BlinfoTec |
(Door Paul Erkens)
Klik op skip tekst om meteen naar de links te gaan, of druk op 'x'.
Comprimeren, hoe gaat dat? Laten we eerst eens vaststellen wat comprimeren eigenlijk is. Comprimeren is het kleiner maken van een bestand met data, op zo'n manier dat het gecomprimeerde bestand later terug gerekend kan worden naar het originele, grote bestand.
Audio in normale, ongecomprimeerde vorm op harde schijf, bestaat op Windows pc's meestal in de vorm van .wav bestanden. Gecomprimeerde bestanden hebben echter allerlei verschillende extensies. Een ervan is mp3. Een wav bestand van 1 minuut zou 10 megabyte groot zijn. Dat hebben we eerder gezien. Maar als we het gaan comprimeren naar mp3, dan kan hetzelfde stukje geluid tot een tiende worden teruggebracht. Dus geen 10, maar 1 megabyte. En zelfs nog veel kleiner.
Wav bestanden kun je gewoon met de Windows media player laten afspelen. Mp3 bestanden werken op dezelfde manier. Een programma als winamp kun je installeren om die taken over te nemen van media player, bijvoorbeeld omdat winamp een stuk makkelijker te bedienen is.
Maar hoe werkt het dan, dat comprimeren? Wel. Het is in werkelijkheid een enorm complex wiskundig verhaal, dat we gelukkig kunnen terug brengen tot een heel simpel basis principe.
Stel je eens een heel simpel audiosignaal voor. Een toon van 4000 hertz. Daar doorheen horen we een toon van 4003 hertz. Alleen is het volume van die vlakbij liggende toon toevallig zo zacht, dat wij het niet horen. Of we nu de 4 kilohertz toon horen met of zonder zachte bijtoon, ons oor merkt geen verschil. Het opslaan van 2 tonen in een gecomprimeerd bestand kost echter meer schijfruimte dan het opslaan van 1 toon. Daarom hoeft de zachte toon van 4003 hertz niet te worden opgeslagen, want of die er nou wel of niet is hoort niemand.
Een praktijk voorbeeld om dit principe te illustreren. Stel, ergens buiten hangt een wind gong. Dat is een ding dat mensen voor de lol wel eens buiten hangen. Het zijn dunne, metalen staafjes, die zachtjes tegen elkaar aan tinkelen als de wind er langs blaast. Behalve het serene geluidje heeft een wind gong geen nuttige functie.
Als het stil is, hoor je de wind gong met de ramen dicht binnen nog heel zachtjes tinkelen. Maar als de stofzuiger aan gaat, hoor je de wind gong niet meer. Hij weerklinkt nog wel, maar je hoort hem niet meer omdat de stofzuiger hem overstemt. Dit principe heet "sound masking", gemaskeerd geluid. Het ene overstemt het andere.
Zo werkt het nu ook met opgenomen digitale audio die je comprimeert. Het ene signaal overstemt het andere, waardoor het andere dus in feite kan worden weggegooid omdat niemand het ooit horen zal en dat scheelt ruimte in je gecomprimeerde bestand.
Daarom is een studie gemaakt van de perceptie van onze oren, zodat er kon worden bepaald wat wij wel en wat we niet meer horen. Op basis daarvan werkt compressie. Frequenties die wel in de audio zitten en dus ruimte innemen, worden op volume en op omliggende geluiden getest om te zien of ze weg mogen. Hoe minder frequenties je gaat op slaan, hoe kleiner je files gaan worden. Hoe meer je weg gooit, hoe minder je hoeft op te slaan. Maar op een zeker moment ga je zo veel weg gooien om kleinere files te krijgen, dat je de aantasting van de audio weldegelijk gaat horen.
een bitrate is bij veel gecomprimeerde audioformaten een maatstaf voor compressie. 32 kilobit betekent: de gecomprimeerde audio file zal 32 duizend bitjes per seconde nodig hebben om af te spelen. Een rekenvoorbeeldje maar weer.
32 kilobit is, even voor het gemak, 32000 bits per seconde. 32000 bitjes gedeeld door 8 bits in een byte levert 4 duizend bytes voor een seconde gecomprimeerde audio, op een bitrate van 32 kilobit. Per minuut is dat: 4000 bytes maal 60 seconden is 240.000 bytes per minuut. Dat gedeeld door 1024 is ongeveer 234 echte kilobytes data per minuut. Samengevat: 32 kilobit mp3 geluid komt neer op ongeveer 234 kilobyte data per minuut.
Je snapt dan wel, dat je voor een minuut muziek met 128 kilobit iets meer data per minuut gaat krijgen. We kunnen dat eenvoudig uitrekenen:
128000 bitjes per seconde maal 60 seconden voor een minuut, is 7.680.000 bitjes nodig per minuut. Dit grote aantal bits per minuut moet je delen door 8 om op het aantal bytes per minuut te komen. De uitkomst is dan 960.000 bytes per minuut. Om daar echte kilobytes van te maken deel je dat weer door 1024, is ongeveer 938 kilobyte. Samenvattend: geluid op 128 kilobit kost geen 234, maar ongeveer 938 kilobyte per minuut. Dat is bijna 1 MB. 128 Kilobit comprimeert dus een factor 10. Immers: een wav bestand op normale grootte kost je 10 megabyte schijfruimte per minuut, terwijl 128 kilobit mp3 nog geen 1 MB nodig heeft. Tien keer zo weinig.
En dat klopt dan allemaal weer prachtig met elkaar. Want 32 kilobit en 128 kilobit scheelt een factor 4. Er gaat per slot van rekening 4 keer 32 in 128. En dus is het aantal benodigde bits per seconde ook vier keer zo groot voor 128 kilobit, ten opzichte van 32 kilobit.
Hoe lager de bitrate, hoe meer geluid er wordt weggegooid en hoe kleiner de resulterende mp3 gaat worden. Dat hebben we al gezien. Moet je in een mp3 file op 128 kilobit nu slechts 1 kanaal kwijt omdat je een mono opname naar mp3 aan het omzetten bent, dan is dat prachtig. Want je kunt elke seconde de volledige 128 duizend bits gebruiken om de audio van dat ene kanaal op te slaan en je hoeft dan dus niet enorm strak te comprimeren, niet al te veel frequenties weg te gooien en dat levert uiteindelijk een prima klinkend gecomprimeerd eindresultaat.
Maar moet je binnen die 128 duizend bitjes voor 1 seconde audio 2 kanalen kwijt, dan betekent dat dat er 64000 bitjes voor links en 64 duizend bitjes voor rechts moeten worden gebruikt om de audio in 128 kilobit per seconde te laten passen.
Conclusie: 128 mono klinkt prima, 128 stereo is in feite 2 x 64 kilobit mono tegelijkertijd afgespeeld en klinkt dus hoorbaar minder goed. Simpelweg omdat er bij stereo twee keer zoveel audio moet worden opgeslagen, in de ruimte die bij mono volledig voor 1 kanaal mocht worden gebruikt.
Op dit moment van schrijven leven we bijna aan het begin van het jaar 2005. Een paar jaar geleden was het nog nodig om mp3 bestanden zo klein mogelijk te maken. Iedereen had nog een gewoon telefoon modem en dus was het duurder om grotere bestanden te versturen. Daarbij waren de harde schijven nog niet zo groot als nu, en je kon zelf nog geen cd's branden.
Tegenwoordig echter hebben heel veel mensen breedband internet, grote schijven en een cd of dvd brander. Het is dus echt niet meer nodig mp3 bestanden echt klein te maken en dat is maar goed ook. Want hoe lager de bitrate van mp3, hoe slechter de resterende audio kwaliteit is. Moge het oude misverstand hiermee eindelijk uit de weg worden geruimd: comprimeren is niet alleen een kwestie van kleine bestanden willen hebben. Het kiezen van de juiste bitrate moet altijd een afweging zijn tussen hoorbaar kwaliteitsverlies aan de ene kant, en omvang van het bestand aan de andere kant. Daarbij weegt kwaliteit mijns inziens veel zwaarder dan bestandsomvang.
Mijn advies is dan ook als volgt. Voor mono materiaal, zou je het best een bitrate van 128 kunnen aanhouden. Voor stereo materiaal 256. Ik weet het, op internet zwerven genoeg mp3tjes rond op 128 kilobit die stereo zijn en die klinken toch ook goed? Ja en nee. Ze klinken acceptabel, maar in vergelijking met het origineel voordat de muziek in mp3 gecodeerd werd, is 128 kilobit stereo beslist hoorbaar beneden cd kwaliteit.
Voor de duidelijkheid: een wav bestand kan mono of stereo zijn en dan heb je niets te maken met bitrates. De kwaliteit van de wav hangt af van de sampling frequentie. 44100 samples per seconde klinkt goed. Daarnaast bepaalt de resolutie de audiokwaliteit van de wav. 8 Bit is telefoonkwaliteit, 16 bit cd kwaliteit en tegenwoordig is het niet bijzonder meer om in studio's 24 en 32 bit opnames te maken. Voor ons is 16 bit prima. Tijdens het maken van de wav moet je bepalen of die mono (1 kanaal) of stereo (2 kanalen) moet worden. Als je geluidsbron mono is, is het onzin om in stereo op te nemen. In het beste geval ontvangt je computer dan hetzelfde signaal zowel links als rechts en daarbij is het onnodig twee keer hetzelfde op te slaan. Is je bron waarvan je opneemt echter stereo, dan is het jammer om de stereo-effecten uit de audio verloren te laten gaan door de wav mono op te nemen. Luister dus naar het origineel dat je in mp3 gaat omzetten en beoordeel aan de hand daarvan of de wav mono of stereo moet worden. Is die keuze eenmaal gemaakt, dan is het een kwestie van een eenvoudige instelling in je digitale opname programma.
Daarentegen bepaalt bij een mp3 bestand enkel nog de bitrate de kwaliteit van het uiteindelijke geluid. Een mp3 is immers een wav bestand geweest dat naar mp3 is geconverteerd. De sampling frequentie, het aantal kanalen en de resolutie liggen dus al vast omdat de wav al klaar is als je gaat mp3en.