Bitdjup
Avser det antal bits (och alltså den dynamik) som en digital inspelning kan innehålla i det valda formatet.
Innehåll
16-bit
En audio-CD har 16-bits dynamik. En bit innebär en skillnad på 6dB, vilket gör att en audio-CD kan ha max 96dB dynamik.
Varje sampling kan ha ett värde mellan -32768 och +32767. Det som hamnar mellan dessa absoluta värden, avrundas till närmaste nivå.
24-bit
En 24-bits inspelning kan ha max 144dB dynamik.
Samplingarna kan ha ett värde mellan -8388608 och +8388607 (16777216 nivåer).
32-bit Floating Point
192dB dynamik, eller...?
Fullt så enkelt är det inte, utan en 32-bit Floating Point inspelning innehåller egentligen 24-bits ljudinformation (det finns inte omvandlare med högre upplösning), medan de extra 8 bitarna är en skalningsfaktor, som ger möjlighet till ENORMT stor dynamik.
Formatet innehåller en 24-bit mantissa, en 8-bit exponent och en tecken-bit (+/-). Det blir 33 bits totalt, men mantissans värde har alltid MSB satt till 1, så behöver man inte bry sig om att spara den biten, utan det räcker ändå med 32 bits och programmen utgår från att MSB alltid ska vara 1.
För de som inte vet vad mantissa och exponent är, så kan man förklara det med exempalvis det decimala talet 100, som också kan skrivas som 1*102, där 1 är mantissan, 10 är basen och 2 är exponenten (typ hur många nollor det ska vara - och när exponenten har ett negativt värde, så handlar det typ om hur många nollor det ska vara mellan decimaltecknet och mantissans värdesiffror).
Eftersom formatet är organiserat som det är, så tillåter det en dynamik mellan 3,4*10-38 och 3,4*10+38. Detta är ett spann på 1*1076, vilket blir hisnande 1520dB. Upplösningen för varje sampling, oavsett nivå, är 24-bit - så formatet är enormt mycket bättre upplöst än övriga.
Detta utnyttjas dock inte när man spelar in, eftersom man bara kan få 24 bits från omvandlaren, så om man skulle spela in in 32-bit FP, så blir det bara 24 bits men ingen exponent som sparas. Det är däremot viktigt när man gör bearbetningar, eftersom man får avrundningsfel vid varje bearbetning om man har ett fast bitdjup i stället för floating point - och eftersom alla dagens DAW-program hanterar ljuddata med 32-bit FP internt, oavsett vilken upplösning det är i ljudfilerna, så har man stor hjälp av den bättre upplösningen.
Om man kör allting i realtid fram till slutmixen, så är det därför inga problem att behålla högsta möjliga kvalitet, utan det går helt automagiskt. Om man däremot behöver göra partiella nedmixningar under resans gång, så är det lämpligast att välja 32-bit FP som filformat, eftersom man då inte förlorar data som man gör med fast bitdjup.
Det går att ha signal långt över 0dB så länge man håller sig i 32-bit FP-formatet (som DAW-programmen gör internt), men för att ljudkortet ska kunna återge det utan distorsion, så måste man förstås dra ner det till 0dB.
48-bit
ProTools har i de senare versionerna börjat använda sig av 48-bit internt i stället för 24-bit, som de har haft tidigare. Detta ger en maximal dynamik på 288dB, något som borde räcka till för de flesta användare.
Det har ibland hävdats att det är lämpligare för audiobruk att använda fixed point, än att använda floating point på grund av att floating point är mer komplicerade uträkningar. Om det sedan beror på att deras egna befintliga algoritmer inte är lämpade för floating point och de inte kan ändra det på ett enkelt sätt, eller om det ligger ett korn av sanning i påståendet, är en fråga för "di lärde". Nästa sak är förstås också om skillnaden är hörbar i söutänden, eller om det är en huvudsakligen akademisk fråga.