Skillnad mellan versioner av "Bitdjup"

Från Kontrollrummet
Hoppa till: navigering, sök
m (32-bit Floating Point)
Rad 3: Rad 3:
 
==16-bit==
 
==16-bit==
 
En audio-[[CD]] har 16-bits dynamik. En bit innebär en skillnad på 6[[dB]], vilket gör att en audio-CD kan ha max 96dB dynamik.
 
En audio-[[CD]] har 16-bits dynamik. En bit innebär en skillnad på 6[[dB]], vilket gör att en audio-CD kan ha max 96dB dynamik.
 +
 +
Varje sampling kan ha ett värde mellan -32768 och +32767. Det som hamnar mellan dessa absoluta värden, avrundas till närmaste nivå.
 +
  
 
==24-bit==
 
==24-bit==
 
En 24-bits inspelning kan ha max 144dB dynamik.
 
En 24-bits inspelning kan ha max 144dB dynamik.
 +
 +
Samplingarna kan ha ett värde mellan -8388608 och +8388607 (16777216 nivåer).
 +
  
 
==32-bit Floating Point==
 
==32-bit Floating Point==
 
192dB dynamik, eller...?
 
192dB dynamik, eller...?
  
Fullt så enkelt är det inte, utan en 32-bit Floating Point inspelning innehåller egentligen 24-bits ljudinformation (det finns inte [[omvandlare]] med högre upplösning), medan de extra 8 bitarna är decimaler som bara utnyttjas för att få noggrannare avrundningar vid bearbetning av ljudinnehållet och alltså inte gör någon nytta alls vid inspelningstillfället.
+
Fullt så enkelt är det inte, utan en 32-bit Floating Point inspelning innehåller egentligen 24-bits ljudinformation (det finns inte [[omvandlare]] med högre upplösning), medan de extra 8 bitarna är en skalningsfaktor, som ger möjlighet till ENORMT stor dynamik.
 +
 
 +
Formatet innehåller en 24-bit mantissa, en 8-bit exponent och en tecken-bit (+/-). Det blir 33 bits totalt, men mantissans värde har alltid MSB satt till 1, så behöver man inte bry sig om att spara den biten, utan det räcker ändå med 32 bits och programmen utgår från att MSB alltid ska vara 1.
 +
 
 +
För de som inte vet vad mantissa och exponent är, så kan man förklara det med exempalvis det decimala talet 100, som också kan skrivas som 1*10<sup>2</sup>, där 1 är mantissan, 10 är basen och 2 är exponenten (typ hur många nollor det ska vara - och när exponenten har ett negativt värde, så handlar det typ om hur många nollor det ska vara mellan decimaltecknet och mantissans värdesiffror).
 +
 
 +
Eftersom formatet är organiserat som det är, så tillåter det en dynamik mellan 3,4*10<sup>-38</sup> och 3,4*10<sup>+38</sup>. Detta är ett spann på 1*10<sup>76</sup>, vilket blir hisnande 1520dB. Upplösningen för '''varje sampling''', oavsett nivå, är 24-bit - så formatet är enormt mycket bättre upplöst än övriga.
  
Att decimalpunkten är "Floating", innebär att den kan flyttas dit där den är mest relevant att ha - oavsett hur stark eller hur svag signal man har, så kommer man alltid att ha 24-bits upplösning för varje sampling, om man kör med 32-bit FP.
+
Detta utnyttjas dock inte när man spelar in, eftersom man bara kan få 24 bits från omvandlaren, om man skulle spela in in 32-bit FP, så blir det bara 24 bits men ingen exponent som sparas.
 +
Det är däremot viktigt när man gör bearbetningar, eftersom man får avrundningsfel vid varje bearbetning om man har ett fast bitdjup i stället för floating point - och eftersom alla dagens [[DAW]]-program hanterar ljuddata med 32-bit FP internt, oavsett vilken upplösning det är i ljudfilerna, så har man stor hjälp av den bättre upplösningen.
  
Det går att ha signal långt över 0dB så länge man håller sig i 32-bit FP-formatet (som [[DAW]]-programmen gör internt), men för att ljudkortet ska kunna återge det, så måste man förstås dra ner det till 0dB. Jag har sett en siffra på 1520dB dynamik som gränsen för 32-bit FP, men har inte kunnat hitta någon riktigt bra förklaring, så jag får återkomma angående det vid senare tillfälle...
+
Det går att ha signal långt över 0dB så länge man håller sig i 32-bit FP-formatet (som [[DAW]]-programmen gör internt), men för att ljudkortet ska kunna återge det utan [[distorsion]], så måste man förstås dra ner det till 0dB.
  
 
[[Kategori:Ljudteknik]]
 
[[Kategori:Ljudteknik]]
[[Kategori:Teknik]]
+
[[Kategori:Datorer]]
 +
[[Kategori:Mjukvara]]

Versionen från 9 juni 2009 kl. 21.43

Avser det antal bits (och alltså den dynamik) som en digital inspelning kan innehålla i det valda formatet.

16-bit

En audio-CD har 16-bits dynamik. En bit innebär en skillnad på 6dB, vilket gör att en audio-CD kan ha max 96dB dynamik.

Varje sampling kan ha ett värde mellan -32768 och +32767. Det som hamnar mellan dessa absoluta värden, avrundas till närmaste nivå.


24-bit

En 24-bits inspelning kan ha max 144dB dynamik.

Samplingarna kan ha ett värde mellan -8388608 och +8388607 (16777216 nivåer).


32-bit Floating Point

192dB dynamik, eller...?

Fullt så enkelt är det inte, utan en 32-bit Floating Point inspelning innehåller egentligen 24-bits ljudinformation (det finns inte omvandlare med högre upplösning), medan de extra 8 bitarna är en skalningsfaktor, som ger möjlighet till ENORMT stor dynamik.

Formatet innehåller en 24-bit mantissa, en 8-bit exponent och en tecken-bit (+/-). Det blir 33 bits totalt, men mantissans värde har alltid MSB satt till 1, så behöver man inte bry sig om att spara den biten, utan det räcker ändå med 32 bits och programmen utgår från att MSB alltid ska vara 1.

För de som inte vet vad mantissa och exponent är, så kan man förklara det med exempalvis det decimala talet 100, som också kan skrivas som 1*102, där 1 är mantissan, 10 är basen och 2 är exponenten (typ hur många nollor det ska vara - och när exponenten har ett negativt värde, så handlar det typ om hur många nollor det ska vara mellan decimaltecknet och mantissans värdesiffror).

Eftersom formatet är organiserat som det är, så tillåter det en dynamik mellan 3,4*10-38 och 3,4*10+38. Detta är ett spann på 1*1076, vilket blir hisnande 1520dB. Upplösningen för varje sampling, oavsett nivå, är 24-bit - så formatet är enormt mycket bättre upplöst än övriga.

Detta utnyttjas dock inte när man spelar in, eftersom man bara kan få 24 bits från omvandlaren, så om man skulle spela in in 32-bit FP, så blir det bara 24 bits men ingen exponent som sparas. Det är däremot viktigt när man gör bearbetningar, eftersom man får avrundningsfel vid varje bearbetning om man har ett fast bitdjup i stället för floating point - och eftersom alla dagens DAW-program hanterar ljuddata med 32-bit FP internt, oavsett vilken upplösning det är i ljudfilerna, så har man stor hjälp av den bättre upplösningen.

Det går att ha signal långt över 0dB så länge man håller sig i 32-bit FP-formatet (som DAW-programmen gör internt), men för att ljudkortet ska kunna återge det utan distorsion, så måste man förstås dra ner det till 0dB.