Samplingsfrekvens

Från Kontrollrummet
Hoppa till: navigering, sök

Samplingsfrekvensen är den frekvens man använder vid in- eller uppspelning av digitalt ljud.


Nyqvist

Samplingsfrekvensen måste enligt Nyqvist-teoremet (som ligger till grund för all AD- och DA-omvandling) ligga på dubbla frekvensen jämfört med högsta önskade frekvens som sedan ska kunna återges korrekt efter DA-omvandling. En högre samplingsfrekvens ger alltså (i alla fall teoretiskt) ett resultat som är något närmare den analoga originalsignalen - åtminstone om man har omvandlare av god kvalitet...


Audio-CD

Som bekant, så är standarden för audio-CD 44.1kHz/16-bit - och om audio-CD är det tänkta slutmediat, så är det ganska meningslöst att använda en högre samplingsfrekvens än 44.1kHz eftersom omvandlaren i CD-spelaren har ett lågpassfilter som gör det omöjligt att frekvenser över 22.05kHz spelas upp.


Film

Om man gör musik till film, så är 48kHz ett lämpligare val än 44.1kHz, eftersom det stämmer överens med alla vanliga videoformat (24, 25, 29.97 och 30 FPS).


Övertoner

Lågpassfiltret gör, i enlighet med Nyqvist, att det är omöjligt att spela upp komplexa vågformer vid frekvenser som ligger över hälften av den högsta möjliga frekvensen, eftersom filtret gör att det enbart kan förekomma sinusvågformer där. En fyrkantvåg är som bekant en sinusvåg med alla dess udda övertoner - och övertonerna som finns över 22,05kHz filtreras bort vid omvandlingen för att reducera risken för hörbara artefakter från omvandlingen - så även om man har spelat in en fyrkantvåg när frekvensen närmar sig Nyqvist-frekvensen, så blir det en sinusvåg vid uppspelning eftersom alla övertonerna filtreras bort. Det intressanta i sammanhanget är att människans hörsel inte heller uppfattar ljud över ca 20kHz (och det i 20-årsåldern - sedan blir det allt sämre...), så inte heller hörseln kan skilja på sinus och fyrkant när man kommer upp lite i frekvens. Sista frekvensen man eventuellt kan höra den första definierande övertonen av, är vid 7kHz, där ju första udda övertonen ligger på 21kHz - men för att det ska närma sig hörbar fyrkant, så behövs det många fler övertoner och alltså en ton med betydligt lägre grundfrekvens.

Se även vikningsdistorsion.


Varför högre samplingsfrekvens?

Är slutmediat annat än audio-CD, så kan det däremot vara meningsfullt att köra med högre samplingsfrekvens - men då får man kanske problem med att datorkraften behöver ökas för att hinna hantera allt... En fördel med att köra med högre samplingsfrekvens, är också att man vid DA-omvandlingen inte behöver ha lika branta filter som man behöver vid lägre samplingsfrekvens om diskantinnehållet inte ska försvinna. Ett brantare filter kan öka risken för fasfel.

Med översampling reduceras detta problem kraftigt, så i dag är det ett betydligt mindre problem än det var i det digitala ljudets barndom.

Man ska också vara vaksam på de omvandlare man använder, eftersom de kan låta olika bra/dåligt vid olika samplingsfrekvenser. Öronen är lättlurade, så det finns risk att man tolkar en förändring av ljudet som "bättre" - trots att det inte alltid är det.


Optimal samplingsfrekvens för audio?

Enligt en av de riktiga auktoriteterna på området, Dan Lavry, är den optimala samplingsfrekvensen 60kHz. Allt ovanför den samplingsfrekvensen är helt överflödigt eftersom människans öra inte kan uppfatta någon skillnad. Eftersom 60kHz inte finns som en standardfrekvens, så är med andra ord 88.2 eller 96kHz det man bör välja för att vara säker på att få det absolut bästa resultatet (under förutsättning att omvandlaren inte färgar ljudet olika vid olika samplingsfrekvens, vilket de ofta gör...).

Två av Lavrys utredningar om detta finns här:

Sampling theory for digital audio

The optimal sample rate for quality audio


Omvandling av samplingsfrekvens

Det finns en vida spridd tro, att det blir bättre resultat vid omvandling exempelvis från 88.2 till 44.1kHz, än om man omvandlar från 96 till 44.1kHz. Detta för att det egentligen borde vara enkelt att bara plocka bort varannan sampling, medan det blir mer komplicerat när det inte är jämnt delbart.

Detta är en helt felaktig myt. I själva verket utför all konvertering först en omvandling till minsta möjliga gemensamma nämnare, för att sedan dela ner till den önskade samplingsfrekvensen, så det finns inga som helst fördelar att hålla sig till den samplingsfrekvens som är precis den dubbla jämfört med den som är slutmålet, eftersom beräkningarna är lika komplicerade oavsett vilket.

Omvandling i realtid (som krävs i vissa ljudkort som inte har riktigt stöd för alla samplingsfrekvenser), ger som regel ett lite metalliskt eller luddigt ljud, så om man har ett ljudkort med sådana begränsningar, så bör man främst använda de samplingsfrekvenser som det verkligen finns stöd för.


Se även sampling.