Blogikirjoituksia

Ihmisen kuulo ja samplerate
Elokuu 2019

Ihmisen kuulo on luonnollisesti asia mihin kannattaa kiinnittää huomiota, kun puhutaan äänestä ja sen muokkaamisesta. Ihmisen kuulo havainnoi ääntä normaalisti 20 hertsin ja 20.000 hertsin (20 kiloherziä) välillä.

Tosi nuorena pystyy vielä kuulemaan ääniä tuonne 20K maastoon saakka, mutta pikkuhiljaa, jo yli 25v iässä ja siitä eteenpäin, korkeiden taajuuksien kuulo ihmisillä heikkenee ja sen jälkeen sitä kuulee enää noin 17-18K saakka. Tästä on tietenkin olemassa poikkeuksia, mutta tämä on keskivertoarvo.

Kun mietitään ihmisen kuulon suhdetta näytteenottotaajuuteen, eng. samplerate (samplerate = kuinka monta kertaa sekunnissa tietokone tai äänikortti lukee/mittaa digitaalista audiosignaalia sekunnissa), sekä miten eri näytteenottotaajuudet vastaavat ihmiskorvan kuulemia taajuuksia, niin huomataan, että 44.100 kHz taajuus pystyy toistamaan kuultavia taajuuksia aina 22K asti. 48.000 kHz vastaavasti 24K asti ja siitä ylöspäin aina 192.000 kHz taajuuteen, joka pystyy toistamaan 96K asti, joka on jo valtavasti inhimillisen kuulon rajan yläpuolella.

masterointi

70-luvulla videoissa alettiin käyttämään digitaalista ääntä ja silloin näytteenottotaajuus ja sen arvo/lukema, tuli ajankohtaiseksi aiheeksi. Isot yhtiöt Philips ja Sony riitelivät aikoinaan asiasta. Sony voitti lopulta ja vuonna 1979 päädyttiin käyttämään 44.100 kHz näytteenottotaajuus standardia, josta myös tuli CD standardi. Silloin huomattiin, että jotta voidaan toistaa korkeita taajuuksia aina ihmiskorvan raja-arvoille saakka (20K) tarvittiin tuplasti niin suuri näytteenottotaajuus (Nyquist teoria). Mutta perustellusti voidaan kysyä, onko mielekästä käyttää korkeimpia näytteenottotaajuuksia kuin 44.100 kHz, jos niiden mahdollistamat korkeat taajuudet eivät enää ole ihmiskorvan kuultavissa?

Lisäksi kannattaa pitää mielessä, että mitä suurempi samplerate, sen haastavampaa se on tietokoneelle. Eikä ainoastaan koneelle sinänsä, vaan jokainen softa tai plugari jota käytetään, joutuu lukemaan näytteitä asetetun näytteenottotaajuuden mukaan. Asiasta on ollut paljon erilaista infoa sekä mielipiteitä. Näitä yli 20K taajuuksia ihmiskorva ei siis enää kuule, joten helposti voi ajatella, ettei niillä ei ole musiikissa merkitystä. Silti jotkut analogiset ja digitaaliset ekvalisaattorit sisältävät jopa 30-40K taajuuksia (AIR Band/Shelf), jotka on säädetty hyvin laajalle ja loivalle EQ käyrälle (Q). Sivumainintana huomautan, että on tutkittu, että esim. koirat pystyvät kuulemaan taajuuksia aina 60 kiloherziin asti!

Vaikka noita 30K taajuuksia ei kuule, ne voi tuntea! Se että niitä ei kuule, ei tarkoita, ettei niitä ole olemassa ja etteivätkö ne vaikuta soundiin. Näitä korkeita taajuuksia kutsutaan, kuten edellä mainitsin, ilma-aalloiksi (AIR band), joten niillä lisätään "ilmavuutta" miksattavan tai masteroitavan kappaleen sävyyn. Niitä käyttäen yläkerta "avataan" ja se tuo kappaleeseen tuota edellä mainittua "ilmaa" ja monet miksaajat pitävät tätä hyvin tärkeänä elementtinä.

On siis paljon eri näkemyksiä siitä, kannattaako käyttää äänittäessä, miksatessa tai masteroinnissa yli 44.100 khz näytteenottotaajuuksia. 48.000 kHz on nykyään aika yleinen arvo musiikkistudioissa ja se on tänä päivänä elokuva-alalla standardi, kun taas 44.100 kHz on yhä CD standardi. Monet hyvin nimekkäätkin studiot käyttävät yhä 44.100 kHz taajuutta musiikin tuotannossa, koska sillä tietokone toimii varmimmin ja sillä on ennenkin tuotettu laadukasta musiikkia.

Kun asiaa ajattelee järjellä, niin voidaan väittää, että mitä suurempi näytteenottotaajuus, sen enemmän tietokone tekee töitä ja varmaankin musiikkikappale on erottelevampi sekä jollain tavalla parempi? Mutta maailmassa on viime vuosisadalla sekä myös 2000 luvulla tehty vanhoissa analogistudioissa miljoonia kappaleita, jotka ovat kuulostaneet erittäin hyvälle, ja kaikki ilman tietokonetta! Analogisessa maailmassa ei ole näytteenottotaajuutta niin kuin tietokoneissa ja digitaalisessa ympäristössä, mutta on laskettu, että analoginen nauhalle äänitetty musiikin näytteenottotaajuus vastaisi noin 41.000 kHz taajuutta ja noin 16 bittistä wav tiedostoa. Mutta tärkein kysymys lienee, tekeekö suurempi samplerate musiikista jotenkin parempaa, vai mennäänkö nyt hifistelemään ihan väärään suuntaan?

Tärkein on itse musiikki

Musiikin tuottamisessa tärkein asia on tietenkin itse musiikki! Vasta sen jälkeen tulevat äänittäminen, miksaaminen ja lopuksi masterointi. Liiallinen tekninen analysointi ei saa hälventää prioriteetteja musiikin tekemisessä!

On miksaajia, jotka vannovat ehdottomasti 196.000 kHz nimeen ja sanovat soundin olevan sillä taajuudella paljon selkeämpi. Mutta on toisia, jotka sanovat, että korkeammat näytteenottotaajuudet tuovat ylimääräisiä häiriöitä ääneen sekä itse asiassa rikkovat ja säröttävät kaikkein korkeimpia taajuuksia. Tätähän ei ihmiskorva kuule, mutta eri äänikorteilla on tehty testejä digitaalisilla mittareilla ja tulosten mukaan tätä säröä pystyy mittareilla todentamaan.

192.000 khH pystyy siis potentiaalisesti toistamaan taajuuksia 96K saakka, kun ihmiskuulon raja oli tuo 20K. Ollaan siis aikoja sitten menty yli rajan mitä ihmiskorva pystyy kuulemaan, saati tuntemaan. Lisäksi tiedostokoot ovat näillä isommilla taajuuksilla paljon suuremmat ja tarvitaan myös laskentateholtaan hyvin tehokas tietokone ja suuri kovalevy. Jos äänitetään ja miksataan 192K taajuudella, silloin alaspäin sämpläystä ei kannata tehdä kuin vasta masterointi vaiheessa. Tämä tietenkin kuormittaa tietokonetta musiikin tekovaiheessa, mutta jos koetaan, että laatu on huomattavasti parempaa tällä taajuudella, asiassa voi olla järkeä.

Kun itse kuuntelen näitä eroja, niin tähänastisen kokemuksen mukaan on todettava, että suuremmilla taajuuksilla musiikin yläkerta on kieltämättä enemmän auki. Se miten paljon sitä tarvitaan ja vaikuttaako se oikeasti tai ratkaisevasti itse musiikkiin, onkin eri asia.

näytteenottotaajuus

Lo-Fi

Nykyään käytetään paljon Lo-Fi sampleja varsinkin Hip-Hop musiikissa. Lo-Fi on Hi-Fi:n vastakohta, eli käytetään äänikirjastoja, joissa on soundeja, jotka ovat tahallisesti huonon laatuisia/kuuloisia tai huonosti tehtyjä (alempi bittisyys ym.) Nämä luovat omanlaisen ”street” tunnelman ja soundin Rap ja Hip-Hop musiikkiin. Herää kysymys, jos käytetään Lo-Fi sämplejä, onko silloin mitään mieltä äänittää ja miksata 192K taajuudella? Monet ovat myös siirtyneet takaisin kuuntelemaan vinyyleitä, koska niissä on kuulemma se ainoa oikea ja aito soundi. Ehkä tuo on vastareaktio sille, kun koitetaan tuottaa mahdollisimman korkealuokkaista soundia digitaalisesti ja ehkä itse musiikki unohtuu silloin? Tässä on niin tärkeä nähdä metsä puilta!

Ihminen, joka on tekemisessä äänen kanssa, joutuu pakostakin ylläolevaa miettimään ja sen lisäksi asiakkaat ja levy-yhtiöt vaativat tiettyä standardia nykypäivänä. Musiikkiala elää nopean kasvun ja mullistuksen aikaa. Kukaan ei oikein tunnut tietävän mille tasolle musiikki oikeastaan pitää nykypäivänä masteroida.

True Peak vielä kerran

Mitä masterointitasoihin tulee, niin nykyään on tärkätä olla tietoinen TruePeakista ja ammatikseen musiikkia tekevän on syytä omistaa laadukas True Peak mittari. Tästä aiheesta on lisää tässä aikaisemmassa artikkelissa. Ei voi siis luottaa pelkästään RMS tai LUFS tasoihin, kun musiikkia tuotetaan digitaaliseen ympäristöön.

RMS ja LUFS ero

Paljon kysymyksiä on myös esitetty RMS ja LUFS eroista. RMS ja LUFS ovat kummatkin mittausarvoja, tarkemmin sanottuna; ”musiikin kuullun kovuuden keskiarvoja”. Olen näistä ennenkin kirjoittanut, mutta mainittakoon vielä kerran, että LUFS ja RMS mittaavat musiikin kuultua äänenvoimakkuuden keskiarvoa tietyltä aikaväliltä. Pohjimmiltaan ne ovat samat, mutta LUFS on uusi ja paranneltu versio vanhasta RMS standardista. Ero on siinä, että LUFS mittaus laittaa loivan filtterin mitattuun ääneen alkaen noin 20 hertsistä aina 500 hertsiin asti. Tämän filtterin ansioista LUFS mittaus on hieman herkempi ylätaajuuksille. Tämä on luonnollisempi mittaustapa ja vastaa paremmin sitä, miten oikeasti ihmiskorva kuulee musiikin. LUFS mittaus on siksi suositeltavaa tänä päivänä.

Takaisin näytteenottotaajuuteen

En halua sanoa, että miksatessa tai äänittäessä 192K olisi parempi kuin 48K, mutta sen tiedän, että musiikin yläkertaa se jonkin verran avaa. 30K Air Bandin lisääminen miksaukseen tuo ilmavuutta ja muuttaa kappaleen tunnelmaa. 30K taajuutta ei kuule, mutta silti sen lisääminen vaikuttaa kappaleen sävyyn. Jokaisen on itse kokeiltava ja kuunneltava sekä vertailtava tuloksia ennen kuin tekee valinnan, mitä näytteenottotaajuutta päättää käyttää. Mutta älkäämme unohtako tärkeintä, eli itse musiikkia, kun vaellamme nykypäivän Hi-Fi viidakossa!

Takaisin KW-Masterointi blogi sivulle

Puhelin: 040 5022 867

E-mail: KW Masterointi

KW-Masterointi
Kuurintorpantie 1 J
02750, Espoo