Blogikirjoituksia
Bittiresoluutio ja Ditherointi
marraskuu 2016
Ajattelin tänään vastata näihin kolmeen aiheeseen niin hyvin ja sekavasti kuin osaan :)
Tietokone, mitä nykyään käytetään musiikin tekemiseen, on digitaalinen härveli. Sen sisällä kaikki data rekisteröidään ja käsitellään bitteinä. Bitit ovat pelkkiä ykkösiä ja nollia. Ennen tietokoneita, kaikki audio äänitettiin studioissa puolen tuuman nauhalle. Iso muutos tapahtui vuonna 1982, kun digitaalinen CD formaatti ensimmäisen kerran julkaistiin. Senkin jälkeen käytettiin vielä pitkään puolen tuuman nauhaa äänitysstudioissa. Nyt kun käytetään tietokoneita musiikin tekemiseen, kaikki analoginen signaali on konvertoitava digitaaliseksi (AD konversio) jotta tietokone ymmärtäisi sen oikein. Tämän mukana tulee muutamia ongelmia sekä paljon hyviä asioita.
Millä näytteenottotaajuudella konvertoidaan?
Samplerate, eli näytteenottotaajuus tarkoittaa nopeutta, kuinka monta kertaa sekunnissa tietokoneen tai äänikortin ADC konvertteri (mikä konvertoi sisään tulevan analogisen signaalin digitaaliseksi) mittaa ja lukee sisään tulevan signaalin sekunnissa. Näytteenottotaajuuksista käytetyimmät musiikkimaailmassa ovat 44.100 khz, 48.000 khz ja 96.000 khz sekä joissain tapauksissa 192.000 khz.
Mutta ihan sama kuinka nopeasti sisään tuleva signaali mitataan, konvertointi (joka on pakollinen toimenpide tietokonetta käytettäessä) tuottaa aina kvantisointi (Quantisation) virheitä. Tämä johtuu siitä, että analogisessa, eli tietokoneeseen sisään tulevassa alkuperäisessä musiikissa signaali muuttuu/elää koko ajan. Jos sisään tuleva signaali olisi tasainen, virheitä ei tulisi, mutta musiikin koko idea on tietenkin olla dynaaminen, vivahteikas prosessi. Virheet tuottavat digitaalista säröä, kun digitaalinen informaatio konvertoidaan takaisin analogiseksi ja tämä ei ole hyvä asia!
Ditheroinnin tarve
Tästä syystä kehitettiin ditherointi, joka lisää sisään tulevaan ja konvertoituun audioon hyvin pienen määrän valkoista kohinaa (white noise). Tämä valkoinen kohina korjaa kaikki kvantisointi virheet digitaalisella puolella. Tämän lisäksi, kun tiedosto konvertoidaan takaisin analogiseksi, kaikki lisätty valkoinen kohina muuttuu puhtaaksi, kohinattomaksi ääneksi, joten lopputulos on virheetön ja puhdas audio! Ditherointi on siis konversiossa hyvin tärkeä vaihe, jota ei pidä jättää pois.
Ditherointi kannattaa tehdä AINA kun konvertoidaan digitaalista audiota ts. kun tuotetaan 16 tai 24 bittinen äänitiedosto. Ainoastaan jos pystyy käyttämään 32 bittistä floating point tasoa, dithereointia ei tarvitse tehdä audion sisäisissä muunnoksissa. Sisäisillä muunnoksilla tarkoitan miksausvaiheen editointeja, kun joskus halutaan prosessoitu audio tallentaa uudeksi raidaksi projektin sisällä.
Jos 24 bittinen projekti, digitaalisessa työasemassa rendataan ulos 24 bittisenä wav tiedostona, kannattaa käyttää ditherointia. Jos 24 bittinen konvertoidaan 16 bittiseksi, se kannattaa myös ehdottomasti tehdä. Eri asia on sitten se, onko ditheroinnin vaikutus kuultavissa musiikissa. Jos kuunnellaan modernia heavy musiikkia, joka on masteroitu jonnekin -4 db RMS tasolle, niin on periaatteessa ihan sama, onko sitä käytetty vai ei, koska sitä ei pysty erottamaan korvalla. Mutta akustisessa ja klassisessa musiikissa ditheroinnin sen sijaan erottaa melko selvästi.
Mitä oikeastaan ditherointi on maalaisjärjellä selitettynä?
Hyvä kysymys! Ja paras on vastata esimerkin avulla; kyseinen prosessi siis lisää valkoista kohinaa musiikkiin, ylempänä kerrotuista syistä. Kuvitellaan että katsot esim. pysäköityä autoa, joka on pienen matkan päässä ja näet sen selvästi. Sitten otat kännykän ja laitat sen silmien eteen niin, että vain osa autosta jää näkyviin. Olet luonut näköesteen. Kun kuitenkin nyt liikutat kännykkää hyvin nopeasti oikealta vasemmalle tai ylös ja alas, huomaat että pystyt näkemään auton kokonaisuudessaan, vaikkakin jotain on lisätty näkökenttään, mutta se jokin liikkuu niin nopeasti, että kokonaiskuva jää kuitenkin näkökenttään. Ditherointi on juuri tällainen prosessi.
16, 24 ja 32 bit
16 bittisellä audiolla on 96 desibelin dynaaminen alue. 24 bittisellä dynaaminen alue on 144 desibeliä. 144 desibelin kohdalla tulevatkin vastaan korvien fyysiset rajat, eli käytännössä sitä enempää ei tulla koskaan tarvitsemaan.
Samaan hengenvetoon pitää todeta, että nykyisissä digitaalisissa työasemissa on monissa 32 bittinen floating point vaihtoehto. 32 bittinen floating pointilla dynaaminen alue on teoreettisesti 1680 desibeliä!
32 bittisellä floating point tiedostomuodolla on paljon hyviä puolia 16 tai 24 bittiseen verrattuna. 32 bittisellä tiedostomuodolla ei tapahdu konvertoidessa yhtä paljon virhelaskentaa kuin alemmilla bittimäärillä. Se antaa siis enemmän laskennallista virhemarginaalia sekä myös enemmän tilaa (headroomia). 32 bittinen ei myöskään klippaa, säröydy, mene yli rajan, samalla tavalla kuin alemmat resoluutiot. Sitä ei voi hyödyntää lopputuotteessa, mutta muokkaamisvaiheessa 32 bittisestä voi olla iso apu.
32 bittinen floating point tiedostomuoto vie enemmän kovalevytilaa, mutta jos digitaalinen työasema pystyy käyttämään sitä, se kannattaa ehdottomasti valita. Pitää kuitenkin muistaa, että 32 bittinen float point on aina väliaikainen tiedostomuoto. Se on pakko konvertoida lopuksi 16 tai 24 bittiseksi, koska mikään nykysoitin ei ymmärrä 32 bittistä audiota.
Kun tietokone käyttää enemmän bittejä, sen enemmän mahdollisuuksia koneella on vähentää syntyviä kvantisaatiovirheitä, joista aiemmin oli puhe. Täten kuulostaisi maalaisjärjellä järkevältä käyttää aina mahdollisimman suurta bittiresoluutiota.
Perussääntö on, että mitä vähemmän tiedostoa konvertoidaan edes takasin, sen parempi. 32 bit floating point on siitä hyvä, että sitä käyttämällä tiedoston laatu pysyy konvertoidessa samana, eikä heikkene. Tämä edellyttää kuitenkin että 32 bittinen floating point konvertoidaan 32 bittiseksi floating point tiedostoksi!
Tätä keinoa onkin erittäin hyvä käyttää musiikin tuotantovaiheessa, kun prosessoituja tiedostoja esimerkiksi tilan säästämiseksi rendataan ulos ja tuodaan takaisin projektiin. Jos saman tekisi 24 bittiselle tiedostolle, se pitää ehdottomasti ensin ditheroida ja muunnosta ei kannata hyvin montaa kertaa tehdä audion laadun säilyttämiseksi.
16 bittinen on yhä CD standardi
Jos musiikkia kuunnellaan CD:ltä tai musiikkituotoksesta painetaan CD, sen pitää olla 16 bittistä ja näytteenottotaajuus on oltava 44.100 khz. Tämä standardi on peräisin vuodelta 1982, jolloin digitaalinen CD näki päivänvalon. CD formaattia käytetään vielä laajasti, joten siksi masterointi on syytä toteuttaa myös 16 bittisenä, mutta myös 24 bittinen on parempilaatuisena tärkeä tiedostomuoto masteroinnissa.
Tietokone käsittelee kaikkea ykkösinä ja nollina. Niitä kutsutaan myös biteiksi ja bitin arvo on aina joko ykkönen tai nolla. Aina kun bittimäärä suurenee, se tuplaa tietokoneen mahdollisuuden laskea dataa. Mutta samalla myös tiedostokoko suurenee. Alla olevasta taulukosta näkee kuinka paljon tilaa eri bittiset tiedostomuodot vaativat.
Bitti määrä | Näytteenottotaajuus | Bittinopeus | Tiedostokoko 1 minuutti (stereo) | 3 minuutin kappale |
16 | 44.100 khz | 1.35 Mbit/sekunnissa | 10.1 MB | 30.3 MB |
16 | 48.000 khz | 1.46 Mbit/sekunnissa | 11.0 MB | 33 MB |
24 | 96.000 khz | 4.39 Mbit/sekunnissa | 33.0 MB | 99 MB |
mp3 | 128 k/bittinopeus | 0.13 Mbit/sekunnissa | 0.94 MB | 2.82 MB |
Parempi äänittää korkeammalla resoluutiolla?
Kuulostaako esim. lauluäänitys paremmalta, jos se on äänitetty 24 bittisenä 16 sijaan? Lyhyt vastaus on ”ei kuulosta”, mutta 24 bittinen antaa enemmän laskennallista tilaa äänitetylle materiaalille digitaalisessa ympäristössä.
Kuinka moni voi sanoa, jos sama äänitys kuulostaa paremmalta, jos on käytetty 44.100 khz näytteenottotaajuutta tai 96.000 khz taajuutta äänittäessä? Tästä on paljon hyvinkin tiukkoja mielipiteitä, mutta ehkä joku materiaali kuulostaa paremmalta pienemmällä, joku suuremmalla taajuudella äänitettynä? Itse äänitän yleensä 24 bittisenä 44.100 tai 48.000 khz.
Se mikä on tärkeää äänittäessä, on mikrofoni, etuaste ja äänitystekniikka. Tämän lisäksi äänitetty audio on yhtä laadukasta kuin sen heikoin linkki. Jos mikrofonijohto on laadukas, mutta johto etuasteesta äänikorttiin on 10 euron kaapeli, niin tuo 10 euron kaapeli tulee olemaan määräävä tekijä lopullisen äänitetyn äänenlaadun suhteen.
Takaisin KW-Masterointi blogi sivulle
- Tai hyppää alla olevista linkeistä suoraan haluamaasi artikkeliin
- - Digitaalisen äänen dynamiikka
- - Ihmisen kuulo ja samplerate
- - Automaattiset masterointipalvelut
- - True Peak - mistä on kysymys?
- - Ditheroinnin ymmärtäminen
- - LUFS standardi ja Bob Katz K-systeemi
- - Miten radio prosessoi musiikkia
- - Studion kuuntelu ja monitorointi
- - LUFS, RMS – syvempi katsaus
- - Sidechain ja Linear Phase tekniikka
- - Dynaaminen alue ja sen manipulointi
- - Hyvän tonaalisen balanssin hakeminen
- - Referenssien käyttäminen masteroidessa
- - Miten miksata masterointia varten
- - Kotona masterointi vai masteroitistudion käyttäminen?
- - Lyhyt oppimäärä masteroinnin historiaa
- - Limitterin käyttö ja masterointiketju
- - Paljon hyvää plugareissakin
- - Loudness War
- - Asiaa kaapeleista
- - Hyvän masteointi ekvalisaattorin etsintä
- - Analogisen ja digitaalisen ero