Kai balsas nuklysta nuo kelio
Turbūt visi esame girdėję tas keistas, robotiškas dainas, kur balsas skamba tarsi iš kito pasaulio. Arba priešingai – klausomės įrašo ir galvojame, kaip tas atlikėjas taip tobulai dainuoja, nė viena nata nepralekia pro šalį. Už abiejų šių efektų dažniausiai slypi viena technologija – Auto-Tune. O tiksliau, Antares Audio Technologies sukurtas tonacijos korekcijos algoritmas, kuris per pastaruosius dešimtmečius tapo neatsiejama muzikos industrijos dalimi.
Įdomiausia, kad šis algoritmas gimė visai ne muzikos studijose. Jo kūrėjas Andy Hildebrand dirbo naftos pramonėje ir kūrė seisminius algoritmus, padedančius rasti naftos telkinius po žeme. Panašūs matematiniai principai, kurie padėjo analizuoti seisminius virpesius, vėliau buvo pritaikyti garsų dažniams analizuoti ir koreguoti. Kas galėjo pagalvoti, kad naftos paieška ir pop muzika turi ką nors bendra?
Kaip žmogaus balsas tampa skaičiais
Pirmiausia reikia suprasti, kad bet koks garsas – tai oro virpesiai. Kai dainuojame notą „La”, mūsų balso stygos virpa maždaug 440 kartų per sekundę. Šis dažnis ir yra ta nota. Problema ta, kad žmonės nėra tikslūs instrumentai. Net profesionalūs dainininkai kartais nukrypsta nuo tikslaus dažnio – gal per kelis hertzus, o kartais ir daugiau.
Auto-Tune algoritmas pradeda savo darbą nuo garso signalo pavertimo skaitmeniniais duomenimis. Mikrofonas užfiksuoja oro virpesius, o analoginis-skaitmeninis keitiklis (ADC) paverčia juos skaičių seka. Dabar turime ne garsą, o matematinę jo reprezentaciją – tūkstančius duomenų taškų per sekundę, kurie aprašo garso bangą.
Toliau prasideda tikroji magija. Algoritmas naudoja vadinamąją autokoreliacijos funkciją arba panašius metodus, kad nustatytų pagrindinį dažnį kiekviename garso signalo fragmente. Tai nėra paprasta užduotis, nes realus balsas nėra grynas sinusoidinis signalas – jame yra daugybė obertonų, šnypščiančių garsų, kvėpavimo triukšmo. Algoritmui reikia atpažinti, kur yra pagrindinis tonas, o kur – visa kita.
Matematika, kuri „traukia” balsą į vietą
Kai algoritmas jau žino, kokiu dažniu dabar skamba balsas, prasideda korekcija. Vartotojas arba garso inžinierius nustato, kokios skalės ar tonacijos reikia laikytis. Pavyzdžiui, jei daina yra C-dur tonacijoje, algoritmas žino, kad leistinos tik tam tikros notos: C, D, E, F, G, A, B ir jų oktavos.
Dabar įdomiausia dalis – kaip pakeisti dažnį nepakeičiant garso trukmės ir neprarandant natūralaus skambesio? Čia naudojamas vadinamasis fazės vokoderių (phase vocoder) principas arba panašios technologijos. Supaprastintai tariant, algoritmas garso signalą suskaido į mažus fragmentus, analizuoja kiekvieno fragmento dažnį ir fazę, tada perkelia šiuos fragmentus į naują dažnį, išlaikydamas kitas garso charakteristikas.
Tai tarsi paimtumėte garso įrašą ir grotumėte jį šiek tiek greičiau ar lėčiau, bet tuo pačiu kompensuotumėte laiko pokyčius, kad bendras įrašo tempas išliktų tas pats. Skamba sudėtingai? Taip ir yra – tai reikalauja intensyvių skaičiavimų realiuoju laiku.
Retune Speed – greičio ir natūralumo balansas
Vienas svarbiausių Auto-Tune parametrų yra „Retune Speed” arba korekcijos greitis. Šis parametras nustato, kaip greitai algoritmas „patrauks” netikslų toną į artimiausią teisingą notą. Ir čia slypi visas skirtumas tarp natūralaus skambesio ir to garsiojo „Auto-Tune efekto”.
Jei nustatysite Retune Speed į 0 (greičiausias nustatymas), korekcija vyks akimirksniu. Bet koks nukrypimas nuo notos bus nedelsiant ištaisytas. Būtent tai sukuria tą robotišką, mechaninį skambesį, kurį T-Pain ir kiti atlikėjai padarė populiarų 2000-ųjų pradžioje. Balsas tiesiog „šoka” nuo notos prie notos be jokių perėjimų.
Priešingai, jei Retune Speed nustatysite į 50 ar 100 milisekundžių, korekcija vyks palaipsniui. Algoritmas leis natūraliems vibrato ir glissando efektams išlikti, tik švelniai nukreips bendrą toną teisinga kryptimi. Profesionalūs garso inžinieriai dažnai naudoja būtent tokius nustatymus pop ir rock muzikoje – klausytojas net nepastebi, kad buvo naudotas Auto-Tune, bet dainininko balsas skamba nepriekaištingai.
Humanize funkcija ir natūralaus vibrato išsaugojimas
Antares suprato, kad vienas didžiausių iššūkių yra išsaugoti natūralų žmogiškumą balse. Todėl vėlesnėse Auto-Tune versijose atsirado „Humanize” funkcija. Ši funkcija analizuoja, ar dažnio pokytis yra greitas (tikėtina, kad tai yra perėjimas tarp notų) ar lėtas (tikėtina, kad tai vibrato arba natūralus natos pradžios „įsibėgėjimas”).
Kai dainininkas pradeda dainuoti notą, natūralu, kad dažnis šiek tiek „klaidžioja” pirmąsias dešimtąsias sekundės dalių. Tai normalu ir suteikia balso šilumą. Humanize funkcija leidžia šiems natūraliems nukrypimams egzistuoti, bet vis tiek koreguoja bendrą natos centrą. Tai tarsi algoritmas „supranta” dainininko ketinimus ir padeda juos realizuoti, o ne tiesiog mechaniškai taiso kiekvieną nukrypimą.
Vibrato – tas natūralus balso virpėjimas, kurį naudoja visi geri dainininkai – taip pat gali būti išsaugotas. Algoritmas gali atpažinti periodinius dažnio svyravimus ir suprasti, kad tai yra tyčinis muzikinis efektas, o ne klaida, kurią reikia taisyti.
Formantų išsaugojimas ir balso charakterio apsauga
Viena didžiausių problemų keičiant garso dažnį yra formantų pokytis. Formantai – tai rezonansų dažniai mūsų balso trakte, kurie suteikia kiekvieno žmogaus balsui unikalų charakterį. Jie priklauso nuo mūsų ryklės, burnos ir nosies formų, o ne nuo to, kokią notą dainuojame.
Jei paprasčiausiai pakeistumėte garso įrašo greitį (kaip seną vinilinę plokštelę sukant greičiau), ne tik pasikeis tonas, bet ir formantai. Balsas skambės tarsi iš chipmunk ar, priešingai, iš lėto monstro. Auto-Tune algoritmas turi išsaugoti formantas nepakitusias, net keičiant pagrindinį dažnį.
Tai pasiekiama naudojant sudėtingus signalų apdorojimo metodus, kurie atskiria spektro komponentus, atsakingus už tonį, nuo tų, kurie atsakingi už tembro charakteristikas. Modernios Auto-Tune versijos tai daro labai efektyviai, todėl net stipriai koreguotas balsas išlaiko savo natūralų charakterį – vyriškumas ar moteriškumas, šiluma ar ryškumas, visa tai išlieka.
Realaus laiko apdorojimas ir latencijos problema
Vienas didžiausių techninių iššūkių buvo padaryti Auto-Tune veikiantį realiuoju laiku. Studijoje įrašant galima apdoroti garsą jau po įrašymo, bet daug atlikėjų nori girdėti koreguotą balsą ausiniuose tiesiogiai dainuodami. O koncertuose – tai būtinybė.
Problema ta, kad visi tie sudėtingi skaičiavimai užtrunka laiko. Jei algoritmas užtruktų nors 50 milisekundžių, dainininkas jau pastebėtų vėlavimą tarp to, ką dainuoja, ir to, ką girdi. Tai labai trukdo ir gali visiškai sugriauti pasirodymą.
Antares inžinieriai optimizavo algoritmą taip, kad latencija būtų minimali – paprastai apie 1-2 milisekundes. Tai pasiekiama naudojant efektyvius algoritmus, kurie analizuoja tik būtiniausią informaciją, ir specializuotą aparatinę įrangą (DSP procesorius), skirtą tokiems skaičiavimams. Šiuolaikiniai kompiuteriai taip pat tapo pakankamai galingi, kad galėtų vykdyti šiuos skaičiavimus beveik be vėlavimo.
Nuo subtilios pagalbos iki kūrybinio įrankio
Įdomu tai, kad Auto-Tune evoliucionavo iš paprastos korekcijos priemonės į pilnavertį kūrybinį instrumentą. Pirmaisiais metais jis buvo naudojamas tik kaip „skaitmeninė saugos tinklas” – pataisyti vieną kitą netikslią notą, kad nereikėtų perrašinėti viso takelio.
Bet 1998 metais Cher daina „Believe” viską pakeitė. Garso inžinierius Mark Taylor tyčia nustatė ekstremalias Auto-Tune reikšmes, sukurdamas tą charakteringą, robotišką efektą. Staiga Auto-Tune tapo ne klaidos taisymo įrankiu, o nauju garso efektu, turinčiu savo estetiką.
T-Pain šį efektą padarė savo prekės ženklu 2000-ųjų viduryje, ir netrukus jį naudojo beveik visi hip-hop ir R&B atlikėjai. Kai kurie muzikos kritikai ir puristai tai vadino „muzikos mirtimi”, bet realybė tokia, kad tai tiesiog naujas kūrybinis įrankis, kaip ir bet kuris kitas efektas – reverb, delay ar distortion.
Šiandien Auto-Tune naudojamas abiem būdais. Daugelyje pop, country ir net rock įrašų jis dirba fone, subtiliai koreguodamas tonus taip, kad niekas nepastebėtų. Tuo pačiu metu jis išlieka populiarus kaip kūrybinis efektas elektroninėje, hip-hop ir eksperimentinėje muzikoje. Kai kurie atlikėjai, kaip Travis Scott ar Lil Uzi Vert, savo skambesį stato būtent ant stipriai apdoroto, Auto-Tune prisodrintų vokalų.
Kai technologija tampa muzikos dalimi
Diskusijos apie Auto-Tune dažnai sukasi apie autentiškumą ir „tikrumą” muzikoje. Bet jei pagalvotume, kiekviena technologija muzikoje kažkada buvo nauja ir sukėlė diskusijų. Elektrinė gitara, sintezatoriai, drum mašinos – visi šie instrumentai buvo kritikuojami kaip „netikri” ar „apgaulingi”.
Realybė tokia, kad Auto-Tune, kaip ir bet kuri technologija, yra tik įrankis. Jis gali būti naudojamas gerai arba blogai, subtiliai arba akivaizdžiai, pagelbėti talentui arba pridengti jo trūkumą. Bet pats algoritmas – tai nuostabus inžinerijos pasiekimas, sujungiantis signalų apdorojimo teoriją, matematiką ir muzikos supratimą.
Įdomu ir tai, kad Auto-Tune paveikė ne tik tai, kaip muzika įrašoma, bet ir tai, kaip ji kuriama. Kai kurie prodiuseriai specialiai rašo melodijas, žinodami, kaip jos skambės per Auto-Tune. Tam tikri intervalai ir melodiniai šuoliai sukuria įdomius efektus, kai yra stipriai apdorojami. Tai tarsi nauja muzikos kalba, kuri neegzistavo prieš šią technologiją.
Antares Auto-Tune algoritmas taip pat paskatino konkurenciją – dabar yra daugybė alternatyvų, nuo Celemony Melodyne iki Waves Tune. Kiekvienas turi savo privalumų ir skirtingą skambesį. Bet Auto-Tune išliko standartine pramonės priemone, iš dalies dėl savo pirmojo žaidėjo pranašumo, iš dalies dėl nuolatinių inovacijų.
Galiausiai, šis algoritmas primena mums, kad muzika ir technologija visada ėjo koja kojon. Nuo pirmųjų įrašymo technologijų iki šiuolaikinių skaitmeninių garso darbo stočių – technologija ne tik fiksuoja muziką, bet ir formuoja ją. Auto-Tune yra tik vienas pavyzdys, kaip matematika ir inžinerija gali sukurti kažką, kas keičia viso pasaulio garso peizažą. Ir nesvarbu, ar jums patinka tas robotiškas efektas, ar ne – negalima neįvertinti technologinio šio išradimo grožio ir jo įtakos šiuolaikinei muzikai.




