YouTube algoritmai: kaip sistema parenka vaizdo įrašus

Kas slypi už rekomenduojamų vaizdo įrašų sąrašo

Kiekvieną dieną milijardai žmonių atidaro YouTube ir mato skirtingus vaizdo įrašus. Vienas gauna kulinarijos receptus, kitas – automobilių apžvalgas, trečias – filosofines diskusijas. Kaip platforma žino, ką tau rodyti? Atsakymas slypi sudėtingoje algoritmų sistemoje, kurią YouTube tobulino daugiau nei dešimtmetį.

YouTube algoritmai – tai ne vienas didelis mechanizmas, o keletas skirtingų sistemų, dirbančių kartu. Pagrindinis jų tikslas paprastas: išlaikyti tave platformoje kuo ilgiau. Skamba šiek tiek ciniškai, bet būtent taip veikia beveik visos socialinės platformos. Kuo ilgiau žiūri, tuo daugiau reklamos pamatysi, tuo daugiau pinigų uždirbs Google.

Tačiau tai nereiškia, kad sistema tiesiog bando tave „įkalinti”. YouTube supranta, kad jei rodys šlamštą, greitai išeisi. Todėl algoritmai stengiasi rasti pusiausvyrą tarp to, kas tau patinka, ir to, kas tau gali patikti ateityje. Šis balansas nuolat keičiasi, nes ir tavo pomėgiai nėra pastovūs.

Trys pagrindiniai algoritmo komponentai

YouTube rekomenduojamų vaizdo įrašų sistema veikia trimis pagrindiniais lygmenimis. Pirmas – tai paieškos algoritmas, kuris aktyvuojamas, kai pats ieškosi konkretaus turinio. Čia sistema analizuoja tavo užklausą ir bando suprasti, ko tiksliai nori. Ar ieškosi pamokos, pramogos, ar gal naujienos?

Antras komponentas – rekomenduojamų vaizdo įrašų sistema, kuri veikia pagrindiniame puslapyje ir dešinėje pusėje, kai žiūri kokį nors vaizdo įrašą. Ši sistema analizuoja tavo žiūrėjimo istoriją, laiką, kurį praleidai prie kiekvieno vaizdo įrašo, tavo paspaudimus „patinka” ir „nepatinka”, net tai, kokius vaizdo įrašus praleidi nepaspaudęs.

Trečias svarbus elementas – prenumeratų srautas. Čia, atrodytų, viskas paprasta: rodo tuos kanalus, kuriuos prenumeruoji. Bet ne visai. Net ir čia algoritmas sprendžia, kuriuos naujus vaizdo įrašus rodyti pirmiau, o kuriuos – vėliau arba visai nerodyti tavo sraute.

Visi šie komponentai naudoja mašininio mokymosi technologijas. Sistema stebi milijardus vartotojų veiksmų ir ieško šablonų. Jei žmonės, kurie žiūri panašius vaizdo įrašus kaip tu, taip pat domisi tam tikra tema, yra didelė tikimybė, kad tau bus pasiūlyta ta pati tema.

Signalai, kuriuos algoritmas seka

YouTube stebi šimtus skirtingų signalų, bet kai kurie yra svarbiausi. Žiūrėjimo laikas – tai karalius tarp visų metrikų. Ne peržiūrų skaičius, o būtent tai, kiek laiko žmonės praleidžia žiūrėdami. Jei tavo 10 minučių vaizdo įrašą žmonės žiūri vidutiniškai 8 minutes – tai puiku. Jei tik 30 sekundžių – algoritmas supras, kad kažkas ne taip.

Įsitraukimas (engagement) – tai komentarai, patikimai, dalinimasis, net nepatikimai. Taip, netgi neigiamas įsitraukimas gali padėti vaizdo įrašui plisti, nes rodo, kad žmonės reaguoja. Todėl matai tiek daug provokacinių antraščių ir miniatiūrų – jos skatina reakcijas.

Paspaudimų dažnis (click-through rate, CTR) rodo, kiek žmonių paspaudžia tavo vaizdo įrašą, kai jį pamato. Jei iš 100 žmonių, kuriems buvo parodytas tavo vaizdo įrašas, paspaudė 10 – tai 10% CTR, kas yra gana gerai. Bet čia svarbu suprasti: aukštas CTR nieko nereiškia, jei žmonės iš karto išeina. Todėl sistema žiūri į abi metrikos kartu.

Šviežumas taip pat svarbus. Naujesni vaizdo įrašai dažnai gauna pirmenybę, ypač jei prenumeruoji kanalą. Bet tai nereiškia, kad seni vaizdo įrašai neturi šansų – jei tema amžina ir žmonės vis dar ieško tos informacijos, senas vaizdo įrašas gali ir toliau gerai veikti.

Kaip sistema mokosi iš tavo elgesio

Kiekvieną kartą, kai atidari YouTube, algoritmas jau turi apie tave nemažai informacijos. Jei esi prisijungęs, sistema žino visą tavo žiūrėjimo istoriją. Bet net jei nesi prisijungęs, ji vis tiek seka tavo sesiją per slapukus ir kitus identifikatorius.

Sistema stebi ne tik tai, ką žiūri, bet ir kaip žiūri. Ar peršoki vaizdo įrašo dalis? Kurias? Ar grįžti atgal peržiūrėti tam tikrą momentą? Ar sustabdai ir skaitai komentarus? Visa ši informacija padeda algoritmui suprasti, kas tau tikrai įdomu.

Įdomus dalykas: YouTube naudoja dviejų lygių filtravimą. Pirma, iš milijonų vaizdo įrašų atrenkama keletas šimtų kandidatų, kurie gali tau patikti. Tai daroma greitai, naudojant paprastesnius metodus. Paskui šie kandidatai rūšiuojami tiksliau, naudojant sudėtingesnius neuroninius tinklus, kurie įvertina kiekvieną vaizdo įrašą pagal daugybę parametrų.

Tavo kontekstas taip pat svarbus. Kokia dienos dalis? Savaitės diena? Iš kokio įrenginio žiūri? Statistika rodo, kad žmonės vakare linkę žiūrėti ilgesnius, rimtesnius vaizdo įrašus, o per pietų pertrauką – trumpus ir linksmesnius. Algoritmas tai žino ir prisitaiko.

Kodėl kartais gauni keistus pasiūlymus

Turbūt pastebėjai, kad kartais YouTube pasiūlo kažką visiškai nesusijusio su tavo įprastais pomėgiais. Tai ne klaida – tai tyrinėjimo funkcija (exploration). Sistema sąmoningai kartais parodo tau kažką naujo, kad patikrintų, ar tavo interesai nėra pasikeitę arba ar neatrastų naują temą, kuri tau galėtų patikti.

Šis mechanizmas padeda išvengti „burbulo efekto”, kai matai vis tą patį turinį. Nors, tiesą sakant, daugelis žmonių būtent ir nori matyti panašų turinį, todėl algoritmas atsargiai dozuoja naujoves. Jei paspaudei į tokį „eksperimentinį” vaizdo įrašą ir jį žiūrėjai – sistema užsifiksavo naują tavo interesą.

Kitas dalykas – virusinio turinio efektas. Kai koks nors vaizdo įrašas pradeda sparčiai plisti, algoritmas jį rodo net tiems žmonėms, kurie paprastai nedomisi ta tema. Sistema supranta, kad kai kuris turinys yra universalus ir gali sudominti plačią auditoriją. Todėl kartais matai rekomenduojamų vaizdo įrašų sąraše kažką labai populiaraus, nors tai visiškai ne tavo tema.

Kūrėjų ir algoritmo santykis

Jei pats kuri turinį YouTube, algoritmas tau – ir draugas, ir priešas. Daugelis kūrėjų jaučiasi priklausomi nuo sistemos malonės. Vienas vaizdo įrašas gauna milijonus peržiūrų, kitas – vos kelias šimtus, nors, tavo nuomone, kokybė panaši.

YouTube oficialiai rekomenduoja kūrėjams sutelkti dėmesį į žiūrovų pasitenkinimą, o ne į algoritmą. Skamba kaip klišė, bet iš tiesų turi prasmę. Sistema pakankamai protinga, kad atpažintų tikrą kokybę – jei žmonės žiūri tavo vaizdo įrašus iki galo, komentuoja, grįžta į tavo kanalą – algoritmas tai pastebės.

Tačiau yra ir praktinių dalykų, kuriuos verta žinoti. Pirmosios 24-48 valandos po vaizdo įrašo publikavimo yra kritinės. Sistema testuoja tavo turinį su nedidele auditorija (dažniausiai tavo prenumeratoriais) ir žiūri, kaip jie reaguoja. Jei reakcija gera – vaizdo įrašas pradedamas rodyti plačiau.

Nuoseklumas taip pat svarbus. Kanalai, kurie reguliariai publikuoja turinį, paprastai geriau veikia nei tie, kurie išleidžia vaizdo įrašą kartą per mėnesį. Algoritmas mėgsta nuspėjamumą ir aktyvumą. Bet čia svarbu nerasti tik kiekybės – jei kokybė krenta, žiūrovai tai pastebės, o kartu ir algoritmas.

Kontroversiškos algoritmo pusės

YouTube algoritmas ne kartą buvo kritikuojamas dėl įvairių problemų. Viena didžiausių – radikalizacijos efektas. Tyrimai parodė, kad sistema kartais gali vesti žmones link vis ekstremalesnio turinio. Jei pradedi žiūrėti politinius vaizdo įrašus, algoritmas gali siūlyti vis radikalesnes nuomones, nes tokio turinio žiūrėjimo laikas dažnai būna ilgas – žmonės įsitraukia į diskusijas.

YouTube teigia, kad dirba ties šia problema. 2019 metais jie pakeitė algoritmus, kad sumažintų „ribinio turinio” (borderline content) rekomenduojamumą. Tai turinys, kuris netechniškai nepažeidžia taisyklių, bet yra klaidinantis ar potencialiai žalingas. Bet tai sudėtinga problema, nes kas vienam yra klaidinanti informacija, kitam – alternatyvi nuomonė.

Vaikų turinys – kita jautri sritis. Po kelių skandalų, kai paaiškėjo, kad vaikams buvo rekomenduojamas netinkamas turinys, YouTube sugriežtino taisykles. Dabar vaizdo įrašai, pažymėti kaip skirti vaikams, turi daug apribojimų ir veikia pagal specialius algoritmus.

Dar viena problema – dezinformacija. Ypač tai aktualu sveikatos ir politikos temose. YouTube bando kovoti su šiuo reiškiniu keliomis strategijomis: kelia patikimų šaltinių (kaip naujienų organizacijų) turinį, prideda informacinius skydelius prie jautrių temų, mažina konspiracijos teorijų pasiekiamumą.

Ateities perspektyvos ir kas laukia toliau

YouTube algoritmai nuolat keičiasi. Google investuoja milijonus į dirbtinio intelekto tyrimus, ir didelė dalis šių inovacijų patenka į YouTube. Naujausi pokyčiai apima geresnį vaizdo turinio supratimą – sistema dabar gali „matyti”, kas vyksta vaizdo įraše, o ne tik skaityti pavadinimą ir aprašymą.

Multimodalinis mokymasis – tai būsimybė. Sistema pradeda analizuoti ne tik vaizdą ir tekstą, bet ir garsą, emocijas, net subtilias detales kaip veidų išraiškas. Tai leidžia tiksliau suprasti turinio pobūdį ir geriau jį suderinti su žiūrovų poreikiais.

Kitas svarbus trendas – personalizacijos gilinimas. Ateityje algoritmai gali pradėti kurti unikalias miniatiūras ar pavadinimus skirtingiems žmonėms. Tas pats vaizdo įrašas tau gali būti parodytas su viena antrašte, o kitam žmogui – su kita, priklausomai nuo to, kas labiau motyvuotų paspausti.

Bet kartu auga ir skaidrumo reikalavimai. Europos Sąjunga ir kitos jurisdikcijos spaudžia platformas atskleisti daugiau informacijos apie tai, kaip veikia jų algoritmai. Gali būti, kad ateityje turėsime daugiau kontrolės ir supratimo apie tai, kodėl mums rodomas tam tikras turinys.

Kaip išmokti dirbti su sistema, o ne prieš ją

Supratimas, kaip veikia YouTube algoritmai, padeda ir žiūrovams, ir kūrėjams. Jei esi žiūrovas ir nori geresnių rekomenduojamų vaizdo įrašų, aktyviai valdyk savo istoriją. Naudok „nedomina” funkciją, kai gauni netinkamas rekomendacijas. Ištrink iš istorijos vaizdo įrašus, kuriuos žiūrėjai atsitiktinai, bet kurie neatspindi tavo tikrųjų interesų. Prenumeruok kanalus, kurie tau tikrai patinka, ir įjunk pranešimus.

Kūrėjams patarimas paprastas, bet ne lengvas įgyvendinti: kurkite turinį, kurį patys norėtumėte žiūrėti. Skamba kaip klišė, bet algoritmas geriausiai veikia su autentišku turiniu. Žmonės jaučia, kai bandai manipuliuoti sistema ar kurti tik dėl peržiūrų. Geriau turėti mažesnę, bet įsitraukusią auditoriją nei milijonus neaktyvių prenumeratorių.

Analizuokite savo statistiką YouTube Studio. Ten rasite neįtikėtinai daug informacijos apie tai, kaip žmonės randa jūsų vaizdo įrašus, kiek laiko žiūri, kur išeina. Ši informacija vertingesnė už bet kokius bendrus patarimus apie algoritmus, nes parodo, kas veikia būtent jūsų kanale.

Ir galiausiai – būkite kantrūs. Algoritmai mėgsta nuoseklumą ir laiką. Naujas kanalas nebus rekomenduojamas taip pat kaip kanalas, kuris aktyvus kelerius metus. Sistema turi išmokti suprasti jūsų turinį, surasti jūsų auditoriją, patikrinti, ar žmonės grįžta. Tai procesas, kuris užtrunka, bet jei turite ką pasakyti ir sakote tai gerai – algoritmas galiausiai jus pastebės.

Поделиться: XFacebookPinterestLinkedin