Kaip jūsų telefonas atpažįsta jūsų veidą greičiau nei geriausia draugė
Prisimenu, kai pirmą kartą išbandžiau veido atpažinimo funkciją savo telefone – atrodė kaip mažas stebuklas. Tiesiog pažiūri į ekraną ir įrenginys atsirakina. Bet kaip tas dalykas iš tikrųjų veikia? Pasirodo, už šito paprasto veiksmo slypi sudėtinga technologija, kuri per kelias dešimtmetes evoliucionavo nuo mokslinių eksperimentų iki kasdienio įrankio mūsų kišenėse.
Veido atpažinimo technologija šiandien yra visur – nuo telefonų iki oro uostų, nuo socialinių tinklų iki bankų sistemų. Ir nors daugelis žmonių naudojasi ja kasdien, nedaugelis supranta, kokie algoritmai ir procesai vyksta už ekrano. Pabandykime tai išsiaiškinti be sudėtingų matematinių formulių ir techninio žargono.
Nuo nuotraukos iki skaitmeninės veido žemėlapio
Pirmasis ir svarbiausias žingsnis – tai kaip kompiuteris „mato” jūsų veidą. Skirtingai nei mes, kurie tiesiog atpažįstame veidus intuityviai, kompiuteriui reikia viską paversti skaičiais. Čia ir prasideda magija.
Kai kamera užfiksuoja jūsų veidą, sistema pirmiausia turi jį aptikti vaizde. Tai gali skambėti paprasta, bet pagalvokite – nuotraukoje gali būti daug objektų, skirtingas apšvietimas, įvairūs kampai. Modernūs algoritmai naudoja tai, kas vadinama „Haar kaskadais” arba gilesnius neuroninius tinklus, kad atskirtų veidą nuo fono.
Aptikęs veidą, algoritmas pradeda ieškoti tam tikrų charakteringų taškų – tai vadiname „veido orientyrais” arba landmark detection. Paprastai sistema ieško 68-194 specifinių taškų: akių kampučių, nosies galiuko, lūpų kontūrų, žandikaulių linijų. Kai kurios pažangesnės sistemos gali identifikuoti net iki 1000 tokių taškų. Kuo daugiau taškų, tuo tikslesnė identifikacija.
Geometrija ir atstumų žaidimas
Dabar prasideda įdomiausia dalis. Sistema išmatuoja atstumus tarp šių taškų ir sukuria tai, kas vadinama „veido parašu” arba faceprint. Tai tarsi jūsų veido skaitmeninis pirštų atspaudas. Pavyzdžiui, atstumas tarp akių, nosies ilgis, skruostikaulių plotis, žandikaulio forma – visa tai paverčiama matematine formule.
Įdomu tai, kad šis „parašas” paprastai užima labai mažai vietos – dažniausiai tik kelias kilobaites. Jūsų telefone nesaugoma tikra nuotrauka (bent jau teoriškai), o tik šis matematinis kodas. Todėl net jei kas nors gautų prieigą prie šių duomenų, jis nematytų jūsų veido nuotraukos, o tik skaičių rinkinį.
Dirbtinio intelekto revoliucija veido atpažinime
Ankstyvosios veido atpažinimo sistemos buvo gana primityvios ir veikė remiantis paprastomis taisyklėmis. Bet maždaug prieš 10-15 metų viskas pasikeitė, kai į žaidimą įsijungė gilieji neuroniniai tinklai (deep learning). Tai buvo tikras proveržis.
Šiuolaikinės sistemos naudoja konvoliucinius neuroninius tinklus (CNN), kurie mokosi atpažinti veidus panašiai kaip žmogaus smegenys – per patirtį. Sistema „maitinama” milijonais veido nuotraukų, ir ji pati išmoksta, kokie požymiai yra svarbiausi atpažinimui. Nebereikia programuotojams rankiniu būdu nurodyti, kad svarbu matuoti atstumą tarp akių – sistema pati tai supranta.
Vienas populiariausių tokių tinklų vadinasi FaceNet, kurį sukūrė Google inžinieriai. Jis gali atpažinti veidus su daugiau nei 99% tikslumu – tai geriau nei vidutinis žmogus! Kiti žinomi algoritmai – DeepFace (Facebook/Meta), VGGFace, ArcFace. Kiekvienas turi savo ypatumų, bet principas panašus.
Kaip sistema mokosi
Mokymo procesas yra fascinuojantis. Įsivaizduokite, kad turite milijoną nuotraukų su 10,000 skirtingų žmonių. Sistema pradeda mokytis, palyginant nuotraukas ir bandydama suprasti, kas daro kiekvieną veidą unikalų. Ji mokosi taip, kad to paties žmogaus skirtingos nuotraukos (su skirtingomis šukuosenomis, apšvietimu, kampais) būtų atpažįstamos kaip tas pats asmuo, o skirtingų žmonių nuotraukos būtų aiškiai atskirtos.
Čia naudojamas metodas vadinamas „triplet loss” – sistema vienu metu žiūri į tris nuotraukas: bazinę, tos pačios asmenybės ir kito žmogaus. Ji mokosi taip koreguoti savo parametrus, kad pirmosios dvi būtų „artimesnės” matematine prasme nei pirmoji ir trečioji.
Kodėl jūsų telefonas nesupainioja jūsų su dvyniu
Vienas dažniausių klausimų – kaip sistema atskiria labai panašius veidus? Atsakymas slypi detalėse. Nors mes galime pamatyti du panašius veidus ir pasakyti „jie atrodo beveik vienodai”, algoritmai mato mikroskopines detales, kurių mes nepastebime.
Šiuolaikinės sistemos analizuoja ne tik akivaizdžius bruožus, bet ir subtilias detales: odos tekstūrą, smulkias raukšles, net kraujagyslių išsidėstymą po oda (naudojant infraraudonųjų spindulių kamerą). Kai kurios sistemos gali aptikti net mikro-išraiškas – nevalingus veido raumenų judesius, kurie yra unikalūs kiekvienam žmogui.
Pavyzdžiui, Apple Face ID naudoja daugiau nei 30,000 infraraudonųjų taškų projekciją ant jūsų veido, sukurdama tikslų 3D žemėlapį. Tai leidžia sistemai atpažinti jus net tamsoje ir atskirti tikrą veidą nuo nuotraukos.
Saugumo iššūkiai ir apgaulės metodai
Žinoma, kur technologija, ten ir bandymai ją apgauti. Ankstyvąsias veido atpažinimo sistemas buvo galima apgauti tiesiog parodžius nuotrauką. Dabar tai jau nebeveikia su rimtomis sistemomis, bet sukčiai nuolat ieško naujų būdų.
Vienas žinomiausių bandymų – naudoti 3D atspausdintą veido kaukę. Kai kurios sistemos iš tikrųjų gali būti apgautos labai kokybiškomis kaukėmis, kurios kainuoja tūkstančius eurų. Bet praktiškai tai nėra reali grėsmė eiliniam vartotojui – kam nors reikėtų turėti jūsų veido 3D skenavimą ir investuoti daug pinigų bei laiko.
Modernios sistemos naudoja „gyvumo aptikimą” (liveness detection). Jos gali paprašyti jūsų mirksėti, šypsotis, pasukti galvą arba tiesiog analizuoja mikro-judesius, kurie įrodo, kad prieš kamerą yra gyvas žmogus. Kai kurios sistemos naudoja termografiją – matuoja šilumą, kurią skleidžia gyvas veidas.
Privatumo klausimas
Čia prasideda filosofinė diskusija. Kiekvienas veido atpažinimo naudojimas kelia klausimą: kur saugomi mano duomenys? Kas juos mato? Ar galiu būti sekamas be savo žinios?
Geros naujienos yra tai, kad daugelis šiuolaikinių telefonų (kaip iPhone ar naujesni Android įrenginiai) apdoroja veido duomenis tiesiog pačiame įrenginyje, nenusiųsdami jų į debesį. Jūsų veido „parašas” saugomas užšifruotame telefono čipe, kurį beveik neįmanoma pasiekti net su fizine prieiga prie įrenginio.
Tačiau situacija kitokia su viešomis sistemomis – oro uostuose, parduotuvėse, gatvėse. Čia duomenys dažnai saugomi centralizuotose duomenų bazėse, ir reguliavimas skiriasi priklausomai nuo šalies. Europoje GDPR įstatymai suteikia tam tikrą apsaugą, bet ne visur pasaulyje yra tokios griežtos taisyklės.
Praktinis panaudojimas šiandien ir rytoj
Veido atpažinimas jau seniai peržengė telefono atrakinimo ribas. Bankai naudoja jį kliento tapatybės patvirtinimui, oro uostuose jis paspartina pasienio kontrolę, parduotuvės analizuoja pirkėjų demografiją (nors tai ir keliama diskusijų).
Medicinos srityje veido atpažinimas padeda diagnozuoti retas genetines ligas – kai kurios būklės pasireiškia specifiniais veido bruožais, kuriuos algoritmai gali aptikti greičiau nei gydytojai. Yra tyrimų, kurie rodo, kad dirbtinis intelektas gali net nustatyti tam tikras širdies ligas analizuodamas veido spalvą ir mikro-pokyčius.
Švietimo įstaigose sistema gali automatiškai registruoti lankomumą. Renginiuose – greitinti įėjimą be bilietų tikrinimo. Namuose – personalizuoti išmaniųjų namų nustatymus priklausomai nuo to, kas įėjo į kambarį.
Kas laukia ateityje
Technologija nestovi vietoje. Jau dabar kuriami algoritmai, kurie gali atpažinti žmones net su kaukėmis (COVID pandemija tai paspartino), iš labai didelių atstumų, net iš dalinio veido profilio. Kai kurie tyrimai rodo, kad ateityje bus įmanoma atpažinti žmones net pagal jų eisenos būdą ar kūno kalbą, net nematant veido.
Kita kryptis – emocijų atpažinimas. Algoritmai mokosi suprasti, ar žmogus yra laimingas, liūdnas, piktas ar sunerimęs. Tai gali būti naudinga psichologijoje, rinkodaroje, net automobilių saugume (aptikti, ar vairuotojas yra pavargęs ar išsiblaškęs).
Ką reikia žinoti naudojant veido atpažinimą
Jei naudojate veido atpažinimą savo telefone ar kituose įrenginiuose, yra keletas dalykų, kuriuos verta žinoti. Pirma, sistema veikia geriau, kai ją „mokote” skirtingomis sąlygomis – su akiniais ir be jų, skirtingu apšvietimu, su skirtingomis šukuosenomis.
Antra, jei labai susirūpinęs saugumu, žinok, kad veido atpažinimas nėra 100% neįveikiamas. Kai kurie ekspertai rekomenduoja naudoti papildomą apsaugą – PIN kodą ar pirštų atspaudus – ypač svarbiems įrenginiams. Yra situacijų (pavyzdžiui, kai miegojate), kai kas nors galėtų atrakinti jūsų telefoną tiesiog priartinęs jį prie jūsų veido.
Trečia, būkite atsargūs su programėlėmis, kurios prašo prieigos prie kameros ir veido atpažinimo funkcijų. Ne visos programėlės yra patikimos, ir kai kurios gali piktnaudžiauti šia informacija. Skaitykite privatumo politikas ir suteikite leidimus tik patikimoms programėlėms.
Kai technologija sutinka žmoniškumą
Grįžtant prie pradžios – veido atpažinimo technologija yra nuostabus pavyzdys, kaip matematika, kompiuterių mokslas ir dirbtinis intelektas gali sukurti kažką, kas atrodo beveik magiškai. Bet svarbu prisiminti, kad tai tik įrankis, kurio vertė priklauso nuo to, kaip jį naudojame.
Geriausi veido atpažinimo algoritmai šiandien dirba su tikslumu, kuris pranoksta žmogaus gebėjimus. Tačiau jie vis dar turi apribojimų – gali būti šališki (kai kurie algoritmai prasčiau atpažįsta tam tikrų etninių grupių veidus, jei nebuvo treniruoti su pakankamai įvairiomis nuotraukomis), gali klysti dėl neįprastų sąlygų, ir svarbiausia – jiems trūksta konteksto supratimo, kurį mes, žmonės, turime natūraliai.
Ateityje tikėtina, kad ši technologija taps dar tikslesnė, greitesnė ir labiau paplitusi. Mūsų užduotis – užtikrinti, kad ji būtų naudojama etiškai, skaidriai ir su pagarba kiekvieno žmogaus privatumui. Technologija turėtų tarnauti žmonėms, o ne atvirkščiai. Ir kol mes tai prisimename, veido atpažinimas gali būti puikus įrankis, darantis mūsų gyvenimą saugesnį ir patogesnį.




