Prisma: kodėl tai ne trumpas susižavėjimas, o technologijos fenomenas

Birželio 11 dieną App Store atsirado Mail.ru Group darbuotojo A. Moisenkovo sukurta programėlė Prisma. „Prisma“, aprašoma kaip kamera su dirbtiniu intelektu (AI Camera), patraukė naudotojų dėmesį visame pasaulyje. Galimybė pasidarytą asmenukę paversti ją Munko tapyta drobe (yra ir kitų dailininkų bei filtrų) įkvėpė milijonus aifonų savininkų. Dar daugiau naudotojų ėmė skųstis feisbuko ir instagramo laikjuostes užvertusiais Kandinskiais ir Roy'ais Lichtensteinais. Susierzinimą stiprino ir Prisma proveržio informacinėse technologijose reikšmės nesupratimas.Pasiaiškinkime, kodėl ši programėlė – daugiau, nei dar vienas žaisliukas telefone.

Kaip veikia Prisma?

Jūs padarote nuotrauką, pasirenkate filtrą. Prisma nusiunčia atvaizdą į serverį, kur dirbtinis neuroninis tinklas (NT) jį mikliai apdoroja ir grąžina, suteikęs vieno ar kito dailininko stilių. Jūs paveikslėlį publikuojate ir renkate laikus.

Būtent NT panaudojimas ir išskiria Prisma nuo nuo Instagram ar grafinių redagavimo programėlių standartinių filtrų, kur (labai supaprastintai tariant) algoritmas atvaizdą iškraipo visiškai aiškiu, nuspėjamu būdu.

Kas yra neuroninis tinklas?

Jei labai trumpai, tai – matematinis modelis, imituojantis gyvų smegenų nervinių ląstelių ryšius. Dirbtiniai neuronai santykinai paprasti, tačiau apjungti į sistemą, į gaunamus signalus gali reaguoti, formuodami sudėtingus atsakymus.

Principinis NT skirtumas – jis apmokomas, o ne programuojamas.

Principinis neuroninio tinklo skirtumas – jis apmokomas, o ne programuojamas.

Tradicinės programos privalo numatyti visus įmanomus atsakymus į visus įmanomus klausimus. NT galima sumaitinti daugybę atvaizdų ir galiausiai gauti kažką panašaus, be išankstinio taisyklių formulavimo. Prisma veikiausia naudoja konvoliucinius NT (convolutional neural network).

Kas yra konvoliucinis NT ir kam man tai žinoti?

Konvoliucinis NT susideda iš daugybės sluoksnių, ir, apžiūrinėdamas paveikslėlį, pamažu atvaizdo fragmentus priskiria požymiams. Šimtais požymių leidžia jei ne pačiupinėti dramblį, tai bent jau suskaidyti jį į identifikuojamus elementus, o paskui juo apdoroti. KNT tinklus žmonijai 1989 metais padovanojo prancūzas Yannas LeCunas, domėjęsis simbolių atpažinimu. Dabar jis vadovauja Facebook dirbtinio intelekto laboratorijai.

Supratimas, ką gali robotai ir ko kol kas ne – kritiškai svarbus mūsų ateičiai

Antrajame šio amžiaus dešimtmetyje NT (ir konvoliuciniai NT, kaip vieni iš geriausių atvaizdų atpažinimo būdų) buvo įkūnyti realiuose programinės įrangos sprendimuose. Šios programos mokosi iš tikrų duomenų – jūsų paveikslėlių, socialinių reakcijų, asmeninių duomenų, užklausų istorijos ir pan. Supratimas, ką gali robotai ir ko kol kas ne – kritiškai svarbus mūsų ateičiai.

Ką dabar veikia neuroniniai tinklai?

Naudodama konvoliucinius neuroninius tinklus ir milijonus realių partijų, Google išmokė kompiuterį žaisti go. Paskui Google programa DeepMind, tobulindama įgūdžius, sužaidė milijardus partijų su savimi. Galiausiai DeepMind go robotas AlphaGo sutriuškino pasaulio čempioną, kas ilgai laikyta neįveikiama užduotimi tradiciniam programavimui. (Go skiriasi, tarkime, nuo šachmatų, milžinišku galimų akmenėlių išdėliojimo kombinacijų skaičiumi, – kai kuriais vertinimais, jis viršija atomų skaičių regimoje Visatoje.)

Go akmenėlių kombinacijų lentoje skaičius viršija atomų skaičių regimoje Visatoje

Microsoft neuroniniai tinklai automatiškai priskiria žymenis jūsų atvaizdams. Milijonai žmonių, turinčių nuotraukų, kuriose yra pavaizduotos katės, padeda NT suprasti, kur nuotraukoje katė, o kur – pūkuotos baltos šlepetės.

„Yandex“ sukurtas mašinų mokymosi metodas MatrixNet mokosi iš milijardų dokumentų ir aptinka milijonus požymių, darančių įtaką užklausos atitikimo lygiui. Facebook algoritmas, vadovaudamasis jūsų ir panašių į jus naudotojų prioritetais, parenka įdomiausius įrašus. Kiekvienas pažymėjimas, kad tai mėgstate ir kiekvienas pasidalinimas daro jos prognozes tikslesnes.

Siekiama, kad NT diktuojamame tekste klaidos pasitaikytų ne kas dvidešimt, o kas šimtą žodžių

Milijonai užklausų balsu, nagrinėjamų smalsiaisiais neuroniniais tinklais, padeda pamažu artėti prie šventojo Graalio – 99 procentų diktuojamo teksto atpažinimo (dabar pasiektas 95 procentų lygis, tai yra, klaida pasitaiko kas dvidešimtame žodyje, o ne viename iš šimto).

O kuo čia dėta Prisma?

Prisma pademonstravo, kad NT infrastruktūrą jau gali naudoti ne tik stambios korporacijos, bet ir mėgėjų sukurtos, plačiajai visuomenei skirtos tarnybos. Iki Prisma'os tokių programėlių (nebūtinai skirtų iOS) buvo gausybė, ir jos rėmėsi gerai žinomais sprendimais, kurie vienas nuo kito dažniausiai tesiskyrė pradiniais konvoliucinių neuroninių tinklų parametrais.

Prisma pakėlė neuroninius tinklus į naują pritaikymo lygį – masinių pramogų

Prisma kūrėjams pavyko išspręsti sudėtingą spartaus darbo, esant didelei apkrovai, užduotį. Mat vaizdo apdorojimui NT reikia didelių skaičiavimo pajėgumų. Prisma kūrėjams vardan veikimo spartos netgi teko paaukoti galimybę apjungti kelis paveikslėlius, kaip buvo numatoma iš pradžių. Tačiau tai ne itin svarbu. Svarbu, kad Prisma pakėlė neuroninius tinklus į naują pritaikymo lygį – masinių pramogų. Tai jau ne tyrėjų pramoga ir ne laboratorinis pavyzdys. Tai linksma programėlė, kurioje sudėtos geriausių pastarųjų dviejų dešimtmečių protų idėjos. Kalbant protingais žodžiais, Prisma aukštąsias technologijas daro plataus vartojimo preke, rodydama jų įdiegimo paprastumą.

Prisma – rusų programuotojų paimtas ir apkarpytas kieno nors pavyzdys?

Taip sakyti nebūtų teisinga. Įvairiausių neuroninių tinklų, mašinų mokymosi ir panašias problemas gvildena dešimtys tūkstančių žmonių iš viso pasaulio – ES, JAV, RF ir kitų šalių. Pats proveržis dirbtinio intelekto srityje, kai kompiuteris laikomas nebe instrukcijų vykdytoju, o mokiniu, daug davė ir pačiai žmonijai.

Prisma – tai demonstravimas galimybių, kurios dabar prieinamos bet kuriam žmogui, norinčiam panaudoti algoritmus, sukurtus bendromis įvairių šalių ir korporacijų pastangomis.

Ir dar ten yra filtras, suteikiantis panašumą į DC komiksų herojų. Argi tai ne įtikinamiausias argumentas naudoti Prisma?

Aleksandr Amzin
slon.ru

   

Facebook komentarai