https://frosthead.com

A „Mona Lisa” életre kel a számítógéppel generált „élő portré” életében

A Harry Potter sorozat beszélt festményeivel és mozgó fényképeivel megszokta a világot az élő portrék elképzelésében. De a múlt héten, amikor egy Leonardo da Vinci-féle Mona Liza egy AI által generált „élő portrék” elkezdték a köröket az interneten, sok ember megdöbbent, amikor a híres portré mozgatta ajkát és körülnézett.

Lisa Gherardini animált portréja egyike volt a számos új, „beszélő fejmodellnek” - közismertebb nevén „mélyfajnak”, amelyet a Samsung moszkvai AI központjának és a Skolkovo Tudományos és Technológiai Intézetnek a kutatói készítettek. Csak néhány referenciakeret vagy akár egyetlen kép felhasználásával a kutatók szintén mélyfajtákat készítettek olyan hírességekről, mint Oprah, Marilyn Monroe és Albert Einstein pillanatképeit hozta életre, és új kifejezéseket hoztak létre a híres képek számára, például Vermeer lánya gyöngy fülbevalóval .

A kutatók módszerüket, amelyet „kevés lövés tanulásnak” hívnak, a YouTube-on, valamint az arXiv.org preprint nyomtatott tárolójában még meg kell vizsgálni. Míg a részletek meglehetősen technikai jellegűek, Mindy Weisberger a LiveScience-nél beszámol arról, hogy az élő portrék elkészítéséhez egy olyan típusú mesterséges intelligencia, amelyet konvolúciós neurális hálózatnak neveznek, a referenciaképek elemzésével képzi magát. Ezután az arcmozgásokat egy képkocka-sorozatból egy statikus képre alkalmazza, mint például a Mona Lisa . Minél több szög és referenciaképe van, annál jobb lesz az élő portré. A cikk szerint az AI mindössze 32 referenciakép felhasználásával képes „tökéletes realizmust” elérni (az emberek azon képességével mérve, hogy meg tudják különböztetni a három képkészlet közül melyik volt mélyfaj).

A Mona Lisa természetesen csak egy kép, tehát Leonardo remekművének három „élő portrája” kissé zavaró. A rövid animációkhoz az ideghálózat három különféle képzési videót figyelt meg, és a Mona Lisa három, a keretekre alapozott verziója különböző személyiségekkel bír. Ha Leonardo különféle szögekből festette meg híres modelljét, a rendszer még valósághűbb élő portrát készíthetett volna.

Miközben az animált Mona Lisa szórakoztató, a mélyfajok növekedése aggodalmat keltett fel, hogy a számítógéppel létrehozott hasonlóságok felhasználhatók az emberek rágalmazására, a faji vagy politikai feszültségek felszámolására és az online média iránti bizalom további rontására. "[Hé] aláássa az összes videóba vetett bizalmunkat, beleértve az eredeti videókat is" - írja John Villasenor, a Brookings Intézet. "Maga az igazság megfoghatatlanná válik, mert már nem lehetünk biztosak abban, hogy mi a valódi, és mi nem."

Miközben az AI-t mélyfajok készítésére használják, Villasenor azt mondja, hogy legalább egyelőre a mélyfajok azonosítására is felhasználható olyan következetlenségek keresése révén, amelyek az emberi szem számára nem nyilvánvalók.

Tim Hwang, az AI kezdeményezés Harvard-MIT etikája és irányítása igazgatója elmondja Gregory Barbernek a Wired-ben, hogy még nem vagyunk azon a ponton, ahol a rossz szereplők még kifinomult mélyhangokat készíthetnek személyes laptopjukra. "Semmi sem sugallja nekem, hogy ezt csak a kulcsrakészen fogja használni otthon mélyhűtések generálására" - mondja. "Nem rövid, középtávon, sőt hosszú távon sem."

Ennek oka az, hogy a Samsung új rendszerének használata drága és hozzáértést igényel. Barber cikke azonban rámutat arra, hogy nem kell egy neurális hálózat által készített szuper kifinomult fotórealisztikus videót becsapni az emberekre. A múlt héten egy manipulált videó, amelyet lelassítottak, hogy Nancy Pelosi, az Egyesült Államok házának elnöke részeg hangjává tegye a körzetet, továbbkerült a közösségi hálózatokon.

Végül azonban a technológia elég jó lesz, hogy a rossz szereplők képesek legyenek mélyfajtákat készíteni, olyan meggyőzően, hogy nem észlelhetők. Amikor eljön ez a nap, Hwang elmondja a Wired-nek, az embereknek tények ellenőrzésére és kontextusbeli nyomokra kell támaszkodniuk, hogy meghatározzák, mi a valódi és mi a hamis. Például, ha Mona Lisa közeli ajka a félmosolya fogos vigyorgássá válik, és megpróbálja eladni neked fehéredő fogkrémet, akkor ez biztosan mélyfajta.

A „Mona Lisa” életre kel a számítógéppel generált „élő portré” életében