https://frosthead.com

A Turing-teszt valamit mér, de ez nem az „intelligencia”

Alan Turing, a számítógépes kor egyik atyja, rendkívül okos ember volt. Valójában annyira okos, hogy megértette, hogy a „gépi intelligencia” kifejezés lényegtelen. Jobb, érvelte: beszélni arról, hogy mit tud egy gép valójában: tud beszélni? Le tudja tartani egy beszélgetést? Legalább ezt megpróbálhatjuk tanulmányozni. Turing végül azt javasolta, amit „Turing-tesztnek” hívtak: Ha egy bíró nem tudja megmondani, melyik két rejtett entitás ember, és melyik mesterséges, akkor a gép „letette” a tesztet - pontosan ez az, amit állítólag a múlt szombaton történt Londonban.

kapcsolodo tartalom

  • A Szilícium-völgy sikere ennek a technikus zseninek köszönhető, amelyet még soha nem hallottál
  • Alan Turing 60 éves előrejelzése a természet mintáiról igaznak bizonyult

"Büszkék vagyunk arra, hogy kijelentjük, hogy Alan Turing tesztjét első ízben tették át" - mondta az egyik szervező, Kevin Warwick a Readingi Egyetemen az eredmények közzétételekor. A győztes chatbot neve „Eugene Goostman”, egy számítógépes program, amely egy 13 éves ukrán fiú személyiségét utánozza. Az „Eugene” -nek sikerült meggyőznie a bírók 33 százalékát, hogy emberi lény volt a londoni Királyi Társaság irodájában, Turing halálának 60. évfordulóján megrendezett szombati rendezvényen. (Turing-et, a homoszexuális nőt, 1952-ben elítélték a súlyos hajléktalanság miatt, és arra kötelezték, hogy hormonális „kezelésnek” vegye alá részét képező megállapodás részeként. Két évvel később látszólagos öngyilkosságban meghaltak cianidmérgezésből.)

De egy óvatos szó rendben van. Az „intelligencia” mindig is csúszós tárgy volt, és különösen a Turing-teszt régóta vitatott. Turing ismertette, hogy működne egy 1950-es, „Számítástechnikai gépek és intelligencia” című cikkben. Az ötlet egy tradicionális viktoriánus játékból származik, ahol megpróbálja kitalálni, hogy a függöny mögé rejtett személy férfi vagy nő, csak kérdéseket feltenni. (A kérdésekre adott válaszokat le kellett írni, mert a hang adomány lenne.) Így működik Turing verziója: Van egy bírója, aki két függöny előtt ül, és semmilyen módon nem tudja, mi mögöttük van. . Az egyik függöny mögött egy ember van; a másik mögött egy számítógép van. A bíró kérdéseket tehet fel a két rejtett entitás bármelyikével kapcsolatban. A válaszok alapján a bíró megpróbálja kitalálni, hogy a rejtett entitás ember vagy gép. (Turing úgy vélte, hogy a beszélgetést teletipikus gépek közvetítik; ma bármilyen elektronikus, szöveges alapú felületet használhatunk, például az internetes csevegőszobákban vagy az azonnali üzenetküldésben.)

Turing azt feltételezte, hogy 2000-re „egy átlagos lekérdezőnek nem lesz több, mint 70 százaléka esélye a helyes azonosítás megszerzésére” - azaz a számítógépes programok az idő 30 százalékát bírálják el a bírákkal - öt perc kihallgatás után. Az „öt perc” fontos. Turing nem beszélt az időkorlátról, mint a teszt elválaszthatatlan részéről, és azt lehet érvelni, hogy ahhoz, hogy egy gép valóban megfeleljen a tesztnek, bármilyen mennyiségű kihallgatásra képesnek kell lennie. Feltehetően az öt perces kritérium önkényes, de szükséges határ volt. A 2000-es év eljött és elment, a chatbotok csak megállították az előrehaladást. (Egy enyhébb pillanatban, válaszolva egy BBC interjúkészítő 1952-ben feltett kérdésére, Turing azt mondta, hogy 100 év telik el, mielőtt egy gép megfelel a tesztnek.)

Még 2012-ben bíró voltam a „Turing tesztmaratonon”, amely a valaha egyidőben elvégzett Turing-teszt legnagyobb sorozat; az angliai Bletchley Parkban tartották, Turing létfontosságú kódtörő munkájának helyén a második világháború utolsó éveiben. (Ugyanaz a csapat szervezte, amely a szombat rendezvényt vezetett, és abban az időben az Eugene korábbi verziója is volt a győztes.) A szombati rendezvény felállítása megegyezett 2012-ben: A bírák kérdéseiket számítógéppel gépelték be., majd várta, hogy a válaszok megjelenjenek a képernyőn; a chatbotok és a „rejtett emberek” együtt egy másik szobában voltak, szem elől.

Az első dolog, amiben hihetetlenül tudatában vagyok annak, hogy amikor egy bíró vagy egy Turing-tesztben, öt perc elég gyorsan elmúlik. És minél rövidebb a beszélgetés, annál nagyobb a számítógép előnye; minél hosszabb a kihallgatás, annál nagyobb a valószínűsége, hogy a számítógép magától feladja magát. Szeretném ezt nevezni a manöken hatásnak: Elnézést kértél már valaha az áruház manökenén, feltételezve, hogy éppen egy élő emberré ütközöttél? Ha a találkozás csak egy másodperc töredéke tart, és a másik irányba nézel, akkor elképzelheti, hogy éppen az ember ellen csapott. Minél hosszabb a találkozás, annál nyilvánvalóbb a manöken manöken szükségessége.

Ugyanez vonatkozik a chatbotokra. A hellók cseréje semmit nem tárt fel - de minél tovább megy bele, annál több probléma merül fel. A chatbotok, úgy találtam, hajlamosak a téma megváltoztatására ok nélkül. Gyakran nem tudnak válaszolni az egyszerű kérdésekre. A homályos hangzás kockázatával egyszerűen nem hangzik embernek . Az egyik 2012-es beszélgetésembe beírtam egy egyszerű viccet - és az az entitás, akivel beszélgettem, azonnal a hamburgerekre változtatta a témát. (Scott Aaronson számítástechnikus nemrégiben hasonló tapasztalatokkal rendelkezik, amikor a bot weboldalán keresztül beszélt Eugene-nal. Aaronson megkérdezte Eugene-t, hogy hány lába van egy tevenek; ez válaszolt: “Valami 2 és 4 között? Talán három? :-))” Később, amikor Aaronson megkérdezte, hogy hány lábát tart egy hangya, Eugene pontosan ugyanazt a választ kötötte fel, háromszor mosolyogva.

Vegye figyelembe azt is, hogy Eugene nem emulálja az angol anyanyelvű felnőttet; úgy tesz, mintha egy fiatal és kissé lebegő ukrán tini lenne, ésszerűen jó (de messze nem tökéletes) angolul beszélget. Ahogyan Vladimir Veselov, a program egyik fejlesztője elmondta a Mashable.com-nak : „Sok időt töltöttünk egy hűséges személyiségű karakter fejlesztésével.” Bár Eugene bárkivel foglalkozik bármilyen témával, életkora miatt teljesen ésszerű, hogy nem „Mindent nem tudok.” Eugene nem jön ki kijelentve, hogy bejelenti korát és nemzetiségét; de feltárja, ha felkérik - és a végeredmény bizonyos mértékű engedékenységet eredményezhet a bírák részéről, különös tekintettel az angol nyelvtanra és a szóhasználatra. (Feltételezem, hogy a szombati bírók többsége anyanyelvű, ám ezt nem tudom biztosan.) Az asztalok valószínűleg megfordultak volna, ha Eugene valaha bíróként találkozott egy natív ukrán nyelvű beszélővel.

A beszélő gép felépítéséért folytatott küzdelem rámutat arra, hogy mennyire összetett a nyelv. Ez nem csak a beszélgetés kérdése - beszélni kell valamiről, és amit mondasz, értelemszerűnek kell lennie, és ennek értelemben kell lennie annak, amit a másik ember mondott. Számunkra könnyű; a számítógépek számára, nem annyira. Tehát a chatbotok különféle trükkökre támaszkodnak: Megjegyzés a megabájt konzervált válaszokról, vagy az internet keresése olyan párbeszédre, amely megközelítheti a jelenleg zajló beszélgetést. Más szavakkal: amit egy gépen nincs intelligencia, az valószínűleg ki tudja elégíteni a nyers számítási teljesítményben. Ez az oka annak, hogy a Google vagy a Siri (az iPhone személyes asszisztense) annyira okosnak tűnik számunkra: Lehet, hogy a Sirinek nincs „elméje”, de van hozzáférése egy ilyen hatalmas információs adatbázishoz, úgy viselkedik, mintha tenné. Ugyanez a brute-force megközelítés tette lehetővé az IBM „Watson” számára a Jeopardy- nál a győzelem ! 2011-ben.

Mindez döntő kérdést vet fel: pontosan mi az, amit a Turing-teszt mér? Egyes kritikusok azt sugallták, hogy inkább a csalás, mint az intelligencia jár. Gary Marcus, a NYU pszichológusa, aki a NewYorker.com -on írja, azt mondja, hogy Eugene sikeresen hajtja végre a "korlátozások" sorozatát, amely a program korlátai elfedésére szolgál. Steven Harnad, a montreali Quebeci Egyetem pszichológusa és számítógépes tudósa még több volt. szkeptikus, mondván a The Guardian-nek, hogy „teljes ostobaság” állítani, hogy Eugene sikeres volt a Turing-tesztben. (Tiszteletére Turing jól ismerte ezt a kérdést; elképzelését „utánzó játéknak” nevezte, és az intelligenciáról csak kíméletesen beszélt.) Még ennél is furcsább módon, a számítógépet, az embertől eltérően, meg kell csalni. „A Turing-teszt valóban egy sikeres hazugság próbája.” - mondta Pat Hayes, a floridai Pensacola Emberi és Gépi Megismerés Intézetének számítógépes tudósa a 2012. évi Turing-tesztmaraton után. "Ha van valami, ami valóban átjuthat Turing utánzatán, ez nagyon sikeres" emberi utánzat "."

És az „emberi” a másik kulcsfontosságú pont: nem lehetséges, hogy a világon másfajta intelligencia is létezik, azon túl, amit fajaink mutatnak? Egy valóban intelligens gépnek számtalan gyakorlati alkalmazása lenne, de miért összpontosítana több „ember” létrehozására? Végül is már rengeteg ember van. Ahogyan Noam Chomsky nyelvész rámutatott, amikor a víz alatt mozgó gépet építünk, nem követeljük meg, hogy „úszhasson” - és a tengeralattjáró nem kevésbé olyan eredmény, hogy nem képes elvégezni a hátulsó löket.

Igen, Eugene lenyűgöző, legalábbis kis részletekben. És még a legjobb csevegőbotok olyan kérdésekre botlik, amelyekkel Eugene tettetett kora gyermeke félszeműen képes kezelni. Talán nem meglepő, hogy a legtöbb AI-kutató kevés időt tölt be a Turing-teszt megszállottságával. A gépi intelligencia valójában halad előre, és meglehetősen gyorsan. A néhány évvel ezelőtt meglehetősen szánalmas beszédszöveg-fordító szoftver, ahogyan a nyelvi fordító programok is, gyorsan fejlődik. Az Amazonnak gyakran nagyon jó ötlete van arról, hogy mit szeretne vásárolni, még mielőtt megtenné. És a Google önálló autója egy évtizeddel ezelőtt pusztán fantázia lett volna. De a beszélgetés, amint újra felfedezzük, nagyon nehéz, és nem valószínű, hogy ez a határ jelenik meg leginkább az AI-ban. Most, ha valakivel szeretne beszélgetni, egy igazi embert ajánlom.

Dan Falk Torontóban található tudományos újságíró.

A Turing-teszt valamit mér, de ez nem az „intelligencia”