Alan Turing-et, egy angol matematikusot, aki a II. Világháború alatt kulcsszerepet játszott kódmegszakítóként, néha a számítógépes programozás atyjának hívják. Híres, hogy olyan számítógépes intelligencia tesztet javasolt, amely egy szalon játékán alapult, amelyben egy kérdező megpróbálta levonni a függöny mögött lévő két ember nemét. A szalon játék egyszerű volt: az írásbeli kérdéseket és válaszokat oda-vissza továbbították, hogy a hang és a hangmagasság ne árulja el a függöny mögött lévőket. Turing által javasolt teszt az egyik rejtett embert számítógépre váltja. A játék célja annak kiderítése, melyik függöny rejti el az embert, és melyik rejti a mesterséges intelligenciát.
Ezt Turing-tesztnek nevezzük, és általában számítógépen egy chatbot-tal folytatott beszélgetésen játsszuk. Múlt nyáron egy program, amely egy 13 éves ukrán fiú, "Eugene Goostman" személyiségét utánozza, a bírók 33 százalékát meggyőzte arról, hogy ez ember, jelentette Dan Falk a Smithsonian számára .
Turing optimistán azt jósolta, hogy 2000-re egy számítógépes program az idő 30% -át becsapja. De eddig a legtöbb chatbot küzd azért, hogy valóban "egészséges" emberré váljon. Az idei feat kritikával fogadták el, mert Eugene elrejti természetét azon hibák mögött, amelyeket egy tökéletes tinédzser, aki nem beszél tökéletesen angolul. Falk írja:
Az egyik 2012-es beszélgetésembe beírtam egy egyszerű viccet - és az az entitás, akivel beszélgettem, azonnal a hamburgerekre változtatta a témát. (Scott Aaronson számítástechnikus nemrégiben hasonló tapasztalatokkal rendelkezik, amikor a bot weboldalán keresztül beszélt Eugene-nal. Aaronson megkérdezte Eugene-t, hogy hány lába van egy tevenek; ez válaszolt: “Valami 2 és 4 között? Talán három? :-)))” Később, amikor Aaronson megkérdezte, hogy hány lábát tart egy hangya, Eugene pontosan ugyanazt a választ kötötte fel, háromszor mosolyogva.
Ha az embereket becsaphatja egy számítógépes ostobaság - nem pontosan az intelligencia jele -, akkor valószínűleg jobb megoldást kínálunk az AI tesztelésére. Írja be a Lovelace Test-et, amelyet Ada Lovelace-nak neveztek el, az első számítógépes programozót.
Lovelace 1843-ban írta, hogy a számítógépek nem tekinthetők intelligensnek mindaddig, amíg nem tudnak valamit eredeti létrehozni, amit nem programoztak be, jelentette Jordan Pearson az Alaplap számára. A Lovelace tesztet először 2001-ben javasolták, de Mark Riedl, az AI kutatója elmagyarázza, hogy az eredeti koncepció szerint ez a teszt sem tökéletes. "Nem vagyok biztos abban, hogy a teszt valóban működik, mert nagyon valószínűtlen, hogy a programozó nem tudta megtudni, hogy az AI miként készített valamit" - mondta a New Scientist .
Frissítése, a Lovelace 2.0 teszt, egyszerűen csak arra kéri a számítógépet, hogy készítsen valami eredeti és kreatív képet: egy történetet, verset vagy képet. Ír:
Ha a bíró elégedett az eredménnyel, újabb, nehezebb kérelmet nyújtanak be. Ez addig folytatódik, amíg az AI-t nem bírják el valamely feladat elmulasztásával, vagy a bíró meggyőződése arról, hogy elegendő intelligenciát mutatott be. A több forduló azt jelenti, hogy pontszámot kap, szemben az átadással vagy a kudarccal. És rögzíthetjük a bíró különféle kérelmeit, hogy azok sokféle AI-vel szemben megvizsgálhatók legyenek
A teszt inkább összehasonlító eszközként szolgál az AI rendszerek között - mondja az New Scientist . De legalább úgy tűnik, hogy a Turing-teszt módszereivel nem lehet bűnözni. Érdemes megjegyezni: a alkotás esztétikája nem számít. Végül is nem minden élő, légző ember képes remekműveket festeni. De a legtöbb játszik Szótárt, rámutat Riedl.