https://frosthead.com

Ez a pókerjátékos AI tudja, mikor kell tartani őket, és mikor kell őket lehajtani

A Pluribus nevű számítógépes program a hat póker nélküli Texas Hold'em hat sorozatú játék sorozatán a póker profikkal vívta ki a mérföldkövet a mesterséges intelligencia kutatásában. Ez az első bot, amely legyőzi az embereket egy összetett többjátékos versenyen.

Ahogyan a Facebook AI laboratóriumának és a Carnegie Mellon Egyetem kutatói a Science folyóiratban számolnak be, a Pluribus győztesnek bizonyult mind az ember, mind az algoritmus által uralt meccsekben. A Merrit Kennedy kezdetben az NPR számára írta a bot öt változatát, amely egy profi pókerjátékos ellen fordult; a következő kísérleti körben egy bot öt ember ellen játszott. Egy Facebook blogbejegyzésben az AI átlagosan körülbelül 5 dollárt nyert kezekenként vagy 1000 dollárt óránként, amikor öt emberi ellenféllel játszott. Ezt a rátát a póker szakemberek „döntő győzelmi margójának” tekintik.

A négyszeres World Poker Tour bajnok, Darren Elias, Kennedy-vel beszélve elmagyarázza, hogy segített a Pluribus edzésében azáltal, hogy négy bot rivális versenytársaival versenyez, és figyelmeztette a tudósokat, amikor az AI hibát követett el. Hamarosan a bot „nagyon gyorsan javult, [közepes] játékosoktól kezdve alapvetően világszínvonalú pókerjátékosokká vált napokban és hetekben.” A tapasztalat, Elias szerint, „elég ijesztő”.

A Verge James Vincent szerint, a Pluribus - egy meglepően olcsó AI, amely kevesebb, mint 150 dolláros értékű felhőalapú számítástechnikai erőforrással edzett - tovább elsajátította a póker stratégiáját azzal, hogy saját magának másolatait játssza le, és próba és hiba útján tanul. Ahogy Jennifer Ouellette megjegyzi az Ars Technica számára, a bot gyorsan rájött, hogy a legjobb cselekedete a játék és a kiszámíthatatlan mozdulatok kombinációja.

A legtöbb emberi profik elkerülik a „donk-fogadást”, amely azt találja, hogy az egyik játékos hívással véget ér, a másik pedig fogadással kezdődik, ám Pluribus könnyen átfogja a népszerűtlen stratégiát. Ugyanakkor, az Ouellette jelentései szerint, az AI szokatlan tétméretet ajánl fel és jobb véletlenszerűsítést mutatott, mint az ellenfelek.

„Legfontosabb erőssége vegyes stratégiák alkalmazására való képesség” - mondta Elias a CMU nyilatkozata szerint. - Ugyanezt csinálják az emberek. Kivégzés kérdése az emberek számára - ezt egy teljesen véletlenszerű módon és következetesen kell megtenni. A legtöbb ember egyszerűen nem tudja. ”

A Pluribus nem az első pókerjátékos AI, amely legyőzte az emberi szakembereket. 2017-ben a bot alkotói, Noam Brown és Tuomas Sandholm kifejlesztették a Libratus nevű program korábbi iterációját. Ez az AI határozottan legyőzte a négy póker profit 120 000 leosztású Texas Hold'em 120 000 leosztásban, de amint azt a Facebook blogbejegyzése magyarázza, korlátozta az a tény, hogy egyszerre csak egy ellenféllel állt szemben.

A MIT Technology Review Will Knight szerint a póker kihívást jelent az AI számára, mivel több játékosot és rengeteg rejtett információt foglal magában. Összehasonlítva az olyan játékokkal, mint a sakk és a Go, csak két résztvevő vesz részt, és a játékosok helyzete mindenki számára látható.

Ezen akadályok leküzdése érdekében Brown és Sandholm létrehozott egy algoritmust, amelynek célja az ellenfelek következő két vagy három lépésének előrejelzése, ahelyett, hogy a játék végén megmérjék lépéseiket. Noha ez a stratégia úgy tűnik, hogy a rövid távú nyereséget előnyben részesíti a hosszú távú nyereményekkel szemben, a Verge 's Vincent azt írja, hogy „a rövid távú elkötelezettség valóban minden, amire szüksége van”.

A továbblépés során a többjátékos programok, például a Pluribus felhasználhatók olyan gyógyszerek tervezésére, amelyek képesek legyőzni az antibiotikumokkal szemben rezisztens baktériumokat, valamint javítani tudják a kiberbiztonságot és a katonai robotrendszereket. Mint Az Ars Technica Ouellette megjegyzi, hogy egyéb lehetséges alkalmazások közé tartozik a többoldalú tárgyalások felügyelete, a termékek árazása és az ötletbörze aukciós ajánlattételi stratégiák.

Brown most elmondja a Knightnak, hogy az algoritmus nagyrészt felfüggesztés alatt marad - elsősorban az online pókeripar védelme érdekében, hogy pusztító pénzügyi veszteségekkel járjon.

A kutató arra a következtetésre jut: "Nagyon veszélyes lehet a póker közösség számára."

Ez a pókerjátékos AI tudja, mikor kell tartani őket, és mikor kell őket lehajtani