https://frosthead.com

Beszél a gépekkel

A hangfelismerő szoftver - valószínűleg többségünk egyetért azzal - nagyon jó dolog. De a gépekkel való beszélgetés részben - legyen az okostelefon, TV-képernyő vagy műszerfal - nos, nem is annyira. Kérdést kér egy eszközről? Geek arca. Minden szót elragadtatva, hogy érthető legyen? Mennyire lehet igazán igaz?

De az Apple, az igaz formája, felvette ezt a fejét azáltal, hogy három jó hűvös ikont bérel fel a legújabb Siri-hirdetési kampányában, az iPhone 4S hangján. Itt vannak Zooey Deschanel (Imádnivaló Cool), John Malkovich (Cerebral Cool) és Samuel L. Jackson (Ultimate Cool), és mindegyikük úgy tűnik, hogy a telefonos szójáték iránti részvétel az istenek sporta.

A kritikusok mindazonáltal rámutatnak, hogy a való életben Siri nem olyan reagáló és nem mindentudó, mint a reklámokban. Te is, biztos vagyok benne, megdöbbent, hogy ezt hallja. Mások úgy látják, hogy az egész megérett a paródiahoz - lásd Zooey testvére, Jooey, hogy együtt készítsenek egy vicces vagy halálos változatot a Zooey és Siri esős napjáról.

Nem számít. Siri vezető énekesvé vált a robot kórusban, az új generáció „You Got Mail” hangjában.

Bizonyos körökben divatos az a vélemény, hogy Siri nem Steve Jobs-méltó, ha még életben lenne, akkor Jobs elhúzta volna a piacról, vagy legalábbis soha nem hagyná jóvá ilyen magas színvonalú hirdetést. kampány az ilyen hibás termékért.

Mint azonban a Jobs utódja, Tim Cook mondta a hét elején, az iPhone 4S tulajdonosai, mint a Siri. A márciusban kiadott felmérés szerint majdnem 90 százalékuk szerint legalább havonta egyszer használja. És ne feledje, hogy a Siri, a kevés Apple termék közül, amelyről azt állították, hogy bétaverzióban jelenik meg, októberig nem ünnepli első születésnapját. Még mindig tanul nyelvet, és ami még fontosabb, éppen most kezdi kiaknázni a mesterséges intelligencia lehetőségeit.

Siri valószínűleg az Apple TV középpontjában áll, várhatóan decemberben debütál. De esélyünk van arra, hogy az a hely, ahol a gépekkel való beszélgetés általános lesz, az autóinkban található.

Hajt, mondta

Persze, hogy ez már megtörténik, de akkor is át kell váltania a robotbeszédre, ha meg akar érteni. És akkor sem garantáljuk. Ez a változás ezen a nyáron kezdődik, amikor néhány új modell fel van szerelve Dragon Drive nevű valamival!

A Nuance Communications, a massachusettsi székhelyű cég találmánya vált a hangfelismerési üzletág erőművévé. (Széles körben úgy gondolják, hogy ez a Siri mögött álló agy.) Az autentikumok és a hangfelismerés nagy előrelépést tett a múlt héten, amikor a cég bejelentette, hogy a Dragon Drive! képes lesz rájutni a felhőbe.

Ez azt jelenti, hogy a rendszer drámaian megnöveli számítási teljesítményét és memóriaképességét. És ez azt jelenti, hogy az irányítópult hangja Siri-szerűbbé válik, és lehetõvé teszi, hogy valóban beszélgessen vele. Nincs több monoszillabikus kiabálás. Közeledik a nap, amikor véletlenül megemlítheti, hogy úgy érzi, mintha valamelyik Allman testvér lenne, és másodperc múlva a „Whipping Post” jön a hangszórókba.

A kulcs az, hogy mennyire képesek vagyunk megtanítani a gépek kontextusát és a pragmatikát - hogyan használjuk a nyelvet a társadalmi helyzetekben. És ez trükkös üzlet. A kezdőknek még a legkifinomultabb hangfelismerő eszköznek is meg kell várnia, amíg az ember befejezi a beszédet, így képes az egész mondatot elemezni és értelmezni. Aztán ott van az „elmeelmélet”, az a képesség, hogy megértsük, hogy mások véleményei és szándékai eltérőek lehetnek, mint a miénk. Tudomásunk szerint csak az emberek tudják ezt megtenni.

Két Stanford-pszichológus nemrégiben készült tanulmánya megértheti, mi járul hozzá a gépek intuitív segítéséhez. Michael Frank és Noah Goodman kutatók online kísérletet készítettek, amelyben a résztvevőket arra kérték, hogy nézzenek meg egy tárgycsoportot, majd válasszák ki, hogy melyikre vonatkoznak egy adott szó. Például az egyik résztvevőcsoport látott egy kék négyzetet, egy kék kört és egy piros négyzetet. A csoport kérdése a következő volt: Képzelje el, hogy beszél valakivel, és utalni akar a középső tárgyra. Melyik szót használnád, „kék” vagy „kör”?

A másik csoportot arra kérdezték: Képzelje el, hogy valaki beszél veled, és a „kék” szót használja az egyik ilyen tárgyra utaláshoz. Melyik tárgyról beszélnek?

A válaszok segítettek a kutatóknak világosabb képet kapni arról, hogy a hallgató miként érti a beszélõt, és hogy a beszélõ miként dönt. Ebből kidolgozták azt a matematikai modellt, amely kibővítheti és finomíthatja a számítógép gondolkodási folyamatát.

Frank elmondta: "Évekig tartó munkát fog igénybe venni, de az álom egy számítógép, amely valójában azon gondolkodik, amit akarsz, és mire gondol, nem csak az, amit mondtál."

Egy beszédmód

Íme néhány új fejlemény a hangfelismerésről:

  • Siri elnémul: Az IBM hajlamos az idegenekre a vállalati titkok kiszabadulása miatt, ezért megtiltja alkalmazottainak a nyilvános fájlátviteli helyek, például a Dropbox használatát. Ugyanakkor megtiltja a Siri irodában való használatát is, mivel a biztonsági alkalmazottak attól tartanak, hogy bárki, miközben beszél a telefonjukkal, érzékeny információkat fedhet fel, amelyek az Apple szerverein végződnek.
  • Vegye figyelembe, Apple !: A Samsung ezen a héten Londonban mutatta be új Galaxy X III okostelefonját, és bár nagy érintőképernyője nagy figyelmet szentel, új hang- és arcfelismerő szoftverrel is rendelkezik.
  • Tegye azt, amit mondok, nem azt, amit csinálok: És a Samsung nem áll meg ott. Nemrégiben szabadalmi bejelentést nyújtott be egy robot számára, amely megérti az emberi beszédet. A robot képes lesz beállítani „hallgatási” képességeit, hogy figyelembe vegye a környezeti zajt, amely megszakíthatja vagy megzavarhatja a kapott parancsokat. Azt is képes felismerni, ki beszél vele, még akkor is, ha a háttérzaj nagyon hangos.

Infographic bónusz: Úgy gondolja, hogy autója számítógépes. Várja meg, amíg teljesen csatlakozik az internethez. Tájékozódjon arról, mit tehet egy csatlakoztatott autó.

Beszél a gépekkel