https://frosthead.com

Hogyan tanulja meg a GPS a nyelvet?

Karen Jacobsen, egy ausztrál énekesnő és hangszínésznő 2000-ben kapott koncertet, nem sokkal azután, hogy megérkezett New Yorkba. A producer - a vállalati típusok - három hétig egy hangstúdióba küldte, ahol napi négy órát töltött, mondván: „a következő kereszteződésnél forduljon balra” és „újraszámolja”. Végül nem a hangja volt. ez feszült volt. "Körülbelül 186-szor mondtam" kb. "- emlékszik vissza Jacobsen. "Ez a fajta elkábíthatja magát."

kapcsolodo tartalom

  • Ptolemaiosztól a GPSig, a térképek rövid története

Két évvel később telefonhívást kapott egy barátjától. - Karen - suttogta a barátja. „Megvettem a férjemnek az egyik ilyen új GPS-dolgot, és feltettük az ausztrál hangon. Te vagy az! ”Jacobsen így rájött, hogy hangja útmutatásokat adott világszerte 400 millió ember számára.

Munkája kiemeli a vér és a technika hibridjét, amely a mindenütt jelenlévő hangokba kerül, amelyek megmutatják, hova kell fordulnunk: Havonta több mint egymilliárd ember támaszkodik a Google Maps szolgáltatásra, és 80 százalékuk aktiválja a hangopciót.

A hangszintézis kezdeti napjaiban - gondoljon az 1970-es évek végi Speak & Spell robot hangjaira - egy algoritmus a szöveget monoton folyammá konvertálta. Ezután az adatbázisok növekedésével rögzíthet olyan hangszereplőket, mint Jacobsen, amelyek kiejtik a szótagok és szavak korpuszát, melyeket az algoritmusok egyesítenek és megváltoztathatnak az alapszabályok szerint. A közelmúltban az olyan cégek szoftverkódolói, mint például a Nuance, amely autókhoz navigációs interfészeket tervez, kifejlesztettek egy harmadik megközelítést - mély tanulást alkalmaznak a beszédszintézisre. Összekeveri a rögzített szavakat és a szintetizált fragmentumokat, és a mesterséges intelligenciára támaszkodik, hogy a kiejtést még emberiesé tegye. "Gondtalanul természetesnek hangzik" - mondja a Nuance vezérigazgatója, Vlad Sejnoha.

A nyelvi furcsa kérdések természetesen továbbra is kihívást jelentenek a hangrendszerek számára. "Gondolj a" bough "versus" vásárolt "vagy" read "versus" read "ellen" - mondja a Google szóvivője. „De remélhetőleg a felhasználó mindig kitalálhatja, hogy mire gondolunk.” Most, hogy az AI az autós navigációs rendszereket intelligensebb beszédre tanítja, ezután az online világban megkeresi és megtudja, hova kíván menni, még mielőtt megtenné.

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Feliratkozás a Smithsonian magazinra mindössze 12 dollárért

Ez a cikk a Smithsonian magazin július / augusztus számának válogatása

megvesz
Hogyan tanulja meg a GPS a nyelvet?