Az egyetemes fordító hosszú ideje popkultúra megszállottja volt. A Star Trek egy kéziszámítógépként mutatja be a mikrofont, amely a legtöbb nyelv azonnal lefordítható . A Hitchhiker útmutatója a galaxishoz Bábel-halakkal büszkélkedhet. Ez egy lény, amely a fülébe ragadva bármilyen nyelvnek azonnali fordítását kínálja a galaxisban.
Tehát nem meglepő, hogy a mai emberek megpróbálnak olyan készüléket létrehozni, amely ugyanolyan jól működik. Több tucat fordító okostelefon-alkalmazás létezik, de a legtöbb szavakat egyszerű, egy-egy alapon fordítják; a felhasználó beír vagy szót beszél, és az alkalmazás visszatér egy fordítással. A cél és a valódi monetáris váratlanság a mérnökök és a vállalkozók számára lehetővé teszi, hogy két ember beszélgethessen különböző nyelveken, míg egy kis eszköz valós időben kiküszöböli a fordításokat.
Meglévő fordító alkalmazások
A görögországi utazás során az angolul beszélő Andrew Lauder megbetegedett.
"Gyógyszertárba mentem, és nem értettek angolul, tehát nem kaptam gyógyszert" - mondja Lauder, a Vocre Translate vezérigazgatója. A gyógyszercímkék szó szerint görögül voltak. A nyelvi korlátok gyakoriak a világutazók számára. Egy idegen országban a kisebb tranzakciók, mint például a gyógyszer vásárlása vagy útmutatások megszerzése - egy másik nehézséggel, amivel Lauder szembesült - herkuláris feladattá válnak.
Amikor visszatért az országrészbe, Lauder létrehozta a Vocre Translate hang- és szövegfordító alkalmazást. A szöveg-szöveges alkalmazásként kezdődött (MyLangauge néven), majd kezdetben beszéd-szöveges modellgé alakult, amely, mint más alkalmazások, köztük a SayHi Translate, egy hagyományos modellt használt, amelyben egy szó közvetlenül egy másik szót fordít. Mondja: „Hello”, és az okostelefon vagy a táblagép csipog egy automatikus „Hola” -ra. A „Viszlát” „Sayonara” -vá válik. És így tovább, hasonlóan a szövegfordítóhoz.
Az egyszerű audio fordítás elkészítéséhez az alkalmazások alkotóinak adatokra volt szükségük. A Vocre információkat nyilvános felvételekből és dokumentumokból, például régi filmekből vagy nyilvános meghallgatásokból vonta ki. "Alapvetően hangposta átírási szolgáltatást kérdeztünk, hogy a felhőnk felhasználhassa a beszédfelismerést" - mondta Lee Bossier, a SayHi vezérigazgatója.
Miután a mérnökök rendelkeztek audio és szöveges adatokkal, párosították a hangot és a szöveget, szóról szóra. A hangfelismerő szoftver felismeri a „sajtot”, és szöveggé konvertálja. Ez átalakul franciául, és az alkalmazás megtalálja a „fromage” francia kiejtését.
Ennek ellenére, ha a felhasználó szelíden valami „sajtosnak” nevezi, akkor a fordító sem működik, mert a beszélt nyelv nem olyan statikus, mint az írott nyelv. A ritmus, szleng, inflexió, kiejtés, dialektus és társalgási folyamat megváltoztathatja a jelentését
Idővel azonban Lauder beszélgetőbb eszközt akart. Egy e-mailben azt mondja: „A felhasználási adataink alapján azt tapasztaltuk, hogy az emberek nagyon eltérően beszélnek, mint az írásuk. A beszélt szó sokkal spontánabb, sokkal kevésbé formális és szó szerinti. ”Tehát statisztikai gépi fordítást alkalmazott, ezt a megközelítést a Google is használja, amely az adatok felhasználásával szokásos szóhasználatot talál meg, elhagyva a hagyományos szó-szó fordítási modellt. Alapvetően a Vocre megtanulja a szokásos módon. „Minden beszélgetés alapján megtanul, minden kifejezésen keresztül megy keresztül. Ez valami okosabb lesz az idő múlásával ”- mondja Lauder.
Jelenleg mindkét alkalmazásnak néhány másodpercre van szüksége a fordításhoz, de kétségtelenül hatékony, különösen a testbeszéddel összhangban, tranzakciós beszélgetésekhez, például étkezés rendeléséhez. Végül is az emberek évek óta nem anyanyelveken rendelnek ételt, és mindig képesek enni. De nem voltak képesek mélyreható, összetett beszélgetésekre.
A Vocre és a SayHi segítségével a beszélgetések mereven megszakadhatnak, de ez nem ugyanaz, mint az anyanyelvén folytatott csevegés. A Google ezt teljes mértékben meg akarja változtatni.
A Google megközelítése (statisztikai gépi fordítás)
Amikor új nyelvet tanulunk az iskolában, az egyedi szókincset kezdjük. De a nyelv folyékonyabb - a szavaknak kontextust igényelnek.
"A [Google] által alkalmazott megközelítés általánosabb megközelítés" - mondja Josh Estelle, a Google Translate szoftvermérnöke. "Ahelyett, hogy megpróbálnánk kódolni ezeket a szabályokat, megpróbáljuk a szabályokat adatok megismerésével megtanulni."
A technológiai vállalat elkerüli az egy-egy, a szóról-szóra módszert, és ehelyett statisztikai gépi fordítást alkalmaz, nem pedig azt vizsgálja, hogy mit jelent a szavak, hanem hogyan modellezi a nyelvet, amit az adatok alapján tanul . Tehát az erdőre, és nem a fákra irányul. Angol példa: ismerjük a „break” és a „up” meghatározásait. De a „break up” kifejezés nem a két szó szó szerinti kombinációja.
A statisztikai gépi fordításhoz adatokra van szükség. Hegyek. A módszer működéséhez nem csak arra a tényre van szükség, hogy a „fromage” francia sajt, hanem 100 példa is a „fromage” és a sajt használatára a tényleges mondatokban.
Estelle azt mondja, hogy ha egy angol nyelvû beszélõnek két menüje van, ugyanazok kivételével, ha az angol nyelvre nyomtatott, a másik pedig kínai, akkor „valószínûleg kitalálhatja, hogy mi a kínai karakter a„ leves ”számára.” A háttér a király. De ahhoz, hogy ezt a kontextust megteremtsük, több millió menühöz és minden más elképzelhető dokumentumhoz hozzá kell férnünk.
Pontosan amiben van a Google. Anélkül, hogy az internetes óriás adathalmazokat gyűjtne volna, nem létezhet valós világbeli Bábel hal. Bejárja az internetet, és mindent összegyűjt - szöveget és hangot. Ezután ezeket az adatokat olyan algoritmusokba továbbítja, amelyek mindent összehasonlítanak minden mással. Ezek az összehasonlítások megkönnyítik a nyelv természetes működésének gyökerét.
"Az egyik dolog, ami meglepte az embereket, amikor a Fordítóról beszélünk, az, hogy csapatunkban nincsenek nyelvészek" - mondja Estelle. „71 nyelvet indítottunk, és azt mondanám, hogy csapatunk nem tudja, hogyan kell beszélni a nyelvek túlnyomó többségén. Az emberi fordító nem fogja megtanulni ezeket a kifejezéseket és dolgokat olyan gyorsan, ahogy az [adatok] megtanulják az internetről. ”
Mi az értelme?
A Google-hoz hasonlóan a Facebook is lát előnyeit. Vegye figyelembe a közösségi média webhelyének saját fordítását fordításra.
"A Facebook küldetése összeköti az egész világot, és a világ összekapcsolásának egyik akadálya, hogy nem mindenki beszél ugyanazt a nyelvet" - mondta Tom Stocky, a Facebook mérnöki igazgatója. "A fordítás oldalán azt gondolom, hogy a jövőben valóban ambiciózus jövőkép az, ha használhatná a Facebook-ot anyanyelvén, és bármilyen más nyelven kapcsolatba léphet."
Augusztus elején a Facebook megvásárolta a Jibbigo beszéd-beszéd fordítási alkalmazást, amely elérhető az Android és az iOS eszközökhöz.
A kedves Facebook-felhasználók megjegyzik, hogy a közösségi oldal már tartalmaz némi fordítást. Ha valaha is volt spanyol üzenet az angol oldalán, akkor azonnal lehetőséget kapott arra, hogy lefordítsa anyanyelvére.
De Stocky a hangkomponenst potenciális játékváltónak tekinti. Az okostelefonok és a táblagépek megjelenése üdvözli az állandóan összekapcsolt világot, és a beszédfelismerő szoftverek megjelenése új eszközöket hív fel a webes interakcióra. Stocky olyan jövőt lát el, amelyben a felhasználók csak parancsot tudnak mondani okostelefonjukra, és kölcsönhatásba léphetnek más felhasználókkal, eltekintve a nyelvi különbségektől.
"Nem kétséges, hogy ez végül megtörténik, mert az egyetlen korlátozás a nyelvi motor ereje, és természetesen a feldolgozási idő és a feldolgozási teljesítmény" - mondja.
Laura Murphy, a Tulane Egyetem globális egészségügyi rendszerek és fejlesztés tanszékének professzora, elismert technológiai szkeptikus, megkérdőjelezi az egyetemes fordító értékét, és nem kell, hogy egynél több nyelvet tudjon.
Szerinte a készülék kissé hasznos lehet utazási, üzleti és nemzetközi kapcsolatokban, de nem úttörő. Bizonyos szinten már vannak fordítók (emberek) a helyén, és a külkapcsolatokban dolgozók többsége ismeri a megfelelő nyelveket. Murphy szerint egy eszköznek negatív következményei lehetnek.
"Úgy gondolom, hogy lássá teheti az embereket" - mondja Murphy. A nyelvek fordítása szellemileg kihívást jelenthet, ha arra kényszeríti az agyat - különösen azt, amely több, mint két nyelvet ismeri - másképp dolgozni, de a gyakorlat mindazonáltal kifizetődő. Az agy egy olyan nyelvi empátia helyéből húzódik, amelyet még a legszebb hangfordító sem tudott elérni.
Noha ez az univerzális kommunikáció pozitív lehet, Murphy elismeri, „az arra vezethet, hogy az emberek azt gondolják, hogy akkor kommunikálnak, amikor nem.” A kultúra nem mindig felel meg teljesen a nyelvnek (pl. Szarkazmus), és a kommunikáció nem mindig az átadott információról.
Mikor várhatjuk meg ezt a technológiát?
"2005-ben 40 óra telt el, hogy lefordítsuk az 1000 mondatot" - mondja Estelle a Google-ról. "Ma 1000 mondatot fordítunk le minden 10 milliszekundumonként."
Ahogyan Richard Anderson az 1970-es években a „ Hatmillió dolláros ember ” televíziós sorozatban mondja: „Megvan a technológia.” Most csak az adatok gyűjtésére és elemzésére vár. Estelle szerint ismeretlen, mennyi ideig tart ez. Az óvatos becslések szerint egy ilyen eszközt egy évtized alatt a kezünkbe tettek.
Míg az alkalmazásalkotók, mint például a Bossier, vagy az olyan óriási cégek, mint a Google és a Facebook nem akarják elkészíteni a Bábel Bibliai Tornyának saját verzióit, véget vetnek a babrálásnak. Olyan világot lát el, amelyben mind kommunikálunk, mind az orvostudományról, a politikáról, az ötletekről.
És ez a világ lehet, hogy nem messze van.
A szerkesztő megjegyzés: 2014. április 4-én frissítettük ezt a történetet a Vocre Translate technológia pontos leírása érdekében.