https://frosthead.com

Az idegtudósok átalakították az agyhullámokat verbális beszédbe

Ugyanaz a technológia, amely táplálja a beszélgető mobil asszisztensét, egy nap hangot adhat azok számára, akik elveszítették a beszédet. Amint Renae Reints a Fortune- ra beszámol, a Columbia Egyetem idegtudós kutatói nemrégiben nagy előrelépést tettek ennek a futurisztikus célnak a felé, sikeresen fordítva az agyhullámokat érthető beszédré.

A csoport kutatása, amelyet a Scientific Reports közzétett, kissé szokatlan megközelítést von maga után. Ahelyett, hogy a gondolatokat közvetlenül követnék a beszéd előállítása érdekében, a kutatók neurológiai mintákat rögzítettek, amelyeket a teszt alanyok generáltak, akik mások beszélgetését hallgatták. Ezeket az agyhullámokat egy vokóderbe táplálták be - egy mesterséges intelligencia algoritmust, amely szintetizálja a beszédet -, majd átértékelhetővé, bár robotikusan hangzó beszéddé alakítja a résztvevők által hallott mondatokat.

"Hangunk hozzájárul a barátainkhoz, a családhoz és a körülöttünk lévő világhoz, ezért annyira pusztító a hang erejének elvesztése sérülés vagy betegség miatt" - mondja Nima Mesgarani, a Columbia neurobiológiai programjának mérnöke. állásfoglalás. „A mai tanulmányunkkal potenciális módon visszaállíthatjuk ezt az erőt. Megmutattuk, hogy a megfelelő technológiával ezeknek az embereknek a gondolatai dekódolhatók és megérthetők bármely hallgató számára. ”

Érdemes megjegyezni, hogy Gizmodo George Dvorsky szerint a tudósok még nem jutottak kitalálásra, hogyan lehet a belső gondolatokat, más néven elképzelt beszédet, szavakba lefordítani. Ebben az ideális forgatókönyvben a beszédtechnológiát használó egyének egyszerűen elképzelnék, amit mondani akartak, majd megvárják, hogy egy mesterséges hangrendszer verbalizálja ezeket a gondolatokat.

A késői brit fizikus, Stephen Hawking a beszédszintézis-technológia rupszant verzióját használta másokkal való kommunikációhoz. Amint Nina Godlewski a Newsweek számára írja, Hawkingnak 21 éves korában diagnosztizálták az amyotrophicus lateralis sclerosis (ALS). A motoros neuronbetegség végül kijelentette beszédképességét, arra kényszerítve, hogy kézi kattintással használja a beszéd kiváltását.

Amikor Hawking elvesztette a kezének használatát, az arcmozgásokon alapuló rendszerre váltott; Gizmodo Dvorsky kifejti továbbá, hogy a tudós a szemüvegéhez kapcsolt arckapcsolót választotta a hangszintetizátor által beszélt szavak kiválasztásához.

Ennek a technológiának az előrehaladott iterációja elhagyná a középső embert, lehetővé téve a felhasználók számára a beszéd előállítását számítógép vagy mozgásérzékeny rendszer nélkül.

Összehasonlítva - Avery Thompson a Popular Mechanics-rel, a Columbia-csoport tanulmánya a „hallott beszéd” fordítására összpontosít. A kutatók öt epilepsziás beteget toboroztak agyműtétet igénybe vevő betegekbe, és arra kérték őket, hogy hallgassanak meg egy sor beszélt szót - például valaki felvételét. számolva nullától kilencig - miközben a neurális megfigyelő eszközökhöz csatlakozik.

Az ezekkel az eszközökkel elfogott agyhullámokat beletették a vokóderbe, amely a futurisztikus Kristin Houser szavaival képzett idegi hálózat segítségével szintetizálta a beszédet a kimenet „tisztításához” és a hangok érthetővé tételéhez.

Ezután a tudósok 11 másik résztvevőt kérték meg, hogy hallgassák meg az AI-kompatibilis beszédet. Figyelemre méltó, hogy a tanulmány társszerzője, Mesgarani a Columbia nyilatkozatában rámutatott, hogy ezek az egyének az idő 75 százaléka körül képesek voltak „megérteni és megismételni” a hangokat - „jóval és azon túl is” - a korábbi kísérletekben megfigyelt arányokat. (A felvételeket itt magad ítélhetik meg.)

A Gizmodo Dvorskyjával készített interjúban Mesgarani azt mondja, hogy kollégái azt remélik, hogy a közeljövőben összetettebb mondatokat szintetizálnak. A kutatók azt is szeretnék rögzíteni a vizsgálati alanyok által generált agyjeleket, akik gondolkodnak vagy elképzelik a beszédet, ahelyett, hogy másokat hallgatnának. Végül, Mesgarani hozzáteszi a nyilatkozathoz, a csapat arra törekszik, hogy egy nap a technológiát implantátummá alakítsa, amely képes a viselő gondolatait közvetlenül szavakba fordítani.

Az új kutatás potenciális korlátai között szerepel a kicsi mintavétel és Andrew Jackson, a Newcastle Egyetem idegtudós szakember szerint, aki nem vett részt a vizsgálatban, az a tény, hogy az ideghálózatokat minden új résztvevő nagyszámú agyjeléhez be kellene vezetni. a beszéd szintetizálása érdekében a nulla és kilenc közötti számon túl.

"A jövőben érdekes lesz látni, hogy az egy személy számára kiképzett dekóderek milyen általánosak más emberek számára" - mondja Jackson Gizmodo-nak . "Kicsit olyan, mint a korai beszédfelismerő rendszerek, amelyeket a felhasználónak egyénileg kellett kiképeznie, szemben a mai technológiákkal, mint például a Siri és az Alexa, amelyek értelmezik bárki hangját, ismét neurális hálózatokat használva. Csak az idő fogja megmutatni, hogy ezek a technológiák egy nap ugyanazt tudnák-e tenni az agyi jelekre. "

Az idegtudósok átalakították az agyhullámokat verbális beszédbe