https://frosthead.com

Lehetséges-e a számítógépek egy 5000 éves nyelvet rejteni?

Az Indus civilizáció, amely Kr. E. III. Évezred nagy részében virágzott, korának legszélesebb körű társadalma volt. A magassága több mint félmillió négyzet mérföldes területet ölel fel, amely a mai India-Pakisztán határán helyezkedik el. Az Indus maradványait északon, a Himalája és a déli részén, Mumbaiig találták. Ez volt a szubkontinens legkorábbi ismert városi kultúrája, és két nagy várost büszkélkedhet, egyet Harappal és egy Mohenjo-daroval. Mégis annak nagysága és hosszú élettartama, valamint a közel egy évszázados régészeti kutatások ellenére, az Indusokról továbbra is rejtély van rejtve.

Amit nem tudunk, az az 1920-as években kezdődött és ma is folytatódó régészeti ásatásokból származik. Az évtizedek folyamán a régészek számos tárgyat mutattak be, ideértve a pecsét pecséteket, amuletteket és a kis tablettákat. Ezeknek a műveknek sok része az írási mintáknak tűnik - vésett figurák, amelyek többek között a szárnyas patkókat, a küllős kerekeket és az egyenes halakat emlékeztetik. Azonban az, amit pontosan ezek a szimbólumok jelenthetnek, továbbra is az ősi civilizációk ösztöndíja egyik leghíresebb rejtvénye.

A történelemben más nehéz kódok is feltörésre kerültek. A botrányos egyiptológusok szerencsés szünetet tartottak a híres Rosetta kő felfedezésével 1799-ben, amely egyiptomi és görög nyelven is tartalmazott szöveget. A maja hieroglifák tanulmányozása mindaddig elmúlt, amíg Jurij Knorozov nevű orosz nyelvész okosan felhasználta a mai beszélt majakat az 1950-es években. De nincs az indus Rosetta kője, és a tudósok nem tudják, mely nyelvek származhatnak esetleg az indusok által beszélt nyelvektől.

Körülbelül 22 évvel ezelőtt, Indiában, Hyderabadban, Rajesh Rao nevű nyolcadik osztályos tanuló megfordította a történelem tankönyv oldalát, és először megismerte ezt a lenyűgöző civilizációt és annak titokzatos szkriptét. Az ezt követő években Rao iskolai végzettsége és szakma más irányba vitte őt - felszámolta a számítógépes tudomány folytatását, amelyet ma a seattlei Washingtoni Egyetemen tanít, de gondosan figyelemmel kísérte az Indus ösztöndíját, és a tucatnyi kudarcot figyelte. megpróbálja megérteni a forgatókönyvet. Még amikor mesterséges intelligenciát és robotikát tanulmányozott, Rao elkészített egy kis könyvet és monográfiát az Indus szkriptén, mintegy 30 könyvből. A közeli könyvespolcon tartotta a dédelgetett, nyolcadik osztályos történelem tankönyvet is, amely bemutatta őt az indusoknak.

"Csodálatos volt látni, hogy hány különböző ötletet javasolnak az emberek" - mondja. Egyes tudósok szerint az írás egyfajta sumér forgatókönyv volt; mások a dravid családban helyezkedtek el; Mások még azt gondolták, hogy ez a Húsvét-szigetek nyelvéhez kapcsolódik. Rao felismerte, hogy ez „az ókori történelem szempontjából valószínűleg az egyik legnagyobb kihívást jelentő probléma”.

Mivel a kísérlet utáni kísérlet sikertelen volt a szkript megfejtésében, egyes szakértők elveszítették a reményét, hogy a szkript dekódolható. 2004-ben három tudós ellentmondásos tanulmányban azzal érvelt, hogy az indus szimbólumoknak egyáltalán nincs nyelvi tartalma. Ehelyett a szimbólumok valószínűleg nem sokkal többek voltak, mint a politikai vagy vallási szereplőket ábrázoló piktogramok. A szerzők olyan messzire mentek, hogy azt állítják, hogy az indusok egyáltalán nem írástudó civilizáció. Néhányan a terepen az indus maratások mögött a nyelv megtalálására irányuló törekvések a hiábavalóság gyakorlatához hasonlítottak.

Néhány évvel később Rao belépett a játékba. Addig a forgatókönyvet tanulmányozó személyek régészek, történészek, nyelvészek vagy kriptológusok voltak. Rao azonban úgy döntött, hogy a legjobban ismeri az eszközt - a számítástechnikát -, és az Indus szkript titkait kovácsolja ki.

A nyolcadik osztály óta az indus civilizáció lenyűgözte. Rajesh Rao számítógépes ismereteket és egy „feltételes entrópia” elnevezésű koncepciót használ az Indus szkript dekódolásához. (David Zax jóvoltából) Az évtizedek folyamán a régészek sok indiai tárgyat mutattak ki az indusi civilizációból, beleértve bélyegző pecséteket, amuletteket és kis tablettákat. (Robert Harding / Robert Harding világkép / Corbis) Rao és munkatársai májusban közölték eredményeiket a Science folyóiratban. Nem tudták megfejteni a nyelvet, ám megállapításai tovább erősítették a megértését. (Robert Harding / Robert Harding világkép / Corbis) Rao és kollégái most a hosszabb karaktersorozatokat vizsgálják, mint amelyeket a Science cikkben elemeztek. A minták keresése viszont segít meghatározni, hogy mely nyelvi családokhoz tartozik a szkript. (David Zax jóvoltából)

Egy nyári napon Seattle-ben Rao üdvözölt engem az irodájába, hogy megmutassa, hogyan kezdett hozzá és munkatársai a probléma megoldásához. Elkészítette agyagfóka benyomásainak másolatát, amelyet a régészek Indus helyszíneiről készítettek. Kicsik - mint a kis négyszögletes csokoládék - és legtöbbjükben egy állat képe látható az Indus szimbólumok sorozata alatt. Az Indus szkript legtöbb mintája miniatűr, ilyen, csak néhány karakterrel; nem fedeztek fel nagy monolitokat. A tudósok bizonytalanok a kis pecsétek funkciójáról - mondta Rao, de az egyik elmélet az, hogy valószínűleg felhasználták őket a kereskedett áruk minőségének igazolására. Egy másik javaslat azt sugallja, hogy a pecsétek valószínűleg annak biztosítására képesek voltak, hogy a kereskedők adót fizetjenek a városba való belépéskor vagy onnan távozásakor - sok pecsétet találtak a kapuházak romjai között, amelyek valószínűleg úgy működtek, mint az ősi autópályadíjak.

Rao és kollégái nem akartak csodákat csinálni - tudták, hogy nincs elegendő információjuk az ősi forgatókönyv megfejtéséhez -, de felteszék, hogy számítási módszerekkel legalább elkezdhetik megállapítani, hogy az induszok milyen típusú írása van. A forgatókönyv: nyelvet kódolt, vagy sem? Ezt a „feltételes entrópia” elnevezésű koncepció alkalmazásával tették meg.

Az impozáns név ellenére a feltételes entrópia meglehetősen egyszerű fogalom: a sorozat véletlenszerűségének mértéke. Vegye figyelembe az ábécéünket. Ha Scrabble lapkákat venne, és a levegőbe dobná őket, előfordulhat, hogy minden régi levél megfordul. De a valódi angol szavakban bizonyos betűk nagyobb valószínűséggel fordulnak elő mások után. Az angol nyelvű q -t szinte mindig u jelöli . A t-t r vagy e követheti, de kevésbé valószínű, hogy n vagy b követi.

Rao és munkatársai - egy nemzetközi csoport, amely számítógépes tudósokból, asztrofizikusokból és matematikusokból áll - számítógépes programot használt az Indus szkript feltételes entrópiájának mérésére. Ezután megvizsgálták más típusú rendszerek feltételes entrópiáját - a természetes nyelvek (sumér, tamil, szanszkrit és angol), a mesterséges nyelv (a Fortran számítógépes programozási nyelve) és a nem nyelvi rendszerek (emberi DNS-szekvenciák, baktériumfehérje-szekvenciák) és két mesterséges adatkészlet, amely a feltételes entrópia magas és alacsony szélsőségeit képviseli). Amikor összehasonlították az Indus szkript véletlenszerűségének mennyiségét a többi rendszeréval, azt találták, hogy ez a legjobban hasonlít a természetes nyelvekben található arányokra. Megállapításaikat májusban tették közzé a Science folyóiratban.

Ha úgy néz ki, mint egy nyelv, és úgy viselkedik, mint egy nyelv, akkor valószínűleg ez egy nyelv, állítják a cikk. A leletek természetesen nem megfejtik a forgatókönyvet, ám tovább erősítik megértésünket róla, és megnyugtatást nyújtanak azoknak a régészeknek, akik azon a feltételezésen dolgoztak, hogy az Indus szkript nyelvét kódolja.

A cikk publikálása után Rao meglepetést kapott. Kiderült, hogy érzékeny a kérdés, hogy melyik nyelvcsaládhoz tartozik a forgatókönyv: az indus-civilizáció korának és jelentőségének köszönhetően Indiában sok kortárs csoport szeretné azt állítani, hogy közvetlen őse. Például a dél tamil nyelvű indiánjai inkább azt szeretnék megtanulni, hogy az indusz szkript egyfajta proto-dravidianus volt, mivel a tamil a proto-dravidian származik. A hindi beszélők északon inkább a szanszkrit régi formája, a hindi őse. Rao tanulmánya nem vonja le a következtetést arra, hogy melyik nyelvcsaládhoz tartozik a forgatókönyv, bár megjegyzi, hogy a feltételes entrópia hasonló az Old Tamil-hoz - így néhány kritikus összefoglalóan „azzal vádol minket, hogy dravidi nacionalisták vagyunk” - mondja Rao. "A vádak és támadások vad hegye teljesen váratlan volt."

Rao néha megkönnyebbül, hogy visszatér az idegtudomány és a robotika kevésbé vadul vitatott világába. De az Indus szkript felhívása továbbra is vonzó, és „ami korábban hobbi volt, az időm több mint egyharmadát monopolizálja” - mondja. Rao és kollégái most a hosszabb karaktersorozatokat vizsgálják, mint amelyeket a Science cikkben elemeztek. „Ha vannak minták - mondja Rao -, akkor fel tudunk állni a nyelvtani szabályokkal. Ez viszont korlátozásokat jelentene azon nyelvi családok számára, amelyekhez a forgatókönyv tartozhat.

Reméli, hogy jövőbeli megállapításai magukért beszélnek, és kevésbé ösztönöznek az ellenfelekre, akiknek az egyik indiai régiója gyökerezik a másik ellen. A maga részéről, amikor Rao arról beszél, hogy mit jelent neki az Indus szkript, hajlamos egész Indiát illetően beszélni. "India öröksége jelentősen gazdagodik, ha megértjük az indus civilizációt" - mondja. Rao és munkatársai dolgoznak rajta, a forráskód egy sorában egy időben.

Lehetséges-e a számítógépek egy 5000 éves nyelvet rejteni?