https://frosthead.com

A nagy adatok nagyobbak lettek, mivel az IBM Watson megfelel az élet enciklopédia-nak

2000 év elteltével az élet végső enciklopédia egy új, adatközpontú korszak csúcspontján áll. A Nemzeti Tudományos Alapítvány támogatást kapott az Élet Enciklopédia (EOL), az IBM és a Georgia Institute of Technology számára. A támogatás lehetővé teszi hatalmas mennyiségű adat feldolgozását és kereszt-indexelését olyan módon, amely lehetővé teszi az úttörő tudomány elvégzését.

kapcsolodo tartalom

  • A javasolt új tengeri tartalékrendszer Rosy Outlook-ot kínál mind a homár, mind a homárhorgász számára

Az ie 77. évben Plinius Idősebb elkezdte a világ első enciklopédia, a Természettudomány elkészítését. Mindent tartalmaz a csillagászattól a botanikáig, az állattól az antropológiáig és még sok mindenig. Plinius megkísérelte mindent, amit személyesen összegyűjthet a természeti világról, egyetlen írásos műbe. Az elmúlt 2000 évben a tudósok, akiket Plinius inspirált, hosszú egymást követő időszakban követik ugyanazt a jövőképet.

Plinius 36 000 kötetben 20 000 témát foglalott magában, de behatárolódott ahhoz, hogy egy ember miként képes felfedezni, rögzíteni és feldolgozni az emberi élettartamon belül. Meghalt a Vezúv-hegy kitörése során, mielőtt befejezte volna magnum opusának utolsó szerkesztését. Még a saját korában sem lehetett egyetlen embernek elolvasni az összes könyvet, megtanulni mindent és elmagyarázni a világ számára.

Ahogy a későbbi tudósok, szerkesztők és könyvtárosok felfedezték egy olyan világban, amely minden évvel több írott tudást ad hozzá, akkor is, ha a világ összes könyveit és kutatásait egy épületben tárolhatja, kihívás az, hogy az összes releváns információ hozzáférhető legyen a kutatók rövid emberi életük korlátozása alatt.

Az EOL ezt megváltoztathatja, ha a legmodernebb számítási teljesítményt alkalmazza a biológiai adatok eltérő gyűjtésein. A projekt a biológiai sokféleséggel kapcsolatos tények, cikkek és multimédia ingyenes és nyitott digitális gyűjteménye, a világ egyik legnagyobb adata. A Smithsonian Intézet székhelye és 357 partnerével és tartalomszolgáltatójával, beleértve a Harvard Egyetemet és az egyiptomi Alexandria Új Könyvtárat, az EOL a 2008-as elindítása során elért 30 000 oldalról több mint 2 millióra nőtt, 1, 3 millió oldalas szöveggel, térképekkel, video, audio és fényképek, és támogatja a 20 nyelvet.

„2010-ben a szoftveriparból jöttem Smithsonianbe” - mondja Bob Corrigan, az EOL igazgatója. „Az egyik felfedezés, amelyet ide érkeztem, az, hogy bár az informatika mindenütt megtalálható, mégsem hatolt be a múzeum világába, ugyanúgy, mint a kereskedelmi világba. Különösen a biológiában a legfontosabb adatokat a tankönyvekbe és a táblázatokba temették el. ”

Hogyan lehet a különböző formájú biológiai adatokat egyesíteni és felhasználni a földi élet új betekintésére? Mi lenne, ha mondjuk az afrikai pillangók biológiai sokféleségére vonatkozó adatokat egy évtized során összekapcsolnák a gazdálkodási gyakorlatokra és az esőzésekre vonatkozó adatokkal? Meg lehet tanulni valami újat? Ehhez valami nagyobb, mint egy emberi agyban. Valami az IBM Watson szuperszámítógépéhez hasonlóan.

"Az IBM hozzájárul az erőfeszítésekhez és a [Watson] verzióhoz való hozzáféréshez, amely nyilvánosan nem elérhető" - mondta Jennifer Hammock, az EOL programigazgatója. „Emellett az emberek is dolgoznak rajta. Az IBM ezt természetbeni hozzájárulásként végzi. ”

A Watson egy szuperszámítógép, amely nemcsak a nagy számú fájlokat összeroppítja. A mesterséges intelligenciát használva lehetővé teszi a felhasználók számára, hogy egyszerű nyelven kérdéseket tegyenek fel.

"Felhasználói szempontból azt mondanám, hogy ez azt jelenti, hogy az adatbázis olyan, amire fel lehet lépni és olyan kérdést feltenni, mintha egy ember lenne" - mondja Hammock. - Például, meg tudod mondani, hogy ez a lila pillangó Afrikában fordul elő?

"Ha az egyszerű kérdésre bármilyen nyelven megválaszolják, a színfalak mögött sok tudás létezik" - mondja Corrigan. Még a [lila] szó is feltételezi, hogy tudjuk, mi a lila. Vagy egy pillangó, a [számítógépnek] meg kell értenie a pillangó és a lepke közötti különbséget. Ráadásul maguk az adatkészletek különböző módon gondolkodnak ezekről a különböző kifejezésekről. Mindezeket az adatokat nehéz volt bányászni egy Rosetta kifejezésköve nélkül. És ez része annak a varázslatnak, amit az EOL csinál. "

Az egyik tudományos kérdés, amelyet az EOL, az IBM és a Georgia Tech közötti partnerség reméli megoldani, a plankton paradoxona.

Hammock szerint a számítógépes szimulációkkal foglalkozó tudósok „megpróbálják modellezni, hogy mi történik az óceánban, mondván, hogy a nap süt be, és az algák növekednek. . . valamiféle durva megközelítéssel rendelkezik, de nem tudják az [ökoszisztéma számítógépes modelljét] stabilnak tartani. Egy ideig elmennek, majd összeomlanak. Mert túl egyszerűek. Reméljük, hogy ha valamivel több diverzitást mutatnak a modellezett bioszférájukban, akkor stabilabbá válnak. . . .paradoxon: hogyan létezik az óceán bioszféra? Miért nem ütközik össze?

"Az emberek adatokon ülnek" - mondja Corrigan. Hihetetlen tárolóhelyek vannak a biológiai sokféleség mérésének az egész bolygón. Nagyon sok telefonhívást kapok azoktól az emberektől, akik ezen adatok mellett ülnek, és segítségre szorulnak az adatok szélesebb összefüggésbe helyezéséhez. Ez azért fontos, mert versenyben állunk, hogy megvizsgáljuk ezt a bolygót, és megtanuljuk, hogyan fejlõdik fejlõdésünk nagyon véges erõforrásainkon. . . A Smithsonian szerepet játszhat az ezekből a forrásokból származó ismeretek bővítésében, és valódi hatalom lehet annak terjesztésére. ”

Az 1 millió dolláros támogatás egynegyedét Smithsonian kapja a munkájáért való részesedésért, ám az EOL-nak sok más szereplője is van. Egyes fejlesztők Egyiptomban vannak; egy oktatási csapat székhelye Harvardon kívül van; és a spanyol nyelvi egység Mexikóvárosban található.

Az EOL összes adata továbbra is köztulajdonban van, vagy a Creative Commons engedéllyel rendelkezik. A kutatás és az adatok célja, hogy nyilvánosan hozzáférhetők legyenek, és ne legyenek elrejtve egy fizetőfal mögött.

"Ez egy nagyon régi álom" - mondja Hammock. „Egy ember valószínűleg nem képes mindent megtanulni. Nehéz mindent egy helyre tenni, ahol tudatosan ellenőrizhető önmagával. De most már vannak számítógépünk. ”

Plinius vagy nagyon elégedett, vagy nagyon féltékeny.

A nagy adatok nagyobbak lettek, mivel az IBM Watson megfelel az élet enciklopédia-nak