https://frosthead.com

A régi tudományos tanulmányokból származó nyers adatok óriási többsége most hiányozhat

A tudományos módszer egyik alapja az eredmények reprodukálhatósága. A világ bármely pontján működő laboratóriumban a kutatónak képesnek kell lennie arra, hogy ugyanazt a témát tanulmányozza, mint egy másik tudós, és ugyanazokat az adatokat reprodukálni tudja, vagy ugyanazokat az adatokat elemezze, és ugyanazokat a mintákat észlelje.

Ez az oka annak, hogy egy, a jelenlegi biológiában ma közzétett tanulmány megállapításai annyira aggasztóak. Amikor egy kutatók egy csoportja megkísérelte e-mailben elküldeni az 1991 és 2011 között közzétett 516 biológiai tanulmány szerzőit, és megkérdezte a nyers adatokat, rémülten rájöttek, hogy a legrégebbi adatok több mint 90% -a (több mint 20 évvel ezelőtt írt dokumentumokból) megközelíthetetlen. Összességében, még a legutóbb, 2011-ben közzétett papírokat is beleértve, csak 23 százalékkal voltak képesek az adatok nyomon követésére.

"Mindenki tudja, hogy ha egy kutatótól kéri a régi tanulmányok adatait, akkor megrontja és megsérti, mert nem tudják, hol van" - mondja Timothy Vines, a British Columbia Egyetem állatorvosa, aki vezette az erőfeszítés. "De valójában még soha nem voltak szisztematikus becslések arról, hogy a szerzők birtokában lévő adatok mennyire valóban eltűnnek."

A becslésük érdekében a csoport egy olyan adattípust választott, amely idővel viszonylag konzisztens volt - a növények és állatok anatómiai méréseit -, és minden páratlan évre 25–40 papírt készített az adott időszakban, amikor ezt az adatot felhasználta, hogy ha tudnák vadászni a nyers számokat.

Megkérdezésük meglepően nagy részét már a legelső lépésben megállították: a tanulmányok 25% -ában nem találtak aktív e-mail címeket, mivel a papíron felsorolt ​​érvénytelen címek voltak, és az internetes keresések nem jelentettek meg aktuálisat. A tanulmányok további 38% -ában a kérdéseik nem eredményeztek választ. Az adatkészletek további 7% -a elveszett vagy elérhetetlen.

"Időről időre például három és fél hüvelykes hajlékonylemezeken mentették el, így senki sem férhetett hozzá, mert már nem voltak a megfelelő meghajtók" - mondja Vines. Mivel az adatok megőrzésének alapvető gondolata az, hogy azokat mások is felhasználhassák a jövőbeli kutatások során, az ilyen elavulás lényegében az adatokat használhatatlanná teszi.

Ezek valószínűleg földrajzi akadályoknak tűnnek, de a tudósok pontosan olyanok, mint a többiünk - megváltoztatják az e-mail címeket, új meghajtókat kapnak különböző meghajtókkal, elveszítik a fájlok biztonsági másolatát - tehát ezek a trendek a tudomány súlyos, szisztematikus problémáit tükrözik.

És az adatok megőrzése olyan fontos, érdemes emlékezni, mert lehetetlen megjósolni, hogy a kutatás milyen irányba halad a jövőben. Például Vines saját kutatását végez Kelet-Európában őshonos varangyfajokról, amelyek látszólag hibridizálódnak. Azt mondja, hogy az 1980-as években egy külön kutatócsoport dolgozott ugyanazon a témán, és találkozott egy régi papírral, amely dokumentálta e varangyok eloszlását az 1930-as években. Annak ismerete, hogy eloszlásuk viszonylag kevés változást mutatott az elmúlt évtizedekben, lehetővé tette a tudósoknak, hogy mindenféle számítást végezzenek, amely egyébként nem lett volna lehetséges. "Az eredeti adatok rendelkezésre állása egy nagyon kicsi, lengyel nyelven írt tanulmányból hihetetlenül hasznos volt a kutatók számára, akik 70 évvel később érkeztek" - mondja.

Az is a tény, hogy e kutatásoknak ilyen nagy részét állami forrásokból finanszírozzák, nagy részét olyan támogatásokból finanszírozzák, amelyek előírják, hogy az így kapott adatokat a nyilvánosság számára szabadon hozzáférhetővé kell tenni. Ezenkívül a terepi adatokat befolyásolják annak a környezetnek a körülményei is, amelyben gyűjtik - tehát lehetetlen később tökéletesen megismételni, amikor a feltételek megváltoztak.

Mi a megoldás? Egyes folyóiratok - köztük a Molekuláris Ökológia, amelynek Vines irányító szerkesztője - olyan irányelveket fogadtak el, amelyek megkövetelik a szerzőktől, hogy nyers adatokat nyújtsanak be papírokkal, lehetővé téve maga a folyóirat számára, hogy az adatokat állandóan archiválja. Bár a folyóiratok, akárcsak az emberek, hajlamosak az e-mail címek megváltoztatására és a technológiai elavulásra, ezeket a problémákat intézményi szinten sokkal könnyebben lehet kezelni.

A régi tudományos tanulmányokból származó nyers adatok óriási többsége most hiányozhat