https://frosthead.com

Hogyan hozta Margaret Dayhoff a modern számítástechnikát a biológiába

1984-ben a Nemzeti Orvosbiológiai Kutatási Alapítvány ingyenes online adatbázist indított, amely több mint 283 000 fehérje-szekvenciát tartalmaz. Ma a fehérjeinformációs forrás lehetővé teszi a tudósok számára, hogy a világ minden táján ismeretlen fehérjét szedjenek, összehasonlítsák az adatbázisban található ezer ismert fehérjével, és meghatározzák, milyen módon és hasonlítanak egymáshoz. Ezen adatok alapján gyorsan és pontosan levezethetik a fehérje evolúciós történetét és kapcsolatát az élet különböző formáival.

Ennek a hatalmas online adatbázisnak a szerény eredete már jóval az internet előtt megjelenik. Az egész a fehérje-szekvencia és -struktúra atlaszával kezdődött, egy 1965-ben nyomtatott könyvvel, amely tartalmazza a 65 akkor ismert fehérje-szekvenciát, és amelyet egy Margaret Dayhoff nevű nő készített. Atlaszjának elkészítéséhez Dayhoff élvonalbeli számítógépes technológiákat alkalmazott megoldások felkutatására a biológiai kérdésekben, segítve a bevezetést egy új, bioinformatikának nevezett terület létrehozásában. Eredetileg kémikus, Dayhoff a II. Világháború utáni számítástechnikai korszak új és fejlődő technológiáit az úttörő eszközökhöz alkalmazta, amelyeket a vegyészek, a biológusok és a csillagászok egyaránt felhasználhattak a Földön az élet eredetét átfogó, multidiszciplináris kutatásban.

Dayhoff (akkori Margaret Oakley) Philadelphiában született 1925. március 11-én Ruth Clarknak, a középiskolai matematika tanárnak és Kenneth Oakleynek, a kisvállalkozás tulajdonosának. Tíz éves korában családja New York Citybe költözött. Ott vett részt állami iskolákban, végül 1942-ben lett a Bayside High beszámolója. Ösztöndíjban vett részt a New York-i Egyetem Washington Square Főiskolán, alig három évvel később, 1945-ben a magna cum laude diplomáját a matematikában.

Ugyanebben az évben Dayhoff belépett a Columbia Egyetemre, hogy doktori fokozatot szerezzen kvantumkémiában, prominens vegyész és a második világháború mûveleteit kutató, George Kimball vezetése alatt. Elfogadása ritka volt az idő számára. A második világháború után több ember lépett be a tudományba, és a kémia még inkább a férfiak dominánsá váltak, mint az előző évtizedben. A kémiai doktordokumentumok mindössze öt százaléka nők felé fordult, szemben a nyolc százalékkal.

Dayhoff egyetemen töltött ideje alatt Columbia melegágyává vált a számítástechnika területén. Büszkélkedhet az első számítástechnikai laboratóriumokkal az Egyesült Államokban, és 1945-ben otthont adott az IBM Watson Tudományos Laboratóriumnak, amelyet WJ Eckert csillagász vezet. A Watson laboratórium először számítástechnikai központként szolgált a Szövetségesek számára a második világháború utolsó hónapjaiban. A háború után az első szuper számítógépek fejlesztésének helyszíne lett, beleértve a Szelektív szekvencia elektronikus kalkulátort (SSEC), amelyet Eckert később az Apollo missziók holdpályájának kiszámításához használt.

A kéznél lévő technológia segítségével Dayhoff a kémia iránti érdeklődését egyesítette a lyukasztógépekkel történő számítástechnika iránt - lényegében a korai digitális számítógépekkel. A gépek lehetővé tették Dayhoff számára a számítások automatizálását, az algoritmus tárolását az egyik kártyasorozaton, az adatokat a másikon. A gép segítségével sokkal gyorsabban és pontosabban tudta feldolgozni a számításokat, mint kézzel.

Dayhoff különös érdeklődésének tárgyát a policiklusos szerves vegyületek képezték, amelyek olyan molekulák, amelyek három vagy több atomból állnak egy szoros gyűrűben. A lyukasztógépekkel számos számítást végez a molekulák rezonancia energiáiról (a molekula adott állapotának potenciális energiája és az átlagos állapot közötti különbség) a molekuláris kötés és a kötési távolságok valószínűségének meghatározására.

Dayhoff mindössze három évben végzett kvantumkémiai doktori fokozattal. A végzős hallgatóként elvégzett kutatást Kimball társtulajdonosaként 1949-ben tették közzé a Vegyi Fizika Journalban, a Lyonkártya számítása a rezonancia energiáinak cím alatt.

Szintén 1948-ban Dayhoff feleségül vette Edward Dayhoffot, a kísérleti fizika hallgatóját, akivel Columbia-ban találkozott. 1952-ben a pár Washington DC-be költözött, ahol Edward posztot töltött be a Nemzeti Szabványügyi Irodában, és Dayhoff született első lányának, Ruthnak. Dayhoff hamarosan kimaradt a kutatásból, és Ruth és fiatalabb lánya, Judith otthoni anyává vált, kivéve a kétéves posztdoktori posztot a Marylandi Egyetemen.

Amikor visszatért a kutatásba, és 1962-ben kezdett pályázatokat kérni munkája finanszírozásához, sokkot tapasztalt. A Nemzeti Egészségügyi Intézetek elutasították a támogatási kérelmet, amelyben Dayhoffot mint fő kutatót sorolták fel azzal a magyarázattal, hogy „[a Dayhoff] egy ideje valóban nem volt meghitt kapcsolatban ... ezzel a bonyolult és gyorsan fejlődő térséggel”, ahogy Bruno Strasser történész írja Közelgő könyve, a Kísérletek gyűjtése: Big Data Biology készítése . A nők ilyenfajta felfelé történő emelkedése, akik időt vesztek igénybe a gyermekek nevelésében, csak az egyik módja annak, hogy a tudományos intézmények akadályozták - és továbbra is akadályozzák - a nők fejlődését.

Annak ellenére, hogy az NIH nem támogatta a támogatást, Dayhoff éppen a karrierjének legkövetkezõ évtizedében lépett be. 1960-ban elfogadta Robert Ledley, az úttörő biofizikus, akivel a férje útján találkozott, végzetes meghívását, hogy csatlakozzon hozzá a Nemzeti Orvosbiológiai Kutatási Alapítványhoz, Silver Mary-ben, Maryland. Ledley tudta, hogy Dayhoff számítógépes ismeretei alapvető fontosságúak az alapítvány azon célkitűzésében, hogy összekapcsolják a számítástechnika, a biológia és az orvostudomány területeit. 21 évig társult igazgatója volt.

Marylandben a Dayhoff szabadon felhasználhatta a Georgetown University vadonatúj IBM 7090 nagyszámítógépet. Az IBM rendszert összetett alkalmazások kezelésére tervezték, a számítási sebesség hatszor gyorsabb, mint az előző modelleknél. Ezt a sebességet úgy sikerült elérni, hogy a lassabb, ömlesztett vákuumcsöves technológiát felváltotta gyorsabb, hatékonyabb tranzisztorokkal (azok az alkatrészek, amelyek a számítógépek 1 és 0 értékét állítják elő). A mainframe segítségével Dayhoff és Ledley elkezdett keresni és összehasonlítani a peptidszekvenciákat a FORTRAN programokkal, amelyeket maguk írtak, hogy megpróbálják a részleges szekvenciákat teljes fehérjévé tenni.

IBM 7090 Az IBM 7090 kezelői konzolja a NASA Ames Kutatóközpontban 1961-ben, az IBM 729 mágnesszalag-meghajtók két bankjával. (NASA)

Rendkívüli volt Dayhoff és Ledley elkötelezettsége a számítógépes elemzés biológiai és kémiai alkalmazására. „A statisztikai elemzés kultúrája, nem is beszélve a digitális számításról, teljesen idegen volt a legtöbb [biokémikus számára]” - magyarázza Strasser a Smithsonian.com interjújában. "Néhányan azt is büszkélkedtek magukkal, hogy nem voltak" teoretikusok ", így értették meg az adatok elemzését a matematikai modellek segítségével."

Az egyik tudományos tudományág, ahol Dayhoff számítógépes hozzáértését jobban értékelték, a csillagászat volt. A számítás iránti érdeklődés részben WJ Eckhartnak köszönhető, aki 1940-ben az IBM lyukasztógép gépeket használt a bolygógömbök előrejelzésére. És az 1960-as években az amerikai űrkutatás iránti érdeklődés teljes lendületben volt, ami a NASA finanszírozását jelentette. A Marylandi Egyetemen Dayhoff találkozott spektroszkóppal, Ellis Lippincott-tal, aki hatéves együttműködésbe hozta Carl Sagan-nal a Harvardon 1961-ben. Három közülük az anyag kémiai összetételének termodinamikai modelljeit fejlesztették ki, és Dayhoff kidolgozott egy számítógépes programot, amely kiszámolhatja a gázok egyensúlyi koncentrációját a bolygó légkörében.

A Dayhoff programjának segítségével ő, Lippincott és Sagan választhattak elemet az elemzéshez, lehetővé téve számtalan különböző légköri összetétel vizsgálatát. Végül légköri modelleket fejlesztettek ki a Vénuszra, a Jupiterre, a Marsra és még a Föld ősi légkörére is.

Az égbolt feltárása során Dayhoff felvette a kérdést is, amelyet a kutatók legalább az 1950-es évek óta feltártak: mi a fehérjék funkciója? A fehérjék szekvenálása a válasz megszerzésének egyik eszköze, ám az egyes fehérjék szekvenálása rendkívül nem hatékony. Dayhoff és Ledley eltérő megközelítést alkalmazott. A fehérjék izolált elemzése helyett összehasonlították a különböző növényi és állati fajokból származó fehérjéket. "Ha összehasonlítottuk ugyanazon fehérje szekvenciáit a különböző fajokban, megfigyelhetjük, hogy a szekvencia mely részei voltak mindig azonosak az összes fajban. Ez jó jelzés arra, hogy a szekvencia ezen része kritikus volt a fehérje érdekében" - mondja Strasser.

Dayhoff mélyebben vizsgálta a fehérjék közös történetét. Nem csak a fajonként azonos részeknél elemezte, hanem azok variációit is. "Ezeket a különbségeket a fajok közötti evolúciós távolságok mérésének tekintik, amelyek lehetővé tették számukra a filogenetikai fák rekonstruálását" - magyarázza Strasser.

A Dayhoff, aki mindig készen áll arra, hogy kiaknázza az új technológia erejét, számítógépes módszereket fejlesztett ki a fehérje szekvenciák meghatározására. Számítógépes analízist végezte a fajok sokféleségében, a Candida gombafélétől a bálnáig. Aztán a különbségeit az ősi kapcsolatok meghatározására használta. 1966-ban, Richard Eck segítségével, Dayhoff elkészítette az első filogenetikai fa rekonstrukciót.

Dayhoff egy 1969. évi tudományos amerikai cikkben, a „Fehérje-evolúció számítógépes elemzése” című részében bemutatta ezeknek a fáknak az egyikét, valamint a fehérjék szekvenálására számítógépekkel végzett kutatásait. "Minden létrehozott fehérje-szekvencia, minden megvilágított evolúciós mechanizmus, a feltárt filogenetikai történelem minden jelentősebb újítása javítja az élet történetének megértését" - írta. Megpróbálta megmutatni az élettudományok közösségének a számítógépes modellek lehetőségeit.

Következő célja az volt, hogy az összes ismert fehérjét összegyűjtse egy helyen, ahol a kutatók szekvenciákat találhatnak, és összehasonlíthatják másokkal. Napjainkban ellentétben, amikor könnyű forrásokat felhívni egy egyszerű adatbázisba, csak egy kulcsszóval, Dayhoffnak fizikai folyóiratokat kellett keresnie, hogy megtalálja a keresett fehérjéket. Sok esetben ez azt jelentette, hogy a kutató munkatársainak hibáit ellenőrizni kell. A szekvenciák összegyűjtésének és katalogizálásának munkája - még számítógép segítségével is - nagy időt igényelt és igényes tudományos szemet igényelt.

Nem mindenki látott értéket abban, amit csinált. Más kutatók számára Dayhoff munkája a 19. századi természettudomány gyűjtési és katalogizálási munkájához hasonlított, nem pedig a 20. századi tudós kísérleti munkájához. „A természet dolgok gyűjtése, összehasonlítása és osztályozása a kísérleti biológusok számára a 20. század második felében régimódinak tűnt” - mondja Stasser. Dayhoff-ot „kívülállónak” nevezi. „Egy olyan területhez járult hozzá, amely nem létezett, tehát nem volt szakmai elismerése” - mondja.

1965-ben Dayhoff először publikálta a 65 ismert fehérje gyűjteményét a proteinszekvencia és -szerkezet atlaszában, az adatbázisának nyomtatott változatában. Az adatok végül mágnesszalagra költöztek, és most az interneten él, ahol a kutatók továbbra is az ő adatait használják további ezer fehérje megtalálására. Más orvosbiológiai adatbázisok is csatlakoztak a csaláshoz, köztük a Protein Data Bank, az 1971-ben elindított fehérje- és nukleinsav-együttes gyűjtemény, valamint a GenBank, az 1982-ben elindított genetikai szekvencia-adatbázis.

„Ma a kísérleti biológiában minden egyes kiadvány új kísérleti adatok és következtetések kombinációját tartalmazza, amelyek összehasonlításra kerülnek a nyilvános adatbázisban elérhető más adatokkal - ezt a megközelítést a Dayhoff fél évszázaddal ezelőtt kezdte meg” - mondja Strasser.

A bioinformatika növekedésével a gyűjtés és a számítás feladatai nagyrészt a nőkre hárultak. Dayhoff az Atlasz munkatársai Ledley kivételével mind nők voltak. Mint a NASA 1960-as években a „számítógépei” és a II. Világháború női kijavítói, ezeket a nőket hamarosan a tudományos gyakorlat peremére szorították. A Jennifer Light számítástudós történész, hivatkozva az „ENIAC lányokra”, akik beprogramozták az elsõ digitális általános célú számítógépet, azt írja, hogy „pontosan ilyen alacsony státusú foglalkozási osztályozás határain belül dolgoztak példa nélküli nők”.

Dayhoff életrajzi vázlatában Lois T. Hunt, aki vele az Atlaszon dolgozott, azt írta, hogy Dayhoff úgy gondolta, hogy a Föld ősi légkörének vizsgálata megadhatja neki „az élet kialakításához szükséges vegyületeket”. Ez talán még több, mint a számítástechnika, ez köti össze a Dayhoff tudományos kutatásának elválaszthatatlan részeit. Az apró fehérjétől a hatalmas légkörig, Dayhoff az élet ezen a bolygón való megjelenésének titkait kutatta. Noha nem oldotta meg mindet, a modern tudomány számára eszközöket és módszereket adott a kutatás folytatására.

Hogyan hozta Margaret Dayhoff a modern számítástechnikát a biológiába