Pneumonia évente egymillió felnőtt amerikait helyez a kórházba, és 50 000 embert öl meg. Ha az orvos azt gyanítja, hogy a beteg tüdőgyulladással rendelkezik, általában mellkasi röntgenfelvételt rendel. Ezeket a röntgenfelvételeket természetesen orvosnak kell értelmeznie. A Stanford kutatói azonban most kifejlesztettek egy algoritmust, amely szerint röntgenfelvételekben jobb diagnosztizálhatják a tüdőgyulladást, mint a tapasztalt radiológusok.
„Az algoritmus előnye, hogy több ezer mellröntgenből és azok megfelelő diagnózisából tanulhat más szakértőktől” - mondja Pranav Rajpurkar, a Stanford Machine Learning Group posztgraduális hallgatója, aki a kutatás társigazgatója volt. "Mikor kapnak esélyt a radiológusok, hogy tanulmányozzanak más radiológusok százezreinek diagnózisaitól és találjanak mintákat a diagnózist eredményező képeken?"
A CheXNet elnevezésű algoritmus 13 egyéb betegséget is diagnosztizálhat, ideértve az emfizematát és a pneumothoraxot (a tüdő és a mellkas falához csavarodott levegő). A csoport az algoritmust a Nemzeti Egészségügyi Intézetek (NIH) nyilvános adatkészletével készítette, amely több mint 100 000 mellkasi röntgenfelvételt tartalmazott 14 lehetséges körülmények között. Az adatkészletet kiadták egy kezdeti diagnosztikai algoritmussal együtt, amelyet az NIH ösztönözött más kutatók számára, hogy haladjanak előre.
Rajpurkar és munkatársai, a Machine Learning csoport tagjai úgy döntöttek, hogy vállalják a kihívást. A kutatók négy Stanford-radiológusnak 420 képen jelölték meg a tüdőgyulladás lehetséges indikációit. Ezen adatok felhasználásával egy héten belül létrehoztak egy algoritmust, amely pontosan képes diagnosztizálni 10 állapotot. Egy hónapon belül az algoritmus felülmúlhatja a korábbi algoritmusokat mind a 14 állapot diagnosztizálásakor. Ezen a ponton a CheXNet diagnózisai sokkal inkább egyetértenek a radiológusok többségi véleményével, mint bármelyik radiológus egyedi véleményével.
A kutatást ebben a hónapban közzétették az arXiv tudományos preprint webhelyén.
Más diagnosztikai algoritmusok tették a híreket a közelmúltban. A kanadai és az olasz csapatok egyaránt kifejlesztettek algoritmusokat az Alzheimer-kór agyszkennelés alapján történő diagnosztizálására. Az agyban lévő plakkok eloszlása, amelyek a betegséget jellemzik, túlságosan finomak a szabad szemmel, de a kutatók szerint az AI technológia képes kimutatni a rendellenes mintákat. Rajpurkar és társai, a Stanford Machine Learning Group kutatói szintén kidolgoztak egy algoritmust a szívritmuszavarok diagnosztizálására, és a hordható szívmonitorok adatainak óráját elemezték. Más tüdőgyulladás-algoritmusokat fejlesztettek ki az NIH adataiból, ám eddig a Stanford-algoritmus a legpontosabb.
A CheXNet különösen akkor hasznos lehet, ha az emberek nem férnek hozzá könnyen tapasztalt radiológusokhoz. Hasznos lehet egyfajta áttekintésként, meghatározva, mely esetekben valószínűleg sürgősségi figyelmet kell fordítani, és melyeket nem. A csoport kifejlesztett egy olyan eszközt is, amely a röntgenfelvételeken elkészíti a potenciális tüdőgyulladás-mutatók térképét, és praktikus vizuális útmutatót ad az orvosok számára.
Miközben a csapat optimista a CheXNet diagnosztikai képességei iránt, ők óvatosak a korlátait illetően.
"Az AI egy erőteljes eszköz, de évek tapasztalatára és sok nehéz órára van szükség ahhoz, hogy megértsük, hogyan kell viselni, és ugyanolyan nehéz meghatározni, hogy miként használhatjuk a legpozitívabb hatásokhoz" - mondja Rajpurkar.
Noha számos mélyreható tanulási algoritmus van a fejlesztésben, még nem ment keresztül a szigorú tesztelési és jóváhagyási folyamaton, amely a valódi betegek számára történő felhasználáshoz szükséges.
Paul Chang, a radiológiai professzor és a Chicagói Egyetem radiológiai tanszékének alelnöke szkeptikus hangot ad a CheXNet és hasonló mély tanulási programok kapcsán. Az orvosok már használnak algoritmusokat, hogy segítsenek bármilyen állapot diagnosztizálásában - mondja Chang. Ezek az algoritmusok egy előre megfogalmazott modellre támaszkodnak arra, hogy a betegség hogyan néz ki: a rákok nagyobbak és tüskések, mint például a jóindulatú tömegek. A mély tanulási programok ezzel szemben azt a célt szolgálják, hogy kitalálják, hogy mely tulajdonságok önmagukban jelentősek, hatalmas mennyiségű adat összegyűjtésével. De ez azt is jelenti, hogy rossz jelzéseket is megtehetnek. Chang példát mutat egy mély tanulási algoritmusra, amely megtanulta a különbséget a különféle típusú röntgenfelvételek között: kéz, láb, mammogram. A kutatók azonban felfedezték, hogy a program egyszerűen megtanulta felismerni a mammogramot azáltal, hogy a főkép a film oldalán volt, nem pedig a közepén (mivel a mell mellkasához vannak erősítve, a film szélén jelennek meg mammogram kép. Ezzel szemben a kezek vagy a lábak a röntgen közepén jelennek meg). Az algoritmus nem tanulott semmi jelentőset a mellekről, csak a képernyőn elfoglalt helyzetéről.
„Nagyon korai időkben van” - mondja Chang, aki rámutat arra, hogy a CheXNet eredményeit nem vizsgálták meg szakértői véleményekkel. „A mély tanulásnak nagy lehetősége van, ám az orvostudományban és a radiológiában általában a hype ciklus korai szakaszában vagyunk, ám az elfogadása hosszabb időt vesz igénybe. Megtanuljuk, hogyan kell azt megfelelő módon fogyasztani. ”