La polmonite mette in ospedale un milione di americani adulti ogni anno e ne uccide 50.000. Se un medico sospetta che un paziente abbia la polmonite, generalmente ordinerà una radiografia del torace. Queste radiografie devono essere interpretate da un medico, ovviamente. Ma ora, i ricercatori di Stanford hanno sviluppato un algoritmo che secondo loro può diagnosticare la polmonite ai raggi X meglio dei radiologi esperti.
"Il vantaggio di un algoritmo è che può imparare da centinaia di migliaia di radiografie del torace e le relative diagnosi da altri esperti", afferma Pranav Rajpurkar, uno studente laureato nel gruppo di apprendimento automatico di Stanford, che ha co-condotto la ricerca. "Quando mai i radiologi hanno la possibilità di imparare da centinaia di migliaia di altre diagnosi di radiologi e trovare modelli nelle immagini che portano a tali diagnosi?"
L'algoritmo, chiamato CheXNet, può anche diagnosticare 13 altre condizioni mediche, tra cui enfisema e pneumotorace (aria intrappolata tra il polmone e la parete toracica). Il team ha creato l'algoritmo utilizzando un set di dati pubblico del National Institutes of Health (NIH), che conteneva oltre 100.000 immagini di radiografia del torace etichettate con 14 possibili condizioni. Il set di dati è stato rilasciato insieme a un algoritmo di diagnosi iniziale, che NIH ha incoraggiato altri ricercatori ad avanzare.
Rajpurkar e i suoi colleghi membri del Machine Learning Group hanno deciso di affrontare la sfida. I ricercatori hanno avuto quattro radiologi di Stanford che segnano possibili indicazioni di polmonite su 420 immagini. Utilizzando questi dati, nel giro di una settimana hanno creato un algoritmo in grado di diagnosticare con precisione 10 condizioni. Entro un mese l'algoritmo potrebbe superare gli algoritmi precedenti nella diagnosi di tutte e 14 le condizioni. A questo punto, le diagnosi di CheXNet sono state concordate con un'opinione della maggioranza dei radiologi più spesso di un'opinione individuale di un radiologo.
La ricerca è stata pubblicata questo mese nel sito Web scientifico di prestampa arXiv .
Altri algoritmi diagnostici hanno fatto notizia di recente. I team canadesi e italiani hanno entrambi sviluppato algoritmi per diagnosticare la malattia di Alzheimer da scansioni cerebrali. La distribuzione delle placche nel cervello che caratterizzano la malattia è troppo sottile per l'occhio nudo, ma i ricercatori affermano che la tecnologia AI può rilevare schemi anomali. Rajpurkar e i suoi colleghi ricercatori del Machine Learning Group di Stanford hanno anche sviluppato un algoritmo per diagnosticare le aritmie cardiache, analizzando ore di dati da cardiofrequenzimetri indossabili. Altri algoritmi di polmonite sono stati sviluppati dai dati NIH, ma quello di Stanford è finora il più accurato.
CheXNet potrebbe essere particolarmente utile in luoghi in cui le persone non hanno facile accesso a radiologi esperti, afferma il team. Potrebbe anche essere utile come una sorta di triage, identificando quali casi necessitano probabilmente di un'emergenza e quali no. Il team ha inoltre sviluppato uno strumento che produce una mappa di potenziali indicatori di polmonite sui raggi X, fornendo una pratica guida visiva per i medici.
Mentre il team è ottimista sulle capacità diagnostiche di CheXNet, sono cauti sui suoi limiti.
"L'intelligenza artificiale è uno strumento potente, ma ci vogliono anni di esperienza e molte ore difficili per capire come utilizzarla, ed è altrettanto difficile determinare dove possiamo usarla per l'impatto più positivo", afferma Rajpurkar.
Mentre ci sono una serie di algoritmi di deep learning in fase di sviluppo, nessuno ha ancora superato i rigorosi processi di test e approvazione necessari per l'uso su pazienti reali.
Paul Chang, professore di radiologia e vicepresidente del dipartimento di radiologia dell'Università di Chicago, emette una nota scettica su CheXNet e programmi simili di deep learning. I medici utilizzano già algoritmi per facilitare la diagnosi di qualsiasi numero di condizioni, afferma Chang. Questi algoritmi si basano su un modello preformato di come si presenta la condizione: ad esempio i tumori sono più grandi e appuntiti delle masse benigne. I programmi di apprendimento profondo, al contrario, hanno lo scopo di capire quali caratteristiche sono significative da sole, sgretolando enormi quantità di dati. Ma questo significa anche che possono prendere spunti sbagliati. Chang fornisce l'esempio di un algoritmo di apprendimento profondo che ha appreso la differenza tra vari tipi di raggi X: mani, piedi, mammografie. Ma i ricercatori hanno scoperto che il programma aveva semplicemente imparato a riconoscere le mammografie dal fatto che l'immagine principale era sul lato del film piuttosto che al centro (poiché i seni sono attaccati alla parete toracica, appaiono sul bordo del film in un immagine della mammografia Le mani o i piedi, al contrario, appariranno al centro della radiografia). L'algoritmo non stava imparando nulla di significativo sul seno, solo sulla loro posizione sullo schermo.
"Questo è molto presto", afferma Chang, che sottolinea che i risultati di CheXNet non sono stati sottoposti a revisione paritaria. "L'apprendimento profondo ha un grande potenziale, ma noi in medicina e in radiologia tendiamo ad essere all'inizio del ciclo di campagna pubblicitaria, ma ci impiega più tempo per adottare. Impareremo come consumarlo in modo appropriato. "