Lo scorso anno, durante l’evento Check Up di Google Health, è stata presentata Med-PaLM 2, un’importante novità nel campo dell’IA applicata alla sanità. Si tratta di un grande modello linguistico (LLM) adattato specificamente per il settore sanitario. Da allora, questo modello è diventato disponibile per un insieme di organizzazioni globali, sia clienti che partner, che stanno sviluppando soluzioni per una vasta gamma di utilizzi, tra cui ottimizzazione dei passaggi di consegna tra infermieri e supporto alla documentazione dei clinici. Alla fine dello scorso anno è stato presentato MedLM, una famiglia di modelli base per la sanità costruiti su Med-PaLM 2, resa più ampiamente disponibile attraverso la piattaforma Vertex AI di Google Cloud.
Da allora, il lavoro sull’IA generativa per la sanità ha fatto passi avanti, sia nei metodi di addestramento dei modelli che nella ricerca applicata al settore sanitario.
Nuove modalità nei modelli per la sanità
La medicina è una disciplina multimodale; è composta da diversi tipi di informazioni memorizzate in vari formati, come immagini radiologiche, risultati di laboratorio, dati genomici, contesto ambientale e altro ancora. Per ottenere una comprensione più completa della salute di una persona, è necessario sviluppare tecnologie che comprendano tutte queste informazioni.
Stiamo introducendo nuove funzionalità nei nostri modelli con l’obiettivo di rendere l’IA generativa più utile alle organizzazioni sanitarie e alla salute delle persone. Abbiamo appena presentato MedLM per la radiografia del torace, che ha il potenziale per trasformare i flussi di lavoro radiologici aiutando nella classificazione delle radiografie del torace per una varietà di casi d’uso. Iniziamo con le radiografie del torace perché sono fondamentali per rilevare condizioni polmonari e cardiache. MedLM per la radiografia del torace è ora disponibile per tester affidabili in anteprima sperimentale su Google Cloud.
Ricerca sull’adattamento dei nostri modelli al dominio medico
circa il 30% del volume mondiale di dati viene generato dall’industria sanitaria – e cresce del 36% annuo. Questo include grandi quantità di testo, immagini, audio e video. Inoltre, informazioni importanti sulla storia dei pazienti sono spesso sepolte in profondità in una cartella clinica, rendendo difficile trovare rapidamente informazioni rilevanti.
Per queste ragioni, stiamo studiando come una versione del modello Gemini, adattata al dominio medico, possa sbloccare nuove capacità per il ragionamento avanzato, la comprensione di un alto volume di contesto e l’elaborazione di molteplici modalità. La nostra ultima ricerca ha portato a prestazioni all’avanguardia sul benchmark per le domande in stile esame di licenza medica degli Stati Uniti (USMLE) al 91,1%, e su un set di dati video chiamato MedVidQA.
E poiché i nostri modelli Gemini sono multimodali, siamo stati in grado di applicare questo modello adattato ad altri benchmark clinici, inclusa la risposta a domande su immagini di radiografia del torace e informazioni genomiche. Stiamo anche ottenendo risultati promettenti dai nostri modelli adattati a compiti complessi come la generazione di rapporti per immagini 2D come le radiografie, così come immagini 3D come le scansioni TC del cervello – rappresentando un cambiamento di paradigma nelle nostre capacità di IA medica. Sebbene questo lavoro sia ancora nella fase di ricerca, c’è il potenziale che l’IA generativa in radiologia porti capacità assistenziali alle organizzazioni sanitarie.
Un LLM sulla salute personale per coaching e raccomandazioni personalizzate
Fitbit e Google Research stanno lavorando insieme per costruire un Grande Modello Linguistico sulla Salute Personale che possa alimentare funzionalità di salute e benessere personalizzate nell’app mobile Fitbit, aiutando le persone a ottenere ancora più informazioni e raccomandazioni dai dati dei loro dispositivi Fitbit e Pixel. Questo modello viene adattato per offrire capacità di coaching personalizzate, come messaggi e orientamenti azionabili, che possono essere individualizzati in base agli obiettivi personali di salute e fitness. Ad esempio, questo modello potrebbe analizzare le variazioni nei tuoi pattern di sonno e la qualità del sonno, per poi suggerire raccomandazioni su come potresti modificare l’intensità del tuo allenamento in base a tali informazioni.
Questo modello viene costruito su modelli Gemini e adattato su un insieme diversificato e de-identificato di segnali di salute provenienti da studi di caso di ricerca di alta qualità. Gli studi vengono raccolti e convalidati in collaborazione con allenatori accreditati ed esperti di benessere, consentendo al modello di mostrare profonde capacità di ragionamento su dati fisiologici e comportamentali. Ad esempio, stiamo testando le prestazioni utilizzando test di pratica simili all’esame di certificazione in medicina del sonno, e stiamo già vedendo che il nostro modello si comporta bene. Continueremo ad iterare e apprendere mentre costruiamo questo nuovo Grande Modello Linguistico sulla Salute Personale, e condivideremo presto ulteriori ricerche.
Migliore comprensione delle capacità assistenziali dell’IA
L’IA generativa sta già funzionando come strumento assistivo per i clinici, aiutandoli con compiti amministrativi come la documentazione che tipicamente richiede ore di tempo. Non ci fermiamo qui – stiamo ora ampliando il nostro lavoro con i partner per esplorare ciò che è possibile.
All’inizio di quest’anno abbiamo introdotto AMIE (Articulate Medical Intelligence Explorer), un sistema di intelligenza artificiale di ricerca costruito su un LLM e ottimizzato per il ragionamento diagnostico e le conversazioni cliniche. Abbiamo esplorato le prestazioni di un LLM simulando consultazioni basate su testo con attori pazienti, adattando un noto framework di “Esami Clinici Obiettivi Strutturati” a un’interfaccia utente rivolta ai consumatori. In un confronto casuale con veri clinici di medicina generale che eseguivano le stesse consultazioni simulate su testo, un LLM opportunamente addestrato ha ottenuto un punteggio superiore o paragonabile a queste consultazioni quando misurato per caratteristiche come accuratezza diagnostica, empatia e spiegazioni utili.
Il nostro prossimo passo è testare questo sistema con un’organizzazione sanitaria per capire come un LLM come AMIE possa essere utile nel supportare le conversazioni cliniche. Speriamo di comprendere come medici e pazienti percepiscano il suo utilizzo all’interno dell’esperienza di cura, con la supervisione di professionisti medici.
Il settore sanitario presenta alcune delle sfide più complesse della società. Stiamo lavorando insieme ai nostri partner per capire come l’IA possa superarle e migliorare l’assistenza.