L’obiettivo di questo articolo è comprendere il ruolo del mondo digitale e della scienza di analisi dei big data nell’affrontare l’emergenza attuale del coronavirus. Prima di iniziare questa disamina, tuttavia, è necessario fare chiarezza su alcune definizioni generali, che potrebbero non essere così chiare ai nostri lettori abituali.
I Big Data rappresentano il nome con cui si definisce “una serie di dati molto grandi che vengono prodotti da persone che utilizzano internet e che possono essere memorizzati, compresi e utilizzati solo con l’aiuto di strumenti e metodi speciali”. Se volessimo fare un esempio di Big Data questi sono i post su Facebook, i dati che generiamo ogni volta che facciamo un acquisto on-line, ma anche, più semplicemente, tutto quello che viene depositato su uno spazio virtuale. Ad esempio le cartelle cliniche virtuali e tutti i database epidemiologici sono un’importante fonte di Big Data.
La Data Science, o come viene chiamata adesso la Human Data Science, è “l’uso di metodi scientifici per ottenere informazioni utili dai dati informatici, in particolare da grandi quantità di dati”. I data scientist sono coloro i quali impostano gli algoritmi di ricerca per analizzare l’enorme mole di dati che generiamo ogni giorno e che sono in grado di leggere i risultati di queste ricerche grazie alla competenza nell’ambito di ricerca e comunicare i dati e le risposte generate da questi sistemi ad un gruppo di decisori. Se pensiamo al mondo della salute i data scientist si compongo di team di persone con differenti background tra statistici, matematici, programmatori, biologi e medici.
L’Intelligenza Artificiale (o AI), invece, è “lo studio di come produrre macchine che hanno alcune delle qualità che la mente umana ha, come la capacità di capire il linguaggio, di riconoscere le immagini, di risolvere i problemi e di imparare”. Questo termine è utilizzato soprattutto per definire qui processi in cui il computer è in grado di apprendere dai dati che ogni volta vengono inseriti nel sistema per essere analizzati: più il sistema sarà utilizzato più le risposte saranno vicine a quello che ci si attende. Ad esempio, l’AI viene oggi molto utilizzata per gli strumenti di riconoscimento vocale, i motori di ricerca, i servizi di traduzione, ma anche in campo medico diagnostico.
Ora che i concetti alla base di questo mondo digitale sono più chiari, torniamo a cercare di capire come e se il mondo stia utilizzando questi strumenti nella gestione dell’emergenza Coronavirus.
Un articolo pubblicato on-line il 20 Febbraio dal Lancet fa una disamina proprio su questi concetti e sulle loro applicazioni nell’affrontare l’emergenza, ma cercando sul web sono numerose le referenze su questo tema. Per fare un po’ di chiarezza proverò qui a sintetizzare i vari ambiti di applicazione con alcuni esempi.
Data Science e AI in ambito epidemiologico
Uno degli ambiti al momento più citati come applicazione degli strumenti digitali nella gestione del COVID-19 è quello epidemiologico. L’azienda canadese BlueDot è stata in grado di lanciare l’allarme su questo virus già nel dicembre 2019, grazie all’analisi dei linguaggi e dei modi di esprimersi utilizzati sui social network attraverso una tecnica chiamata Natural Language Processing (NLP) integrata all’analisi della geo-localizzazione degli utenti. Questa tecnica viene applicata anche da altri enti di ricerca e dalle autorità Cinesi per identificare i casi di contagio o monitorare gli spostamenti dei residenti o dei soggetti malati nelle “zone rosse”. Questo tipo di monitoraggio è possibile grazie al nostro utilizzo di social network, smartphone e strumenti di rilevamento elettronico, tuttavia se in Cina questi dati sono controllati dal governo, nei paesi occidentali i dati sono frammentati nei database dei diversi fornitori che vendono i dati aggregati alle aziende capaci di analizzarle. Inoltre, non tutte le persone potrebbero aver acconsentito alla condivisione dei propri dati o non tutti potrebbero aver accesso a queste tecnologie e quindi si genererebbero delle zone d’ombra difficili da comprendere.
Un altro utilizzo in questo ambito, invece, è il monitoraggio quotidiano dei nuovi casi nel mondo, del numero di decessi e del numero di ricoveri. Grazie a piattaforme come Healthmap o quella creata dalla Johns Hopkins è possibile visualizzare i contagi paese per paese e la loro diffusione. Questi strumenti sono utili sia per comprendere l’epidemiologia del virus sia per comprendere il suo spostamento e avere tempo per attuare misure di sicurezza. Si può vedere, ad esempio, come le strategie adottate dalla Cina abbiano portato ad una stabilizzazione dei nuovi casi di contagio, mentre per gli altri stati la crescita continua ad essere esponenziale.
Data Science e AI in ambito diagnostico
Un ambito in cui queste tecnologie stanno prendendo più piede è quello diagnostico. La capacità delle macchine di leggere e identificare anomalie in referti diagnostici sta diventando sempre più accurata grazie alle tecniche di AI e la lettura di una TAC polmonare può passare da 15 minuti (il tempo medio impiegato da un medico) a 10 secondi come afferma Kuan Chen, founder of Infervision. Infervision, infatti, è un’azienda cinese che ha sviluppato una serie completa di soluzioni per l’imaging medico in grado di fornire una diagnostica per immagini assistita per più aree del corpo, tra cui, ma non solo, cervello, polmoni, scheletro e ossa. Durante questa emergenza sono stati in grado di convertire i loro software per riconoscere le lesioni polmonari dovute al COVID-19 e velocizzare, quindi, le diagnosi soprattutto durante le fasi di emergenza.
Data Science e AI in ambito terapeutico
Anche nella definizione di nuove strategie terapeutiche per la cura del COVID-19 molte aziende stanno utilizzando queste tecnologie per velocizzare il processo di identificazione di target molecolari che possono essere bersagli di vaccini o di nuove terapie.
In particolare le aziende più attive in questo settore sono:
- Insilico Medicine che ha identificato attraverso software digitali sei nuove molecole che potrebbero limitare la capacità di replicazione del virus;
- BenevolentAI e l’Imperial College di Londra che, attraverso i loro algoritmi, hanno identificato una proteina bersaglio per questa malattia (la proteina chinasi 1) che è bersaglio di un farmaco, il baricitinib, già approvato per l’artrite reumatoide;
- Mateon Therapeutics che ha scoperto alcuni candidati antivirali ed è particolarmente attiva nella ricerca anche in associazione con università e case farmaceutiche.
Anche nell’identificazione di possibili vaccini sono state utilizzate queste tecnologie, tuttavia poco ancora viene fatto trapelare dalle aziende che stanno attivamente lavorando su questo fronte. Sicuramente queste ricerche e queste applicazioni sono state possibili grazie alla condivisione dei dati genomici del coronavirus su piattaforme open-source che facilitano la condivisione degli esiti di ricerca e la cooperazione internazionale piuttosto che la competizione. Questo in contrapposizione ai modelli standard di pubblicazione attraverso riviste peer-reviewed che stanno ora attraversando una potenziale crisi.
In conclusione possiamo dire che la tecnologia ci sta sicuramente aiutando nel monitoraggio, nella diagnosi e nell’individuazione di nuove terapie e che la condivisione e la trasparenza delle informazioni è diventata un requisito chiave per la gestione di questa emergenza. Tuttavia queste tecnologie potrebbero essere utilizzate anche a supporto dei processi decisionali governativi per prevedere come misure di contenimento del virus possono impattare sull’economia e sull’istruzione e fare quindi delle analisi rischio-beneficio supportate da dati provenienti da fonti anche molto distanti tra loro. Queste tecnologie, però, nel nostro paese non sono ancora accettate completamente e i dati sono ancora troppo frammentati in database e server comunali, provinciali e regionali per essere utilizzati come invece è stato fatto in Cina. Basti pensare il Fascicolo Sanitario Elettronico non sono è ancora stato implementate in tutto il territorio italiano e che, anche dove presente, sono pochi i cittadini che ve ne fanno ricorso, mancando una strategia a livello Italiano per comprendere la potenzialità di questo repository di dati. Ci auguriamo, quindi, che questa emergenza possa generare un nuovo sentire comune e accelerare il processo di digitalizzazione anche della sanità, non in termini di burocrazia, come è ancora viene spesso percepita, ma come supporto concreto sia nel rapporto medico-paziente sia nella gestione nazionale della salute.