Pin It

Francesca Dominici è Professoressa di Biostatistica, Popolazione e Data Science presso la Harvard T.H. Chan School of Public Health. Dirige il progetto Harvard Data Science Initiative ed è membro eletto del Institute of Mathematical Statistics e della National Academy of Medicine. Inoltre ha diretto il Committe on the Advancement of Women Faculty. La intervista Marco Menale.

Marco Menale: Ciao, Francesca. Come stai?

Francesca Dominici: Sto benissimo. Siamo tornati a viaggiare dopo i mesi più duri della pandemia. In questo periodo lavoro a diversi progetti di Data Science. Tuttavia a Boston ha fatto proprio un gran caldo quest’estate e non siamo tanto abituati.

MM: Come sei arrivata alla Data Science, ad Harvard?

FD: Ho avuto una grande passione per la matematica sin da piccola. Era la parte dei compiti che preferivo. Infatti al momento della scelta universitaria ero orientata in quella direzione. Tuttavia temevo di non poter cambiare le cose solo con la matematica. Allora con il mio fidanzato di quel periodo mi informo sulla statistica. Capisco subito una cosa: la statistica richiede molta matematica e probabilità. Può essere la disciplina per cambiare le cose. Così mi iscrivo al corso di laurea in “Statistica” all’Università di Roma “La Sapienza”. Sin dai primi corsi di statistica mio rendo conto di avere una  grande passione. E da subito decido per il mio futuro la carriera accademica.

Francesca Dominici
Tuttavia la situazione italiana pone dei limiti. Quando una mia docente si trasferisce per motivi di studio alla Carnegie Mellon University di Pittsburg, anche io comincio a pensare a uno spostamento. Ma non mi sento ancora pronta. Finita la laurea in statistica, vinco un PhD all’Università di Padova e mi trasferisco lì. C’è l’opportunità di ottenere una borsa di studio. E così vado alla Duke University in North Carolina dove concludo la mia tesi di dottorato. Avendo scritto negli USA la tesi di dottorato decido di costruire lì il mio futuro. Lavoro per dodici anni alla Johns Hopkins University, da research fellow a full professor. E dal 2009 eccomi ad Harvard nel Dipartimento di Biostatistica. Viaggiare è stato importante per la mia carriera. E negli USA si è avvantaggiati, dato che mediamente ci si sposta molto.

MM: Ci racconti la tua attività di ricerca?

FD: Mi occupo di Data Science. Io lavoro su insiemi di dati già collezionati da agenzie governative degli USA. Alcuni dati provengono dai centri di monitoraggio sui livelli di inquinanti nell’aria. Altri riguardano incendi boschivi e parametri per quantificare i cambiamenti climatici. E poi ci sono i dati giornalieri di salute pubblica su ricoveri e decessi. Oramai abbiamo dati sull’intera popolazione statunitense. In particolare ci concentriamo su persone sopra i 65 anni. Questi sono i dati e i problemi di cui mi occupo con il mio gruppo. Prendiamo questi dati già collezionati e li armonizziamo, nel senso che li colleghiamo da un punto di vista spaziale e temporale. E in questa fase usiamo i modelli di Data Science. L’obiettivo è stimare le conseguenze di un certo fenomeno.

 

Science

Dati pubblici e definizione di nuove regole, in un articolo su “Science”

 

Ad esempio valutiamo l’impatto di determinati livelli di inquinanti dell’aria sulla salute della popolazione (qui per approfondire). Oppure quantifichiamo le conseguenze delle ondate di caldo e dell’aumento del numero di incendi (qui per approfondire). E l’obiettivo finale è impattare direttamente sulle leggi, come quelle sui regolamenti per i livelli di inquinanti dell’aria o sul tasso consentito di emissioni. Il ruolo della Data Science è centrale. È necessario avere un’ampia conoscenza così da prendere i dati collezionati e metterli assieme per riuscire a stabilire connessioni causali tra fenomeni.

MM: Ci racconti nello specifico come avviene?

FD: Prendiamo gli inquinanti dell’aria. Voglio capire dai dati se l’aumento del loro livello sia causa di malattie. Tuttavia devo assicurarmi che la causa siano proprio gli inquinanti e non ce ne siano altre, come ad esempio il livello socio-economico. Ecco l’importanza di armonizzare i dati. La data science ha due ruoli. Il primo è analizzare dati complessi, stabilendo causa ed effetto, rispondendo alla domanda: è stato proprio l’inquinante la causa di una malattia e non altro? L’altro ruolo fondamentale della Data Science è il Machine Learning. Infatti non possiamo sperare di avere dati sul livello degli inquinanti da ogni singolo posto degli Stati Uniti. Non può esserci una centralina di rilevamento fuori ogni casa americana. Posso avere solo dati parziali. Usando i dati delle centraline presenti e i satelliti, applichiamo tecniche di Machine Learning e inferenza per avere una stima sull’intero territorio.

 

New York Times

L’impatto dell’inquinamento sulll’aumento delle morti da Covid-19, in un articolo del “The New York Times”

 

Ad esempio abbiamo cercato di capire se i livelli di particolato sottile PM 2.5 potessero incidere sulla salute dei cittadini anche con un livello inferiore alla soglia di sicurezza nazionale (qui e qui per i dettagli). Per fare questo abbiamo analizzato i dati delle centraline presenti e stimato i livelli globali di particolato con le tecniche di Machine Learning. Così abbiamo applicato modelli di inferenza causale per capire se ci fosse un impatto negativo  sulla salute di chi respira livelli di inquinanti anche al di sotto  della soglia di sicurezza. E la risposta è stata sì. E poi questo studio ha avuto anche un impatto sulle leggi americane, abbassando ulteriormente la soglia di sicurezza. La riduzione del particolato sottile può avere un buon impatto anche sul clima. E in un altro lavoro con le stesse tecniche abbiamo mostrato un nesso causale tra alti livello di particolato e morti da SARS-CoV-2.

MM: Su quali altri problemi stai lavorando? E quali pensi siano le sfide future della Data Science?

FD: Con il mio team sto lavorando sui metodi di inferenza per quantificare le conseguenze sulla salute dei cambiamenti climatici. In particolare ci interessa capire quali siano le conseguenze delle estreme ondate di calore e dei numerosi incendi. A mio avviso sono tre le sfide della Data Science. Valutare gli effetti causali con modelli molto flessibili. Propagazione dell’incertezza nei modelli di apprendimento automatico. Affrontare il problema dell’interpretabilità nei modelli di apprendimento automatico.

MM: Quanto è importante la matematica e, in generale, l’aspetto teorico nella Data Science e nei suoi progressi?

FD: La matematica è essenziale nella Data Science perché i suoi modelli sono basati sulla matematica. È tanto essenziale come delle solide fondamenta per costruire una casa; senza crolla tutto. La Data Science cerca relazioni tra variabili e lo fa con la probabilità e la statistica, e quindi con la matematica. A mio avviso in giro c’è tanta cattiva data science. Mi riferisco alla pratica di prendere i dati e applicare meccanicamente degli algoritmi per avere delle risposte. E quelle risposte sono prese come verità. La matematica ti aiuta a capire ciò che stai facendo e come, così da avere idea sulla risposta.

Purtroppo questo è un problema della Data Science, soprattutto fuori dai contesti accademici. Ci sono aziende che pensano di risolvere i loro problemi assumendo dei data scientist. Ma questi non fanno che applicare algoritmi (anche di Machine Learning) ai dati in modo meccanico. E ritorna la cattiva data science. Non basta avere super computer e scrivere codice, ma serve sviluppare modelli matematici e fare inferenza. Gli algoritmi di Machine Learning possono essere il  pedale di accelerazione della conoscenza, ma da soli non bastano. Essere data scientist è come avere una macchina da Formula1. Tuttavia se non sai guidarla ci fai poco. E non solo rischi di distruggere la macchina, ma rischi anche di fare del male agli altri.

MM: Francesca, hai ricoperto anche ruoli in organi che combattono le disparità di genere. Come è la situazione attuale?

FD: Purtroppo viviamo in una pesante disparità di genere. Sì, anche qui negli USA. Il mondo scientifico è ancora molto maschile. E poi nell’ambito STEM c’è questo assurdo modo di pensare che per lavorare bene sia necessario lavorare 7 giorni su 7, 24 ore su 24. Lo si chiede sia alle donne che agli uomini. È un modo per testare le donne e spingerle a rinunciare, perché in una coppia alla donna si chiede il sacrificio.

Francesca Dominici

Per me questi ritmi non sono sostenibili nemmeno per gli uomini! E poi nel mondo accademico si ritiene ancora difficile lavorare con una donna ambiziosa. Gli uomini hanno ancora limiti nel vedere la donna come capo. Sono oramai trent’anni che c’è lo stesso numero di donne e uomini nel mondo STEM, ma le posizioni di comando sono quasi esclusivamente per gli uomini. E negli USA il problema è ancora più grave. Mancano leggi di tutela per le donne in gravidanza. Ad esempio in università sono concesse 12 settimane, ma non pagate! Io cerco di fare la mia parte. Creo opportunità non solo per le donne, ma per tutti i gruppi sottorappresentati nel mondo STEM.

MM: Prima di salutarci, ci dici quali sono i tuoi hobby?

 

FD: Io amo lo sport. Corro e nuoto. Faccio soprattutto gare di corsa. Amo stare con mio marito e mia figlia. E poi amo i cani. Infatti ho due black labrador.

Marco Menale

Pin It
This website uses the awesome plugin.