Pin It

Il problema della selezione avversa può compromettere i risultati di un algoritmo basato sul machine learning. Ce ne parla Marco Menale.

Le nostre vite sono scandite degli algoritmi. Lo facciamo in modo più o meno consapevole: dalle mappe dei navigatori alla ricerca del ristorante per la cena, passando per i suggerimenti di acquisti on-line. Gli algoritmi di autoapprendimento (in inglese machine learning) risolvono perfino problemi matematici. La loro efficacia si basa su schemi come il PAC. Grandi quantitativi di dati insegnano loro cosa fare e come.. Può capitare che gli algoritmi si allenino su insiemi di dati disturbati, con risultati ambigui. È il caso della selezione avversa.

Gli algoritmi di machine learning stanno avendo ampia diffusione nell’ambito sanitario. Se le risorse sono ottimizzate, ne beneficia l’intero sistema. Consideriamo il caso di una patologia. Se intercettassimo con anticipo i soggetti a maggior rischio di complicanze, potremmo prevenire i casi più gravi. L’impatto sulla salute del singolo diventa un beneficio per l’intero sistema. Come nel caso della polmonite.

Rich Caruana, Yin Lou, Johannes Ernst Gehrke, Paul Koch, Marc Sturm e Noémie Elhadad si occupano di polmonite nel 2015. Nell’articolo “Intelligible Models for HealthCare: Predicting Pneumonia Risk and Hospital 30-day Readmission” i ricercatori descrivono un algoritmo che stima la probabilità che un paziente colpito da polmonite abbia esito fatale. I risultati sembrano buoni. Eppure per i pazienti con una storia di asma succede qualcosa di strano. Per questi ultimi, la probabilità di morire risulta più bassa rispetto ad altri pazienti. L’asma sembra essere un aiuto per combattere la polmonite piuttosto che un aggravante.

Gli autori analizzano l’insieme di dati con cui è stato istruito l’algoritmo. Dopo diverse osservazioni comprendono il perché dell’anomalia: la selezione avversa. I protocolli medici stimano ad alto rischio i pazienti asmatici. Quindi in caso di polmonite  sono mandati con maggior frequenza nei reparti di terapia intensiva. Così ricevono un trattamento più forte ed efficace; ma l’algoritmo ignora questo dettaglio. Così la probabilità di esito fatale per chi soffre d’asma risulta bassa. Supponiamo che il servizio sanitario si affidi a questo meccanismo. Allora i pazienti asmatici sarebbero tagliati fuori da un’eventuale vaccinazione anti-pneumococco. Con l’esperienza della recente pandemia di Covid-19  possiamo immaginarne le conseguenze disastrose.

La selezione avversa è un pericolo. Non si tratta di una distorsione pilotata dall’esterno per qualche fine, ma avviene in totale autonomia, come nel caso appena descritto. Il machine learning può migliorare le nostre vite a patto di allenarlo nella giusta palestra di dati.

 

[Illustrazione di Luca Manzo]

Marco Menale

Pin It
This website uses the awesome plugin.