Due grandezze variano insieme. Tendiamo a concludere che l’una è causa dell’altra. Mentre può trattarsi di sola correlazione. Ce ne parla Marco Menale.
I dati a disposizione aumentano giorno dopo giorno. Ogni notizia ne è piena. Rilevazioni locali, censimenti, statistiche internazionali. È un susseguirsi di numeri. Capita che numeri relativi a grandezze diverse siano disposti gli uni di fianco agli altri, lungo due colonne. Scorriamo queste righe, fino a trovarne tre di seguito in cui entrambe le grandezze diminuiscono. Proprio in quel momento arriva il dubbio, quella tentazione di dirsi “ah, quindi questa cosa causa quell’altra”. Ecco, stiamo partendo da una correlazione per dedurne una causalità. Malgrado termini simili, sono due cose ben diverse.
Partiamo dalla correlazione. Consideriamo due variabili di qualsiasi natura; fisiche, come spazio e tempo, oppure socio-economiche, come ricchezza e livello d’istruzione. Si dicono correlate se a ciascun valore dell’una corrisponde un valore dell’altra con una certa regolarità. Ad esempio, una correlazione è positiva se all’aumentare dell’una, corrisponde un aumento dell’altra. È negativa se all’aumentare della prima si osserva un calo della seconda, o viceversa. La correlazione può essere misurata statisticamente con appositi indici, come l’indice di correlazione di Pearson.
Cosa diversa è la causalità. In questo caso, due variabili sono correlate, ma una delle due è responsabile dell’altra. Anche solo in parte. Siamo in una situazione di causa-effetto. Dunque, alla correlazione si aggiunge un ordine temporale con cui variano le due variabili. Ad esempio, osserviamo che entrambe aumentano, ma l’aumento della prima segue l’aumento della seconda con un certo lasso di tempo.
Consideriamo una situazione reale, spesso utilizzata in questo contesto. È piena estate. Le giornate sono molto calde e molto lunghe. Vediamo tante persone che indossano occhiali da sole. Ma vediamo anche tante persone mangiare gelati. Dunque, all’aumentare del numero di occhiali da sole aumentano i gelati consumati. Ma allora, possiamo concludere che sono gli occhiali da sole a causare il maggior consumo di gelati? No. Le due grandezze sono solo correlate. Infatti, ce n’è una terza che entra in gioco: l’estate. È questa a causare entrambi gli aumenti. In definitiva, le due grandezze sono solo in rapporto di correlazione, mentre è l’estate a essere in rapporto di causalità con loro.
Con i dati americani troviamo situazioni ancora più sorprendenti. Esiste una correlazione positiva al \(95,86\%\) tra il consumo di mozzarella e il numero di dottorati di ricerca conseguiti in ingegneria civile. Mangiare latticini migliora il flusso delle idee ingegneristiche? Oppure, è lo sforzo della ricerca in questa disciplina a spingere a mangiare più mozzarella? Beh, la risposta è più semplice. Non c’è nessun rapporto di causalità, ma è solo correlazione.
Hoc ergo propter hoc, ossia “con questo, allora a causa di questo”. È la locuzione latina che descrive la fallacia del ragionamento per cui deduciamo causalità dove c’è solo correlazione. E lo facciamo più di quanto immaginiamo. Tra i motivi ci sono (anche) i bias cognitivi, come: bias della conferma, overconfidence bias e bias dell’evidenza incompleta.
In questo periodo, i tanti dati a disposizione complicano la situazione. Basti pensare alle errate causalità che portano alla diffusione delle fake-news e alla polarizzazione del dibattito. Dunque, prima di concludere “ecco la causa”, ricordiamoci degli occhiali da sole mentre gustiamo il nostro gelato.