La campagna vaccinale subisce gli inevitabili ritardi di una pandemia su scala mondiale. In Italia si assiste ad una crescita costante dei nuovi casi, mentre in altri paesi già si parla di terza ondata. Resta alto, troppo alto, il numero dei morti, per un totale di quasi 90.000 decessi in Italia da Marzo. Servono ulteriori misure? Quanto fatto fino ad ora non è sufficiente? Il conteggio delle vittime degli altri paesi è dubbio?
Un aiuto a queste domande arriva dalla legge di Benford, di cui già ci siamo occupati qualche tempo fa su MaddMaths!.
L’astronomo americano Simon Newcomb (1835-1909) e l’ingegnere americano Frank Benford (1883-1948), studiando problemi di natura molto diversa, osservarono indipendentemente una singolare proprietà di alcuni insiemi di dati, per questo si parla anche di legge di Benford-Newcomb.
Benford considerava per esempio l’insieme dei numeri che rappresenta la lista della superficie totale dei principali fiumi americani. Apparentemente questi numeri sembrano casuali: come prima cifra (significativa) possiamo trovare un qualunque numero da 1 a 9, insomma, una distribuzione uniforme.
E invece l’intuito ci inganna! L’ingegnere americano osservava che i numeri 1 e 2 hanno maggiore probabilità di comparire come prima cifra rispetto agli altri. Anzi, insieme ricoprono quasi il 40% dei casi. Questo perché, osservava Benford, se consideriamo come insieme di dati i numeri da 1 a 20, ci accorgiamo che fino a 9 ogni cifra comincia con un numero diverso, ma da 11 a 19 cominciano tutte con il numero 1. Matematicamente parlando, la probabilità P(d) che un certo numero d tra 1 e 9 sia la prima cifra di un set di dati è: log_10(d+1)-log_10(d). Al crescere da 1 a 9 questa probabilità diventa via via più piccola. La legge di Benford si adatta bene agli insiemi di dati che non siano soggetti a tagli o vincoli, a differenza di indirizzi, targhe automobilistiche e civici. L’insieme di dati deve essere libero di crescere di diversi ordini di grandezza.
Ed eccoci al Covid. Un gruppo di ricercatori dell’Auburn University ha utilizzato la legge di Benford per studiare l’andamento della pandemia. In “Covid-19, flattening the curve, and Benford’s law” mostrano che per le prime fasi di crescita esponenziali di nuovi casi, i numeri dei contagi seguono la distribuzione indicata della legge di Benford. Propongono di controllare l’efficacia delle misure restrittive verificando quanto i nuovi casi si discostino dalla distribuzione di Benford, essendo questi casi soggetti a vincoli esterni. Se in un paese, i dati seguono con buona approssimazione la Benford, allora bisogna inasprire le misure per evitare il tracollo del sistema sanitario. Per esempio, nel caso della Svezia, dove i nuovi contagi seguono la distribuzione di Benford con un errore (quasi) trascurabile, si rileva che la curva non si sta per niente appiattendo.
In pratica la legge di Benford è ideale anche per capire se un certo insieme di dati è stato manipolato dall’esterno. In questa direzione si sono mossi altri due gruppi di ricerca.
Il primo, dell’Universidade del Pernambuco (Brasile), ha usato la legge di Benford come misura dell’autenticità dei dati. In “Using Benford’s law to assess the quality of Covif-19 register data in Brazil”, i ricercatori mostrano che i dati brasiliani, nella prima fase di crescita esponenziale, si discostano in modo significativo dalla legge di Benford. Che significa? Con buona certezza, i dati sono stati manomessi per “appiattire” il bollettino giornaliero.
Il secondo, guidato da Christoffer Koch e Ken Okamura si è confrontato con i dati cinesi. Ebbene, in “Benford’s law and Covid-19 reporting” questo gruppo mostra che non c’è distacco sensibile tra i dati cinesi e la distribuzione di Benford. Quindi non c’è motivo di pensare a manomissioni. Come dati di riferimento utilizzano quelli italiani. A loro dire i più solidi.
Insomma, in molti casi per capire come stanno andando le cose e chi sta facendo il furbo, basta usare la legge di Benford.
Marco Menale
[Illustrazione di Luca Manzo]
oppure i cinesi sono più furbi e sanno verificare se i numeri rispettano la legge di Benford…