Matematici: signori dei numeri e minatori di dati?
In una libreria, fra banchi e scaffali, mi cade l'occhio su un titolo incredibile: "Il potere segreto dei matematici" (Mondadori). Ora, queste sono parole forti, di solito riservate alle multinazionali, ai servizi segreti o, in un altro settore, alla Massoneria, ai Templari, ai Rosacroce, insomma a quelle organizzazioni sulle quali si possono costruire storie di complotti e trame segrete. Ma i matematici? Dai, ma chi ci può credere? Ma che roba è? Così prendo il libro...
In una libreria, fra banchi e scaffali, mi cade l'occhio su un
titolo incredibile:
"Il potere segreto dei matematici" (Mondadori). Ora, queste sono parole
forti, di solito riservate alle multinazionali, ai servizi segreti o,
in un altro settore, alla Massoneria, ai Templari, ai Rosacroce,
insomma a quelle organizzazioni sulle quali si possono costruire storie
di complotti e trame segrete. Ma i matematici? Dai, ma chi ci può
credere? Ma che roba è? Così prendo il libro, lo sfoglio e cerco di
capire. E la prima cosa da capire è che all'ufficio marketing della
casa editrice qualcuno sa come attirare il cliente: infatti io sono là,
con il libro in mano, che poi comprerò.
E' la traduzione di "The Numerati", di Stephen Baker, che sembra abbia
venduto discretamente negli Stati Uniti. In effetti avevo sentito usare
la parola, uno di quei neologisimi che in Inglese sono così facili da
inventare. Ma in Italiano? Meglio tradurlo con una espressione
suggestiva e minacciosa: "il potere segreto...". Poi ci penso, e non mi
viene in mente nessuna recensione: sarà sfuggito, con quel titolo non
sembra una cosa seria, o forse la recensione è sfuggita a me.
"The Numerati" sono "I Signori dei Numeri", secondo l'autore, e anche
detto così fa una certa impressione. Più che di numeri qui si parla di
dati, un diluvio di dati, tutti quelli che ci lasciamo in giro quando
facciamo la spesa, telefoniamo, viaggiamo, paghiamo, ma anche
quando mandiamo un'email, accendiamo la luce e consumiamo tanta o
poca corrente, e soprattutto clicchiamo qui e là sui siti con le nostre
dita mentre percorriamo le strade dei mondi virtuali, ma non solo
quelli: una nuvola, un polverone di particelle di informazione che
solleviamo a ogni passo.
Questa è la matematica del "data mining", che sta all'incrocio fra la
statistica, la ricerca operativa e forse anche altro. I minatori di
dati (e già questo termine è molto suggestivo) sembra che scavino nella
spazzatura di informazioni che ci lasciamo dietro per riciclarla in
qualcosa di utile, o forse anche di pericoloso. Diciamo subito: di
matematica qui se ne vede poca, se ne parla ma non si vede. Se sei del
mestiere la scovi dietro a qualche parola: clustering, code,
distribuzioni di probabilità e qualche altro termine tecnico, magari
scritto in italico, come se fosse una lingua straniera. La scelta
dell'autore è chiara: evitiamo i dettagli tecnici, e soprattutto le
formule, che fanno vendere di meno (così dicono gli editori). Se vuoi
imparare sul serio come funzionano queste cose non è qui che devi
cercare.
Il libro si articola in sette capitoli con titoli sintetici ma
eloquenti: lavoratori, consumatori, elettori, blogger, terroristi,
pazienti, anime gemelle. Non ci sorprendiamo dell'interesse dei
supermercati per i nostri scontrini della spesa: avete mai pensato al
vero motivo per il quale tutti vogliono affibbiarvi una "carta
fedeltà"? Raccolgono dati, per conoscervi e vendervi altra merce. Ma
non è così facile come sembra tirar fuori da milioni di scontrini
virtuali, con codici, numeri e numeretti, qualche indicazione
significativa. Si rischia di essere travolti da una montagna di dati. E
qui arrivano i matematici, nelle vesti di minatori. L'eroe del capitolo
sui consumatori è Rayid Ghani, uno che ha studiato informatica e
statistica alla Carnegie-Mellon. Uno che si pone domande come questa:
"Le persone che comperano cavoletti di Bruxelles e cereali zuccherati
acquistano più tavolette di cioccolato svizzero rispetto alla media?".
Ecco, prendete sul serio la domanda (non è così facile) e pensate a
migliaia e migliaia di indagini su simili possibili correlazioni.
Non è solo questione di quantità, non basta la forza bruta
dell'informatica. Ci vogliono idee, e algoritmi efficienti, tecniche
che sono state inventate in contesti più nobili, come le ricerche sul
DNA per scoprire le predisposizioni alle malattie ereditarie. In
effetti, da quel che ho capito, sembra che Ghani abbia avuto l'idea di
studiare i consumatori attraverso i loro "microcomportamenti"
commerciali, che nell'insieme formano una specie di patrimonio
genetico. Dal punto di vista di una catena di supermercati ci portiamo
dentro migliaia di piccole predisposizioni al consumo che formano in un
certo senso il nostro DNA commerciale, così come le basi degli
aminoacidi fanno con quello biologico, strutturandosi nelle unità
genetiche. L'idea di un DNA da consumatori è suggestiva, e a pensarci
bene sembra azzeccata: il fatto che nelle vostre visite al supermercato
perdiate sempre un po' di tempo intorno a certi banchi e magari vicino
allo scaffale dei libri scontati, a prescindere dal motivo principale
per cui siete entrati, è un po' simile a certi comportamenti animali,
come sa chi è abituato a portare un cane a passeggio. D'altra parte, la
butto là, mi sembra che questo approccio non sia così lontano dalle
idee di Richard Dawkins sulla "memetica": dove i "memes" sono le unità
base di trasmissione delle informazioni culturali. E poi la cosa deve
funzionare, in un modo o nell'altro, perché questo Rayid Ghani sembra
passarsela bene dal punto di vista economico (ho sempre sospettato di
essermi dedicato al ramo sbagliato della matematica...).
Ma la parte più inquietante è forse quella dedicata ai "lavoratori",
dove incontriamo Samuel Takiri (un altro che se la passa bene), che ha
iniziato costruendo (testuale) "modelli matematici dei tecnici
dell'IBM". L'idea del "curriculum professionale" non ha nulla di nuovo,
ma qui andiamo ben oltre: Takiri vuole conoscere, o costruire, il
vostro DNA di lavoratore, scomposto in piccole parti. E non gli
interessa solo cosa sapete fare, altrimenti sarebbe quasi banale. Lui
vuole anche analizzare i flussi delle vostre email e delle vostre
telefonate: come interagite, con quale frequenza, come si sviluppano le
vostre dinamiche sociali in azienda (Sta o non sta costruendo un
modello di voi stessi? E pensate che gli basti sapere se sapete
programmare in C++?). Takiri dice che siamo ancora abituati a gestire
le relazioni umane "all'antica" (proprio così: "all'antica") e per
sviluppare le sue ricerche è poi passato dall'IBM alla Enron (avete
letto bene: alla Enron, che basta cercare su Google per farsi un'idea).
C'è poi un gran daffare per convincere il lettore che tutto questo sarà
vantaggioso anche per il lavoratore, che potrà rendersi conto del
proprio valore per l'azienda in modo più chiaro ed esplicito (già, la
matematica...).
Non so dire, e non vorrei sembrare prevenuto, ma una cosa mi ha
colpito: a un certo punto qui si racconta di una conferenza stampa del
presidente dell'IBM su "Second Life", come prova dei vantaggi della
virtualità. Second Life? Se ne parla ancora? Il sole tramonta subito
sulle mode virtuali, o no?
Da qualche parte si dice che dobbiamo "trasformare tutto in numeri". In
fondo, come ha osservato qualcuno, si tratta sempre della ricerca della
sostanza ultima del mondo: "tutto è denaro" (Marx), "tutto è amore"
(Freud), "tutto è memoria" (Proust, e fra questi il mio "tutto"
preferito). Il cerchio si chiude e qui torniamo al vecchio Pitagora:
"tutto è numero". E' il trionfo ultimo della matematica? L'idea è
suggestiva, ma non so se quello dei Signori dei Numeri sia proprio un
trionfo: credo che Pitagora e molti matematici avessero un'altra
idea.
Ma andiamo avanti. No, non parlo del capitolo sulle "anime gemelle",
che già ve lo
immaginate e solo un americano un po' ingenuo ci può credere (sì, sono
prevenuto).
Piuttosto è interessante dove si parla di "pazienti", e qui i Signori
dei Numeri danno forse il meglio di sé. L'idea che l'analisi statistica
di tante microinformazioni sulla vita di un paziente possano dare un
quadro clinico più preciso di certe domande un po' generiche che ci
fanno a volte i medici (le gira la testa?) sembra ben fondata. Qui si
parla dei dati raccolti da tappeti magici, che si accorgono se il
vostro passo si fa più sbilanciato e incerto (un presagio di possibili
sventure). Eric Dishman, che lavora alla Intel, vuole usare ogni sorta
di metodi matematici per analizzare gli innumerevoli dati che potrebbe
ottenere riempendo la casa di persone a rischio con ogni genere di
sensori. L'idea è un po' quella di affiancare agli esami clinici di
laboratorio (nei quali ovviamente la matematica ha un ruolo ben noto)
un'analisi dei dati ricavabili dalla nostra vita quotidiana. In altre
parole, anche se non lo dice così chiaramente, vorrebbe immergere le
nostre intere giornate in un laboratorio "diffuso". E poi via con i
"minatori" e le loro campionature, i data clustering, la ricerca delle
anomalie statistiche, così qualcuno può scoprire in (utile) anticipo se
ci stiamo avvicinando a qualche patologia. Vien da dire: un "grande
fratello medico", ma a fin di bene.
di Maurizio Vianello
