Matematici: signori dei numeri e minatori di dati?

On June 26, 2011

In una libreria, fra banchi e scaffali, mi cade l'occhio su un titolo incredibile: "Il potere segreto dei matematici" (Mondadori). Ora, queste sono parole forti, di solito riservate alle multinazionali, ai servizi segreti o, in un altro settore, alla Massoneria, ai Templari, ai Rosacroce, insomma a quelle organizzazioni sulle quali si possono costruire storie di complotti e trame segrete. Ma i matematici? Dai, ma chi ci può credere? Ma che roba è? Così prendo il libro...

 

In una libreria, fra banchi e scaffali, mi cade l'occhio su un titolo incredibile: "Il potere segreto dei matematici" (Mondadori). Ora, queste sono parole forti, di solito riservate alle multinazionali, ai servizi segreti o, in un altro settore, alla Massoneria, ai Templari, ai Rosacroce, insomma a quelle organizzazioni sulle quali si possono costruire storie di complotti e trame segrete. Ma i matematici? Dai, ma chi ci può credere? Ma che roba è? Così prendo il libro, lo sfoglio e cerco di capire. E la prima cosa da capire è che all'ufficio marketing della casa editrice qualcuno sa come attirare il cliente: infatti io sono là, con il libro in mano, che poi comprerò.
E' la traduzione di "The Numerati", di Stephen Baker, che sembra abbia venduto discretamente negli Stati Uniti. In effetti avevo sentito usare la parola, uno di quei neologisimi che in Inglese sono così facili da inventare. Ma in Italiano? Meglio tradurlo con una espressione suggestiva e minacciosa: "il potere segreto...". Poi ci penso, e non mi viene in mente nessuna recensione: sarà sfuggito, con quel titolo non sembra una cosa seria, o forse la recensione è sfuggita a me.
"The Numerati" sono "I Signori dei Numeri", secondo l'autore, e anche detto così fa una certa impressione. Più che di numeri qui si parla di dati, un diluvio di dati, tutti quelli che ci lasciamo in giro quando facciamo la spesa, telefoniamo,  viaggiamo, paghiamo, ma anche quando mandiamo un'email, accendiamo la luce e  consumiamo tanta o poca corrente, e soprattutto clicchiamo qui e là sui siti con le nostre dita mentre percorriamo le strade dei mondi virtuali, ma non solo quelli: una nuvola, un polverone di particelle di informazione che solleviamo a ogni passo.
Questa è la matematica del "data mining", che sta all'incrocio fra la statistica, la ricerca operativa e forse anche altro. I minatori di dati (e già questo termine è molto suggestivo) sembra che scavino nella spazzatura di informazioni che ci lasciamo dietro per riciclarla in qualcosa di utile, o forse anche di pericoloso. Diciamo subito: di matematica qui se ne vede poca, se ne parla ma non si vede. Se sei del mestiere la scovi dietro a qualche parola: clustering, code, distribuzioni di probabilità e qualche altro termine tecnico, magari scritto in italico, come se fosse una lingua straniera. La scelta dell'autore è chiara: evitiamo i dettagli tecnici, e soprattutto le formule, che fanno vendere di meno (così dicono gli editori). Se vuoi imparare sul serio come funzionano queste cose non è qui che devi cercare.
Il libro si articola in sette capitoli con titoli sintetici ma eloquenti: lavoratori, consumatori, elettori, blogger, terroristi, pazienti, anime gemelle. Non ci sorprendiamo dell'interesse dei supermercati per i nostri scontrini della spesa: avete mai pensato al vero motivo per il quale tutti vogliono affibbiarvi una "carta fedeltà"? Raccolgono dati, per conoscervi e vendervi altra merce. Ma non è così facile come sembra tirar fuori da milioni di scontrini virtuali, con codici, numeri e numeretti, qualche indicazione significativa. Si rischia di essere travolti da una montagna di dati. E qui arrivano i matematici, nelle vesti di minatori. L'eroe del capitolo sui consumatori è Rayid Ghani, uno che ha studiato informatica e statistica alla Carnegie-Mellon. Uno che si pone domande come questa: "Le persone che comperano cavoletti di Bruxelles e cereali zuccherati acquistano più tavolette di cioccolato svizzero rispetto alla media?". Ecco, prendete sul serio la domanda (non è così facile) e pensate a migliaia e migliaia di indagini su simili possibili correlazioni. Non è solo questione di quantità, non basta la forza bruta dell'informatica. Ci vogliono idee, e algoritmi efficienti, tecniche che sono state inventate in contesti più nobili, come le ricerche sul DNA per scoprire le predisposizioni alle malattie ereditarie. In effetti, da quel che ho capito, sembra che Ghani abbia avuto l'idea di studiare i consumatori attraverso i loro "microcomportamenti" commerciali, che nell'insieme formano una specie di patrimonio genetico. Dal punto di vista di una catena di supermercati ci portiamo dentro migliaia di piccole predisposizioni al consumo che formano in un certo senso il nostro DNA commerciale, così come le basi degli aminoacidi fanno con quello biologico, strutturandosi nelle unità genetiche. L'idea di un DNA da consumatori è suggestiva, e a pensarci bene sembra azzeccata: il fatto che nelle vostre visite al supermercato perdiate sempre un po' di tempo intorno a certi banchi e magari vicino allo scaffale dei libri scontati, a prescindere dal motivo principale per cui siete entrati, è un po' simile a certi comportamenti animali, come sa chi è abituato a portare un cane a passeggio. D'altra parte, la butto là, mi sembra che questo approccio non sia così lontano dalle idee di Richard Dawkins sulla "memetica": dove i "memes" sono le unità base di trasmissione delle informazioni culturali. E poi la cosa deve funzionare, in un modo o nell'altro, perché questo Rayid Ghani sembra passarsela bene dal punto di vista economico (ho sempre sospettato di essermi dedicato al ramo sbagliato della matematica...).
Ma la parte più inquietante è forse quella dedicata ai "lavoratori", dove incontriamo Samuel Takiri (un altro che se la passa bene), che ha iniziato costruendo (testuale) "modelli matematici dei tecnici dell'IBM". L'idea del "curriculum professionale" non ha nulla di nuovo, ma qui andiamo ben oltre: Takiri vuole conoscere, o costruire, il vostro DNA di lavoratore, scomposto in piccole parti. E non gli interessa solo cosa sapete fare, altrimenti sarebbe quasi banale. Lui vuole anche analizzare i flussi delle vostre email e delle vostre telefonate: come interagite, con quale frequenza, come si sviluppano le vostre dinamiche sociali in azienda (Sta o non sta costruendo un modello di voi stessi? E pensate che gli basti sapere se sapete programmare in C++?). Takiri dice che siamo ancora abituati a gestire le relazioni umane "all'antica" (proprio così: "all'antica") e per sviluppare le sue ricerche è poi passato dall'IBM alla Enron (avete letto bene: alla Enron, che basta cercare su Google per farsi un'idea). C'è poi un gran daffare per convincere il lettore che tutto questo sarà vantaggioso anche per il lavoratore, che potrà rendersi conto del proprio valore per l'azienda in modo più chiaro ed esplicito (già, la matematica...).
Non so dire, e non vorrei sembrare prevenuto, ma una cosa mi ha colpito: a un certo punto qui si racconta di una conferenza stampa del presidente dell'IBM su "Second Life", come prova dei vantaggi della virtualità. Second Life? Se ne parla ancora? Il sole tramonta subito sulle mode virtuali, o no?
Da qualche parte si dice che dobbiamo "trasformare tutto in numeri". In fondo, come ha osservato qualcuno, si tratta sempre della ricerca della sostanza ultima del mondo: "tutto è denaro" (Marx), "tutto è amore" (Freud), "tutto è memoria" (Proust, e fra questi il mio "tutto" preferito). Il cerchio si chiude e qui torniamo al vecchio Pitagora: "tutto è numero". E' il trionfo ultimo della matematica? L'idea è suggestiva, ma non so se quello dei Signori dei Numeri sia proprio un trionfo: credo che Pitagora e molti matematici avessero un'altra idea.
Ma andiamo avanti. No, non parlo del capitolo sulle "anime gemelle", che già ve lo immaginate e solo un americano un po' ingenuo ci può credere (sì, sono prevenuto). Piuttosto è interessante dove si parla di "pazienti", e qui i Signori dei Numeri danno forse il meglio di sé. L'idea che l'analisi statistica di tante microinformazioni sulla vita di un paziente possano dare un quadro clinico più preciso di certe domande un po' generiche che ci fanno a volte i medici (le gira la testa?) sembra ben fondata. Qui si parla dei dati raccolti da tappeti magici, che si accorgono se il vostro passo si fa più sbilanciato e incerto (un presagio di possibili sventure). Eric Dishman, che lavora alla Intel, vuole usare ogni sorta di metodi matematici per analizzare gli innumerevoli dati che potrebbe ottenere riempendo la casa di persone a rischio con ogni genere di sensori. L'idea è un po' quella di affiancare agli esami clinici di laboratorio (nei quali ovviamente la matematica ha un ruolo ben noto) un'analisi dei dati ricavabili dalla nostra vita quotidiana. In altre parole, anche se non lo dice così chiaramente, vorrebbe immergere le nostre intere giornate in un laboratorio "diffuso". E poi via con i "minatori" e le loro campionature, i data clustering, la ricerca delle anomalie statistiche, così qualcuno può scoprire in (utile) anticipo se ci stiamo avvicinando a qualche patologia. Vien da dire: un "grande fratello medico", ma a fin di bene.

 

di Maurizio Vianello

Leave a Reply

Your email address will not be published. Required fields are marked *

this site uses the awesome footnotes Plugin