Ma che dilemma e dilemma...

On December 23, 2015

Ma siamo proprio sicuri di aver capito il dilemma del prigioniero in teoria dei giochi? Roberto Lucchetti ci spiega che spesso, su questo problema, ci sono degli equivoci. 

L’idea del dilemma del prigioniero è maturata alla RAND corporation, una società di studi strategici fondata nel 1948. Gli ideatori della situazione, poi descritta dal dilemma, che però nella sua versione di storiella è stata formalizzata da A. Tucker nel 1950, furono  Merrill Flood e Melvin Dresher.

Ecco il racconto della storiella:

Due tizi sono catturati dalla polizia perché fortemente sospettati di aver commesso un crimine. Il giudice, un giudice geniale, come vedremo, fa loro il discorso seguente:

So che siete responsabili della rapina di ieri. Per questo crimine la pena corrispondente è di 5 anni di galera. Se però uno confessa la partecipazione di entrambi al delitto, sarà libero per una legge sui pentiti, mentre l’irriducibile si prende delle aggravanti e sarà condannato a 7 anni di galera. Se nessuno dei due parla, dal momento che sono convinto che in un processo con giuria popolare sareste assolti, vi sanziono per una pena minore, cioé un anno di galera, per varie infrazioni gravi al codice della strada, senza portarvi a processo.

Come nella più ovvia tradizione matematica, riassumiamo, riportando gli anni di galera, nelle varie situazioni:

dilemma

Che faranno i due, se si comportano razionalmente, e se quel che conta per loro sono gli anni di galera? La conclusione inesorabile è che entrambi confesseranno, e si faranno 5 anni di galera, pur avendo a disposizione una scelta congiunta, non confessare, che li farebbe avere solo un anno di galera. Una pausa prima di spiegare il perché di questa conclusione.

Ecco una frase presa dalla descrizione del dilemma da parte di Wikipedia, versione italiana.

Gli investigatori li arrestano entrambi e li chiudono in due celle diverse, impedendo loro di comunicare.

Ed ecco la versione Inglese

Each prisoner is in solitary confinement with no means of communicating with the other.

Se interrogate esperti o quasi esperti (tipo economisti, gente che la teoria dei giochi la mastica un po’), il 90% vi dirà la stessa cosa. Se poi uno è raffinato, vi dice pure che è un gioco a mosse contemporanee, e che se uno dovesse parlare per primo, la situazione cambierebbe.

Mi spiace, ma sono proprio sciocchezze. E non parlatemi male di Wikipedia, di solito molto affidabile (almeno, per la matematica). Ora spiego perché, e si vedrà che è facilissimo capire, ma tant’è uno dice per qualche motivo una cosa una volta, e poi le leggende sono difficili da estirpare…

Supponiamo per un secondo che uno debba decidere da solo (qui non si parla più di prigionieri, sto generalizzando…), che abbia dei costi da sostenere, e delle scelte da fare. Che fa secondo voi, da un punto di vista matematico, e non solo? Non è difficile direi, cerca di minimizzare i costi. Chiamate c la funzione costo, definita su qualche insieme di scelte X, e studiate il problema

inf_{x\in X} c(x)

C’è bisogno di altre spiegazioni? Direi di no! Occorre affannarsi a spiegare regole per convincerci che quella è la cosa giusta da fare? No! si parla di costi, che quindi vanno minimizzati e chiuso il discorso: provate voi a fare una teoria dell’ottimizzazione in cui la funzione costo non è minimizzata!

Ora, qual è la complicazione che la teoria dei giochi introduce?  Di fatto, la presenza di un altro implica che in genere la funzione costo di un individuo dipende anche dalle scelte dell’altro individuo, ossia:

c=c(x,y)

Adesso che cosa voglia dire minimizzare in questo caso non è mica chiaro, visto che un agente ha la possibilità di scegliere una sola delle variabili in ngioco. Però supponete che succeda un caso incredibilmente fortunato:

Esiste x tale che

c(x,y)<c(z,y) per ogni z\in X diverso da x, e per ogni y.

Insomma, esiste un elemento che minimizza i miei costi sempre, a prescindere da quel che fa l’altra persona!

Bene, questa è una situazione veramente estrema, direte che non succederà quasi mai, ed è vero: è banale rendersi conto che in genere una nostra scelta sarà buona o cattiva a secondo delle scelte dell’altro! Però questa situazione “ideale” è proprio ciò che accade nel Dilemma del prigioniero. Basta esaminare la tabella e si vede che in realtà la scelta di confessare è SEMPRE più conveniente, qualunque cosa faccia l’altro! 

E dunque non occorre affatto tenere separati questi prigionieri, non occorre affatto supporre che il gioco sia a mosse contemporanee, è ridicolo sostenere che se uno parla per primo la situazione cambia…tanto ognuno di loro sa cosa farà l’altro, e quindi giocare prima o dopo, parlare o no, non cambia proprio nulla.

Perché questi errori? Forse, in parte perché in un equilibrio di Nash in effetti la situazione non è così chiara come qui, dove si parla di strategia fortemente dominante. In una generica situazione di equilibri di Nash, se uno parla per primo può indirizzare le scelta, ma qui la situazione è ben diversa. Il primo che avuto l’idea peregrina di dire che i prigionieri andavano tenuti separati voleva forse in qualche modo sottolineare che occorre evitare, per esempio, che i due possano minacciarsi, cioè dirsi cose tipo “se parli faccio ammazzare qualche tuo parente”. Però mi pare evidente che così si sta cambiando il gioco, ossia si stanno cambiando le funzioni costo dei giocatori, e allora si deve semplicemente studiare un’altra tabella di costi, non dire che per ottenere la soluzione giusta per la tabella di sopra devo specificare procedure stravaganti. Questo però è un discorso che non è tanto facile da accettare, forse perché mostra come i matematici abbiano una marcia in più, quando si tratta di fare modelli. Dico questo, perché ho parlato del Dilemma con uno psicologo di grande reputazione, che voleva mostrarmi che i matematici sbagliano a postulare che le persone perseguano la massimizzazione dell’utilità. E per convincermi di questo, mi ha fatto leggere una ricerca di alcuni colleghi, pubblicata in una rivista importante, in cui gli autori volevano appunto confutare l’idea che l’agente massimizzasse la propria utilità. Per fare ciò, hanno ideato un esperimento tipo Dilemma del prigioniero, che in questo caso potrebbe essere esemplificato con la formula “vuoi che dia 10 Euro a te o 100 al tuo collega?”. Ancora una volta la corretta risposta razionale, dammi 10 Euro, va a scapito di una situazione più favorevole per entrambi (ma insostenibile, in assenza di vincoli).  Nella prima fase dell’esperimento, dicevano all’intervistato che l’altro aveva già manifestato l’intenzione di chiedere i 10 Euro per sé. E il 98% delle persone a sua volta chiedeva i 10 Euro. Nella seconda fase, gli sperimentatori provavano a convincere che l’altro lo aveva fatto perché costretto, e che era in difficoltà economiche, che forse meritava un gesto di simpatia e, voilà, un buon numero di loro cambiava opinione e accettava l’idea di dare i 100 Euro all’altro, andando quindi contro al principio della massimizzazione della propria utilità… ma invece non è per nulla così!

Il Dilemma è stupendo anche perché ci mostra quanto sia facile equivocare, se non si è matematici. L’esperimento non ha mostrato che si sbagliano i matematici, ha mostrato che gli psicologi non hanno capito che cosa hanno fatto nell’esperimento: inducendo empatia verso l’altro, hanno semplicemente cambiato la funzione di utilità di molti intervistati, che continuano a fare una scelta coerente, però secondo parametri diversi.  

Anche se i giornali raccontano solo cose truci, ogni giornata è piena di gesti di gratuita generosità da parte di tante persone. Non sono persone irrazionali, non sono persone che non sanno massimizzare la loro utilità, sono semplicemente belle persone, che massimizzano la loro soddisfazione personale, per esempio, facendo un gesto che apparentemente, ma solo apparentemente, non porta loro un guadagno tangibile.

Roberto Lucchetti

4 Comments

  1. Corrado

    23/12/2015 at 23:23

    Caro Roberto, prendo le difese dei "cattivi" interpretatori di cui dici. Il buon senso dice che se i due prigionieri possono comunicare, nel loro desiderio di minimizzare gli anni di carcere, opteranno per non confessare entrambi, coerentemente con quanto descritto dalla tabella. La questione è precisare quale ruolo hanno i numeri in tabella e quindi quale è il funzionale di costo su cui possono agire. E' per questo motivo che si utilizza l'escamotage della non-comunicazione tra i prigionieri. Forse non matematicamente indispensabile, ma importante per precisare le regole del gioco...

    • Roberto

      24/12/2015 at 15:05

      Bene se ci troviamo tu e io in quella situazione, caro Corrado, fai bene attenzione a propormi dei patti...potrei mentire...
      Se poi Maddmaths mi farà l'onore di ospitarmi ancora, magari chiarirò perché in fondo di dilemma si tratta, ma certamente non matematico!

  2. Simone

    24/12/2015 at 16:37

    Io di teoria dei giochi capisco ben poco, ma mi sembra evidente che il dibattito nasce dall'inserire un gioco matematico in un contesto che vorremmo assoluto: quello della giustizia. Nessuno di noi desidera a priori una giustizia in cui la verità non trionfa e l'unico scopo è il minore dei mali. Se invece di crimini e sanzioni si parlasse di bambini e caramelle (o di giochi di società), forse il "dilemma" assumerebbe un aspetto differente.

Leave a Reply

Your email address will not be published. Required fields are marked *