Pin It

Abbiamo conosciuto qualche mese fa su questo sito Adam Atkinson per la sua presentazione dei MathsJam. Ora ci propone un nuovo post, incentrato sulle distribuzioni di probabilità singolari, ma che non siano misure atomiche. E voi, le conoscete? 

Scrivo questo articolo principalmente per chiedervi qualcosa. Quanto avete imparato sulle distribuzioni di probabilità singolari[1 ]N.B.: qualcuno usa “distribuzione singolare” per la distribuzione che prende un unico valore con probabilità 1. Come distribuzione questa sembra chiaramente discreta (la f.d.r. è discontinua), ma degenere. E secondo qualcuno tutte le distribuzioni discrete sono singolari in quanto le loro f.d.r. hanno derivata 0 tranne su un insieme di misura 0. Sembra più comune usare “singolare” quando la f.d.r. è continua e ha derivata 0 tranne su un insieme (non-numerabile) di misura 0. A quanto pare alcuni libri dicono “assolutamente continue” e “continue singolari” invece di “continue” e “singolari”, ma io finora non ho mai incontrato questi termini di persona. Magari perché ho guardato solo libri relativamente elementari. a scuola o durante i vostri eventuali corsi di probabilità all’università o altrove, e quando? Se insegnate la probabilità, quanto dite ai vostri studenti sulle distribuzioni singolari? Mi sono reso conto non tanto tempo fa che sapevo della loro esistenza, e conoscevo almeno un esempio. E basta. Quindi ho chiesto ad un po’ di amici, e le loro risposte mi hanno sorpreso. Per lo più hanno detto “Le che?”. Fra questi c’erano laureati in matematica, e anche gente con un dottorato in matematica. Alcuni specialisti in probabilità hanno risposto invece “Certo. Le conoscono tutti, no?” e/o “Cosa avrebbero di speciale?” Forse sono stato fortunato. “Probability: An Introduction” di Grimmett e Welsh ha ben 4 pagine sulle distribuzioni singolari. Guardando altri libri di testo in, o tradotti in, inglese dagli anni ‘30 fino ad oggi ho trovato un po’ di informazioni del tipo:

  • niente
  • c’è un’altra possibilità di cui non diremo niente

  • c’è un’altra possibilità molto contorta di cui non diremo niente

  • c’è un’altra possibilità che non si verifica quasi mai nella vita reale, quindi non ne diremo nulla

  • una qualche descrizione ma niente esempi

  • descrizione + un esempio (sempre lo stesso)

Sembra che io sia stato molto fortunato decenni fa ad incontrare un corso nello stile di Grimmett e Welsh e non un qualche altro corso. “Counterexamples in Probability” di Stoyanov dice soltanto “Notiamo che ci sono misure le cui funzioni di ripartizione sono continue ma […]. Tali misure e distribuzioni si chiamano singolari. Non le tratteremo qui.” Queste distribuzioni sono troppo recondite perfino per un libro sui controesempi? Forse in Italia sono molto più conosciute di quanto non lo siano all’estero, ma se qualcuno che legge questo testo non le conoscesse, eccone una descrizione, con ben DUE esempi! Come forse saprete ci sono distribuzioni discrete (con una funzione di massa) e distribuzioni continue (con una densità). Entrambe hanno una funzione di ripartizione. È possible mischiare questi due tipi per costruire distribuzioni che non sono né discrete né continue. Per esempio:

Lancio una moneta bilanciata. Se esce testa, lancio un dado uniforme a 6 facce e prendo il risultato. Se esce croce, genero un numero reale dalla distribuzione uniforme su [0,6] e prendo quello come risultato. La mia distribuzione finale non è né discreta né continua, e la sua funzione di ripartizione è una combinazione lineare di una f.d.r. discreta e una continua.

Ma c’è un terzo tipo di distribuzione di base. E la funzione di ripartizione di una distribuzione di probabilità in generale è una combinazione lineare di quelle di una distribuzione discreta, una distribuzione continua, e una distribuzione singolare. (E la cosa finisce qui, non c’è un quarto tipo di base). Ma sembra che molti libri di testo, almeno quelli elementari (fino al primo anno dell’università, forse?), non dicano nulla (o quasi) a proposito. Il primo, e spesso unico, esempio che si trova è questo:

Prendiamo una moneta bilanciata i cui lanci siano indipendenti. La lanciamo infinite volte. (Una per ogni intero non-negativo.) Dopo il lancio n-esimo riceviamo \((\frac {2}{3^n})\) euro se esce testa, altrimenti niente. Possiamo ricevere in totale da 0 (tutte croci) a 1 (tutte teste) euro in totale, ma solo alcuni valori sono possibili. E anche i valori possibili hanno probabilità 0. Com’è la distribuzione delle somme che possiamo ottenere? 

Ecco un grafico della funzione di ripartizione.

Funzione di ripartizione della distribuzione di Cantor. Il grafico va da (0,0) a (1,1).

È la scala del diavolo! Ed è la f.d.r. della distribuzione di Cantor. La f.d.r è derivabile quasi ovunque con derivata 0. È continua. Non ha né funzione di massa, né densità. La media è 0,5 per simmetria. Ma come si calcolano i momenti di una cosa così? Grimmett e Welsh dicono “Data la funzione di ripartizione \(F_X\) di una variable casuale X, possiamo calcolare i momenti di X quando esistono (almeno se X è continua o discreta)”. Ci sono delle informazioni utili qui e possiamo ottenere la media di ½ e la varianza di 1/8 in questo caso. È naturale chiedersi se le distribuzioni singolari siano tutte più o meno così – cioè con la f.d.r. piatta su intervalli lunghi ecc. Possiamo creare distribuzioni di Cantor con altri parametri. Ecco un video con degli esempi (N.B.: chiaramente, i buchi che appaiono nel grafico dopo un certo punto non ci sono veramente).

Potremmo prendere qualsiasi funzione di ripartizione e sostituire pezzi del suo grafico con copie rimpicciolite di (pezzi di) una distribuzione di Cantor per ottenere distribuzioni singolari nuove. Guardando in giro sul web e sui libri troviamo che quando c’è un secondo esempio, è (quasi?) sempre il seguente:

Cominciamo con una quantità di soldi x fra 0 e 1 euro. Stiamo cercando di arrivare a un totale di 1 euro scommettendo sui lanci di una moneta sbilanciata (con lanci indipendenti) tale che esca testa con probabilità \(0<p<0,5\). Siamo obbligati a scommettere su testa, e se esce vinciamo 2 volte la somma che abbiamo scommesso (ossia ci riprendiamo la somma scommessa e ne guadagnamo altrettanto), se esce croce perdiamo la somma scommessa. Si può vedere che la strategia ottima è questa: se \(x\leq 0,5\) scommettiamo \(x\), e se \(x\geq 0,5\) scommettiamo \((1-x)\). Qual è la probabilità \(f(x)\) di raggiungere 1 prima o poi? Chiaramente f(0)=0 in quanto abbiamo già perso e f(1)=1 in quanto abbiamo già vinto. Se \(x\leq 0,5\), scommettiamo \(x\), perdiamo con probabilità \((1-p)\) e in tal caso finiamo con 0 euro (e abbiamo perso definitivamente). Vinciamo con probabilità \(p\) e in tal caso finiamo con \(2x\) euro (e una probabilità \(f(2x)\) di vincere prima o poi). Quindi la nostra probabilità di arrivare a 1 euro prima o poi è \(f(x)=(1-p)f(0) + pf(2x) = pf(2x)\). Se \(x\geq 0,5\), scommettiamo \((1-x)\) perché ci basta per arrivare ad 1 euro. Vinciamo con probabilità \(p\), finendo con 1 euro (e abbiamo vinto definitivamente). Perdiamo con probabilità \((1-p)\), finendo con \((2x-1)\) euro. La nostra probabilità di avere un euro prima o poi è \(f(x)= p +(1-p)f(2x-1)\).

Ecco il grafico di \(f(x)\) per \(p = 0,25\).

Funzione di ripartizione del Bold Play.

Ed ecco un video del grafico di f mentre p varia fra 0,499 a 0,001.

Nel contesto del nostro problema queste funzioni f non sono f.d.r. Ma hanno tutti i requisiti per esserle quindi adesso le consideriamo come f.d.r.. Questo è forse più preoccupante del primo esempio. Anche qui la funzione è continua ed è derivabile quasi ovunque con derivata 0. Ma questa volta è anche strettamente crescente. Questa distribuzione mi sembra più inquietante di quella di Cantor. Come si calcolano la media e la varianza di questa distribuzione? Quella pagina citata prima di Stackexchange ci fornisce un metodo, ma usarlo concretamente sembra difficile. Ho disegnato i grafici per i due esempi usando programmi che uso per disegnare i frattali. Quindi un’altro modo per ottenere esempi di distribuzioni singolari potrebbe essere semplicemente di disegnare frattali che hanno le caratteristiche necessarie per essere f.d.r., specificamente facendo l’interpolazione frattale per creare delle funzioni non-decrescenti. Almeno su un intervallo limitato, questo dovrebbe fornire tanti esempi.

Sarei curioso di sapere cosa dicono i libri di testo di probabilità in Italia sulle distribuzioni singolari. Può non bastare cercare “singolari” nell’indice analitico in quanto gli eventuali riferimenti spesso non le nominano. Sebbene abbiamo almeno due modi per creare nuove distribuzioni singolari, sarei anche curioso di sapere se c’è un terzo esempio abbastanza naturale usato nei libri. Magari c’è anche un “Bulletin of Singular Distribution Studies”, ma mi sembra inverosimile.

Adam Atkinson

P.S.: Auguriamo ogni successo al terzo MathsJam italiano a Pavia per il suo primo incontro il 18 settembre. Informazioni su http://www.mathsjam.com/cities/pavia e per MathsJam in generale c’è l’articolo di MaddMaths! qui: http://maddmaths.simai.eu/divulgazione/mathsjam/. Ben vengano altri Jam italiani! Il Grande Jam annuale è a novembre: https://mathsjam.com/gathering/

Pin It

Note e riferimenti   [ + ]

1. N.B.: qualcuno usa “distribuzione singolare” per la distribuzione che prende un unico valore con probabilità 1. Come distribuzione questa sembra chiaramente discreta (la f.d.r. è discontinua), ma degenere. E secondo qualcuno tutte le distribuzioni discrete sono singolari in quanto le loro f.d.r. hanno derivata 0 tranne su un insieme di misura 0. Sembra più comune usare “singolare” quando la f.d.r. è continua e ha derivata 0 tranne su un insieme (non-numerabile) di misura 0. A quanto pare alcuni libri dicono “assolutamente continue” e “continue singolari” invece di “continue” e “singolari”, ma io finora non ho mai incontrato questi termini di persona. Magari perché ho guardato solo libri relativamente elementari.
this site uses the awesome footnotes Plugin