Nuove scoperte in teoria dei numeri portano a chiederci: finiranno mai di stupirci i numeri primi? Alessandro Zaccagnini prova a rispondere a questa domanda.
Finiranno mai di stupirci i numeri primi?
Parliamo di un nuovo fenomeno, scoperto recentemente, che ha qualche somiglianza con un problema posto dal matematico Pafnuty Chebyshev nella seconda metà del XIX secolo, e noto come “Chebyshev bias.” La parola bias è entrata a far parte del gergo tecnico della matematica e la possiamo tradurre, con qualche libertà, con propensione, inclinazione, tendenza o pregiudizio.
In che senso, dunque, i numeri primi hanno una propensione o un pregiudizio? Eliminiamo dalla nostra considerazione i numeri primi 2 e 5 (cioè i fattori primi di 10) e classifichiamo tutti gli altri in base alla loro ultima cifra, che è 1, 3, 7, o 9. Alla fine del XIX secolo, Charles Jacques de la Vallée Poussin, subito dopo aver dimostrato il Teorema dei Numeri Primi simultaneamente a Jacques Hadamard, ma in modo del tutto indipendente, portando cosí a termine il “programma” di Riemann, dimostrò che i numeri primi che stiamo trattando si suddividono in modo sostanzialmente equo fra le 4 classi nominate sopra. In altre parole, da questo punto di vista i numeri primi non hanno preferenze: la loro ultima cifra appare distribuita uniformemente fra le 4 possibilità. Lo stesso accade, molto piú in generale, se si considerano le “progressioni aritmetiche di ragione \(q\),” ma qui ci limitiamo al caso in cui \(q = 10\).
Chebyshev, però, aveva notato già qualche anno prima un curioso fenomeno che possiamo descrivere usando la metafora delle “corse” dei numeri primi. Abbiamo 4 “cavalli,” indicati dai numeri 1, 3, 7, 9. Quando la gara comincia i cavalli sono appaiati. All’istante numero \(n\) facciamo avanzare di una posizione il cavallo 1 se \(n\) è un numero primo che termina con 1; analogamente, faremo avanzare il cavallo 3 se \(n\) è un numero primo che termina con 3 e cosí via. Dopo 10 “secondi,” diciamo, i cavalli 1 e 9 sono ancora al palo, mentre i cavalli 3 e 7 sono avanzati di una posizione, perché i numeri 3 e 7 sono primi. Dopo 20 secondi le posizioni saranno rispettivamente 1, 2, 2, 1.
A 100 secondi dall’inizio della gara, il cavallo 1 ha raggiunto la posizione 5, il cavallo 3 ha raggiunto la posizione 7, il cavallo 7 la 6, il 9 la 5. Questo perché fra i numeri primi fino a 100 ce ne sono 5 che hanno come ultima cifra 1 (11, 31, 41, 61, 71), 7 che hanno come ultima cifra 3 (3, 13, 23, 43, 53, 73, 83), 6 che hanno come ultima cifra 7 (7, 17, 37, 47, 67, 97) ed infine 5 che hanno come ultima cifra 9 (19, 29, 59, 79, 89).
Ci si può dunque chiedere se, lasciando correre questi cavalli, possa accadere che uno prenda il largo e, da un certo punto in poi, stia davanti a tutti gli altri. Nel 1914 John Littlewood ha dimostrato che questo non succede: scelto un qualsiasi intero nell’insieme 1, 3, 7, 9, il relativo cavallo sta davanti agli altri per un’infinità di istanti, come ci si potrebbe aspettare se i numeri primi fossero distribuiti completamente a caso, ma in modo equo, fra le 4 classi.
Dov’è, allora, la preferenza, il pregiudizio, notato da Chebyshev?
Il punto è che di solito certi cavalli tendono a precedere altri cavalli: nel nostro caso, i cavalli numero 3 e 7 si trovano davanti ai cavalli numero 1 e 9 per la maggioranza degli istanti. (Caveat: questo è vero in media, in un senso molto tecnico del termine, che qui ci asteniamo dal definire con precisione; contare è sempre una cosa difficile e in questo caso particolare il “conteggio” richiede una definizione piuttosto bizzarra). Abbiamo appena detto che la corsa non ha un vincitore, ma di solito i “cavalli” associati ad alcuni primi tendono a stare davanti, anche se solo per un’incollatura, o poco di piú. Nessuno vince, nessuno riesce a staccare definitivamente gli altri. D’altra parte, se fosse possibile fare una scommessa su chi sta davanti ad un certo istante, questa sarebbe molto vantaggiosa: per esempio, il cavallo numero 7 tende a precedere il cavallo numero 1, anche se talvolta, rarissimamente, deve lasciargli per un breve tempo la testa della corsa; poi, però, lo supera di nuovo per lunghissimo tempo, ma non per sempre.
I numeri primi “preferiscono” o “privilegiano” certe classi di resto a scapito delle altre, ma questa preferenza è decisamente blanda, per quanto visibile. Quantitativamente, ripetiamo, si tratta di una corsa che possiamo definire “testa a testa.” Le classi meno preferite dai numeri primi sono quelle dei residui quadratici, cioè quelle che contengono i quadrati perfetti: nella consueta notazione decimale, sappiamo che i quadrati perfetti terminano con 0, 1, 4, 5, 6 o 9 mentre non terminano con 2, 3, 7, 8. Dato che stiamo parlando di numeri primi le classi “preferite” sono 3 e 7, quelle meno preferite 1 e 9. Se scrivessimo i numeri in base 4, ci sarebbe familiare il fatto che nessun quadrato perfetto termina con 3, cioè dà resto 3 se diviso per 4. È questo il caso studiato in origine da Chebyshev.
Come dicevamo sopra, questo fenomeno è ben noto: osservato da Chebyshev alla fine del XIX secolo, è stato ripreso da numerosi autori tra cui Knapowski & Turán nel 1977, e recentemente Fiorilli & Martin, e numerosi altri matematici, e ha trovato una spiegazione euristica soddisfacente.
Qualche giorno fa è emerso un nuovo fenomeno, piuttosto sconcertante e inatteso, rivelato in un articolo pubblicato da R. Lemke Oliver & K. Soundararajan, e in apparente contraddizione con il “Chebyshev bias”! Questi autori hanno studiato la frequenza con cui, per esempio, un numero primo che termina con la cifra 1 ha come successore, fra i numeri primi, un numero che termina con la cifra 7. Questo accade la prima volta con i numeri 31 e 37. Per continuare con la nostra metafora, ora consideriamo coppie di cavalli, facendo attenzione al fatto che, per esempio, la coppia (1, 7) è diversa dalla coppia (7, 1); quest’ultima, infatti corrisponde all’evento in cui un numero primo che termina con 7 è seguito da un numero primo che termina con 1, come nel caso dei numeri 7 ed 11. Inoltre, è necessario tenere presente anche il caso in cui due numeri primi consecutivi terminano con la stessa cifra, come 139 e 149. In definitiva, dobbiamo considerare 16 di queste “coppie” di cavalli, poiché abbiamo 4 scelte per il primo e 4 scelte indipendenti per il secondo. (Qui la metafora ippica mostra la corda: non solo fa differenza mettere un cavallo a destra o a sinistra, ma addirittura possiamo “appaiare” due volte lo stesso cavallo, cioè fargli fare coppia con una copia di sé stesso!)
A prima vista, le coppie dovrebbero essere ugualmente rappresentate e, in analogia con quello che succede nel problema di Chebyshev, se le facciamo “correre” una contro l’altra, ci aspetteremmo che ciascuna sia in testa infinite volte, magari di poco come detto sopra.
E invece no: alcune “coppie” sono sfavorite, in modo piuttosto marcato. Questa corsa non è un testa a testa, ma ci sono differenze importanti! Per esempio, fra i primi 100 milioni di numeri primi, ce ne sono quasi 8 che terminano con 9 e sono seguiti da un numero primo che termina con 1, mentre ce ne sono “solo” 4 milioni e mezzo che terminano con 7 e sono seguiti da un altro primo che termina con 7. Alcune coppie sembrano prendere il largo e la distanza dalle inseguitrici sembra aumentare.
Per poter essere un po’ piú precisi, associamo a ciascuna delle 16 coppie la funzione che dà la corrispondente “posizione” ad un certo istante, \(n\) “secondi” dopo l’inizio della gara. È importante sottolineare un fatto, apparentemente contraddittorio: il rapporto tra due qualunque di queste funzioni tende ad 1, ma la loro differenza, in qualche caso, tende ad infinito; per esempio, la coppia (9, 1) da un certo punto in poi sta davanti alla coppia (7, 7) e la distanza tende ad aumentare. Un semplice esempio concreto in cui si manifesta un fenomeno simile è quello delle funzioni \(f(x) = x^2 + x\) e \(g(x) = x^2 – x\); si vede facilmente che il rapporto tende ad 1, quando \(x\) tende ad infinito, ma la differenza fra le due funzioni aumenta senza limite. In un linguaggio un po’ piú tecnico, possiamo dire che, al “primo ordine,” \(f\) e \(g\) si possono considerare equivalenti, ma non lo sono piú se consideriamo i termini successivi. Questo è un problema generale che si presenta ovunque in matematica, ed è, genericamente, il problema dell’approssimazione: data una funzione “complicata” (come la funzione esponenziale, logaritmo o una qualsiasi funzione trigonometrica) trovarne una piú semplice (per esempio, un polinomio) che conservi alcune proprietà della prima funzione. I campi della matematica pura e soprattutto applicata dove si usano approssimazioni sono troppo numerosi per essere elencati.
Il risultato principale dell’articolo di Lemke Oliver & Soundararajan è appunto questo: se consideriamo le 16 funzioni che danno la posizione delle coppie di numeri primi, il primo termine del loro sviluppo è esattamente lo stesso per tutte. Questo è quanto previsto in base a considerazioni statistiche, perché non ci sono motivi di preferenza, ed è quello che succede sia nel Teorema dei Numeri Primi nelle Progressioni Aritmetiche dimostrato da de la Vallée Poussin, sia nel Problema di Chebyshev.
Le cose, però cambiano radicalmente se si spinge l’analisi un passo avanti: Lemke Oliver & Soundararajan hanno infatti individuato un secondo termine (ed anche un terzo, per dirla tutta) che è appena piú piccolo del primo ed ha un segno che dipende dalla particolare coppia scelta. Semplificando molto, possiamo dire che per alcune coppie la corrispondente funzione ha un andamento del tipo \(f(x)\), per le altre del tipo \(g(x)\). Questo permette di confrontare le “posizioni” relative delle varie coppie di cavalli, concludendo che alcune di queste prendono il largo e lasciano molto indietro le altre. L’analisi dettagliata di queste formule permette di concludere che le coppie (1, 1), (3, 3), (7, 7), (9, 9) sono visibilmente sfavorite rispetto alle altre, perché sono tutte del tipo \(g(x)\), per cosí dire.
Questo “secondo termine” con un segno ben definito non ha una controparte nel problema di Chebyshev, e quindi ora sappiamo perché c’è questa notevole differenza nei risultati osservati.
Per completezza, dobbiamo aggiungere che Lemke Oliver & Soundararajan non hanno dato una spiegazione completa del fenomeno, ma lo hanno collegato con una famosa congettura, enunciata da Hardy & Littlewood negli anni 20 del XX secolo e che generalizza il concetto di “primi gemelli” di cui abbiamo già parlato su queste pagine. In definitiva, il principio di Hardy & Littlewood è semplice: quando si tratta di numeri primi, tutto ciò che non è vietato, succede infinite volte e con una frequenza prevedibile.
Per esempio, è vietato da considerazioni di parità che due interi consecutivi siano entrambi primi (e infatti questo accade una sola volta, con il numero primo 2 che è piuttosto speciale), ma non è vietato che due numeri dispari consecutivi siano entrambi primi, e questo, con ogni probabilità, accade infinite volte. Il mio esempio preferito, come ho già scritto, è quello dei numeri primi come 11, 13, 17, 19; uno schema analogo si ripete di nuovo: 101, 103, 107, 109; e ancora di nuovo: 191, 193, 197, 199. Si ripete infinite volte? Probabilmente sí.
Hardy & Littlewood hanno fornito una versione quantitativa forte della loro congettura, dando una formula che permette di “predire” quante sono le quaterne di numeri primi che seguono lo schema qui sopra, se le contiamo fino ad un numero \(N\) molto grande. Si tratta in effetti di un’infinità di formule diverse, una per ciascuno degli schemi che risultano “ammissibili,” cioè non vietati da considerazioni relative alla divisibilità. Partendo da queste formule, in una versione sufficientemente precisa, Lemke Oliver & Soundararajan sono riusciti a dare una spiegazione plausibile del fenomeno osservato, anche negli aspetti che, ad un’analisi superficiale, apparivano piú contraddittori.
Ora dunque sappiamo, anche se in forma di congettura, che le corse delle coppie di numeri primi hanno un comportamento diverso rispetto ai numeri primi presi singolarmente. Naturalmente un procedimento di questa natura può lasciare piuttosto perplessi: che senso ha “giustificare” una Congettura usandone un’altra? Il punto è che non tutte le congetture sono uguali: sapere che alcune di queste (quella di Hardy & Littlewood citata sopra e la famosissima Congettura di Riemann di cui abbiamo parlato recentemente qui) ne implicano altre, di minore importanza, mostra la struttura profonda dei numeri primi e stimola nuove ricerche volte alla loro dimostrazione. Per sottolineare che non tutte le congetture nascono uguali, Sir Peter Swinnerton-Dyer dice che quella di Riemann è una congettura che qualunque gentiluomo può fare!
In conclusione, la risposta alla domanda retorica con cui ho cominciato è sicuramente, e fortunatamente, no!
Alessandro Zaccagnini
Spunti per letture ulteriori e approfondimenti
L’articolo di Robert J. Lemke Oliver & Kannan Soundararajan “Unexpected biases in the distribution of consecutive primes” si trova qui http://arxiv.org/abs/1603.03720. Un’intervista commentata ai due autori, curata da Evelyn Lamb, si trova in “Peculiar pattern found in “random” prime numbers“; Terence Tao spiega e commenta il risultato nel suo blog. Si tratta di un articolo che presuppone conoscenze avanzate sulla distribuzione dei numeri primi.
Gli articoli di Andrew Granville & Greg Martin “Prime number races”, Amer. Math. Monthly , 113(1):1–33, 2006, e quello di Daniel Fiorilli & Greg Martin “Inequities in the Shanks-Rényi prime number race: an asymptotic formula for the densities”, J. reine angew. Math. 676:121–212, 2013, discutono, a livelli diversi, il problema del “Chebyshev bias.” I miei articoli precedenti su MaddMaths! sono, rispettivamente “Il cerchio si stringe intorno ai primi gemelli” e “Una versione elementare della Congettura di Riemann“.