Oggi inizia il torneo di tennis di Wimbledon, che si chiuderà domenica 13 luglio. I tabelloni comprendono 128 giocatori nel torneo maschile e 128 giocatrici in quello femminile e molte persone vorrebbero sapere come andrà a finire. In questo articolo proviamo a spiegare i criteri con cui si possono provare a predire i risultati delle partite che si disputeranno nei prossimi giorni, e più in generale come fare delle classifiche che risultino utili per assegnare una probabilità di vittoria a un giocatore o a una giocatrice. Insomma, Roberto Natalini ci parla della matematica delle classifiche del tennis.
Inizia il torneo di Wimbledon. Nel torneo maschile c’è grande attesa per vedere se ci sarà una nuova finale epica tra Sinner e Alcaraz, ma chissà se Draper, Bublik o anche lo stesso Djokovic non riusciranno a mischiare le carte in tavola. Sul lato femminile la previsione è anche più difficile dopo i risultati degli ultimi due tornei dello Slam. Riuscirà Sabalenka a far valere la sua maggiore potenza, o sarà di nuova Gauff a spuntarla? Sarà finalmente il momento di Swiatek, che qui a Wimbledon non ha mai superato i quarti, o ci sarà spazio per una sopresa, magari ad opera della nostra Jasmine Paolini, finalista dello scorso anno?
Per rispondere a queste domande di solito ci si affida alle classifiche ufficiali delle due associazioni tennistiche principali: ATP per gli uomini e WTA per le donne. Chi ha la classifica più alta ci si aspetta che batta chi ha quella più bassa. Però noi, da matematici, possiamo chiederci quanto le due classifiche, quella maschile e quella femminile, siano attendibili. Sulla base di quali criteri vengono compilate? Quanto tengono conto dei dati storici e dello stato di forma attuale dei giocatori e delle giocatrici?
Dal 1973 queste classifiche si basano sui tornei giocati nelle ultime 52 settimane. Per ogni torneo e ogni turno all’interno del torneo, un giocatore o una giocatrice riceve un certo numero di punti per ogni partita che vince. Il numero di punti a partita varia a seconda del turno in cui viene giocata la partita (le prime partite danno meno punti, più si va avanti e più danno punti), e soprattutto dell’importanza del torneo. Se vincere una partita al primo turno maschile di Wimbledon dà 50 punti, i punti sono solo 8 per un primo turno di un torneo di Challenger 125. La vittoria di uno dei tornei dello Slam (Australian Open, Roland Garros, Wimbledon, US Open) dà 2000 punti, la vittoria di un torneo ATP 250 ne dà, appunto, solo 250. Quindi battere Sinner al primo o al terzo turno di un torneo non dà lo stesso numero di punti.

Classifiche ufficiali WTA (a sinistra) e ATP (a destra) per le prime dieci posizioni, aggiornate al 29 giugno 2025
Dopo 52 settimane i punti guadagnati si perdono, ma durante tale periodo non diminuiscono la loro influenza e questo a volte può falsare la classifica. Lo stato attuale di forma di un giocatore o una giocatrice può essere solo vagamente correlato alle sue prestazioni di un anno fa. Inoltre, la classifica, o il numero di punti guadagnati, non ci dicono molto sulla probabilità di vincere un singolo incontro.
Certo, probabilmente un o una tennista con un ranking alto batterà quella con il ranking basso, ma come lo scarto influisca sulla probabilità di vittoria non è chiaro. La differenza tra due tenniste è influenzata dalla loro posizione relativa in classifica o solo dalla differenza dei punti guadagnati? Se guardiamo per esempio la classifica ATP, potremmo pensare dalla posizione di classifica che la differenza tra Sinner e Draper sia la stessa che c’è tra lo stesso Draper e Musetti. Ma poi vediamo che Sinner ha oltre il doppio dei punti di Draper, mentre la distanza tra Draper e Musetti nei punti è di circa il 10%. Cosa se ne deduce a livello quantitativo? E poi come si spiega il fatto che Alcaraz abbia battuto Sinner negli ultimi cinque incontri e nonostante questo, e lo stop forzato di tre mesi di Sinner per sospensione, Sinner sia avanti in classifica di oltre 1000 punti?
Creare una classifica
Insomma, abbiamo una variabile nascosta che vorremmo misurare, che è quella che potremmo chiamare la “forza intrinseca” di un o una tennista in un dato momento, e il dato a cui affidarci sono solo le partite giocate, che però spesso sono solo un piccolo sottoinsieme delle partite possibili. Un modo rapido per risolvere il problema potrebbe essere quello di guardare alle quote dei siti di scommesse, che spesso però sono influenzate da fattori extra-sportivi. Le quote infatti sono calcolate in base alle giocate degli scommettitori e fattori come la nazionalità o la simpatia dei giocatori e delle giocatrici possono influenzare le previsioni. Attualmente le quote di un noto sito di scommesse per il torneo maschile sono le seguenti. “Alcaraz C. 2.25; Sinner J., 2.50; Djokovic N. 6.50; Draper J. 10.00: Bublik A. 15.00; Berrettini M. 25.00”. Ossia in questo scenario Alcaraz avrebbe il 44% di probabilità di vincere, Sinner il 40, Djokovic solo il 15. In pratica è come affidarsi a un sondaggio. In questo articolo vogliamo invece esplorare la possibilità di tenere conto di tutti i dati in nostro possesso per formulare una previsione basata sulle partite giocate che dia allo stesso tempo la possibilità di assegnare una probabilità di vittoria per ogni incontro anche con giocatori e giocatrici che non si sono mai incontrati e un punteggio assoluto che permetta di fare una classifica.
L’Elo Rating
Il metodo più usato per fare questo tipo di confronti è l’Elo rating, che è un metodo per calcolare la bravura di un “player” in un gioco a somma zero, come può essere una partita di tennis. È stato proposto per la prima volta per le classifiche scacchistiche a partire dal 1960 da Arpad Elo[1 ] Arpad E. Elo, (August 1967). “The Proposed USCF Rating System, Its Development, Theory, and Applications”, Chess Life. XXII (8): 242–247. https://uscf1-nyc1.aodhosting.com/CL-AND-CR-ALL/CL-ALL/1960/1960_03_1.pdf, Guarda anche Elo, A.E., 1978. The rating of chessplayers, past and present. Arco Pub, professore di fisica e maestro di scacchi, e poi usato in tanti altri ambiti dal calcio al baseball, ai videogiochi, e più recentemente anche per valutare i Large language models.
In sintesi l’idea principale è semplice: a ogni giocatrice è assegnata una valutazione, l’Elo rating, che dovrebbe sintetizzare la sua “forza tennistica”, e vogliamo che la differenza di punteggio tra due giocatrici dia una stima affidabile del risultato della partita tra di loro. Inoltre, ed è l’idea numero due, l’Elo rating cambia a ogni partita. La tennista che vince guadagna punti e quella che è sconfitta li perde, ma la quantità di punti persi o guadagnati dipenderà dalla forza relativa delle tenniste coinvolte. Insomma, il sistema si auto-aggiusta e se una tennista è troppo in alto in classifica rispetto al suo valore intrinseco, rapidamente perderà punti, mentre se è troppo in basso, risalirà, cercando di arrivare a riflettere la sua forza intrinseca. Per il tennis questa idea è stata implementata da Jeff Sackmann nel suo sito Tennis Abstract che, se siete appassionati di tennis e di dati, è una specie di miniera d’oro. Oltre a riportare tutte le statistiche possibili sul tennis, calcola le classifiche femminili e maschili secondo l’Elo rating (le trovate subito sotto) e simula il risultato dei diversi tornei, fornendo previsioni estremamente dettagliate su ogni partita. Per esempio sul suo sito trovate le previsioni per Wimbledon 2025 maschile e femminile, basate proprio sull’Elo rating e simulazioni probabilistiche che ne tengono conto.

Classifica Elo della WTA (top 10) , aggiornata al 23 giugno 2025 (cliccare per andare alla pagina con la classifica attuale). Le colonne hElo, cElo, gElo, riportano i punteggi rispettivamente su cemento, terra ed erba (sono un mix tra i risultati specifici e quelli assoluti), il Peak Elo è il massimo punteggio Elo raggiunto da una giocatrice nella sua carriera, e in ultimo il WTA ranking attuale.

Classifica Elo della ATP (top 10), aggiornata al 23 giugno 2025 (cliccare per andare alla pagina con la classifica attuale). Le colonne hElo, cElo, gElo, riportano i punteggi rispettivamente su cemento, terra ed erba (sono un mix tra i risultati specifici e quelli assoluti), il Peak Elo è il massimo punteggio Elo raggiunto da un giocatore nella sua carriera, e in ultimo l’ATP ranking attuale.
Cerchiamo di capire meglio come funziona l’Elo rating supponendo di avere soltanto due giocatrici che chiamiamo \(i\) e \(j\). Sia \(R^n_i\) la valutazione della giocatrice \(i\) al tempo \(t_n\). All’inizio una giocatrice entra con 1500 punti, ma specie se inizia da tornei minori spesso le vengono assegnati solo 1200 punti. Questi valori sono solo orientativi e vanno presi con cautela nelle prime partite, poi rapidamente si stabilizzano e diventano più affidabili. Dopo ogni incontro il rating di \(i\) viene aggiornato nel modo seguente
$$ \large R^{n+1}_i=R^n_i+K \times\left( S^n_{ij} – E^n_{ij} \right)$$
In questa formula \(S^n_{ij}\) è il risultato dell’incontro, che vale 1 se vince \(i\) e 0 se vince \(j\). Per gli altri due simboli, \(K\) e \(E^n_{ij}\) dobbiamo prenderci un attimo di tempo. Partiamo dal secondo, che è l’ingrediente principale del modello, ossia il risultato atteso o probabilità di vittoria, basato sulla valutazione precedente delle due giocatrici. Questo termine è una funzione modellata usando la curva logistica in base 10:
$$\large E^n_{ij}=\frac{1}{1+10^{(R^n_j-R^n_i)/400}}$$
di cui riproduciamo il grafico in funzione della differenza tra le due valutazioni:

Funzione logistica usata nell’Elo rating
Ovviamente il numero 400 è un numero puramente convenzionale, ma con questa formula abbiamo che se c’è uno scarto di 100 punti tra le giocatrici, la probabilità di vittoria di \(i\) rispetto a \(j\) è del 64%, se lo scarto è di 200 punti, la probabiità sale al 76% e se è di 400 punti, allora è esattamente 10 volte di più di quella dell’avversaria, 90,90% contro 9,09%. Ci sono stati tentativi usando altre funzioni (per esempio una distribuzione gaussiana) e diversi parametri, ma questa formula per ora è quella che ha dato i risultati migliori in termini di predittività.
Infine abbiamo il parametro \(K\), che è un po’ l’ultima rotella da sistemare, che modelizza quanto una singola partita influisca sulla valutazione complessiva della giocatrice. È importante che questa influenza sia non troppo marcata. Se una giocatrice esperta e molto forte perde una partita con una giocatrice meno brava, non è che immediatamente cambiamo le nostre aspettative su di lei. Per questo negli scacchi il valore di \(K\) è uguale a 16 per i maestri e le maestre e 32 per il resto dei giocatori e delle giocatrici. Per il tennis questo parametro non è esplicitato da Sackmann nel suo articolo di riferimento, ma in questo codice in R, il valore di K è specifico per ogni giocatrice ed è uguale a
$$ K(i)= \frac{250}{ (\text{numero partite di } i + 5)^{0,4}}$$
ossia un valore molto alto per le persone nuove arrivate, che rapidamente scende sotto il valore di 40. Per un giocatore come Sinner, che ha giocato 376 partite e ha un rating sopra ai 2000 punti, abbiamo \(K=23\), per cui una vittoria o una sconfitta modifica il suo punteggio circa dell’1%.
Quindi, ricapitolando, una giocatrice inizia a giocare a livello professionistico con un punteggio di 1200. GIoca un certo numero di partite, almeno 10 a livello di tour, qualificazioni comprese, challenger o ITF nelle ultime 52 settimane, e almeno in teoria il suo Elo rating si stabilizza fino a rappresentare la sua forza relativa rispetto al resto delle giocatrici. Tipicamente sopra a 2000 punti ci sono i campioni e le campionesse, mentre il fondo della classifica è intorno ai 1000/1100 punti.
Qualche osservazione veloce
- Poiché la maggior parte delle partite si gioca su cemento, per avere un numero sufficienti di partite i punteggi specifici su una data superficie (cemento, terra o erba) sono una media al 50% dei punteggi generali e di quelli su quella superficie.
- L’Elo rating non dipende dai punti fatti in partita, dal numero dei set o dei games vinti o persi. Però c’è una correzione (vedi qui) per le partite al meglio dei 5 set (che sono solo maschili), situazione che avvantaggia il giocatore più forte.
- Se una giocatrice è stata assente per infortuni o altri motivi per più di 8 settimane (per esempio, la recente assenza di Sinner dovuta alla sospensione), il suo rating scende di 100 punti e ancora di più se l’assenza si prolunga, vedi l’articolo di Sackmann Handling Injuries and Absences With Tennis Elo.
- Potrebbe sembrare che l’Elo rating permetta di confrontare epoche diverse di uno sport, dando delle misure assolute del valore delle giocatrici. Questo è sbagliato per almeno due motivi. Il primo è che alla fine si tratta di transazioni di punti tra giocatrici, e quindi l’insieme di riferimento cambia nel tempo. Il secondo è che il numero di punti totali non è stazionario. Ogni volta che entrano nuove persone in classifica o escono i punti aumentano o diminuiscono. Questo altera i valori assoluti dei punteggi.
- Stiamo ignorando tante altre classifiche significative come la race, che tiene conto solo dei risultati dell’anno solare, la year Elo, che considera l’Elo rating con i risultati dell’anno solare. Ma va bene, sono dettagli.
Ma questo Elo rating dà matematicamente una stima della forza tennistica intrinseca ?
Ecco, questo è un problema matematicamente avanzato. Per il caso in cui si suppone che la forza intrinseca di una giocatrice sia costante, questo problema è stato affrontato nell’articolo del 2015 di Pierre-Emmanuel Jabin e Stéphane Junca[2 ]Jabin, Pierre-Emmanuel; Junca, Stéphane, A continuous model for ratings. SIAM J. Appl. Math. 75, No. 2, 420-442 (2015).. Gli autori suppongono che ogni giocatrice \(i\) abbia una forza intrinseca costante, ma sconosciuta, \(\rho_i\) e un rating \(R_i\) dato dal modello Elo. Supponendo di avere un numero molto altro di partecipanti (nel tennis possono essere circa 500, ma nei giochi online possono essere migliaia), dimostrano che con il passare del tempo il rating approssima la forza intrinseca a meno di una costante che è la stessa per tutte le partecipanti che fanno parte dello stesso insieme connesso (condividono un certo numero di partite). Questo risultato è tecnicamente abbastanza avanzato, c’è un modello cinetico e un limite di campo medio, ed è stato generalizzato al caso di forza variabile in un articolo del 2024 di Bertram Düring, Josephine Evans, e Marie-Therese Wolfram[3 ]Düring, Bertram; Evans, Josephine; Wolfram, Marie-Therese Steady states of an Elo-type rating model for players of varying strength. Kinet. Relat. Models 17, No. 2, 209-233 (2024)..
Ma questo Elo rating funziona?
La motivazione per considerare l’Elo rating è che funziona meglio delle classifiche ufficiali. Ma è proprio vero?
Non è facile confrontare diversi sistemi di valutazione, un po’ come le previsioni meteorologiche. Si parla di eventi irripetibili e inconfrontabili. Ogni partita, così come ogni situazione meteorologica, fa storia a sé. Alla fine c’è una giocatrice che vince e una che perde, cosa cambia se quella che vince aveva il 72% o il 54% di probabilità di vincere? Però insomma, a un certo punto vorremmo sapere se, con tutti questi dati a nostra disposizione, riusciamo a fornire una previsione sensata o meno. Un modo semplice per confrontare i sistemi di valutazione è una metrica chiamata “accuratezza della previsione”, che banalmente conta il numero di previsioni corrette. Una metrica migliore è però il Brier score, che guarda allo scarto quadratico medio delle previsioni:
Brier score\(=\frac{1}{N} \sum_{i=1}^N (\text{prob. vince } i \ – \text{ esito})^2\)
dove la somma è presa su un certo numero di partite e l’esito può valere 1 se vince \(i\), 0 se perde. Per esempio, prendiamo l’Elo rating su erba di Sinner e Nardi che giocheranno domani (1 luglio). Sinner ha un rating di 1955,8, mentre Nardi è a 1478. Questo implica una probabilità di vittoria di Sinner del 94% [4 ]97,7% secondo Tennis abstract . Il Brier score di questa partita sarà 0,88 se Sinner perde e 0,003 se vince. Insomma, il Brier score premia le previsioni aggressive che si rivelano corrette, ma poiché usa la distanza quadratica, punisce severamente le previsioni aggressive ma sbagliate.
Un modo più intuitivo per capire cosa misura il punteggio di Brier è immaginare che Sinner e Nardi giochino 100 partite di fila. (O, più accuratamente ma meno intuitivamente, immaginare che 100 Sinner identici giochino simultaneamente contro 100 Nardi identici.) Una previsione dell’94% significa che ci aspettiamo che Sinner vinca 93 o 94 partite. Se Sinner ne vince 98 o 99, la previsione non era abbastanza favorevole a Jannik. Non avremo mai 100 partite simultanee come queste, ma abbiamo migliaia di partite individuali, molte delle quali condividono le stesse previsioni, come una probabilità del 94% che vinca il favorito. Il punteggio di Brier aggrega tutte queste coppie previsione-risultato e restituisce un numero che ci dice come stiamo andando.
Avrete capito che i matematici sono persone pignole (o forse solo molto ansiose) e vogliono veramente sapere quale dei vari sistemi di predizione sia migliore. Quindi per finire vi rimandiamo allo studio di Williams Vaughan, Chunping Liu, Lerato Dixon e Hannah Gerrard del 2021 How well do Elo-based ratings predict professional tennis matches?[5 ]Vaughan Williams, Leighton, Liu, Chunping, Dixon, Lerato and Gerrard, Hannah. “How well do Elo-based ratings predict professional tennis matches?” Journal of Quantitative Analysis in Sports, vol. 17, no. 2, 2021, pp. 91-105. https://doi.org/10.1515/jqas-2019-0110 che hanno confrontato le previsioni delle scommesse, vari metodi Elo (pesati in modo diverso) e le classifiche ufficiali usando cinque metriche diverse, tra cui l’accuratezza della previsione e il Brier Score usando i dati di Wimbledon 2018 e 2019, Roland Garros 2019, US Open 2019, Australian Open 2020. Chiaramente le previsioni delle scommesse sono molto accurate (utilizzano dati in tempo reale), ma abbastanza equivalenti all’Elo rating standard o pesato, mentre le classifiche ufficiali forniscono previsioni abbastanza scadenti quando confrontabili.

Confronto tra vari sistemi di predizione per Wimbledon 2018 and 2019. Da: Vaughan Williams, Leighton, Liu, Chunping, Dixon, Lerato and Gerrard, Hannah. “How well do Elo-based ratings predict professional tennis matches?” Journal of Quantitative Analysis in Sports, vol. 17, no. 2, 2021, pp. 91-105
Conclusioni
Da sempre l’umanità ha cercato di prevedere il futuro. Abbiamo guardato viscere di volatili e lanciato astragali per cercare di sapere cosa ci aspettava nei momenti di incertezza. Il campo sportivo poi è un mondo a parte, da sempre le persone che scommettono sarebbero molto contente di potere avere anche solo limitati poteri di predizione del futuro, a volte appena di poche ore. E infatti il secondo film di “Ritorno al Futuro” gira tutto intorno a un mitico almanacco di risultati sportivi che permettevano, a chi ne fosse entrato in possesso, di vincere un sacco di soldi scommettendo senza rischiare.

Marty McFly (Michael J. Fox) con il Gray’s Sports Almanac in Ritorno al Futuro, parte II (1989). (Grazie a Telegrammi di tennis per questo suggerimento)
Ma bisogna tenere sempre conto che In ogni modo è difficile prevedere il risultato delle singole partite di tennis (e dei singoli eventi sportivi in generale). Qualsiasi sistema, per quanto sofisticato, sbaglierà molto spesso (intorno al 30% dei casi, che insomma, non è poco). In molti casi, la previsione “corretta” è quasi equivalente a “nessuna previsione”, come nel caso della finale del Roland Garros 2025. Eppure, niente ci impedirà di continuare a provare, forse solo come una forma di illusione di controllo su un aspetto molto secondario delle nostre vite. Non abbiamo strumenti affidabili per prevedere se l’umanità sopravviverà a questo secolo, o anche solo se una bomba atomica sarà fatta esplodere nei prossimi mesi, ma una cosa più modesta come azzeccare il vincitore di Wimbledon 2025 potrebbe darci molta soddisfazione.
Roberto Natalini
Immagine di copertina generata con intelligenza artificiale · 28 giugno 2025 alle ore 18:38
Note e riferimenti
⇧1 | Arpad E. Elo, (August 1967). “The Proposed USCF Rating System, Its Development, Theory, and Applications”, Chess Life. XXII (8): 242–247. https://uscf1-nyc1.aodhosting.com/CL-AND-CR-ALL/CL-ALL/1960/1960_03_1.pdf, Guarda anche Elo, A.E., 1978. The rating of chessplayers, past and present. Arco Pub |
---|---|
⇧2 | Jabin, Pierre-Emmanuel; Junca, Stéphane, A continuous model for ratings. SIAM J. Appl. Math. 75, No. 2, 420-442 (2015). |
⇧3 | Düring, Bertram; Evans, Josephine; Wolfram, Marie-Therese Steady states of an Elo-type rating model for players of varying strength. Kinet. Relat. Models 17, No. 2, 209-233 (2024). |
⇧4 | 97,7% secondo Tennis abstract |
⇧5 | Vaughan Williams, Leighton, Liu, Chunping, Dixon, Lerato and Gerrard, Hannah. “How well do Elo-based ratings predict professional tennis matches?” Journal of Quantitative Analysis in Sports, vol. 17, no. 2, 2021, pp. 91-105. https://doi.org/10.1515/jqas-2019-0110 |