Numeri e modelli alimentano il calciomercato. La matematica dice ai club: i difensori fanno davvero la differenza. Ce ne parla Marco Menale.
Si sono conclusi i principali campionati e le competizioni calcistiche europee. Tra la novità della Coppa del mondo per club 2025 e le deprimenti vicende della Nazionale di calcio, è arrivato quel periodo dell’anno: il momento del calciomercato. Ciascuno seguendo la propria squadra spera nel colpo a effetto. Basta un titolo e si accende la speranza, anche perché in Italia si può spendere relativamente poco in confronto ad altri campionati come la Premier League. A entusiasmarci sono soprattutto gli acquisti dalla metà campo in su, più difficilmente succede con i difensori. Eppure, i modelli matematici suggeriscono qualcosa di diverso.
Da qualche anno il calcio è pieno di dati, numeri e matematica. Basti pensare alle app che usiamo piene di statistiche, come gli expected goals. Analogamente, la matematica riempie le panchine con data-analyst e consulenti a cercare la miglior tattica. Fino al calciomercato, con i famosi algoritmi che aiutano nella scelta dei profili migliori per una squadra, modulo il budget a disposizione. E tutto questo andrà aumentando negli anni avvenire con machine learning e intelligenza artificiale.
Torniamo ai colpi di mercato. Nell’articolo “A Skellam regression model for quantifying positional value in soccer”, Konstantinos Pelechrinis e Wayne Winston hanno quantificato in quale ruolo tendono più a fare la differenza i giocatori forti. Ossia, quali sono i ruoli che più contribuiscono alla vittoria. Il cuore del modello è la distribuzione di Skellam, una distribuzione che modella la differenza tra due variabili aleatorie indipendenti. Più in dettaglio, detta \lambda_1 la variabile dei gol segnati dalla squadra in casa e \lambda_2 quella dei goal subiti, allora la probabilità che la differenza reti Z sia esattamente k segue la distribuzione di Skellam
\displaystyle P(Z=k)=e^{-(\lambda_1+\lambda_2)}\left(\frac{\lambda_1}{\lambda_2}\right)^{\frac{k}{2}}I_k(2\sqrt{\lambda_1\lambda_2}),
dove I_k è una funzione di Bessel. In un certo senso, la P rappresenta la probabilità che una squadra vinca una partita.
Partendo dai dati dei principali campionati europei e dai rating dei giocatori, Pelechrinis e Winston hanno costruito un modello di regressione Skellam. Ogni partita è vista come un confronto tra le medie dei rating dei quattro ruoli in campo delle due squadre: portieri, difensori, centrocampisti e attaccanti. Il modello quantifica quanto un aumento nel rating medio di ciascun ruolo influenzi i parametri \lambda_1 e \lambda_2, e di conseguenza la probabilità di vincere. Si definisce così l’indicatore eLPAR, acronimo di expected League Points Above Replacement, cioè quanti punti in più una squadra si aspetta di guadagnare sostituendo un giocatore con uno più forte.
Qui arriva la sorpresa. Sebbene a entusiasmarci siano soprattutto i giocatori offensivi, dal modello eLPAR emerge che, a parità di rating, i difensori fanno più la differenza degli attaccanti. La linea difensiva ha un coefficiente più alto nel modello. Da un punto di vista modellistico, un difensore riduce \lambda_2, cioè i goal subiti, spostando la distribuzione di Skellam di più verso differenze reti positive, ossia rende più probabile la vittoria. C’è poi un aspetto più sottile. Essendo la difesa la linea che incide di più, un miglioramento anche piccolo in difesa ha un impatto maggiore sulla distribuzione Skellam e, quindi, sulla probabilità di vittoria. E in difesa ci sono più giocatori su cui poter intervenire. Infatti, è possibile vedere squadre con la linea difensiva a 5, mentre è molto improbabile vedere 5 attaccanti della stessa squadra (per buona pace di Oronzo Canà).
In definitiva, secondo questo modello un difensore forte impatta in media di più di un attaccante forte, sebbene l’entusiasmo intorno a loro sia minore se paragonato a chi gioca dalla metà campo in su. Anche se tutti vogliamo un Lamine Yamal in squadra, meglio non sbuffare al prossimo acquisto in difesa.