Gennaio è il mese del calciomercato. Le scelte dei procuratori sono sempre più influenzate dai dati e dalla matematica. Ce ne parla Marco Menale.
Con il brindisi di inizio anno comincia anche il calciomercato di riparazione, come si dice in gergo giornalistico. Per infortuni, carenza di organico o i Dani Olmo della situazione, le società sono in movimento. La matematica e i suoi modelli, attraverso le tecnologie, non hanno solo cambiato il modo di analizzare le partite, ad esempio con gli xG. Ma anche le scelte di mercato e le valutazioni dei procuratori passano per formule, dati e statistiche.
Di matematica nel calciomercato c’è la regressione lineare multipla, MLR (dall’inglese Multiple Linear Regression). La MLR è una tecnica statistica per analizzare le (eventuali) relazioni tra una variabile dipendente e più variabili indipendenti. Questo metodo consente di comprendere come diverse variabili influenzino un risultato specifico. Fornisce previsioni e analisi approfondite in vari campi, tra cui l’economia, le scienze sociali e le scienze naturali. E nel calciomercato. Uno studio ha applicato la MLR per stimare i valori di mercato di alcuni calciatori, considerando fattori fisici e performance nella stagione 2017-2018. I risultati hanno evidenziato come variabili come l’età e le prestazioni sul campo influenzino questi valori.
Applichiamo la MLR a un caso di mercato.
Supponiamo di valutare l’acquisto di uno tra due i attaccanti, Giocatore A e Giocatore B. Le loro statistiche annuali, le variabili indipendenti del modello, sono:
A prima vista, il Giocatore A sembra più affidabile: maggiore esperienza con i suoi 30 anni e più gol segnati.
Applichiamo la MLR. A ciascuna delle variabili è assegnato un peso, ottenuto con tecniche di machine learning sulle serie storiche:
- Età \(-0,5\), ossia più il giocatore è giovane, maggiore è il suo potenziale e, di conseguenza, meno è penalizzato;
- Gol segnati \(+2,0\);
- Assist \(+1,5\);
- Passaggi completati \(+0,01\);
- Tackle riusciti \(+0,1\).
A questo punto, calcoliamo con la MLR i valori di mercato dei due giocatori, le variabili indipendenti, \(v_A\) e \(v_B\). Per ciascuno dei due, moltiplichiamo ciascuna statistica per il peso e sommiamo il tutto. Otteniamo così
\[\begin{align*}
v_A&=−15+40+9+10+1,5=45,5\\
v_B&= −11,5+28+15+15+4=50,5.
\end{align*}\]
Ebbene, la MLR sconfessa l’intuito: il valore del Giocatore B, \(v_B\), è più alto di \(4\) punti di quello del Giocatore A, \(v_A\). A fare la differenza, leggendo i risultati, sono due aspetti. Da un lato, la minore età riduce il fattore di penalizzazione; a livello di calciomercato traduce un potenziale futuro del Giocatore B. Dall’altro, i suoi alti numeri in passaggi e tackle indicano una maggiore incisione sull’intera fase offensiva della squadra.
L’esempio con la MLR, per quanto semplificato, mostra come la matematica possa supportare le decisioni di una società di calcio. Ce ne sono altre di formule e algoritmi per il calcio mercato; giusto per citarne uno, il modello Moneyball. Con l’aumento dei dati a disposizione e i progressi dell’intelligenza artificiale questo supporto matematico aumenterà, aiutando i club nelle scelte di riparazione post-brindisi.