Euro2024 ha visto la vittoria della Spagna in finale contro l’Inghilterra. Oltre che in campo, questo campionato europeo si è giocato tra numeri, algoritmi e dati. Ce ne parla Marco Menale.
Domenica 14 luglio si è conclusa la diciassettesima edizione del Campionato europeo di calcio (EURO 2024, in breve). La Spagna ha battuto l’Inghilterra 2-1 ed è per la quarta volta campione d’Europa. È record assoluto per le furie rosse, che staccano la Germania ferma a quota \(3\). Si conferma la maledizione degli inglesi che continuano a non-vincere nulla dal dibattuto mondiale del 1966. Questo europeo è quello che ha più visto l’uso di tecnologia, algoritmi e numeri. Non solo VAR (con le polemiche di Spagna-Germania), ma anche e soprattutto statistiche di squadra e singoli giocatori, usate per preparare, intervenire e commentare ogni partita.
L’uso dei dati e dei modelli matematici nello sport, in generale, e nel calcio, in particolare, va avanti da diversi anni. In ogni partita si vede alle spalle dell’allenatore un gruppo di persone con uno o più computer/tablet che analizzano quanto sta accadendo sul campo. Ed è quello che abbiamo visto nel corso di questo europeo. Non si è trattato solo di un dietro le quinte per pochi addetti ai lavori. Ha così raggiunto gli spettatori l’importanza dei dati che anche le principali app che informano sui risultati riportano assieme al tabellino tanti dati, statistiche e heat-map. Eppure, il calcio è arrivato in ritardo rispetto ad altri sport. Ad esempio, nella pallavolo i data-analyst sono una realtà consolidata da diversi anni, come nel caso di Math&Sport, nata come costola del MOX, quest’ultimo spin-off del Politecnico di Milano (ne avevamo parlato qualche tempo fa).
Facciamo un esempio per capire come i dati possono aiutare a capire, analizzare e, forse, prevedere una partita. E lo facciamo con la finale Spagna-Inghilterra, guardando ai dati che hanno preceduto i novanta minuti in campo, frutto di quanto successo fino alle seminfinali. Usiamo dati, grafici e tabelle di Opta Sports, società inglese (sic!) di data analysis per lo sport che copre oltre \(30\) sport in \(70\) paesi.
Prima della partita, i modelli matematici di Opta danno la Spagna campione d’Europa al \(60,18\%\), mentre l’Inghilterra al \(39,82\%\), Figura 1. Mentre, nei novanta minuti le probabilità diventano: \(40,5\%\) Spagna, \(29,0%\) Inghilterra e \(30,5\%\) pareggio. Le furie rosse erano favorite, come poi confermato dal campo.
In Figura 2 sono riportati i dati degli attacchi delle prime \(10\) squadra prima della finale. Come ordine è stato scelto il parametro che più rappresenta l’ingresso dei numeri nel mondo del calcio: l’expected goals o xG. Questo parametro misura la probabilità che un’occasione d’attacco si concluda con un goal e, di conseguenze, da una stima del numero di goal di una squadra. Può essere calcolato in vari modi; ad esempio, tenendo conto dell’angolo di tiro o degli avversari presenti lungo la traiettoria.
Nel percorso fino alla finale è la Spagna ad avere l’xG più alto, \(11,06\), staccando, e di non-poco, Germania, Portogallo e Francia. La Spagna è la squadra che ha creato di più fino alla finale. Mentre, l’Inghilterra è ultima con \(5,62\), dietro anche alla non brillantissima Croazia.
Se, invece, consideriamo la differenza tra goal fatti e xG (GOALS vs xG in Figura 2), la Spagna è ancora prima con \(1,94\), mentre l’Inghilterra passa al secondo posto con \(1,38\). Quest’ultimo dato spiega come sia arrivata in finale l’Inghilterra: pur non creando tante occasioni, è riuscita a trasformare quelle poche a disposizione. È interessante notare come la Francia, inizialmente tra le favorite del torneo, sia fuori dalle prime dieci per questo parametro, anzi sprofonda agli ultimi, con \(-5,17\), ossia ha molte occasioni, ma pochissime ne trasforma in goal. Stesso discorso vale per il Portogallo, altra favorita, con \(-4,57\). Infatti, una si è fermata ai quarti e l’altra in semifinale.
Anche sui calci piazzati l’xG della Spagna è migliore di quello dell’Inghilterra con \(2,5\) contro \(1,07\), anche se la classifica è dominata dall’insospettabile Cechia con \(3,06\).
Passiamo ai dati che riguardano gli xG concessi: l’Inghilterra è davanti la Spagna, con \(5,30\) contro \(6,51\). Infatti, gli spagnoli hanno subito goal in tutte le partite della fase a eliminazione diretta. Tuttavia nella differenza tra goal subiti e xG la Spagna è di nuovo avanti, con \(-3,51\), contro \(1,30\) degli inglesi. La Spagna concede qualcosa in più dato il suo gioco, tuttavia subisce pochi goal.
Passiamo alla rappresentazione delle zone di dominio della Spagna, mettendo assieme i dati che hanno portato alla finale, Figura 2. Come si vede dai vari colori, gli spagnoli conducono le partite sulle fasce, dove ci sono Nico Williams e quel fenomeno di Lamine Yamal.
I dati pre-finale sono stati confermati sul campo domenica 14 Luglio. La Spagna ha avuto molte più occasioni dell’Inghilterra, vincendo la partita nei novanta minuti, ma subendo comunque un goal. L’Inghilterra costruisce poco, ma riesce a concretizzare le poche occasioni. Anche il modo in cui è stata preparata è in linea con i dati pre-match delle zone di dominio. Infatti, entrambi i goal della Spagna sono venuti dagli esterni, e non per via centrale.
Qualche ultimo dato al di là della finale. Il giocatore con xG più alto dell’Europeo è stato Kai Havertz della Germania. Mentre, per la differenza goal e xG c’è lo slovacco Ivan Schranz, quasi in ex-equo con il tedesco Jamal Musial e l’olandese Cody Gakpo. Quest’ultimo è uno dei pochi dati relativi all’Olanda che, forse, si è trovata in semifinale più per la struttura del tabellone a eliminazione diretta di questo europeo che per oggettivi meriti. Infine, sulle tre volte che si è andati ai calci di rigore, per due volte ha vinto la squadra che ha tirato per prima, confermando la regola illusoria del vantaggio di battere per primi.