Dalla Moneyball alla Football Analytics: la statistica scende in campo
Alla ricerca della formula matematica segreta per raggiungere la vittoria sul campo e nei conti di bilancio.
TUTTO HA INIZIO CON LA MONEYBALL
Nel mondo della MLB la chiamano “Moneyball”. Nel baseball indica l’applicazione dell’analisi statistica per lo svolgimento delle attività di valutazione della performance delle squadre e dei giocatori nonché per quella del talent scouting. L’ideatore di questa filosofia è stato Bill James (nome di battesimo George William James, nato a Holton, Kansas, il 5 ottobre 1949), fondatore della c.d. Sabermetrica ossia lo studio del baseball mediante l’uso della scienza statistica. Prendendo le mosse dalle teorie di James, il grande autore, saggista e giornalista statunitense Michael Lewis ha scritto nel 2003 il famoso bestseller “Moneyball: The Art of Winning an Unfair Game”. Hollywood non ha resistito all’enorme successo editoriale del libro di Lewis, tanto che il 2011 diventa l’anno della sua fortunata trasposizione cinematografica con il film “Moneyball – L’arte di vincere”, diretto da Bennett Miller ed interpretato da Brad Pitt, Jonah Hill e Philip Seymour Hoffman.
Il libro ed il film ripercorrono le gesta di Billy Beane (ex promessa del baseball) che nel 2002 in qualità di General Manager degli Oakland Athletics – con il supporto di Peter Brand – decide di rivoluzionare il metodo di selezione e valutazione dei giocatori. Lo scouting viene così basato su un set di parametri statistici al fine di allestire una squadra competitiva, pur disponendo di un budget molto ridotto. Il risultato finale è quasi incredibile: gli Oakland sfiorano l’impresa. Essi arrivano primi nella West Division dell’American League (con una striscia significativa di vittorie consecutive), ma saranno eliminati nel primo turno dei play-off. Però, da quel giorno Billy Beane ha cambiato per sempre il gioco del baseball e non solo quello…
FOOTBALL ANALTYCS: COS’È? – Il mondo del calcio non è certo rimasto indifferente al grande fascino mediatico scatenato dalla Moneyball. E così gli staff dirigenziali e quelli tecnici hanno iniziato ad assumere un numero sempre più elevato di esperti studiosi di statistica, con l’obiettivo di definire un insieme di indicatori statistici idonei a valutare oggettivamente i risultati raggiunti dai club nonché le prestazioni dei singoli calciatori. Da qui, ne sono venuti fuori una serie di importanti indici che sempre più sono considerati nella pianificazione delle attività di calcio-mercato nonché nella definizione delle strategie aziendali e di quelle tecnico-tattiche. Ed anche le definizioni del fenomeno in argomento abbondano: Football Analytics, Soccer Analitycs, Soccermoney, Soccermatics, Soccerment, Soccermetrics, Money-Football, SoccerStat, Footmoney, Soccer Data, Football Data, Soccer Data Science, Football Data Science, Soccer Forecasting, Big Data Soccer e chi più ne ha più ne metta: il limite è solo la fantasia!
CHARLES REEP: I DATI SCENDONO IN CAMPO – A dire il vero, la Football Analytics nasce in Inghilterra intorno al 1950 grazie al lavoro pionieristico di Thorold Charles Reep (22/09/1904 – 03/02/2002). Charles Reep fu un contabile inglese della Royal Air Force. Amante del football, egli seguiva sempre le partite di calcio. Sabato 18 marzo 1950, nel corso di un match tra Swidon Town e Bristol Rovers allo stadio County Ground di Swidon, accadde l’imponderabile. Al termine della prima frazione di gioco, il Ragioniere Reep fu piuttosto deluso nell’osservare che la squadra casalinga, malgrado il miglior gioco espresso, non era riuscita a segnare nemmeno un gol. Così, nel secondo tempo decise di iniziare ad annotare su un proprio taccuino una serie di dati relativi alla partita: numero di passaggi, numero di tiri in porta, numero di cross, posizioni principali del campo da cui le squadre effettuavano i tiri in porta e tanto altro ancora. Il tutto, ovviamente, fu registrato rigorosamente a mano (un aspetto da non sottovalutare!). Si giunge quindi al momento storico in cui i dati scendono in campo! Da quel giorno, Reep collezionò le informazioni relative a tutte le partite visionate allo scopo poi di analizzarle (ricordiamo sempre che tutto era svolto “a mano”). Dopo circa un anno di rilevazioni ed analisi, Charles Reep fu in grado di constatare che una squadra riusciva solitamente a realizzare una rete attraverso l’esecuzione di non più di tre passaggi. Con questa scoperta, il contabile della Royal Air Force elaborò la celebre “long ball theory” ossia la “teoria della palla lunga” (che in Italia conosciamo meglio con l’espressione di “palla lunga e pedalare”).
VALERIJ LOBANOVS’KYJ: I COMPUTER SCENDONO IN CAMPO – Registrare molte informazioni rappresenta, però, soltanto il primo passo per eseguire un’analisi statistico-scientifica che si riveli completa, razionale, fondata e significativa. Non basta infatti solo registrare i dati, ma poi occorre anche elaborarli in modo automatico, sistematico e massivo. Un compito arduo se tali attività devono essere svolte manualmente da uno o più individui. Ebbene, qui subentra l’altro principale precursore della Football Analytics. Stiamo parlando di Valerij Vasyl’ovyč Lobanovs’kyj (06/01/1939 – 13/05/2022), che fu non solo un ottimo calciatore sovietico (ucraino dal 1991), ma soprattutto un indiscusso Maestro dell’arte della panchina. Il grande Valerij era soprannominato il Colonnello”. L’appellativo deriva sia dall’omonimo grado militare ricoperto da Lobanovs’kyj nelle gerarchie dell’Armata Rossa sia soprattutto dai suoi metodi di allenamento considerati da tutti estenuanti ossia sino a sfidare i limiti dell’umana sopportazione fisica. Infatti, il sistema di preparazione atletica imposto ai giocatori – con il supporto tecnico del Professor Petrovskij, (al tempo allenatore degli sprinter dell’Unione Sovietica) – si rivelò davvero proibitivo.
Il Colonnello fu, però, un allenatore all’avanguardia: infatti, fu il primo a servirsi in un campo di calcio dell’uso di un computer e di un’équipe di statistici per esaminare gli allenamenti e le partite. È un fatto sino ad allora impensabile: i computer scendono in campo! Con Lobanovs’kyj i calciatori diventano delle vere e proprie macchine efficienti. L’uso dei pc ed il ricorso ad esperti studiosi di statistica serviva a definire un nuovo metodo scientifico atto all’identificazione delle zone nevralgiche del campo da presidiare ed a quelle in cui passare il pallone, alla codificazione dei movimenti con o senza palla da effettuare prima ancora di ricevere un passaggio nonché alla creazione di giocatori adatti al calcio universale o totale (ossia con ruoli non ben definiti in cui ogni giocatore deve saper fare tutto: difendere, interdire ed attaccare). Lobanovs’kyj fu, infatti, uno degli inventori del “calcio totale o universale basato sulla matematica” (a differenza del più noto calcio totale olandese). Ciò concorse ad incrementare il valore economico e la performance tecnica non solo delle squadre allenate dal Colonnello, ma anche quello dei singoli calciatori addestrati.
LA FORMULA PITAGORICA DELLA VITTORIA NEL CALCIO
Partendo dalla formula pitagorica di Bill James adottata per il baseball, gli statistici sono giunti alla formula pitagorica del calcio. Le basi (runs) hanno lasciato il posto a gol fatti e subiti, mentre le vittorie sono state sostituite dai punti. Nella sostanza, la formula dei punti attesi è data dal rapporto tra il quadrato dei gol fatti e la somma del quadrato di fatti e subiti. In questo modo, si calcola il numero di punti attesi (“pitagorici”) che ottiene una squadra con la formula sopra descritta. Dal confronto tra lo score pitagorico e quello effettivo, si può accertare se una squadra sia stata più o meno fortunata, tenendo conto anche del numero di gol realizzati o concessi. La formula pitagorica del calcio è stata ideata e proposta dal blogger Martin Eastwood.
ALTRI PRINCIPALI INDICATORI STATISTICI DELLA FOOTBALL ANALYTICS – Di seguito, vi proponiamo alcune delle principali grandezze statistiche elaborate e studiate oggigiorno da un vero Football Data Scientist.
1) TSR (TOTAL SHOTS RATIO)
È l’Indice dei Tiri, che denota la capacità di una squadra di arrivare al tiro rispetto ai suoi avversari. Il rapporto deriva dall’indice Corsi utilizzato nel mondo dell’hockey su ghiaccio. La sua esportazione nel calcio la si deve a James Grayson. Il concetto di base è che le squadre più abili riescono a tirare con maggior frequenza, ostacolando gli avversari nell’andare al tiro. Il rapporto fornisce una misura del valore di una squadra. Il TSR mostra anche una certa correlazione con la posizione finale in classifica: ossia più alto è il TSR più alta tende ad essere la posizione in classifica. Il TSR si ottiene rapportando i tiri fatti da una squadra alla somma di tiri fatti e subiti. La formula è: TSR= [Tiri Fatti/(Tiri Fatti+Tiri Subiti)] La media di un campionato (sommando il TSR di tutte le squadre) è sempre pari a 0,50. Pertanto, i club con valori nettamente sotto la media miglioreranno, mentre quelli con valori molto al di sopra della media tenderanno a peggiorare. L’indicatore si stabilizza in breve tempo: infatti, dopo poche partite (6 o 7) il valore del TSR resta sostanzialmente costante per tutta la stagione. Inoltre, il valore del TSR da un anno all’atro non subisce variazioni significative: ciò consente di utilizzare tale rapporto anche per predire le future performance di una squadra nonché per sviluppare un’analisi andamentale negli anni. Pertanto, è un indicatore che ingloba in sé sia una funzione analitica che predittiva. Nel lungo termine, è una statistica che si rivela precisa in relazione ai punti ottenuti ed al numero di gol fatti. L’indicatore può essere espresso anche in valori % (moltiplicando il risultato della formula per 100).
2) STR (SHOTS ON TARGET RATIO): È l’Indice dei Tiri in Porta, che denota la capacità di una squadra di effettuare tiri nello specchio della porta rispetto ai suoi avversari. Il concetto di base è che le squadre più abili tirano nello specchio della porta con maggior frequenza, ostacolando gli avversari nel compiere tiri verso il proprio specchio della porta. Il rapporto fornisce una misura del valore di una squadra e della sua pericolosità. L’STR mostra anche una buona correlazione con la posizione finale in classifica: ossia più alto è l’STR più alta tende ad essere la posizione in classifica. L’STR si ottiene rapportando i tiri fatti nello specchio della porta da una squadra alla somma di tiri fatti nello specchio della porta e quelli subiti. La formula è: STR=[Tiri Fatti nello Specchio della Porta/(Tiri Fatti nello Specchio della Porta+Tiri Subiti nello Specchio della Porta)]. La media di un campionato (sommando l’STR di tutte le squadre) è sempre pari a 0,50. Pertanto, i club con valori nettamente sotto la media ricopriranno posizioni di coda in classifica generale, mentre quelli con valori molto al di sopra della media occuperanno le zone alte di classifica. Il valore dell’STR da un anno all’atro non subisce variazioni significative: ciò consente di utilizzare tale rapporto per predire le future performance di una squadra nonché per sviluppare un’analisi andamentale negli anni. Nel lungo termine, è una statistica che si rivela precisa in relazione ai punti ottenuti, al numero di gol fatti e, conseguentemente, alla posizione in classifica. L’indicatore può essere espresso anche in valori % (moltiplicando il risultato della formula per 100).
3) ISR (INSIDE THE BOX SHOT RATIO)
È l’Indice dei Tiri da Dentro l’Area, che denota la capacità di una squadra di andare alla conclusione da una posizione, almeno in teoria, molto favorevole, rispetto agli avversari. Il rapporto fornisce una misura del valore di una squadra. L’ISR mostra una buona correlazione con la posizione finale in classifica: ossia più alto è l’ISR più alta tende ad essere la posizione in classifica. Si ottiene rapportando i tiri da dentro l’area fatti da una squadra alla somma di tiri da dentro l’area fatti e quelli subiti. La formula è: ISR=[Tiri da Dentro l’Area Fatti/(Tiri da Dentro l’Area Fatti+Tiri da Dentro l’Area Subiti)]. La media di un campionato (sommando l’ISR di tutte le squadre) è sempre paria 0,50. Pertanto, i club con valori nettamente sotto la media miglioreranno, mentre quelli con valori molto al di sopra della media peggioreranno. È un rapporto molto interessante perché la capacità di giungere stabilmente alla conclusione da posizioni molto ravvicinate e favorevoli (limitando tale possibilità agli avversari) è un chiaro sintomo dell’esistenza di un armonico equilibrio tattico tra la fase offensiva e quella difensiva. Pertanto, l’ISR è un indicatore della qualità del gioco espresso da una squadra.
4) CR (CONVERSION RATIO)
È il Tasso di Conversione, che denota la capacità di una squadra di trasformare i suoi tiri in gol rispetto ai suoi avversari. Il rapporto fornisce una misura del valore di una squadra e del suo livello di fortuna predicendo se nel tempo essa migliorerà o peggiorerà. Il CR mostra anche una buona correlazione con la posizione finale in classifica: ossia più alto è il CR più alta tende ad essere la posizione in classifica. Si ottiene rapportando i tiri in porta fatti da una squadra alla somma di tiri in porta fatti e quelli subiti. La formula è: STR=[% realizzativa/(%realizzativa+% realizzativa dell’avversario)], ove % realizzativa=Tiri Fatti nello Specchio della Porta convertiti in Rete. Secondo alcuni, si tratta di un indice che misura il famoso fattore “C” ossia la “fortuna di una squadra di calcio”. Per altri è una sorta di misura del grado di pragmatismo di un club. Infatti, si considera che un valore inferiore allo 0,50 sia espressivo di sfortuna; al contrario, un valore superiore allo 0,50 è indicativo di una buona sorte. La media di un campionato (sommando il CR di tutte le squadre) è sempre paria 0,50. Pertanto, i club con valori nettamente sotto la media miglioreranno, mentre quelli con valori molto al di sopra della media peggioreranno. Contrariamente agli altri indicatori sopra esaminati, il CR può evidenziare variazioni significative da un anno all’altro o perfino nel corso della stessa stagione. Nel lungo termine, è una statistica che si rivela precisa in relazione ai punti ottenuti, al numero di gol fatti e, conseguentemente, alla posizione in classifica.
5) PDO
È una misura statistica ideata da Vic Ferrari. Il nome dell’indice non è una sigla, bensì è un omaggio ad uno dei commentatori del blog di Vic Ferrari (Irreverent Oiler Fans). Il PDO denota la capacità di una squadra di trasformare i suoi tiri in gol rispetto ai suoi avversari. Il rapporto fornisce una misura del valore di una squadra e del suo livello di fortuna predicendo se nel tempo essa migliorerà o peggiorerà. Si ottiene dalla somma (espressa in valori percentuali) del tasso di conversione e del tasso di salvataggio di una squadra, moltiplicata per 10. La formula è: PDO=[(Tasso di Conversione+Tasso di Salvataggio)*10], ove Tasso di Conversione=(Numero Gol Fatti/Numero Tiri Fatti) e Tasso di Salvataggio=[1–(Numero Gol Subiti/Numero Tiri Subiti)]. È un’altra misura del livello di “fortuna” o di “cinismo” di una squadra, rispetto al CR. La media di un campionato (sommando il PDO di tutte le squadre) è sempre paria 1.000. Pertanto, i club con PDO inferiore a 1.000 potranno essere considerati “sfortunati”, mentre quelli con valori superiori a 1.000 come “fortunati”.
6) xG (EXPECTED GOAL)
Si tratta dell’indicatore dei “Gol Attesi” o “Gol Previsti”. Si tratta di un indicatore della capacità di produzione offensiva di un singolo giocatore o di una intera squadra. Tale indicatore esprime il numero di gol che una squadra o un singolo calciatore avrebbe dovuto segnare. Il calcolo degli xG si basa su modelli matematici complessi, che fanno leva sulle serie storiche di tiri effettuati da varie posizioni del campo, misurandone la probabilità di trasformazione in gol. Un valore di 0,6 xG significa che una specifica conclusione ha la probabilità di tramutarsi in rete del 60% (oppure di segnare 6 volte su 10). Dal confronto tra xG e gol effettivi possiamo verificare se una squadra o un singolo giocatore stia sovraperformando (il numero di gol effettivi è superiore all’xG) oppure sottoperformando (il numero di gol effettivi è inferiore all’xG). Tra i modelli di calcolo degli xG più conosciuti vi sono quello di Paul Riley e quello di Michael Caley. Il primo si basa sui seguenti fattori: a) tiri nello specchio della porta (non si considerano gli autogol); b) la posizione da cui parte il tiro nello specchio della porta; c) la tipologia di tiro nello specchio della porta (tiro su azione, su punizione diretta o su calcio di rigore). Il modello di Caley, invece, risulta molto più analitico e complesso basandosi su: a) tutte le tipologie di tiri (nello specchio della porta e fuori dallo specchio della porta), ad eccezione di autogol e penalty; b) distanza dalla porta; c) angolo di tiro. Il modello prevede sei tipologie di tiro (a ciascuna delle quali è associata una differente equazione): i) tiri da punizione diretta; ii) tiri dopo un dribbling al portiere; iii) tiri di testa da cross; iv) tiri di testa non da cross; v) tiri non di testa da cross; vi) tiri “regolari” (ossia non di testa e non da cross). Il modello di Caley considera anche la qualità degli assist (osservando la supremazia di filtranti e dei passaggi smarcanti in area). Quindi, sono state codificate varie tipologie di assist abbinate ad una differente efficienza realizzativa sulla base di dati empirici. Tra gli altri fattori considerati vi sono: la tipologia di azione offensiva (possesso palla o contropiede), ulteriori misure indirette della pressione difensiva, l’abilità di finalizzazione di ogni singolo calciatore ed altro ancora.
7) xGA (EXPECTED GOAL AGAINST)
Si tratta dell’indicatore dei “Gol Attesi Concessi” o “Gol Concessi Previsti”. È un indicatore della capacità di produzione offensiva degli avversari che viene adottato per testare la qualità del gioco difensivo di una squadra.
8) xG DIFF (EXPECTED GOAL DIFFERENCE)
Si tratta della “Differenza Gol Attesa”. Si calcola, appunto, come differenza tra gol attesi (xG) e gol attesi concessi (xGA). Un valore positivo indica che la squadra produce più di quanto subisce; viceversa, in caso di risultato negativo.
9) xA (EXPECTED ASSIST)
Si tratta dell’indicatore degli ∫Assist Attesi”. Indica la probabilità che un passaggio diventi un assist e, quindi, che il ricevente trasformi in gol il passaggio/assist realizzato. L’indicatore – che prescinde dal numero di assist effettuati – esprime quali sono i calciatori che propiziano maggiormente le occasioni da gol.
10) xG E PENALTY
Si tratta della “Abilità nel tirare i Calci di Rigore”. Un tiro da penalty presenta un valore fisso di 0,76xG (ciò in quanto ogni calcio di rigore è un tiro effettuato in una stessa situazione di gioco, dalla stessa posizione e dalla stessa distanza). La comparazione tra il valore di xG di un calciatore e la correlata costante prevista per i calci di rigore esprime la capacità realizzativa dagli 11 metri.
11) npxG (NON-PENALTY EXPECTED GOAL)
Si tratta della misura dei “Gol Attesi Non da Calcio di Rigore”. Nel caso in cui il valore di xG sia pari a 5,76, la npxG sarà determinata dalla semplice differenza tra xG e valore fisso di xG associato ai calci di rigore. La formula è: ossia: npxG=(xG–xGPenalty). Nell’esempio sopra proposto, l’npxG sarà pari a: npxG = 5.76 – 0.76 = 5.
12) PA (PASS ACCURACY)
Si tratta dell’ “Analisi della precisione dei passaggi”. I moderni software di raccolta e analisi dei dati rilevano, ad esempio, anche questa tipologia di informazione per poter saggiare la qualità di una squadra o di un singolo giocatore nell’esecuzione dei passaggi.
13) PR (PACKING RATE)
Si tratta del “Passaggio Chiave”. Tale indicatore statistico esprime il grado di pericolosità di una squadra. La pericolosità di una squadra è, infatti, sostanzialmente connessa alla capacità di trovare un’imbucata (passaggio filtrante in profondità per esterni che tagliano alle spalle dei difensori o centrocampisti che si inseriscono da dietro) oppure di fare un cambio di gioco (improvviso lancio del pallone da un lato del campo dove si sta sviluppando il gioco a quello opposto, al fine di sorprendere gli avversari). In sostanza, il packing rate è un passaggio intelligente finalizzato a tagliar fuori il maggior numero di giocatori avversari; in tal modo, si riesce a lanciare un proprio compagno di squadra dritto verso la porta creando una chiara situazione da gol. L’indicatore è stato ideato nel 2015 da Stefan Reinartz (ex calciatore di Bayer Leverkusen, Norimberga ed Eintracht Francoforte) e Jens Hegeler (calciatore attualmente svincolato, che in carriera ha militato nelle file di Bayer Leverkusen, Augusta, Norimberga, Hertha Berlino e Bristol City).
I “NUMERI” SEGRETI DELLA COPPIA MAGICA BENHAM-ANKERSEN E I MIRACOLI DEL BRENTFORD F.C. E DEL F.C. MIDJTYLLAND
Così come fatto da Billy Beane alla guida degli Oakland Athletics, anche nel calcio non sono mancati esempi di utilizzo dei parametri e degli indicatori statistici per la gestione delle attività di scouting e valutazione delle performance della squadra e dei singoli giocatori. Al riguardo, si ricordano i modelli di scouting e valutazione della perfomance dei calciatori del Brentford Football Club (club che attualmente milita in Premier League) e dell’FC Midjtylland (club che attualmente milita nella Danish Superliga). Le due squadre hanno in comune due uomini chiave: Matthew Benham (fisico laureato ad Oxford, esperto di finanza, manager, imprenditore nel campo delle scommesse, proprietario di club calcistici) e Rasmus Ankersen (ex calciatore dell’FC Midjtylland, autore, direttore di società di calcio, co-fondatore del gruppo Sport Republic che nel 2022 ha rilevato la proprietà del Southampton Football Club).
Nel 2007, Benham decide di sostenere il Brentford Football Club (di cui risulta essere tifoso sin dalla tenera età di 11 anni) che versava in gravi condizioni economico-finanziarie. Così, Benham compì una serie di operazioni finanziarie con le quali rilevò la proprietà del club londinese (in dettaglio, Benham erogò un prestito ad un gruppo di tifosi, con la clausola di trasferimento della proprietà in caso di mancato rimborso del finanziamento). Alla guida del Brentford, Benham ingaggiò nel 2015 Ankersen nel ruolo di co-direttore sportivo con Phil Giles (anche quest’ultimo nel ruolo di co-direttore). Ankersen rimarrà al Brentford fino al 2020.
Grazie alle geniali intuizioni ed alle innovazioni gestionali (utilizzo dei metodi e degli strumenti della fooball analytics) apportate dal rivoluzionario duo Benham-Ankersen, il Brentford ha ottenuto una serie di importanti promozioni: nel 2008, vittoria nella Football League Two ed accesso alla Football League One; nel 2013/2014 secondo posto in Football League One ed accesso alla Football League Championship; nel 2020/2021, vittoria nei play-off della Football League Championship ed accesso alla Premier League. Nel 2010/2011, il Brentford è stato finalista nella Football League Trophy e nel 2020/2021 è stato semifinalista nella English Football League Cup (la Coppa di Lega inglese).
Nel 2014, Benham acquista l’FC Midjtylland. I metodi statistici della premiata Ditta “Benahm-Ankersen” vengono ciecamente applicati anche al club danese. Sotto la guida dei due manager, il Midjtylland va alla conquista di tre titoli nazionali danesi nel 2014/2015, 2017/2018 e 2019/2020 (oltre a 3 piazzamenti al secondo posto), due coppe nazionali danesi nel 2018/2019 e 2021/2022 (oltre a 2 semifinali). Senza dimenticare l’indiscutibile miglioramento complessivo della qualità del gioco della squadra danese e dei suoi singoli calciatori.
E allora cari calciofili, che dire di più? Niente. Solo questo, «Passare la palla ai numeri!».
Francesco Ciavarella