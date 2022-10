Quando si parla di statistiche applicate al calcio, il rischio è quello di entrare in un territorio minato. Come per l’annoso tema degli allenatori ‘giochisti’ o ‘risultatisti’ , anche i big data sono un argomento divisivo. C’è chi li considera un alleato fondamentale per raggiungere l’eccellenza e chi invece li ritiene sopravvalutati o ‘inutili’ per due ragioni sostanziali: 1) la difficoltà intrinseca del modellare uno sport episodico come il calcio, caratterizzato da un numero di eventi individuali più ristretto; 2) lo scetticismo di fondo verso un nuovo approccio, così diverso dall’atteggiamento ‘tradizionale’.

la data analytics per ottimizzare i loro processi di scouting e match analysis (ad esempio Che siate o meno stati avidi ammiratori del film ‘Moneyball-L'arte di vincere’ oppure per nulla affascinati da tale pellicola è innegabile che tutte quelle squadre che per prime hanno integratoper ottimizzare i loro processi di scouting e match analysis (ad esempio il Liverpool in Premier ed il Milan in Serie A ) godono oggi di un importante vantaggio rispetto alle concorrenti.

Di dati disponibili, anche gratuitamente, ne esistono tanti, ma possono rivelarsi inutili, o addirittura dannosi, se non si è in grado di interpretarli correttamente. Proprio in quest’ottica nasce ‘StatsCorner’, la nuova rubrica di Eurosport, un'oasi, uno spazio in cui analizzare le prestrazioni di squadre, giocatori e le peculiarità e anomalie del gioco attraverso le statistiche. Ma quali sono i big data o gli indici che veramente fanno la differenza? Perché sempre più spesso si sente parlare di Expected Goals o Expected assists? Per acquisire dimestichezza con queste terminologie, mostrarne il potenziale e capire come ci possono aiutare a valutare meglio ciò che realmente accade in campo, in questa prima puntata, abbiamo pensato di stilare un piccolo glossario in cui vi spiegheremo alcuni degli indici più utilizzati. Iniziamo!

Expected goals (xG)

Gli expected goals sono un dato che misura la probabilità di un tiro di diventare un gol. Dall’analisi di centinaia di migliaia di tiri viene assegnato a ciascuno di essi un valore, che varia da 0 (0% impossibile segnare) a 1 (100% gol certo), a seconda del modello adottato. Ne esistono infatti diversi, alcuni più accurati, altri meno, che tengono in considerazione differenti fattori pre-tiro, tra i quali:

l’angolo di tiro;

la distanza dalla porta;

la parte del corpo con cui si tira;

il numero e la posizione dei difensori e del portiere;

altezza dell’impatto col pallone;

la tipologia di assist ricevuto.

In base a questi criteri è possibile raggruppare i tiri scoccati in condizioni simili e dividendo quelli trasformati in rete sul numero totale si ottiene un valore compreso tra 0 ed 1 che è appunto l’xG.

Quali squadre creano di più o meno e quali concdono più/meno nella Serie A 2022-23 dopo 11 giornate? L'analisi attraverso gli Expected Goals Credit Foto Eurosport

Guardando al singolo tiro si può determinarne la pericolosità attribuendogli appunto un valore xG. Alternativamente si può calcolare l’xG medio di una squadra/un giocatore durante una partita/stagione. Gli xG possono essere anche utilizzati per calcolare gli expected Points (ci arriveremo, solo un po’ di pazienza). Sommare gli xG prodotti durante una partita può darci un’idea della pericolosità offensiva creata, seppur non sia corretto da un punto di vista matematico sommare probabilità di eventi indipendenti. Nonostante ciò, vedrete diversi analisti parlare di overperformance se un giocatore (o una squadra) segna un numero di gol superiore a quelli attesi e viceversa parlare di underperformance.

Lo stesso vale per i Non-penalty expected goals (npxG), che altro non sono se non gli xG senza contare il contributo dei calci di rigore (che a seconda dei modelli valgono 0,76÷0,79). Infine, quando ci si riferisce agli xG (o npxG) subiti, si aggiunge una “A” alla fine che sta per “allowed” (xGA e npxGA).

Expected goals on target (xGOT) o Post-shot expected goals (PsxG)

Due nomi diversi per descrivere lo stesso dato, forniti da due provider differenti: Opta per i primi e Statsbomb per i secondi. Si definiscono analogamente agli xG, quindi anch’essi assegnano ad ogni tiro un valore che varia da 0 a 1, con la sostanziale differenza che gli xG modellano una situazione pre-tiro, mentre gli xGOT (o PsxG) post-tiro. Ne segue che i criteri mediante i quali vengono raggruppati e calcolati variano.

Ad esempio, gli xGOT tengono conto sia del punto di partenza del tiro ma anche della posizione della palla quando varca la linea di porta. Tiri più vicini ai legni avranno un valore di xGOT maggiore rispetto a tiri più centrali. Come è facilmente intuibile, il valore degli xGOT dei tiri bloccati e fuori dallo specchio è 0. Avremo un valore > 0 solamente per i tiri in porta parati e per i goal.

È bene sottolineare che i modelli sono relativamente recenti e perfettibili (solo di recente è stata introdotta la velocità del tiro come parametro). Gli xGOT possono essere utilizzati per valutare l’effettiva pericolosità di un tiro in porta. Sono anche utili per valutare il contributo, positivo o negativo, del tiratore guardando alla differenza tra xGOT e xG (vero in linea di massima, ma sarebbe un discorso più complicato e meritevole di futuro approfondimento). Alternativamente vengono utilizzati per stimare l’abilità nel parare di un portiere, calcolando: (xGOT-GA) / xGOT ossia la percentuale di gol concessi in +/- rispetto al portiere medio (in questo caso gli xGOT” sono quelli affrontati dal portiere e i "GA” i gol subiti).

Top 10 Portieri Serie A 2022-23 dopo 11 giornate per % gol prevenuti rispetto agli attesi (XGOT-GA)/XGOT (Fonte Opta)

1. PERIN (Juventus) +48% 2. PROVEDEL (Lazio) +35% 3. SEPE (Salernitana) +13% 4. FALCONE (Lecce) +12% 5. RADU (Cremonese) +10% 6. VICARIO (Empoli) +8% 7. MERET (Napoli) +6% 8. MILINKOVIC-SAVIC (Torino) +6% 9. SILVESTRI (Udinese) +6% 10. SKORUPSKI (Bologna) +4%

* Valutati solo i portieri con minimo 5 xGOT subiti

Expected assists e Expected goals assisted (xA)

Inizialmente non vi era distinzione, esistendo solo gli expected assists, definiti semplicemente come il valore di xG del tiro a cui portava il passaggio in esame. Questo voleva dire considerare meritevoli di assegnazione del valore xA solamente i passaggi che portavano effettivamente a un tiro, oltre a non considerare il contributo del tiratore che magari, portando palla al piede, migliorava le sue chance di segnare.

Se il modello di Statsbomb è rimasto tale, a livello di definizione, cambiando solo nome da “expected assists” a “expected goals assisted”, il modello di Opta si è invece evoluto, assicurando che venisse attribuito un valore xA anche quando il compagno che riceve il pallone non è in grado di tirare, tenendo conto di alcuni fattori, tra i quali il punto di ricezione ed il tipo di passaggio.

La Top 10 degli assistman Serie A 2022-2023 tramite gli Expected Assists per 50 tocchi (Fonte Opta)

1. LOOKMAN (Atalanta) 0.407 2. DE KETELAERE (Milan) 0.375 3. PEREYRA (Udinese) 0.346 4. KVARATSKHELIA (Napoli) 0.342 5. MURIEL (Atalanta) 0.329 6. DEULOFEU (Udinese) 0.328 7. LEAO (Milan) 0.322 8. DZEKO (inter) 0.318 9. LOZANO (Napoli) 0.313 10. DUMFRIES (Inter) 0.307

* considerati solo giocatori che hanno collezionato minimo 150 tocchi

Gli xA possono essere utilizzati per valutare la pericolosità media dei passaggi di una squadra o di un giocatore (e quindi la sua visione/creatività). Sommando invece gli expected goals assisted e confrontandoli con gli xG, si può avere un’idea di quanto sia corale o meno il gioco di una squadra. A livello del singolo giocatore, gli xA servono per calcolare l’expected offensive value added (xOVA, fornito da Soccerment), che possiamo definire per ora in breve come la misura del contributo offensivo di un calciatore: xOVA = npxG + xA - xAricevuti.

Expected points (xPts)

Gli expected points di una squadra, in una determinata partita, vengono calcolati a partire dagli xG ed xGA di ciascun tiro, fissati i quali la partita viene simulata migliaia di volte (nel gergo tecnico si fa una simulazione di Monte Carlo). Da quest’ultime si ricava il numero di vittorie, pareggi e sconfitte della squadra in esame. Dividendo poi il numero di partite vinte sul totale delle simulazioni avremo la percentuale di vittoria, e analogamente, di pareggio e sconfitta. A questo punto potremo calcolare gli xPts come: xPts =3 x % vittoria + 1 x % pareggio

Sommare gli xPts di ogni squadra per ciascuna partita ci permette di stilare una classifica alternativa, più meritocratica, basata sulle prestazioni, più che sui risultati. Possiamo dunque individuare quali squadre stanno over/underperformando e giudicare se il loro percorso fino ad ora in campionato è sostenibile o meno lungo tutta la stagione.

Expected threat (xT)

L’expected threat è un modello che nasce dalla necessità di valutare il contributo delle giocate che precedono il tiro, in termini di pericolosità. Ricorrendo ad un database storico è possibile dividere il campo da gioco in zone ed assegnare, a ciascuna di esse, un valore uguale alla probabilità che avere il possesso in quella zona porti ad un’azione da goal.

L’xT del singolo passaggio o spostamento palla al piede è dato dalla differenza tra il valore di xT della zona di arrivo e quella di partenza. Sommando i valori dei singoli eventi si può valutare la pericolosità di un’azione, di una squadra o il contributo di un singolo giocatore. Tuttavia, il modello xT porta con sé dei difetti intrinsechi:

non tiene conto della posizione degli avversari né dei compagni di squadra;

sopravvaluta i cross (passaggi che partono da zone poco pericolose e arrivano in zone pericolose, quindi xT alto, però segnare da cross è statisticamente poco probabile);

a volte per sbloccare un’azione e avanzare è necessario prima portare indietro il pallone, il che implica un valore di xT negativo;

ha senso confrontare gli xT solo fra giocatori con ruoli/compiti simili in campo.

Oltre agli utilizzi già citati, gli xT possono essere traslati (in gergo plottati) in un grafico al variare del tempo di gioco per dare un’idea di quanto e quando una squadra si sia resa più pericolosa dell’altra.

