De meeste voetbalfans zullen dit gevoel wel kennen. Men is naar een wedstrijd aan het kijken van zijn favoriete ploeg, een speler krijgt een open kans en mist onbegrijpelijk. Onze frustratie loopt dan over en we hebben dan allen een oordeel over deze speler die het onmisbare heeft gemist. Maar is deze frustratie wel terecht? Misschien minder dan je denkt. Volgens het model van de Expected goals (verwachte doelpunten) of xG, zouden het de fans moeten zijn die hun verwachtingen zouden moeten aanpassen. Hieronder wordt de reden achter deze gedachtegang uitgelegd.
Expected goals is een voorspellend model dat gebruikt wordt om elke kans om een goal te scoren te analyseren en de kans dat er werkelijk gescoord wordt. Een xG model berekent voor elke kans de waarschijnlijkheid dat een doelpunt gescoord wordt op basis van hetgeen we over deze kans weten, zoals variabelen die gebaseerd zijn op het evenement of wedstrijd zelf. Hoe hoger de xG-score is, met 1 als maximum en 0 het minimum, hoe hoger de kans dat een doelpunt gescoord wordt. We nemen als voorbeeld een score van 0.2xG. Dit soort kansen moet 20% van de tijd gescoord worden. Als de kans een 0.99xG-score krijgt, betekent dat deze fase een 99% kans heeft om gescoord te worden.
Een typische xG model houdt rekening met de volgende evenement gebaseerde variabelen om de kwaliteit van een scoringsopportuniteit te berekenen:
- de afstand tot het doel
- de hoek ten op zicht van het doelpunt
- speelt de speler de bal met zijn voet of met het hoofd
- in welke omstandigheden wordt de kans gespeeld (tijdens het spel zelf, een rechtstreekse vrije trap, een hoekschop, een tegenaanval…)
- heeft de speler juist een speler van de andere ploeg uitgeschakeld?
Een schot van dichtbij vanuit een centrale positie heeft bijvoorbeeld een hogere xG waarde dan een kans die met het hoofd gespeeld wordt vanuit een scherpe hoek, als alle andere factoren dezelfde zijn. Het model hierboven is het standaardmodel, maar sommige bedrijven gebruiken andere technologieën en algoritmes om nog betere voorspellingsresultaten te verkrijgen van het xG model. Bijkomende gegevens zijn bijvoorbeeld de positie van de doelman of de druk die uitgeoefend wordt op de speler die een doelpunt probeert te scoren.
Waarom is het Expected goals model nuttig?
Het idee achter het xG model is dat het een indicatie geeft over het feit of resultaten gebaseerd zijn op duurzame factoren zoals het creëren van een groot aantal opeenvolgende kansen of op andere factoren zoals geluk of een zeer goede doelman. Als een speler bijvoorbeeld een hogere xG waarde heeft dan de goals die hij werkelijk gescoord heeft, betekent dit dat hij slecht afgewerkt heeft of dat hij gewoon geen geluk had. En omgekeerd ook. Als een speler meer doelpunten scoort dan zijn xG waarde, kan dit te wijten zijn aan een uitzonderlijke individuele prestatie.
Eenvoudig uitgelegd, xG kan gezien worden als een manier om op een doeltreffende manier de kwaliteit van de kansen de evalueren. Met de statistieken die voor elke wedstrijd gebruikt worden, maakt men geen onderscheid tussen een schot op doel vanuit 25 meter of een schot op doel vanuit 2 meter. Met het xG model is dat wel het geval. Een kans vanuit 2 meter heeft een grotere kwaliteitswaarde dan een schot op doel vanuit 25 meter. We kunnen als voorbeeld de aanvaller van Bayern München, Robert Lewandowski. Hij is natuurlijk een uitstekende speler en heeft tijdens het seizoen 2018 – 2019 de meeste doelpunten gescoord in Duitsland. Maar dit wilt niet zeggen dat hij de beste afwerker is. Hij heeft misschien gewoon de meest kwalitatieve kansen afgewerkt.
Het xG model helpt ons dus om de kwaliteit van individuele spelers te evalueren, maar ook van ploegen. Door dit xG model te gebruiken, kan men zelfs de toekomstige prestaties van deze ploegen voorspellen. Als een team op een bepaalt niveau speelt bij het begin van een seizoen, kunnen we, door het xG model te gebruiken, zien of ze dit niveau zullen behouden. Als ze meer doelpunten scoren dan de verwachte doelpunten, is het meer dan waarschijnlijk dat het niveau van deze ploeg in de nabije toekomst zal zakken. Zouden ze minder doelpunten maken dan het aantal dat het xG model voorspelt, kan je erop rekenen dat hun vorm wel zal verbeteren. Maar het xG model gaat nog verder. Men kan het model ook gebruiken om defensieve en offensieve trends in kaart te brengen. Het zijn deze trends die aangeven hoeveel kansen een bepaalde ploeg zal creëren, maar ook hoeveel kansen hun tegenstanders zullen krijgen. Men kan ook het aantal verwachte assists (de pas die naar een goal leidt) berekenen. De volgende keer dat je dus vol frustraties op je spelers aan het roepen bent, moet je je de volgende vraag stellen: was het echt een gouden mogelijkheid?
Door wie wordt het xG model gebruikt?
Er zijn veel partijen die dit xG model gebruiken. In eerste instantie denken we natuurlijk aan de voetbalploegen zelf. Als een coach een toekomstige tegenstander analyseert, is het natuurlijk heel handig om de xG waarde van elke speler te kennen, maar ook voor de ploeg in haar geheel natuurlijk. Gelukkig zijn er in het voetbal nog zaken dat men niet kan voorspellen, maar dit model geeft toch een heel goede indicatie van de kwaliteit van de kansen die je tegenstander waarschijnlijk zullen creëren. Voor een coach is dit model dus zeer handig om zijn eigen tactisch plan op te stellen.
Analisten en (online) brokers gebruiken dit model ook om voorspellingen te maken. Door rekening te houden met de xG waarde van elke speler en van de ploegen, kan men natuurlijk betere voorspellingen maken over de toekomstige winnaars en verliezers. Brokers gebruiken o.a. dit model om hun quoteringen te berekenen.
Iedereen kent wel de traditionele statistieken die gebruikt worden, zoals totaal aantal schoten, totaal aantal schoten op doel, hoeveel gele en rode kaarten per ploeg, het balbezit, de afstand die gelopen werd door de ploeg en door een individuele speler… Deze statistieken worden tijdens een televisieprogramma gebruikt om de dominantie van een ploeg uit te leggen, maar ook om te zoeken waar het probleem van de verliezende ploeg zit. Meer en meer voetbalprogramma’s gebruiken nu ook de xG statistieken tijdens een wedstrijd als extra bron aan informatie om de prestatie van de ploegen uit te leggen en te analyseren. Als men naar de recente tendensen kijkt, is het duidelijk dat het model van Expected Goals meer en meer gebruikt zal worden.
Meer details voor een beter begrip van het xG model
Misschien lijkt de uitleg hierboven een beetje te abstract. Voor deze reden gaan we nu het xG model uitleggen aan de hand van een concreet voorbeeld. Als voorbeeld nemen we de Argentijnse superster en speler van FC Barcelona, Lionel Messi. We analyseren zijn kansen en doelpunten tijdens het seizoen 2018 – 2019. Dit zijn enkele statistieken van dat seizoen:
- Gescoorde doelpunten: 36
- Gescoorde doelpunten zonder penalty’s: 32
- Assists: 13
- Gemiddeld aantal schoten gedurende 90 minuten: 5,66
- Gemiddeld aantal passen gedurende 90 minuten die tot een schot leiden: 3,10
- Expected goals: 26
- Expected assists: 15,34
- Gemiddeld aantal verwachte doelpunten gedurende 90 minuten: 0,87
- Gemiddeld aantal verwachte assists gedurende 90 minuten: 0,51
Natuurlijk is Lionel Messi een buitengewone speler. Dit is de reden waarom tijdens dit seizoen het aantal gescoorde doelpunten hoger ligt dan de expected goals. In andere woorden, Lionel Messi scoort in meer situaties dan andere spelers in dezelfde situatie. Men kan natuurlijk ook de prestaties van de spelers wedstrijd per wedstrijd analyseren in functie van de expected goals. Dan zijn er 2 mogelijkheden:
- de xG ligt hoger dan de werkelijk gescoorde doelpunten, dit betekent dat de speler onder het niveau van de verwachte prestatie ligt
- de xG ligt lager dan de werkelijk gescoorde doelpunten, dit betekent dat de speler boven het niveau van de verwachte prestatie ligt
Dit kunnen we illustreren met de wedstrijd die Lionel Messi tijdens het seizoen 2018 – 2019 speelde tegen Eibar. Hij heeft de wedstrijd beëindigd met xG van 1,88. Tijdens deze wedstrijd scoorde hij echter 4 maal op 5 schoten. Zijn xG ligt dus duidelijk lager dan het aantal doelpunten die hij werkelijk gescoord heeft. Door 4 doelpunten te scoren op 5 schoten, heeft de Argentijnse nummer 10 natuurlijk een wereldprestatie genoteerd.
Het schot is natuurlijk een de variabelen die gebruikt worden om een xG waarde op te stellen. Er zijn 5 soorten schoten:
- een schot tijdens het spel
- een directe vrije trap
- een hoekschop
- een penalty
- een herneming
Op 21 december 2019 scoort Lionel Messi een doelpunt tijdens een wedstrijd tegen Alaves. Op zich, is er hier niets uitzonderlijks aan, behalve dat deze kans een xG waarde van 0,03 had. Elke speler had maar 3% kans om deze kans om te toveren in een doelpunt. En hier ligt een van de weinige zwakke punten van het xG model. Dit statistisch model houdt geen rekening met de speler zelf. Een kans voor Messi bijvoorbeeld heeft dezelfde xG waarde als voor zijn ploegmaat Gerard Piqué. Ook al is deze verdediger een zeer talentvolle speler, iedereen weet dat er meer kans is dat Messi een goal scoort dan als de bal in de voeten van Piqué valt in dezelfde omstandigheden.
De plaats waarvan het schot vertrekt is natuurlijk ook heel belangrijk. Het is in normale omstandigheden eenvoudiger om een doelpunt te scoren als men dicht bij het doelpunt staat dan wanneer men verder van het doel staat. Voor deze reden, houdt het xG model ook rekening met 3 verschillende posities:
- buiten het strafschopgebied
- in het strafschopgebied
- in de 6 meters
Voor Messi bijvoorbeeld maakt het niet veel uit waar hij zich op het veld bevindt. Zijn doelpuntstatistieken liggen hoger dan zijn xG waarde zowel buiten het strafschopgebied als binnen het strafschopgebied. Wat zeer opmerkelijk is, is dat de kleine Argentijn minder goals scoort van binnen de 6 meters dan de verwachtingen van de expected goals.
Zoals iedereen weet die al voetbal heeft gespeeld, is het gemakkelijker met zijn “goede” voet te scoren dan met zijn “slechte” voet. Voor deze reden baseert het xG model zich ook op welk deel van het lichaam gebruikt wordt om naar doel te schieten:
- linkervoet
- rechtervoet
- hoofd
- ander deel van het lichaam
De prestaties van een ploeg analyseren met het xG model
Zoals eerder gezegd, kan men naast de prestaties van een individuele speler ook de prestaties van een hele ploeg bestuderen met het model van de expected goals. De variabelen die hiervoor gebruikt zijn de volgende:
- spelsituatie: hoekschop, vrije trap, balbezetting, penalty…
- gebruikte spelformatie: 433, 442, 532…
- score: verliest met 1 goal, verliest met 2 goals, wint met 1 goal, wint met 2 goals, gelijkspel…
- wedstrijdminuut: 0 – 15de, 15de – 30ste, 30ste – 45ste…
- zone van het schot: binnen de 6 meter van de tegenstander, strafschopgebied, buiten het strafschopgebied…
- snelheid van de aanval: snelle aanval, tegenaanval…
Zoals je kan zien, wordt er rekening gehouden met een groot aantal variabelen om het xG model van een hele ploeg op te stellen. Een van de meest interessante variabelen voor de echte voetbalfan is de xG waarde in functie van de gebruikte formatie. Supporters in de hele wereld kunnen tijdens verschillende uren debatteren over welke formatie de beste is voor hun ploeg. Met het xG model is er geen discussie meer nodig. De volgende statistieken worden berekend per gekozen formatie:
- xGA: de verwachte doelpunten van de tegenstander
- xGA90: het gemiddeld aantal doelpunten door de tegenstander gedurende 90 minuten
- xGD: het verschil tussen de verwachte doelpunten tegen en voor de ploeg
Op deze eenvoudige manier, kan je dus snel zien in welke formatie, je ploeg de meest doelpunten scoort, maar ook tegen krijgt. Het is de taak van de trainer, en niet van de supporters, om dan het juiste evenwicht te vinden.
Expected goals of xG is een statistisch model dat toelaat om te zien of een speler of een hele ploeg boven of onder zijn verwachte niveau speelt. Het wordt in de hele wereld door analisten, brokers en ook supporters gebruikt om de prestaties van hun favoriete speler of ploeg te beoordelen.