Matchplan Sports

Statistik im Fußball: Eine Analyse

Advanced Stats, also fortgeschrittene beziehungsweise erweiterte Statistiken, nehmen eine immer größere Rolle im Sportjournalismus ein. Doch was genau leisten sie, was althergebrachte Statistiken nicht können? Und sind die bisher eingesetzten Statistiken tatsächlich aussagekräftig? Steht der Sport vor einer Daten-Revolution? Eine Einschätzung am Beispiel des Fußballs.

Wie erkenne ich Advanced Stats?

Ein Indikator dafür, dass es sich bei einer Statistik um eine Advanced Stat und nicht um eine Standardstatistik handelt, ist ihre Komplexität. Am ehesten kann man sich der Begriffsbedeutung durch ein Ausschlussverfahren nähern. Tore im Fußball gehören eindeutig zu dem, was wir als Standardstatistik erachten. Ihre Erfassung hat Tradition, Tore sind für den Ausgang des Spiels unabdingbar. Auch Assists – also Zuspiele, die zu einem Treffer führen – zählen zu den Standardstatistiken. Die prozentuale Wahrscheinlichkeit, mit der ein Assist zu einem Tor führt, gehört hingegen schon zu den fortgeschrittenen Statistiken, die schwieriger und zum Teil nur mit Hilfe technischer Hilfsmittel wie zum Beispiel Kameras erfasst werden können.

Ziel von Advanced Stats ist es, vergangene Leistungen eines Spielers oder Teams zu bewerten und gleichzeitig auch Schlüsse auf künftige Leistungen zuzulassen. Diese Vorhersagen haben den Anspruch, möglichst repräsentativ zu sein und sich soweit möglich in den tabellarischen Platzierungen widerzuspiegeln.

Voraussetzung dafür ist eine möglichst große Datenbasis. Diese kann zum einen dadurch erzielt werden, dass eine Vielzahl von Spielen untersucht wird. Darüber hinaus müssen in diesen Spielen möglichst viele und klar voneinander abgrenzbare Spielsituationen vorhanden sein. Zusätzlich muss das untersuchte Ereignis in jedem Spiel häufiger eintreten: Tore zum Beispiel fallen in vielen Sportarten zu selten, um als repräsentativ zu gelten. Dort setzen Advanced Stats an, indem sie Ereignisse untersuchen, die häufiger passieren – zum Beispiel Schussversuche.

Dadurch, dass Advanced Stats unter anderem im Basketball, American Football, Baseball, Fußball und Hockey zum Einsatz kommen, gibt es sehr viele Werte, die man überprüfen könnte. Dieser Artikel beschränkt sich auf die Sportart mit den meisten Zuschauern in Deutschland: Fußball. Hier wurden diverse Advanced Stats ausgewählt und kritisch hinterfragt. Ihre Aussagekraft wurde zusätzlich von Jörg Rahnenführer, Professor für Statistik an der TU Dortmund, eingeschätzt. Er beschäftigt sich unter anderem mit Statistiken in Sport und Journalismus.

Advanced Stats im Fußball

Bevor Advanced Stats im Fußball erhoben wurden, untersuchte man lediglich Faktoren wie die Anzahl der Tore, der Torschüsse, der Eckstöße, der Ballkontakte sowie Ballbesitz und Laufstrecke. Der Einsatz von Advanced Stats wurde jedoch als sinnvoll erachtet, da Fußball zu den Sportarten gehört, in denen zu selten Treffer – also Tore – erzielt werden, als dass die Datenmenge aussagekräftig wäre. Zusätzlich sind diese häufig vom Zufall und nicht allein von der Leistung der Spieler abhängig. Auch wenn Advanced Stats präziser als Standardstatistiken sind, können auch sie nicht alle Faktoren berücksichtigen. Hier wird nun analysiert, welche Aspekte ausgewählte Advanced Stats aus dem Fußball gut beziehungsweise weniger gut erfassen können.

Expected Goals (xG)

Diese Statistik lässt sich vor allem auf die Offensive anwenden. Sie versucht nämlich die Frage zu beantworten, wie viele Tore ein Spieler oder Team angesichts der Positionen, von denen aus geschossen wurde, hätte schießen müssen, wenn die Bälle mit durchschnittlicher Wahrscheinlichkeit verwandelt worden wären. Für die Errechnung der zu erwartenden Tore (xG) wird auf Spieldaten von vergangenen Partien zurückgegriffen. Die Firma Opta hat 300.000 Schüsse analysiert.

Es wird berechnet, mit welcher Wahrscheinlichkeit ein Schuss im Tor landen würde, wenn man ihn immer wieder von der gleichen Position wiederholen würde. Ein Elfmeter hat beispielsweise einen Wert von 0,76, landet also in 76 Prozent der Fälle im Tor. Schießt ein Spieler ein Tor aus einer vielversprechenden Position, bekommt er Pluspunkte, allerdings nur wenige. Verfehlt er das Tor aus einer schlechten Position, bekommt er zwar Minuspunkte, aber davon ebenfalls wenige. Schießt ein Spieler ein Tor aus einer schlechten Position, bekommt er viele Pluspunkte. Verfehlt er aber das Tor aus einer guten Position, bekommt er Minuspunkte und davon ziemlich viele.

Ein verschossener Elfmeter schadet dem xG-Wert eines Spielers also. Es lässt sich errechnen, wie viele Tore ein Spieler bzw. eine Mannschaft hätte schießen müssen, wenn sie von ihren Schusspositionen mit durchschnittlicher Wahrscheinlichkeit getroffen hätten. Die zu erwartenden Tore für eine Partie oder Saison lassen sich dann mit den tatsächlich erzielten Toren vergleichen. Liegt die Anzahl der tatsächlich erzielten Tore über der zu erwartenden Zahl, spricht das für eine hohe Qualität.

Bezüglich der Aussagekraft von Expected Goals fällt zunächst positiv auf, dass bei der Berechnung der Trefferwahrscheinlichkeit Faktoren wie die Art des Assists, der Schusswinkel, die Distanz zum Tor, das Körperteil, mit dem das Tor erzielt wird, und die Chancengröße bereits berücksichtigt werden. Das Konzept, das Großchancen eine größere Aussagekraft zuordnet als Toren, um die Faktoren Glück und Zufall zu minimieren, ist sinnvoll: Eine Mannschaft, die ihre Großchancen konstant verwandelt, hat auf lange Sicht bessere Aussichten als eine Mannschaft, die aktuell mehr Tore schießt, da Tore immer stark mit dem Faktor Zufall verbunden sind. Das hat sich insofern bewahrheitet, als dass die xG-Werte eng mit den Gesamt-Ligapunkten und dem finalen Tabellenplatz verknüpft sind.

Zusätzlich hilft die xG-Statistik dabei, Einzelspieler gerechter zu bewerten. Ein Spieler, der stets schlechte Vorlagen bekommt, verwandelt zwangsläufig weniger, ist deshalb aber nicht zwingend ein schlechterer Stürmer. Die Erhebung findet auf Basis von Torschüssen statt. Die kommen zwar häufiger vor als Tore, sind aber lange nicht so repräsentativ wie zum Beispiel Pässe, die in einem Spiel ja deutlich häufiger vorkommen.

Jedoch wird lediglich erhoben, wie gut ein Offensivspieler die Chance finishen, nicht wie gut er sie kreieren kann. Wer zufällig gut steht, eine super Vorlage bekommt und nur noch ins leere Tor schießen muss (wenige Pluspunkte) und wer auf gut Glück einen Weitschuss vorbeischießt (wenige Minuspunkte), schneidet besser ab als ein Spieler, der sich eine gute Chance selbst erarbeitet hat, jedoch kurz vor dem Tor scheitert (viele Minuspunkte).

Zudem wird nicht berücksichtigt, wie regelmäßig und wie lange ein Spieler auf dem Platz steht. Spieler, die immer nur kurz eingewechselt werden, in dieser Zeit aber verlässlich treffen, werden besser bewertet als jene, die länger spielen, somit häufiger auf das Tor zielen und dementsprechend auch häufiger das Tor verfehlen. Es wird ebenfalls nicht die Unterschiedlichkeit der Spieler berücksichtigt: Jeder Spieler hat individuelle Spiel- und Schusstechniken. Während dem einen Spieler eine Position besonders gut liegt und er aus ihr mit hoher Wahrscheinlichkeit trifft, liegt sie einem anderen Spieler nicht.

Wie viele Gegenspieler sich zum Zeitpunkt des Schusses zwischen Ball und Netz befinden, wie weit der Schütze vom nächsten Defensivspieler entfernt ist, wie groß der Abstand zwischen Torwart und Torlinie ist, wie gut der Blockversuch des Defensivspielers ist und wie sich das verteidigende Team grundsätzlich formiert hat, wird bislang noch zu wenig erfasst.

Non-Shot based expected goals (NSxG)

Diese Statistik lässt sich auf die gesamte Mannschaft anwenden, denn sie untersucht, wie gut eine Mannschaft Ballbesitz in Schüsse umwandelt und wie viele Tore ein Team angesichts seiner „Nicht-Schuss-Aktionen“ hätte schießen müssen. Als „Nicht-Schuss-Aktionen“ erhoben werden Pässe, abgefangene Bälle, Ballgewinne und Tacklings. Diese Aktionen führen nämlich zu Ballbesitz, der wiederum die Voraussetzung ist, um Tore schießen zu können. Jeder Position auf dem Feld wird ein bestimmter Wert zugeschrieben, der aussagt, mit welcher Wahrscheinlichkeit aus einem Ballbesitz in dieser Position ein Tor entsteht.

Während ein Ballbesitz in der eigenen Hälfte eine geringe Chance bietet, ein Tor zu erzielen, bringt Ballbesitz in der gegnerischen Hälfte eine größere Torgefährlichkeit mit sich. Wenn ein Passspiel die Chance des eigenen Teams verbessert, gibt es Credits für den Passspieler und den Passempfänger. Bei groben Fehlpässen bekommt der Passempfänger des gegnerischen Teams Credits.

Bezüglich der Aussagekraft der NSxG-Statistik lässt sich zunächst festhalten, dass es in Bezug auf den Ballbesitz mehr Daten als bei Torschüssen oder gar Toren gibt, da diese vergleichsweise selten geschehen. Obengenannte Aktionen wie Pässe oder Tacklings erfordern Eigeninitiative und kommen nicht allein durch Fehlpässe des Gegners zustande, sodass die Statistik Aussagen über einzelne Spieler zulässt.

Wenn ein Spieler sich häufig zur richtigen Zeit in die Passlinie stellt, hat er ein gutes Gespür dafür, wohin der Gegner den Ball spielen will, was zweifelsohne eine Qualität ist, die es zu erkennen lohnt. Doch auch diese Statistik ist nicht ohne ein Aber. Dass der Gegner durch einen Fehlpass eine Menge NSxG erhält, kann kritisch gesehen werden. Schließlich ist kein großes Können erforderlich, um zufällig einen Fehlpass vor die Füße gespielt zu bekommen. Sinnvoller wäre es, der Mannschaft, die den Fehler macht, den Credit abzuziehen, statt ihn der unbeteiligten Mannschaft gutzuschreiben.

Expected Goals Chain (xGC)

Auch die Expected Goals Chain lässt sich auf die gesamte Mannschaft anwenden. Sie versucht die Frage zu klären welche Spieler generell – nicht nur welche Offensivspieler – für einen Sieg oder eine Niederlage verantwortlich sind. Die xGC erfasst jeden Pass, jeden Schuss, jedes Foul und jede Defensivaktion, die letztlich zu einem Expected Goal oder Expected Assist führt. Die Wahrscheinlichkeit, mit der der letzte Schuss in einem Tor oder einem Assist geendet hätte, wird jedem daran beteiligten Spieler angerechnet.

Diese Methode erfasst nicht nur Schüsse, sondern auch diverse andere Werte. Diese große Datenbasis trägt zu einer besseren Aussagekraft bei. Anders als bei Expected Goals und Expected Assists, bei denen vor allem die Stürmer und das offensive Mittelfeld betrachtet werden, berücksichtigt die xG Chain jeden involvierten Spieler, sodass auch die Spieler, die am Spielaufbau beteiligt sind, profitieren.

Allerdings gibt es an einigen Stellen noch Defizite bei der Umsetzung: Beispielsweise bekommt ein Spieler, der mit fünf Pässen an einer Sequenz beteiligt war, genauso viele Credits wie ein Spieler, der nur mit einem Pass daran beteiligt war. Dabei ist der entscheidende Pass im Strafraum in der Regel schwieriger als ein unbedrängter Pass in der eigenen Defensive. Außerdem ist die letzte Schussposition dafür relevant, wie viele Credits alle Beteiligten bekommen. Wenn der finale Pass schlecht gespielt wurde, bekommen gegebenenfalls alle Beteiligten keine Credits, egal wie gut sie mitgewirkt haben.

Expected Goals bei Defensivspielern

Diese Statistik lässt sich auf die Defensive anwenden und versucht die Qualität von Defensivspielern auch dann zu messen, wenn diese nicht im Ballbesitz sind. Hierbei wird in Form von xG erhoben, wie effektiv die gegnerische Offensive ist und folgender Umkehrschluss gezogen: Je weniger erfolgreich die gegnerische Offensive, desto besser der Defensivspieler. Das ist ein positiver neuer Ansatzpunkt, weil zur Bewertung von Spielern meist nur die Situationen, in denen besagte Spieler selbst im Ballbesitz sind, betrachtet werden und dadurch Defensivspieler zum Teil vernachlässigt werden. Allerdings gibt es auch bei dieser Statistik kritische Aspekte. Beispielsweise wäre es möglich, dass ein Defensivspieler – auf Grund des Fehlers seines Mitspielers – eine torgefährliche Situation nicht verhindern kann. Das sagt dann aber nicht zwangsläufig etwas über die Qualität des Defensivspielers aus.

Packing

Die Packing-Statistik hat Spieler auf allen Positionen im Blick. Sie erfasst, wie viele Gegner, die sich zwischen dem ballführenden Angreifer und dem gegnerischen Tor befinden, mit einem Pass oder Dribbling überspielt werden. Zusätzlich wird erfasst, wie viele Verteidiger mit einem Pass oder Dribbling überspielt werden, hierfür wird ein weiterer Wert (der Impact-Wert) berechnet.

Ein positiver Aspekt – und sogar einer, der entscheidend zur Entstehung der Statistik beigetragen hat – ist der, dass defensive Mittelfeldspieler bei statistischen Erhebungen mitberücksichtigt werden. Schließlich sind sie auch oft an Angriffen beteiligt, tauchen in den Statistiken aber kaum auf. Auch die Idee, einen separaten Wert für überspielte Verteidiger zu erheben, erscheint sinnvoll. Schließlich ist das Ausschalten von Verteidigern eine sehr effektive Methode, die maßgeblich zum Torerfolg beiträgt. Mit den Packing-Werten kann ermittelt werden, welche Spieler häufig an Offensivaktionen als Passgeber oder Passempfänger beteiligt sind. Er lässt zudem Schlüsse auf die Qualität eines Teams zu.

Der Wert berücksichtigt jedoch nicht, ob der Pass beziehungsweise das Dribbling zu einer erhöhten Torgefahr führt. Mit einem Pass Richtung Seitenlinie kann man genauso viele Spieler überspielen wie mit einem torgefährlichen Pass in den Strafraum. Würde man nur nach der Anzahl an überspielten Spielern gehen, hätte zudem der Torwart die beste Packing-Rate und wäre am häufigsten an Offensivaktionen beteiligt. Dementsprechend lässt die Packing-Rate auch keine Schlüsse auf das Endergebnis eines Spieles zu.