Blick in die Glaskugel: Wie ich den Ausgang der Regionalliga Südwest vorhersagen
Inspiriert von theanalyst.com habe ich versucht, die Endplazierung unseres OFCs, in der aktuellen Saison, vorherzusagen. Heute nehme ich Euch mit hinter die Kulissen. Keine Sorge, es wird nicht zu kompliziert – versprochen!
Womit Ich arbeite
Für meine Vorhersage nutze ich zwei wichtige Informationen:
- Die aktuelle Tabelle: Wir schauen uns an, wie die Teams nach den ersten 9 Spieltagen dastehen.
- Erwartete Tore (xG): Das ist eine moderne Kennzahl, die uns zeigt, wie gut ein Team im Angriff und in der Verteidigung ist – getrennt für Heim- und Auswärtsspiele. Hier ein paar Beispiele:
- Kickers Offenbach: 1,88 xG (Heim), 1,69 xG (Auswärts)
- Stuttgarter Kickers: 1,67 xG (Heim), 1,56 xG (Auswärts)
- TSG Hoffenheim II: 1,72 xG (Heim), 1,48 xG (Auswärts)
- FC 08 Homburg: 1,77 xG (Heim), 1,42 xG (Auswärts)
- Diese Zahlen zeigen, wie viele Tore ein Team pro Spiel im Durchschnitt erzielen sollte, basierend auf der Qualität ihrer Torchancen.
Wie ich vorgehen
Mein Weg zur Vorhersage besteht aus mehreren Schritten:
1. Analyse der erwarteten Tore (xG)
Ich starte mit den xG-Werten jedes Teams. Diese Zahlen sagen uns mehr darüber, wie gut ein Team spielt, als nur die tatsächlich geschossenen Tore. Ein hoher xG-Wert bedeutet, dass ein Team viele gute Torchancen kreiert.
Mein Datenlieferant schreibt zur Ermittlung der Werte folgendes:
FootyStats verwendet eine Formel zur Berechnung von xG. Traditionelles xG berücksichtigt nur die Schusspositionen, während FootyStats eine Kombination aus Schussgenauigkeit (auf/abseits des Tores), Schusshäufigkeit (Anzahl der Schüsse), Gefährlichkeit des Angriffs, allgemeinem Angriffsdruck (Ballbesitz und Tiefe des Ballbesitzes) verwendet, um die erwarteten Tore für die Regionalliga Südwest zusammenzufassen. Der Grund für die Verwendung von mehr Datenpunkten zur Berechnung von xG liegt darin, dass viele Angriffe extrem gefährlich sein können, ohne dass ein Torschuss erfolgt, und die Einbeziehung anderer Daten wie Ballbesitz und Angriffstiefe die Granularität der xG-Daten für die Regionalliga Südwest erhöhen kann.
2. Simulation einzelner Spiele mit der Poisson-Verteilung
Für jedes noch ausstehende Spiel in der Saison lasse ichr den Computer sozusagen „würfeln“. Dabei nutzen wir etwas, das Mathematiker „Poisson-Verteilung“ nennen. Das klingt kompliziert, ist aber eigentlich ganz einfach:
Die Poisson-Verteilung hilft uns, zufällige Ereignisse vorherzusagen, die mit einer bestimmten Häufigkeit auftreten – wie zum Beispiel Tore in einem Fußballspiel. Sie berücksichtigt, dass Tore selten sind und unabhängig voneinander fallen.
Stellt euch vor, ihr habt einen speziellen Fußball-Würfel. Wenn ein Team einen xG-Wert von 1,5 hat, bedeutet das, dass dieser Würfel im Durchschnitt 1,5 Tore pro Spiel anzeigt. Manchmal zeigt er 0, manchmal 1, manchmal 2 oder sogar mehr Tore an – aber im Durchschnitt kommt 1,5 heraus.
Für jedes Spiel „würfele“ ich so für beide Teams, einmal mit dem Heim-xG und einmal mit dem Auswärts-xG. Das Ergebnis dieses Wurfs sagt mir, wie das Spiel ausgehen könnte.
3. Viele Wiederholungen mit der Monte-Carlo-Methode
Um dem Zufall eine Chance zu geben, lasse ich den Computer die restliche Saison gleich 250 Mal durchspielen. Diese Technik nennt man „Monte-Carlo-Simulation“, benannt nach dem berühmten Casino in Monaco.
Warum machen wir das? Nun, stellt euch vor, ihr würfelt einmal für ein Spiel und bekommt ein 3:0. Ist das repräsentativ? Vielleicht nicht. Aber wenn ihr 250 Mal würfelt und den Durchschnitt nehmt, bekommt ihr ein viel genaueres Bild davon, was wahrscheinlich passieren wird.
So funktioniert meine Monte-Carlo-Methode: Wir simulieren die gesamte Restsaison 250 Mal, jedes Mal mit neuen Zufallszahlen für jedes Spiel. Am Ende nehme ich den Durchschnitt all dieser Simulationen. Das gibt eine stabilere und zuverlässigere Vorhersage.
4. Berechnung der erwarteten Punkte
Für jede dieser 250 Saisons zähle ich die Punkte jedes Teams. Der Durchschnitt daraus ergibt dann die erwarteten Punkte für den Rest der Saison.
5. Kombination mit der aktuellen Tabelle
Zum Schluss addiere ich diese erwarteten Punkte zu den Punkten, die jedes Team bereits nach 9 Spieltagen hat. So verbindet sich die tatsächliche Leistung mit meiner Vorhersage.
Das Ergebnis
Meine Methode liefert eine Vorhersage für die Abschlusstabelle. Hier ein Blick auf die Top 5:
- Kickers Offenbach: 65 Punkte
- Stuttgarter Kickers: 64 Punkte
- TSG Hoffenheim II: 61 Punkte
- FC 08 Homburg: 60 Punkte
- SC Freiburg II: 59 Punkte
Was das bedeutet
Die Vorhersage ist zwar datenbasiert, aber natürlich nicht perfekt. Ein paar Dinge müssen wir bedenken:
- Die Simulation geht davon aus, dass alle Teams so weiterspielen wie bisher.
- Verletzungen, Transfers oder Formkrisen können nicht vorhergesehen werden
- Würden die Berechnung mehrmals durchgeführt werden, könnten die Ergebnisse leicht anders aussehen.
Zum Schluss
Die Methode verbindet die aktuelle Leistung mit einer statistischen Vorhersage. Sie gibt uns eine interessante Perspektive darauf, wie die Saison in der Regionalliga Südwest weitergehen könnte.
Aber denkt immer daran: Fußball wird auf dem Platz gespielt, nicht auf dem Papier. Die Spannung des Sports liegt ja gerade darin, dass alles passieren kann.
Ich bin gespannt, wie die Saison tatsächlich ausgehen wird. Die Simulation werde ich regelmäßig wiederholen, mal sehen, wie sich das entwickelt.