Zahlenverlagerung: Die Hinrunde der Bundesliga

von TE am 13.01.2016 in den Kategorien Bundesliga,Featured,Statistik mit 64 Kommentaren

Gelangweilt von Ballbesitzwerten und Zweikampf-Statistiken? Spielverlagerung hat aus den Daten von Whoscored.com interessante Statistiken zur Hinrunde der Bundesliga gebastelt.

Spielverlagerung pflegt zu Statistiken im Fußball eine Art Hassliebe. Zahllose Kommentatoren und Journalisten nutzen wenig aussagekräftige Zahlenspiele, um ihre Argumentation zu untermauern. Zweikampfstatistiken bspw. sagen sehr wenig über die Qualität eines Spielers aus. Wenn ein Spieler eine Zweikampfquote von 100% aufweist, kann das schlicht heißen, dass er einen einzigen Zweikampf bestritten hat – wohingegen ein Spieler mit 25% Zweikampfquote sich im Pressing in jeden Zweikampf wirft und alleine damit seinem Team hilft.

Doch nicht alle Statistiken sind schlecht. Blogger wie die Kollegen von Statsbomb zeigen, wie man Statistiken im Fußball gewinnbringend einsetzen kann. Auch immer mehr Fußballteams entdecken die Macht der Zahlen und stellen Statistiker an. Auch wir wollen dem Trend folgen und ein paar interessante Statistiken zur Bundesliga anbieten. Alle Werte sind selbst berechnet; mal mit komplexeren, mal mit weniger komplexen Formeln. Als Grundlage dienen die Daten von Whoscored.com. Dort findet man relevante Zahlen zu Team- und Spielerstatistiken, sei es Ballbesitz-Zahlen, Passwerte oder umfangreiche Defensiv-Statistiken.

Leistungsdiagnose: TSR und SoTR

Bereits in einer Spieltags-Kolumne kam der TSR-Wert vor. TSR steht für Total Shots Ratio, übersetzt so viel wie Schussquotient. Man bildet einen Quotienten aus abgegebenen und erhaltenen Schüssen. Die Rechnung lautet: Abgegebene Schüsse/ (Abgegebene Schüsse + erhaltene Schüsse). Einfacher formuliert: Ein TSR von 0.500 bedeutet, dass ein Team exakt so viele Schüsse abgegeben hat wie ihre Gegner. Der SoTR funktioniert ähnlich, nur dass hierbei nur Schüsse zählen, die aufs Tor gingen.

Die Idee dahinter: Wer mehr Schüsse abgibt als der Gegner, hat eine höhere Wahrscheinlichkeit, ein Tor zu erzielen. Fußball ist ein „low scoring game“, d.h., wenige Punkte (=Tore) entscheiden über den Spielausgang. Glück und Pech spielen oftmals eine Rolle, wenn es um den Spielausgang geht. Der TSR und SoTR soll die wahre Stärke der Teams zeigen, jenseits von Punkten. Der Statistik-Blogger James Grayson hat bereits nachgewiesen, dass TSR stark mit dem Tabellenstand am Ende der Saison korreliert.

Copy: Bundesliga TSR Create column charts

Was zeigen uns TSR und SoTR? Die Bayern sind in beiden Statistiken weit voraus. Auch Dortmund, Leverkusen und Wolfsburg haben die erwartet hohen Werte. Hertha, Mainz und Köln haben in der Hinserie viele Punkte aus einem recht geringen TSR gemacht. Bei Hertha relativiert sich dieser Eindruck mit einem Blick auf den SoTR. Offenbar gelingt es Hertha, selbst viele Schüsse aufs Tor zu bringen, während der Gegner öfter neben das Tor schießt. Der VfB Stuttgart lag bis zur Hälfte der Hinserie in den Top 5 bei TOR und SoTR. In den vergangenen Wochen war die Tendenz jedoch rückläufig. Schlusslicht in beiden Statistiken sind Hannover 96 und TSG Hoffenheim. Ihr Tabellenstand spiegelt sich in ihrem Schussverhältnis.

Spielphilosophie: Ballbesitz und Passwerte vertieft

Ballbesitz und Passgenauigkeit sind zwei der beliebtesten Statistiken unter Kommentatoren und Journalisten. Der Blick auf Ballbesitz und Passgenauigkeit lässt Schlüsse auf den Stil einer Mannschaft zu; je höher der durchschnittliche Ballbesitz und die Passgenauigkeit, desto stärker spielt ein Team auf Ballbesitz. Doch wie kann man diese Werte noch vertiefen?

Gerade mit der Passgenauigkeit lässt sich schnell errechnen, welchen Stil ein Team spielt. In der folgenden Grafik sieht man zwei Werte: die eigene Passgenauigkeit (Y-Achse) und die gegnerische Passgenauigkeit (X-Achse). Es sind aber keine absoluten Werte, sondern relative. Bayer Leverkusen bspw. hat als Pressing-Team das Interesse, die gegnerische Passgenauigkeit zu drücken. Der Gegner soll nicht seine durchschnittliche Passgenauigkeit erreichen. Leverkusens Gegner waren im Durchschnitt 8,48% unter der eigenen Durchschnitts-Passgenauigkeit. Bayern wiederum gelingt als Ballbesitz-Team durchschnittlich eine 15,18% höhere Passgenauigkeit als der Gegner sonst durchschnittlich zulässt.

Pressing-Daten Rückrunde
Create your own infographics

Es ergeben sich vier logische Quadranten: Oben links die Dominanz-Teams, die sowohl über ihr Passspiel als auch über ihr Pressing dominieren (Bayern, BVB). Unten links die Umschaltmonster, die hart pressen und ungenau passen, also riskanter spielen (VfB, Ingolstadt; Bayer mit stärkerer Passgenauigkeit). Oben rechts sind die ruhig spielenden Teams, die nicht aggressiv pressen und genau passen, also ruhig aufbauen (Hertha, Gladbach, mit Abstrichen Schalke). Und unten rechts, da findet sich Darmstadt – das Kick’n‘ Rush Team mit wenig Pressing.

Die zweite Idee: die Ballbesitzwerte konkretisieren. Der Durchschnittswert verrät bereits viel über den Spielstil – je höher der Ballbesitzwert, desto stärker spielt das Team auf Ballbesitz (logisch). Allerdings kann sich ein Team nicht den Ballbesitzwert aussuchen. Ein Fußballspiel besteht aus zwei Parteien – und eine muss am Ende einen höheren Ballbesitzwert haben. Die folgende Statistik bildet ab, in wie vielen Spielen ein Team wie viel Ballbesitz hatte. Die Werte sind eingeteilt in Spiele mit über 60%, 50-60%, 40-50% und unter 40%.

Ballbesitz pro Spiel Bundesliga
Create column charts

Die Bayern sind das einzige Team, das in jedem Spiel mehr Ballbesitz hatte als der Gegner. Wolfsburg hatte nur gegen die Bayern weniger Ballbesitz. Allgemein fällt auf, dass die vorderen Teams der Tabelle öfter ein Ballbesitzplus haben. Hertha und Schalke tanzen aus der Reihe. Schalke ist ein interessanter Fall: Sie haben mit knapp über 50% den sechsthöchsten Ballbesitzwert der Liga. Dennoch hatten sie in neun der siebzehn Spiele weniger Ballbesitz als ihr Gegner. Extremen Schwankungen unterlegen ist der FC Augsburg, mit vier Spielen über 60%, aber auch zehn Spielen unter 50%. König der ballbesitzlosen Teams ist (natürlich) Darmstadt, dicht gefolgt von der TSG Hoffenheim. Interessant auch: Ingolstadt hatte mehr Spiele mit einem Ballbesitzplus als Werder.

Exkurs: Ballbesitz nach Spielstand

Schalkes Ballbesitz-Statistik brachte mich auf einen Gedanken: Wie verhält es sich mit dem Ballbesitz nach Spielstand? Mich wundert immer, dass die großen Statistik-Anbieter diesen Wert nicht aufweisen. Er sagt viel über die Philosophie einer Mannschaft aus: Setzt sie nach einer Führung auf Konter und zieht sich zurück? Oder spielt sie weiter auf Ballbesitz? Ich habe die Daten von drei Teams analysiert: Bayern, BVB und Schalke.

Ballbesitz nach Spielstand
Create column charts

Die Bayern habe ich zur Prüfung meiner Methodik gewählt, weil ich hier klare Erwartungen an die Werte hatte: Die Bayern haben auch nach einer Führung so viel Ballbesitz wie beim Stande von 0:0. Dortmunds Philosophie ist leicht anders. Auch sie haben nach Führungen weit über 50% Ballbesitz, allerdings merklich weniger als beim Stande von 0:0 oder bei einem Rückstand. Schalke wiederum ist der extremste Fall: Bei einem Rückstand 56% Ballbesitz, bei einer Führung jedoch nur 43% – das deutet daraufhin, dass Schalkes Strategie stark vom Spielstand abhängig ist. (Ein interessantes Nebenprodukt dieser Statistik: Der BVB lag in dieser Saison mehr Minuten in Führung als der FC Bayern.)

Warum weist die Statistik ein 0:0, aber keine Unentschieden aus? Hierbei würden zu viele verzerrende Faktoren reinspielen. Bei einer Führung oder einem Rückstand sind die Rollen klar verteilt: Ein Team muss treffen, um mindestens einen Punkt zu holen. Doch bei Unentschieden kommt oft der psychologische Faktor hinzu. Das Team, das ausgeglichen hat, drückt weiter, das Team, das gefangen hat, will zurückschlagen oder begnügt sich mit dem Ergebnis, je nachdem, wer der Favorit ist. Ich habe sie der Einfachheit halber rausgelassen.

Warum habe ich diese Statistik nicht für alle Bundesligisten berechnet? Ganz einfach: Ich musste die Daten per Hand sammeln. Das kostet Zeit. Viel Zeit. Die Art von „Wieso zur Hölle verschwendest du deine Zeit damit?“-Zeit. Leider gibt es keinen automatisierten Weg – bisher. Vielleicht liest ja ein Statistikanbieter mit und bietet die Werte bald automatisiert an.

Chancenverwertung: Schüsse pro Tor

Ein einfacher Weg, die Chancenverwertung eines Teams zu analysieren, ist die Rechnung Schüsse geteilt durch Tor. Sie gibt wieder, wie viele Schüsse ein Team braucht, um ein Tor zu erzielen. Das gleiche Spiel lässt sich natürlich auch für die Schüsse wiedergeben, die ein Team erhält.

Chancenwertung Bundesliga
Create your own infographics

Auffällig: Die Spitzenteams der Liga brauchen weniger Schüsse pro Tor. Bayern, Hertha, Gladbach, Mainz sind oben links im Diagramm – genau dort möchte man hin. Stuttgart und Bremen wiederum brauchen signifikant mehr Schüsse für ein Tor als ihre Gegner. Ingolstadt ist ein Sonderfall: Sie haben die schlechteste Schussverwertung der Liga, ihre Gegner sind aber nicht viel besser. Das Ganze lässt sich natürlich auch für einzelne Spieler berechnen:

Schüsse pro Tor Bundesliga Spieler
Create column charts

Chicharito und Aubameyang sind nicht nur in der Torschützenliste weit vorne, sie brauchen auch die wenigsten Schüsse für ein Tor. Lewandowski wäre ihnen mit einer besseren Schussverwertung weit voraus. Ingolstadt wiederum hätte das angesprochene Verwertungsproblem nicht, wenn Pascal Groß Zielwasser trinken würde. Der Spieler mit den meisten Schüssen ohne Torerfolg ist übrigens Ilkay Gündogan.

Spielerqualität: Chancen kreieren

Scorer-Punkte sind eine beliebte Statistik, um die herausragenden Angreifer einer Mannschaft zu küren. Hierbei werden Tore mit Assists addiert. Diesen Wert kann man auch auf Schussbeteiligungen übertragen. Ich habe Schüsse und key passes (Pässe, die zu einem Schuss geführt haben) addiert. Zur besseren Vergleichbarkeit habe ich die Werte auf 90 Minuten hochgerechnet, also Schussbeteiligungen pro 90 Minuten. Berücksichtigt wurden nur Spieler, die mindestens 750 Minuten (also rund die Hälfte der Hinrunde) gespielt haben.

Torschussbeteiligungen pro 90 Minuten
Create column charts

Calhanoglu führt das Ranking vor Lewandowski an. In den Top 10 tummeln sich viele der üblichen Verdächtigen von Bayern, Leverkusen und Dortmund. Caiuby, Didavi und Groß hätte ich dort nicht erwartet. Vidal und Geis sind die einzigen Sechser bzw. Achter, die es in die Top 25 geschafft haben (wobei Junuzuvic auch oft auf der Acht spielte.) Ansonsten wird das Ranking von offensiven Mittelfeldspielern und Stürmern dominiert. VfB-Fans und Zorniger-Kritikern sei gesagt: Alexandru Maxim wäre weit oben in den Top 10 gelandet, hat allerdings nicht die benötigten 750 Minuten Spielzeit erhalten. Wenn man diese Statitik weiterdenkt, kann man errechnen, wie abhängig ein Team von einem bestimmten Spieler ist. An wie vielen Schüssen des Teams war ein Spieler beteiligt?

Torschuss Abhängigkeit
Create column charts

Ein alter Bekannter grüßt uns von der Spitze der Liste: Pascal Groß. Er war an fast der Hälfte der Ingolstädter Schüsse beteiligt – ein phänomenaler Wert. Dahinter folgen vor allem die Schlüsselspieler kleinerer Teams. Mkhitaryan und Aubameyang haben ebenfalls hohe Werte, auf jeden Fall höhere als die Bayern-Spieler. Die Bayern scheinen etwas mehr Varianz bei ihren Schussbeteiligungen zu besitzen.

Spielerqualität: Verteidigen

Bislang ging es um die Offensivstärken der Spieler. An dieser Stelle wollen wir uns der Defensive widmen. Whoscored weist viele einzelne Werte für Defensivaktionen aus: Tacklings, Interceptions (abgefangene Pässe), Clearances (Ball aus der Gefahrenzone befördert), geblockte Schüsse – alles einzelne Werte. Doch was kommt heraus, wenn man die Werte kombiniert? Ich habe zwei Werte berechnet: Einmal die Anzahl der erfolgreichen Defensivaktionen pro 90 Minuten, also nur gewonnene Tacklings sowie Interceptions. Und dann noch die Anzahl der ausgeführten Defensivaktionen pro 90 Minuten.

Defensivaktionen
Create column charts

Die Top 10 bietet einige Spieler, die man dort nicht erwartet hätte – allen voran Werders Sechser Philipp Bargfrede auf dem Spitzenrang. Wendell wiederum dürfte als Außenverteidiger in Leverkusens Pressing-System viel zu tun haben. Überhaupt: Die Liste wird dominiert von Teams, die defensiv viel zu tun haben. Vom BVB findet sich kein Spieler in den Top 30, von den Bayern nur Kampfschwein Vidal. Auffällig zudem: Xhaka und Guilavogui haben niedrige Werte, was die Gesamtanzahl der Defensivaktionen angeht. Sie punkten mit einer hohen Erfolgsquote.

Spielerphilosophie: Ballverluste

Bislang gab es vor allem positive Statistiken. Bei so viel Lobhudelei braucht es eine negative Statistik als Ausgleich: Ballverluste. Hier zählen alle Situationen hinein, in denen ein Spieler dem Gegner den Ballbesitz geschenkt hat: Fehlpässe, schlechte Ballannahmen, verlorene Zweikämpfe. Was ich nicht mit hineinzähle: Schüsse (als Abschluss eines Angriffs). Auch diese Werte sind auf 90 Minuten hochgerechnet.

Ballverluste mit Pässen
Create column charts

Auch diese Statistik führt Pascal Groß an. Dahinter tummeln sich zahlreiche Spieler von Leverkusen, Stuttgart und Ingolstadt. Das riskante Spiel in die Spitze, das die drei Teams kultivieren, zeigt sich auch auf individueller Ebene. Die Bayern finden sich nicht in dieser Liste – das spricht für ihre Passstärke. Dortmund hingegen ist mit Gündogan und Mkhitaryan vertreten.

Was für Werte kommen heraus, wenn man die Fehlpässe nicht berücksichtigen? Also nur schlechte Ballannahmen, verlorene Zweikämpfe sowie misslungene Dribblings.

Ballverluste ohne Pässe
Create column charts

Dieses Ranking ist ein Stelldichein der Dribbler der Liga. Der umworbene Sane führt das Ranking an. Er probiert viel, wobei auch viel schiefgeht. Coman und Costa fallen durch ihre vergleichsweise niedrigen Werte auf – und das, obwohl sie mehr Dribblings wagen als die meisten anderen Spieler. Hier spiegelt sich ihre ganze individuelle Klasse wieder. Choupo-Moting, Bellarabi und Kostic können hier nicht mithalten.

Was haltet ihr von diesen Statistiken? Was hat euch überrascht, was habt ihr so erwartet? Was könnte man mit diesen Zahlen noch machen? Ich freue mich auf euer Feedback.

Artikel von TE

TE ist wie Thomas Tuchel: Lange Zeit predigte er die Vorteile eines schnellen Umschaltspiels, mittlerweile weiß er aber auch ein gutes Ballbesitzspiel zu schätzen. Autor des Buchs "Vom Libero zur Doppelsechs" über die Geschichte der Fußballtaktik in Deutschland. Bei Spielverlagerung kümmert er sich hauptsächlich um die Bundesliga und die Nationalmannschaft. Er ist auch bei Twitter aktiv unter @TobiasEscher.

64 Kommentare Alle anzeigen

Muellergerd 19. Januar 2016 um 21:39

Vielen Dank für die interessante und aufwändige Arbeit. Das muss ja einige Nächte gedauert haben….. Super gemacht !

Antworten

zer0 19. Januar 2016 um 15:51

Schöne Arbeit, das muss ja ne ganze Menge Zeit gekostet haben.
Was mich interessieren würde, wäre eine zusätzliche Normierung der Defensivaktionen mit dem gegnerischen Ballbesitz. Vielleicht kommt da ja etwas Interessantes heraus, etwa wer am besten verteidigt oder auch indirekt wo (weil von wem) der Gegner am häufigsten erfolgreich attackiert wird.

Antworten

Avogadro 19. Januar 2016 um 11:00

Zuerstmal grosses Lob und Dankeschön für die zahlenspielerei!

Kleine Anmerkung:
Ich finde es auch interessant, Statistiken (bspw. Fouls, (Tor)schüsse, Defensivaktionen,…) ballbesitzbereinigt darzustellen. Es ergibt ja einen Unterschied zwischen gleiche vielen Aktionen / 90 min bei „doppeltem“ Ballbesitz.

Antworten

kadeho 18. Januar 2016 um 11:50

Sehr interessanter und auch unterhaltsamer Artikel (da jeder seine Annahmen mit der statistischen Realität messen kann). Interessant fände ich „Ballverluste ohne Pässe“ in Relation zu angesetzten Dribblings. So würde, wenn auch ungenau, ermittelt wer wirklich gut/effektiv dribbelt (wie im Text angemerkt: Coman und Costa).

Antworten

festi 17. Januar 2016 um 20:41

großartige übersicht. danke dafür! gerne mehr davon.

kommt eigentlich jeder an die daten von whoscored?

Antworten

TE 17. Januar 2016 um 21:36

Klar. Einfach auf die Seite surfen und dort die Team und Player Statistics aufrufen. Kannst sogar detaillierte Statistiken anwählen und selber ein bisschen rumspielen.

Antworten

ES 17. Januar 2016 um 01:04

Kann mich erst einmal nur den vielen Lobenden anschließen. Wahnsinns-Arbeit, sehr spannende und aussagekräftige Ergebnisse, verständlich aufbereitet. Großartig! Als Anmerkungen (Fragen) nur Folgendes:
1) Auch wenn ich hier wieder Widerspruch ernte: Das Diagramm zur gegnerbereinigten Passgenasuigkeit zeigt sehr schön, dass die eigene Passgenauigkeit viel entscheidender (oder signifikanter) für den Erfolg ist als die Fähigkeit, die Passgenauigkeit des Gegners zu verschlechtern, oder anders ausgedrückt: Wichtiger, sauber unter dem generischen Druck zu spielen als das Passpiel des Gegners aggressiv und hoch zu stören (Tabelle von oben nach unten: Bayern, BVB, Wolfsburg, Gladbach, Schalke, Hertha; von links nach rechts: Leverkusen, Bayern, BVB, Stuttgart, Ingolstadt)
2) Ballbesitz: Mich würde interessieren, ob, und bei welchen Mannschaften der Ballbesitz stark zwischen Heimspiel und Auswärtsspiel schwankt.

Antworten

Ein Zuschauer 17. Januar 2016 um 13:01

Also mir scheint die Tabelle von oben nach unten Bayern München, Wolfsburg, BVB zu sein und nicht „BVB, Wolfsburg“. Hier mal die beiden vollständigen Tabellen, mit Abweichungen:
Von oben nach unten: 1 Bayern, 2 Wolfsburg, 3 Dortmund, 4 BMG, 5 S04, 6 Hertha, 7 Frankfurt, 8 Augsburg, 9 Köln, 10 Leverkusen, 11 HSV, 12 Mainz, 13 Hannover, 14 Hoffenheim, 15 Stuttgart, 16
Abweichung von 49 Tabellenplätzen zur richtigen Tabelle
Von links nach rechts:
1 Leverkusen, 2 München, 3 Dortmund, 4 Stuttgart, 5 Ingolstadt, 6 Wolfsburg, 7 HSV, 8 Hoffenheim, 9,5 Bremen und Augsburg auf dem gleichen Platz, 11 S04, 12 Mainz, 13 Frankfurt, 14 BMG, 15 Darmstadt, 16 Köln, 17 Hannover, 18 Hertha
Abweichung von 90 Tabellenplätzen zur richtigen Tabelle
Nur Darmstadt (besser als Gegnerabweichung), Frankfurt (schlechter als Gegnerabweichung), Dortmund (schlechter als beides!) und Hertha (besser als Passgenauigkeit) befinden sich nicht innerhalb der Spanne der Plätze in den beiden Tabellen.
Nur von dieser Statistik ausgehend scheint die eigene Passgenauigkeit tatsächlich wichtiger zu sein, als die Fähigkeit die Passgenauigkeit des Gegners zu senken. So im Verhältnis von 30:70 oder 40:60 würde ich schätzen.

Antworten

Izi 16. Januar 2016 um 23:51

Vielen Dank für den sehr intetessanten und auflussreichen Artikel!!! Ich habe großen Tespekt vor der vielen Mühe, die für den Atrikel vonnöten war!!!

Antworten

Dr. Acula 15. Januar 2016 um 23:56

wow, ein hochspannender artikel bei dem die idee, statistiken effizienter und aussagekräftiger zu gestalten perfekt umgesetzt wurde

Antworten

HW 14. Januar 2016 um 13:36

Großartig, ein ganz dickes Lob. Ich habe die Zahlen bisher nur überflogen, aber die Auswahl gefällt mir sehr.

Bei den Spielstand abhängigen Spielausrichtungen wäre einerseits die erste Halbzeit, wenn die Teams sich noch an den ursprünglichen Plan halten, interessant (spielstandabhängig). Und dann die letzten 10 Minuten des Spiels, wenn es darum geht noch etwas zu gewinnen oder zu verteidigen. Wie sehen also die ursprünglichen, spielstandabhängigen Pläne aus. Und wie sehen die „Panikpläne“ aus. Und evtl. noch: Was sind typische Anpassungen nach der Pause.

Bei einer Grafik würde mir an x- und y-Achse jeweils ein ‚besser‘-Pfeil (-> oder <-) gut gefallen um deutlich zu machen, dass einmal der hohe Wert gut ist und einmal der niedrige. Oder man dreht eine Achse um und weiß damit oben rechts ist besser als unten links, wie sonst auch meistens. Aber das ist eine Kleinigkeit.

Zu den letzten Werten. Um Sane gibt es einige Gerüchte er würde evtl. ins Ausland wechseln. Die Ballverlustwerte sollten Vereine abschrecken, auch wenn es sich um einen Offensivspieler handelt. Vielleicht bleibt er lieber wo er ist und entwickelt sich noch ein paar Jahre. Wir wollen ja nicht sehen, wie Talente verbrennen.

Antworten

TE 14. Januar 2016 um 23:35

Wie gesagt, ich finde es extrem schade, dass die Statistikanbieter ihre Ballbesitz-Daten nicht differenzieren. Das müsste ja relativ leicht gehen, wenn man die zugrunde liegenden Daten vorliegen hat. Das ist meiner Meinung nach sogar ein Wert, der für Trainer und Betreuerstäbe extrem wichtig wäre, um einen schnellen Überblick über die gegnerische Philosophie zu haben. Es macht halt einen Unterschied, wann man den Ball hält und wann man auf Konter spielt.

Antworten

HW 15. Januar 2016 um 13:58

Das sehe ich auch ähnlich. Ich weiß nicht wie viele Spezialauswertungen die Anbieter liefern können. Aber man kann durch die Kombination von Werten noch viel lernen. Wie viele Pässe spielt ein Team pro Minute, wie lange hält ein Spieler den Ball, wie lange braucht es von der Ballannahme zur nächsten Aktion.
Laufwege, wo/wann wird gesprintet. In welchen Spielphase werden welche Pässe wohin gespielt. Das ist hier alles nicht behandelt worden. Daran lässt sich auch die Philosophie erkennen. Allerdings geht das in die detaillierte Gegner Analyse und ist zu speziell für diesen Artikel.
Auch interessant: Zweikampf verhalten. Laufwege, Doppeln, Gegner stellen, wann wird wo Druck aufgebaut. Und natürlich Umschaltverhalten. Wie länger dauert es vom Ballgewinn zum ersten vertikalen Pass, wie lange brauchen die Spieler um hinter den Ball zu kommen.

Antworten

luckyluke 14. Januar 2016 um 12:23

Endlich kann ich Spieler, die meiner Meinung nach (noch) zu sehr gehyped werden (Sane, Costa,…) mit einer aus dem Kontext gerissenen Statistik schlecht reden 😀

Antworten

cj 14. Januar 2016 um 12:11

Schüsse pro Tor ist krass. Sollte man Spieler mit extrem hohen Werten nicht dazu anhalten, selektiver den Abschluss zu suchen. Aber hat Guardiola nicht Costa dazu aufgefordert, sogar mehr selbst abzuschliessen?

Antworten

HW 14. Januar 2016 um 13:58

Jede Statistik ist zunächst Ausgangspunkt für eine weitere Untersuchung und nicht Endpunkt einer solchen. Man muss also bei jedem Spieler ergründen warum solche Statistiken entstanden sind. Dann muss man entscheiden ob man etwas ändern kann oder überhaupt will. Offensivspieler haben ja oft die Aufgabe das Risiko zu suchen. Natürlich sollte sich auch der Erfolg einstellen.
Allerdings muss man jeden Wert in Kontext setzen: Absolute Zahlen in relation zum relativen Anteil im Team. Kießling hat zum Beispiel wenig gespielt. Auf 90 Minuten gerechnet mögen die Zahlen dann dramatischer wirken als sie tatsächlich sind.
Anderen Spielern könnte man vorwerfen zu wenige Aktionen zu haben, aber vielleicht sind es immernoch die meisten oder die effektivsten Aktionen in ihrem Team.

Antworten

M+M 15. Januar 2016 um 02:33

Wenn man sich die Statistik mit den Schüssen pro Tor anschaut sieht man, dass gerade Spieler die selten im Strafraum zum Abschluss kommen hier vertreten sind (Groß, Calhanoglu, Costa, Vidal). Wenn man als Team gegen einen sehr defensiv spielenden Gegner spielt können aber genau diese Fernschüsse als Dosenöffner fungieren und so auch sehr wertvoll sein (z.B. Vidal gegen Darmstadt). Bei Teams wie Ingolstadt ist es auch so, dass oft ein Tor reicht um auch etwas zählbares mitzunehmen und da kann man das Risiko von vielen Fernschüssen in kauf nehmen (möglicherweise kommt man auch nicht oft genug in gute Schusspositionen). Es gibt auch oft die Situation, dass nach einem Schuss der Abpraller verwertet werden kann und wenn man den Torwart zu diesen Abprallern zwingt bringt das dem eigenen Team oft sehr gute Chancen.

Antworten

HW 15. Januar 2016 um 14:01

Dazu sorgt ein gefährlicher Fernschütze auch dafür, dass sich die Abwehr nicht zu sehr eingraben kann.

Antworten

cj 16. Januar 2016 um 12:01

Das stimmt schon alles. Die Frage, ob ein Spieler sich zu viele schlechte Abschlüsse nimmt, lässt sich wohl nur durch Analyse der Einzelszenen und im Gesamtkontext des jeweiligen Spiels beantworten. Würde mich halt interessieren, ob es zu einem oder mehreren der Spieler irgendeine Analyse oder fundierte Meinung diesbezüglich gibt.

Antworten

juwie 14. Januar 2016 um 00:39

Und natürlich eine Superzusammenstellung. Danke!!!

Antworten

juwie 14. Januar 2016 um 00:38

Beeindruckend die Defensivwerte von Levels, den man ja bei F95 mit Schimpf vom Hof gejagt hat. 🙁

Antworten

LM1895 16. Januar 2016 um 10:27

Das ärgert mich mittlerweile sehr. Wobei wir mit Schauerte einen mindestens gleichwertigen Ersatz holen konnten. Aber der Tobi hat zwar damals gaaaanz schwach angefangen, sich aber gerade gegen Ende seines Vertrages unglaublich gut entwickelt, besonders was sein Zugriffstiming anging. Also Schimpf und Schande ist auch übertrieben, gegen Ende war er tatsächlich recht beliebt. Ist auch einfach ein feiner Kerl.

Antworten

Christian 13. Januar 2016 um 19:45

Kann mich den meisten nur anschließen, schöner Artikel, danke für die viele Arbeit.. In letzterem sehe ich das große Problem. Fußball und Statistik stärker zu verbinden interessiert mich auch, aber aufgrund fehlender Daten habe ich bisher immer aufgehört, bevor ich zu solchen Ergebnissen wie du gekommen bist. Meine größte Hoffnung bei der Überschrift war, dass du hier irgendwo schreibst, es gäbe vernünftige freie computerlesbare Daten, sehr schade. 🙁

Antworten

HW 14. Januar 2016 um 14:03

Bei den Anbietern bekommt man sicher alle möglichen Daten, auch weiterverarbeitet und maschinenlesbar. Wenn man denn dafür bezahlt. Warum sollte die (Vor-)Auswertung umsonst sein.
Die Datenbasis könnte vielleicht von der Liga bereitgestellt werden (wird sie zum Teil auch). Aber am Ende ist das eben auch ein Geschäft diese Daten erheben zu dürfen, das man nicht jedem kostenlos öffnen muss.

Antworten

Klugscheißer 13. Januar 2016 um 19:19

Netter Artikel und überfällig, dass ein paar der Konzepte für diejenigen verfügbar ist, die sich nicht auf Englisch plagen möchten. Trotzdem ein bisschen Klugscheißerei:
– Zu Lewandowski und Groß kann man nur Peer Steinbrück bemühen: Hätte, hätte, Fahrradkette.
– Zu Ilkay Gündogan: Es gibt kaum einen anderen Bundesliga-Spieler, der gefühlt zu 95% Fernschüsse aus 20+ Metern und kaum innerhalb des Strafraums abgibt. Kein Wunder also, dass diese gefühlt überwiegend geblockt werden oder aber daneben/darüber gehen. Er dürfte damit auch die geringste shots accuracy (shots on target /all shots) aufweisen.
– Zu den Defensivstatistiken: Statsbomb hat sie sinnvollerweise an die Anzahl der gegnerischen Pässe (DAPP) adaptiert. Es gibt aber noch etliche andere Defensivaktionen, die in die Berechnung einfließen sollten, als die genannten. Beeidnruckende Korrelationen zwischen Anzahl der Defensivaktionen und Erfolg, egal ob man letzteren in Punkten, Toren, Anzahl der Schüsse ausdrückt, gibt’s augenscheinlich trotzdem nicht.

Antworten

datschge 13. Januar 2016 um 18:34

Nette Zusammenstellung.
Bzgl. „Spielerqualität: Verteidigen“ wäre es schön, diese Werte analog zu Torschuss-Abhängigkeit prozentual zur Gesamtzahl des Teams aufzulisten. Bei den erfolgreichen Defensivaktionen würde man dann sehr schnell sehen, wer sich im Rahmen des jeweils eigenen Spielsystems defensiv positiv einbringt; bei allen Defensivaktionen hingegen könnte das ein Anhaltspunkt sein, dass dieser Spieler alleinegelassen und/oder regelmäßig vom Gegner als Schwachpunkt ausgemacht wird.

Antworten

Alfie 13. Januar 2016 um 18:01

Hey TE, schöner Artikel und vielen Dank für die Mühe!

Vor allem die Koordinatensysteme, TSR und SoTR finde ich sehr Aussagekräftig.

Glaubst du, dass die Differenz der ‚Ballbesitz nach Spielstand Werte‘ mit sinkendem Durchschnittsballbesitz in der Regel zunimmt? Oder, dass man sie als Maß für ‚Systemfußball vs Heroenfußball verwenden kann. (Wir spielen unser System egal wie es steht. Da wir sicher sind, dass wir mit unser System (inklusive Gegneranpassung) den größten Erfolg haben. vs. Ich dribble jetzt das x-te mal die Außenbahn herunter, da wir ein Tor brauchen und eh keine Idee habe was ich im Ballbesitz machen soll).

Leider fehlen bei den Spielerstatistiken Bezugsdaten, welche leider in den Rohdaten nicht vorhanden sind. So kann man an den Graphen nicht absehen ob Pascal Groß der schlechteste Stürmer der Liga ist, oder nur der arme Kerl der bei jeder Flanke den Kopf hinhalten muss. Ist Bargfrede ein busquetesker Abräumer der die ganze Breite absichert, oder hat er genug Unterstützung, dass er nur einen geringen Korridor mit nur einer begrenzten Entscheidungsmöglichkeit der Angreifer absichern muss? Wie groß ist der Gegnerdruck bei den Ballverlusten? Wie ist die Entscheidungsfindung von Sane? Sind seine eingegangenen Risiken gerechtfertigt?
Leider fehlen diese Daten, und Hypothesen zur Einschätzung der Spielerqualität kann mit diesen Statistiken nur schwer begründet werden.

Es ist auf der einen Seite nur traurig, dass man seine Ideen, welche man aus den Taktikanalysen von SV bildet, wegen fehlenden Daten nicht umgesetzt sieht. Andererseits ist es ein Traum, jetzt den Anfang der statistischen Analysen des Fußballs zu erleben. Jeden Moment kann ein neuer Artikel über ein neues Tool erscheinen, der alles ändert.

Antworten

HW 14. Januar 2016 um 14:11

Der Anfang ist doch schon lange gemacht. Es geht hält immer weiter. Dabei darf man sich aber nicht blind auf die Daten verlassen. Nicht jede Wahrheit steckt in diesen Zählen. Ein Trainerteam muss also ausgehend von solchen Werten immer weiter analysieren, Videos schauen und Lösungen erarbeiten.

Es geht ja nicht ums Verteufeln oder Bejubeln von Spielern aufgrund von Statistiken. Statistiken sind ein Hilfsmittel, gewissermaßen eine Krücke, um Verständnis zu erlangen und Verbesserung anzustreben.

Antworten

TE 14. Januar 2016 um 23:38

Danke für das Lob! Zur ersten Frage: Da habe ich ehrlich gesagt keine Vorstellungskraft, da mir hier die Erfahrungswerte fehlen. Damit sind wir auch direkt bei der zweiten Frage. Man müsste theoretisch mal einen Quervergleich über die Ligen und über längere Zeiträume machen, um Spitzen- und Durchschnittswerte zu bestimmen. Aber da die Daten wie gesagt nicht automatisiert sind, ist das schlicht nicht machbar durch mich. Ich saß bereits einen ganzen Arbeitstag an diesem Artikel – kaum vorstellbar, dass ich das unter der Saison hinbekommen würde.

Antworten

smon 13. Januar 2016 um 17:26

„Warum habe ich diese Statistik nicht für alle Bundesligisten berechnet?“

Wie hast du die Daten nun berechnet? Ich finde bei whoscored gerade nicht den Ballbesitz in bestimmten Minuten oder ähnliches, eventuell kann ich das automatisieren.

Antworten

TE 13. Januar 2016 um 18:51

Ich habe die einzelnen Spiele angewählt. Dort kann man dann einzelne Minuten des Spiels im Slider anwählen (unterhalb der Werte wie Ballbesitz und Passstatistik bei den Formationen). Dann jeweils den nötigen Zeitraum mit Führung, Rückstand etc. wählen. Wie gesagt, viel Arbeit.

Antworten

smon 13. Januar 2016 um 17:16

Wäre bei den Defensivaktionen nicht gerade der prozentuale Erfolg interessant?

Antworten

TE 13. Januar 2016 um 18:50

Jein. Eigentlich schon, aber wie in einem Kommentar erwähnt, sind manche Statistiken nicht eindeutig, was den Erfolg angeht. Ein abgeblockter Schuss kann sowohl in den eigenen Reihen landen als auch beim Gegner und zum Torerfolg führen. Auch clearances sind nicht eindeutig. Daher habe ich darauf mangels Genauigkeit verzichtet.

Antworten

Josef 13. Januar 2016 um 16:26

Sehr cool. Thx für die Mühe. Und sehr gut und verständlich aufgearbeitet.

Eine Verständnisfrage zu den Defensivaktionen: Ich verstehe nicht so recht warum Tacklings und Interceptions erfolgreich sind, geblockte Schüsse und Clearances aber nicht?
Unabhängig davon: Der Unterschied der beiden Defensivstatistiken besteht also darin dass Nr. 1 die Summe aus Interceptions und Tacklings ist und Nr. 2 die Summe aus allen vieren, korrekt?

Eine Idee, auf die mich Pascal Groß bringt: Wie wäre es mit einer Torschussbeteilitung-Ballverluste-Ratio? Ähnlich wie Assist-Turnover in der NBA. Ich bin mir noch nicht sicher, welche Ballverluste alle hierzu gehören würden. Aber klingt für mich vielversprechend.

Eine ganz leichte Kritik an der Darstellung: Die beiden Darstellungen im Koordinatensystem finde ich etwas unglücklich. Zum einen sollte rein intuitiv (erfahrungsgemäß) rechts oben das beste Quadrat sein. Dann ist es rein grafisch schwer alles zu verstehen, z.B. wegen unklarer Farbgebung (FCB einmal rot, einmal grün) und die Gitternetzlinien sind etwas zu dominant.

Antworten

TE 13. Januar 2016 um 16:47

Danke für das Feedback. Clearances bringen, wenn ich die Statistik richtig verstanden habe, keinen Ballgewinn. Es sind Szenen, in denen der Ball weggebolzt bzw. ins Aus gespielt wird. Bei erfolgreichen Defensivaktionen wollte ich nur welche reinnehmen, bei denen der Ball gewonnen wird. Man hätte es auch Ballgewinne pro 90 Minuten nennen können, dann wäre es aber wohl zu Verwechslungsgefahr mit den Interceptions gekommen.

Zur Darstellung: Ja, ein wenig schief ist es. Aber groß ändern kann ich an der Darstellung nichts, das macht Infogr.am. Aber gut aussehen tut’s 😉

Antworten

Josef 13. Januar 2016 um 17:40

Danke für die Erklärung. Ich verstehe und teile deine Intention. Und auch nachvollziehbar, dass bei geblockten Schüssen und Clearances der Ball nicht automatisch gewonnen wird. Aber ist es denn eindeutig, dass Tacklings hier anders definiert sind? Könnte nicht im whoscoredschen Sinne ein gewonnenes Tackling auch ein solches sein, bei dem der Ball ins Seitenaus getackelt wird?

Antworten

TE 13. Januar 2016 um 18:52

Ein Tackling wird definiert als „Dispossessing an opponent, whether the tackling player comes away with the ball or not“. Ich gehe daher davon aus, dass ein succesful tackle, wie ihn whoscored ausweist, zu einem Ballgewinn führt.

Antworten

Halbraumlibero 14. Januar 2016 um 05:39

Wird nicht auch noch zwischen „Clearences“ und „Effective Clearances“ unterschieden? Konnte es bei WhoScored gerade nicht finden, aber ich meine, dass es entweder Squawka (?) macht oder WhoScored zumindest mal hatte…
Ich weiß zwar auch nicht genau, was „Effective Clearances“ sind, aber ich könnte mir vorstellen, dass es Clearances sind, nach denen man im Ballbesitz ist.

Antworten

TE 14. Januar 2016 um 23:30

Whoscored macht diese Unterscheidung auf Spielerebene nicht, nein.

Antworten

el tren 14. Januar 2016 um 13:30

Die Einschätzung teile ich auch. Allerdings kann ich eine andere Sache aus der letzten Statistik nicht nachvollziehen:

Warum sind Tackings (sofern das die „verlorenen Zweikämpfe“ sind) bei den Ballverlusten mitberücksichtigt? Denn durch ein missglückstes Tackling verliert man ja nicht den Ball, sondern gewinnt ihn lediglich nicht.

Bei der Bewertung bspw. der Offensivspieler würde ich durch die Ballverluststatistik ja herauslesen wollen, wie oft oder wie wahrscheinlich der Angriff scheitert und wie oft das zu einer Umschaltsituation führt. Genau dann will ich aber die Tacklings nicht mitzählen, weil die zumeist ja in ganz anderen Situationen passieren, wenngleich auch u.a. direkt nach einem Ballverlust im gegnerischen Umschalten. Aber sie sind eben nicht ursächlich hierfür m.E.

Antworten

TE 14. Januar 2016 um 23:32

Misslungene Zweikämpfe sind Situationen, in denen sich zwei Spieler gegenüberstehen und der ballführende Spieler den Ball verliert. Im Gegensatz zu Dribblings, die in Bewegung stattfinden. Sorry, falls das widersprüchlich war.

Antworten

The Soulcollector 19. Januar 2016 um 21:27

Zu den Clearences: Ich sehe die schon als erfolgreiche Defensivaktionen. Der Ball wird zwar weit nach vorn geschlagen (und landet oft beim Gegner). Aber man schafft sich so die Zeit um die Defensivordnung wiederherszustellen. Erfolgfreiche Defensivaktionen könnte man ja eher danach einteilen wie lang der Gegner braucht um wieder in die gefährliche Zone zu kommen. Ein abgefangener Pass bringt wenig, wenn man gleich danach wieder den Zweikampf verliert oder einen Fehlpass schlägt. Da ist der Gegner sofort wieder in Strafraumnähe.

Antworten

HW 14. Januar 2016 um 14:15

Habe bei den Grafiken auch gedacht: Spieler gleicher Teams sollten die gleichen Farben haben. Aber manchmal gibt ein Werkzeug sowas nicht her.

Antworten

CHR4 13. Januar 2016 um 16:04

ein paar Gedanken zu TSR und SoTR:
Beide Werte können dazu dienen, sich bestimmten Sachverhalten zu nähern, enthalten aber in sich vollkommen unsinnige Aussagen/Bewertungen:
– TSR: ein Schuss der 5cm neben den Pfosten geht wird genauso bewertet, wie einer der 4m vorbei und gleichzeitig 3m drüber geht: klar fürs Spielergebnis haben beide die selbe Folge, aber interessant wäre doch wie GENAU ein Spieler bzw. ein Team seine Schüsse anbringt
– SoTR: ein Schuss, der direkt in die Arme des Torwarts in die Mitte des Tors geht, zählt gleich viel, wie ein Schuss, der durch den Torwart nur durch eine Glanzparade mit den Fingerspitzen aus dem Winkel gekratzt wird, aber der Schuss knapp neben den Pfosten zählt gar nicht (!)

Für mich wäre also viel interessanter zu quantifizieren, um wieviele cm, der Schuss anders hätte platziert werden müssen, um ein Tor zu erzielen: ob die Entfernung dann nach zu weit nach innen (Richtung Torwart) oder nach außen (neben den Pfosten oder drüber) gemessen wird, ist für mich nebensächlich.
D.h. ein Schuss auf den Torwart in die Tormitte sollte genauso schlecht bewertet werden, wie ein Schuss weit daneben. Und ein Schuss, der knapp neben den Pfosten geht, sollte genauso gut bewertet werden, wie ein Schuss, der nur knapp gehalten wird.

Dies führt zu einem Wert, der mich für die Teams/Angreifer wirklich mal interessieren würde: die Kreisfehlerwahrscheinlichkeit bzw. der Streukreisradius bei Schüssen!
https://de.wikipedia.org/wiki/Circular_Error_Probable

In Sportarten wie Golf, Badminton, Tennis sind diese Werte ebenfalss sehr hilfreich …

PS: Der Nachweis, dass die TSR am Ende der Saison mit dem Tabellenplatz korreliert, reizt mich zu der kühnen Behauptung, dass auch das Torverhältnis am Ende der Saison stark mit dem Tabellenplatz korrellieren könnte. 😉 Allerdings muss ich hierzu den Beweis vorerst schuldig bleiben.

Antworten

euler8 13. Januar 2016 um 18:03

>quantifizieren, um wieviele cm, der Schuss anders hätte platziert werden müssen, um ein Tor zu erzielen:

Annahme:
Team x hat eine hohe TSR, einen schlechte SoTR, eine geringe Kreisfehlerwahrscheinlichkeit.
D. H. die Stürmer sind fleissig, müssten aber nur ein kleines bisschen genauer zielen, um deutlich erfolgreicher zu sein.

Den Mehrwert sehe ich bei der Kreisfehlerwahrscheinlichkeit dann nur in der Angabe, wie „schlecht“ die Stürmer zielen. Kknapp daneben ist aber auch vorbei und in der Summe auch eine Frage der indivuellen Qualität.

Rechtfertigt das den höheren Aufwand? Noch kann man sowas mW zumindest nicht automatisch messen, während die beiden anderen Methoden mE eine sehr schöne Mischung aus Einfachheit und Aussagekraft bieten.

Oder welche weiteren Mehrwert soll die Kreisfehlerwahrscheinlichkeit haben?

Antworten

Benni 13. Januar 2016 um 18:43

Was du suchst sind „expected goals“. Das gibt es schon, einfach mal googlen 🙂

Antworten

euler8 13. Januar 2016 um 19:26

Nein, ExpG ist nicht genau das.
ExpG hat eine andere Bewertungsfunktion, z. B. Kopfball oder Schuss, zentral vorm Tor oder nicht, etc. pp.

Es kann nicht:
>quantifizieren, um wieviele cm, der Schuss anders hätte platziert werden müssen, um ein Tor zu erzielen:

Wenn der Threadersteller wirklich DAS haben will, dann kann er mit ExpG auch nicht zufrieden sein, wobei es zumindest mehr in die gewünschte Richtung geht, ja.

Antworten

CHR4 14. Januar 2016 um 01:47

vorweg: Vielen Dank für die Antworten und euren Gedankenaustausch! 🙂

Ja, in der Tat geht „expected goals“ in die richtige Richtung (ist mir auch bekannt), aber evt. schießt diese Methode sogar über das Ziel hinaus:
+ noch „genauere“ Aussagekraft, wie gefährlich ein Schuss war
– Verfahren intransparent („Welche Schüsse sie berücksichtigen wird jedoch meist nicht näher ausgeführt und oft wird sogar das gesamte Modell geheimgehalten.“ abseits.at) und
– evt. (werde ich je nach Möglichkeit weiter untersuchen) abhängig von der INDIVIDUELLEN EINSCHÄTZUNG eines Experten / Analysten, also kein objektiv messbarer Wert

und natürlich dürften „expected goals“ damit noch weitaus schwerer und aufwendiger zu ermittlen sein als die CEP, ich denke wenn man will dürfte die CEP durchaus automatisch zu erfassen sein, zumindest, wenn schon das Equipment der Torlinientechnik vorhanden ist

zu dem Fall angesprochenen Fall „hohe TSR, niedrige SoTR, kleine CEP“:
sollte eigentlich extrem selten vorkommen … warum? – nehmen wir an ein Spieler würde 90% seiner Schüsse in einen Radius von 50cm abgeben können, dann würde er, wenn er die meisten Schüsse knapp daneben setzt immer ca. 50 cm NEBEN das Tor ZIELEN! Da die Wahrscheinlichkeit nach außen und innen gleich abnimmt, würden sich seine Schüsse also ca. 1m neben das Tor bis (Innnen-)Pfosten verteilen. Und warum sollte das extrem selten sein? Bevor ein Spieler aus allen Lagen so genau schießen kann, dass seine CEP klein ist, sollte man ihm als Trainer doch beibringen nicht 50cm neben das Tor, sondern ins Tor 50cm neben den Pfosten zu zielen, denn dann gehen 90% seiner Schüsse aufs Tor (in den Bereich Innenpfosten bis 1m vom Pfosten zur Tormitte – außerdem sind dann nur 5% daneben und die anderen 5% halt nochmal näher zur Tormitte). Das richtige Ziel zu wählen sollten bedeutend schneller zu vermitteln sein, als die CEP nenneswert zu verkleinern, d.h. ich würde gerade schon Schützen mit großer Streuung zuerst mal erklären, dass sie mehr Richtung Tormitte zielen müssen.

Mir gefallen grundsätzlich , die Grafiken zu Chancen über den Spielverlauf auf uefa.com, allerdings auch hier mit den zu TSR, SoTR oben erwähnten Einschränkungen. Da gefällt mir die „expected goal“ Zeitverlaufskurve prinzipiell nochmal besser. 🙂

Kennt jemand eine Seite mit „expected goals“, die ihr Berechnungsverfahren offen gelegt hat?

Antworten

CHR4 14. Januar 2016 um 02:18

ok, mit meinem „eventuellen 2. Minuspunkt“ lag ich falsch, „expected goals“ sind in der Tat objektiv messbar und unabhängig von soften subjektiven Einschätzung – dafür hat sich Kritikpunkt 1 fast noch verstärkt: selbst wenn die Berechnungsgrundlagen offen gelegt werden, ist die Berechnung durch die große Anzahl auszuführender Berechnungsschritte / Quantifizierung mittels umfangreicher Datenbanken für einen Menschen nicht mehr intuitiv nachvollziehbar – man muss also größte Sorgfalt bei der Fütterung des Computersystems walten lassen, sowohl was die Datenerhebenung als auch die Programmierung angeht bzw. großes Vertrauen haben, dass die Verantwortlichen dies so getan haben

insofern ist der verlässlichste Wert wohl sogar die Durchschnittswettquote der online-Wettanbieter 😉

Antworten

Peter Vincent 15. Januar 2016 um 16:03

>zu dem Fall angesprochenen Fall “hohe TSR, niedrige SoTR, kleine CEP”:
>sollte eigentlich extrem selten vorkommen … warum?

Ja, das habe ich bewusst so konstruiert. Randfälle (Extremfälle) testen. 😉

>Bevor ein Spieler aus allen Lagen so genau schießen kann, dass seine CEP klein ist, sollte man ihm als >Trainer doch beibringen nicht 50cm neben das Tor, sondern ins Tor 50cm neben den Pfosten zu zielen, >denn dann gehen 90% seiner Schüsse aufs Tor. Das richtige Ziel zu wählen sollten bedeutend schneller >zu vermitteln sein, als die CEP nenneswert zu verkleinern, d.h. ich würde gerade schon Schützen mit >großer Streuung zuerst mal erklären, dass sie mehr Richtung Tormitte zielen müssen.

Wenn das der große „Mehrwert“ ist, dann ist das iwie ziemlich viel Aufwand für eine sehr triviale Folgerung oder?
„Paul, du triffst normalerweise nicht mal ein Scheunentor, aber wenn du schon schießt, dann ziele doch wenigstens in die Tormitte!“

Dann erkenne ich da iwie keinen richtigen Mehrwert. Nicht mal in Sachen Training. So triviale Dinge sollte doch jeder Trainer/Spieler komplett ohne statistische Auswertungen sehen.

Unabhängig von Trainingsaussagen: In wiefern wäre so eine Methode für Analytiker wie Tobi nützlich(er)?

Antworten

CHR4 15. Januar 2016 um 16:34

CEP wäre für mich eigentlich nur ein weiterer Zwischenschritt/Option vor „Expected golas“ in der Reihe: Punkte, Tordifferenz, TSR, SoTR, CEP, expected goals

Die Aussagekraft nimmt zu, die Nachvollziehbarkeit der Berechnung allerdings ab (bzw. die Komplexität der Erhebung und Berechnung zu).

Die Entscheidung, was man in welcher Situation auswählt kann durchaus unterschiedlich ausfallen. Ich sehe CEP einfach als weitere Option, die mehr Aussagekraft hat als SoTR, aber nicht ganz so komplex ist wie ExpG.

Die Entwicklung ist seit ca. 2013 halt schon weiter, für mich macht es wenig Unterschied, da ich weder CEP noch ExpG erheben und berechnen werde. Dem Datenliefranten muss ich dann so oder so vertrauen, also kann ich auch ExpG nehmen.

Antworten

Peter Vincent 16. Januar 2016 um 14:00

>CEP wäre für mich eigentlich nur ein weiterer Zwischenschritt/Option vor “Expected golas” in der >Reihe: Punkte, Tordifferenz, TSR, SoTR, CEP, expected goals
>Die Aussagekraft nimmt zu, die Nachvollziehbarkeit der Berechnung allerdings ab (bzw. die >Komplexität der Erhebung und Berechnung zu).

Im Prinzip fände ich das schon auch ok, die zusätzlichen Daten zu haben.
Aber ob die zusätzliche Aussagekraft wirklich relevant ist, da bin ich eher skeptisch. Ich würde mich eher an ExpG halten. Nehmen wir mal das Beispiel mit der hohen Streuung eines Spielers. Dann hätte CEP mE für einen Spielanalytiker keine wirklich relevanten zusätzlichen Infos (Stürmer haben schlechte Chancenverwertung reicht mE hier vollkommen aus) . Die Trainer hätten dann einen zusätzlichen Wert, aber die Ableitungen daraus sind mE auch trivial (Ziel weiter in die Mitte / Ziel 50cm weiter in nach links, etc.), weil das jeder Spieler schon selbst intuitiv bei jedem Abschluss bemerken sollte (genaue cm-Angaben braucht es da mE auch nicht).

Alfie 13. Januar 2016 um 19:07

TSR und SoTR haben durch ihre höhere Gesamtanzahl, eine höhere Vorhersagekraft bei weniger Spielen. 11tegen11 hat einen guten Artikel über die Vorhersagekraft verschiedener Parameter. http://11tegen11.net/2015/01/05/the-best-predictor-for-future-performance-is-expected-goals

Antworten

Tom 14. Januar 2016 um 09:43

Was nützt mir die Aussage, dass der Ball 50cm vorbei ging, wenn ich nicht weiß von welcher Position aus geschossen wurde oder wie schwierig zu verwerten die Vorlage war oder wie bedrängt der Schütze. 50cm neben das Tor unbedrängt mit kullerndem Ball aus 5m zentral vor dem Tor ist etwas komplett anderes als 50cm neben das Tor von drei Gegnern bedrängt und Direktabnahme einer scharfen Flanke aus 20m Entfernung.

Darüber hinaus, weiß man ja gar nicht wo ein Schuss hingehen sollte. Mitunter sollte es eine Flanke werden, die ins Tor ging.

Antworten

luckyluke 14. Januar 2016 um 12:18

Ich will jetzt auch noch meinen Senf dazugeben, auch wenn ich bei dem Statistikkauderwelsch unter deinem Kommentar schon teilweise ausgestiegen bin, weil ichs nicht verstehe 😀

Ich wollte daher nur kurz die Überlegung einbringen, dass ein Schuss 5cm neben das Tor auf keinen Fall die Chance hat ins Tor zu gehen und der auf den Torwart eben schon. Im Umkehrschluss der Gedanke: Schlechte Abschlusspositio –> Ball irgendwie aufs Tor bringen und nicht versuchen zu platzieren (ich weiß, bisschen überspitzt formuliert). Und vielleicht kommt daher auch einfach die „Überlegenheit“ der Schüsse auf den Torwart gegenüber denen, die 5cm daneben gehen…

Antworten

blub 14. Januar 2016 um 17:17

„Der Nachweis, dass die TSR am Ende der Saison mit dem Tabellenplatz korreliert, reizt mich zu der kühnen Behauptung, dass auch das Torverhältnis am Ende der Saison stark mit dem Tabellenplatz korrellieren könnte. “

Das ist auch so, aber der TSR korreliert stärker und v.A. früher als die Tordifferenz. Die Chancenverwertung(offensiv und defensiv) ist der größte Randomfaktor im Fußball und die ist ja in den Toren enthalten. Deswegen enthalten die wengier „information“

Antworten

Halbraumlibero 13. Januar 2016 um 16:03

Super Artikel, schöne Grafiken!

Der große Unterschied zwischen Dortmund und Bayern ist wohl die Qualität der zugelassenen Torchancen. Gut zu sehen in der ersten Grafik unter „Chancenverwertung (Gegn. Schüsse pro Spiel)“. ExpG-Modelle haben das auch schon gezeigt.

Interessant finde ich außerdem, dass Weiser als einziger nomineller Außenverteidiger in der letzten Grafik auftaucht. Hertha hat mit Plattenhardt und Weiser sowieso die beste deutsche Außenverteidigerzange der Liga imo.

Goretzka möchte ich noch hervorheben, der eine äußerst gute Rolle in der Grafik der „Erflogreichen Defensivaktionen“ spielt. Besonders gegen den Ball für mich einer der besten Spieler der Welt.

Thomas Müller ist übrigens auch ein sehr guter Spieler wie ich finde… 😉

Antworten

blub 13. Januar 2016 um 15:35

Schöner Artikel, hat mich sehr gefreut.

redrobbery hat das schon im Dezember rausgebracht: Wären alle Spiele nach 88min abgepfiffen worden wäre Dortmund Tabelleführer, nicht Bayern.

Was ich noch wirklich interessant gefunden hätte: Wie sind die Spiele mit Ballbesitzen jenseits von 60/40 den Ausgegangen? Da du die spiele schon sortiert hast, könntest du da mal ne verteilung rausgeben?

Vermutlich macht Darmstadt hier wieder die Statistik kaputt, aber wenn man Trends herauslesen will macht es auch manchmal sinn die harten Outliner wegzulassen.

Antworten

CHR4 13. Januar 2016 um 16:16

da muss man (leider) auf den alten Sepp Herberger hören:
die Bayern haben, dass durch bittere Niederlagen gelernt (1999, 2012) („Weiter, immer weiter!“ O. Kahn) und ich musste BVB-Fans 2013 gegen Malaga, Mut zu sprechen 15 min. vor Schluss …

Antworten

Denis Dercho 13. Januar 2016 um 15:34

Unter Torschussabhängigkeit ist Lewandowski als BVB-Spieler gelistet. Kleiner fehler? 🙂

Antworten

TE 13. Januar 2016 um 16:43

Kleiner Fehler, danke für den Hinweis. Habs korrigiert.

Antworten

Isco 13. Januar 2016 um 15:13

Blöde Frage, aber wie hast du denn die Daten von whoscored bekommen? Gibt es die irgendwo als Download?

Antworten

TE 13. Januar 2016 um 15:14

Nein, crawlen kann man die auch schlecht. Ich sammel die alle per Hand. Klingt grausam – ist es auch.

Antworten

Isco 13. Januar 2016 um 15:25

Ja, kann ich mir gut vorstellen 🙂
Danke für die schnelle Antwort

Antworten

Zahlenverlagerung: Die Hinrunde der Bundesliga

Hinterlasse eine Antwort Antwort abbrechen

Hinterlasse eine Antwort
Antwort abbrechen