Interview mit Lukas Fesca
Wir erhielten vor kurzem eine Mail bezüglich einer statistischen Analyse. Es war keine gängige Statistik, sondern eine präzise und detaillierte Analyse der Bundesliga und insbesondere des FC Schalke 04, wo behauptet wurde, man könne erkennen, dass die Schalker an „Pech“ litten.
Weil wir einerseits gerne mit unseren Lesern zusammenarbeiten und andererseits ohnehin Autodidakten wie Freidenker aller Art protegieren, haben wir uns entschlossen, dem werten Herrn eine Plattform für seine Arbeit zu geben. Herausgekommen ist ein Interview über Statistik, Glück und Vorhersagen.
RM: „In deinen, darf ich du sagen?, statistischen Analysen hast du dich damit beschäftigt, wie man den oft erwähnten Faktor Zufall möglichst stark aus den Tabellen und Ergebnissen extrahieren und messbar machen kann. Wie genau geht man da vor und wie kommt man denn auf diese kuriose Idee?“
Lukas Fesca: „Die Kernidee war erst einmal herauszubekommen, welcher Teil am Fußball Glück beziehungsweise „Luck“ und welcher Können beziehungsweise „skill“ ist. Mir gefallen hier übrigens die englischen Wörter besser. Dazu untersuchte James Grayson Tore, Punkte, Schüsse, Torschüsse und die Chancenverwertung beziehungsweise die Prozentzahl der gehaltenen Bälle, als sh% bezeichnet, auf ihre Wiederholbarkeit.
Dazu plottet man aufeinanderfolgende Jahre der Teams in der entsprechenden Kategorie gegeneinander, wie man es auf diesem Bild sehen kann. Dann untersucht man diese Punktemenge auf ihre Bestimmtheit, nämlich R2. Für Interessierte gibt es wieder einen Link auf Wikipedia, den ich empfehlen kann.
Für mittel-Interessierte kurz gesagt: R2 ist eine Zahl zwischen 0 und 1 und je näher R2 bei 1 ist, desto stärker ist der Zusammenhang zwischen zwei Variablen. Je kleiner R2 , desto stärker ist die Regression zum Mittelwert. Besteht ein starker linearer Zusammenhang in den Ergebnissen zweier aufeinander folgender Jahre hat es also was mit „Skill“ oder Können zu tun und nur auf den Skill kann man sich bei Voraussagen in der Zukunft verlassen.
Wen die einzelnen Schritte auf diesem Weg wirklich interessieren, dem empfehle ich das englische Original, den Blog von James Grayson, zu lesen, das ist äußerst interessant und man hat die Möglichkeit Statistik anhand eines Themas zu lernen, welches einen interessiert.
RM: „Oh Gott, zu viel Informationen. Gibt es für uns normalsterbliche Taktik- und Wörterfreaks eine Zusammenfassung?“
Lukas Fesca: „ Jein. Nur eine Vereinfachung: Schüsse sind die beste Möglichkeit, die Zukunft vorherzusagen und sagen somit am meisten über den Skill aus. Dass Schüsse das beste Vorhersagemittel sind, wird einige vielleicht an Christoph Biermanns „Die Fußballmatrix“ erinnern. Der Großwetter auf Seite 186 benutzt sie ebenfalls in zentraler Stelle.
Der in der Statistik dazugehörige Wert dazu heißt TSR. Das ist die Abkürzung für den „total shot ratio“, also das Verhältnis der eigenen Schüsse zu allen im Spiel abgegebenen Schüssen.
Das Gleiche macht man dann mit den Schüssen auf das Tor, was einen STR beziehungsweise „shot on target ratio“ ergibt. Das funktioniert auf die gleiche Art und Weise.
RM: „Naja, im Endeffekt sind das doch „nur“ die abgegebenen Schüsse, die in Verhältnis zum Gegner gesetzt werden sowie mit der zweiten Formel in Relation zur Qualität der jeweiligen Schüsse. Wo kommt denn der Faktor Glück ins Spiel?“
Lukas Fesca: „Der Faktor Glück wird durch den PDO gemessen. Das ist ein aus dem Eishockey geklauter Wert und ist nach seinem Schöpfer benannt. Es ist also keine Abkürzung für irgendetwas.“
RM: „Also soweit ich weiß, war es das Internetalias von Brian King, dem Erfinder, nicht wahr? Wäre ich helle, hätte ich die Pressingkompetenz als den RM-Faktor benannt. Und an alle Supermathematiker: mit PDO ist somit nicht der pseudo-differential operator gemeint! Aber zurück zum Thema.“
Lukas Fesca: „Ähm, ja…Also der PDO ist eine Zahl die sich aus der eigenen und der gegnerischen Chancenverwertung ergibt, ist er größer als 1000 ist die eigene Chancenverwertung besser als die des Gegners.
Ich hab es in der Analyse als 1- Chancenverwertung des Gegners geschrieben, denn das englische Wort „saving percentage“, abgekürzt sv%, konnte ich nicht richtig übersetzen. „Prozentzahl der gehaltenen Bälle“ klingt megadoof und es gibt diesen Wert bei whoscored gar nicht, daher anders geschrieben.
Liegt der Wert also über 1000 hat man im Schnitt eine bessere Chancenverwertung als der Gegner. Mehr sagt es nicht, aber der Punkt ist, dass kein Team einen konstant guten PDO hat.
Der PDO hat somit gar nichts mit dem Skill zu tun, sondern ist reines Glück. Für alle Statistiker: Der Wert regressiert sehr stark gegen den Mittelwert.“
RM: „Mal ehrlich – wie kommt man darauf, sich mit so etwas zu beschäftigen?“
Lukas Fesca: „Ich hab mir das natürlich nicht selbst ausgedacht, ich muss ja eure brillanten Artikel lesen. Zum ersten Mal fand ich diese Art der statistischen Analyse bei 11tegen11, worüber ich wiederum in das Blog von James Grayson, gefunden habe, ihm gebührt hier meines Wissens die Ehre.“
RM: „Du sagst DAS Blog?“
Lukas Fesca: „Blog, von Web-log, also Buch, hab ich mal gelernt. Durch dieses Blog, habe ich dann gemerkt, dass man mit Statistiken mehr machen kann als zur (un)passenden Situation die passende Statistik zu suchen – ihr könnt euch noch an ran erinnern?
Vor allem kann man mit Statistiken komplexe Zusammenhänge auf schöne und verständliche Bilder herunterbrechen. Mir imponierte auch die genaue Umsetzung.
James Grayson hat Daten von 12 Jahren aus den 4 obersten englischen Ligen untersucht und daraus einige Erkenntnissen gezogen.
Der Kern der Analyse ist ein Top-down-Ansatz, er erklärt das Spiel also von seinem Ergebnis her. Er ist quasi entgegengesetzt zur Taktikanalyse, die das Spiel aus kleinen Teilen zusammensetzt und Tore entstehen quasi als Nebenprodukt; was wiederum dem Ansatz des Bottom-up entspricht.
Ein Topdownansatz, der mit großen Datenmengen zur Grundlagenuntersuchung arbeitet, kann später aus relativ wenig Information viel ableiten kann. Goalimpact.com versucht übrigens was Ähnliches für einzelne Spieler.
RM: „An dieser Stelle einen lieben Gruß an einen weiteren Stammleser!“
Lukas Fesca: „Ähm, ja. Natürlich ist die Methode nicht perfekt und gerade Gladbach weist einen sehr auffälligen TSR auf. Der ist eigentlich zu viel schlecht für ihren Tabellenplatz, ohne dass sie herausragend viel Glück, also einen guten PDO, hätten.
Das liegt vermutlich daran, dass sie sehr tief und passiv verteidigen. Sie kassieren viele Schüsse, ohne dass diese gefährlich werden, gleichzeitig ist die Qualität einer Konterchance natürlich höher, weil man häufiger viel Platz und wenig Gegenspieler beim Schuss hat.“
RM: „Da hört man wiederum den Spielverlagerer in dir heraus. Gibt es noch weitere interessante Anomalien?“
Lukas Fesca: „Durchaus. Ebenfalls wieder ein taktischer Überflieger. Freiburgs aggressives Pressing „manipuliert“ den Wert zu deren Gunsten, ohne dass das Team prinzipiell besser sein muss.
RM: „Also zerstören Taktiken die Statistiken so ein bisschen. Freut mich sogar etwas. Gibt es noch weitere Anomalien?“
Lukas Fesca: „Ja, eine große eigentlich: In der PL funktioniert die Methode schlichtweg besser, weil da im Großen und Ganzen alle Teams recht ähnlich tief verteidigen und kaum einer spielt Pressing. Dazu gab‘s hier ja einen heiß diskutierten, grandiosen Artikel.“
RM: „Zuviel der Ehre – ist nämlich nicht meiner.“
Lukas Fesca: „ Solange man sich aber dieser Schwächen bewusst ist, hindert einen das ja an nichts. Es war schon immer alles einfacher, je ähnlicher sich die untersuchten Objekte sind und ein Statistiker scheut keine komplexen Aufgaben.
Auch der PDO ist extremer, als ich aus den PL-Grafiken kenne, aber bis Ende der Saison wird sich das noch etwas ausgleichen, denke ich.“
RM: „Auf welche Ergebnisse kam Grayson im Laufe der Jahre?
Lukas Fesca: „Zuerst war ja die grundlegende Erkenntnis, dass Schüsse wichtiger sind als Tore oder Punkte und dann eben der statistische Beweis, dass die Chancenverwertung Glückssache ist. Er hat noch weitere Analysen gemacht, z.B. aus dem TSR, der Tabellensituation und dem TSR der restlichen Gegner eine Voraussage über das Meisterschaftsrennen gemacht, ungefähr 8 Spieltage im Voraus. Die Datenlage, dass City Meister würde, war relativ überzeugend. Oder auch Untersuchungen zu Elfmetern, aber lest es einfach selbst in seinem Blog!“
RM: „Ist der PDO nicht der Vergleich zwischen eigener Chancen- und Verwertungsqualität sowie Chancen- und Verwertungsqualität des Gegners? Eine Mannschaft mit niedrigerem PDO lässt also weniger qualitative zu, wie Gladbach bei den Torschüssen, und hat eine schlechtere Chancenverwertung, wie Huntelaars kritisierte Abschlussquote in dieser Saison oder eben Augsburgs fehlender Vollstrecker?“
Lukas Fesca: „Die Begründung, weshalb ein guter PDO Glück ist und wie viele Chancen auf der einen oder anderen Seite reingehen, ist eine statistische. Wie erwähnt einfach eine starke Regression zum Mittelwert. Außerdem findet sich keinerlei Zusammenhang zwischen dem PDO im einen und im nächsten Jahr. Es lässt sich feststellen, dass R2 ~0,14 das bedeutet ein guter PDO im einen Jahr korreliert in keinster Weise mit dem im nächsten Jahr.
Besser als Graysons Blog kann ich es leider auch nicht erklären, dort findet man eine detailliertere Erklärung.
Bezüglich den Abschlüssen kann man auch sagen: temporäre Formschwäche des Angreifers ist nichts anderes, als dass er die Dinger manchmal nicht unterbringt und manchmal doch unterbringt. Das ist ebenso reines Glück bzw. Pech. Das sagen doch alle Stürmer: da kann man nichts machen, das kommt von alleine wieder. Und man kann belegen, dass es zumindest für die PL stimmt.
Wie man auf dieser Grafik sieht, gibt es eine überhaupt-nicht Korrelation zwischen STR und Trefferquote und so ein ähnliches Bild gibt es quasi für den Vergleich mit jedem relevanten Aspekt im Fußball.
RM: „Deine Meinung also zu dieser Art der Analyse?“
Lukas Fesca: „Insgesamt ist das leider nicht der Heilige Gral, aber ein gutes zusätzliches Mittel, um Fußball statistisch zu beschreiben. Manche Werte geben das Spiel frappierend gut wieder, z.B. Rayo gegen Barcelona. Rayo hat gut gespielt und war relativ gleichwertig, aber Barcelona hatte genug Glück, um sie abzuschießen.“
RM: „Puh, Gott sei Dank unterstützen die Statistiken meinen Artikel zu Rayo! Und du hast nun nicht nur ein paar Spiele analysiert, sondern uns eine beeindruckende Analyse zu allen Bundesligateams und ihren Spielen geschickt. Wieso eigentlich?“
Lukas Fesca: „Ich wollte eigentlich eh schon lange mal so eine Analyse zur Bundesliga machen, bin aber immer vor dem Aufwand zurückgeschreckt. Beim Artikel zur Schalker Phantomkriese hat es mich gepackt und ich habe Schalkes Hinrunde untersucht. Und den Rest der Liga dann gleich mit. Schalke, Hoffenheim und Augsburg hatten beispielsweise eine Menge Pech. Düsseldorf, Bayern und Frankfurt waren sehr glücklich in ihren Ausgängen.“
RM: „Könnte man daraus nicht eine taktische Analyse bauen können?“
Lukas Fesca: „Um taktisch zu analysieren, muss man das Spiel ansehen. Und auf ein einzelnes Spiel kann das ja jeder, der es schaut, abschätzen. Soviel ist da nicht zu holen, denke ich. Wenn man ein Spiel guckt, merkt man ja, ob es ein Team echt nicht packt, die Kugel unterzubringen.“
RM: „Wie schätzt du die Bundesligateams ein, welche Teams werden abfallen, welche stärker werden?“
Lukas Fesca: „Ich gehe davon aus, dass sich der PDO von allen Mannschaften etwas angleicht, weil das seine Natur ist. Daraus folgt, dass Schalke und Hoffenheim sich steigern werden und Düsseldorf, Frankfurt und Bayern keine so starke Rück- wie Hinserie spielen. Nur, dass das bei Bayern leider egal sein wird.“
RM: „Wobei bei Schalke und Hoffenheim natürlich die Frage ist, ob sie sich nicht in anderen Aspekten verschlechtern. Ist eine solche statistische Analyse mittels PDO eigentlich schwierig?“
Lukas Fesca: „So eine Hexerei ist das gar nicht. Schwierig ist es, die Exceltabelle so zu bauen, dass man nicht alles von Hand eingeben muss. Daran arbeite ich noch. Ich ziehe mir Schüsse, diejenigen, die aufs Tor gehen, und das Ergebnis von einem Spiel von whoscored.com und lege das für beide Teams ab. Dann lass ich mir nach den oben genannten Formeln von Excel alles weitere ausrechnen.“
RM: „Sehr interessant. Gibt es auch einen Favoriten oder ähnliches von Graysons Blog, den du unseren Lesern näher bringen möchtest?“
Lukas Fesca: „Meine Lieblingsgrafik ist der Premier League bubble plot. Eine ganze Ligasaison in einer Grafik. Die Punktgröße sind die Punkte, je weiter rechts desto mehr Glück, je weiter oben desto besser, die „Grünheit“ ist die Tordifferenz.“
101 Kommentare Alle anzeigen
CF 10. August 2013 um 14:04
Lieber Lukas Fesca,
Ich würde mich sehr freuen, wenn du nocheinmal deine genauen Formeln aufschreiben könntest, so dass ich die Rechnung auch selbst ausführen kann. Interessiert mich unglaublich stark und wäre dir sehr dankbar für eine nochmalige Ausführung.
Gruß CF
Sebastian 10. Januar 2013 um 01:59
Also mir ist da etwas beim PDO von Schalke aufgefallen, als ich den PL Bubble Plot auf die BuLi-Hinrunde ummünzen wollte. Der liegt nicht, wie dort oben beschrieben, bei 881, sondern bei 981, was wiederum nicht sooo schlecht ist, aber immer noch auf mehr Pech als Glück hindeutet.
Lukas Fesca 10. Januar 2013 um 15:05
wie kommst du dazu?
klar ist es möglich das ich nicht in der lage bin meine exceltabelle richtig zu programmieren, aber in diesem Punkt bin ich mir absolut sicher.
27 Tore aus 95 Torschüssen bei 25 Gegentoren aus 62 Torschüssen.
–>PDO von 881
TS 8. Januar 2013 um 15:15
Für all die, die Blut geleckt haben gibt es auch statistisch sauberere Arbeiten, die sich zwar nicht mit Taktik, aber mit anderen Fußballthemen beschäftigt:
https://lirias.kuleuven.be/bitstream/123456789/319674/1/ruxanda_berlinschi.pdf
TW 8. Januar 2013 um 19:42
Ich bin mir da nicht so sicher, ob dass wirklich sauber ist. Ich glaube eher, dass da Ursache und Wirkung vertauscht worden sind…
TW 8. Januar 2013 um 19:59
Noch ein wissenschaftliches Paper zur Vorhersage von Spielausgängen der Tottenham Hotspors. Interessanterweise ist der wichtigsten Prädiktor neben dem Gegner das Vorhandensein von Schlüsselspielern.
http://www.sciencedirect.com/science/article/pii/S0950705106000724
TW 8. Januar 2013 um 20:03
Vielleicht sogar noch interessanter:
http://www.sciencedirect.com/science/article/pii/S003132031100447X
zuzak 8. Januar 2013 um 14:18
@Lukas okay habe es verstanden…finde das aber gleichzeitig auch beängstigend. 🙂 D.h. die Schalker können gar nix anderes machen als besser werden (Hand Gottes?) 🙂 Okay, Spaß beiseite…aber irgendwie schon merkwürdig wenn die Statistik am Ende siegt, weil es „normal“ ist.
HW 8. Januar 2013 um 15:39
Nee, natürlich können die noch schlechter werden. Wobei sich trotzdem einige Statistiken verbessern können.
Sollte im Winter aber eingekauft werden, dann stellt sich die Frage wie die Mannschaft der Hinrunde mit der neuen Mannschaft mit neuem Trainer übereinstimmt und verglichen werden darf?
Lukas Fesca 8. Januar 2013 um 16:23
Nachdem Magath nicht Trainer ist werden die eher nicht das gesamte Team austauschen.
es gibt im blog 2 oder 3 untersuchungen zu trainerwechseln.
teilweise hat der PDO dank neuer messung zugenommen, der TSR hat aber nur im normalen Maße fluktuiert, also so gut wie garnicht.
aber im ernst: um noch schlechter abzuschneiden als Schalke mit besseren Statistiken muss mans schon drauf anlegen.
aber natürlich: pech kann immer absurder werden, nur von der möglichkeit lass ich mich in der voraussage nicht beeinflussen.
zuzak 8. Januar 2013 um 13:01
Der Schalker PDO wird besser, weil es einfach so ist (fast schon eine Gesetzmäßigkeit?) oder woran liegt das? Finde das sehr interessant das ganze, möchte es aber irgendwie verstehen. Denn wer weiß ob Hunter nicht auch inder Rückrunde das Pech am Schuh klebt oder sollte er durch Marica ersetzt werden, es ihm nicht genauso geht wie Hunter?
Lukas Fesca 8. Januar 2013 um 13:21
Ne, ich kann ihn natürlich nicht vorhersagen, aber die Erwartung ist das der PDO 1000 (oder 1020 wenn ich obigen link anwende) beträgt. Im Moment ist er bei 881, sehr viel weiter kann so ein PDO fast garnicht schwanken(wie immer keine Daten zu BuLi). Regression zu Mittelwert ist das Stichwort und mehrfach verlinkt.
Mit einem PDO von 100 anstatt 880 holt man aber mehr Punkte (angenommen der TSR bleibt gleich, aber der ist reacht konstant und wird deswegen ja als Messwert für den skill eines teams genommen), ergo wird Schalke einige Plätze steigen.
zuzak 8. Januar 2013 um 13:49
Man kann es also rein statistisch erklären, aber nicht „praktisch“ (man weiß schließlich nicht ob Hunter weiterhin das Pech am Schuh kleben hat –> verstärktes Trainieren des Abschlusses, Eheprobleme, Schnupfen, fehlende Klasse der Mitspieler, Gegner stellt sich noch besser auf Schalke ein).
Statistisch „müssen“ Hunter und Co. besser knipsen, weil sie rein statistisch in der Hinrunde unterdurchschnittlich waren…
Lukas Fesca 8. Januar 2013 um 14:03
Exakt. Die Chanceverwertung ist bei allen Mannschaften näherungsweise gleich. Die Stürmer eines Absteigers sind nur Nuancen schlechter als die der Topmannschaften. Wir sind ja immernoch im Profibereich. In der Kreisliga ist das halt anders.
Wenn jemand dauerhaft das Tor nicht trifft ist er schlecht. Wenn jemand gutes [wie Huntelaar] kurzzeitig das Tor nicht trifft ist das Pech.
Wenn jemand ein mal ne Dose vom Tor schießt ist das Glück.
Wenn jemand 8 mal ne Dose vom Tor schießt ist das können.
Nein, die Knipsen nicht besser weil sie in der Hinrunde unterdurschnittlich waren(ein würfel kann sich auch an nichts erinnern), ich erwarte das sie einfach „normal“ Knipsen und weil sie besser sind als andere Teams wird sie das weiter nach vorne bringen.
Wenn Schalke in der Rückrunde einen PDO von 1000 Produzieren haben sie insgesamt einen von 990. Dann stehen sie vermutlich immernoch nicht so gut da wie erhofft aber immernoch besser als jetzt. Ich erwarte ja auch das die overperformer abbauen .
So klarer?
HW 8. Januar 2013 um 15:43
@Lukas Fesca
Der PDO sagt eigentlich, dass Serien reißen und keiner Konstant gut oder schlecht ist, solange er gegen Mannschaften gleicher / ähnlicher Klasse spielt.
Da wäre dann in der Tat eine Analyse der spanischen Liga mit Real und Barca interessant, die fast permanent eine Klasse für sich sind und daher nicht an 1000 sondern an z. B. 1100 oder noch höher annähern.
GoalImpact 8. Januar 2013 um 13:54
Der Punkt beim PDO ist ja gerade, dass er sich nicht prognostizieren kann. Deswegen die Schlussfolgerung, dass es sich im wesentlichen um Glück handeln muss.
=> Welchen PDO Schalke in der Rückrunde hat weiß kein Mensch. Man kenn nur die PDO-Verteilung und die macht einen ähnlich niedrigen Wert wie in der Hinrunde unwahrscheinlich (aber nicht unmöglich).
zuzak 8. Januar 2013 um 10:19
Eine Sache schwirrt mir noch durch den Kopf und zwar wird ja die ganze Zeit davon gesprochen, dass Schalke in der Hinrunde oftmal Pech hatte und sich dies in der Rückrunde auch wieder ausgleichen wird. Nun aber meine Frage: wieso kann man davon ausgehen, dass dies tatsächlich auch so kommen wird? Mit der reinen Mannschaftsstärke kann dies nichts zu tun haben, denn wenn sich Huntelaar, Farfan und Draxler verletzen, dann kann dies auch Schalke nicht so einfach wegstecken (sei es die Chancenanzahl, -qualität oder -verwertung). Sprich, es ist doch eigentlich unmöglich aufgrund dieser Faktoren eine Prognose abzugeben oder?
firedo 8. Januar 2013 um 10:27
Nunja selbst wenn es so wäre, dass die schalker Pech gehabt hätten, müsste das NICHT bedeuten, dass sie in der Rückrunde Glück haben.
nur weil ich dreissigmal hintereinander beim mensch ärger dich nicht ne 1 würfle, erhöht sich die chance dass ich das nächste mal ne 6 habe um 0%.
zuzak 8. Januar 2013 um 10:40
Sehe ich auch so, aber ich lese oft „dies würde sich im Laufe der Saison wieder ausgleichen“. Gibt ja auch bei spiegel online diesen Index, der hier verlinkt wurde. Klar werden die Bayern Meister, das steht außer Frage…aber im Fußball gibt es so viele Unwegbarkeiten (Verletzung, Transfers, Gegner verstärkt sich (auch Augsburg könnte plötzlich nen Torjäger in seinen Reihen haben), uvm.)…da kann man doch nicht aufgrund dieses Indexes die Tabelle vorhersagen. Oder wird dieser Index vor der Saison seit Jahren in der Endtabelle bestätigt?
Lukas Fesca 8. Januar 2013 um 10:52
Kurz: ich erwarte das sich der PDO wieder an die 1000 annähert, weil Regression zum Mittelwert[…]
Daraus folgt das Schalke besser performt als in der Hinrunde.
Schalke braucht nicht explizit „Glück“, es würde reichen wenn sie einfach „kein Pech“ mehr hätten.
Aber: Variance ist a bitch.
Lustiger weise sieht der SPONartikel Schalke weit vorne, weil da der negative Trend(stream of bad luck) noch nicht eingesetzt hatte. Aber verlorene Punkte bekommt man ja auch nicht zurück.
HW 8. Januar 2013 um 11:04
Der PDO muss sich nicht 1000 annähern. Bei schwachen Teams ist auch eine Annäherung gegen z. B. 950 möglich.
siehe:
http://11tegen11.net/2013/01/06/what-is-a-normal-pdo/
Lukas Fesca 8. Januar 2013 um 11:24
Das kannte ich noch nicht. danke für den hinweis.
Das ändert aber nichts ander prinzipiellen erwartung das Schalkes PDO besser wird.
HW 8. Januar 2013 um 17:21
Interessant ist auch, dass sh% und sv% von Gruppe zu Gruppe besser / schlechter werden. Gerade diese gemittelten Werte zeigen, dass es Unterschiede gibt. Auch wenn es nur jeweils etwa 1 Prozentpunkt ist.
Lukas Fesca 8. Januar 2013 um 17:31
was ne überraschung wenn der PDO sich von Gruppe zu Gruppe um 20 ändert.
Rasengrün 7. Januar 2013 um 21:29
Hervorragende Arbeit, meinen Dank für diesen Grundlagenbeitrag. Was jetzt fehlt ist eine noch bessere Erfassung der Rohdaten. MMn ist das einzelne Spiel meist eine zu grobe „Grundeinheit“, auch die Unterscheidung Ballbesitz oder eben nicht ist noch zu grob. Habe ich den Ball und will das Ergebnis halten oder habe ich ihn und brauche dringend einen Treffer? Ein Unterschied wie Himmel und Hölle. Mir fällt auf, dass offenbar viele statistische Methoden und Modelle aus den in den Staaten populären Sportarten entlehnt sind und die scheinen mir alle miteinander eine Gemeinsamkeit zu haben: wesentlich häufigere Unterbrechungen und damit auch eine klarere Aufteilung des einzelnen Spiels in Phasen, die man dann auch gesondert erfassen und bewerten kann. Genau das dürfte wohl der nächste Schritt sein und hier sind nicht nur die Statistiker gefragt. Wie unterteilt man ein Spiel sinnvoll, was sollte wie erfasst werden? Nuja, diese Diskussion wird sicherlich irgendwo auf diesem Planeten bereits geführt. Ich bin auf die Ergebnisse gespannt.
Lukas Fesca 7. Januar 2013 um 21:48
Aus genannten Gründen halte ich die Theorie nicht geeignet für einzelne Spiele, da haben zeitpunkt des Tores (5′ oder 85′) und andere Faktoren einen viel zu großen einfluss.
Da ich aber Datenpakete in Spielen bekomme und sie sowie so einmal für Mannschaft A und B verwende brauche ich das als kleinste Einheit.
Die erste Trendaussage treffe ich beispielsweise erst ab 3 spielen und da muss für die spezielle Bewertung die Qualität der Gegner miteingerechnet werden.
Eine Basketballlastigkeit das man aussagen über die letzten 15 spielzüge(ca 5 min) ist für Fußball aus naheliegenden Gründen nicht sinnvoll.
Wenn aber die Denke einsetzt, das die beste möglichkeit den Vorsprung über die Zeit zu brigen ein weiteres Tor ist, und nicht das vernageln des 16ers dann hat man viel sauberere Daten.
Da muss man vielleicht das Mindset eines Pokerspieler einbringen: Wiso den Ball in den letzten minuten schnell nach vorne schlagen? wenn ich glaubte das würde meine Torgefahr erhöhen würde ich es schon seit der 1. Minute tun. Da ich Tore immer einzeln und nicht im Paket erziele (wie Basketball oder Football) hilft mir eine erhöhung des Risikos in den seltensten Fällen.[Das ist erstmal ein Rohgedanke der erst ausgebraint werden muss. Ich arbeite dran.]
Und noch was das man dem Fußball grundsätzlich austreiben muss: result oriented thinking.
Rasengrün 8. Januar 2013 um 04:08
Jupp, die Limitierung der Theorie sehe ich auch. Muss aber nicht so bleiben, oder? Die Frage, ob es taktisch geschickter ist die Offensive oder Defensive zu stärken um einen Vorsprung über die Zeit zu bringen hängt ja bspw auch von den eigenen und gegnerischen Schwächen und Stärken ab. Bisher können wir die nur begrenzt abbilden. Genau da sehe ich Raum für eine „feiner gerasterte“ Erfassung der Daten, eben beispielsweise nach Spielphasen. Dann könnte man bspw beantworten wie sich das jeweils auf die TSR auswirkt und irgendwann eine Empfehlung geben, dass es tatsächlich erfolgversprechender ist selbst weiterhin den Torerfolg zu suchen. So selbstverständlich ausgemacht erscheint mir das nämlich nicht, im Fußball fallen nun einmal deutlich weniger Tore (lies Zählereignisse) als in anderen Sportarten. Um mal wieder auf Spielphasen zurückzukommen, das Momentum kann im Lauf eines Spiels mehrfach wechseln und die Bewertung des aktuellen Spielstands durch die Mannschaften wirkt sich ja durchaus auch aus. In der Liga, auch durch die Drei-Punkte-Regel, sicher weniger als in Turnieren, aber fühlbar ist das manchmal schon. Tja und die Liste kann man leicht verlängern. Das müsste man halt mal sammeln und eine Matrix machen, damit hätte man dann einen Satz qualifizierter Spielphasen, in die man jedes Spiel zerlegen und dann jede einzelne quantifizieren müsste. Catch my drift? Damit dürften dann auch in-game-Entscheidungen bewertbar werden. Was schon ziemlich irre wäre. Für einen Einzelnen natürlich kaum zu leisten, aber auf Basis einer ausgearbeiteten Theorie wäre ich gar nicht mal überrascht, wenn sich Wettanbieter finden würden, die das finanzieren. Ok, in die Zukunft und ins Blaue gedacht, aber… abwarten.
Nimm’s ansonsten einfach als Zeichen, dass mich deine Arbeit inspiriert hat.
Rasengrün 8. Januar 2013 um 23:50
Nachdem die Links hier immer wieder auftauchen, bin ich jetzt auch mal 11tegen11 lesen gegangen. (Ich hab das lange ignoriert, weil… ich wirklich dachte es wäre auf Niederländisch. Öh… whatever) Gefunden habe ich u.a. das hier: http://11tegen11.net/2012/08/23/the-trouble-with-football-analytics/ Spielphasen ftw!
TW 7. Januar 2013 um 21:14
Einfach mit der Suchfunktion des Browsers nach “Der perfekte Tipp” suchen. War glaub ich immer GoalImpact der darauf hingewiesen hat.
Louis 7. Januar 2013 um 19:48
Übrigens hat der Spiegel mal über eine Statistik zur Bundesliga berichtet:
http://www.spiegel.de/sport/fussball/statistik-zu-den-torchancen-der-bundesligisten-a-866120.html
„Tatsächlich zeigt die Betrachtung der vergangenen 16 Jahre Bundesliga, dass die Chancenverwertung bei allen Mannschaften in jeder Saison fast identisch ist. Die scheinbaren Unterschiede, wie beim Vergleich von Hannover und Augsburg, resultieren fast ausschließlich aus den Unwägbarkeiten, die ein Fußballspiel mit sich bringt: Latte, Pfosten, Torwart angeschossen, das Abwehrbein in letzter Sekunde, und vieles mehr.
…
Mittels statistischer Verfahren können nun die Zufallsbeiträge herausgerechnet werden, die nichts mit der Qualität einer Mannschaft zu tun haben. Es bleibt die überraschende Erkenntnis, dass in Wirklichkeit alle Mannschaften bei Mittelung über viele Spiele genau vier Chancen für ein Tor benötigen. Erst bei genauerer Betrachtung bleiben ganz kleine Unterschiede (gute Mannschaften etwa 3,8 Chancen pro Tor, schlechte Mannschaften etwa 4,2 Chancen pro Tor). „
Louis 7. Januar 2013 um 20:08
P.S.: Ich bin kein Sportwissenschaftler, aber ich könnte mir vorstellen, dass es in diesem Feld schon einige weitere Untersuchungen zu diesem Thema gibt und man vielleicht nicht nur auf Taktikblogs schauen sollte.
TW 7. Januar 2013 um 20:58
Das Buch, auf das sich der Artikel bezieht, wurde in den Kommentaren bereits mehrfach angesprochen.
GoalImpact 7. Januar 2013 um 21:04
Ja. Z.b. hat der Autor des Spiegel-Artikels ein ganzes Buch darüber geschrieben.
Louis 7. Januar 2013 um 21:09
@ TW: alles klar. Ich habe die Kommentare nicht von vorne bis hinten gelesen, sondern nur überflogen… Wenn du es parat hast, könntest du vielleicht die entsprechenden Kommentare nennen (weil es geschätzt eine halbe Stunde dauern würde, alles zu lesen).
LeFlo777 7. Januar 2013 um 16:22
Hallo,
sehr interessanter Artikel und noch besser ist die Diskussion. Ich finde es super, dass ihr versucht, Fußball-Analyse mit Hilfe von Statistischen Mitteln zu betreiben und Ein Fußball-Statistik-Theorie zu entwicklen, die bei der Analyse von Fußballspielen helfen (können).
Ich glaube allerdings, dass es es relativ kompliziert ist, hier wirklich vorzeigbare Ergebnisse zu bekommen und stimmte HW in vielen Kritikpunkten zu.
Interessant/Fraglich sind für mich auch die Rohdaten, auf die sich die Therie stützt. Die Größen „Schüsse“ und „Schüsse aufs Tor“ sind vielleicht einfach zu ermitteln, allerdings finde ich, dass es hier doch erhebliche Unterschiede gibt.
Ein Schuss, der knapp am Tor vorbeigeht wird genauso gezählt wie ein Schuss der weit vorbei geht.
Genauso werden Schüsse aus kurzer und weiter Distanz gleich bewertet.
Schöner wäre es, wenn die Rohdaten hierzu besser aufgeschlüsselt wären. Zu jeden Schuss müsste Geschwindigkeit, Abstand zum Tor, Winkel, Distanz zum Tor (bei Fehlschüssen neben das Tor), Bedrängter bzw unbedrängter Schuss, etc erfasst werden. Daraus könnte man dann vll so was wie ein „Gefährlichkeitsindex“ und einen „Schwierigkeitsindex“ eines Schusses ermitteln.
Ich glaube, dass man mit den ungenauen Rohdaten vor allem viel Rauschen misst und berechnet.
Lukas Fesca 7. Januar 2013 um 17:15
Wie festgestellt entwickel die BuLi mehr taktisch bedingtes Rauschen in den Daten, aber wenn man mal ein Ergebnis hat und das untersucht dann hat man relativ das was man „erwartet“.
Wenn du nur die Ergebnisse der BuLi mit den ausgangssituationen vergleichst, dann erkennt man klar die over-(Frankfurt, Fortuna) und underperformer(Schalke, Augsburg, Hoffenheim, etwas unter durschnitt liegt der BVB).
Das Deck sich halt recht gut mit der beobachteten Hinrunde z.B. BVB hatte gegen HSV und Wolfsburg definitiv Pech.
Man könnte einwenden, auch Bayern war spielerisch gegen Leverkusen überlegen, aber aufs Tor haben beide nur 5 Schüsse gebracht, das relativiert natürlich die „Dominanz“.
Von Frankfurt wie von Schalke hätte keiner so eine Hinrunde erwartet.
Dafür das es angeblich so ungenau ist sind die Ergebnisse halt ziehmlich gut.
Auch Abstand und Winkel sind relativ zu den Fähigkeiten Spieler. Frag mal CR oder Marco van Basten.
Die Stillschweigende annahme ist halt das ein Spieler nur aus realistischen Situationen heraus aufs tor schießt.
Diese Situationen sind halt für Müller andere als für Juan Arango.
Oder betrachte Manzukic. Der hat 9 Tore gemacht, davon hat er 7 aus dem 5er ins leere Tor geschoben. Sein Wert liegt also auch nicht wirklich in der verwandlung von Gelegenheiten. es gibt viele schlecht erfasste Cornercases aber einem großteil der Pauschalkritik kann ich nicht zustimmen.
LeFlo777 7. Januar 2013 um 20:59
@Lukas:
So jetzt hast du mich abgehängt bzw ich kann dir nicht mehr ganz folgen. So wie dich verstanden habe, gibt’s eine gewisse (objektive) Erwartungshaltung, wie gut Vereine Abschneiden müssten aufgrund der Kaderstärke, des Budegts, Kaderwert, o.ä.
Sagtst du jetzt, dass die es nur am Glück bzw. Pech liegt, wenn eine Mannschaft dieses Ziel nicht erfüllt?
Ich denke, es gibt viele und gute Gründe, wieso es bei einem Team nicht läuft. Und Überraschungsteams haben eben nicht nur Glück, sondern hat viel mit einem guten ausbalanciertem Kader (Stärken/Schwächen + Teamgeist/Gruppendynamische Prozesse), einem guten Trainer mit der richtigen Taktik für das Spielermaterial zu tun.
Ich warne davor, nur weil eine Theorie für ein paar Teams eine Halb-Saison passt, daraus gleich mehr abzuleiten. Interessant wären doch mal Daten der letzten 10 Jahre o.ä.
Wie siehst du das Abschneiden von Wolfsburg und Mainz z.B.?
Lukas Fesca 7. Januar 2013 um 21:36
Ich sage nicht das Schalke besser als Frankfurt oder Mainz abschneiden „muss“, aber es ist aus objektiven gründen die Erwartungshaltung (gewesen), vor allem bessere, erfahrenere Spieler, Budget, etc und interessanter weise ist der TSR da relativ treffsicher. Es ist nur so, das es mir aufgefallen ist. Und da Schalke dasteht als sie gespielt haben ist hier ja ein- und ausgängig erläutert worden.
Das sollte nur verdeutlichen das die Zahlen nicht nur Müll ausspucken.
Die Grundlagen der Theorie gründen sich ja nicht auf einer Halbserie, diese Hinrunde bestätigt sie mir aber bis auf gewisse, bereits genannte Ausnahmen. Auf die Grundlagen habe ich ca. 12 links gesetzt.
Es ist sinnvoll aus einer Theorie schlüsse zu ziehen, wenn sie Dinge bestätigt die man bereits weis, dann kann man sie auf andere, unbekannte Probleme anwenden.
zum BuLi langzeitvergleich:
Ich hab aber keinen Bock und keine Zeit das für die letzten 10 Jahre zu machen. Und ganz sicher nicht per Einzelauslese, wenn dann hole ich mir kompakt die ganzen Saisondaten von irgendeinem anbieter. Vielleicht wenn ich Semesterferien habe.
Wolfsburg&Mainz: Die Daten sagen, das Wolfsburg genau da steht wo sie hingehören, sie haben von einem katastrophalen auf ein unterdurchschnittliches Niveau gesteigert. Keinesfalls ein Kandidat für die obere Hälfte oder gar internationale Ambitonen. Die steigen nur wegen zu schwacher konkurrenz nicht ab.
Mainz steht imo etwas zu hoch, aber liegt aber vor allem an dem Fehlen von Schalke aber ist in der Region richtig angeordent und wird dort auch enden.
LeFlo777 8. Januar 2013 um 08:47
Sorry, da waren meine Worte wohl etwas zu unbedacht gewählt. Grundenlagen zur Theorie und ist ja wirklich genug vorhanden 😉
Was ich eher gemeint habe: hätte man die Trends der Vereine auch aus anderen Daten ermitteln können (vielleicht bessere messbare Werte)? Quote der erfolgreichen Zweikämpfe, Laufleistung, Tordifferenz der letzten Spiele, etc…
Vielleicht gibt es hier ähnliche Zusammenhänge, die mit dem Erfolg einer Mannschaft korrelieren.
Du schreibst, dass es sinnvoll ist aus einer Theorie Schlüsse zu ziehen und auf unbekannte Probleme anzuwenden. An welche unbekannten Probleme und Schlussfolgerungen hast du hierbei gedacht?
Ganz nebenbei: Ich hoffe, du verstehst meine Beiträge nicht als Kritik an dir. Mir geht’s nur um die Sache an sich und ich will diesen Sport einfach besser verstehen. Ich finde es toll, wenn sich Leute so intensiv mit Fußball auseinandersetzen!
Lukas Fesca 8. Januar 2013 um 10:08
In der Physik hilft es auch eine Theorie zu haben die alles bekannte erklärt, aber für Fußball ist ds relativ sinnfrei, denke ich.
Meine äußerungen zu Wolfsburg&Mainz habe ich z.B. aufgrund der Daten gefällt.
Die Theorie kannste jederzeit kritisieren, solange du Argumentativ vorgehst.
Ich lass mich doch nicht persönlich treffen, keine Angst.
LeFlo777 8. Januar 2013 um 10:39
Der Vorteil einer GPA (Glück-Pech-Analyse 😉 ) könnte sein, dass gewissen Erwartungshaltungen realistischer gesehen werden können. Die Frage, ob ein Team so gut/schlecht ist, weil es taktische und/oder kadertechnische Probleme gibt, oder weil das Team einfach Glück/Pech gehabt hat.
Für Vereinsfunktionäre bestimmt interessant um besser beurteilen zu können, wie und ob an der Mannschaft und dem Trainer Veränderungen vorgenommen werden sollten.
SC 6. Januar 2013 um 20:39
Hallo zusammen,
erstmal vielen Dank für diesen interessanten Artikel. Ich bin jetzt kein Statistiker und kann „nur“ auf mein Mathe-Wissen aus dem Informatikstudium zurückgreifen. Daher eine Verständnisfrage:
Es wird die These aufgestellt, dass die Schwankung des PDO von einer Saison zur nächsten belegt, dass hier eine größere Abhängigkeit vom Glück als vom Können besteht. Hier stellt sich mir als Statistiklaie die Frage, ob denn da die Stichprobe überhaupt groß genug ist, um diese Bewertung vorzunehmen? Anders formuliert: Mannschaften unterliegen ständigen Veränderungen, grade zwischen zwei Saisons. Da werden Spieler und Trainer ausgetauscht, Systeme umgestellt etc.pp.. Müsste man nicht aber für eine statistische Bewertung eine Stichprobe von einer gewissen Mengengröße haben? Also z.B. eine gewisse Anzahl von Spielen mit demselben taktischen System, mit denselben Spielern gegen dieselbe Mannschaft welche wiederum ebenfalls dasselbe System und dieselben Spieler aufstellt wie zuvor?
Nichtsdestotrotz danke für die Denkanstöße! Letztlich liegt es halt doch wieder daran dass die Nationalhymne von Spanien keinen Text zum Mitsingen hat! 😉
Lukas Fesca 6. Januar 2013 um 23:04
Die Messgröße mit der man festgestellt hat das der PDO eine sehr starke Regression zum Mittelwert hat war ja nicht 1 Saison.
Der untersuchung liegen Daten aus 12 Jahren Premier League zu grunde. Die Datenmenge ist schon groß, das sind ~200 Vergleiche, und da sind die Mannschaften die ab- oder aufgestiegen sind natürlich nicht dabei.
Das die taktische Variabilität der PL [historisch] nicht so groß ist schadet der untersuchung auch keinesfalls;)
BenHasna 6. Januar 2013 um 18:11
@ Lukas Fesca: Sehr gut dargelegt.
Kenne PDO aus der NHL und habe auch Berechnungen zur Bundesliga in den letzten Jahren durchgeführt, etc. Grundsätzlich eh einverstanden mit allem, was du sagst.
Mir ist aufgefallen, dass die Chancenverwertung der Gegner etwas weniger Regression zur Mitte aufweist als die eigene Chancenverwertung. Im Eishockey ist das zwar ähnlich der Fall, aber weniger ausgeprägt und deshalb PDO bis auf +/- 1-2 Prozentpunkte wirklich eine herausragende Statistik für nicht erklärbare Varianz, Glück, Zufall oder wie immer man das nennen will. In der Bundesliga scheint sich das leicht stärker zu streuen, wobei eben hauptsächlich die Chancenverwertung der Gegner dafür verantwortlich ist. Das bedeutet, dass die save percentage etwas weniger zufällig erscheint als die eigene Chancenverwertung.
Bin mir deshalb insgesamt nicht sicher, ob PDO in dieser Form die beste Lösung für die Bundesliga oder den Fussball allgemein darstellt. Das Konzept dahinter unterstreiche ich total, aber eben, wenn die zwei Variablen der PDO nicht gleich extrem normal gestreut sind, ergibt eine Addition vielleicht keinen Sinn.
Ich schaue deshalb die eigene Chancenverwertung sowie die save percentage wieder verstärkt getrennt an, und bin eben bei der save percentage weniger schnell bereit, extreme Werte als luck zu bezeichnen. Vielleicht sollte man adjusted PDO oder so etwas entwickeln für den Fussball und dabei eben berücksichtigen, dass saver percentage nicht komplett zufällit ist.
Das wie gesagt meine Erfahrung am Rande – prima Job hier von dir sonst!
Lukas Fesca 6. Januar 2013 um 23:07
Der PDO streut tatsächlich stärker, aber mal sehen was der am Ende der saison sagt, da ist noch Platz für ne ordentliche Regression.
Danke, mein „Job“ wars ja nur sowas auf deutsch mal bekannt zu machen.
TaunusT 6. Januar 2013 um 13:57
Ihr lieben Leute, wenn ich mir das durchlese, dann fällt mir auf dass von deskriptiver und induktiver Statistik aus dem Studium nicht viel hängen geblieben ist. Alles sehr interessant, aber schon schwere Kost.
Man wird wohl letztlich nie genau rausfinden, warum eine Mannschaft gewinnt, obwohl sie eigentlich schlechter ist als der Gegner, und umgekehrt. Mir sind daher (als Freizeitleser) Analysen von einzelnen Spielen oder Spielszenen lieber.
Trotzdem: Hut ab!
Lukas Fesca 6. Januar 2013 um 15:22
Die Frage ist doch wie viele hier überhaupt a) Studieren ,b)schon das Studium hinter sich haben und c) mit einer Richtung in der es Satistik überhaupt gibt.
Bei der Frage wie man herausfindet warum eine Mannschaft gegen eine bessere oder schlechtere gewinnt oder verliert muss man ja erstmal herausfinden warum eine Mannschaft überhaut „gut“ ist.
Sonst kommt man möglicherweise zu dem Punkt das eine Mannschaft gut ist weil sie gewinnt.
Von einer great unifying theory sind wir noch weit entfernt.
TaunusT 6. Januar 2013 um 16:12
Mir fällt grade auf dass ich etwas zweideutig formuliert habe. Ich wollte damit sagen dass bei MIR nicht mehr viel hängen geblieben ist, bzw. nicht so viel wie ich es gerne hätte, um in solchen Überlegungen besser mitmischen zu können. Das war keinesfalls als Kritik an Dir oder den anderen Statistikern hier gemeint!
Im Gegenteil, finde es sehr beeindruckend, wenn man sich in seiner Freizeit so intensiv mit komplexen Dingen befasst. Ich bin zwar in meiner Freizeit auch sehr interessiert und liege nicht blöd in der Ecke rum, aber ich konsumiere halt eher interessante Inhalte anstatt sie zu schaffen. Von daher meinen höchsten Respekt!
Zu deinem letzten Punkt: Ja, da hast du Recht. Letztlich gilt es, sich darüber Gedanken zu machen. Sonst könnte man es ja mit Hans Krankl halten, der einst sagte: „Wir müssen gewinnen, alles andere ist primär.“ 🙂
GoalImpact 5. Januar 2013 um 20:21
Es lohnt sich doch immer bei Euch vorbei zu schauen. Vielen Dank für das interessante Interview und an die Leser für die spannenden Anmerkungen.
@Lukas: Falls Du das Buch „Der perfekte Tipp“ von Andreas Heuer noch nicht gelesen hast, sei es Dir wärmstens empfohlen.
Dort wird auch festgestellt, das Torchancen mehr über die Spielstärke aussagen als Tore. Die Chancenverwertung ist bei allen Mannschaften fast gleich. Der Unterschied liegt hauptsächlich in der Anzahl der Chancen. Trotzdem haben gute Mannschaften eine leicht bessere Quote.
Er macht auch einige erste Schritte in Richtung den Top-Down-Ansatz mit Bottom-Up-Kennzahlen zu verheiraten. Finde ich ganz spannend und sollte viel mehr gemacht werden.
Die Kennzahlen TSR und BDO finde ich persönlich nicht ideal definiert, weil sie Informationen beider Mannschaften vermengen und damit Information schwerer zugänglich machen. Ich kann einen TSR von 100% haben und trotzdem nur eine Chance gehabt haben. Der Gegner hatte halt keine. Das geht nicht mehr daraus hervor.
Lukas Fesca 5. Januar 2013 um 21:59
Wenn du bei 1 Schuss einen TSR von 1,00 hast, dann hast du keinen einzigen schuss zugelassen, das würde ich als gut gespielt ansehen.
Ich Messe die Spielstärke beriets per TSR, da haben die Tore keinerlei einfluss drauf.
Ich muss aber Schüsse nehmen, weil „Chancen“ relativ schwammig ist und es den Wert in den Daten nicht gibt. Da ist natürlich die Annahme dabei das die Teams Fußball und nicht „TSR-betrügen“ spielen. Du kannst aber jede statistik ad absurdum führen indem du voraussetzt das eine Mannscahft an ihr vorbeispielen will.
Du musst schon den Gegner mit einrechnen. Gegen Kreisligamannschaften hat sogar Arminia Bielefeld tolle zahlen. Die Qualität einer Mannschaft steht immer im vergleich zur Competition. Z.B. der Avr. TSR aller Mannschaften gegen die das Team gespielt hat wäre da ein möglicher Wert.
Der TSR einer ganzen Liga ist immer 0,5.
Du kannst nur so gut spielen wie der gegner es zulässt.
GoalImpact 6. Januar 2013 um 00:52
Ein hoher TSR ist leider nicht immer gut. So war meine Anmerkung gemeint. Ein TSR von 1 kann bedeuten, dass sich zwei Mannschaften neutralisiert haben und eine gar nicht und die andere nur einmal aufs Tor geschossen hat. Das ist nicht gut, sondern hoch wahrscheinlich Unentschieden trotz Top-TSR.
Ein TSR von 1 kann (und wird in der Regel) natürlich wie von Dir beschrieben tatsächlich Überlegenheit anzeigen.
Ein besseres Maß als die Schußquote wäre die Schußdifferenz. Dann gibt es die Probleme nicht.
SR 6. Januar 2013 um 04:26
Leider ist der PDO Wert empirisch unbrauchbar. Das hat verschiedene Ursachen:
1) Die absolute Hypothese auf der deine Kennzahlen beruhen, dass mehr Torschüsse eine bessere Leistung bedeuten (höherer TSR), ist falsch. Diese Annahme könnte nur unter folgenden Annahmen als richtig betrachtet werden: a) beide Teams spielen dasselbe System mit der selben taktischen Ausrichtung b) die Intensität des Spiels bleibt bei beiden Mannschaften während des gesamten Spiels konstant. Beide Annahmen a und b können nur mit Hilfe gesunden Menschenverstandes als falsch abgelehnt werden.
2) Die Vermischung der Formeln für die eigene Chancenverwertung mit der des Gegners für den PDO ist nicht zulässig. Die Variablen für „Abwehrstärke“ und gegnerische Chancenverwertung beeinflussen einander sind aber nicht abhängig sondern von dessen Spielsystem abhängig. Ein Beispiel dafür ist z.B. Hannover 96 oder Gladbach letzte Saison. Eine kompakte Abwehr zwingt den Gegner zu vielen Weitschüssen oder bedrängten bzw. geblockten Abschlüssen. Eine Konterstrategie mit hohen Risikopässen führt zu wenigen, aber hochwertigen Torchancen. beides zusammen lässt den PDO ins extreme schiessen (ohenne eine Aussagekraft dahinter, weil es strategisch begründet ist).
3) Die Begründung dass der PDO Glück wiederspiegelt, weil er sich jede Saison ändert ist wahnwitzig. Die tatsächlichen Gründe wurden weiter oben bereits genannt.
4) Du selbst scheinst den Wert noch nicht ganz durchschaut zu haben: Ein Rückstand würde in der Regel nicht zu einer Erhöhung sondern einer Senkung des PDo führen, weil von da an oft folgendes geschieht: man spielt offensiver und wechselt oft. Das wird meist mit einem zusätzlichen Defensivorientierten Spieler beantwortet. Es ergeben sich wieder viele Abschlüsse unter starker Bedrängnis und hochprozentige Konterchancen für den Gegner. Das führt zu einem noch höheren PDO für die verteidigende Mannschaft und ein noch tieferer Wert für die aufholende.
5) Der Wert korreliert natürlich immer stark zugunsten der Tore erzielenden Mannschaft (in einem Spiel). Von daher ist sein Aussagewert sehr beschränkt. Ausserdem ist er durch die niedrigen Anzahl geschossener Tore und der Differenz beim Fussball statistisch nicht immer relevant.
Falls du nicht das Interesse verloren hast können wir uns gerne darüber unterhalten warum ich persönlich den Wert in der momentanten Definituion auch praktisch für nutzlos halte und unter welchen Bedingungen er an Aussagekraft gewinnen würde.
TW 5. Januar 2013 um 16:02
Eine Detailfrage hätte ich noch für das Verständnis. Gegen was genau werden TSR und PDO auf der x-Achse aufgetragen, um die Korrelation/den Determinationskoeffizienten zu bestimmen? Oder geht es dabei wie im ersten Plot der Punkte wirklich nur um die Wiederholgenauigkeit Saison(n-1) vs. Saison(n). Interessanter wäre doch dann eigentlich so etwas wie TSR vs. Punkte am Saisonende, oder?
Lukas Fesca 5. Januar 2013 um 16:40
Man trägt jeweils von allen Mannschaften die nicht abgestiegen sind Jahr n gegen Jahr n+1 auf, oder andersrum, das ist egal. Daraus leitet man dann ab wie gut etwas zur vorhersage taugt=wie skillabhängig der wewrt ist. Wenn ich vorher weis das jemand glück hat, ist es kein Glück.
Man kann den TSR auch den Punkten der saison gegenüberstellen, 1 Saison sind da zu wenig Daten, das was du suchst ist folgendes:
http://jameswgrayson.wordpress.com/2012/07/16/another-comparison-of-shots-goals-and-luck/
und evtl.
http://jameswgrayson.wordpress.com/2012/07/15/another-post-about-tsr/
TW 5. Januar 2013 um 17:28
Vielen Dank für den Link. Die Grafiken sind super.
Gassmao 5. Januar 2013 um 15:55
Hallo,
hat vielleicht jemand schon ein vorbereitetes exel-sheet zu einer Analyse im sinne von der Hinrundenanalyse von Lukas?
wenn ja, wäre es super, wenn man dieses von eurer seite runterladen könnte um selber etwas mit Daten herumzubasteln.
vielen dank übrigens – für die tollen Artikel.
TW 5. Januar 2013 um 15:32
In der Formel zum PDO, muss es da nicht (100 – gegn. Chancenverwertung in %) heißen? Ansonsten würden bei der Multiplikation mit 10 nicht Werte bis 1000 rauskommen.
Ich hab grad auch mal eine schnelle Recherche zum Thema Data Mining (Suchen von Zusammenhängen in Daten) und Feature Selection (Erkennen von Merkmalen, die aus mehreren Einzelparametern abhängen, wie beispielsweise RMs Defensiv- oder Pressingkompetenz) in Google Scholar (Datenbank wissenschaftlicher Artikel) gemacht. Es ist echt interessant, dass es da nichts zu finden gibt. Da ich selbst im akademischen Umfeld viel Datenanalyse (im Maschinenbau) mache, wundert mich das doch sehr, da die hier beschriebene Technik der linearen Regression die einfachste aller Techniken ist.
Philo 5. Januar 2013 um 15:15
Ich will der Behauptung, dass der Anteil der erspielten Chancen mehr über die Leistung einer Mannschaft aussagt als der PDO, gar nicht widerspechen. Die Begründung aber scheint mir zwar nicht unplausibel, aber dennoch anfechtbar zu sein.
Wenn ich das richtig verstehe, wird aus der fehlenden Konstanz des PDO über mehrere Saisons hinweg abgeleitet, dass er nicht vom Können, sondern von Glück abhängig sei. Dazu müsste man jedoch erst einmal wissen, wie stark denn die anderen Werte schwanken (also TSR, STR etc.). Ich finde in dem Interview dazu leider keine Angaben.
Das Schwanken des PDO könnte auch durch Spielerwechsel oder Verletzungen erklärt werden. Zudem sind Formschwankungen zu berücksichtigen. (Bei Spielern wie Gomez und Huntelaar habe ich den Eindruck, dass ihre Formkurven stärkere Ausschläge haben als die anderer Spieler. Aber das könnte auch an ihren Spielweisen liegen. Keine Ahnung.) Taktische Umstellungen (etwa infolge eines Trainerwechsels) könnten zudem zu einer veränderten Qualität der Chancen und damit indirekt einem anderen PDO führen. Aus diesen Gründen halte ich den PDO innerhalb einer Saison für relevanter als den Vergleich über mehrere Saisons hinweg.
Ein weiterer Aspekt ist, dass der PDO zwar für das „Chancenglück“ aussagekräftig ist, weil er auch die Chancenverwertung des Gegners berücksichtigt. Für die Frage, ob Chancenverwertung mehr Glück als Können ist, ist aber allein die eigene Chancenverwertung relevant. Und da könnte ich mir vorstellen, dass die eigene Chancenverwertung stabiler als der PDO ist.
Im Interview wird behauptet, dass der PDO nicht mit anderen Werten korreliert. Aber folgt daraus wirklich, dass er nichts mit Können zu tun hat? Man erwartet normalerweise, dass, wenn eine Mannschaft gut in Form ist, sich das auf alle spielerischen Belange gleichermaßen auswirken sollte. Doch das ist nicht unbedingt wahrscheinlich. Hat man zum Beispiel im Training viel Kombinationsspiel geübt, dürfte sich das positiv auf die Passgenauigkeit auswirken, ohne einen nennenswerten Effekt auf Zweikampfstatistik zu haben. Oder halt den Torabschluss.
Noch etwas ist in diesem Zusammenhang zu bedenken: Am Erarbeiten von Chancen ist die ganze Mannschaft beteiligt, für den Torabschluss sind aber in erster Linie die Offensivspieler und ganz besonders natürlich die Stürmer verantwortlich. Die Chancenverwertung ist stärker von einzelnen Spielern abhängig als die Zahl der erarbeiteten Chancen, weil bei letzterer viel mehr Rädchen ineinander greifen und sich Formschwankungen oder Ausfälle einzelner Spieler weit weniger stark bemerkbar machen.
Mir geht es halt darum, dem kontraintuitiven Eindruck entgegenzuwirken, als sei es relativ unwichtig, wen man vorne hinstellt, um Tore zu schießen. Ich bin schon der Meinung, dass Schwankungen beim Torabschluss oft eher durch Glück/Pech als durch Formschwankungen zu erklären sind (wobei man sich immer auch die Qualität und die „Knappheit“ der vergebenen Chancen ansehene sollte). Wahrscheinlich werden Stürmer, im Vergleich zu anderen Spielern, auch für zuviel Geld gehandelt. Aber dennoch sträube ich mich dagegen, den PDO ausschließlich oder fast ausschließlich durch Glück zu erklären.
ZeugeYeboahs 5. Januar 2013 um 14:17
Hochinteressanter Artikel, vielen Dank an alle Beteiligten! In einem Punkt möchte/muss ich aber deutlich widersprechen. Es geht um folgende Aussage:
„Der PDO hat somit gar nichts mit dem Skill zu tun, sondern ist reines Glück.“
Wenn in diesen Wert im Wesentlichen nur die eigene und gegnerische Chancenverwertung reingehen, dann ist dieses PDO mMn mehr als Glück:
a) Zum Teil ist natürlich Glück im Spiel: Dinge die ein Spieler beim Torschuss nicht kontrollieren/beeinflussen kann, Unebenheiten im Rasen, Laserpointer im Auge, Schuhe schief geschnürt, zu wenig Gel im Haar etc.
b) Rein der Fußballlogik entsprechend geht aber sicherlich auch „Skill“ mit hinein. Es gibt einfach bessere und schlechtere Fußballspieler/Stürmer, die besser oder schlechter etc. schießen, knipsen, passen,… Gute Spieler haben (im Durchschnitt) eine absolut höhere Chancenverwertung als schlechtere. (Würde da gern mal Messi’s Statistiken sehen…).
c) Die aktuelle Form eines Spielers (einer Mannschaft). Grad nach Verletzung wieder zurückgekehrt, schleppt Grippe mit sich rum, schlecht geschlafen, schlecht drauf wegen Stress mit Freundin, etc. Und solch individuellen Formen können sich innerhalb einer Mannschaft natürlich auch zufällig häufen, bzw gegenseitig beeinflussen. (Spielmacher schlecht drauf, Stürmer kriegt weniger gute Pässe, Stürmer sauer und schlecht drauf, …)
Ist vielleicht auch ne Frage/Definitionssache, was man als Glück bezeichnet und was nicht.
Definitiv aber, so wie die Formel aufgestellt ist, geht da auch die bestehende individuelle Klasse der Spieler (skill) ein.
Lukas Fesca 5. Januar 2013 um 14:55
Heijeijei, ich schreibs gerne nochmal: Die Aussage das PDO reines Glück ist, kommt nicht daher, das man das aufgrund der Werte die eingehen weis, sondern, weil man überprüfen kann das kein Team konstant einen guten PDO hat.
Wenn es kein Glück wäre, dann kann man ja davon ausgehen das es reproduzierbar ist. Dies ist aber nachweislich nicht der fall.
Was ist denn „der Stürmer/TW/Spieler xy hat ne schlechte Phase“ anderes als Glück bzw. Pech?
btw „Glücklich“ Elfmeter bekommen erhöht auch den PDO, weil man den zu ~75% reinschiebt, was man aus dem Spiel natürlich nicht tut. Die sind dann vielleicht Dummheit der Gegenspieler/Schiris, aber ist das nicht auch Glück?
Barcas PDO nach 17 Spielen ist 1099. Auch wenn sie sehr lange auf das herausspielen von Torchancen hinarbeiten und Messi haben geht der Wert deswegen nicht durch die Decke.
HW 5. Januar 2013 um 15:19
Aber ein schwankender PDO ist nicht zwangsläufig mit Zufall oder Glück zu begründen.
Wenn ein Wissenschaftler 10 Tests durhführt und jedesmal den Testaufbau verändert, dann hängen die unterscheidlichen Ergebnisse auch nicht vom Glück ab.
Der von dir angesprochene Elfmeter muss ja kein Glück sein (Glück wäre das nur bei einem zu unrecht gegebenen Elfmeter).
Die Begründung eine Schwächephase eines Spielers ist auch nicht unbedingt mit Zufall zu erklären. Klar wäre es für den HSV Pech wenn RvdV durch z. B. die Trennung von seiner Frau schlechter spielt, aber solche faktoren kann man immernoch versuchen zu beeinflussen und damit den Einfluss der Variable Glück/Pech verringern.
Bei 17 Spielen pro Halbserie hat eine Mannschaft 17 verschiedene Gegner, bis zu 17 verschiedene Aufstellungen, bis zu 17 verschiedene taktische Ansätze, bis zu 17 verschiedene Wetterlagen, usw. usw. Für mich sind das alles Faktoren, die Statistiken schwanken lassen.
er PDO ist ein für ein bestimmtes Spiel individueller Wert, der nicht einfach auf andere Spiele übertragen werden kann. Interessant wäre der Vergleich von Hin- und Rückspiel im Europapokal über den man evtl. den „Erfolg“ von taktischen Anpassungen verdeutlichen kann.
ZeugeYeboahs 5. Januar 2013 um 19:41
Ich denke du hast Unrecht. Meine Argumentation beruht auf der gegebenen Definition der PDO Formel (die ja gar nicht von dir stammt, sondern diesem Eishockeytyp).
In die Formel gehen die eigene sowie die jeweils gegnerische Chancenverwertung als einzige Variablen ein.
Und jetzt erklär mir bitte, dass die Chancenverwertung NUR eine Frage des Glücks ist. Klar, Glück ist mit drin, aber logischerweise nicht der einzige Faktor.
Ich schlage dir folgendes Exempel vor, bezugnehmend auf dein Beispiel des FC Barcelona von dieser Saison.
– Mach das mal diese und die letzten paar Saisons. Ich wette Barcelona hat systematisch einen besseren PDO als 1000, einfach weil die systematisch besser (wenn auch nicht extrem) sind als ihre Gegner
– Check mal Pokalspiele, wo Bundesligisten gegen unterklassige Mannschaften spielen, wo der individuelle Qualitätsunterschied deutlich(er) sein müsste. Ich wette hier findest für die Bundesligisten systematisch bessere PDOs als 1000.
Max 5. Januar 2013 um 10:18
Natürlich macht eine solche Analyse sinn! Vorausgesetzt, man benutzt den gesunden Menschenverstand, um die Daten und Indikatoren zu verstehen.
Wenn ich meine TSR verbessern will und einfach nur sinnlos auf’s Tor ballere, dann mache ich mir ja damit automatisch meinen PDO kaputt, weil die Dinger eben nicht reingehen.
Wenn ich aber davon ausgehe, dass mein Team nur aus aussichtsreicher Position schießt, kann ich mit den Werten schon etwas anfangen. Und die verwendeten Datenmengen sind hinreichend groß, um tatsächlich eine statistische Aussagekraft zu erhalten – über eine Serie von Spielen oder eine Saison hinweg. Einzelne Spiele kann ich natürlich nicht vorhersagen – höchstens eine Wahrscheinlichkeit abgeben, dass z.B. Bayern gegen Hoffenheim gewinnt.
Einen Punkt, in dem ich manchmal die Vermutung habe, dass sich das Glück doch nicht ganz normalverteilt verhält ist die Psychologie: nach einem schlechten Start kann die Moral einer Mannschaft nachlassen was wiederum zu schlechten Ergebnissen führt, oder „hast du scheiße am Schuh, hast du scheiße am Schuh“. Wobei mir jetzt auch die Idee fehlt, wie man so etwas statistisch untersuchen könnte.
Lukas Fesca 5. Januar 2013 um 14:09
Naja, in dem man seinen TSR gut manipuliert spielt man keinen guten Fußball, aber wenn man guten Fußball spielt hat man meißt einen guten TSR.
Schuss% und Save% sind beide normalverteilt:
http://jameswgrayson.wordpress.com/2011/03/30/shooting-percentage-part-i/
http://jameswgrayson.wordpress.com/2011/03/31/save-percentage-part-i/
Damit ist der PDO der sich aus beiden Werten zusammensetzt auch normalverteilt.
Ich hab jetzt auch den etwas späteren Blogeintrag gefunden und 74% Regression zum Mittelwert sieht ziemlich wie Glück aus:
http://jameswgrayson.wordpress.com/2011/10/31/predicting-future-performance-revisited/
Anhaltende psychologische Faktoren würde ich einfach unter Pech verbuchen. Blockade beim Mittelstürmer ist halt das Pech der Mannschaft.
CJ 5. Januar 2013 um 03:45
Mir gefällt der PL-Bubble Plot auch sehr gut. Doch insbesondere MU macht mich doch etwas stutzig. Deiner Interpretation folgend wäre Manu nur die sechstbeste Mannschaft der PL (TSR) und hatte letzte Saison nur unglaubliches Glück (mit Abstand höchster PDO). Scheint mir nicht sonderlich pausibel.
RM 4. Januar 2013 um 22:42
Offtopic: Was mich besonders freut, ist der rege Austausch und die Diskussion; nicht nur jetzt, sondern generell, aber eben bei diesem besonders. Wohl nicht nur das erste Interview mit einem Leser, sondern auch das erste interaktive Interview auf einem deutschsprachigen Blog. Zumindest Taktikblog (hust hust).
AP 4. Januar 2013 um 21:53
@Lukas. Mich würde noch etwas interessieren.
Hast du dir vorher auch einen Kopf gemacht, wem deine aufwendige Arbeit was bringen würde?
Ich meine inwieweit kann ich als Trainer oder als Mitarbeiter, in welcher Position eines Bundesligisten auch immer, diese Daten anwenden und in die tägliche Trainingsarbeit einfließen lassen?
Oder hattest du einfach „nur“ Spaß dran 🙂
Ich will als Trainer, dass Glück einfach keine Rolle spielt… Und wenn ich weiß, wie hoch der Glückanteil in meinem Spiel ist, dann kann ich doch schauen, welche Faktoren eine Rolle spielen… Kompliziert ich weiß oder bin ich bei den ganzen Formeln komplett auf einem Holzweg
Lukas Fesca 4. Januar 2013 um 22:29
Zum einen wollte ich sehen ob das mit der BuLi funktioniert, hab aber gehofft jemand anderes machts, weil ich halt erstmal 350 Datensätze(à 4 werte) manuell ausgelesen und von hand in Excel eingetragen habe. Schön ist was anderes. Das wäre deutlich einfacher wenn ich Programmieren könnte.
Wenn ich auch die Grafiken so habe wie ich möchte, dann spricht nichts dagegen das auch zu publizieren.
Vor allem denke ich das es eine andere Dimension des Fußballs beschreibt und das kann nicht schlecht sein, denn es erweitert den Gedankenraum.
wem das was bringt? kp, aber es erleichtert die großflächige Diskussion, langfristig sind da ganz andere Sachen möglich.
Reading war 2007 Jahren 8 der PL und eine Saison später abgestiegen.
Der STR war genau gleich, nur der PDO ist um 136 gefallen.
Wenn man solche beispiele aber kennt kann man sowas wie Hoffenheim im Aufstiegsjahr auch besser einschätzen.
Das ganze „2. jahr komplex“ ist auch mit einer Regression des PDO zu erklären.
Vor allem ist ein Ranking nach TSR frappierend nah an der „gefühlten Stärke“ einer Mannschaft und beim PDO sind klare overperformer vorne dabei.
AP 4. Januar 2013 um 22:41
Danke für deine Antwort
HerrHannibal 4. Januar 2013 um 23:42
Und woran liegt das dann bei Hoffenheim oder bei Reading?
Nach deiner Auffassung am Glück. Ich sage die haben einfach weniger qualitativ gute Chancen herausgespielt und mehr gute Chancen für den Gegner zugelassen. Und darum sind sie am Ende in der Tabelle schlechter. Genau das sagt dann dein Wert aus. Mit Glück hat das überhaupt nichts zu tun.
trauni 5. Januar 2013 um 19:29
Hallo Lukas,
finde deine Analyse wirklich sehr interessant und könnte dir unter Umständen meine Hilfe anbieten.
ich kann etwas VBA programmieren (zumindest habe ich bisher alles hinbekommen was ich machen wollte) und würde gerne versuchen dich bei deinen analysen zu unterstützen.
lg trauni
HW 4. Januar 2013 um 20:19
Ich halte es bekanntlich mit Leroy Jethro Gibbs und glaube nicht an Zufälle (was kein Dogma ist).
Was ich mich bei statisischen Methoden immer frage ist, wie aussagekräftig ist die Datenbasis und wie zielführend sind die Ergebnisse?
Hilft es mir als Trainer zu erkennen, dass mein PDO oder TSR bei X oder Y liegt? Und wie aussagekräftig sind diese Werte überhaupt? Was wird z. B. über die Qualität des Eingangswerts ausgesagt und sind die Werte von Spiel zu Spiel, von Team zu Team überhaupt vergleichbar?
Die richtigen Statistiken können sehr hilfreich sein. Leider habe ich aber auch schon so viele Sachen gelesen bei denen die Schwächen offensichtlich waren, dass ich mich nicht mehr durch irgendwelche „Abhandlungen“ kämpfe.
Ich meine, dass es bei Schalke nicht stimmt sehe ich am Tabellenplatz (oder am Verhältnis Tabellenpaltz / Spieleretat im Vergleich zur Konkurenz). Jetzt geht es darum die Situation zu verbessern. Da würde ich mich nicht auf etwas abstraktes wie PDO verlassen, sondern anhand von konkreten Situationen/Fehlern und näher am Spiel gebundenen Statistiken arbeiten (Gegentore nach Flanken, Wo auf dem Fehl passieren Ballverluste usw.).
Mutt 4. Januar 2013 um 22:34
Die Aussagevielfalt scheint ja zunächst gering:
– Viele Torschüsse sind ein Qualitätsmerkmal
– „totale Kaltschnäuzigkeit vorm Tor“ ist kaum nachhaltig zu erzielen
– Statistik gibt Hinweis ob man eher Glück hat oder einen eher nachhaltigen Trend verfolgt
Der Witz ist ja nun folgender: Das hat mit Taktik nur noch bedingt zu tun. Es ist eher ein übergeordnetes, strategisches Thema. Wenn die statistischen Kennzahlen den Hinweis geben, dass man eine Pechsträhne hat, dann muss vielleicht kaum etwas geändert werden. Wenn man nun aber gerade eher eine Glückssträhne hat und dennoch den Saisonzielen hinterherhinkt, dann stimmt etwas grundsätzlich nicht.
Als Dortmunder hat man in letzter Zeit relativ gut reden, und so bemühe ich den BVB als Beispiel: Die Bewertungen der Spiele durch die Offiziellen fallen (seit Ära Klopp) dann relativ positiv aus, wenn der BVB häufig aufs Tor geballert hat. Selbst wenn man verliert oder unentschieden spielt. Das könnte man so werten, dass man in der strategischen Perspektive Wert darauf legt eine gescheite TSR zu haben und eben auf den PDO pfeift. Das bedeutet für den Trainer, er hat die Möglichkeit sein Team mittelfristig so anzupassen, dass die TSR steigt und das ist auch, woran er gemessen wird.
Also: TSR&Co sind interessant für die mittelfristige, strategische Perspektive eines Teams (wie weit man das auch immer fassen möchte). Taktiken (in einem Spiel) lassen sich damit vermutlich kaum bewerten.
Das schöne ist natürlich: mit solchen Zahlen lässt sich eine Saison in einem Diagramm darstellen – mit verbalenTaktikanalysen wird dies nie gelingen. Von daher sehe ich den Nutzen dieser Zahlen auch eher darin strategische Entscheidungen zu bewerten, wie etwa Veränderungen in der Führungsriege eines Vereins, Trainerwechsel, vermeintlich große Transfers oder prinzipielle Veränderungen des Spielsystems.
Jose Mourinho 5. Januar 2013 um 05:05
„Die Bewertungen der Spiele durch die Offiziellenälf fallen (seit Ära Klopp) dann relativ positiv aus, wenn der BVB häufig aufs Tor geballert hat.“
Wo hast du denn das her? Ein optimales Spiel läuft für Klopp mMn dann, wenn Ball sich so lang wie möglich in der gegnerischen Spielhälfte befindet unabhängig davon ob man in Ballbesitz ist oder in der defensiven Grundformation.
HW 5. Januar 2013 um 11:16
„Viele Torschüsse sind ein Qualitätsmerkmal“
Darum habe ich auch gesagt man muss die Datenbasis bewerten.
Die Anzahl der Torschüsse geht bei der Chancenauswertung z. B. verloren. 3 Tore bei 6 Chancen ergibt die selbe Quote ein Tor bei zwei Chancen.
Wie gesagt, man muss die Grenzen von Auswertungen kennen.
“ “totale Kaltschnäuzigkeit vorm Tor” ist kaum nachhaltig zu erzielen“
Wenn ich z. B. die Chancenauswertung von Spiel zu Spiel vergleiche, dann darf ich auch nicht vergessen, dass gegen unterschiedliche Gegner mit unterschiedlichen Taktiken gespielt wird. Wenn ich also eine Veränderung der Chancenauswertung feststelle, muss ich auch analysieren woran das liegt und kann die evtl. kontinuierliche Schwankung nicht einfach auf Zufall schieben. Wenn ich heute gegen den BVB und morgen gegen Augsburg spiele, dann habe ich natürlich unterschiedliche PDOs usw. das ist aber kein Zufall.
„Statistik gibt Hinweis ob man eher Glück hat oder einen eher nachhaltigen Trend verfolgt“
Wie gesagt, das hängt von der Statistik ab. Also von der Datenbasis und der Berechnungsmethode.
Es hat für mich den Anschein, dass auch im Fußball ein „Managementsyndrom“ einzughält. 4 Zahlen sind zu viel, besser sind 2 oder 1 Kennwert um die Leistung zu beurteilen.
Ich kann natürlich die Anzahl der Torchancen (ohne Berücksichtigung der Qualität der Torchance) und Tore auf die Chancenverwertung runterrechnen. Und dazu die Chancenverwertung mit der Quote abgewehrter Torchancen verrechnen. Aber bei jedem dieser Schritte verliere ich auch Informationen.
So ein Wert kann also nur Startpunkt sein und darf nicht überbewertet werden.
GoalImpact 5. Januar 2013 um 19:51
@HW
Da die Tore pro Torchance bei allen Mannschaften unabhängig von der Spielstärke sehr ähnlich ist, ist die Qualität der Torchance nicht so relevant wie es intuitiv erscheint. Tatsächlich hängt es eher davon ab, wie scharf „Chance“ denn definiert ist.
RM 5. Januar 2013 um 20:20
Ich hatte / habe eigentlich nur zwei große Bedenken. Nämlich, dass es sehr ähnlich ist, aber bei der Chancenqualität GERINGE Unterschiede entstehen und bei einzelnen Spielern ebenfalls GERINGE Unterschiede. Diese sind nur leicht spürbar (wegen der geringen Anzahl an Toren) und werden durch Spieler und Mannschaften, die ähnliches in negativer Ausführung erleiden, statistisch aufgewogen. Ein Messi und ein Barcelona wird dann durch Augsburg aufgewogen.
Bei Bundesligafanatic gibt es ja folgende schöne Grafik:
http://bundesligafanatic.com/wp-content/uploads/2012/12/Screen-shot-2012-12-29-at-3.08.16-AM.png
Interessant finde ich aber folgendes: Laut dieser Statistik hat Schalke eine im Ligavergleich durchschnittliche Chancenverwertung. 6,7 Tore pro Chance ist der Schnitt, sie erfüllen ihn. Beim PDO hingegen sind sie dennoch schlecht, was ziemlich gut zur Lage passt, nicht wahr? Lassen sie also einfach sehr qualitative Chancen zu? Wüsste ich eigentlich gar nicht. Die ließen auch nur sehr wenige Torschüsse zu, ich fand aber die Schüsse allesamt „haltbar“ – und einen Torwart im Kasten zu haben, der solche Sachen nicht fängt, ist auch „Pech“ UND Nichtkönnen.
Auch klasse: Düsseldorf. Die hatten mMn wirklich offensives Glück (sh. Bild von bulifanatic), weil sie einige Male bei Unterzahlkontern aus schlechten Situationen in ungünstigen Lagen irgendwie noch ein (unhaltbares) Tor gemacht haben.
HW 6. Januar 2013 um 12:09
@GoalImpact
Die Chancenauswertung ist unabhängig von der Spielstärke doch nicht ähnlich. Im gerade veröffentlichten Artikel von TR sieht man Unterschiede von etwa 17% bis 42% (CN).
Daher kann ich die Chancenqualität nicht so einfach vernachlässigen. Gerade bei den Aufsteigern sieht man große Unterschiede die sich durch die Spielweise und die resultierende Chancen-Qualität ergeben können.
HW 6. Januar 2013 um 12:49
@RM
„und einen Torwart im Kasten zu haben, der solche Sachen nicht fängt, ist auch “Pech” UND Nichtkönnen.“
Schalke hat die Torleute ja nicht zugelost bekommen. Wenn der Torwart nicht gut genug ist, dann ist das mangelndes Können. Ob das durch Training, Taktik oder anders behoben wird ist eine andere Frage.
Bei Schalke muss man sich vor allem Fragen ob die Leistung zu dem passt was man für den Kader ausgibt. Vielleicht passen die Ergebnisse zur Leistung, vielleicht nicht. Aber die Kosten sind bei diesen Ergebnissen auf jeden Fall zu hoch und können bei verfehlen eines EL oder CL Platzes auch nicht gehalten werden.
Man muss sich also für die mittel- und langfristige Betrachtung fragen ob der Kader sein Geld wert ist und das auch in Relation zu anderen Vereinen in der Liga setzen. Stevens musste schon gehen weil er offensichtlich nicht das Beste aus dem Kader herausgeholt hat. Jetzt muss sich zeigen wie viel ein anderer Trainer erreicht und welche Ideen er umsetzt.
HW 6. Januar 2013 um 12:55
Die BLFanatic-Grafik hat einen Fehler (sicher nur ein Versehen in der berschrift).
Eine Goal / Chance Ratio kann nicht über 1 liegen, es ist wohl Chance / Goal Ratio gemeint.
Auch wenn nur ein Typo, trotzdem eine nette Erinnerung nicht alles vorschnell zu übernehmen.
zuzak 4. Januar 2013 um 19:39
[RM: „Puh, Gott sei Dank unterstützen die Statistiken meinen Artikel zu Rayo! Und du hast nun nicht nur ein paar Spiele analysiert, sondern uns eine beeindruckende Analyse zu allen Bundesligateams und ihren Spielen geschickt. Wieso eigentlich?“
Könnt ihr diese Analyse hier veröffentlichen? Würde mich interessieren.
RM 4. Januar 2013 um 19:44
Habe den Link zur Analyse reineditiert!
zuzak 4. Januar 2013 um 19:54
Also ich meinte seine komplette Analyse zur Bundesliga.
Tanqueray 4. Januar 2013 um 16:35
Ich denke der FC Barcelona ist es mal wieder, der diesen Ansatz ad absurdum führt. Gemeint ist die Aussage, dass die Chancenverwertung nur Glück ist.
Sie haben eigentlich stehts die beste Chancenauswertung in der Liga. Und wiederholtes Glück ist ja bekanntlich schon wieder Skill.
Lukas Fesca 4. Januar 2013 um 17:12
Jein. Ich habe für RM auch Barca mal durchgecheckt.
Die haben in überraschend vielen Spielen viele Schüsse kassiert, der TSR ist relativ durchschnittlich, aber der STR wieder abnormal hoch, die Daten haben da den gleichen tick den es auch bei Leverkusen gibt.
Der PDO ist aber nicht abnormal hoch. damit man das aber genauer wüsste müsste man schon wirklich viele Spiel analysieren.
Barca bringt 58% aller schüsse aufs tor, davon aber „nur“ ~43% rein(ein tatsächlicher weltklasse wert!).
Da Barca aber bei im Schnitt 3 Torschüssen pro Spiel meist auch einen Gegentreffer bekommen hat ist der wert völlig im Rahmen.
wenn jemand lust, Zeit und Daten hat kann er das ja mal für die guardiola-ära ausrechnen. Ich hab mir in den letzten paar tagen die Daten von 170 Spielen ausgelesen, ich brauch das jetzt erstmal nicht.
HerrHAnnibal 4. Januar 2013 um 17:51
Es geht doch nicht darum was die errechneten Werte aussagen. Ich bezweifle dass man mit dieser Art der Analyse überhaupt irgendeine valide Aussage zum Thema Glück treffen kann.
Die ganze Herleitung macht doch keinen Sinn.
Man kann nicht einfach mit der „Chancenverwertung“ rechnen ohne die Qualität der Chancen zu berücksichtigen.
MR 4. Januar 2013 um 18:27
Wieso schlussfolgerst du aus der mangelnden Tauglichkeit zur Glücksprognose, dass es nicht darum geht, was die Werte aussagen? Gerade wenn es eben nicht nur Aussage A zulässt, dann ist doch zu diskutieren, was es dann eben aussagt.
Wie du richtig sagst, wird der Faktor Glück in dem Fall von der Chancenqualität verzerrt. Schlussfolgerung: Der Wert ist eben Chancenqualität + Zulassungsqualität + Glück.
Solange die Chancenqualität und die Qualität der zugelassenen Chancen normal gestreut sind (das dürfte schätzungsweise bei vielen Klubs der Fall sein), ist es dann aber auch ein guter Indikator für das Glück alleine.
Lukas Fesca 4. Januar 2013 um 19:18
Die aussage das ein guter PDO glück ist, hängt nicht damit zusammen das das ihärent so sein muss, aber er geht (wie immer auf Grund von PL daten) sehr stark gegen den Mittelwert 1000.
Lies das, wenn dus nicht glaubst:
http://jameswgrayson.wordpress.com/2011/04/15/pdo-part-ii/
wenn ihr meint sie spiegeln kein Glück wieder, aber man könnte sonst was aus den Daten lesen, dann tut das.
PDO=Varianz ist nur die bisher gängige Interpretation.
GoalImpact 5. Januar 2013 um 19:44
Das die Chancenverwertung nicht mit der Spielstärke korreliert (Also Bayern die gleiche Verwertungsquote hat die Augsburg) stimmt weitgehend. Schaut man genau hin, so haben gute Mannschaften eine leicht höhere Torausbeute als schlechte. Das mag an der Kaltschnäutzigkeit vorm Tor oder einfach nur an der Qualität der Chancen liegen. Im lesenswerten Buch „Der perfekte Tipp“ ist das schön dargelegt.
HW 5. Januar 2013 um 21:09
@Lukas Fesca
Ich finde diesen Link den du gepostet hast sehr aufschlussreich:
http://jameswgrayson.wordpress.com/2011/04/15/pdo-part-ii/
Da steht z. B.
“
As the premiership average sh% is 21.8% and sv% is 78.2% the average PDO is
PDO = 10 X (21.8 + 78.2) = 1000
“
Das ist auch völlig logisch denn der Liga-weite Wert für sv ergibt sich aus 100% – sh. Die Summe der verwandelten und nicht verwandelten Chancen ist immer 100%.
Dass man dann den Faktor 10 davor setzt ist ganz nett, aber nicht mehr als Augenwischerrei.
Der Wert der EPL liegt im Schnitt bei 1000, wie bei jeder anderen Liga auch.
Dass sich die Team im Schnitt um einen gewissen Mittelwert verteilen ist normal. Und dass es Ausreißer gibt auch.
Da ein Team mit einer extrem schlechten Torchancenverwertung im nächsten Jahr radikalere Veränderungen vornimmt als ein Team mit einer guten Verwertung ist nachvollziehbar und gilt genauso für die Defensive.
Schaue ich mir die Grafik auf der Seite an sehe ich auch nicht so viele Veränderungen. (Links oben und rechts unten würden ja die Extremfälle auftauchen.)
Es gibt ein paar extreme Veränderungen, aber die meisten Punkte liegen etwa +/- 50 bei ihrem Vorjahreswert. Dass diese PDO Statistik dabei alleine durch den Faktor 10 in der Formel extreme Werte auswirft und durch kleinere Anpassungen in Defensive und Offensive beide relevanten Faktoren der Formel manipuliert werden, ist da sicher die logische Erklärung für die meisten Schwankungen.
Gründe warum PDOs von Spieltag zu Spieltag schwanken habe ich schon an anderer Stelle angedacht. Dass gute Teams bessere PDOs haben als schwache Teams, und dass nichts über die Qualität der verhinderten Torchancen ausgesagt wird sollte ebenso klar sein. (Man denke an ein Team, das durch Pressing früh den Ball erobert und so Torchancen des Gegners verhindert im Vergleich zu einem tief spielenden Gegner, der zu Fernschüssen zwingt.)
Ich frage mich nun ob der PDO so ohne weiteres von einer Sportart auf eine andere übertragen werden kann.
Beim TSR muss man mal den TSR in Relation zum Ergebnis stellen. Von glücklichen Siegen kann man evtl. bei TSR unter 0,5 sprechen (Gegner hatte mehr Schüsse als das eigene Team). Aber dann vernachlässigt man, dass die führende Mannschaft gegen ende des Spiels nicht mehr auf auf weitere Tore drängt, das andere Team evtl. aber aus eher aussichtslosen Lagen schießt.
Schalke hatte folgende Ergebnisse in der Hinrunde:
Spieltag. Tore Schalke:Tore Gegner -> TSR (mehr oder weniger genau aus der Grafik abgelesen)
1. 2:2 -> 0,555
2. 3:1 -> 0,44
3. 2:0 -> 0,45
4. 0:2 -> 0,475
5. 3:0 -> 0,5
6. 2:2 -> 0,52
7. 3:0 -> 0,55
8. 2:1 -> 0,54
9. 1:0 -> 0,555
10. 2:3 -> 0,58
11. 2:1 -> 0,56
12. 0:2 -> 0,55
13. 1:1 -> 0,555
14. 1:3 -> 0,55
15. 1:1 -> 0,56
16. 1:3 -> 0,56
17. 1:3 -> 0,555
7 Siege, 6 Niederlagen, 4 Unentschieden
TSR >=0,5 bei 14 Spielen: 5 Siege, 5 Niederlagen, 4 Unentschieden
TSR <0,5: 2 Siege, 1 Niederlage
Es ist der Trend zu erkennen, dass Schalke zu Beginn der Saison niedrigere TSR Werte hatte, aber bessere Ergebnisse.
Eine Begründung wäre Spekulation. aber es wäre interessant z. B. zu untersuchen wieviele Torschüsse die Mannschaften abgeben nachdem das Ergebnis feststeht. Führe ich 3:1, dann schießt der Gegner vielleicht aus allen Lagen, oder ich kontrolliere das Spiel und es passiert nichts mehr.
Das wäre mein Ansatz: Prüfen wann der Verlierer seine Torschüsse abgegeben hat und TSR der Chancenverwertung gegenüberstellen. Dazu analysieren ob/wie sich die absoluten Zahlen verändert haben.
Wie man zur Erklärung kommt die Form wäre gut gewesen, erschließt sich mir nicht. Viele Torschüsse sind kein zwingender Indikator für gute Leistung und nach den oben aufgeführten Werten auch nicht für gute Ergebnisse.
Wie wurde der Durchschnittswert für Schalke berechnet? Mir kommt der zu hoch vor, wenn ich die Werte der einzelnen Spieltage sehe (ich schätze den Wert eher auf 0,53).
Lukas Fesca 5. Januar 2013 um 21:47
Erfolgreiche teams haben einen besseren PDO als weniger erfolgreiche, das liegt aber auf der hand, mit einer guten chancenverwertung hat man leicht mal mehr punkte;)
Da die abstände beim PDo relativ klein sein sollten macht man die mit dem Faktor 10 einfach „sichtbar“ und versteckt sie nicht in den Nachkommastellen. Die qualität der änderung unterscheidet sich doch nicht dadurch an welcher stelle es sich ändert. Du willst aber gerne unterscheidbare werte haben, sonst brauchst dus ja nicht messen, ergo faktor 10.
Das von dir angegeben Bild war aber ein älteres, da habe ich noch ein besseren link gepostet, unten bei der antwort auf TW.
klar wäre es besser zu wissen wer wann die schüsse abgegeben hat, aber krieg das mal rückwirkend über Daten raus.
HW 6. Januar 2013 um 13:17
Gut der Faktor 10 ist mMn überflüssig, weil eigentlich nur % werte miteinander verrechnet werden und eine schwankung von 50 Punkten auf 1000 ist das gleiche wie eine Schwankung von 5 Punkten auf 100. Was daran im wissenschaftlichen Sinn weniger deutlich sein soll ?? Psychologisch ist eine hohe Zahl natürlich beeindruckender, aber das gehört dan nin den vereich der Reklame oder Wahlkampfwerbung wo man Behauptung A von Behauptung B abgrenzen will und versucht beeindruckende Zahlen zu präsentieren.
Wenn du sagts, erfolgereiche Teams haben einen besseren PDO dann ist die Variable Zufall schonmal deutlich unbedeutender geworden. Schwnakungen von Spiel zu spiel ergeben sich daraus, dass Spiele nicht identisch ablaufen und auch gute teams mal kämpfen und dreckig gewinnen müssen.
Ich meine auch dass z. B. der Unterschied ob Schüsse von außerhalb oder innerhalb des Strafraums abgegeben wurden ein Anhaltspunkt für die Qualität, aber auch für den taktischen Ansatz beider Teams geben. Weitere Qualitätskriterien können sein: Stürmer im 1-gege-1 mit derm Torwart, Stürmer unbedrängt beim Abschluss, freie Schussbahn, Positionierung des Torwarts, winkel zum Tor, usw.
Und wenn dabie die meisten externen Fakoren identisch sind kann man immernoch davon ausgehen dass z. B. Arne Friedrich eine schlechtere Ausbeute hat als Ronaldo und damit die Chance eine geringe Qualität hat weil der Spieler eine geringere Qualität im Abschluss besitzt. Wobei man dort zur Grenz zwischen Qualität der Chance und Fähigkeiten der Chancenverwerung eines Spielers kommt. Auf eine Mannschaft bezogen könnte man die Wahrscheinlichkeit errechnen mit der bei feststehender Taktik und Spielzügen ein Spieler mit guten Fähigkeiten eine vorgegebene Torchance erhält. usw. usw. Aber damit entfernen wir uns vom Thema.
DDD 4. Januar 2013 um 16:33
„Wie man auf dieser Grafik sieht, gibt es eine überhaupt-nicht Korrelation zwischen STR und Trefferquote und so ein ähnliches Bild gibt es quasi für den Vergleich mit jedem relevanten Aspekt im Fußball.“
Hier sollte angemerkt werden, dass es Korreliertheit gibt und Abhängigkeit. Das Bestimmtheitsmaß misst überhaupt nichts, bis auf einen linearen Zusammenhang (Korrelation). Es kann aber troztdem einen nicht-linearen Zusammenhang zwischen zwei Variablen geben und R² ist nahe null (Abhängigkeit).
Lukas Fesca 4. Januar 2013 um 17:31
Das ist richtig, aber
1. War mir das zu Theoretisch um das nochmal klar zu erwähnen, den meisten leuten dreht sich schon davon der Kopf,
2. habe ich keine Daten um das selbst zu überprüfen,
3. sehen die Bilder ehrlichgesagt auch nicht nach sonst einer Ordnung aus.
DDD 6. Januar 2013 um 22:36
ja aber das ist ja genau mein Punkt: das R² verrät dir nichts was du nicht auch mit ner einfachen Linie oder sogar mit bloßem Auge sehen könntest.
Erkan 4. Januar 2013 um 16:04
Auf 11tegen11 gibt es wirklich seit einiger Zeit interessante Analysen darüber zu lesen, bin damals auch über die Kommentare dieser Seite auf den Holländer gestoßen.
Ich muss aber nochmal meinen Lob aussprechen, hervorragende Arbeit, so eine (Wissens-)Quellehabe ich mir schon immer gewünscht.
Anmerken würde ich gerne eines der derzeitigen Statistikforschungen, welche auch die takt. Elemente im Fußball berücksichtigt:
http://www.uni-bielefeld.de/sport/arbeitsbereiche/ab_ii/news/news_pdf_archive/dvs_Fussball_2011_Lex-et-al_end.pdf
Durch das Einfließen der takt. Situationen könnte man quasi die takt. Entscheidungen im Spiel voraussagen.
HerrHAnnibal 4. Januar 2013 um 15:46
Bei allem Respekt: Halte ich für kompletten Quatsch. Eine Mannschaft ballert aus allen Lagen auf das Tor und die andere Mannschaft sucht sich nur sehr gezielte Situationen für den Abschluss… Wie soll man da valide Daten zum Thema Glück rausinterpretieren indem man letztendlich nur die Chancenverwertung untersucht?
Stefan 4. Januar 2013 um 15:20
Ich hoffe, ich habe das jetzt nicht verpennt und es ist schon eingebaut: Statt nur die Schusswahrscheinlichkeit (=vergangene Häufigkeit) zu vergleichen, macht es nicht Sinn, diesem „Offensiv“-Wert auch den defensiv-Wert entgegenzustellen, nämlich alle wieviel Schüsse ein Tor gegen die Mannschaft fällt bzw. die „Chancen-Entwertung“?
RM 4. Januar 2013 um 15:25
Falls ich es richtig verstehe, dann ist das ein klares Ja. Das wird für jeden Gegner der jeweiligen Mannschaft in den Spielen gemacht, woraus sich dann der PDO berechnet. Ergo: man hat ein Spiel, wo man eine Chancenverwertung XY hatte und der Gegner hatte Chancenverwertung YX, wodurch man weiß, ob man Glück oder Pech bei sich selbst hatte und ob man beim Gegner Glück oder Pech hatte. So habe ich es zumindest vom Lukas her verstanden! 😀
Christoph Hänsch 4. Januar 2013 um 17:16
Hierbei darf man natürlich (sofern man den PDO in eine taktische Vorbereitung auf ein Spiel mit einbezieht) nicht vergessen, dass man gerade durch so etwas auch leicht einen Gegner unterschätzen und zu seinem Glück „zwingen“ kann.
Ich denke mal, dass ihr diesen Faktor hier bei euren Kommentaren nicht vergessen habt, aber es kam ja schon häufig bei vielen Vereinen (besonders bei meinem Karlsruher SC) vor, dass man (zumindest in vergangenen Saisons) zu schnell den Gang zurückgeschaltet hat.
Mich würde an dieser Stelle auch sehr interessieren wie sich der PDO etc auf das Spiel Deutschland gg. Schweden bezüglich der beiden Halbzeiten (getrennt analysiert) auswirkt bzw ausgewirkt hat und inwiefern man den PDO in das oftmals bekannte „Gang zurückschalten“ (und nicht wieder reinkriegen) einbeziehen kann.
Stefan 4. Januar 2013 um 18:54
Aaahh, okay, danke! Ich war mir nicht ganz sicher, ob ich die „saving percentage“ anders hätte berechnen wollen, aber „1-gegnerische Chancenauswertung“ passt natürlich, wenn man ein Spiel betrachtet (6 Schüsse, 1 Tor, 1/6 Chancenverwertung, also 5/6 Saving Percentage). Spannend, je mehr man sich damit beschäftigt, desto mehr Ideen kommen einem.