Samstag, 30. Januar 2010

Alles Statistik!

So,
nachdem ich mich heute nicht so wahnsinnig zum Lernen motivieren konnte, habe ich mich dann wenigstens mal hingesetzt und einen Teil der Erkenntnisse aus dem Internet gesiebt, über die Stefan und ich neulich am Telefon gesprochen haben. Es geht um die Anzahl von Songs und Flashs in Scrubs. Stein des Anstoßes war meine Neugierde, welche danach drängte zu erfahren, ob mich nur der Schein trügt, oder ob die Zahl an Flashes und Songs in Scrubs innerhalb der letzten Jahre stark abgenommen hat, oder eben nicht. Denn ich hatte mit der 7. und 8. Staffel immer das Gefühl, dass weniger Fantasien seiten JDs eingebaut wurden. Wie wir auf die Zahl der Songs gekommen sind weiß ich garnicht, das bietet sich eben einfach mit an.

Ich habe also sämtliche Informationen, die ich dazu auf scrubs.wikia.com finden konnte, in ein Excel-Chart gepackt, und ein paar Grafiken erstellt. Das Zählen der Songs und Flashes kann zwar nicht immer ganz akkurat gewesen sein, weil ich am Ende nur noch die Anstriche unter den jeweiligen Punkten in jeder Episode gezählt habe (mit kleiner Nachkorrektur), und manchmal kann es ja sein dass unter einen Bullet zwei Flashs fallen oder auch gar keiner. Hab versucht das teilweise zu berücksichtigen.

Seht und staunt:

Hier sehen wir erstmal eine Aufstellung absoluter Anzahlen über die gesamte Serie hinweg. Man bemerke das schicke Holz-Design =)

Es folgen:

Joar, ein paar Sachen noch dazu:

  • Auf weiteres Auswerten hab ich jetzt keine Lust mehr. Wer mag, darf die erkennbaren Trends gerne verschriftlichen und so eine Diskussion anzetteln.
  • Weitere Indikatoren und Graphen werden auf Anfrage zur Verfügung gestellt, sofern die Daten vorliegen.
  • Der Pearson'sche Korrelationskoeffizient für Flashs und Songs liegt bei 0,024. Sehr geringe Korrelation also (mehr Songs führen nicht zu mehr Flashes und umgekehrt)
  • Hier der Link zu den Daten.
  • Stefans und meiner eigentlichen "Wette" sind wir so noch kein Stück näher. Stefan behauptet nämlich, es gibt mehr Flash ohne Song als Songs ohne Flash, wohingegen ich behaupte dass es generell mehr Songs ohne Flash als mit Flash gibt. Problem hierbei ist nur die Datenlage. Wo sich aus der wikipedia noch erlesen lies, welche folge welche songs und flashe beisteuert, bedarf es noch einmal einer genaueren sondierung um herauszufinden, welche songs mit flashs bzw flashes mit songs auftraten, welche songs ohne flash und welche flashes ohne song. Ich formuliere das mal, wie es viele Forscher in wissenschaftlichen Arbeiten tun: Die ist gegenstand zukünftiger Forschungen.
Beste Grüße

7 Kommentare:

  1. Sehr edle Grafiken! Immerhin beweist das schonmal, dass dein Gefühl dich nicht trügt, dass die Fantasies abgenommen haben. Denn die sind ja nicht nur absolut (was angesichts der Kürze von 7. und 8. Staffel verständlich wäre), sondern auch relativ zurückgegangen.

    AntwortenLöschen
  2. Die achte Staffel ist ja garnicht so wahnsinnig viel kürzer (immerhin 19 Folgen). Aber ja, das mit den relativen Zahlen stimmt schon. Hab jetzt auch nochmal die "absolute" grafik reuploaded, da war mir beim screenshooten ein fehler unterlaufen =)

    Und höre ich ein "abgefahrene scheiße man! krass wie viel arbeit und mühe du dir da gemacht hast. Guter Mann!"?

    AntwortenLöschen
  3. Es muss übrigens noch berücksichtigt werden, dass die Graphen an der Stelle von Season 09 noch zweimal 0 für songs und fantasies drin stehen haben bei E12 und 13, die ja noch nicht ausgestrahlt wurden. Sobald die da sind werden die Grafiken natürlich aktualisiert.

    Und zu der Abnahme der Fantasies pro Staffel ist noch anzumerken, dass (abgesehen von Season one, die mit ihren 98 Fantasies wirklich herausstand) der Median, also der Wert, an dem 50% der Folgen drüber und 50% darunter liegen (in ihrer absoluten Anzahl an Fantasies und Shows) eigentlich konstant geblieben ist. So stark ist der Trend also nicht. Umso auffälliger ist es dann natürlich, wie sich in S04 für Songs und Fantasies de Median nach unten entwickelt hat. Man könnte dies einen Tiefpunkt nenne.

    AntwortenLöschen
  4. Und noch etwas: Bei den obigen Graphiken ist natürlich zu beachten, dass sie, sofern an der X-Achse die Seasons angezeigt werden, natürlich auch nur deren Gesamtwerte berücksichtigt worden sind. Sprich: Relevan sind die "Knicke" über der Skala. Die Striche dazwischen sind nur Verbindungslinien ohne statistische Aussage. Die dienen eher nur der besseren Lesbarkeit. Akkurater wären Punkte statt linlien gewesen.

    AntwortenLöschen
  5. Krasse, abgefahre Scheiße! Guter Mann!

    AntwortenLöschen
  6. Abgefahrene scheiße man! Krass, wie viel Arbeit und Mühe du dir da gemacht hast. Guter Mann!

    Das erinnert mich daran, dass ich Statistik am 10. schreibe ^^
    Ich persönlich finde ja den Chi-Quadrat-Koeffizienten mit korrigiertem Korellationskoeffizieten aussagekräftiger =D
    Ich setz mich nach der Prüfungszeit mal ran und man mir Gedanken drüber =P
    Grüße

    AntwortenLöschen
  7. ICh lad die richtige Excel-Datei auch demnächst mal hoch oder schicke sie euch, zum selber rumexperimentieren.

    AntwortenLöschen