Statistik

Aus GreWiki

Wechseln zu: Navigation, Suche

Eine Theorie, zwei Anwendungen

Als Statistik wird eine Sammlung von Methoden bezeichnet, die dazu dienen, große Mengen von Tatsachen zu beschreiben. Grundlegend ist die deskriptive Statistik, die Tatsachen zusammenfaßt und beschreibt. Die Arbeitslosenstatistik ist z.B. eine deskriptive Statistik. Auf früheren Erkenntnissen aufbauend, versucht die induktive Statistik, Vorhersagen zu treffen. So könnte Beispielsweise bei einer Firma, in der 1000 PCs verwendet werden, aufgrund vorheriger Erfahrungen davon ausgegangen werden, dass im Durchschnitt 7 PCs von einer Fachkraft gewartet werden müssen.

Statistik im Alltag

Menschen werden im Alltag oft mit statistischen Aussagen z.B. über Risiken gewisser Verhaltensweisen konfrontiert. Eine typische Aussage dieser Form wäre:

Lungenkrebs geht zu 85 Prozent auf das Rauchen zurück (Quelle)

Ob derart abstrakte Aussagen in ihrer Gesamtheit von allen Lesern erfaßt werden, darf bezweifelt werden. Die Aussage oben lautet:

85 Prozent der Lungenkrebspatienten sind starke Raucher

Diese Aussage betrifft nicht etwa die absolute Gefährlichkeit des Rauchens, sie sagt nichts darüber aus, wie häufig Lungenkrebs bei Rauchern oder Nichtrauchern ist, sondern vergleicht die Lungenkrebszahlen von Nichtrauchern und Rauchern.

Da solche Zahlen in derartigen Zusammenhängen oft ohne Erläuterung und anscheinend rein nach Klang veröffentlicht werden, ist nicht zu erwarten, dass Statistik ihrer Bedeutung gerecht verstanden wird.

Gute und Schlechte Statistik

Die Beispiele belegen, dass Statistik ein wichtiges Thema ist, und so verwundert es, dass Statistiken grobe Fehler enthalten können, und trotzdem veröffentlicht werden. So wird z.B. in der zur Zeit in Deutschland geführten Rentendebatte völlig unterschlagen, dass jeder Arbeitnehmer auch für Kinder aufkommen muß, und die Zahl der pro Arbeitnehmer versorgten Kinder zu der der versorgten Rentner addiert werden müßte. In diesem Fall wird also eine korrekt errechnete Statistik (das Verhältnis von Arbeitnehmern zu Rentnern) benutzt, um eine falsche Tatsache ("Da die Zahl der Rentner steigt, wird jeder Arbeitnehmer mehr Personen mitzuversorgen haben") zu behaupten.

Aussagen der Statistik sind stets nur verwendbar, wenn gewisse Grundregeln eingehalten werden:

  1. formale Korrektheit: die verwendeten Rechenregeln müssen richtig angewendet worden sein.
  2. korrekte Grundlage: die "Grundgesamtheit" hat die vorausgesetzten Eigenschaften.
  3. korrekte Stichprobe: die untersuchten Objekte werden zufällig (durch ein Losverfahren o.Ä.) aus einer homogenen "Grundgesamtheit" entnommen.

Im Bereich der Grenzwissenschaft sind oft die Regeln 2 und 3 das Problem. Beispielsweise wird beim Rutengehen davon ausgegangen, dass Grundwasser in Adern verläuft, die zu treffen besonderes Geschick erfordere (Regel 2 verletzt). Bei Präkognitions- und Telepathieversuchen oder in der Numerologie (s. Global Consciousness Project, Bibelcode) wird oft Anhand von einzelnen positiven Ergebnissen der Nachweis eines Effektes behauptet, ohne die Zahl der insgesamt durchgeführten Versuche zu berücksichtigen (Regel 3 verletzt).

Um allein die formale Richtigkeit einer Statistik zu überprüfen, ist daher ein nennenswerter Teil der Ausgangsdaten nötig. Zeichen für gute statistische Arbeit sind:

  • Genaue Beschreibung des Versuchs und der Hypothesen
  • Schilderung der Versuchsdurchführung bzw. der Zählmethode, inklusive aller aufgetretenen Probleme und eventueller nachträglicher methodischer Änderungen
  • Anführung aller Meßwerte/Zählungen, bzw. einfache Möglichkeit, diese Daten zu erhalten

Anzeichen für schlechte statistische Arbeit sind:

  • unvollständige Beschreibung, unvollständige Dokumentation, im schlimmsten Fall Geheimhaltung (Patente, "persönlich durchgeführter Versuch" etc.)
  • Ideenflucht (z.B. Erweitern der Definition eines positiven Ergebnisses, nachträgliches Erklären der Ungültigkeit von negativen Ergebnissen)

Links

Meine Werkzeuge