Deskriptive Statistik

aus Wikipedia, der freien Enzyklopädie

Wechseln zu: Navigation, Suche

Die deskriptive (beschreibende) Statistik hat zum Ziel, empirische Daten durch Tabellen und Grafiken übersichtlich darzustellen und zu ordnen, sowie durch geeignete grundlegende Kenngrößen zahlenmäßig zu beschreiben. Vor allem bei umfangreichem Datenmaterial ist es sinnvoll, sich einen ersten Überblick zu verschaffen. Durch eine systematische Beschreibung der Daten mit Hilfsmitteln der deskriptiven Statistik können mitunter auch Fehler in den Daten -beispielsweise durch Tippfehler bei der Dateneingabe oder fehlerhafte Ergebnisse von Texterkennungssystemen - erkannt werden. Die deskriptive Statistik verwendet keine stochastischen Modelle, so dass die dort getroffenen Aussagen nicht durch Fehlerwahrscheinlichkeiten abgesichert sind. Dies kann durch die Methoden der schließenden Statistik erfolgen, sofern die untersuchten Daten den dort unterstellten Modellannahmen genügen. Die explorative (erkundende) Statistik hat darüber hinaus zum Ziel, bisher unbekannte Strukturen und Zusammenhänge in den Daten zu finden und hierdurch neue Hypothesen zu generieren. Diese auf Stichprobendaten beruhenden Hypothesen können dann im Rahmen der schließenden Statistik mittels Wahrscheinlichkeitstheoretischer Methoden auf ihre Allgemeingültigkeit untersucht werden.

Von der induktiven oder inferentiellen Statistik (Inferenzstatistik) unterscheidet sich die deskriptive Statistik dadurch, dass sie keine Aussagen zu einer über die untersuchten Fälle hinausgehenden Grundgesamtheit macht. Beim Konklusionsschluss (indirekter Schluss) der inferentiellen Statistik ist es also umgekehrt: Dort werden ausgehend von der Stichprobe unbekannte Parameter der Grundgesamtheit geschätzt.

Inhaltsverzeichnis

[Bearbeiten] Deskriptive Zusammenfassung von Daten

Im Einzelnen gibt es folgende Möglichkeiten der Zusammenfassung:

  1. Tabellarische Auflistung
  2. Grafische Darstellung
  3. Berechnung von statistischen Kennwerten

[Bearbeiten] Kenngrößen (statistische Kennwerte)

Zwei Arten von Kenngrößen sind hauptsächlich von Interesse: Lagemaße und Streuungsmaße. Die Wahl der geeigneten Kenngrößen hängt vom Skalen- oder Messniveau der Daten und von der Robustheit der Kenngröße ab.

[Bearbeiten] Lagemaße – zentrale Tendenz einer Häufigkeitsverteilung

Aus der Lage der verschiedenen Schätzwerte für die zentrale Tendenz zueinander lassen sich Schiefe und Exzess einer Verteilung bestimmen.

[Bearbeiten] Streuungsmaße – Streuung oder Dispersion der Verteilung

Zusammenhangsmaße geben an, wie stark zwei betrachtete Merkmale miteinander korrelieren.

[Bearbeiten] Beispiele

  • Darstellung der Durchschnittstemperatur und der Temperaturschwankungen in einer Region durch Mittelwert und Streuung; Angabe, wie oft bestimmte Temperaturen überschritten werden (Quantil); Vergleich nach Regionen und/oder Zeiträumen mithilfe von Grafiken oder Tabellen.
  • In einer Urne sind fünf rote und vier blaue Kugeln. Es werden drei Kugeln ohne Zurücklegen aus dieser Urne gezogen. Definiert man die Zufallsvariable X: Zahl der roten Kugeln unter den drei gezogenen, ist X hypergeometrisch verteilt mit M=5 als Zahl der roten Kugeln in der Urne, N=9 als Gesamtzahl der Kugeln in der Urne und n=3 als Zahl der Versuche. Hier können alle Informationen über die Verteilung von X gewonnen werden.

[Bearbeiten] Siehe auch

[Bearbeiten] Literatur

  • Bol, Georg: Deskriptive Statistik. Oldenbourg Verlag 2004, ISBN 3-486-57612-7.
  • Burkschat, M.; Cramer, E.; Kamps, U.: Beschreibende Statistik. Grundlegende Methoden. Springer, Berlin 2004, ISBN 3-540-03239-8.
  • Steland, Basiswissen Statistik. Springer Berlin Heidelberg 2007, ISBN 978-3-540-74204-3.

[Bearbeiten] Weblinks

Persönliche Werkzeuge
Buch erstellen