Streuung (Statistik)

aus Wikipedia, der freien Enzyklopädie

Wechseln zu: Navigation, Suche

Unter Streuung fasst man in der deskriptiven Statistik verschiedene Maßzahlen zusammen zur Beschreibung der Streubreite von Werten einer Häufigkeitsverteilung um ihren Mittelwert. Die verschiedenen Berechnungsmethoden unterscheiden sich prinzipiell durch ihre Beeinflussbarkeit bzw. Empfindlichkeit gegenüber Ausreißern. Die Streuung der Häufigkeitsverteilung wird als Standardfehler bezeichnet.

Inhaltsverzeichnis

[Bearbeiten] Maßzahlen

[Bearbeiten] Spannweite (engl.: range)

Die Spannweite ist das einfachste Streuungsmaß und berechnet sich einfach als Distanz zwischen dem größten und dem kleinsten Messwert:

  • R = xmaxxmin

R ist aufgrund der Tatsache, dass, unabhängig von der Stichprobengröße, nur zwei Werte (die so genannten Extremwerte) berücksichtigt werden, nicht robust gegenüber Ausreißern.

Siehe auch gleitende Spannweite (engl. moving range).

[Bearbeiten] (Inter-)Quartilabstand (engl.: interquartile range)

Hat man die Quartile Q.25 und Q.75 berechnet, so bezeichnet man deren Differenz als Interquartilabstand oder IQR:

  • IQR = Q.75Q.25

Innerhalb des IQR liegen 50% aller Messwerte. Er ist – wie auch der Median bzw. Q.50 – unempfindlich gegenüber Ausreißern. Es lässt sich zeigen, dass er einen Bruchpunkt von ε * = 0.25 hat.

[Bearbeiten] Mittlere absolute Abweichung

Die mittlere absolute Abweichung e bezüglich des Mittelwertes \hat{x} ist definiert durch

  •  \mathit{e} = E ((X - \hat{x})^2)

Im Falle einer konkreten Stichprobe wird sie errechnet durch

  •  \mathit{e} = \frac{1}{n-1}\sum_i (x_i - \hat{x})^2

[Bearbeiten] Mittlere absolute Abweichung bezüglich des Medians (engl.: mean deviation from the median, MD)

Die mittlere Abweichung MD vom Median \tilde{x} ist definiert durch

  •  \mathit{MD} = E\left|X - \tilde{x}\right|

Im Falle einer konkreten Stichprobe wird sie errechnet durch

  •  \mathit{MD} = \frac{1}{n}\sum_i \left|x_i - \tilde{x}\right|

Durch die Definition ergibt sich im Falle von normalverteilten Daten folgender Zusammenhang zur Standardabweichung:

  • \mathit{MD} = \sqrt{\frac{2}{\pi}} \cdot \sigma

[Bearbeiten] Median der absoluten Abweichungen (engl.: median absolute deviation, auch: MedMed)

Die mittlere absolute Abweichung MAD ist definiert durch

  •  P(\left|X - \tilde{x}\right| \leq \mathit{MAD}) = 0.5

Im Falle einer konkreten Stichprobe wird sie errechnet durch

  •  \mathit{MAD} = \mathrm{median}{\left|x_i - \tilde{x}\right|}

Durch die Definition ergibt sich im Falle von normalverteilten Daten folgender Zusammenhang zur Standardabweichung:

  • \mathit{MAD} = z_{0.75} \cdot \sigma

z0.75 ist das 0.75-Quantil der Standardnormalverteilung und beträgt ca. 0,6745.

Die mittlere absolute Abweichung ist ein robuster Schätzer für die Standardabweichung. Es lässt sich zeigen, dass sie einen Bruchpunkt von \varepsilon^*=0.5 hat.

[Bearbeiten] Varianz und Standardabweichung (engl.: variance bzw. standard deviation)

Dies sind die wichtigsten und am meisten verwendeten Streuungsmaße. Siehe separate Artikel zu Varianz, Standardabweichung.

[Bearbeiten] Graphische Darstellungsformen

[Bearbeiten] Siehe auch

Persönliche Werkzeuge
Buch erstellen