Cramér-von-Mises-Test

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der Cramér-von-Mises-Test ist ein statistischer Test, mit dem untersucht werden kann, ob die Häufigkeitsverteilung der Daten einer Stichprobe von einer vorgegebenen hypothetischen Wahrscheinlichkeitsverteilung abweicht (Ein-Stichproben-Fall), oder ob die Häufigkeitsverteilungen von zwei verschiedenen Stichproben voneinander abweichen (Zwei-Stichproben-Fall). Beim Vergleich der Verteilung einer Stichprobe mit der Normalverteilung fungiert das Verfahren als Normalitätstest. Der Test ist benannt nach Harald Cramér und Richard von Mises, die ihn zwischen 1928 und 1930 entwickelt und veröffentlicht haben. Die Verallgemeinerung für den Zwei-Stichproben-Fall wurde 1962 von Theodore Wilbur Anderson beschrieben.

Testbeschreibung[Bearbeiten]

Für den Vergleich der Häufigkeitsverteilung einer Stichprobe mit einer vorgegebenen hypothetischen Wahrscheinlichkeitsverteilung berechnet sich die Testgröße T aus den aufsteigend sortierten Stichprobenwerten x_1,x_2,\cdots,x_n und der Verteilungsfunktion F der vorgegebenen Wahrscheinlichkeitsverteilung nach der Formel

T = n \omega^2 = \frac{1}{12n} + \sum_{i=1}^n \left[ \frac{2i-1}{2n}-F(x_i) \right]^2.

Aus dem Vergleich der Testgröße T mit entsprechenden Tabellenwerten ergibt sich der p-Wert. Die Nullhypothese des Tests im Ein-Stichproben-Fall ist die Annahme, dass sich die Verteilung der Stichprobendaten nicht von der vorgegebenen Wahrscheinlichkeitsverteilung unterscheidet. Ein p-Wert kleiner als 0,05 ist somit als statistisch signifikante Abweichung der Verteilung der Stichprobenwerte von der vorgegebenen Wahrscheinlichkeitsverteilung zu interpretieren.

Für den Vergleich der Häufigkeitsverteilungen von zwei verschiedenen Stichproben berechnet sich die Testgröße T nach den Formeln

T = N \omega^2 = \frac{U}{N M (N+M)}-\frac{4 M N - 1}{6(M+N)}

mit

U = N \sum_{i=1}^N (r_i-i)^2 + M \sum_{j=1}^M (s_j-j)^2

Dabei sind, jeweils aufsteigend sortiert, x_1,x_2,\cdots,x_N die Werte in der ersten und y_1,y_2,\cdots,y_M die Werte in der zweiten Stichprobe sowie r_1,r_2,\cdots,r_N die Ränge der Werte der ersten Stichprobe und s_1,s_2,\cdots,s_M die Ränge der Werte der zweiten Stichprobe in einer gemeinsamen Rangfolge beider Stichproben.

Der p-Wert ergibt sich analog zum Ein-Stichproben-Fall aus dem Vergleich der Testgröße T mit entsprechenden Tabellen. Die Nullhypothese des Cramér-von-Mises-Tests im Zwei-Stichproben-Fall ist die Annahme, dass sich die Häufigkeitsverteilungen beider Stichproben nicht unterscheiden. Ein p-Wert kleiner als 0,05 bedeutet deshalb einen statistisch signifikanten Unterschied zwischen den Verteilungen der Werte beider Stichproben.

Alternative Verfahren[Bearbeiten]

Der Kolmogorow-Smirnow-Test stellt sowohl für den Ein-Stichproben-Fall als auch für den Zwei-Stichproben-Fall eine Alternative zum Cramér-von-Mises-Test dar, wobei letzterer aber insbesondere für den Zwei-Stichproben-Fall als teststärker gilt. Eine weitere Alternative zum Cramér-von-Mises-Test für den Ein-Stichproben-Fall ist der Anderson-Darling-Test. Für die spezielle Anwendung als Normalitätstest können unter anderem auch der Shapiro-Wilk-Test, der Jarque-Bera-Test und der Lilliefors-Test als alternative Verfahren genutzt werden.

Literatur[Bearbeiten]

  • Theodore Wilbur Anderson: On the Distribution of the Two-Sample Cramer-von Mises Criterion. In: The Annals of Mathematical Statistics. 33(3)/1962. Institute of Mathematical Statistics, ISSN 0003-4851, S. 1148−1159
  • Cramér–von-Mises Test. In: Zakkula Govindarajulu: Nonparametric Inference. World Scientific, Hackensack NJ 2007, ISBN 9-81-270034-X, S. 187−189