Kruskal-Wallis-Test

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der Kruskal-Wallis-Test (nach William Kruskal und Wilson Allen Wallis; auch H-Test) ist ein parameterfreier statistischer Test, mit dem im Rahmen einer Varianzanalyse getestet wird, ob unabhängige Stichproben (Gruppen oder Messreihen) hinsichtlich einer ordinalskalierten Variable einer gemeinsamen Population entstammen.[1] Er ähnelt einem Mann-Whitney-U-Test und basiert wie dieser auf Rangplatzsummen, mit dem Unterschied, dass er für den Vergleich von mehr als zwei Gruppen angewendet werden kann.

Die Nullhypothese H0 lautet: Zwischen den Gruppen besteht kein Unterschied. Als Prüfgröße des Kruskal-Wallis-Tests wird ein sogenannter H-Wert berechnet. Der H-Wert wird wie folgt gebildet:[2] Der Rang R_i für jede der n Beobachtungen in der Vereinigung der Stichproben wird bestimmt. Daraus werden dann die Rangsummen S_h für die einzelnen Gruppen und daraus die Teststatistik

H= \tfrac{12}{n(n+1)}\sum_h\tfrac{S_h^2}{n_h}-3(n+1)

bzw. beim Vorliegen von Bindungen

H= \frac{\tfrac{12}{n(n+1)}\sum_h\tfrac{S_h^2}{n_h}-3(n+1)}{1-\tfrac{1}{(n^3-n)} \sum t_{r(i)}^3 - t_{r(i)}}

(mit t_{r(i)} die Zahl der gebundenen Beobachtungen mit Rang i) errechnet. Diese folgt unter Nullhypothese einer Chi-Quadrat-Verteilung. Die Freiheitsgrade (Df) berechnen sich nach Df=k-1, wobei k die Anzahl der Klassen (Gruppen) ist. Die berechnete Prüfgröße H wird mit einer theoretischen Größe aus der Chi-Quadrat-Verteilung für eine gewählte Fehler 1. Art verglichen. Ist der errechnete H-Wert größer als der H-Wert aus der Chi-Quadrat-Tabelle, wird H0 verworfen, es besteht also ein signifikanter Unterschied zwischen den Gruppen.

Ist h=3 und n_h< 6, so ist die Teststatistik H nicht \chi^2-verteilt und es muss auf tabellierte kritische Werte zurückgegriffen werden.

Ein ähnlicher Test wie der Kruskal-Wallis-Test ist der Jonkheere-Terpstra-Test oder dessen Verallgemeinerung, der Umbrella-Test nach Mack und Wolfe.[3] Eine Erweiterung des Kruskal-Wallis-Tests auf den Anwendungsbereich der mehrfaktoriellen Varianzanalyse ist der Scheirer-Ray-Hare-Test.[4]

Einzelnachweise[Bearbeiten]

  1. Kruskal, W. H. und Wallis, W. A.: Use of ranks in one-criterion variance analysis, in: Journal of the American Statistical Association, Vol. 47, 1952, S. 583-621, Online (JSTOR).
  2. Douglas C. Montgomery: Design and Analysis of Experiments. John Wiley & Sons, Inc., Danvers 2005, ISBN 0-471-48735-X, S. 110 - 111
  3. Mack, H. B. und Wolfe, D. A.: K-sample rank tests for umbrella alternatives., in: Journal of the American Statistical Association, Band 76, 1981. S. 175 - 181, Online (JSTOR)
  4. James Scheirer, William S. Ray, Nathan Hare: The Analysis of Ranked Data Derived from Completely Randomized Factorial Designs . In: Biometrics. 32(2)/1976. International Biometric Society, S. 429−434, ISSN 0006-341X