Benutzer:Sigbert/Permutationstest
Mit Permutationstests (auch exakter Test) wird eine Klasse von Signifikanztests in der Statistik bezeichnet. Dabei wird jedem Beobachtungswert der Stichprobe ein Label (z.B. eine Gruppenzugehörigkeit, erkrankt/nicht erkrankt) zugeordnet. Unter der Nullhypothese wird davon ausgegangen, dass jede Permutation der Zuordnung gleichwahrscheinlich ist. Für alle Permutationen der Zuordnung kann dann die Teststatistik berechnet werden und mit dem Prüfwert, berechnet aus der Stichprobe, verglichen werden.
Zu den Permutationstests gehören unter anderem
- der Binomialtest,
- der Exakter Test nach Fisher und
- der Wilcoxon-Mann-Whitney-Test.
Beispiel
[Bearbeiten | Quelltext bearbeiten]Im Wilcoxon-Mann-Whitney-Test kann u.a. die Hypothese geprüft werden, ob die "Mittelwerte" in zwei Gruppen gleich sind. Die verwendete Teststatistik ist
- ,
worin S(X,Y) = 1 wenn X < Y und sonst 0.
0 | 1 | 1 | |
0 | 0 | 1 |
Die Stichprobe besteht aus fünf Beobachungen von denen zwei in die Gruppe x () fallen und drei in Gruppe y (). Desweiteren gelte für die fünf Beobachtungen :
Sortiert: | < | < | < | < | |||||
Gruppenlabel: | y | x | y | x | y |
also gilt .
Unter der Gültigkeit der Nullhypothese (die beiden Verteilungsfunktionen unterscheiden sich nicht) sind alle 10 möglichen Permutationen der Labels gleich wahrscheinlich:
Labels | Wk. | |
---|---|---|
xxyyy | 0,1 | 6 |
xyxyy | 0,1 | 5 |
xyyxy | 0,1 | 4 |
yxxyy | 0,1 | 4 |
xyyyx | 0,1 | 3 |
yxyxy | 0,1 | 3 |
yxyyx | 0,1 | 2 |
yyxxy | 0,1 | 2 |
yyxyx | 0,1 | 1 |
yyyxx | 0,1 | 0 |
Damit ist die Verteilung der Teststatistik , eine Zufallsvariable, unter der Nullhypothese, vollständig definiert:
0 | 1 | 2 | 3 | 4 | 5 | 6 | |
0,1 | 0,1 | 0,2 | 0,2 | 0,2 | 0,1 | 0,1 |
Zweiseitiger Test
[Bearbeiten | Quelltext bearbeiten]Mit einem Signifikanzniveau von soll auf Basis der obigen fünf Beobachtungsdaten geprüft werden, ob es Mittelwertunterschiede zwischen den Gruppen x und y gibt:
- vs. .
(Wenn die beiden Verteilungsfunktionen gleich sind, müssen auch die Mittelwerte oder Mediane gleich sein).
Der Ablehnungsbereich der Nullhypothese sind gerade die Extremwerte von , also wenn die Teststatistik gerade die Werte 0 und 6 annimmt:
Da ist, kann die Nullhypothese nicht verworfen werden.
Einseitiger Test
[Bearbeiten | Quelltext bearbeiten]Mit einem Signifikanzniveau von soll auf Basis der obigen fünf Beobachtungsdaten geprüft werden, ob der Mittelwert der Gruppe x kleiner gleich dem Mittelwert der Gruppe y ist:
- vs. .
Der Ablehnungsbereich der Nullhypothese enthält die Werte 5 und 6.
Da ist, kann die Nullhypothese nicht verworfen werden.