Benutzer:Rogmann/Spielwiese

Cliff's Delta ist ein parameterfreier statistischer Test und liefert eine intuitiv verständliche Maßzahl für den Unterschied oder der Überlappung bzw. der Übereinstimmung zweier Stichproben auf ordinalem Niveau. Die Maßzahl ist eine ordinale Alternative zu den traditionellen Mittelwertsvergleichen (z.B. t-Test), die ohne Normalverteilungsannahme (oder andere Annahmen!) auskommt. Auch eine Signifikanzprüfung dieser Maßzahl ist vorgesehen. Der Test wurde ursprünglich von näher beschrieben und später von seinen Kollegen Jeffrey Long und Du Feng fortentwickelt.

Grundidee

Jeder der in einer Grundgesamtheit $X_{1}$ zu findenden Werte $x_{11},\dots ,x_{m1}$ kann ordinal (="größer oder kleiner"?) mit jedem Wert $x_{12},\dots ,x_{k2}$ aus einer anderen Grundgesamtheit $X_{2}$ verglichen werden. Cliff's $\delta$ bezeichnet dann die Wahrscheinlichkeit $p$ , dass ein Wert aus $X_{1}$ größer ist als aus $X_{2}$ abzüglich der Wahrscheinlichkeit, dass ein Wert aus $X_{1}$ kleiner ist als aus $X_{2}$ :

$\delta =p(x_{i1}>x_{j2})-p(x_{i1}<x_{j2})$ .

Cliff's delta beschreibt damit die Tendenz einer Variable, größere Werte anzuehmen als eine Vergleichsvariable (="Dominanz").

$\delta$ liegt damit zwischen -1.00 (nichtüberlappende Verteilungen mit $x_{1}$ linksseitig, d.h. 100% der Werte aus $X_{1}$ sind kleiner) bis +1.00 (nichtüberlappende Verteilungen mit $x_{1}$ rechtsseitig, d.h. 100% der Werte aus $X_{1}$ sind größer). Ist $\delta$ gleich 0, überlappen die Verteilungen vollständig und sind damit strukturell nicht unterschiedlich.

Dominanzanalyse von zwei Stichproben

Der aus Stichproben zu errechnende, erwartungstreue Schätzer für Cliff's Delta, $d$ , bezeichnet den Anteil der Stichprobenwerte, die größer sind, als die Stichprobenwerte der Vergleichsstichprobe, abzüglich des Anteils der Stichprobenwerte, die kleiner sind, als die Vergleichsstichprobenwerte. Jeder der n Stichprobenwerte $x_{i}$ wird also mit jedem der m Vergleichsstichprobenwerte $x_{j}$ verglichen (das sind genau mn Vergleiche. Die Anzahl der Vergleiche, in denen die Bedingung $x_{i}>x_{j}$ erfüllt ist (= $\#(x_{i}>x_{j})$ ) wird ermittelt, und ebenso die Anzahl der Vergleichsfälle, in denen das Gegenteil gilt (= $\#(x_{i}<x_{j})$ ). Dann gilt für

$d={\frac {\#(x_{i}>x_{j})-\#(x_{i}<x_{j})}{mn}}$ .

$d$ ist robust und hat Power (Cliff, 1996, 126).

Teststatistik

Für das Testen der Hypothesen des Wilcoxon-Mann-Whitney-Test

H_{0}:a=0{\text{ vs. }}H_{1}:a\neq 0

gibt es zwei Teststatistiken: die Mann-Whitney-U-Statistik $U$ und die Wilcoxon-Rangsummenstatistik $W_{m,n}$ . Aufgrund des Zusammenhangs zwischen den Teststatistiken

W_{m,n}=U+{\frac {n(n+1)}{2}}

sind der Wilcoxon-Rangsummentest und der Mann-Whitney-U-Test äquivalent.

Mann-Whitney-U-Statistik

Die Mann-Whitney-U-Teststatistik ist

U=\sum _{i=1}^{m}\sum _{j=1}^{n}S(X_{i},Y_{j})

,

worin S(X,Y) = 1 wenn Y < X und sonst 0. Abhängig von der Alternativhypothese wird die Nullhypothese abgelehnt für zu kleine oder zu große von $U$ . In dieser Form findet er sich bei Mann und Whitney und wird oft als Mann-Whitney-U-Test bezeichnet.

Exakte kritische Werte

Exakte kritische Werte liegen nur tabelliert vor und können für kleine Stichprobenumfänge der Tabelle unten entnommen werden ( $\alpha =5\%$ beim zweiseitigen Test und $\alpha =2,5\%$ beim einseitigen Test).

Approximative kritische Werte

Für $m>3$ , $n>3$ und $m+n>19$ kann

U\approx N\left({\frac {m\,n}{2}};{\frac {n\,m\,(n+m+1)}{12}}\right)

durch die Normalverteilung approximiert werden.^[1] Die kritischen Werte ergeben sich dann aus den kritischen Werten der approximativen Normalverteilung.

Wilcoxon-Rangsummenstatistik

Die Wilcoxon-Rangsummenstatistik ist

W_{m,n}=\sum _{i=1}^{m}R(X_{i})

mit $R(X_{i})$ der Rang der i-ten X in der gepoolten, geordneten Stichprobe. In dieser Form trägt der Test häufig die Bezeichnung Wilcoxon-Rangsummentest.

Exakte kritische Werte

Die exakte Verteilung von $W_{m,n}$ unter der Bedingung der Nullhypothese kann mittels kombinatorischer Überlegungen leicht gefunden werden. Allerdings steigt der Rechenaufwand für große Werte von $m,n$ rasch an. Man kann die exakten kritischen Werte $w$ zum Signifikanzniveau $\alpha$ mittels einer Rekursionsformel berechnen:

P(W_{m-1,n}=w)=\alpha

(oder

=\alpha /2

oder

=1-\alpha

oder

=1-\alpha /2

)

Die Formel entsteht, wenn man konditioniert auf die Bedingung, ob der letzte Wert in der Anordnung ein X (...X) oder ein Y (...Y) ist.

P(W_{m,n}=w)=P(W_{m,n}=w|...X)P(...X)+P(W_{m,n}=w|...Y)P(...Y)=\,

=P(W_{m-1,n}=w-m-n){\frac {m}{m+n}}+P(W_{m,n-1}=w){\frac {n}{m+n}}

Approximative kritische Werte

Für $m>25$ oder $n>25$ (auch: $m>10$ oder $n>10$ ) kann die Teststatistik

W_{m,n}\approx N\left({\frac {m\,(n+m+1)}{2}};{\frac {n\,m\,(n+m+1)}{12}}\right)

durch die Normalverteilung approximiert werden.^[2] ^[3] Die kritischen Werte ergeben sich dann aus den kritischen Werten der approximativen Normalverteilung.

Einseitige Hypothesen

Der Test kann auch für die einseitigen Hypothesen

H_{0}:a\leq 0{\text{ vs. }}H_{1}:a>0

bzw.

H_{0}:a\geq 0{\text{ vs. }}H_{1}:a<0

formuliert werden.

Abgeleitete Hypothesen

Der Test ist speziell interessant, weil bei Annahme bzw. Ablehnung der Null- oder Alternativhypothese auch die folgenden Null- und Alternativhypothesen (unter den oben genannten Voraussetzungen) angenommen bzw. abgelehnt werden können:

H_{0}:\mu _{A}-\mu _{B}=0{\text{ vs. }}H_{1}:\mu _{A}-\mu _{B}\neq 0

, d.h. die Mittelwerte

\mu

der Verteilungen A und B unterscheiden sich.

H_{0}:{\tilde {x}}_{A}-{\tilde {x}}_{B}=0{\text{ vs. }}H_{1}:{\tilde {x}}_{A}-{\tilde {x}}_{B}\neq 0

, d.h. die Mediane

{\tilde {x}}

der Verteilungen A und B unterscheiden sich.

Sind die Voraussetzungen bei der Hypothese über die Mediane nicht erfüllt, dann kann man auf den Median-Test ausweichen.

Beispiel

Aus den Daten der Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften 2006 wurden zufällig 20 Personen gezogen und ihr Nettoeinkommen ermittelt:

Rang	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20
Nettoeinkommen	0	400	500	550	600	650	750	800	900	950	1000	1100	1200	1500	1600	1800	1900	2000	2200	3500
Geschlecht	M	W	M	W	M	W	M	M	W	W	M	M	W	M	W	M	M	M	M	M

Man hat zwei Stichproben vor sich, Stichprobe der Männer mit $13$ Werten und Stichprobe der Frauen mit $7$ Werten. Wir könnten nun prüfen, ob das Einkommen der Männer und Frauen gleich ist (zweiseitiger Test) oder das Einkommen der Frauen geringer (einseitiger Test) mit $F$ die Verteilungsfunktion des Einkommens der Männer und $G$ die Verteilungsfunktion des Einkommens der Frauen. Wir betrachten hier die Tests

Zweiseitiger Test	Einseitiger Test
$H_{0}:a=0{\text{ vs. }}H_{1}:a\neq 0$	$H_{0}:a\geq 0{\text{ vs. }}H_{1}:a<0$

Zunächst wird aus beiden Zahlenreihen je eine Prüfgröße $U$ gebildet:

U_{1}=n_{1}\cdot n_{2}+{n_{1}\cdot (n_{1}+1) \over 2}-R_{1}

U_{2}=n_{1}\cdot n_{2}+{n_{2}\cdot (n_{2}+1) \over 2}-R_{2}

$n_{1}$ und $n_{2}$ sind dabei die Anzahlen der Zahlenwerte pro Reihe, $R_{1}$ und $R_{2}$ sind die Rangzahlen der geordneten Reihen. Die Rangzahlen der Zahlenwerte werden für $A$ und für $B$ getrennt in zwei Spalten aufsummiert. Sind zwei oder mehrere Werte in beiden Datensätzen gleich, dann müssen in beiden Rangspalten jeweils die Mediane (bzw. arithmetischen Mittel) eingetragen werden. Für die Tests benötigt man das Minimum von $U_{1}$ und $U_{2}$ , also $\min(U)=\min(U_{1},U_{2})$ .

Für unser Beispiel ergibt sich

R_{M}=151

und

U_{M}=31

.

R_{W}=59

und

U_{W}=60

und

\min(U)=31

.

Bei korrekter Berechnung muss gelten $R_{1}+R_{2}=(n_{1}+n_{2})(n_{1}+n_{2}+1)/2$ bzw. $U_{1}+U_{2}=n_{1}n_{2}$ . $\min(U)$ wirden nun mit den kritischen Wert(en) verglichen. Das Beispiel ist so gewählt, dass sowohl ein Vergleich mit den exakten kritischen Werten als auch mit den approximativen Werten möglich ist.

Zweiseitiger Test

Exakte kritische Werte

Anhand der Tabelle ergibt sich mit $n_{1}=13$ und $n_{2}=7$ ein kritischer Wert von $U_{krit}=20$ für ein Signifikanzniveau vom $\alpha =5\%$ . Ablehnt wird die Nullhypothese, wenn $\min(U)<U_{krit}$ ist; dies ist hier aber nicht der Fall.

Approximative kritische Werte

Da die Teststatistik $U$ approximativ normal verteilt ist, folgt dass die

Z={\frac {U-{\frac {n_{1}n_{2}}{2}}}{\sqrt {\frac {n_{1}n_{2}(n_{1}+n_{2}+1)}{12}}}}\approx N(0;1)

verteilt ist. Für ein Signifikanzniveau vom $\alpha =5\%$ muss für die Annahme der Alternativhypothese im zweiseitigen Test $z$ außerhalb des Intervalls $[-1,96;+1,96]$ liegen. Es ergibt sich jedoch $z={\frac {31-45,5}{\sqrt {159,25}}}\approx -1,15$ , d.h. die Nullhypothese kann nicht abgelehnt werden.

Einseitiger Test

Exakte kritische Werte

Anhand der Tabelle ergibt sich mit $n_{1}=13$ und $n_{2}=7$ ein kritischer Wert von $U_{krit}=20$ für ein Signifikanzniveau vom $\alpha =2,5\%$ (anderes Signifikanzniveau als beim zweiseitigen Test!). Abgelehnt wird die Nullhypothese, wenn $\min(U)<U_{krit}$ ist; dies ist hier aber nicht der Fall.

Approximative kritische Werte

Für ein Signifikanzniveau vom $\alpha =5\%$ muss für die Annahme der Alternativhypothese im zweiseitigen Test $z$ außerhalb des Intervalls $[-1,65;+\infty ]$ liegen. Es ergibt sich jedoch $z={\frac {31-45,5}{\sqrt {159,25}}}\approx -1,15$ , d.h. die Nullhypothese kann nicht abgelehnt werden.

Tabelle der kritischen Werte der Mann-Whitney-U-Statistik

Die folgende Tabelle ist gültig für $\alpha =5\%$ (zweiseitig) bzw. $\alpha =2,5\%$ (einseitig) mit $n_{2}\leq n_{1}$ . Ein - Eintrag bedeutet, dass die Nullhypothese in jedem Fall zu dem gegebenen Signifikanzniveau angenommen werden muss.

	$n_{1}$
$n_{2}$	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26	27	28	29	30	31	32	33	34	35	36	37	38	39	40
1	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	0	0
2		-	-	-	-	-	-	0	0	0	0	1	1	1	1	1	2	2	2	2	3	3	3	3	3	4	4	4	4	5	5	5	5	5	6	6	6	6	7	7
3			-	-	0	1	1	2	2	3	3	4	4	5	5	6	6	7	7	8	8	9	9	10	10	11	11	12	13	13	14	14	15	15	16	16	17	17	18	18
4				0	1	2	3	4	4	5	6	7	8	9	10	11	11	12	13	14	15	16	17	17	18	19	20	21	22	23	24	24	25	26	27	28	29	30	31	31
5					2	3	5	6	7	8	9	11	12	13	14	15	17	18	19	20	22	23	24	25	27	28	29	30	32	33	34	35	37	38	39	40	41	43	44	45
6						5	6	8	10	11	13	14	16	17	19	21	22	24	25	27	29	30	32	33	35	37	38	40	42	43	45	46	48	50	51	53	55	56	58	59
7							8	10	12	14	16	18	20	22	24	26	28	30	32	34	36	38	40	42	44	46	48	50	52	54	56	58	60	62	64	66	68	70	72	74
8								13	15	17	19	22	24	26	29	31	34	36	38	41	43	45	48	50	53	55	57	60	62	65	67	69	72	74	77	79	81	84	86	89
9									17	20	23	26	28	31	34	37	39	42	45	48	50	53	56	59	62	64	67	70	73	76	78	81	84	87	89	92	95	98	101	103
10										23	26	29	33	36	39	42	45	48	52	55	58	61	64	67	71	74	77	80	83	87	90	93	96	99	103	106	109	112	115	119
11											30	33	37	40	44	47	51	55	58	62	65	69	73	76	80	83	87	90	94	98	101	105	108	112	116	119	123	127	130	134
12												37	41	45	49	53	57	61	65	69	73	77	81	85	89	93	97	101	105	109	113	117	121	125	129	133	137	141	145	149
13													45	50	54	59	63	67	72	76	80	85	89	94	98	102	107	111	116	120	125	129	133	138	142	147	151	156	160	165
14														55	59	64	69	74	78	83	88	93	98	102	107	112	117	122	127	131	136	141	146	151	156	161	165	170	175	180
15															64	70	75	80	85	90	96	101	106	111	117	122	127	132	138	143	148	153	159	164	169	174	180	185	190	196
16																75	81	86	92	98	103	109	115	120	126	132	137	143	149	154	160	166	171	177	183	188	194	200	206	211
17																	87	93	99	105	111	117	123	129	135	141	147	154	160	166	172	178	184	190	196	202	209	215	221	227
18																		99	106	112	119	125	132	138	145	151	158	164	171	177	184	190	197	203	210	216	223	230	236	243
19																			113	119	126	133	140	147	154	161	168	175	182	189	196	203	210	217	224	231	238	245	252	258
20																				127	134	141	149	156	163	171	178	186	193	200	208	215	222	230	237	245	252	259	267	274

Einzelnachweise

↑ Rönz, B., Strohe, H.G. (Hrsg.): Lexikon Statistik. Gabler, Wiesbaden 1994, ISBN 3-409-19952-7
↑ Rinne, H. (2003), Taschenbuch der Statistik (3. Auflage), Verlag Harri Deutsch, S. 534
↑ Kotz, S., Read, C.B., Balakrishnan, N. (2003), Encyclopedia of Statistical Sciences, Wiley, Band ?, S. 208

Literatur

Herbert Büning, Götz Trenkler (1998), Nichtparametrische statistische Methoden, de Gruyter, ISBN 3-11-016351-9
Sidney Siegel: Nichtparametrische statistische Methoden. Fachbuchhandlung für Psychologie, Eschborn bei Frankfurt am Main, 2. Ausgabe, 1985)
W. H. Kruskal: Historical notes on the Wilcoxon unpaired two-sample test, In: J. Amer. Stat. Assn. 52, 1957, S. 356–360.

Weblinks

[1] Rönz, B., Strohe, H.G. (Hrsg.): Lexikon Statistik. Gabler, Wiesbaden 1994, ISBN 3-409-19952-7

[2] Rinne, H. (2003), Taschenbuch der Statistik (3. Auflage), Verlag Harri Deutsch, S. 534

[3] Kotz, S., Read, C.B., Balakrishnan, N. (2003), Encyclopedia of Statistical Sciences, Wiley, Band ?, S. 208

[1]

[2]

[3]

Benutzer:Rogmann/Spielwiese

Inhaltsverzeichnis

Grundidee

Dominanzanalyse von zwei Stichproben