Levene-Test

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Verteilung des Nettoeinkommens in Deutschland 2008 (ALLBUS) nach Geschlecht und Geburtsmonats des Befragten.

Der Levene-Test[1] bezeichnet in der Statistik einen Signifikanztest, der auf Gleichheit der Varianzen (Homoskedastizität) von zwei oder mehr Grundgesamtheiten (Gruppen) prüft. Der Brown–Forsythe Test ist aus dem Levene Test abgeleitet.

Ähnlich dem Bartlett-Test prüft der Levene-Test die Nullhypothese darauf, dass alle Gruppenvarianzen gleich sind. Die Alternativhypothese lautet demnach, dass mindestens ein Gruppenpaar ungleiche Varianzen besitzt (Heteroskedastizität):

Nullhypothese: H_0: \sigma^2_1=\sigma^2_2=\ldots=\sigma^2_k
Alternativhypothese: H_1:\sigma^2_i\neq\sigma^2_j  für mindestens ein Gruppenpaar i,j mit i \neq j

Befindet sich der Signifikanzwert des Tests unter einem zuvor bestimmten Niveau, so sind die Unterschiede in den Varianzen der Stichproben überzufällig (signifikant) und die Nullhypothese der Varianzgleichheit kann abgelehnt werden.[2]

Beispiel[Bearbeiten]

Die Grafik oben zeigt die Verteilung des Nettoeinkommens nach Geschlecht und Geburtsmonat. Die Ausgabe von car::leveneTest in R:

  • Der Levene-Test nach Geschlecht ergibt einen p-Wert kleiner als 2.2\times10^{-16} und ist damit hochsignifikant:
Levene's Test for Homogeneity of Variance
        Df F value    Pr(>F)    
group    1  106.09 < 2.2e-16 ***
      2404                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 


  • Der Levene-Test nach Geburtsmonat ergibt einen p-Wert von 0,076 und ist bei einem vorgegebenen Signifikanzniveau von 5 % nicht signifikant:
Levene's Test for Homogeneity of Variance
        Df F value Pr(>F)  
group   11  1.6621  0.076 .
      2384                 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Teststatistik[Bearbeiten]

Sind X_{ji} (j=1,...,k und i=1,..,n_j) die Stichprobenvariablen und

Y_{ji} = |X_{ji}-\bar{X}_j|

mit k Anzahl der Gruppen (Stichproben), n_j die Anzahl der Beobachtungen in Gruppe j und \bar{X}_j der Stichprobenmittelwert der Gruppe j. Dann ist die Teststatistik

L=\frac{n-k}{k-1}\frac{\displaystyle\sum_{j=1}^{k} n_j (\bar{Y}_j - \bar{Y})^2}{\displaystyle\sum_{j=1}^k \sum_{i=1}^{n_j} (Y_{ji}-\bar{Y})^2}\sim F_{k-1;n-k}

verteilt mit n die Anzahl aller Beobachtungen

n = \sum_{j=1}^{k} n_j,

\bar{Y} der Stichprobenmittelwert über alle Gruppen und \bar{Y}_j der Stichprobenmittelwert über Gruppe j.

Die Teststatistik bzgl. Y_{ji} ist identisch zur Teststatistik der einfaktoriellen ANOVA (Test auf Gleichheit von k Gruppenmittelwerten). Durch die Transformation von X_{ji} auf Y_{ji} sind die Gruppenmittelwerte

\bar{Y}_j = \frac{1}{n_j} \sum_{i=1}^{n_j} Y_{ji} =  \frac{1}{n_j} \sum_{i=1}^{n_j} |X_{ji}-\bar{X}_j|

robuste Schätzfunktionen der Gruppenvarianzen. Die Normalverteilungsannahme für die ANOVA gilt zwar nicht, jedoch haben die Y_{ji} oft eine rechtsschiefe Verteilung für die die ANOVA angewandt werden kann.[3]

Brown–Forsythe-Test[Bearbeiten]

Im Brown–Forsythe-Test wird bei Berechnung von Y_{ji} statt dem Gruppenmittelwert der Gruppenmedian benutzt.[4] Um eine gute Teststärke zu erhalten, muss der Lageparameter in Abhängigkeit von der zugrunde liegenden Verteilung gewählt werden. Brown und Forsythe zeigten in Simulationsstudien, dass der Mittelwert eine gute Wahl ist, wenn die Verteilung symmetrisch und „normale“ Verteilungsenden (Exzess \approx 0) hat, z. B. einer Normalverteilung ähnlich ist. Der Median sollte benutzt werden, wenn die Verteilungen stark schief sind, und der getrimmte Mittelwert, wenn die Verteilung schwere Verteilungsenden hat (Exzess<0).

Einzelnachweise[Bearbeiten]

  1. Howard Levene: Robust tests for equality of variances. In: Ingram Olkin, Harold Hotelling et al (Hrsg.): Contributions to Probability and Statistics: Essays in Honor of Harold Hotelling. Stanford University Press, 1960, S. 278-292..
  2.  Jürgen Janssen, Wilfried Laatz: Statistische Datenanalyse mit SPSS für Windows. 8. Auflage. Springer Verlag, 2007, S. 246.
  3.  Maxwell J. Roberts, Riccardo Russo: Student's Guide to Analysis of Variance. Routledge Chapman & Hall, 14. Januar 1999, ISBN 978-0415165655, S. 71.
  4.  Morton B. Brown, Alan B. Forsythe: Robust tests for equality of variances. In: Journal of the American Statistical Association. 69, 1974, S. 364–367, doi:10.1080/01621459.1974.10482955.

Literatur[Bearbeiten]

  • Biostatistik: Eine Einführung für Biowissenschaftler. (2008). München: Pearson Studium. S. 150-154.

Weblinks[Bearbeiten]