Levene-Test

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Verteilung des Nettoeinkommens in Deutschland 2008 (ALLBUS) nach Geschlecht und Geburtsmonats des Befragten.

Der Levene-Test[1] bezeichnet in der Statistik einen Signifikanztest, der auf Gleichheit der Varianzen (Homoskedastizität) von zwei oder mehr Grundgesamtheiten (Gruppen) prüft.

Ähnlich dem Bartlett-Test prüft der Levene-Test die Nullhypothese darauf, dass alle Gruppenvarianzen gleich sind. Die Alternativhypothese lautet demnach, dass mindestens ein Gruppenpaar ungleiche Varianzen besitzt (Heteroskedastizität):

Nullhypothese: H_0: \sigma^2_1=\sigma^2_2=\ldots=\sigma^2_k
Alternativhypothese: H_1:\sigma^2_i\neq\sigma^2_j  für mindestens ein Gruppenpaar i,j mit i \neq j

Befindet sich der Signifikanzwert des Tests unter einem zuvor bestimmten Niveau, so sind die Unterschiede in den Varianzen der Stichproben überzufällig (signifikant) und die Nullhypothese der Varianzgleichheit kann abgelehnt werden.[2]

Beispiel[Bearbeiten]

Die Grafik oben zeigt die Verteilung des Nettoeinkommens nach Geschlecht und Geburtsmonat. Die Ausgabe von car::leveneTest in R:

  • Der Levene-Test nach Geschlecht ergibt einen p-Wert kleiner als 2.2\times10^{-16} und ist damit hochsignifikant:
Levene's Test for Homogeneity of Variance
        Df F value    Pr(>F)    
group    1  106.09 < 2.2e-16 ***
      2404                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 


  • Der Levene-Test nach Geburtsmonat ergibt einen p-Wert von 0,076 und ist bei einem vorgegebenen Signifikanzniveau von 5 % nicht signifikant:
Levene's Test for Homogeneity of Variance
        Df F value Pr(>F)  
group   11  1.6621  0.076 .
      2384                 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Teststatistik[Bearbeiten]

Sind X_{ji} (j=1,...,k und i=1,..,n_j) die Stichprobenvariablen und

Y_{ji} = |X_{ji}-\bar{X}_j|

mit k Anzahl der Gruppen (Stichproben), n_j die Anzahl der Beobachtungen in Gruppe j und \bar{X}_j der Stichprobenmittelwert der Gruppe j. Dann ist die Teststatistik

L=\frac{n-k}{k-1}\frac{\displaystyle\sum_{j=1}^{k} n_j (\bar{Y}_j - \bar{Y})^2}{\displaystyle\sum_{j=1}^k \sum_{i=1}^{n_j} (Y_{ji}-\bar{Y})^2}\sim F_{k-1;n-k}

verteilt mit n die Anzahl aller Beobachtungen

n = \sum_{j=1}^{k} n_j,

\bar{Y} der Stichprobenmittelwert über alle Gruppen und \bar{Y}_j der Stichprobenmittelwert über Gruppe j.

Die Teststatistik bzgl. Y_{ji} ist identisch zur Teststatistik der einfaktoriellen ANOVA (Test auf Gleichheit von k Gruppenmittelwerten). Durch die Transformation von X_{ji} auf Y_{ji} sind die Gruppenmittelwerte

\bar{Y}_j = \frac{1}{n_j} \sum_{i=1}^{n_j} Y_{ji} =  \frac{1}{n_j} \sum_{i=1}^{n_j} |X_{ji}-\bar{X}_j|

robuste Schätzfunktionen der Gruppenvarianzen. Die Normalverteilungsannahme für die ANOVA gilt zwar nicht, jedoch haben die Y_{ji} oft eine rechtsschiefe Verteilung für die die ANOVA angewandt werden kann.[3]

Einzelnachweise[Bearbeiten]

  1. Howard Levene: Robust tests for equality of variances. In: Ingram Olkin, Harold Hotelling et al (Hrsg.): Contributions to Probability and Statistics: Essays in Honor of Harold Hotelling. Stanford University Press, 1960, S. 278-292..
  2.  Jürgen Janssen, Wilfried Laatz: Statistische Datenanalyse mit SPSS für Windows. 8. Auflage. Springer Verlag, 2007, S. 246.
  3.  Maxwell J. Roberts, Riccardo Russo: Student's Guide to Analysis of Variance. Routledge Chapman & Hall, 14. Januar 1999, ISBN 978-0415165655, S. 71.

Literatur[Bearbeiten]

  • Biostatistik: Eine Einführung für Biowissenschaftler. (2008). München: Pearson Studium. S. 150-154.

Weblinks[Bearbeiten]