Homoskedastizität und Heteroskedastizität

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Homoskedastizität)
Wechseln zu: Navigation, Suche
Homoskedastizität: Die Streuung der Punkte um die Gerade in vertikaler Richtung ist konstant.
Heteroskedastizität: Hier wird die Streuung der Punkte um die Gerade nach rechts hin größer.
Heteroskedastizität: Die Streuung der Punkte um die Gerade wächst nach rechts hin stärker als linear an.

Heteroskedastizität (auch (Residuen-)Varianzheterogenität; gr. σκεδαστός, skedastós, zerstreut, verteilt; zerstreubar) bedeutet in der Statistik unterschiedliche Streuung innerhalb einer Datenmessung. Wenn die Varianz der Residuen (und somit die Varianz der erklärten Variablen selbst) für alle Ausprägungen der anderen (Prädiktor)-Variablen nicht signifikant unterschiedlich ist, liegt Homoskedastizität ((Residuen-)Varianzhomogenität) vor. Der Begriff spielt insbesondere in der Ökonometrie und der empirischen Forschung eine wichtige Rolle.

Vorkommen[Bearbeiten]

Häufig werden in der Statistik Methoden angewendet, bei denen mehrere gleichartige Merkmale eine Rolle spielen. Beispielsweise hat man in der Regressionsanalyse eine Menge von Datenpunkten gegeben, in die eine Gerade möglichst passgenau eingelegt wird. Die Abweichungen der Datenpunkte von der Geraden werden Störterme oder Residuen genannt und sind wahrscheinlichkeitstheoretisch jeweils Zufallsvariablen. Haben diese Störterme alle die gleiche Varianz, liegt Homoskedastizität vor.

Wenn diese Störterme allerdings nicht die gleiche Varianz aufweisen, führt die einfache Kleinstquadratmethode nicht zu effizienten Schätzwerten für die Regressionskoeffizienten. Dies bedeutet, dass diese Schätzwerte nicht die kleinstmögliche Varianz aufweisen. Außerdem ist dann eine naive Anwendung des t-Tests nicht möglich; die t-Werte sind nicht mehr brauchbar. Abhilfe schafft in vielen Fällen eine geeignete Datennormalisierung: Herrscht Heteroskedastizität, kann es durchaus sinnvoll sein, die Daten mittels Anwendung des Logarithmus oder der Quadratwurzel zu transformieren, um Homoskedastizität zu erreichen. Diese führt dann zur korrekten Verwendung des Gauss-Markov-Theorems.

Folgen von Heteroskedastizität bei linearer Regression[Bearbeiten]

Beispiele[Bearbeiten]

Heteroskedastizität in Zeitreihen[Bearbeiten]

Ein typisches Beispiel für Heteroskedastizität ist, wenn bei einer Zeitreihe die Abweichungen von der Trendgeraden mit Fortlauf der Zeit steigen (z. B. für die Treffgenauigkeit bei der Wettervorhersage: je weiter in der Zukunft, desto unwahrscheinlicher ist eine genaue Prognose). Allerdings können auch in Zeitreihen ohne konstante Varianz bestimmte charakteristische Auffälligkeiten wie z. B. Volatilitätscluster beobachtet werden. Deshalb wurde im Rahmen von Volatilitätsmodellen versucht, dem Verlauf der Varianz eine systematische Erklärung zu Grunde zu legen.

Heteroskedastizität bei der linearen Regression[Bearbeiten]

Heteroskedastizität kann bei einer linearen Regression auftreten. Dies ist ein Problem, da in der klassischen linearen Regressionsanalyse Homoskedastizität der Residuen vorausgesetzt wird. Die untenstehende Grafik zeigt die Variablen Mittlere Raumzahl pro Haus (X) sowie Mittlerer Kaufpreis pro Haus (Y) für (fast) jeden Distrikt in Boston (Boston Housing Daten). Die Grafik Lineare Regression zeigt den Zusammenhang zwischen den beiden Variablen. Die rote Linie zeigt das Residuum für die ganz rechte Beobachtung, also die Differenz zwischen dem beobachteten Wert (runder Kreis) und dem geschätzten Wert auf der Regressionsgerade.

In der Grafik Heteroskedastische Residuen sieht man die Residuen für alle Beobachtungen. Betrachtet man die Streuung der Residuen im Bereich von 4-5 Räumen oder im Bereich ab 7,5 Räumen, so ist sie kleiner als die Streuung in dem Bereich 5-7,5 Räume. Die Streuung der Residuen in den einzelnen Bereichen ist also unterschiedlich, also heteroskedastisch. Wäre die Streuung der Residuen in allen Bereichen gleich, dann wäre sie homoskedastisch.

Lineare Regression und Residualplot bei den Boston Housing Daten.

Testverfahren[Bearbeiten]

Bekannte Verfahren, um die Nullhypothese „Homoskedastizität“ zu überprüfen, sind der Goldfeld-Quandt-Test, der White-Test, der Levene-Test, der Glejser-Test und der Breusch-Pagan-Test.