RESET Test

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der Regression Equation Specification Error Test (RESET) Test von Ramsey (1969) ist ein Test in der Statistik zur Überprüfung der Modellspezifikation im Rahmen der linearen Regression.[1] Er prüft, ob nichtlineare Kombinationen der erklärenden Variablen X_i einen Einfluss auf die erklärte Variable Y haben. Falls die nichtlinearen Kombinationen der erklärenden Variablen einen Einfluss haben, dann sollte die lineare Modellspezifikation überdacht werden. Aber auch Fehlspezifikationen wie das Nichtberücksichtigen relevanter Variablen, Strukturbrüche, Homoskedastizität etc. können durch den Test angezeigt werden.[2] Ein Vorteil des RESET Tests ist es, dass kein explizites Alternativmodell spezifiziert werden muss; der Nachteil, dass er aber auch keinen Hinweis auf eine „richtige“ Spezifikation liefert.

Mathematische Formulierung[Bearbeiten]

Im linearen Modell wird folgende Modellspezifikation angenommen

Y=\beta_0+\beta_1 X_1 + ... + \beta_m X_m + \epsilon,

und man schätzt

\hat{Y}=b_0+b_1 X_1 + ... + b_m X_m.

Der Test prüft, ob ein nichtlineares Modell der Form

Y = \hat{Y} + \gamma_2 \hat{Y}^2 + ... + \gamma_k \hat{Y}^k+\zeta

nicht eine größere Erklärungskraft als das lineare Modell hat.

Die Hypothesen sind

H_0: \gamma_2=...=\gamma_k=0 vs. H_1: es existiert min. ein \gamma_i\neq0.

Die Teststatistik ist

\frac{\frac{R_1^2-R_0^2}{k}}{\frac{1-R_1^2}{n-(m+k)-1}}\sim F_{k-1;n-m-k}

mit

  • R_0^2 das Bestimmtheitsmaß des linearen Modells,
  • R_1^2 das Bestimmtheitsmaß des nichtlinearen Modells,
  • n der Stichprobenumfang,
  • m die Zahl der erklärenden Variablen und
  • k die Zahl der zusätzlichen Parameter im nichtlinearen Modell.

Werden auch die Koeffizienten der linearen Regression im nichtlinearen Modell neu geschätzt und unterscheiden sie sich wesentlich von den geschätzten Koeffizienten im linearen Modell, so ist dies auch ein Hinweis auf eine Fehlspezifikation.

Der RESET Test lässt sich auch auf generalisierte lineare Modelle erweitern.[3]

Beispiel[Bearbeiten]

Lineare Regression bei einem nicjht-linearen Zusammenhang.

In den Boston Housing Daten wird der mittlere Kaufpreis von Häusern pro Bezirk (medv) in Abhängigkeit vom Anteil der Unterschichtbevölkerung (lstat) mittels einer einfachen linearen Regression geschätzt. Die Regressiongerade im Scatterplot zeigt deutlich, dass der Zusammenhang zwischen den beiden Variablen nichtlinear ist.

Der RESET Test (mit \hat{y}^2 und \hat{y}^3) ergibt folgendes Ergebnis:

   RESET test
data:  linreg 
RESET = 83.4103, df1 = 2, df2 = 502, p-value < 2.2e-16

Wie die Grafik bereits nahe legt, wird die Nullhypothese verworfen, da der p-Wert kleiner ist als z. B. ein Signifikanzniveau von \alpha=5\%.

Einzelnachweise[Bearbeiten]

  1.  J.B. Ramsey: Tests for Specification Errors in Classical Linear Least Squares Regression Analysis. In: Journal of the Royal Statistical Society, Series B. 31, Nr. 2, 1969, S. 350-371 (http://www.jstor.org/stable/2984219).
  2.  Peter Hackl: Einführung in die Ökonometrie. Addison-Wesley Verlag, 28. Oktober 2004, ISBN 978-3827371188.
  3.  Sunil Sapra: A regression error specification test (RESET) for generalized linear models. In: Economics Bulletin. 3, Nr. 1, 2005, S. 1-6 (http://www.economicsbulletin.com/2005/volume3/EB-04C50033A.pdf, abgerufen am 9. September 2012).