Standardfehler des Regressionskoeffizienten

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 9. Februar 2020 um 17:46 Uhr durch Gestrandete 4,5-Volt-Taschenlampenbatterie (Diskussion | Beiträge). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Zur Navigation springen Zur Suche springen

In der Statistik ist der Standardfehler des Regressionskoeffizienten ein Maß für die Variabilität des Schätzers für den Regressionskoeffizienten. Der Standardfehler des Regressionskoeffizienten wird benötigt, um die Präzision der Schätzung des Regressionskoeffizienten beurteilen zu können, etwa anhand eines statistischen Tests oder eines Konfidenzintervalls.[1]

Die Schätzung einer Regressionsgerade wird oft so angegeben, dass unter den ermittelten Koeffizienten die Standardfehler in Klammern angeführt werden. Damit erreicht man eine übersichtliche Darstellung der beiden Aspekte, der Punktschätzung sowie einer Angabe der Präzision.

Spezialfall: Lineare Einfachregression

In der linearen Einfachregression (nur eine erklärende Variable) ist der (geschätzte) Standardfehler des Regressionskoeffizienten (hier des Anstiegs ) gegeben durch die positive Quadratwurzel der geschätzten Varianz von (siehe auch Lineare Einfachregression#Varianzen der Kleinste-Quadrate-Schätzer):

mit der erwartungstreuen Schätzung der Varianz der Störgrößen

,

dessen empirisches Pendant das mittlere Residuenquadrat

ist. Daher folgt für den (empirischen) Standardfehler des Anstiegs:[2]

.

Mit diesem Standardfehler lässt sich die Präzision der Schätzung des Anstiegs beurteilen, z. B. mittels eines Konfidenzintervalls. Ein -Konfidenzintervall für den unbekannten (wahren) Regressionskoeffizienten ist gegeben durch:[3]

,

wobei das -Quantil der studentschen t-Verteilung mit Freiheitsgraden ist.

Multiple lineare Regression

Gegeben ein typisches multiples lineares Regressionsmodell , mit dem Vektor der unbekannten Regressionsparameter, der Versuchsplanmatrix , dem Vektor der abhängigen Variablen und dem Vektor der Störgrößen . Dann ist in der multiplen linearen Regression ist die erwartungstreuen Schätzung der Varianz der Störgrößen in Matrixschreibweise gegeben durch die Residuenquadratsumme adjustiert durch die residualen Freiheitsgrade:

.

Für den Standardfehler der (geschätzten) Regressionskoeffizienten folgt daraus, dass sie gegeben sind durch die Quadratwurzel des -ten Diagonalelements der geschätzten Kovarianzmatrix des Kleinste-Quadrate-Schätzers[4]

.

Eine andere Darstellung mittels des Bestimmtheitsmaßes ist[5]

.

Einzelnachweise

  1. Axel M. Gressner, Torsten Arndt: Lexikon der Medizinischen Laboratoriumsdiagnostik. Springer-Verlag, 2013., 3. Auflage, S. 2209.
  2. Werner Timischl: Angewandte Statistik. Eine Einführung für Biologen und Mediziner. 2013, 3. Auflage, S. 313.
  3. Werner Timischl: Angewandte Statistik. Eine Einführung für Biologen und Mediziner. 2013, 3. Auflage, S. 327.
  4. Lothar Sachs, Jürgen Hedderich: Angewandte Statistik: Methodensammlung mit R. 8., überarb. und erg. Auflage. Springer Spektrum, Berlin/ Heidelberg 2018, ISBN 978-3-662-56657-2, S. 806
  5. Jeffrey Marc Wooldridge: Introductory econometrics: A modern approach. 5. Auflage. Nelson Education, 2015, S. 101.