Residuenquadratsumme

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Residual sum of squares)
Wechseln zu: Navigation, Suche
Lineare Regression: Grüne vertikale Linien sind die Residuen.
Die blauen Vierecke sind Residuenquadrate. Die roten Flächen bezeichnen die Gesamte Abweichungsquadratsumme.

Die Residuenquadratsumme (engl. residual sum of squares, kurz RSS oder SSR) bezeichnet in der Statistik die Quadratsumme von beobachteten Werten und den durch ein Modell vorhergesagten Werten.[1] Eine solche Abweichung wird Residuum genannt oder einfach nur Fehler (engl. error). Sie ist damit ein Gütekriterium für ein lineares Modell und beschreibt die Ungenauigkeit des Modells. Die Residuenquadratsumme wird auch als die nicht erklärte Abweichungsquadratsumme bezeichnet.

In einem Modell mit nur einer erklärenden Variable ist RSS gegeben durch:

Im einfachsten Fall handelt es sich bei dem Modell um den Gesamtmittelwert. Dann wird dieser Ausdruck entsprechend als gesamte Abweichungsquadratsumme bezeichnet. Im Kontext der linearen Regression lässt sich dieser Zusammenhang auch wie folgt ausdrücken:

Die Methode der kleinsten Quadrate versucht hier die Residuenquadratsumme zu minimieren (vgl. Minimierung der Summe der Fehlerquadrate). Ein spezielleres Konzept ist die PRESS-Statistik (predicted residual sum of squares).

Um etwa einen F-Test durchzuführen sind oft mittlere Abweichungsquadratsummen von Interesse. Dividiert man die Residuenquadratsumme durch die residualen Freiheitsgrade erhält man den durchschnittlichen Anteil von Varianz der durch äußere Variablen erklärt wird (die unsystematische Varianz). Ein F-Test berechnet dann nur noch den Anteil der erklärten mittleren Varianz im Verhältnis der mittleren Residuenquadratsumme.

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Field, Andy. Discovering statistics using SPSS. Sage publications, 2009. S. 202.