Verschiebungssatz (Statistik)
Der Verschiebungssatz (auch Satz von Steiner genannt) ist eine Rechenregel für die Ermittlung der Summe quadratischer Abweichungen.
Kurz gefasst besagt er:
.
Der Verschiebungsatz erleichtert beispielsweise die Berechnung der Varianz, wenn Messwerte fortlaufend anfallen. Es ist dann weder nötig, alle
abzuspeichern (Speicher), noch nochmals alle Summanden durchzulaufen (Rechenzeit). Bei Verwendung dieser Formel mit begrenzter Rechengenauigkeit kann es jedoch zu einer numerischen Auslöschung kommen, wenn
erheblich größer ist als die Varianz.
Inhaltsverzeichnis |
Erläuterung am Fall einer endlichen Folge von Zahlen: Das Stichprobenmittel [Bearbeiten]
Der Verschiebungssatz wird zunächst am einfachsten Fall vorgeführt: Es ist eine Folge von reellen Zahlen xi gegeben, beispielsweise eine Stichprobe. Es wird die Summe Q der quadratischen Abweichungen der Einzelwerte xi vom arithmetischen Mittel dieser Werte gebildet:
wobei
das arithmetische Mittel der Zahlen ist.
Der Verschiebungssatz ergibt sich aus
-
.
Beispiel [Bearbeiten]
Im Rahmen der Qualitätssicherung werden fortlaufend Kaffeepäckchen gewogen. Für die ersten vier Päckchen erhielt man die Werte (in g) xi
Das durchschnittliche Gewicht beträgt
Es ist
Für die Anwendung des Verschiebungssatzes berechnet man
und
Man kann damit beispielsweise die korrigierte Stichprobenvarianz bestimmen:
im Beispiel
Kommt nun ein weiteres Päckchen in die Stichprobe, so reicht es zur Neuberechnung der Stichprobenvarianz mit Hilfe des Verschiebungssatzes, lediglich die Werte für
und
neu zu berechnen. Beim fünften Päckchen werde das Gewicht 510 g gemessen. Dann gilt:
sowie
Die Stichprobenvarianz der neuen, größeren Stichprobe ist dann
Anwendungen [Bearbeiten]
Wahrscheinlichkeitsverteilungen [Bearbeiten]
Varianz [Bearbeiten]
Die Varianz als Erwartungswert
lässt sich mit dem Verschiebungssatz auch angeben als
Dieses Resultat wird auch als Satz von König-Huygens bezeichnet. Es ergibt sich aus der Linearität des Erwartungswertes:
- Man erhält bei einer diskreten Zufallsvariablen X mit den Ausprägungen
und der dazugehörigen Wahrscheinlichkeit
dann für
- Mit der speziellen Wahl
ergibt sich
und die obige Formel
- Für eine stetige Zufallsvariable X mit den Ausprägungen Ω = {x| x ∈ R} und der dazugehörigen Dichtefunktion f(x) ist
Man erhält hier mit dem Verschiebungssatz
Kovarianz [Bearbeiten]
Die Stichprobenkovarianz zweier Zufallsvariablen X und Y lässt sich als E( (X-E(X))·(Y-E(Y)) ) angeben.
Für diskrete Zufallsvariablen erhält man für
entsprechend zu oben
mit f(xj, yk) als gemeinsamer Wahrscheinlichkeit, dass X = xj und Y = yk ist.
Bei stetigen Zufallsvariablen ergibt sich mit f(x,y) als gemeinsamer Dichtefunktion von X und Y an der Stelle x und y für die Kovarianz
entsprechend zu oben
Stichprobenkovarianz [Bearbeiten]
Für die Stichproben-Kovarianz zweier Merkmale x und y benötigt man
Hier ergibt der Verschiebungssatz
Die korrigierte Stichprobenkovarianz berechnet sich dann als
.


.








sowie




und der dazugehörigen Wahrscheinlichkeit
dann für
ergibt sich
und die obige Formel








