Mittlere quadratische Abweichung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Zwei Schätzfunktionen: Die Wahl einer verzerrten Statistik kann hinsichtlich ihrer erwarteten Abweichung vom echten Wert gegenüber einer unverzerrten vorteilhaft sein.

Die mittlere quadratische Abweichung oder mittlerer quadratischer Fehler (engl. mean squared error und daher mit „MSE“ abgekürzt) ist ein Begriff der mathematischen Statistik. Mit der mittleren quadratischen Abweichung kann die Abweichung eines Schätzers von dem zu schätzenden Wert (oder allgemeiner: von Funktionalen von ihnen) berechnet werden.

Definition[Bearbeiten]

Es seien X eine Zufallsvariable und g eine messbare Funktion dieser Variablen. Wenn damit der wahre Parameter \gamma geschätzt werden soll, dann ist die mittlere quadratische Abweichung des Schätzers g(X) für \gamma wie folgt definiert:

\operatorname{MSE}(g,\gamma) = \operatorname{E} [ \| g(X) - \gamma \|^2]

Im klassischen Falle reellwertiger Funktionen heißt das dann:

\operatorname{MSE}(g,\gamma)  = \operatorname{Bias}^2(g(X))+ \operatorname{Var}(g(X))

Dabei ist die Verzerrung \operatorname{Bias}(g(X)) = \operatorname{E} [g(X) - \gamma] , verschwindet also im Fall der Erwartungstreue, in dem der MSE und die Varianz identisch werden.

Interpretation[Bearbeiten]

Eine geringe mittlere quadratische Abweichung bedeutet im klassischen Fall, dass gleichzeitig Bias und Varianz des Schätzers klein sind. Man befindet sich mit dem Schätzer also im Mittel in der Nähe des zu schätzenden Funktionals (geringer Bias) und weiß gleichzeitig, dass die Schätzwerte wenig streuen (geringe Varianz) und mit großer Wahrscheinlichkeit auch in der Nähe ihres Erwartungswerts liegen.

Mit dem MSE ist es daher möglich, Schätzverfahren miteinander zu vergleichen. Die Idee ist, dass es vorteilhaft sein kann, einen leicht verzerrten Schätzer zu bevorzugen, der dafür eine wesentlich kleinere Varianz besitzt. Dabei gilt das Schätzverfahren mit dem kleineren MSE in der Regel als das bessere.

Problematisch ist, dass der MSE vom zu schätzenden, unbekannten Grundgesamtheitsparameter abhängt.

Beispiel[Bearbeiten]

Ein typischer Fall ist die Schätzung des Mittelwerts einer Normalverteilung. Wir nehmen an, dass Zufallsvariablen X_1, \ldots, X_n\; existieren, die jeweils normalverteilt mit unbekanntem Erwartungswert \gamma und Varianz 1 sind. Der klassische Schätzer ist das Stichprobenmittel \bar{X}_n. Hier ist die Verzerrung null:

\operatorname{Bias}(\bar{X}_n) = 0,

da der empirische Mittelwert erwartungstreu für \gamma ist. Da \bar{X}_n selbst normalverteilt mit Erwartungswert \gamma und Varianz \tfrac{1}{n} ist, folgt

\operatorname{MSE}(\bar{X}_n) = \frac{1}{n}.

Ausweitung auf beliebige Verlustfunktionen[Bearbeiten]

Eine Verallgemeinerung der mittleren quadratischen Abweichung ergibt sich, wenn man in der Definition an Stelle des quadratischen Abstandes von Schätzer und unbekanntem Funktional eine beliebige andere Funktion L\; ersetzt, die

  • symmetrisch ist,
  • Werte in \mathbb R^{+}_{0} besitzt und
  • in beiden Komponenten konvex ist.

Abbildungen dieser Art heißen Verlustfunktion, das Risiko eines Schätzers g\; ist dann definiert als

\operatorname{R}_\vartheta(g) = \operatorname{E}_{\vartheta}[L(g(X), \gamma (\vartheta))].

Literatur[Bearbeiten]

  •  Guido Walz (Hrsg.): mittlere quadratische Abweichung. In: Lexikon der Mathematik. 1 Auflage. Spektrum Akademischer Verlag, Mannheim/Heidelberg 2000, ISBN 3-8274-0439-8.