Verzerrung (Statistik)

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Verzerrung, auch Bias oder systematischer Fehler[1] genannt, ist in der Schätztheorie, einem Teilgebiet der mathematischen Statistik, eine Kennzahl oder Eigenschaft eines Punktschätzers. Die Verzerrung bildet das Gegenstück zur Erwartungstreue und formalisiert, dass ein Schätzer im Mittel von dem zu schätzenden Wert abweicht.

Definition[Bearbeiten | Quelltext bearbeiten]

Gegeben sei ein statistisches Modell sowie ein Punktschätzer

und eine zu schätzende Funktion

.

Dann heißt

die Verzerrung des Schätzers bei . Dabei bezeichnet den Erwartungswert bezüglich des Wahrscheinlichkeitsmaßes .

Die Notation für die Verzerrung ist nicht einheitlich. In der Literatur finden sich unter anderem , oder .

Beispiel[Bearbeiten | Quelltext bearbeiten]

Gegeben seien Zufallszahlen, die gleichverteilt in einem Intervall sind. Aufgabe ist, zu schätzen. Statistisches Modell ist

,

wobei und die stetige Gleichverteilung auf ist.

Die zu schätzende Funktion ist , ein möglicher Schätzer wäre

,

da die größte ausgegebene Zufallszahl intuitiv "nah" an der unbekannten Obergrenze liegt. Dann ist

für alle . Daraus folgt

,

somit ist die Verzerrung

.

Die Verzerrung kommt hier zustande, da der Schätzer den wahren Wert stets unterschätzt, es ist .

Eigenschaften[Bearbeiten | Quelltext bearbeiten]

Ist die Verzerrung eines Schätzers für alle gleich Null, also

,

so nennt man diesen Schätzer einen erwartungstreuen Schätzer.

Der mittlere quadratische Fehler

zerfällt aufgrund des Verschiebungssatzes der Varianz in Varianz und Verzerrung

Somit entspricht der mittlere quadratische Fehler bei erwartungstreuen Schätzern genau der Varianz des Schätzers.

Sowohl die Verzerrung als auch der mittlere quadratische Fehler sind wichtige Qualitätskriterien für Schätzer. Folglich versucht man, beide möglichst klein zu halten. Es gibt aber Fälle, in denen es zur Minimierung des mittleren quadratischen Fehlers sinnvoll ist, Verzerrung zuzulassen.

So ist im Binomialmodell mit ein gleichmäßig bester erwartungstreuer Schätzer gegeben durch

,

heißt seine Varianz (und damit auch sein mittlerer quadratischer Fehler) ist für alle kleiner als die jedes weiteren erwartungstreuen Schätzers. Der Schätzer

ist nicht erwartungstreu und folglich verzerrt, besitzt aber für Werte von nahe an einen geringeren mittleren quadratischen Fehler[2].

Es können also nicht immer Verzerrung und mittlerer quadratischer Fehler gleichzeitig minimiert werden, siehe auch Bias-Varianz-Dilemma.

Weblinks[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Georgii: Stochastik. 2009, S. 207.
  2. Georgii: Stochastik. 2009, S. 209.