Effizienz (Statistik)

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Effizienz ist ein Begriff in der Statistik, mit dem ein Aspekt der Qualität eines Schätzers für einen unbekannten Parameter bemessen werden kann. Sie zählt neben Konsistenz, Suffizienz und (asymptotischer) Erwartungstreue zu den vier gebräuchlichen Kriterien für die Qualität von Schätzern.

Idee[Bearbeiten]

Die Effizienz bezieht sich auf die Varianz einer Schätzfunktion. Je kleiner die Varianz einer Schätzfunktion ist, desto näher wird ein Schätzwert (im Mittel), berechnet aus einer Stichprobe, an dem wahren Parameter liegen. Man unterscheidet zwischen relativer und absoluter Effizienz.

Hat man zwei erwartungstreue Schätzfunktionen für den gleichen unbekannten Parameter, dann heißt die Schätzfunktion mit der kleineren Varianz (relativ) effizient oder effizienter. Zur Lösung des Schätzproblems würde man den effizienteren Schätzer bevorzugen. Die Cramer-Rao-Ungleichung sagt aus, dass es für viele Schätzprobleme eine untere Grenze für die Varianz einer erwartungstreuen Schätzfunktion gibt. Hat man eine solche Schätzfunktion gefunden, dann gibt es keine andere erwartungstreue Schätzfunktion, die eine kleinere Varianz hat. Kann man also zeigen, dass für ein Schätzproblem eine Schätzfunktion die minimale Varianz hat, so heißt diese Schätzfunktion absolut effizient.

Beispiel[Bearbeiten]

Wenn X_i unabhängige Stichprobenvariablen sind mit E(X_i)=\mu und \operatorname{Var}(X_i)=\sigma^2 und man betrachtet für den unbekannten Parameter \mu die beiden Schätzfunktionen (für 3 Beobachtungswerte):

T_1(X_1,X_2,X_3)=\tfrac13 (X_1+X_2+X_3) und
T_2(X_1,X_2,X_3)=\tfrac13 (X_1+2\cdot X_3).

Beide Schätzfunktionen sind erwartungstreu: E(T_j(X_1,X_2,X_3))=\mu. Für die Varianz ergibt sich jedoch

\operatorname{Var}(T_1(X_1,X_2,X_3))=\operatorname{Var}(\tfrac13 (X_1+X_2+X_3))=\frac19 \left(\operatorname{Var}(X_1)+\operatorname{Var}(X_2)+\operatorname{Var}(X_3)\right)=\frac13\sigma^2 und
\operatorname{Var}(T_2(X_1,X_2,X_3))=\operatorname{Var}(\tfrac13 (X_1+2\cdot X_3))=\frac19 \left(\operatorname{Var}(X_1)+4\cdot\operatorname{Var}(X_3)\right)=\frac59\sigma^2.

Damit gilt \operatorname{Var}(T_1(X_1,X_2,X_3))=\frac13\sigma^2<\frac59\sigma^2=\operatorname{Var}(T_2(X_1,X_2,X_3)), d. h. T_1 ist effizienter als T_2.

Mathematische Definition[Bearbeiten]

Erwartungstreuer Fall[Bearbeiten]

Formal sei T(X)\; ein erwartungstreuer Schätzer für den unbekannten Parameter \vartheta\; in einer Familie von Wahrscheinlichkeitsdichten und I(\vartheta)\; die zur Dichte \prod_{i=1}^{n} f_{\vartheta}(x_i) gehörige Fisher-Information. Dann ist die Effizienz von T(X)\; wie folgt definiert:

e(T(X)) = \frac{1}{I(\vartheta) \mathrm{Var}_{\vartheta}(T(X))}.

Wenn man zwei erwartungstreue Schätzer T_1(X) und T_2(X) miteinander vergleichen möchte, so heißt derjenige Schätzer effizienter, der den höheren Wert e(T_i(X)) und also die kleinere Varianz besitzt.

Eine Konsequenz aus der Cramer-Rao-Ungleichung ist, dass unter Regularitätsbedingungen e(T(X))\; nach oben durch 1 beschränkt ist und daher solche Schätzer effizient genannt werden, für die e(T(X)) = 1\; und also \mathrm{Var}_{\vartheta}(T(X)) = I(\vartheta)^{-1} gilt. Dies ist unter den für die Cramer-Rao-Ungleichung notwendigen Bedingungen an das stochastische Modell die bestmögliche Varianz eines Schätzers.

Nichterwartungstreuer Fall[Bearbeiten]

Falls der Schätzer T\; nicht erwartungstreu ist, lässt sich seine Effizienz als

e(T(X)) = \frac{(\frac{\partial}{\partial \vartheta} E_{\vartheta}[T(X)])^2}{I(\vartheta) \mathrm{Var}_{\vartheta}(T(X))}

definieren. Offensichtlich ergibt sich die obige Definition als Spezialfall.

Asymptotische Effizienz[Bearbeiten]

In der Regel reicht es aus, wenn Schätzer asymptotisch effizient sind, d.h. wenn sie in Verteilung gegen eine normalverteilte Zufallsvariable konvergieren, deren Varianz das Inverse der Fisher-Information ist. Formal soll also die Konvergenzaussage

\sqrt n (T(X) - \vartheta) \stackrel{\mathcal D}{\rightarrow} \mathcal N (0, I_{1}(\vartheta)^{-1})

bewiesen werden können, wobei I_{1}(\vartheta) die Fisher-Information der Dichte f_{\vartheta}(x) bezeichnet und I(\vartheta) = n \cdot I_{1}(\vartheta) gilt. Für asymptotisch effiziente Schätzer gilt offensichtlich \lim_{n \rightarrow \infty} e(T) = 1.

Typische Beispiele für asymptotisch effiziente Schätzer sind solche, die mit Hilfe der Maximum-Likelihood-Methode gewonnen werden.

Literatur[Bearbeiten]

  • Helmut Pruscha: Vorlesungen über Mathematische Statistik. B. G. Teubner, Stuttgart 2000, ISBN 3-519-02393-8, Abschnitt V.1.