Schätztheorie

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Die Schätztheorie ist ein neben der Testtheorie ein zentrales Gebiet der induktiven Statistik. Sie befasst sich zum einen mit der Frage Schätzfunktionen für unbekannte Parameter einer Grundgesamtheit zu entwickeln. Zum anderen möchte sie aber auch Qualitätsaussagen über die entwickelten Schätzfunktionen machen.

Grundlegende Modellierung[Bearbeiten | Quelltext bearbeiten]

Zugrunde liegt der Schätztheorie ein statistisches Modell . Dabei enthält

  • alle möglichen Werte, welche die Stichprobe annehmen kann,
  • alle Mengen, denen man eine Wahrscheinlichkeit zuordnen will,
  • alle Wahrscheinlichkeitsmaße auf , die man für möglich oder relevant erachtet.

Des Weiteren ist eine Funktion

gegeben, die jedem Wahrscheinlichkeitsmaß aufgrund seines Index den zu schätzenden Wert, beispielsweise einen Verteilungsparameter oder eine Größe aus der ein solcher berechnet werden kann, zuweist. Meist handelt es sich hier um Erwartungswert, Varianz oder Median, dann ist . Im Falle eines parametrischen statistischen Modells heißt diese Funktion Parameterfunktion

Ein Punktschätzer oder einfach Schätzer ist dann eine Funktion

für einen Entscheidungsraum . Sie ordnet jeder Stichprobe einen geschätzten Wert für den zu schätzenden Wert zu. Hier ist wieder am häufigsten oder entsprechende Teilmengen oder höherdimensionale Äquivalente.

Bei dieser Schätzung ist das zugrunde liegende Wahrscheinlichkeitsmaß unbekannt. Allerdings sind die Stichproben gemäß diesem Wahrscheinlichkeitsmaß verteilt und erlauben daher einen Rückschluss auf gewisse Eigenschaften des Wahrscheinlichkeitsmaßes.

Die Verteilung der Stichproben gemäß einem Wahrscheinlichkeitsmaß wird dadurch formalisiert, das man sie als Realisierung einer Zufallsvariable mit Verteilung schreibt. So bezeichnet die Zufallsvariable, die entsteht, wenn die Stichprobe selbst als Zufallsvariable angesehen wird. Analog bezeichnet dann die Auswertung der Realisation der Zufallsvariable . ist eine Funktion, eine Auswertung dieser Funktion an der Stelle .

Methoden der Schätzfunktionengewinnung[Bearbeiten | Quelltext bearbeiten]

Man geht aus von Stichprobenvariablen , also von Zufallsvariablen, deren Verteilung die Wahrscheinlichkeit angibt, welche Merkmalsausprägung (für diskrete Daten) bzw. welcher Bereich von Merkmalsausprägungen (für stetige Daten), für die -te Beobachtung einer Stichprobe auftreten. In der Verteilung der Stichprobenvariablen treten die gesuchten Parameter der Grundgesamtheit auf.

Im Laufe der Zeit sind verschiedene Methoden zur Gewinnung von Schätzfunktionen entwickelt worden, z. B.

Die Schätzfunktionen und deren Verteilung sind dann Grundlage von Punktschätzern und Intervallschätzern (Konfidenzintervalle).

Hauptartikel: Schätzmethode (Statistik)

Qualitätskriterien für Schätzer[Bearbeiten | Quelltext bearbeiten]

Die Güte eines Punktschätzers wird nach unterschiedlichen Kriterien bemessen. Dabei lassen sich zwei verschiedene Klassen von Gütekriterien unterscheiden:

  1. Kriterien, die einen direkten Vergleich im Sinne von besser / schlechter zwischen Schätzern zulassen.
  2. Einschränkungen auf Klassen von Schätzern, die gewisse wünschenswerte strukturelle Eigenschaften aufweisen.

Zu den ersteren gehören beispielsweise die Effizienz und der mittlere quadratische Fehler, zu den zweiten die Suffizienz.

Die klassischen Gütekriterien der Schätztheorie sind Effizienz, Erwartungstreue, Konsistenz und Suffizienz.

Effizienz[Bearbeiten | Quelltext bearbeiten]

Hauptartikel: Effizienz (Statistik)

Die Güte eines Schätzers wird meist über seinen mittleren quadratischen Fehler

definiert. Dabei werden größere Abweichungen von der zu schätzenden Funktion durch das Quadrat stärker gewichtet. Ein Schätzer heißt dann effizienter als , wenn

.

Im erwartungstreuen Fall reduziert sich dies zu

.

Gesucht werden meist "absolut" effiziente Schätzer, also solche, die effizienter sind als jeder weitere Schätzer in einer vorgegebenen Menge. Unter relativ milden Annahmen an eine Schätzfunktion sichert die Cramér-Rao-Ungleichung eine untere Schranke für die Varianz von erwartungstreuen Schätzfunktionen für ein Schätzproblem zu. Hat man eine Schätzfunktion mit dieser Varianz gefunden, kann es keine effizientere Schätzfunktion mehr geben.

Erwartungstreue[Bearbeiten | Quelltext bearbeiten]

Hauptartikel: Erwartungstreue

Ein erwartungstreuer Schätzer trifft "im Mittel" immer den zu schätzenden Wert, es gilt also

für alle . Ist ein Schätzer nicht erwartungstreu, so nennt man ihn verzerrt. Eine Abschwächung der Erwartungstreue ist die asymptotische Erwartungstreue. Bei ihr gilt die Erwartungstreue erst im Grenzwert. Eine Verallgemeinerung der Erwartungstreue ist die L-Unverfälschtheit, sie enthält neben der Erwartungstreue auch noch die Median-Unverfälschtheit als Spezialfall.

Konsistenz[Bearbeiten | Quelltext bearbeiten]

Hauptartikel: Konsistente Schätzfolge

Die Konsistenz ist ein asymptotisches Gütekriterium und formalisiert, dass für große Stichproben die Wahrscheinlichkeit, dass der geschätzte Wert von dem zu schätzenden Wert abweicht, sehr klein werden soll. Es soll also gelten

.

Es existieren unterschiedliche Versionen des Konsistenzbegriffes, welche sich durch die verwendeten Konvergenzarten unterscheiden.

Suffizienz[Bearbeiten | Quelltext bearbeiten]

Hauptartikel: Suffizienz (Statistik)

Die Suffizienz formalisiert, dass alle für die Schätzung relevanten Informationen beachtet werden. Man unterscheidet in suffiziente Statistiken, die alle Daten von Relevanz übertragen, und suffiziente σ-Algebren, die alle relevanten Daten enthalten. Eine Verschärfung der Suffizienz ist die Minimalsuffizienz, sie beschäftigt sich mit der Frage, wie sehr Daten komprimiert werden können, ohne dass Informationsverlust auftritt. Ihre Bedeutung erlangt die Suffizienz unter anderem durch den Satz von Rao-Blackwell. Dieser besagt, dass optimale Schätzer immer in der Klasse der suffizienten Schätzer zu finden sind.

Zentrale Aussagen[Bearbeiten | Quelltext bearbeiten]

Zu den zentralen Aussagen der Schätztheorie gehören:

Punktschätzung als Entscheidungsproblem[Bearbeiten | Quelltext bearbeiten]

Viele Optimalitäts- und Reduktionsprinzipien der Schätztheorie lasse sich im Rahmen der Entscheidungstheorie sinnvoll in ein statistisches Entscheidungsproblem einordnen und miteinander vergleichen.

Grundlage des statistischen Entscheidungsproblems ist wie in der Schätztheorie ein statistisches Modell sowie ein Entscheidungsraum . Entscheidungsfunktionen sind dann genau die Punktschätzer

.

Ist nun

eine zu schätzende Funktion (im parametrischen Fall Parameterfunktion genannt),

so lassen sich verschiedene Verlustfunktionen

definieren. Typische Verlustfunktionen sind

  • der Gauß-Verlust
  • der Laplace-Verlust
  • eine Einschränkung auf konvexe Verlustfunktionen .

Die zum Gauß-Verlust zugehörige Risikofunktion ist dann der mittlere quadratische Fehler, die zum Laplace-Verlust gehörende Risikofunktion der mittlere betragliche Fehler. Statistisches Modell, zu schätzende Funktion, Entscheidungsraum und Verlustfunktion werden dann zu einem Schätzproblem zusammengefasst.

Typische Reduktionskriterien sind:

  • Suffizienz: Der Satz von Rao-Blackwell liefert nun, dass für alle konvexen Verlustfunktionen (und somit auch für den Laplace- und Gauß-Verlust) die Bedingung auf suffiziente Schätzer immer mit einer gleichmäßigen Verminderung des Risikos einhergeht und begründet somit die Einschränkung der Suche von Elementen minimalen Risikos auf suffiziente Schätzer.
  • L-Unverfälschtheit: Pragmatisch motiviert ist die Einschränkung auf L-unverfälschte Schätzer. Diese weisen keinen systematischen Fehler auf. Spezialfällen sind Erwartungstreue (Gauß-Verlust) und Median-Unverfälschtheit (Laplace-Verlust). Für die Erwartungstreue reduziert sich dann das Risiko eines Schätzers auf seine Varianz.

So sind dann beispielsweise die zulässigen Entscheidungsfunktionen bezüglich des Gauß-Verlustes in der Menge der erwartungstreuen Schätzer genau die gleichmäßig besten erwartungstreuen Schätzer und ein Schätzer ist genau dann relativ effizienter als ein weiterer Schätzer, wenn sein Risiko stets kleiner ist als das des zweiten Schätzers.

Literatur[Bearbeiten | Quelltext bearbeiten]