Geschichtete Zufallsstichprobe

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Das Ziehen einer geschichteten Zufallsstichprobe (auch: stratifizierte Zufallsstichprobe) kann in der Statistik Vorteile bringen, wenn die Grundgesamtheit in sinnvolle Gruppen, die sogenannten Schichten, unterteilt werden kann. Man schränkt nun die rein zufällige Auswahl der Stichprobenelemente insofern ein, dass man die Stichprobenumfänge pro Schicht vorgibt und danach in jeder Schicht eine reine Zufallsstichprobe zieht. Man "verbietet" damit extreme Stichproben, die beispielsweise zufällig fast nur Elemente aus einer Schicht enthalten und bekommt in der Konsequenz bessere Punktschätzer, d. h. Schätzer mit kleinerer Varianz. In Monte-Carlo-Simulationen kann man geschichtete Zufallsziehungen als Mittel der Varianzreduktion einsetzen. Die Schichtungsmerkmale (Paradaten) müssen vorab bekannt sein.

Grundgesamtheitsgrößen[Bearbeiten | Quelltext bearbeiten]

Umfang der Grundgesamtheit, Anzahl der Schichten, interessierendes Merkmal. Im Folgenden ist . Umfang der Schicht . Ausprägung des Merkmals in Schicht . relative Schichtstärke. Erwartungswert in Schicht . Varianz in Schicht Es gilt:

.

Die Gesamtvarianz ist die Summe der Varianz in den Schichten und der Varianz zwischen den Schichten.

Schätzer für die Grundgesamtheitsparameter[Bearbeiten | Quelltext bearbeiten]

Wir konzentrieren uns auf die Schätzung von . Seien die Stichprobenumfänge pro Schicht und der Gesamtstichprobenumfang. Seien weiter die Stichprobenwerte aus den Schichten. Dann ist ein erwartungstreuer Schätzer für und eine erwartungstreue Schätzung für . Zum Vergleich mit dem hier interessierenden Schätzer wird das auf reiner Zufallsauswahl beruhende Stichprobenmittel herangezogen.

Schichtungsarten[Bearbeiten | Quelltext bearbeiten]

  • Proportionale Schichtung:

Wenn man wählt, dann sind die proportional zum Schichtumfang . ist deutlich kleiner als , wenn sich die Erwartungswerte in den Schichten stark unterscheiden, d. h. wenn die Varianz zwischen den Schichten groß ist.

  • Varianzoptimale Schichtung:

Wenn

,

dann ist bei stark unterschiedlichen die Varianz von wesentlich kleiner als bei proportionaler Schichtung, weil Schichten mit großer Streuung stärker beprobt werden. Proportionale Schichtung ist varianzoptimal, wenn alle gleich sind.

  • Kostenoptimale Schichtung

Seien die zur Verfügung stehenden Gesamtkosten und die Kosten für die Auswahl eines Elementes aus Schicht . Wenn man nun die Varianz von minimiert unter der Nebenbedingung, die Kosten nicht zu überschreiten, dann ergibt sich

.

In der Regel ist obiger Wert keine natürliche Zahl und daher zu runden.

Stratifikationsproblematik[Bearbeiten | Quelltext bearbeiten]

Stratifikation ist die Einteilung der Grundgesamtheit in Schichten. Dabei entstehen zwei Teilprobleme:

  1. Die Festlegung der Anzahl der Schichten.
  2. Die Festlegung der Schichtabgrenzung.

Ziel ist es, die beiden Teilprobleme so zu lösen, dass die Schätzungen genauer werden. Dazu bedarf es allerdings meist Vorinformationen über die Grundgesamtheit (etwa durch die Amtliche Statistik oder vorhergehende Untersuchungen).

Eine Lösung o. g. Problematik stellt etwa das Stratifikationsmodell nach Dalenius inklusive entsprechender Näherungslösungen wie die cum-Regel oder die equal aggregate -Regel dar.

Vergleich mit Klumpen-Sichprobe[Bearbeiten | Quelltext bearbeiten]

Geschichtete Stichproben sind von Vorteil, wenn die Grundgesamtheit bzgl. des interessierenden Merkmals in Schichten mit (möglichst stark) unterschiedlichen Schichterwartungswerten und Schichtvarianzen eingeteilt werden kann. Bei einer Klumpen-Stichprobe wird die Grundgesamtheit in sogenannte Klumpen eingeteilt. Jeder Klumpen soll dabei der Grundgesamtheit bzgl. der Merkmalsparameter Erwartungswert und Varianz möglichst ähnlich sein.

Vergleich Quotenstichprobe und geschichtete Zufallsstichprobe[Bearbeiten | Quelltext bearbeiten]

Die Quotenstichprobe ist von der geschichteten Zufallsstichprobe zu unterscheiden. Bei der Quotenstichprobe wird nach bestimmten Merkmalen so lange gezogen, bis die gewünschten Quoten erreicht sind. Bei der geschichteten Zufallsstichprobe werden Ziehungsanteile bestimmter Merkmale vorab festgelegt und dann zufällig gezogen. Damit hat die geschichtete Zufallsstichprobe eine angebbare Ziehungswahrscheinlichkeit. Bei der Quotenstichprobe kann keine Ziehungswahrscheinlichkeit für die Quotenmerkmale angegeben werden; die Ziehung ist von der Antwortverweigerung vorangegangener Fälle abhängig.

Literaturhinweise[Bearbeiten | Quelltext bearbeiten]

  • Kish, L. (1965). Survey Sampling. Wiley
  • Stenger, H. (1971). Stichprobentheorie. Physica-Verlag
  • Cochran, W. G. (1977). Sampling Techniques (3rd Edition), New York, Wiley
  • Hartung, J. (2009). Statistik (15. Auflage). Oldenbourg München