Studentisierung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Unter Studentisierung oder Studentisieren versteht man in der mathematischen Statistik eine Transformation der Realisationen einer Zufallsvariablen, so dass die resultierende Werte das arithmetische Mittel Null und die Stichprobenvarianz Eins besitzen. Da die Stichprobenstandardabweichung der Wurzel der Stichprobenvarianz entspricht, ist diese somit auch gleich Eins.

Studentisieren ist zum Beispiel notwendig um unterschiedlich verteilte Zufallsvariablen miteinander vergleichen zu können.

Der Name beruht auf dem Pseudonym „Student“ des Statistikers William Sealy Gosset (1876–1937).

Sind x_i die n Realisationen einer Zufallsvariable mit arithmetischem Mittel \overline x, so erhält man die zugehörigen studentisierten Werte dadurch, dass man das arithmetische Mittel subtrahiert und durch die Stichprobenstandardabweichung teilt:

 z_i=\frac{x_i - \overline x}{\sqrt{\frac{1}{n}\sum\limits_{k}\left(x_k-\overline x\right)^2}}

Für diese so erhaltenen Werte z_i gilt dann:

  • Arithmetisches Mittel: \overline z := \frac{1}{n} \sum_{i}{z_i} = 0
  • Stichprobenvarianz: \frac{1}{n}\sum\limits_{i}\left(z_i-\overline z\right)^2 = 1

In vielen Statistikprogrammen wie SPSS und Statistica ist die Möglichkeit des Studentisierens der Messergebnisse bereits eingebaut. Oftmals wird hierbei fälschlicherweise der Begriff des Standardisierens verwendet, bei der eigentlich eine Zufallsvariable selbst - und nicht deren Realisationen - auf Erwartungswert Null und Varianz Eins transformiert wird. Es ist vielmehr so, dass meistens von Standardisieren gesprochen wird, auch wenn in statistischen Auswertungen eigentlich Studentisieren gemeint ist.

Beispiel[Bearbeiten]

Nummer (i) Originalwert (x_i) Studentisierter Wert (z_i)
1 3 0,5
2 -1 -0,5
3 2 0,25
4 4 0,75
5 -7 -2
6 7 1,5
7 2 0,25
8 5 1
9 -2 -0,75
10 -3 -1

Die nebenstehende Tabelle enthält 10 Realisationen einer Zufallsvariablen. Dabei sind einmal die Originalwerte x_i und die zugehörigen studentisierten Werte z_i angegeben.

Für die Originalwerte gilt:

  • Arithmetisches Mittel: \overline x := \frac{1}{n} \sum_{i}{x_i} = 1
  • Stichprobenvarianz: \frac{1}{n}\sum\limits_{i}\left(x_i-\overline x\right)^2 = 16

Folglich errechnen sich die zugehörigen studentisierten Werte wie folgt:  z_i=\frac{x_i - 1}{\sqrt{16}} = \frac{x_i - 1}{4}

Für diese so erhaltenen Werte z_i gilt dann tatsächlich:

  • Arithmetisches Mittel: \overline z := \frac{1}{n} \sum_{i}{z_i} = 0
  • Stichprobenvarianz: \frac{1}{n}\sum\limits_{i}\left(z_i-\overline z\right)^2 = 1

Mit den studentisierten Werten kann man nun sehr leicht beurteilen, ob ein zugehöriger Originalwert auffällig weit weg vom Mittelwert aller Daten ist. So erkennt man, dass der Wert Nummer 5 sehr niedrig ist, da der zugehörige studentisierte Wert -2 beträgt. Dies sagt aus, dass der Originalwert von -7 zwei Stichprobenstandardabweichungen kleiner ist als der Mittelwert.

Quellen[Bearbeiten]

  • Bortz, Statistik für Human- und Sozialwissenschaftler, 6. Auflage, 2005, Springer
  • Falk et al., Foundations of statistical analyses and applications with SAS, 2002, Birkhäuser