Hotellings T-Quadrat-Verteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Hotellings T-Quadrat Verteilung ist eine Wahrscheinlichkeitsverteilung, die 1931 von Harold Hotelling erstmals beschrieben wurde.[1] Sie ist eine Verallgemeinerung der Studentschen t-Verteilung.

Definition[Bearbeiten]

Hotellings T-Quadrat-Verteilung ist definiert als


t^2=n({\mathbf x}-{\mathbf\mu})'{\mathbf W}^{-1}({\mathbf x}-{\mathbf\mu})

mit

  • n einer Anzahl von Punkten
  • {\mathbf x} ist ein Spaltenvektor mit p Elementen
  • {\mathbf W} ist eine p\times p-Kovarianzmatrix.

Eigenschaften[Bearbeiten]

Es sei x\sim N_p(\mu,{\mathbf V}) eine Zufallsvariable mit einer multivariaten Normalverteilung und {\mathbf W}\sim W_p(m,{\mathbf V}) (unabhängig von x) habe eine Wishart-Verteilung mit einer nicht-singulären Varianz-Matrix \mathbf V und mit m=n-1. Dann ist die Verteilung von t^2: T^2(p,m), Hotellings T-Quadrat-Verteilung mit Parametern p und m.

F sei die F-Verteilung. Dann kann gezeigt werden, dass gilt:


\frac{m-p+1}{pm}
T^2\sim F_{p,m-p+1}
.

Unter der Annahme, dass

{\mathbf x}_1,\dots,{\mathbf x}_n

p×1-Spaltenvektoren mit reellen Zahlen sind.

\overline{\mathbf x}=(\mathbf{x}_1+\cdots+\mathbf{x}_n)/n

sei der Mittelwert. Die positiv definite p×p-Matrix

{\mathbf W}=\sum_{i=1}^n (\mathbf{x}_i-\overline{\mathbf x})(\mathbf{x}_i-\overline{\mathbf x})'/(n-1)

sei ihre „sample variance“-Matrix. (Die Transponierte einer Matrix M sei mit M′ bezeichnet). μ sei ein p×1-Spaltenvektor (bei Anwendung ein Schätzer des Mittelwertes). Dann ist die Hotellings T-Quadrat-Verteilung


t^2=n(\overline{\mathbf x}-{\mathbf\mu})'{\mathbf W}^{-1}(\overline{\mathbf x}-{\mathbf\mu}).

t^2 hat eine enge Beziehung zur quadrierten Mahalanobis-Distanz.

Insbesondere kann gezeigt werden [2], dass, wenn {\mathbf x}_1,\dots,{\mathbf x}_n\sim N_p(\mu,{\mathbf V}) unabhängig sind und \overline{\mathbf x} und {\mathbf W} wie oben definiert sind, dann hat {\mathbf W} eine Wishart-Verteilung mit n −1 Freiheitsgraden

\mathbf{W} \sim W_p(V,n-1) und ist unabhängig von

\overline{\mathbf x} und

\overline{\mathbf x}\sim N_p(\mu,V/n).

Daraus folgt

t^2 = n(\overline{\mathbf x}-{\mathbf\mu})'{\mathbf W}^{-1}(\overline{\mathbf x}-{\mathbf\mu}) \sim T^2(p, n-1).

Einzelnachweise[Bearbeiten]

  1. H. Hotelling (1931) The generalization of Student’s ratio, Ann. Math. Statist., Vol. 2, pp360-378.
  2. K.V. Mardia, J.T. Kent, and J.M. Bibby (1979) Multivariate Analysis, Academic Press.