Gemischtes Modell

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Ein gemischtes Modell (auch Mixed Model) ist ein statistisches Modell, das sowohl Fixed Effects als auch Random Effects enthält, also gemischte Effekte. Diese Modelle werden in verschiedenen Bereichen der Physik, Biologie und den Sozialwissenschaften angewandt. Sie sind besonders nützlich, sofern eine wiederholte Messung an der gleichen statistischen Einheit oder Messungen an Clustern von verwandten statistischen Einheiten durchgeführt werden.

Geschichte und momentaner Stand der Forschung[Bearbeiten]

Ronald Fisher führte das Random Effects Modell ein, um Korrelationen von charakteristischen Merkmalen zwischen Verwandten zu untersuchen. [1] In den fünfziger Jahren entwarf Charles Roy Henderson BLUE für fixed effects und BLUP für random effects.[2][3][4][5] Anschließend wurde gemischte Modellierung eines der Hauptforschungsfelder der statistischen Forschung, einschließlich Arbeiten zur Berechnung von Maximum Likelihood Schätzern, nicht-linearen gemischte-Effekte-Modellen, fehlenden Daten in gemischten Modellen und bayessche Schätzungen von gemischte-Effekte-Modellen. Gemischte Modelle werden in vielen Disziplinen angewandt, insbesondere sofern verschiedene korrelierte Messungen an jeder zu untersuchenden Einheit gemacht werden. Sie werden besonders häufig bei Forschung über Menschen oder Tieren benutzt, wobei die Spanne der Einsatzmöglichkeiten von Genetik bis zu Marketing reicht.

Definition[Bearbeiten]

In Matrixnotation kann ein gemischtes Modell dargestellt werden als:

\ y = X \beta + Zu + \epsilon\,\!

wobei

  • y ein Vektor aus Beobachtungen ist mit Mittelwert E(y)=X\beta
  • \beta ein Vektor aus Fixed Effects
  • \epsilon ein Vektor aus IID zufälligen Fehlertermen ist mit Mittelwert E(\epsilon)=0 und Varianz \operatorname{var}(\epsilon)=R
  • X und Z Matrizen mit Regressoren sind, die die Beobachtungen y mit \beta und u verknüpfen

Schätzung[Bearbeiten]

Hendersons “mixed model equations” (MME, engl. für gemischtes-Modell-Gleichungen) sind: [2][4]

\begin{pmatrix}  X'R^{-1}X & X'R^{-1}Z \\ Z'R^{-1}X & Z'R^{-1}Z + G^{-1} 
\end{pmatrix}\begin{pmatrix}  \tilde{\beta} \\ \tilde{u}
\end{pmatrix}=\begin{pmatrix} X'R^{-1}y  \\ Z'R^{-1}y
\end{pmatrix}

Die Lösungen der MME \textstyle\tilde{\beta} und \textstyle\tilde{u} sind minimalvariante lineare erwartungstreue Schätzer (BLUE) für \beta bzw. u. Dies folgt aus dem Satz von Gauß-Markow, da die konditionelle Varianz des Ergebnis' nicht auf die Einheitsmatrix skalierbar ist. Falls die konditionelle Varianz bekannt ist, ist der mit der inversen Varianz gewichtete Least Squares Schätzer BLUE. Jedoch ist die konditionelle Varianz selten bekannt, sodass es bei der Lösung der MME erwünscht ist, die Varianz und die gewichteten Parameterschätzungen gemeinsam zu schätzen.

Eine Methode zur Anpassung gemischter Modell ist der EM-Algorithmus[6], in dem die Komponenten der Varianz als unbeobachtete Störparameter in der gesamten Wahrscheinlichkeit behandelt werden. Zurzeit ist diese Methode in den wichtigsten Statistiksoftwarepaketen R (lme in der nlme Bibliothek) und SAS (proc mixed) implementiert. Die Lösung der mixed model equations ist eine Maximum-Likelihood-Schätzung, falls die Fehler normalverteilt sind.[7]

Quellen[Bearbeiten]

  1. RA Fisher: The correlation between relatives on the supposition of Mendelian inheritance. In: Transactions of the Royal Society of Edinburgh. 52, 1918, S. 399–433.
  2. a b G.K. Robinson: That BLUP is a Good Thing: The Estimation of Random Effects. In: Statistical Science. 6, Nr. 1, 1991, S. 15–32. doi:10.1214/ss/1177011926.
  3. C. R. Henderson, Oscar Kempthorne, S. R. Searle and C. M. von Krosigk: The Estimation of Environmental and Genetic Trends from Records Subject to Culling. In: International Biometric Society (Hrsg.): Biometrics. 15, Nr. 2, 1959, S. 192–218. doi:10.2307/2527669.
  4. a b L. Dale Van Vleck: Charles Roy Henderson, April 1, 1911 – March 14, 1989. United States National Academy of Sciences. Abgerufen am 28. Mai 2012.
  5. Robert A. McLean, Sanders, William L.; Stroup, Walter W.: A Unified Approach to Mixed Linear Models. In: American Statistical Association (Hrsg.): The American Statistician. 45, Nr. 1, 1991, S. 54–64. doi:10.2307/2685241.
  6. ML Lindstrom, Bates, DM: Newton-Raphson and EM algorithms for linear mixed-effects models for repeated-measures data. In: JASA. 83, 1988, S. 1014–1021.
  7. Nan M. Laird, Ware, James H.: Random-Effects Models for Longitudinal Data. In: International Biometric Society (Hrsg.): Biometrics. 38, Nr. 4, 1982, S. 963–974. doi:10.2307/2529876. PMID 7168798.

Weiterführende Literatur[Bearbeiten]

  • Milliken, G. A., & Johnson, D. E. (1992). Analysis of messy data: Vol. I. Designed experiments. New York: Chapman & Hall.
  • West, B. T., Welch, K. B., & Galecki, A. T. (2007). Linear mixed models: A practical guide to using statistical software. New York: Chapman & Hall/CRC.