Rasch-Modell

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Das Rasch-Modell ist ein mathematisch-psychologisches Modell der probabilistischen Testtheorie (oder Item-Response-Theorie), das vom dänischen Statistiker Georg Rasch entwickelt wurde.

Überblick[Bearbeiten]

Psychologische Tests (Fragebögen, Leistungstests) zur Messung psychischer Merkmale können auf verschiedenen Messmodellen basieren. Letztere unterscheiden sich darin, wie aus den Antworten auf die Items eines Tests auf die Ausprägung der Fähigkeiten bzw. Eigenschaften einer Person (z. B. Intelligenz oder Extraversion) geschlossen wird – und wie die Tests daraufhin konstruiert sein müssen. Zwei Modellarten bzw. -klassen sind vor allem zu unterscheiden, die Klassische Testtheorie (KTT) und die Probabilistische Testtheorie, die bestimmte Nachteile der klassischen Testtheorie überwinden will. Zu letzterer gehört auch das Rasch-Modell. Der Vorteil probabilistischer Modelle liegt darin, dass aus dem beobachteten Antwortverhalten auf zwei latente Variablen geschlossen wird, welche das Antwortverhalten determinieren: die Itemschwierigkeit und die Fähigkeit der Person. Ein Effekt ist, dass die Schätzung der Fähigkeit dann unabhängig von der Itemschwierigkeit erfolgen kann. Ein ähnliches Modell fand z. B. auch innerhalb der PISA-Studie Anwendung.

Wissenschaftlicher Hintergrund[Bearbeiten]

Itemfunktion des Rasch-Modells

Das Rasch-Modell postuliert im Vergleich zum Guttman-Modell keinen deterministischen Zusammenhang zwischen dem Testverhalten einer Versuchsperson und deren Personenparameter. Vielmehr wird ein zugrundeliegendes Persönlichkeitsmerkmal („Latent Trait“) angenommen, von dessen Ausprägung das manifeste Lösungsverhalten in probabilistischer Weise abhängt.

Die Wahrscheinlichkeit der Antwort von Person av bei Aufgabe xi ist bestimmt durch:

Modellgleichung:


p(X_{vi} = {1})=\frac{{\exp}{(\theta_v - \sigma_i)}}{1+{\exp}({\theta_v - \sigma_i})}

Likelihood:


p(X_{vi} = x_{vi})=\frac{{\exp}{(x_{vi}(\theta_v - \sigma_i))}}{1+{\exp}({\theta_v - \sigma_i})}

wobei Xvi eine Zufallsvariable ist, welche den Wert 1 annimmt, wenn die Person av die Aufgabe xi löst, und die den Wert 0 annimmt, wenn die Person av die Aufgabe nicht löst. θv ist die latente Fähigkeit der Person av, σi ist die Schwierigkeit der Aufgabe xi, \exp bezeichnet die natürliche Exponentialfunktion. Formal liegt hier ein Logitmodell vor, das die Anteile von 0 bzw. 1 in eine stetige Verteilung überführt.

Parameterschätzung[Bearbeiten]

Konfidenzintervalle für die geschätzten Personenparameter θv

Die Parameterschätzung erfolgt im Rasch-Modell über einen Maximum-Likelihood-Ansatz. Es gibt 3 Methoden zur Schätzung der Personen- und Aufgabenparameter:

  • Es kann eine gemeinsame Schätzung der Personen- und Aufgabenparameter erfolgen, dabei leidet allerdings die Konsistenz der Statistik[1].
  • Eine andere Methode ist die bedingte Maximum-Likelihood-Schätzung (auch Conditional Maximum-Likelihood-Methode[2]). Hierbei werden zunächst die Aufgabenparameter unter der bedingten Likelihood der Daten, gegeben die suffiziente Summenstatistik für den Personenparameter geschätzt und nachfolgend die unbedingten Maximum-Likelihood-Schätzer der Personenparameter.
  • Die dritte Methode ist die marginale Maximum-Likelihood-Schätzung bei der Annahmen über die Verteilung der Personenparameter in der Population getroffen werden.

Im Vergleich zur KTT kann im Rasch-Modell für jeden geschätzten Personenparameter θv ein individuelles Konfidenzintervall angegeben werden. Dieses wird eng, wenn für die jeweilige Personenfähigkeit θv mehrere Items Informationen liefern (Maximale Information gdw. θv = σi). Es wird breit bei wenig Items die für diesen Bereich Informationen liefern (i.d.R. ist dies bei extremen Ausprägungen der Fall).

Nutzen[Bearbeiten]

Im Rasch-Modell erfolgt eine Trennung des Einflusses der Personenfähigkeit θv vom Einfluss der Testaufgabe σi. Damit wird eine Messung gemäß der Messtheorie etabliert. Vergleiche von Personen (bzw. Aufgaben), die von den Aufgaben (bzw. Personen) unabhängig sind, werden möglich. Diese Eigenschaft wird von Rasch als „spezifische Objektivität“ bezeichnet. Weiterhin bildet das Rasch-Modell die Grundlage für adaptives Testen, da der Personenparameter nach jeder Aufgabe neu berechnet werden kann und dadurch entsprechend Items selektiert werden können, die maximale Information liefern. Ebenfalls etabliert wird eine Basis für Veränderungsmessungen. Die KTT setzt dagegen stabile Persönlichkeitsmerkmale voraus und ist aus psychometrischer Sicht dafür nicht konzipiert.

Modelltest[Bearbeiten]

Modelltest und Aufgabenselektion

Innerhalb des Rasch-Modells kann ein Modelltest durch die Schätzung der Aufgabenparameter σi in Teilstichproben erfolgen. Dies ist möglich, da die Schätzungen unabhängig von den eingehenden Personenparametern sind (siehe spezifische Objektivität). Hierzu kann man eine Stichprobe z. B. am Median splitten. Trägt man die erhaltenen Schätzwerte gegeneinander ab, so sollten sie auf einer Geraden durch den Nullpunkt mit Steigung 1 liegen. Die Abweichung von dieser Geraden kann im Rahmen der Testkonstruktion als Kriterium zur Aufgabenselektion genutzt werden (siehe Abbildung). Die Vorhersagen können auch durch einen Likelihood-Quotienten-Test (Andersen, 1973) statistisch geprüft werden. Bei optimaler Modellpassung nimmt dieser Quotient einen Wert von 1 an.

Literatur[Bearbeiten]

  • G. H. Fischer, I.W.Molenaar: Rasch Models. Foundations, Recent Developments, and Applications. Springer, New York 1995. ISBN 0387944990
  • E. B. Andersen: A goodness of fit test for the Rasch model. in: Psychometrika. New York 38.1973, 123-140. ISSN 0033-3123
  • S. Embretson, S. Reise: Item response theory for psychologists. Erlbaum, Mahwah NJ 2000. ISBN 0585347824
  • F. Gernot: Probabilistische Testmodelle in der Persönlichkeitsdiagnostik. Lang, Frankfurt am Main 1993. ISBN 3631460309
  • H. Irtel: Entscheidungs- und testtheoretische Grundlagen der Psychologischen Diagnostik. Lang, Frankfurt am Main 1996. ISBN 3-631-49374-6
  • Kempf, W. (1974). Dynamische Modelle zur Messung sozialer Verhaltenspositionen [Dynamic models for measuring social relationships]. In W. Kempf (Ed.), Probabilistische Modelle in de Sozialpsychologie [Probabilistic models in social psychology] (pp. 13-55). Bern: Huber.
  • Kempf, W. (1977a). A dynamic test model and its use in the micro-evaluation of instrumental material. In Spada, & W. Kempf, (Eds.), Structural models for thinking and learning (pp. 295-318). Bern: Huber.
  • Kempf, W. (1977b). Dynamic models for the measurement of ’traits’ in social behavior. In W. Kempf, B. H. Repp (Eds.), Mathematical models for social psychology (pp. 14-58). New York: Wiley.
  • Kempf, W., R. Langeheine (2012). Item-Response-Modelle in der sozialwissenschaftlichen Forschung. Berlin: regener. ISBN 978-3-936014-29-7
  • H. Müller: Summenscore und Trennschärfe beim Rasch-Modell. (Sum score and discrimination in the Rasch model). in: Psychologische Rundschau. Göttingen 51.2000, 34–35. ISSN 0033-3042
  • Matthias von Davier, Claus H. Carstensen (Hrsg.): Multivariate and Mixture Distribution Rasch Models. Extensions and Applications. Springer, Berlin 2006. ISBN 0-387-32916-1
  • G. Rasch: Probabilistic models for some intelligence and attainment tests. Danish Institute for Educational Research, Copenhagen 1960, expanded edition with foreword and afterword by B.D. Wright. The University of Chicago Press, Chicago 1980. ISBN 0226705536
  • J. Rost: Was ist aus dem Rasch-Modell geworden? in: Psychologische Rundschau. Göttingen 50.1999, 140–156. ISSN 0033-3042
  • J. Rost: Testtheorie - Testkonstruktion. Huber, Göttingen 2003. ISBN 3456839642

Einzelnachweise[Bearbeiten]

  1. Amelang, M. & Schmidt-Atzert, L. (2006). Psychologische Diagnostik und Intervention (S. 75). Springer: Heidelberg.
  2. Amelang

Weblinks[Bearbeiten]

Etliche Software-Pakete sind auf dem Markt. Einige ausführbare Programme sind frei erhältlich, zum Teil allerdings nur als Demo-Version mit reduziertem Leistungsumfang. Auch Open_Source-Software ist verfügbar.