Klassische Testtheorie
Die Klassische Testtheorie (KTT) ist die meist verbreitete psychometrische Testtheorie. Der Schwerpunkt des Modells der klassischen Testtheorie liegt auf der Genauigkeit einer Messung bzw. auf der Größe des jeweiligen Messfehlers. Daher wird sie oft auch als Messfehlertheorie bezeichnet. Die klassische Testtheorie versucht zu klären, wie, ausgehend von einem Testwert einer Person, auf die wahre Ausprägung des zu messenden Persönlichkeitsmerkmals geschlossen werden kann.
Axiome
- Jeder Testwert () ist zusammengesetzt aus einem wahren Merkmalsanteil () und einem zufälligen Messfehleranteil (): .
- Der Erwartungswert, der Mittelwert und die Summe der Fehler haben den Wert Null: .
- Der Messfehler ist mit dem wahren Wert unkorreliert: .
- Wahrer Wert und Fehlerwert zweier verschiedener Tests sind unkorreliert: .
- Fehlerwerte von zwei verschiedenen Tests sind unkorreliert: .
Je größer der Messfehler desto geringer ist der wahre Merkmalsanteil und desto weniger zuverlässig misst ein Test.
Aus den ersten beiden Axiomen folgt zudem:
Dies besagt, dass der Messfehler verschwindet, wenn entweder ein Test an vielen Individuen angewandt wird oder ein Test mehrfach bei ein und derselben Person angewandt wird.
Reliabilität
Das zentrale Konzept der klassischen Testtheorie ist die Reliabilität, das ist die Zuverlässigkeit bzw. Genauigkeit (Freiheit von Messfehlern), mit der ein Testwert den wahren Wert erfasst. Die Reliabilität wird theoretisch als das Verhältnis der Varianz der wahren Werte zur Varianz der Testwerte definiert:
Reliabilität =
Die Reliabilität kann allerdings, da man die wahren Werte nicht kennt, nur geschätzt werden. Ein Verfahren dazu ist die Konstruktion von parallelen Tests, das sind Tests, von denen man annimmt, dass sie die gleichen wahren Werte messen. Die Reliabilität kann dann durch die Korrelation zweier paralleler Tests X1 und X2 geschätzt werden:
Geschätzte Reliabilität =
Vorteil
- Die Annahmen der klassischen Testtheorie sind einfach gehalten und daher leicht empirisch realisierbar.
Kritik
- Möglicherweise ist die Annahme zu grob, da verschiedene Arten von Fehlern berücksichtigt werden müssten. Hier bietet das erweiterte Latent-State-Trait-Modell (Steyer und andere) einen weiterführenden Ansatz
- Die Stichprobenabhängigkeit von Reliabilität, Itemschwierigkeit und Itemtrennschärfe wird in der KTT nicht oder nur ungenügend beachtet.
- Die Homogenität von Items kann im Rahmen der KTT nicht geprüft werden.
- Streng genommen ist Reliabilität das einzige Gütekriterium, das im Rahmen der KTT bestimmt werden kann. Die KTT sagt nichts über die Validität eines Tests.
- Grundsätzliche Probleme der klassischen Testtheorie bei der Veränderungsmessung: Die Tests der klassischen Testtheorie werden auf Grundlage der Stabilität der Merkmale (Retestreliabilität/Paralleltestreliabilität) konstruiert, damit steht die Forderung nach hoher Reliabilität im Widerspruch zur Veränderbarkeit der Merkmale.
Alternative psychometrische Modelle
Die Auswertung psychometrischer Daten kann auch durch Latent-Trait Theorien (z.B. Rasch-Modell) erfolgen. Diese können einige der Probleme, die mit der KTT einhergehen, lösen.
Literatur
- Gustav A. Lienert, Ulrich Raatz: Testaufbau und Testanalyse. 6. Auflage. BeltzPVU, Weinheim 1998, ISBN 3-621-27424-3
- Moosbrugger, H., Kelava, A.: Testtheorie und Fragebogenkonstruktion. Springer, Heidelberg 2007, ISBN 3540716343.
- Lord, F. M., Novick, M. R.: Statistical theories of mental test scores. Addison-Welsley, Reading, MA 1968, ISBN 978-0201043105.