Cronbachs Alpha

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Cronbachs (Alpha) ist eine nach Lee Cronbach benannte Maßzahl für die interne Konsistenz einer Skala und bezeichnet das Ausmaß, in dem die Aufgaben bzw. Fragen einer Skala miteinander in Beziehung stehen (interrelatedness[1]). Es ist hingegen kein Maß für die Homogenität oder Eindimensionalität einer Skala. Cronbachs Alpha wird vor allem in den Sozialwissenschaften bzw. in der Psychologie verwendet – insbesondere bei der Testkonstruktion und -evaluation. Es wird angewendet, um die interne Konsistenz eines psychometrischen Instruments zu schätzen. In der jüngeren Literatur wird der Begriff Cronbachs abgelehnt und stattdessen der Begriff tau-äquivalente Reliabilität () vorgeschlagen.[2] Die tau-äquivalente Reliabilität ist u.a. in der Psychometrie von Bedeutung.

Geschichte[Bearbeiten | Quelltext bearbeiten]

Ein tau-äquivalentes Messmodell ist ein Spezialfall des hier abgebildeten kongenerischen Messmodells, bei dem alle Faktorladungen als identisch angenommen werden, d.h. .

Die erste Bezeichnung als Alpha geschah 1951 durch Cronbach, obwohl die Kuder-Richardsonsche Formel eine ältere Version für dichotome Items darstellt und Guttman die gleiche Maßzahl bereits 1945 unter dem Namen Lambda-3[3] entwickelt hatte. In jüngster Zeit wird die Verwendung von Cronbachs Alpha und des Begriffes zunehmend kritisiert. Cho (2016) schlägt vor, statt Cronbachs Alpha konsequent von tau-äquivalenter Reliabilität zu sprechen; Cho verdeutlicht zudem, dass statt in vielen Fällen eine Verwendung der kongenerischen Reliabilität angebracht ist (s. dort).[2]

Definition[Bearbeiten | Quelltext bearbeiten]

Geht man davon aus, dass eine Stichprobe hinsichtlich einer Gruppe von k Items untersucht wurde, dann ist Cronbachs definiert als die durchschnittliche Korrelation zwischen diesen Items, nach oben korrigiert um k durch die Spearman-Brown-Formel. Deshalb wird Cronbachs Alpha auch als Maß der internen Konsistenz einer Skala bezeichnet. Cronbachs hängt zusammen mit dem Ergebnis einer Varianzanalyse der Itemdaten hinsichtlich der Varianz zwischen den Testpersonen und der Varianz zwischen den Items. Je höher die proportionale Varianz zwischen den Testpersonen, desto höher ist auch Cronbachs .

Interpretation[Bearbeiten | Quelltext bearbeiten]

Faustregel zur Interpretation der Alpha Werte[4]
Bedeutung
> 0,9 exzellent
> 0,8 gut
> 0,7 akzeptabel
> 0,6 fragwürdig
> 0,5 schlecht
0,5 inakzeptabel

kann Werte zwischen minus unendlich und 1 annehmen (obwohl nur positive Werte sinnvoll interpretierbar sind). Als Faustregel sollte ein beliebiges psychometrisches Instrument nur verwendet werden, wenn ein Wert für von 0,65 oder mehr erreicht wird. Als kritisch wird allerdings auch ein zu hoher Wert (z. B. 0,95) eingeschätzt, da dies darauf hindeutet, dass mehrere Items redundant sind.[5] Bei kleineren Werten kann mittels einer Faktorenanalyse geprüft werden, ob sich die Items auf mehrere Faktoren verteilen.

Sehr häufig findet sich in wissenschaftlichen Arbeiten ein Verweis auf Nunnally (1978), wonach dieser angeblich vorgeschlagen habe, dass ein Wert von 0,7 oder mehr als akzeptabel gelte. Tatsächlich hat Nunnally jedoch sehr sorgsam die Verwendung des Koeffizienten diskutiert und keineswegs eine strenge Vorgabe gemacht.[6] Für ist daher zu beachten, dass sich strenge Regeln, die Messmodelle unterhalb eines Schwellwertes automatisch ablehnen und oberhalb eines Schwellwertes automatisch annehmen, in der Regel verbieten.[7] Die Tabelle in diesem Abschnitt kann daher nur als Anhaltspunkt dienen. Insbesondere sollten Indikatoren aufgrund eines niedrigen Wertes nicht vorschnell entfernt werden, da dies auf Kosten der Inhaltsvalidität gehen könnte.

Problematisch an derartigen Vorgaben ist zudem, dass die Reliabilität eines Instruments sehr leicht zuungunsten der Bandbreite erreicht werden kann. Dieses Problem wird auch als Bandbreiten-Fidelitätsdilemma oder Reliabilitäts-Validitäts-Dilemma bezeichnet. Je breiter und allgemeiner ein Instrument misst, umso mehr Chancen bestehen in der Regel, auch breite und entfernte Kriterien vorherzusagen. Auf der anderen Seite leidet durch die Breite die Reliabilität. Eine Lösung dieses Problems bietet in der Regel nur die Verlängerung des Tests.

Cronbachs Alpha wird oft fälschlicherweise als Beleg für Eindimensionalität einer Skala interpretiert. Eine Skala kann mehrdimensional sein und gleichwohl eine hohe innere Konsistenz, folglich also ein hohes Cronbachs Alpha, aufweisen. Beispiel wäre eine Skala, die Items zu Depression und Ängstlichkeit vermischt darbietet, also zweidimensional ist, und doch eine hohe Konsistenz hat.

Formel[Bearbeiten | Quelltext bearbeiten]

Die Formel zur Berechnung eines standardisierten Cronbachs lautet:

,

wobei die Anzahl der Komponenten (Items oder Subskalen) und die durchschnittliche Korrelation zwischen den Items bezeichnet. Alternativ ergibt sich Cronbachs aus

,

wobei die Anzahl der Komponenten (Items oder Subskalen), die Varianz der beobachteten Gesamttestscores und der Varianz in Komponente (Item, Subskala) ist. Für Likert-Skalen gilt in der Regel .

Beispiel[Bearbeiten | Quelltext bearbeiten]

Korrelation Klassik Jazz Oper Rap Heavy
Metal
Blues/
R&B
Klassik 1 0,29 0,51 0,03 0,01 0,21
Jazz 1 0,21 0,22 0,09 0,54
Oper 1 0,08 -0,04 0,19
Rap 1 0,30 0,17
Heavy Metal 1 0,09
Blues/R&B 1

Im General Social Survey 1993 wird mit nach verschiedenen Musikrichtungen gefragt mit den Antwortkategorien (1=Mag Musikrichtung, 2=Unentschieden, 3=Mag Musikrichtung nicht). Wird nun eine Skala Mag Musik als Summe der Einzelskalen für jede Musikrichtung gebildet, so ergibt sich

und

In diesem Fall wird die neue Skala meistens nicht als reliabel (zuverlässig) angesehen; dabei ist . Der Grund liegt darin, dass die Korrelationsmatrix mindestens zwei Subskalen zeigt: Klassik/Oper und Jazz/Blues/R&B, d. h. bei Anwendung von Cronbachs sollte man sicher sein, dass die Items wirklich nur eine Skala bilden (Überprüfung mit der Faktorenanalyse).

Alternative Formel[Bearbeiten | Quelltext bearbeiten]

Cho (2016) schlägt eine alternative Formel zur Berechnung der tau-äquivalenten Reliabilität vor. Diese Formel ist äquivalent zur vorhergehenden, führt somit zum gleichen Ergebnis:

Hierbei ist die Anzahl der Indikatoren (engl. items) des Messmodells, die durchschnittliche Kovarianz zwischen den Indikatoren und die Varianz des Testergebnisses. Vorteil dieser Formel ist, dass sie in das von Cho (2016) vorgestellte System aus Formeln eingebettet ist und einen Vergleich zu anderen Koeffizienten, etwa für die kongenerische Reliabilität, erleichtert. Die zuvor fehlende Systematik bei der Benennung ist zudem der Grund, warum Cho auf den Begriff „Cronbachs “ verzichtet und stattdessen von „tau-äquivalenter Reliabilität “ spricht. Beide Begriffe sind jedoch Synonyme.

Ein Rechenbeispiel sowohl für die traditionelle als auch alternative Formel findet sich in Tabelle 9 in Cho (2016).[2]

Berechnung von Cronbachs α mit gängiger Statistiksoftware[Bearbeiten | Quelltext bearbeiten]

Für die freie Statistiksoftware R gibt es mehrere Pakete, die Funktionen zur Berechnung von Cronbachs enthalten, z. B. multilevel::cronbach, psy::cronbach, psych::alpha und psychometric::alpha. Das R-Paket cocron[8] ist auch als freies Web-Interface verfügbar und erlaubt den statistischen Vergleich von zwei oder mehr abhängigen und unabhängigen Cronbach Alphas.

In SAS lautet die Kommandozeile proc corr data=variable1 variable2 … variablen alpha plots;.

In SPSS wählt man „Analysieren“, danach „Skalierung“ bzw. „Skala“, dann „Reliabilitätsanalyse“ an und wählt die gewünschten Variablen aus. Für diese wird dann Cronbachs Alpha berechnet. Der Syntaxbefehl seit Programmversion 17.0 lautet RELIABILITY VARIABLES=[VARIABLES] /MODEL=ALPHA..

Mit dem Programmpaket Stata lässt sich Cronbachs mit der Anweisung alpha varlist [if] [in] [, options] berechnen. Die Item-Test und Item-Rest Korrelationen werden durch Auswahl der Option item angegeben. Mit der Option generate(newvar) wird die ermittelte Skala als Variable gespeichert. Sollen die Items der Skala zuvor (auf den Mittelwert 0 und Varianz 1) standardisiert werden, so ist die Option std zusätzlich anzufügen.

Alternativen[Bearbeiten | Quelltext bearbeiten]

Cronbachs , oder besser die tau-äquivalente Reliabilität (), geht von gleichen Faktorladungen aller Indikatoren aus. Diese Voraussetzung wird in der Realität jedoch selten erfüllt, wodurch die Reliabilität unterschätzt wird. Eine Alternative zu , die unterschiedliche Faktorladungen explizit berücksichtigt, ist die kongenerische Reliabilität (), welche traditionell auch als „composite reliability“ bezeichnet wurde, einem Begriff der zuletzt jedoch kritisiert wurde.[2]

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Cortina, Jose M. (1993): What is Coefficient Alpha? Examination of Theory and Applications. In: Journal of Applied Psychology, 78(1), S. 98–104 (PDF; 1,2 MB).
  2. a b c d Cho (2016), http://dx.doi.org/10.1177/1094428116656239
  3. Louis Guttman: A basis for analyzing test–retest reliability. In: Psychometrika. 10, 1945, S. 255–282.
  4. Darren George, Paul Mallery: SPSS for Windows Step by Step: A Simple Guide and Reference, 11.0 Update. 4. Auflage. Allyn & Bacon, 2002, ISBN 978-0-205-37552-3, S. 231.
  5. D. L. Streiner: Starting at the beginning: An introduction to coefficient alpha and internal consistency In: Journal of Personality Assessment Ban 80, 2003, S. 99–103. DOI:10.1207/S15327752JPA8001_18
  6. Nunnally, J. C. (1978): Psychometric theory (2nd ed.). New York: McGraw-Hill.
  7. Guide & Ketokivi (2015), http://dx.doi.org/10.1016/S0272-6963(15)00056-X
  8. comparingcronbachalphas.org

Weblinks[Bearbeiten | Quelltext bearbeiten]

  • Berechnung in der SPSS-Syntax
  • Das freie Webinterface und R-Paket cocron erlaubt den statistischen Vergleich von zwei oder mehr abhängigen und unabhängigen Cronbach Alphas.
  • Das Handbook of Management Scales von Wikibooks sammelt betriebswirtschaftliche Konstrukte, deren Indikatoren und gibt Cronbachs Alpha an. (engl.)
  • RelCalc, Tools zur Berechnung der tauäquivalenten und kongenerischen Reliabilität sowie anderer Koeffizienten.