Likert-Skala

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Likert-Skala (nach Rensis Likert) ist ein Verfahren zur Messung persönlicher Einstellungen, die mittels so genannter Items abgefragt werden. Die Items sind positiv oder negativ formulierte Aussagen über einen Sachverhalt, zu dem die Befragten Zustimmung oder Ablehnung in mehreren, vorgegebenen Abstufungen äußern können. Die vorgegebenen Antwortmöglichkeiten sind so konstruiert, dass der „Abstand“ zwischen den Antwortmöglichkeiten möglichst gleich ist (Äquidistanz).

Konstruktion[Bearbeiten]

Grundidee[Bearbeiten]

Die methodische Überlegung ist folgende: Man interessiert sich für die Einstellung der Versuchsperson, ein bestimmtes Objekt betreffend. Alle dazugehörigen Items werden als strikt positive oder negative Aussagen formuliert. Der Likert-Skala liegt die Überlegung zu Grunde, dass die Versuchsperson die Aussage eines Items umso mehr ablehnt, je weiter ihre Einstellung von der Formulierung des Items abweicht. In der Gesamtheit werden dann die Antworten auf den Grad der Einstellung abgebildet. Man erhofft sich durch diese Vorgehensweise eine methodisch haltbare Messung der Einstellung.

In der konkreten Ausführung eines Fragebogens bilden die Antwortmöglichkeiten für ein Item den Grad der Zustimmung oder Ablehnung der befragten Person zur Aussage des Items ab. Die möglichen Antworten sind als natürliche Zahlen kodiert und aufsteigend angeordnet.

Antworten auf einer Likert-Skala sind formal ordinal- beziehungsweise rangskaliert, da nicht notwendigerweise angenommen werden kann, dass Testteilnehmer die verschiedenen Antwortmöglichkeiten als äquidistant wahrnehmen. Als Ordinalskala kann das Ergebnis für ein Likert-Skala-Item durch den Median oder Modus als Lageparameter zusammengefasst werden, nicht aber durch den arithmetischen Mittelwert, da dieser eine Intervallskala voraussetzt. siehe auch Skalenniveau#Ordinalskala

Ziel der Konstruktion einer Likert-Skala ist es jedoch, die Konstruktion von Item und Antwortmöglichkeiten so zu gestalten, dass eine Annäherung an die Äquidistanzforderung erreicht wird. Die Antwortmöglichkeiten werden daher meist symmetrisch formuliert (stimme vollständig zu, stimme eher zu, lehne weder ab noch stimme zu, lehne eher ab, lehne vollständig ab). Zudem wird ggf. auch durch eine Abbildung einer Skala mit dem eingezeichneten Antwortmöglichkeiten die Wahrnehmung einer äquidistanten Skala unterstützt.

In der Praxis werden solche Likert-Skalen als Intervallskalen verwendet. In der Fragebogen- und Testpraxis wird aus pragmatischen Gründen (leichte Verfügbarkeit vieler parametrischer Tests) und aus testtheoretischen Gründen (in der Regel höhere Teststärke bei parametrischen Verfahren) sogar das metrische Skalenniveau angenommen.

siehe auch: Rating-Skala

Eine Likert-Skala besteht in der Regel nicht aus einem einzelnen, sondern aus mehreren Items, die sich häufig in Skalen aufteilen und zusammen einen Fragebogen bilden.

Geradzahlige oder ungeradzahlige Skalen?[Bearbeiten]

Es ist eine gerade Zahl der Antwortmöglichkeiten ebenso gebräuchlich wie eine ungerade Zahl. Letztere wird verwendet, wenn eine mittlere Ausprägung (neutral bzw. „weder-noch“) sinnvoll ist. Eine gerade Anzahl zwingt zur Entscheidung nach einer Seite. Diese Praxis nennt man Forced Choice.

Skalenkonstruktion[Bearbeiten]

Es ist üblich, in einer quantitativen Pilotstudie eine große Anzahl von Items (Aussagen) zu testen. Items werden als ungeeignet angesehen, wenn sie zu wenige Unterschiede zwischen den Befragten aufzeigen. Ein Mangel ist es beispielsweise, wenn mehr als 80% der Befragten einem Item maximal zustimmen (Ceiling-Effekt) oder es maximal ablehnen (Floor-Effekt). Solche Items werden oft aussortiert.

Man kann weitere Items aufgrund zu geringer oder negativer Korrelation mit dem Gesamttestwert aussortieren, um zu einer möglichst eindimensionalen Skala zu kommen (siehe Cronbachs Alpha).

Anwendungsgebiete[Bearbeiten]

Verwendung finden Likert-Skalen in Fragebogenerhebungen insbesondere in der empirischen Sozial-, Markt- und Wahlforschung und der Psychologie.

Beispiel[Bearbeiten]

Angenommen, es soll die Einstellung zu Off-Road-Autos gemessen werden. Aufgrund theoretischer Überlegungen werden dazu unter anderem folgende Items verwendet:

  • Item 1: Off-Road-Autos werden überwiegend von Angebern gefahren.
  • Item 2: Frauen fühlen sich in Off-Road-Autos geschützt.

Antwortmöglichkeiten (zugeordnete Codes):

  • Variante 1: trifft zu (1), trifft eher zu (2), teils-teils (3), trifft eher nicht zu (4), trifft nicht zu (5)
  • Variante 2: trifft zu (1), trifft eher zu (2), trifft eher nicht zu (3), trifft nicht zu (4)

Eine Aussage und die auf der Antwortskala gewählte Zahl stellen somit einen Indikator für die Einstellung dar. Ziel ist es, eine konsistente und trennscharfe Finalskala beziehungsweise Itemmenge zu bilden, mit der ein möglichst valides (gültiges) Ergebnis zur untersuchten Fragestellung erzielt werden kann.

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

  • Jürgen Rost: Lehrbuch Testtheorie, Testkonstruktion. Huber, Bern u. a. 1996, ISBN 3-456-82480-7
  • Naresh K. Malhotra: Marketing Research. Prentice-Hall, Upper Saddle River/NJ 1999, ISBN 0-13-242801-6
  • Donald R. Lehmann, Sunil Gupta, Joel H. Steckel: Marketing Research. Addison-Wesley, Reading, Mass. u.a. 1998, ISBN 0-321-01416-2

Weblinks[Bearbeiten]

 Wikibooks: Handbook of Management Scales (engl.) – Lern- und Lehrmaterialien