„Modus (Statistik)“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
linkfix
zu großen teilen neu geschrieben
Zeile 1: Zeile 1:
{{Dieser Artikel|beschreibt die Kennzahl von Stichproben. Für den Modus einer Wahrscheinlichkeitsverteilung siehe [[Modus (Stochastik)]], weitere Bedeutungen sind unter [[Modus]] zu finden.}}
{{Dieser Artikel|beschreibt die Kennzahl von Stichproben. Für den Modus einer Wahrscheinlichkeitsverteilung siehe [[Modus (Stochastik)]], weitere Bedeutungen sind unter [[Modus]] zu finden.}}
Als '''Modus''' oder '''Modalwert''' bezeichnet man in der [[deskriptive Statistik|deskriptiven Statistik]] einen [[Lageparameter (Deskriptive Statistik)|Lageparameter]] einer [[Häufigkeitsverteilung]]. Er gibt an, welcher Wert am häufigsten in der Stichprobe vorkommt.
Der '''Modus''', auch '''Modalwert''' genannt,<ref name="Cleff37" /> ist ein [[Lageparameter (Deskriptive Statistik)|Lageparameter]] in der [[deskriptive Statistik|deskriptiven Statistik]]. Er ist der häufigste Wert, der in der Stichprobe vorkommt und hat im Gegensatz zu anderen Lagemaßen den Vorteil, dass er immer existiert. Jedoch ist er im Allgemeinen nicht eindeutig. Werden beispielsweise Klausurnoten einer Schulklasse erhoben, so wäre der Modus diejenige Note oder diejenigen Noten, die am häufigsten vergeben wurden.


== Definition ==
== Existenz und Eindeutigkeit ==
Jede Merkmalsausprägung, die in einer Stichprobe am häufigsten vorkommt heißt ein Modus der Stichprobe.<ref name="Bosch20" /> Damit ist ein Modus genau ein Gipfel der entsprechenden [[Häufigkeitsverteilung]].<ref name="Kosfeld68" />
[[Bild:Cauchy pdf.svg|thumb| Die Dichtefunktion der [[Cauchy-Verteilung]]. Der Erwartungswert der Verteilung existiert nicht, der Modus ist <math> x_0 </math>]]
[[Bild:ZweigipfligeVerteilung.png|thumb|Beispiel für Verteilungen mit einem oder zwei Modi.]]


Als Notationen für den Modus finden sich meist <math> D </math> oder <math> \overline x_M </math>
Im Gegensatz zum [[Erwartungswert]] ist der Modus ein Lagemaß, das immer existiert. Allerdings ist es nicht immer eindeutig. Hat zum Beispiel die [[statistische Variable]] oder [[Zufallsvariable]] mindestens [[Ordinalskala|ordinales Skalenniveau]], so kann die Häufigkeitsverteilung, Wahrscheinlichkeitsfunktion oder Dichtefunktion auch mehrere voneinander getrennte Maxima (Modi oder Modalwerte) besitzen. Je nach der Anzahl der Modi findet man eine unimodale (nur ein Maximum), [[Bimodale Verteilung|bimodale]] bzw. zweigipflige (genau zwei Maxima) oder multimodale bzw. mehrgipflige Verteilung (mehr als zwei Maxima).


== Skalen-Abhängigkeit ==
== Beispiele ==
=== Nominalskala ===
Für die Bestimmung des Modus genügt [[Nominalskala|nominales Skalenniveau]], wohingegen zum Beispiel für den [[Median]] eine [[Ordinalskala]] und für die Berechnung des [[Arithmetisches Mittel|arithmetischen Mittels]] eine [[Intervallskala]] Voraussetzung ist.
Gegeben sei die Stichprobe
:<math>(\text{Zebra},\text{Elefant},\text{Giraffe},\text{Zebra},\text{Giraffe},\text{Antilope}) </math>


Es Treten die Merkmalsausprägungen <math> \text{Zebra},\text{Elefant},\text{Giraffe} </math> und <math> \text{Antilope} </math> auf. Dabei tritt <math> \text{Antilope} </math> einmal auf, ebenso wie <math> \text{Elefant} </math>. Sowohl <math>\text{Zebra} </math> als auch <math> \text{Giraffe} </math> treten zweimal auf. Des weiteren gibt es kein Merkmal, das dreimal oder öfters auftritt. Also ergeben sich also Modi
== Charakterisierung der Neigung ==
:<math> D_1= \text{Zebra} </math>
In Beobachtungsreihen mit ordinal- und metrisch skalierten Merkmalen kann der Modalwert als Dichtemittel bezeichnet werden. Im Vergleich mit Median und arithmetischem Mittel kann der Modus die Neigung der Verteilung – ähnlich der statistischen [[Schiefe (Statistik)|Schiefe]] – charakterisieren.<ref name=Wirtz2008>{{Literatur |Autor=Markus Wirtz, Christof Nachtigall|Jahr=2008 |Titel=Deskriptive Statistik – Statistische Methoden für Psychologen|Auflage=5. |Verlag=Juventa}}</ref>
Die Modus-Schiefe nach [[Karl Pearson]] ist zum Beispiel definiert als


und
:<math> \frac{\text{Arithmetisches Mittel} - \text{Modus}}{\text{Standardabweichung}}</math>.
:<math> D_2= \text{Giraffe} </math>


=== Ordinalskala ===
Folgende [[Faustregel]] setzt Modus, Median und arithmetisches Mittel in Beziehung:<ref>[http://www.amstat.org/publications/jse/v13n2/vonhippel.html Paul T. von Hippel: ''Mean, Median, and Skew: Correcting a Textbook Rule.'' Journal of Statistics Education Volume 13, Number 2, 2005.] </ref>
Bei einer Klassenarbeit wurden die Noten
:<math> (\text{befriedigend}, \;\text{sehr gut}, \; \text{befriedigend},\;\text{gut},\;\text{gut},\; \text{ausreichend},\;\text{befriedigend},\; \text{ungenügend},\;\text{gut}) </math>


vergeben. Die Noten <math>\text{sehr gut}, \;\text{ausreichend} </math> und <math> \text{ungenügend} </math> wurden jeweils einmal vergeben, die Note <math> \text{befriedigend} </math> zweimal und die Note <math> \text{gut} </math> dreimal. Keine weitere Note wurde viermal vergeben, also ist der Modus
* rechtsschiefe (linkssteile) Häufigkeitsverteilung: Modus < Median < arithmetisches Mittel
:<math> D= \text{gut} </math>.
* linksschiefe (rechtssteile) Häufigkeitsverteilung: Modus > Median > arithmetisches Mittel
* unimodale symmetrische Häufigkeitsverteilung: Modus &asymp; Median &asymp; arithmetisches Mittel


== Erkenntnisgewinn ==
=== Kardinalskala ===
Betrachtet man die Stichprobe
[[File:exponential pdf.svg|thumb|Die Wahrscheinlichkeitsdichte der Exponentialverteilung. Unabhängig vom Parameter <math> \lambda </math> ist der Modus immer 0.]]
:<math> (1,1,1,2,10,11,12,67,72) </math>
Bei Verteilungen, die mittels monotoner Dichtefunktionen, wie der [[Exponentialfunktion]], beschrieben werden können, unterlässt man die Angabe des Modus, weil dies keinen Erkenntnisgewinn mit sich bringt.


So kommen alle Werte bis auf die <math> 1 </math> jeweils nur einmal vor, die <math> 1 </math> jedoch dreimal. Also ist der Modus
== Beispiele ==
:<math> D=1 </math>


== Eigenschaften und Vergleich ==
* Beispiel mit ''einer'' häufigsten Ausprägung:
Der Modus ist immer definiert, allerdings auch im Allgemeinen nicht eindeutig. Beides zeigt das Beispiel unter [[#Nominalskala]]: Keines der gängigen Lagemaße ist in solch einem Allgemeinen Rahmen anwendbar, jedoch treten bei dieser Stichprobe zwei Modi auf. Der Extremfall tritt ein, wenn alle Merkmalsausprägungen in der Stichprobe voneinander verschieden sind. Dann tritt jede nur einmal auf und damit ist jede auch ein Modus.


Bei Stichproben mit Ordnungsstruktur lässt sich zusätzlich zum Modus noch der [[Median]] definieren. Die beiden müssen nicht übereinstimmen, so wäre im Beispiel unter [[#Ordinalskala]] der Median
:<math>\{1, 1, 1, 1, 2, 2, 2, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5\}</math>
:<math>M= \text{befriedigend} </math>,


wohingegen der Modus als
:Bei dieser unimodalen Verteilung ist die häufigste Ausprägung 4 (9 Beobachtungen). Damit ist der Modus 4.
:<math>D= \text{gut} </math> bestimmt wurde.


Bei vorliegen einer Kardinalskala kann zusätzlich noch das [[arithmetisches Mittel|arithmetische Mittel]] bestimmt werden. Modus, Median und arithmetisches Mittel können jedoch weit auseinanderliegen. So ist der Modus im Beispiel unter [[#Kardinalskala]] als
* Beispiel mit ''mehreren'' häufigsten Ausprägungen:
:<math> D= 1 </math>


bestimmt worden. Für den Median ergibt sich
: <math>\{1, 2, 2, 3, 4, 5, 5, 6, 7\}</math>
:<math> m=10 </math>


und für das arithmetische Mittel
: Diese Häufigkeitsverteilung besitzt zwei Modi, 2 und 5, jeweils mit der Häufigkeit 2. Eine solche Verteilung heißt auch [[bimodal]].
:<math> \overline x = 19{,}97</math>.

== Aufbauende Begriffe ==
Häufigkeitsverteilungen mit zwei oder mehr Modi weden als [[Multimodale Verteilung]]en bezeichnet. Dabei werden Verteilungen mit zwei Modi als [[Bimodale Verteilung|bimodal]] bezeichnet. Verteilungen mit lediglich einem Modus werden [[Unimodale Verteilung|unimodal]]genannt.

== Charakterisierung der Neigung ==
In Beobachtungsreihen mit ordinal- und metrisch skalierten Merkmalen kann der Modalwert als Dichtemittel bezeichnet werden. Im Vergleich mit Median und arithmetischem Mittel kann der Modus die Neigung der Verteilung – ähnlich der statistischen [[Schiefe (Statistik)|Schiefe]] – charakterisieren.<ref name="Wirtz2008" />
Die Modus-Schiefe nach [[Karl Pearson]] ist zum Beispiel definiert als

:<math> \frac{\text{Arithmetisches Mittel} - \text{Modus}}{\text{Standardabweichung}}</math>.

Folgende [[Faustregel]] setzt Modus, Median und arithmetisches Mittel in Beziehung:<ref name="Hippel" />

* rechtsschiefe (linkssteile) Häufigkeitsverteilung: Modus < Median < arithmetisches Mittel
* linksschiefe (rechtssteile) Häufigkeitsverteilung: Modus > Median > arithmetisches Mittel
* unimodale symmetrische Häufigkeitsverteilung: Modus &asymp; Median &asymp; arithmetisches Mittel


==Einzelnachweise==
== Einzelnachweise ==
<references />
<references>
<ref name="Cleff37" > {{Literatur |Autor=Thomas Cleff |Titel=Deskriptive Statistik und Explorative Datenanalyse |TitelErg=Eine computergestützte Einführung mit Excel, SPSS und STATA |Auflage=3., überarbeitete und erweiterte |Verlag=Springer Gabler |Ort=Wiesbaden |Datum=2015 |ISBN=978-3-8349-4747-5 |Seiten=37|DOI=10.1007/978-3-8349-4748-2}} </ref>
<ref name="Bosch20" > {{Literatur |Autor=Karl Bosch |Titel=Elementare Einführung in die angewandte Statistik |Auflage=8. |Verlag=Vieweg |Ort=Wiesbaden |Datum=2005|Seiten=20}} </ref>
<ref name="Kosfeld68" > {{Literatur |Autor=Reinhold Kosfeld, Hans Friedrich Eckey, Matthias Türck |Titel=Deskriptive Statistik |TitelErg=Grundlagen – Methoden – Beispiele – Aufgaben |Auflage=6. |Verlag=Springer Gabler |Ort=Wiesbaden |Datum=2016 |ISBN=978-3-658-13639-0 |Seiten=68|DOI=10.1007/978-3-658-13640-6}} </ref>
<ref name="Wirtz2008" >{{Literatur |Autor=Markus Wirtz, Christof Nachtigall|Jahr=2008 |Titel=Deskriptive Statistik – Statistische Methoden für Psychologen|Auflage=5. |Verlag=Juventa}}</ref>
<ref name="Hippel" >[http://www.amstat.org/publications/jse/v13n2/vonhippel.html Paul T. von Hippel: ''Mean, Median, and Skew: Correcting a Textbook Rule.'' Journal of Statistics Education Volume 13, Number 2, 2005.] </ref>
</references>


[[Kategorie:Deskriptive Statistik]]
[[Kategorie:Deskriptive Statistik]]

Version vom 23. April 2017, 09:11 Uhr

Der Modus, auch Modalwert genannt,[1] ist ein Lageparameter in der deskriptiven Statistik. Er ist der häufigste Wert, der in der Stichprobe vorkommt und hat im Gegensatz zu anderen Lagemaßen den Vorteil, dass er immer existiert. Jedoch ist er im Allgemeinen nicht eindeutig. Werden beispielsweise Klausurnoten einer Schulklasse erhoben, so wäre der Modus diejenige Note oder diejenigen Noten, die am häufigsten vergeben wurden.

Definition

Jede Merkmalsausprägung, die in einer Stichprobe am häufigsten vorkommt heißt ein Modus der Stichprobe.[2] Damit ist ein Modus genau ein Gipfel der entsprechenden Häufigkeitsverteilung.[3]

Als Notationen für den Modus finden sich meist oder

Beispiele

Nominalskala

Gegeben sei die Stichprobe

Es Treten die Merkmalsausprägungen und auf. Dabei tritt einmal auf, ebenso wie . Sowohl als auch treten zweimal auf. Des weiteren gibt es kein Merkmal, das dreimal oder öfters auftritt. Also ergeben sich also Modi

und

Ordinalskala

Bei einer Klassenarbeit wurden die Noten

vergeben. Die Noten und wurden jeweils einmal vergeben, die Note zweimal und die Note dreimal. Keine weitere Note wurde viermal vergeben, also ist der Modus

.

Kardinalskala

Betrachtet man die Stichprobe

So kommen alle Werte bis auf die jeweils nur einmal vor, die jedoch dreimal. Also ist der Modus

Eigenschaften und Vergleich

Der Modus ist immer definiert, allerdings auch im Allgemeinen nicht eindeutig. Beides zeigt das Beispiel unter #Nominalskala: Keines der gängigen Lagemaße ist in solch einem Allgemeinen Rahmen anwendbar, jedoch treten bei dieser Stichprobe zwei Modi auf. Der Extremfall tritt ein, wenn alle Merkmalsausprägungen in der Stichprobe voneinander verschieden sind. Dann tritt jede nur einmal auf und damit ist jede auch ein Modus.

Bei Stichproben mit Ordnungsstruktur lässt sich zusätzlich zum Modus noch der Median definieren. Die beiden müssen nicht übereinstimmen, so wäre im Beispiel unter #Ordinalskala der Median

,

wohingegen der Modus als

bestimmt wurde.

Bei vorliegen einer Kardinalskala kann zusätzlich noch das arithmetische Mittel bestimmt werden. Modus, Median und arithmetisches Mittel können jedoch weit auseinanderliegen. So ist der Modus im Beispiel unter #Kardinalskala als

bestimmt worden. Für den Median ergibt sich

und für das arithmetische Mittel

.

Aufbauende Begriffe

Häufigkeitsverteilungen mit zwei oder mehr Modi weden als Multimodale Verteilungen bezeichnet. Dabei werden Verteilungen mit zwei Modi als bimodal bezeichnet. Verteilungen mit lediglich einem Modus werden unimodalgenannt.

Charakterisierung der Neigung

In Beobachtungsreihen mit ordinal- und metrisch skalierten Merkmalen kann der Modalwert als Dichtemittel bezeichnet werden. Im Vergleich mit Median und arithmetischem Mittel kann der Modus die Neigung der Verteilung – ähnlich der statistischen Schiefe – charakterisieren.[4] Die Modus-Schiefe nach Karl Pearson ist zum Beispiel definiert als

.

Folgende Faustregel setzt Modus, Median und arithmetisches Mittel in Beziehung:[5]

  • rechtsschiefe (linkssteile) Häufigkeitsverteilung: Modus < Median < arithmetisches Mittel
  • linksschiefe (rechtssteile) Häufigkeitsverteilung: Modus > Median > arithmetisches Mittel
  • unimodale symmetrische Häufigkeitsverteilung: Modus ≈ Median ≈ arithmetisches Mittel

Einzelnachweise

  1. Thomas Cleff: Deskriptive Statistik und Explorative Datenanalyse. Eine computergestützte Einführung mit Excel, SPSS und STATA. 3., überarbeitete und erweiterte Auflage. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5, S. 37, doi:10.1007/978-3-8349-4748-2.
  2. Karl Bosch: Elementare Einführung in die angewandte Statistik. 8. Auflage. Vieweg, Wiesbaden 2005, S. 20.
  3. Reinhold Kosfeld, Hans Friedrich Eckey, Matthias Türck: Deskriptive Statistik. Grundlagen – Methoden – Beispiele – Aufgaben. 6. Auflage. Springer Gabler, Wiesbaden 2016, ISBN 978-3-658-13639-0, S. 68, doi:10.1007/978-3-658-13640-6.
  4. Markus Wirtz, Christof Nachtigall: Deskriptive Statistik – Statistische Methoden für Psychologen. 5. Auflage. Juventa, 2008.
  5. Paul T. von Hippel: Mean, Median, and Skew: Correcting a Textbook Rule. Journal of Statistics Education Volume 13, Number 2, 2005.