Arithmetisches Mittel

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Das arithmetische Mittel (auch Durchschnitt) ist in der Mathematik derjenige Mittelwert, der als Quotient aus der Summe der betrachteten Zahlen und ihrer Anzahl berechnet wird. In der Statistik stellt das arithmetische Mittel einen Lageparameter dar und wird als arithmetisches Mittel einer Stichprobe auch empirischer Mittelwert genannt.[1] Die wichtigste Eigenschaft des arithmetischen Mittels ist die Optimalitätseigenschaft, die besagt, dass die Summe der Quadrate der Abweichungen aller Daten vom Mittelwert kleiner ist als die Summe der Quadrate der Abweichungen von einem beliebigen anderem Wert.

Definition[Bearbeiten | Quelltext bearbeiten]

Die Hälfte der Summe zweier Größen und ist gegeben durch:

.

Da die Größen eine arithmetische Folge bilden, wird die Merkmalssumme der Merkmalsausprägungen dividiert durch die Anzahl der Merkmalsträger

als „arithmetisches Mittel“ (lies: quer) bezeichnet. Wird das arithmetische Mittel nicht gewichtet (siehe auch Abschnitt Gewichtetes arithmetisches Mittel), dann wird es auch als einfaches arithmetisches mittel oder ungewichtetes arithmetisches Mittel bezeichnet.

Zum Beispiel ist das arithmetische Mittel der beiden Zahlen und :

.

Das arithmetische Mittel beschreibt das Zentrum einer Verteilung durch einen numerischen Wert und stellt somit einen Lageparameter dar. Das arithmetische Mittel ist sinnvoll für beliebige metrische Merkmale definiert. Im Allgemeinen ist es für qualitative Merkmale nicht geeignet, jedoch liefert es für dichotome Merkmale mit zwei Kategorien und eine sinnvolle Interpretation. In diesem Fall ist das arithmetische Mittel identisch mit der relativen Häufigkeit .[2] Gelegentlich wird zur Bezeichnung des arithmetischen Mittels auch das Durchschnittszeichen ⌀ verwendet. Das arithmetische Mittel ist im Gegensatz zum empirischen Median sehr anfällig gegenüber Ausreißern (siehe Median). Das arithmetische Mittel kann als „Mittelpunkt“ der Messwerte interpretiert werden. Es gibt jedoch keine Auskunft darüber, wie stark die Messwerte um das arithmetische Mittel streuen. Dieses Problem kann mit der Einführung der „mittleren quadratischen Abweichung“ vom arithmetischen Mittel, der empirischen Varianz, behoben werden.

Definition für Häufigkeitsdaten[Bearbeiten | Quelltext bearbeiten]

Für Häufigkeitsdaten mit den Ausprägungen und den dazugehörigen relativen Häufigkeiten ergibt sich das arithmetische Mittel als[3]

.

Arithmetisches Mittel bei Schichtenbildung[Bearbeiten | Quelltext bearbeiten]

Bei vorliegen einer geschichteten Stichprobe, deren arithmetischen Mittel in Schichten bekannt sind lässt sich das arithmetische Mittel für die Gesamterhebung berechnen. Es sei eine Erhebungsgesamtheit mit Merkmalsträgern in Schichten mit der jeweiligen Anzahl an Merkmalsträgern und arithmetischen Mitteln eingeteilt. Das arithmetische Mittel in ist dann definiert durch[4]

.

Eigenschaften[Bearbeiten | Quelltext bearbeiten]

Ersatzwerteigenschaft[Bearbeiten | Quelltext bearbeiten]

Direkt aus der Definition des arithmetischen Mittels folgt, dass

.

Wenn man das arithmetische Mittel mit dem Stichprobenumfang multipliziert, dann erhält man die Merkmalssumme.[5] Diese Rechenregel wird als Ersatzwerteigenschaft oder Hochrechnungseigenschaft bezeichnet und oft bei mathematischen Beweisen verwendet. Sie kann wie folgt interpretiert werden: Die Summe aller Einzelwerte kann man sich ersetzt denken durch gleiche Werte von der Größe des arithmetischen Mittels.

Schwerpunkteigenschaft[Bearbeiten | Quelltext bearbeiten]

Die Abweichungen der Messwerte vom Mittwert

werden auch als „scheinbare Fehler“ bezeichnet. Die Schwerpunkteigenschaft (auch Nulleigenschaft genannt) besagt, dass die Summe der scheinbaren Fehler bzw. die Summe der Abweichungen aller beobachteten Messwerte vom arithmetischen Mittel gleich Null ist, also

beziehungsweise im Häufigkeitsfall .

Dies lässt sich mithilfe der Ersatzwerteigenschaft wie folgt zeigen:

Die Schwerpunkteigenschaft spielt für das Konzept der Freiheitsgrade eine große Rolle. Aufgrund der Schwerpunkteigenschaft des arithmetischen Mittels ist die letzte Abweichung bereits durch die ersten bestimmt. Folglich variieren nur Abweichungen frei und man mittelt deshalb, z.B. bei der empirischen Varianz, indem man durch die Anzahl der sogenannten Freiheitsgrade dividiert.[6]

Optimalitätseigenschaft[Bearbeiten | Quelltext bearbeiten]

In der Statistik ist man oft daran interessiert die Summe der quadratischen Abweichungen zu minimieren. Wenn man das Zentrum durch einen Wert auf der horizontalen Achse festlegen will, der die Summe der quadratischen Abweichungen

zwischen Daten und Zentrum minimiert, dann ist der minimierende Wert. Daraus ergibt sich die folgende Optimalitätseigenschaft (auch Minimierungseigenschaft genannt):

, für alle [7] oder anders ausgedrückt [8]

Die Summe der Quadrate der Abweichungen aller Daten vom Mittelwert ist kleiner als die Summe der Quadrate der Abweichungen von einem beliebigen anderem Wert. Dieses Resultat kann durch einfaches Ableiten der Funktion nach gezeigt werden:

.

Dies ist ein Minimum, da ebenfalls die hinreichende Bedingung für ein Minimum erfüllt ist.

Lineare Transformationseigenschaft[Bearbeiten | Quelltext bearbeiten]

Je nach Skalenniveau ist das arithmetische Mittel äquivariant gegenüber speziellen Transformationen. Es gilt für die lineare Transformation [9]

,

da

.

Dreiecksungleichungen[Bearbeiten | Quelltext bearbeiten]

Für das arithmetische Mittel gilt die folgende Dreiecksungleichung: Das arithmetische Mittel von positiven Merkmalsausprägungen ist größer oder gleich dem geometrischen Mittel dieser Merkmalsausprägungen, also

.

Die Gleichheit ist nur gegeben, wenn alle Merkmalsausprägungen gleich sind. Weiterhin gilt für den Absolutbetrag des arithmetischen Mittels mehrerer Merkmalsausprägungen, dass er kleiner oder gleich dem quadratischen Mittel ist

.[10]

Beispiele[Bearbeiten | Quelltext bearbeiten]

Einfache Beispiele[Bearbeiten | Quelltext bearbeiten]

  • Das arithmetische Mittel aus 50 und 100 ist
  • Das arithmetische Mittel aus 8, 5 und -1 ist

Anwendungsbeispiel[Bearbeiten | Quelltext bearbeiten]

Ein Auto fährt eine Stunde lang 100 km/h und die darauf folgende Stunde 200 km/h. Mit welcher konstanten Geschwindigkeit muss ein anderes Auto fahren, um denselben Weg ebenfalls in zwei Stunden zurückzulegen?

Der Weg , den das erste Auto insgesamt zurückgelegt hat, beträgt

und der des zweiten Autos

wobei die Geschwindigkeit des zweiten Autos ist. Aus ergibt sich

und damit

Gewichtetes arithmetisches Mittel[Bearbeiten | Quelltext bearbeiten]

Es lässt sich auch ein gewichtetes arithmetisches Mittel definieren (auch als gewogenes arithmetisches Mittel bezeichnet). Es erweitert den Anwendungsbereich des einfachen arithmetischen Mittels auf Werte mit unterschiedlicher Gewichtung. Ein Beispiel ist die Berechnung einer Schulnote, in die mündliche und schriftliche Leistungen unterschiedlich stark einfließen.

Deskriptive Statistik[Bearbeiten | Quelltext bearbeiten]

Das gewichtete Mittel wird beispielsweise verwendet, wenn man Mittelwerte , aus Stichproben der gleichen Grundgesamtheit mit verschiedenen Stichprobenumfängen miteinander kombinieren will:

.

Wahrscheinlichkeitsrechnung[Bearbeiten | Quelltext bearbeiten]

Stichprobenmittel[Bearbeiten | Quelltext bearbeiten]

Hauptartikel: Stichprobenmittel

Die konkreten Merkmalausprägungen lassen sich als Realisationen von Zufallsvariablen auffassen. Jeder -Wert stellt somit nach der Ziehung der Stichprobe eine Realisierung der jeweiligen Zufallsvariablen dar. Das arithmetische Mittel dieser Zufallsvariablen

wird auch als Stichprobenmittel bezeichnet und ist ebenfalls eine Zufallsvariable.

Unabhängig verteilte Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Sind die unabhängig verteilte Zufallsvariablen (d. h. ist eine Zufallsvariable mit den Zufallsvariablen und ist eine Zufallsvariable mit den Zufallsvariablen ) mit gemeinsamem Erwartungswert aber unterschiedlichen Varianzen , so hat der gewichtete Mittelwert ebenfalls Erwartungswert und seine Varianz beträgt

.

Wählt man , so vereinfacht sich die Varianz zu

.

Aus der Cauchy-Schwarzschen Ungleichung folgt

.

Die Wahl der Gewichte oder eine Wahl proportional dazu minimiert also die Varianz des gewichteten Mittels. Mit dieser Formel lassen sich die Gewichte abhängig von der Varianz des jeweiligen Wertes, der dementsprechend den Mittelwert mehr oder weniger stark beeinflusst, zweckmäßig wählen.

Unabhängig und identisch verteilte Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Sind Zufallsvariablen, die unabhängig und identisch verteilt mit Erwartungswert und Varianz sind, so hat der Stichprobenmittelwert ebenfalls den Erwartungswert , aber die kleinere Varianz . Hat also eine Zufallsvariable endlichen Erwartungswert und endliche Varianz, so folgt aus der Tschebyscheff-Ungleichung, dass das arithmetische Mittel einer Stichprobe gegen den Erwartungswert der Zufallsvariablen stochastisch konvergiert. Das arithmetische Mittel ist daher nach vielen Kriterien eine geeignete Schätzung für den Erwartungswert der Verteilung, aus der die Stichprobe stammt.

Sind die speziell Stichprobenmittelwerte vom Umfang aus derselben Grundgesamtheit, so hat die Varianz , also ist die Wahl optimal.

Gewichtetes arithmetisches Mittel als Erwartungswert[Bearbeiten | Quelltext bearbeiten]

Im Falle einer diskreten Zufallsvariable mit abzählbar endlichem Träger ergibt sich der Erwartungswert der Zufallsvariable als

.

Hierbei ist die Wahrscheinlichkeit, dass den Wert annimmt. Dieser Erwartungswert kann als ein gewichtetes Mittel der Werte mit den Wahrscheinlichkeiten interpretiert werden. Bei Gleichverteilung gilt und somit wird zum arithmetischen Mittel der Werte [11]

.

Beispiele[Bearbeiten | Quelltext bearbeiten]

Das arithmetische Mittel der Zahlen 1, 2 und 3 beträgt 2, das arithmetische Mittel der Zahlen 4 und 5 beträgt 4,5. Das arithmetische Mittel aller 5 Zahlen ergibt sich als mit dem Stichprobenumfang gewichteter Mittelwert der Teilmittelwerte:

Liegen die Beobachtungen als klassierte Häufigkeit vor, kann man das arithmetische Mittel näherungsweise als gewichtetes Mittel bestimmen, wobei die Klassenmitten als Wert und der Klassenumfang als Gewicht zu wählen sind. Sind beispielsweise in einer Schulklasse ein Kind in der Gewichtsklasse 20 bis 25 kg, 7 Kinder in der Gewichtsklasse 25 bis 30 kg, 8 Kinder in der Gewichtsklasse 30 bis 35 kg und 4 Kinder in der Gewichtsklasse 35 bis 40 kg, so lässt sich das Durchschnittsgewicht als

abschätzen. Um die Güte dieser Schätzung zu ermitteln, muss man dann den minimal / maximal möglichen Mittelwert ermitteln, indem man pro Intervall die kleinsten / größten Werte zugrunde legt. Damit ergibt sich dann, dass der tatsächliche Mittelwert zwischen 28,75 kg und 33,75 kg liegt. Der Fehler der Schätzung 31,25 beträgt also maximal ±2,5 kg oder ±8 %.

Weiteres Beispiel: Ein Bauer stellt im Nebenerwerb 100 kg Butter her. 10 kg kann er für 10 €/kg verkaufen, weitere 10 kg für 6 €/kg und den Rest muss er für 3 €/kg abgeben. Zu welchem (gewichtetem) Durchschnittspreis hat er seine Butter verkauft? Lösung: (10 kg · 10 €/kg + 10 kg · 6 €/kg + 80 kg · 3 €/kg) / (10 kg + 10 kg + 80 kg) = 400 € / 100 kg = 4 €/kg. Der mit der jeweils verkauften Menge gewichtete Durchschnittspreis entspricht also dem fixen Preis, zu dem die Gesamtmenge verkauft werden müsste, um den gleichen Erlös zu erzielen wie beim Verkauf von Teilmengen zu wechselnden Preisen.

Der Mittelwert einer Funktion[Bearbeiten | Quelltext bearbeiten]

Als Mittelwert der Riemann-integrierbaren Funktion wird die Zahl

definiert.

Die Bezeichnung Mittelwert ist insofern gerechtfertigt, als für eine äquidistante Zerlegung des Intervalls mit der Schrittweite das arithmetische Mittel

gegen konvergiert, vgl. [12]

Ist stetig, so besagt der Mittelwertsatz der Integralrechnung, dass es ein gibt mit , die Funktion nimmt also an mindestens einer Stelle ihren Mittelwert an.

Der Mittelwert der Funktion mit dem Gewicht (wobei für alle ) ist

.

Für Lebesgue-Integrale im Maßraum mit einem endlichen Maß lässt sich der Mittelwert einer Lebesgue-integrierbaren Funktion als

definieren. Handelt es sich um einen Wahrscheinlichkeitsraum, gilt also , so nimmt der Mittelwert die Form

an; das entspricht genau dem Erwartungswert von .

Der Mittelwert einer Funktion hat in Physik und Technik erhebliche Bedeutung insbesondere bei periodischen Funktionen der Zeit, siehe Gleichwert.

Quasi-arithmetischer Mittelwert (f-Mittel)[Bearbeiten | Quelltext bearbeiten]

Sei eine auf einem reellen Intervall streng monotone stetige (und daher invertierbare) Funktion und seien

Gewichtsfaktoren. Dann ist für das mit den Gewichten gewichtete quasi-arithmetische Mittel definiert als

.

Offensichtlich gilt

Für erhält man das arithmetische, für das geometrische Mittel, und für das -Potenzmittel.

Dieser Mittelwert lässt sich auf das gewichtete quasi-arithmetische Mittel einer Funktion verallgemeinern, wobei in einem die Bildmenge von umfassenden Intervall streng monoton und stetig sei:

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Karl Bosch: Elementare Einführung in die angewandte Statistik. 8. Auflage. Vieweg, Wiesbaden 2005, S. 13.
  2. L. Fahrmeir, R. Künstler u. a.: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer 2016, S. 49.
  3. L. Fahrmeir, R. Künstler u. a.: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer 2016, S. 50.
  4. L. Fahrmeir, R. Künstler u. a.: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer 2016, S. 50.
  5. Horst Degen, Peter Lorscheid: Statistik-Lehrbuch: mit Wirtschafts- und Bevölkerungsstatistik., S. 42.
  6. Fahrmeir, L.; Künstler, R.; Pigeot, I.; Tutz, G.: Statistik. Der Weg zur Datenanalyse. 8. Auflage, S.65
  7. L. Fahrmeir, R. Künstler u. a.: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer 2016, S. 54.
  8. bezeichnet analog zu (Argument des Maximums) das Argument des Minimums
  9. L. Fahrmeir, R. Künstler u. a.: Statistik. Der Weg zur Datenanalyse. 8. Auflage. Springer 2016, S. 54.
  10. I.N. Bronstein, K.A. Semendjajew u. a.: Taschenbuch der Mathematik. 2. Auflage, 1995, S. 19 ff.
  11. I.N. Bronstein, K.A. Semendjajew u. a.: Taschenbuch der Mathematik. 2. Auflage, 1995, S. 629.
  12. H. Heuser: Lehrbuch der Analysis, Teil 1, 8. Auflage, Teubner, Stuttgart 1990. ISBN 3-519-12231-6