Normalverteilung
Die Normal- oder Gauß-Verteilung (nach Carl Friedrich Gauß) ist ein wichtiger Typ stetiger Wahrscheinlichkeitsverteilungen. Ihre Wahrscheinlichkeitsdichte wird auch Gauß-Funktion, Gauß-Kurve, Gauß-Glocke, Gaußsche Glockenkurve oder schlicht Glockenkurve genannt.
Die besondere Bedeutung der Normalverteilung beruht unter anderem auf dem zentralen Grenzwertsatz, der besagt, dass eine Summe von
unabhängigen, identisch verteilten Zufallsvariablen mit endlicher Varianz (s. die Cauchy-Verteilung als Gegenstück) im Grenzwert
normalverteilt ist. Das bedeutet, dass man Zufallsvariablen dann als normalverteilt ansehen kann, wenn sie durch Überlagerung einer großen Zahl von unabhängigen Einflüssen entstehen, wobei jede einzelne Einflussgröße einen im Verhältnis zur Gesamtsumme unbedeutenden Beitrag liefert.
Die Abweichungen der (Mess)Werte vieler natur-, wirtschafts- und ingenieurswissenschaftlicher Vorgänge vom Mittelwert lassen sich durch die Normalverteilung (bei biologischen Prozessen oft logarithmische Normalverteilung) entweder exakt oder wenigstens in sehr guter Näherung beschreiben (vor allem Prozesse, die in mehreren Faktoren unabhängig voneinander in verschiedene Richtungen wirken).
Zufallsgrößen mit Normalverteilung benutzt man zur Beschreibung zufälliger Vorgänge wie:
- zufällige Messfehler,
- zufällige Abweichungen vom Nennmaß bei der Fertigung von Werkstücken,
- Beschreibung der brownschen Molekularbewegung.
In der Versicherungsmathematik ist die Normalverteilung geeignet zur Modellierung von Schadensdaten im Bereich mittlerer Schadenshöhen.
In der Messtechnik wird häufig eine Normalverteilung angesetzt, die die Streuung der Messfehler beschreibt. Hierbei ist von Bedeutung, wie viele Messpunkte innerhalb einer gewissen Streubreite liegen. Die Standardabweichung
beschreibt die Breite der Normalverteilung und hängt mit der Halbwertsbreite zusammen. Es gilt näherungsweise:
- Im Intervall der Abweichung
vom Mittelwert sind 68,27 % aller Messwerte zu finden, - Im Intervall der Abweichung
vom Mittelwert sind 95,45 % aller Messwerte zu finden, - Im Intervall der Abweichung
vom Mittelwert sind 99,73 % aller Messwerte zu finden.
Und ebenso lassen sich umgekehrt für gegebene Wahrscheinlichkeiten die maximalen Abweichungen vom Mittelwert finden:
- 50 % aller Messwerte haben eine Abweichung von höchstens
vom Mittelwert, - 90 % aller Messwerte haben eine Abweichung von höchstens
vom Mittelwert, - 95 % aller Messwerte haben eine Abweichung von höchstens
vom Mittelwert, - 99 % aller Messwerte haben eine Abweichung von höchstens
vom Mittelwert.
Somit kann neben dem Mittelwert auch der Standardabweichung eine einfache Bedeutung zugeordnet werden.
[Bearbeiten] Geschichte
Im Jahre 1733 zeigte Abraham de Moivre in seiner Schrift „The Doctrine of Chances“ im Zusammenhang mit seinen Arbeiten am Grenzwertsatz für Binomialverteilungen eine Abschätzung des Binomialkoeffizienten, welche als Vorform der Normalverteilung gedeutet werden kann. Die für die Normierung der Normalverteilungsdichte zur Wahrscheinlichkeitsdichte notwendige Berechnung des nicht elementaren Integrals
gelang Pierre-Simon Laplace im Jahr 1782 (nach anderen Quellen Poisson). Im Jahr 1809 publizierte Gauß sein Werk „Theoria motus corporum coelestium in sectionibus conicis solem ambientium“ (dt.: Theorie der Bewegung der in Kegelschnitten sich um die Sonne bewegenden Himmelskörper), welches neben den eng zusammenhängenden Methoden der kleinsten Quadrate und der Maximum-Likelihood-Schätzung die Normalverteilung definiert. Ebenfalls Laplace war es, der 1810 den Satz vom zentralen Grenzwert bewies, der die Grundlage der theoretischen Bedeutung der Normalverteilung darstellt und de Moivres Arbeit am Grenzwertsatz für Binomialverteilungen abschloss. Adolphe Quételet erkannte schließlich bei Untersuchungen des Brustumfangs von mehreren tausend Soldaten im Jahr 1844 eine verblüffende Übereinstimmung mit der Normalverteilung und brachte die Normalverteilung in die angewandte Statistik. Er hat vermutlich die Bezeichnung Normalverteilung geprägt.
[Bearbeiten] Definition
Eine stetige Zufallsvariable
mit der Wahrscheinlichkeitsdichte
, gegeben durch:
heißt
-
-normalverteilt, auch geschrieben als
oder
-normalverteilt, wobei
der Erwartungswert und
die Varianz sind.
Die Verteilungsfunktion der Normalverteilung ist gegeben durch
Darin ist
die Verteilungsfunktion der Standardnormalverteilung
Die Dichtefunktion der Standardnormalverteilung ist
,
welche nebenstehend dargestellt ist.
Die mehrdimensionale Verallgemeinerung findet man im Artikel mehrdimensionale Normalverteilung.
[Bearbeiten] Eigenschaften
[Bearbeiten] Symmetrie
Der Graph der Wahrscheinlichkeitsdichte
ist eine gaußsche Glockenkurve, deren Höhe und Breite von
abhängt. Sie ist achsensymmetrisch zur Achse
. Ihre Stammfunktion
ist punktsymmetrisch relativ zum Punkt
.
[Bearbeiten] Maximalwert und Wendepunkte der Dichtefunktion
Mit Hilfe der ersten und zweiten Ableitung lassen sich der Maximalwert und die Wendepunkte bestimmen. Die erste Ableitung ist
Das Maximum der Dichtefunktion der Normalverteilung liegt demnach bei
und beträgt dort 
Die zweite Ableitung lautet
Somit liegen die Wendestellen der Dichtefunktion bei
. Die Dichtefunktion hat an den Wendestellen den Wert
.
[Bearbeiten] Normierung
Wichtig ist, dass die gesamte Fläche unter der Kurve gleich 1 ist, also der Wahrscheinlichkeit eines sicheren Ereignisses entspricht. Somit folgt, dass, wenn zwei gaußsche Glockenkurven dasselbe
, aber unterschiedliche
-Werte haben, jene Kurve mit dem größeren
breiter und niedriger ist (da ja beide zugehörigen Flächen jeweils den Wert von 1 haben und nur die Standardabweichung (oder „Streuung“) höher ist). Zwei Glockenkurven mit dem gleichen
, aber unterschiedlichen
haben gleich aussehende Graphen, die jedoch auf der
-Achse um die Differenz der
-Werte zueinander verschoben sind.
Jede Normalverteilung ist tatsächlich normiert, denn mit Hilfe der linearen Substitution
erhalten wir:
Für die Normiertheit des letzteren Integrals siehe den Artikel Fehlerintegral.
[Bearbeiten] Berechnung
Da sich
nicht auf eine elementare Stammfunktion zurückführen lässt, wurde für die Berechnung früher meist auf Tabellen zurückgegriffen (siehe Tabelle der Standardnormalverteilung). Heutzutage sind in üblichen Tabellenkalkulationsprogrammen Zellenfunktionen verfügbar, die einem auch die Transformation auf beliebige
und
abnehmen. Die dahinter liegenden Näherungen sind transformierte Polynome.[2]
[Bearbeiten] Erwartungswert
Der Erwartungswert der Standardnormalverteilung ist 0. Es sei
, so gilt
da der Integrand integrierbar ist und punktsymmetrisch.
Ist nun
, so gilt
sei standardnormalverteilt, und somit
[Bearbeiten] Varianz und weitere Streumaße
Die Varianz der
-
-normalverteilten Zufallsgröße ist tatsächlich
, ein elementarer Beweis wird Poisson zugeschrieben.
Die mittlere absolute Abweichung ist
und der Interquartilsabstand
.
[Bearbeiten] Variationskoeffizient
Aus Erwartungswert
und Standardabweichung
der
-Verteilung erhält man unmittelbar den Variationskoeffizienten
[Bearbeiten] Schiefe
Die Schiefe besitzt unabhängig von den Parametern
und
immer den Wert 0.
[Bearbeiten] Charakteristische Funktion
Die charakteristische Funktion für eine standardnormalverteilte Zufallsvariable
berechnet sich gemäß
Den Übergang von der dritten zur vierten Zeile erhält man dabei durch Anwendung des Cauchyschen Integralsatzes.
Für eine Zufallsvariable
erhält man nun
wobei
.
[Bearbeiten] Momenterzeugende Funktion
Die momenterzeugende Funktion der Normalverteilung ist
[Bearbeiten] Momente
Sei
-verteilt. Dann sind die ersten Momente wie folgt:
Nummer, ![]() |
Moment, ![]() |
zentriertes Moment | Kumulante |
|---|---|---|---|
| 0 | 1 | 1 | |
| 1 | ![]() |
0 | ![]() |
| 2 | ![]() |
![]() |
![]() |
| 3 | ![]() |
0 | 0 |
| 4 | ![]() |
![]() |
0 |
| 5 | ![]() |
0 | 0 |
| 6 | ![]() |
![]() |
0 |
| 7 | ![]() |
0 | 0 |
| 8 | ![]() |
![]() |
0 |
Alle zentralen Momente
lassen sich durch die Standardabweichung
darstellen:
dabei wurde die Doppelfakultät verwendet:
[Bearbeiten] Invarianz gegenüber Faltung
Die Normalverteilung ist invariant gegenüber der Faltung, d. h. die Summe unabhängiger normalverteilter Zufallsgrößen ist wieder normalverteilt. Eine veranschaulichende Formulierung dieses Sachverhaltes lautet: Die Faltung einer Gaußkurve der Halbwertsbreite
mit einer Gaußkurve der Halbwertsbreite
ergibt wieder eine Gaußkurve mit der Halbwertsbreite
Sind also
zwei unabhängige Zufallsvariable mit
so ist deren Summe ebenfalls normalverteilt:
Das lässt sich dadurch beweisen, dass die charakteristische Funktion der Summe das Produkt der charakteristischen Funktionen der Summanden ist.
Speziell ist das arithmetische Mittel
unabhängiger und normalverteilter Zufallsgrößen
wieder eine normalverteilte Zufallsgröße mit
Nach dem Satz von Cramér gilt sogar die Umkehrung: Ist eine normalverteilte Zufallsgröße die Summe von unabhängigen Zufallsgrößen, dann sind die Summanden ebenfalls normalverteilt.
Die Dichtefunktion der Normalverteilung ist ein Fixpunkt der Fourier-Transformation, d. h. die Fourier-Transformierte einer Gaußkurve ist wieder eine Gaußkurve. Das Produkt der Standardabweichungen dieser korrespondierenden Gaußkurven ist konstant; es gilt die heisenbergsche Unschärferelation.
[Bearbeiten] Entropie
Die Normalverteilung hat die Entropie:
.
Da sie für gegebenen Mittelwert und gegebene Varianz die größte Entropie unter allen Verteilungen hat, wird sie in der Maximum-Entropie-Methode oft als A-priori-Wahrscheinlichkeit verwendet.
[Bearbeiten] Beziehungen zu anderen Verteilungsfunktionen
[Bearbeiten] Transformation zur Standardnormalverteilung
Eine Normalverteilung mit beliebigen
und
und der Verteilungsfunktion F hat, wie oben erwähnt, die nachfolgende Beziehung zur
-Verteilung:
Darin ist
die Verteilungsfunktion der Standardnormalverteilung.
Wenn
, dann führt die Transformation
zu einer standardnormalverteilten Zufallsvariablen Z, denn
Geometrisch betrachtet entspricht die durchgeführte Substitution einer flächentreuen Transformation der Glockenkurve von
zur Glockenkurve von
.
[Bearbeiten] Approximation der Binomialverteilung durch die Normalverteilung
Die Normalverteilung kann zur Approximation der Binomialverteilung verwendet werden, wenn der Stichprobenumfang
hinreichend groß und in der Grundgesamtheit der Anteil
der gesuchten Eigenschaft nicht zu klein ist. Als Faustregeln dafür gelten:
, was für die Standardabweichung bedeutet: 
Falls diese Bedingung nicht erfüllt sein sollte, ist die Näherung immer noch vertretbar genau, wenn gilt:
und zugleich
.
Ist eine Binomialverteilung (Bernoulli-Versuch) mit
voneinander unabhängigen Stufen (bzw. Zufallsversuchen) mit einer Erfolgswahrscheinlichkeit
gegeben, so lässt sich die Wahrscheinlichkeit für
Erfolge allgemein durch
für
berechnen.
Für sehr große Werte von
kann diese Binomialverteilung durch eine Normalverteilung approximiert werden (Satz von Moivre-Laplace, zentraler Grenzwertsatz). Dabei ist
- der Erwartungswert

- und die Standardabweichung

Ist nun
, dann ist folgende Näherung brauchbar:
Bei der Normalverteilung wird die untere Grenze um 0,5 verkleinert und die obere Grenze um 0,5 vergrößert, um eine bessere Approximation bei einer geringen Standardabweichung
gewährleisten zu können. Dies nennt man auch Stetigkeitskorrektur. Nur wenn
einen sehr hohen Wert besitzt, kann auf sie verzichtet werden.
Da die Binomialverteilung diskret ist, muss auf einige Punkte geachtet werden:
oder
(und auch größer und größer gleich) müssen beachtet werden (was ja bei der Normalverteilung nicht der Fall ist). Deshalb muss bei
die nächstkleinere natürliche Zahl gewählt werden, d. h.
-
bzw. 
- damit mit der Normalverteilung weitergerechnet werden kann.
- z. B.

- Außerdem ist
-


(unbedingt mit Stetigkeitskorrektur)
- und lässt sich somit durch die oben angegebene Formel berechnen.
Der große Vorteil der Approximation liegt darin, dass sehr viele Stufen einer Binomialverteilung sehr schnell und einfach bestimmt werden können.
[Bearbeiten] Beziehung zur Cauchy-Verteilung
Der Quotient von zwei unabhängigen
standardnormalverteilten Zufallsvariablen ist Cauchy-verteilt.
[Bearbeiten] Beziehung zur Chi-Quadrat-Verteilung
- Die Summe
von
unabhängigen quadrierten standardnormalverteilten Zufallsvariablen
genügt einer Chi-Quadrat-Verteilung
mit
Freiheitsgraden.
- Die Summe
mit
und
unabhängigen normalverteilten Zufallsvariablen
genügt einer Chi-Quadrat-Verteilung
mit
Freiheitsgraden.
- Mit steigender Zahl an Freiheitsgraden (df >> 100) nähert sich die Chi-Quadrat-Verteilung der Normalverteilung an.
- Die Chi-Quadrat-Verteilung wird zur Konfidenzschätzung für die Varianz einer normalverteilten Grundgesamtheit verwendet.
[Bearbeiten] Beziehung zur Rayleigh-Verteilung
Der Betrag
zweier normalverteilter Zufallsvariablen
ist Rayleigh-verteilt.
[Bearbeiten] Beziehung zur logarithmischen Normalverteilung
Ist die Zufallsvariable
normalverteilt mit
, dann ist die Zufallsvariable
logarithmisch-normalverteilt mit
.
Die Entstehung einer logarithmischen Normalverteilung ist auf multiplikatives, die einer Normalverteilung auf additives Zusammenwirken vieler Zufallsgrößen zurückführen.
[Bearbeiten] Beziehung zur F-Verteilung
Wenn die identischen normalverteilten Zufallsvariablen
und
die Parameter
mit
besitzen, dann unterliegt die Zufallsvariable
einer F-Verteilung mit
Freiheitsgraden. Dabei sind
[Bearbeiten] Beziehung zur Studentschen t-Verteilung
Wenn die unabhängigen Zufallsvariablen
identisch normalverteilt sind mit den Parametern
und
, dann unterliegt die stetige Zufallsgröße
einer Studentschen t-Verteilung mit
Freiheitsgraden.
Für eine steigende Anzahl an Freiheitsgraden nähert sich die Student-t-Verteilung der Normalverteilung immer näher an. Als Faustregel gilt, dass man ab ca.
die Student-t-Verteilung bei Bedarf durch die Normalverteilung approximieren kann.
Die Student-t-Verteilung wird zur Konfidenzschätzung für den Erwartungswert einer normalverteilten Zufallsvariable bei unbekannter Varianz verwendet.
[Bearbeiten] Rechnen mit der Standardnormalverteilung
Bei Aufgabenstellungen, bei denen die Wahrscheinlichkeit für
-normalverteilte Zufallsvariablen durch die Standardnormalverteilung ermittelt werden soll, ist es nicht nötig, die oben angegebene Transformation jedes Mal durchzurechnen. Stattdessen wird einfach die Transformation
verwendet, um eine
-Verteilte Zufallsvariable Z zu erzeugen.
Die Wahrscheinlichkeit für das Ereignis, dass z. B. X im Interval
liegt, ist durch folgende Umrechnung gleich einer Wahrscheinlichkeit der Standardnormalverteilung:
[Bearbeiten] Grundlegende Fragestellungen
Allgemein gibt die Verteilungsfunktion die Fläche unter der Glockenkurve bis zum Wert
an, d. h. es wird das bestimmte Integral von
bis
berechnet.
Dies entspricht in Aufgabenstellungen einer gesuchten Wahrscheinlichkeit, bei der die Zufallsvariable
kleiner oder kleiner gleich einer bestimmten Zahl
ist. Durch die Verwendung der reellen Zahlen und der Stetigkeit der Normalverteilung macht es keinen Unterschied, ob nun
oder
verlangt ist,
- weil
und somit
.
Dasselbe gilt für größer und größer gleich.
Dadurch, dass
nur kleiner oder größer einer Grenze (oder innerhalb oder außerhalb zweier Grenzen) liegen kann, ergeben sich für Aufgaben bei normalverteilten Wahrscheinlichkeitsberechnungen folgende zwei grundlegende Fragestellungen:
- Wie hoch ist die Wahrscheinlichkeit, dass bei einem Zufallsversuch die normalverteilte Zufallsvariable
höchstens den Wert
annimmt?
- In der Schulmathematik wird für diese Aussage auch die Bezeichnung Linker Spitz verwendet, da die Fläche unter der Gaußkurve von links bis zur Grenze verläuft. Für
sind auch negative Werte erlaubt, trotzdem haben viele Tabellen der Standardnormalverteilung nur positive Einträge. Durch die Symmetrie der Kurve und der Negativitätsregel des linken Spitz stellt dies aber keine Einschränkung dar:
- Wie hoch ist die Wahrscheinlichkeit, dass bei einem Zufallsversuch die normalverteilte Zufallsvariable
mindestens den Wert
annimmt?
-
- Analog wird hier oft die Bezeichnung Rechter Spitz verwendet. Ebenso gibt es eine Negativitätsregel:
(Da jede Zufallsvariable
der allgemeinen Normalverteilung sich in die Zufallsgröße
der Standardnormalverteilung umwandeln lässt, gelten die Fragestellungen für beide Größen gleichbedeutend.)
[Bearbeiten] Streubereich und Antistreubereich
Der Streubereich gibt die Wahrscheinlichkeit wieder, dass die normalverteilte Zufallsvariable
Werte zwischen
und
annimmt:
Beim Sonderfall des symmetrischen Streubereiches (
, mit
) gilt
Hingegen gibt der Antistreubereich die Höhe der Wahrscheinlichkeit an, dass die normalverteilte Zufallsvariable
Werte außerhalb des Bereichs zwischen
und
annimmt:
Somit folgt bei einem symmetrischen Antistreubereich
[Bearbeiten] Streubereiche am Beispiel der Qualitätssicherung
Besondere Bedeutung haben beide Streubereiche z. B. bei der Qualitätssicherung von technischen oder wirtschaftlichen Produktionsprozessen. Hier gibt es einzuhaltende Toleranzgrenzen
und
, wobei es meist einen größten noch akzeptablen Abstand
vom Erwartungswert
(= dem optimalen Sollwert) gibt.
kann hingegen empirisch aus dem Produktionsprozess gewonnen werden.
Wurde
als einzuhaltendes Toleranzintervall angegeben, so liegt (je nach Fragestellung) ein symmetrischer Streu- oder Antistreubereich vor.
Im Falle des Streubereiches gilt:
Der Antistreubereich ergibt sich dann aus
oder wenn kein Streubereich berechnet wurde durch
Das Ergebnis
ist also die Wahrscheinlichkeit für verkaufbare Produkte, während
die Wahrscheinlichkeit für Ausschuss bedeutet, wobei beides von den Vorgaben von
,
und
abhängig ist.
Ist bekannt, dass die maximale Abweichung
symmetrisch um den Erwartungswert liegt, so sind auch Fragestellungen möglich, bei denen die Wahrscheinlichkeit vorgegeben und eine der anderen Größen zu berechnen ist.
[Bearbeiten] Testen auf Normalverteilung
Um zu überprüfen, ob vorliegende Daten normalverteilt sind, können folgende Methoden angewandt werden:
- Chi-Quadrat-Test
- Kolmogorow-Smirnow-Test
- Anderson-Darling-Test (Modifikation des Kolmogorow-Smirnow-Tests)
- Lilliefors-Test (Modifikation des Kolmogorow-Smirnow-Tests)
- Cramér-von-Mises-Test
- Shapiro-Wilk-Test
- Jarque-Bera-Test
- Q-Q-Plot (deskriptive Überprüfung)
- Maximum-Likelihood-Methode (deskriptive Überprüfung)
Die Tests haben unterschiedliche Eigenschaften hinsichtlich der Art der Abweichungen von der Normalverteilung, die sie erkennen. So erkennt der Kolmogorov-Smirnov-Test Abweichungen in der Mitte der Verteilung eher als Abweichungen an den Rändern, während der Jarque-Bera-Test ziemlich sensibel auf stark abweichende Einzelwerte an den Rändern („heavy tails“) reagiert.
Beim Lilliefors-Test muss im Gegensatz zum Kolomogorov-Smirnov-Test nicht standardisiert werden, d. h.
und
der angenommenen Normalverteilung dürfen unbekannt sein.
Mit Hilfe von Quantil-Quantil-Plots (auch Normal-Quantil-Plots oder kurz Q-Q-Plot) ist eine einfache grafische Überprüfung auf Normalverteilung möglich.
Mit der Maximum-Likelihood-Methode können die Parameter
und
der Normalverteilung geschätzt und die empirischen Daten mit der angepassten Normalverteilung grafisch verglichen werden.
[Bearbeiten] Parameterschätzung
Oft sind die Parameter einer Normalverteilung nicht bekannt und müssen geschätzt werden. Beispielsweise ist dies der Fall, wenn eine Reihe von Messwerten
vorliegt, bei welcher man Grund zur Annahme hat, dass sie unabhängige Realisierungen einer normalverteilen Zufallsgröße mit unbekannten Parametern
und
sind.
[Bearbeiten] Erwartungstreue Schätzer
Der Erwartungswert
kann durch das arithmetische Mittel
geschätzt werden (siehe Schätzwert für den Erwartungswert).
Die Varianz
kann über die (korrigierte) Stichprobenvarianz
geschätzt werden.
Beide Schätzer sind erwartungstreu.
[Bearbeiten] Maximum-Likelihood-Schätzung der Verteilungsparameter
Um die Parameter einer Normalverteilung zu schätzen, kann man auch die Maximum-Likelihood-Schätzung verwenden. Schätzer
für den Erwartungswert und
für die Varianz erhält man, indem die Log-Likelihood-Funktion für die Normalverteilung maximiert wird[3].
Als Maximum-Likelihood-Schätzer für
ergibt damit ebenfalls
, also das arithmetische Mittel der Messwerte.
Für die Varianz erhält man dagegen die unkorrigierte Stichprobenvarianz
und für die Standardabweichung
Diese Schätzer für Varianz bzw. Standardabweichung sind jedoch nicht bzw. nur asymptotisch erwartungstreu. Selbst wenn man einen erwartungstreuen Varianz-Schätzer verwendet, ist dessen Quadratwurzel – d. h. die Standardabweichung – im Allgemeinen nicht ebenfalls erwartungstreu.[4]
[Bearbeiten] Simulation normalverteilter Zufallsvariablen
[Bearbeiten] Box-Muller-Methode
Nach der Box-Muller-Methode lassen sich zwei unabhängige, standardnormalverteilte Zufallsvariablen
und
aus zwei unabhängigen, gleichverteilten Zufallsvariablen
, sogenannten Standardzufallszahlen, simulieren:
und
[Bearbeiten] Polar-Methode
Die Polar-Methode von Marsaglia ist auf einem Computer noch schneller, da sie nur einen Logarithmus benutzt:
- Erzeuge zwei voneinander unabhängige, im Intervall
gleichverteilte Zufallszahlen
und 
- Berechne
. Falls
oder
, gehe zurück zu Schritt 1. - Berechne
.
liefert zwei voneinander unabhängige, standardnormalverteilte Zufallszahlen
und
.
Durch lineare Transformation lassen sich hieraus beliebige normalverteilte Zufallszahlen erzeugen: Ist die Zufallsvariable
-verteilt, so ist
schließlich
-verteilt.
[Bearbeiten] Zwölferregel
Der zentrale Grenzwertsatz besagt, dass sich unter bestimmten Voraussetzungen die Verteilung der Summe unabhängiger, identisch verteilter Zufallszahlen einer Normalverteilung nähert.
Ein Spezialfall ist die Zwölferregel, die sich auf die Summe von zwölf Zufallszahlen aus einer Gleichverteilung auf dem Intervall [0,1] beschränkt und bereits zu passablen Verteilungen führt.
Stark ins Gewicht fällt die Forderung der Unabhängigkeit der zwölf Zufallsvariablen
, die bei immer noch häufig verwendeten (Linearen Kongruenzgeneratoren (LKG)) nicht garantiert ist. Im Gegenteil wird vom Spektraltest für LKG meist nur die Unabhängigkeit von maximal vier bis sieben der
garantiert. Für numerische Simulationen ist die Zwölferregel daher sehr bedenklich und sollte, wenn überhaupt, dann ausschließlich mit aufwändigeren, aber besseren Pseudo-Zufallsgeneratoren wie z. B. dem Mersenne Twister (Standard in Python, GNU R) oder WELL durchgeführt werden. Andere, sogar leichter zu programmierende Verfahren, sind daher i. d. R. der Zwölferregel vorzuziehen.
[Bearbeiten] Verwerfungsmethode
Normalverteilungen lassen sich mit der Verwerfungsmethode (s. dort) simulieren.
[Bearbeiten] Inversionsmethode
Die Normalverteilung lässt sich auch mit der Inversionsmethode berechnen. Da das Fehlerintegral leider nicht explizit mit elementaren Funktionen integrierbar ist, muss man auf Reihenentwicklungen der inversen Funktion für einen Startwert (
weiter unten) und anschließende Korrektur mit dem Newtonverfahren zurückgreifen. Dazu werden erf(x) und erfc(x) benötigt, die ihrerseits mit Reihenentwicklungen und Kettenbruchentwicklungen berechnet werden können – insgesamt ein relativ hoher Aufwand. Die notwendigen Entwicklungen sind in der Literatur zu finden.[5]
Entwicklung des inversen Fehlerintegrals (wegen des Pols nur als Startwert für das Newtonverfahren verwendbar):
mit den Koeffizienten
[Bearbeiten] Anwendungen außerhalb der Wahrscheinlichkeitsrechnung
Die Normalverteilung lässt sich auch zur Beschreibung nicht direkt stochastischer Sachverhalte verwenden, etwa in der Physik für das Amplitudenprofil der Gauß-Strahlen und andere Verteilungsprofile.
Zudem findet sie Verwendung in der Gabor-Transformation.
[Bearbeiten] Siehe auch
- Mehrdimensionale Normalverteilung
- Additives weißes gaußsches Rauschen
- Wahrscheinlichkeitsnetz
- Statistik
- Six Sigma Methode der Qualitätsverbesserung
[Bearbeiten] Literatur
- Stephen M. Stigler: The history of statistics: the measurement of uncertainty before 1900. Belknap Series. Harvard University Press, 1986. ISBN 9780674403413.
[Bearbeiten] Fußnoten und Einzelnachweise
- ↑ Bei der Funktion
handelt es sich um die Exponentialfunktion mit der Basis
, auch als
bekannt. - ↑ Espen Gaarder Haug: The complete guide to option pricing formulas, Band 1, McGraw-Hill, 1998, ISBN 0-7863-1240-8, eingeschränkte Vorschau in der Google Buchsuche.
- ↑ Wolfram MathWorld: Maximum Likelihood
- ↑ Wolfram MathWorld: Sample Variance
- ↑ William B. Jones, W. J. Thron; Continued Fractions: Analytic Theory and Applications; Addison Wesley, 1980
[Bearbeiten] Weblinks
Diskrete univariate Verteilungen für endliche Mengen:
Benford | Bernoulli | beta-binomial | binomial | kategorial | hypergeometrisch | Rademacher | Zipf | Zipf-Mandelbrot
Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann | Conway-Maxwell-Poisson | negativ binomial | erweitert negativ binomial | Compound-Poisson | diskret uniform | discrete-Phase-Type | Gauss-Kuzmin | geometrisch | logarithmisch | parabolisch-fraktal | Poisson | Poisson-Gamma | Skellam | Yule-Simon | Zeta
Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta | Cantor | Kumaraswamy | raised Cosine | Dreieck | U-quadratisch | stetig uniform | Wigner-Halbkreis
Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime | Bose-Einstein | Burr | Chi-Quadrat | Coxian | Erlang | Exponential | F | Fermi-Dirac | Folded normal | Fréchet | Gamma | Gamma-Gamma | Extremwert | verallgemeinert invers Gauß | halblogistisch | halbnormal | Hotellings T-Quadrat | hyper-exponentiale | hypoexponential | invers Chi-Quadrat | scale-invers Chi-Quadrat | Invers Normal | Invers Gamma | Lévy | log-normal | log-logistisch | Maxwell-Boltzmann | Maxwell-Speed | Nakagami | nichtzentriert Chi-Quadrat | Pareto | Phase-Type | Rayleigh | relativistisch Breit-Wigner | Rice | Rosin-Rammler | shifted Gompertz | truncated normal | Type-2-Gumbel | Weibull | Wilks’ Lambda
Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy | Extremwert | exponential Power | Fishers z | Fisher-Tippett (Gumbel) | generalized hyperbolic | Hyperbolic-secant | Landau | Laplace | alpha-stabil | logistisch | normal (Gauß) | normal-invers Gauß’sch | Skew-normal | Studentsche t | Type-1-Gumbel | Variance-Gamma | Voigt
Diskrete multivariate Verteilungen:
Ewen | multinomial | Dirichlet compound multinomial
Kontinuierliche multivariate Verteilungen:
Dirichlet | generalized Dirichlet | multivariat normal | multivariat Student | normalskaliert invers Gamma | Normal-Gamma
Multivariate Matrixverteilungen:
Invers Wishart | Matrix-normal | Wishart
(blau),
(grün) und
(rot)
vom Mittelwert sind 68,27 % aller Messwerte zu finden,
vom Mittelwert sind 95,45 % aller Messwerte zu finden,
vom Mittelwert sind 99,73 % aller Messwerte zu finden.
vom Mittelwert,
vom Mittelwert,
vom Mittelwert,
vom Mittelwert.




,
































die nächstkleinere natürliche Zahl gewählt werden, d. h.
bzw. 



(unbedingt mit Stetigkeitskorrektur)
von
genügt einer
mit
mit
und
genügt einer
mit
Freiheitsgraden.





und somit
.
annimmt?

















gleichverteilte Zufallszahlen
und 
. Falls
oder
, gehe zurück zu Schritt 1.
.
liefert zwei voneinander unabhängige, standardnormalverteilte Zufallszahlen 

handelt es sich um die
, auch als
bekannt.