Logarithmische Normalverteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die logarithmische Normalverteilung (kurz Log-Normalverteilung) ist eine kontinuierliche Wahrscheinlichkeitsverteilung über der Menge der positiven reellen Zahlen. Sie beschreibt die Verteilung einer Zufallsvariablen X, wenn \ln(X) normalverteilt ist.

Definition[Bearbeiten]

Dichtefunktion der Lognormalverteilung (mit \mu=0)

Dichtefunktion[Bearbeiten]

Eine stetige Zufallsvariable X unterliegt der logarithmischen Normalverteilung \mathcal{LN}(\mu,\sigma^2) mit den Parametern \mu \in \mathbb{R} und \sigma \in \mathbb{R}, \sigma>0, wenn sie die Wahrscheinlichkeitsdichte

f(x)= \begin{cases} \displaystyle \frac{1}{\sqrt{2\pi}\sigma x }\,\exp\Big( -\frac{(\ln{x}-\mu)^2}{2\sigma^2}\Big) & x > 0 \\ 0 & x\leq0 \end{cases}

besitzt.

Zweidimensionale Log-Normalverteilung[Bearbeiten]

Sind X und Y zwei log-normalverteilte Zufallsvariablen, dann ist mit dem transformierten Korrelationskoeffizienten

\rho=\frac{\mathrm{e}^{\rho_{N}\sigma_{x}\sigma_{y}}-1}{\sqrt{(\mathrm{e}^{\sigma_{x}^2}-1)(\mathrm{e}^{\sigma_{y}^2}-1)}}

deren gemeinsame Wahrscheinlichkeitsdichte definiert als

f(x,y)=\frac{\mathrm{e}^{{-\frac{1}{2(1-\rho^2)}\Big(\Big(\frac{\ln(x)-\mu_{x}}{\sigma_{x}}\Big)^2-2\rho\frac{\ln(x)-\mu_{x}}{\sigma_{x}}\frac{\ln(y)-\mu_{y}}{\sigma_{y}}+\Big(\frac{\ln(y)-\mu_{y}}{\sigma_{y}}\Big)^2\Big)}}}{2\pi xy\sigma_{x}\sigma_{y}\sqrt{1-\rho^2}} .

Verteilungsfunktion[Bearbeiten]

Verteilungsfunktion der Lognormalverteilung (mit \mu=0)

Damit hat die logarithmische Normalverteilung für x \geq 0 die Verteilungsfunktion

F(x)= \frac{1}{\sqrt{2\pi}\sigma}\int\limits_{0}^{x}\frac{1}{t}\mathrm{e}^{\displaystyle -\frac{(\ln{t}-\mu)^2}{2\sigma^2}}\operatorname{d}t.

Die Verteilungsfunktion der logarithmischen Normalverteilung stellt sich im doppelt logarithmisch geteilten Wahrscheinlichkeitspapier als Gerade dar.

Eigenschaften[Bearbeiten]

Maximum[Bearbeiten]

Die Wahrscheinlichkeitsdichte nimmt ihren maximalen Wert

f_\text{max} = \frac{1}{\sqrt{2\pi}\sigma}\,\mathrm{e}^{\sigma^2/2-\mu}

an der Stelle x = \mathrm{e}^{\mu-\sigma^2} an.

Erwartungswert[Bearbeiten]

Der Erwartungswert der logarithmischen Normalverteilung beträgt

\operatorname{E}(X) = \frac{1}{\sqrt{2\pi}\sigma}\int\limits_{0}^{+\infty}
                             x \; \frac{\mathrm{e}^{-\frac{(\ln{x}-\mu)^2}{2\sigma^2}}}{x} \; \operatorname{d}x
                           = \mathrm{e}^{\mu+\frac{\sigma^{2}}{2}}

Varianz[Bearbeiten]

Die Varianz ergibt sich analog zu

\operatorname{Var}(X) = \frac{1}{\sigma\sqrt{2\pi}}\int\limits_{0}^{+\infty}(x-\mathrm{e}^{\mu+\frac{\sigma^{2}}{2}})^2 \;
                               \frac{\mathrm{e}^{-\frac{(\ln{x}-\mu)^2}{2\sigma^2}}}{x} \; \operatorname{d}x
                             = \mathrm{e}^{2\mu+\sigma^{2}}(\mathrm{e}^{\sigma^{2}}-1) .

Standardabweichung[Bearbeiten]

Für die Standardabweichung ergibt sich

 \sqrt{\operatorname{Var}(X)}= \sqrt{\mathrm{e}^{2\mu+\sigma^{2}}(\mathrm{e}^{\sigma^{2}}-1)}.

Variationskoeffizient[Bearbeiten]

Aus Erwartungswert und Varianz erhält man unmittelbar den Variationskoeffizienten

\operatorname{VarK}(X) = \sqrt{\mathrm{e}^{\sigma^2}-1}.

Schiefe[Bearbeiten]

Die Schiefe ergibt sich zu

\operatorname{v}(X) = (\mathrm{e}^{\sigma^2}+2)\sqrt{\mathrm{e}^{\sigma^2}-1} > 0,

d.h., die Lognormalverteilung ist rechtsschief.

Quantile[Bearbeiten]

Ist u_{(p)} das p-Quantil einer Standardnormalverteilung (d.h. \Phi(u_{(p)}) = 
p, wobei \Phi die Verteilungsfunktion der Standardnormalverteilung sei), so ist das p-Quantil der Logarithmischen Normalverteilung gegeben durch

x_{(p)} = \mathrm{e}^{\mu + u_{(p)} \cdot \sigma}.

Insbesondere ist der Median, d.h. der Wert, bei dem die Verteilungsfunktion den Wert 0,5 annimmt, gegeben durch

x_{(0,5)}=\mathrm{e}^\mu.

Je größer die Differenz zwischen Erwartungswert und Median, desto ausgeprägter ist i.a. die Schiefe einer Verteilung. Hier unterscheiden sich diese Parameter um den Faktor \mathrm{e}^{\frac{\sigma^2}{2}}. Die Wahrscheinlichkeit für extrem große Ausprägungen ist also bei der Lognormalverteilung hoch.

Charakteristische Funktion[Bearbeiten]

Die charakteristische Funktion ist für die logarithmische Normalverteilung nicht explizit darstellbar.

Momente[Bearbeiten]

Für die logarithmische Normalverteilung existieren alle Momente und es gilt:

\operatorname{E}(X^n)=\mathrm{e}^{n\mu+\frac{n^2\sigma^2}{2}}.

Momenterzeugende Funktion[Bearbeiten]

Die momenterzeugende Funktion existiert nicht für die logarithmische Normalverteilung.

Entropie[Bearbeiten]

Die Entropie der logarithmischen Normalverteilung (ausgedrückt in nats) beträgt

\mu + \frac{1}{2}\ln\left(2\pi\mathrm{e}\sigma^2\right).

Beziehungen zu anderen Verteilungen[Bearbeiten]

In der Versicherungsmathematik wird die Verteilung der Schadensanzahl häufig mit Hilfe von Zufallsvariablen modelliert, die der Poisson-Verteilung, der Negativ-Binomialverteilung oder der logarithmischen Verteilung genügen. Dagegen eignen sich zur Modellierung der Schadenshöhe insbesondere die Gammaverteilung, die Log-Gammaverteilung oder die Log-Normalverteilung.

Beziehung zur Normalverteilung[Bearbeiten]

Der Logarithmus einer logarithmisch-normalverteilten Zufallsvariablen ist normalverteilt. Genauer: Ist Y eine N(\mu,\sigma^2)-verteilte reelle Zufallsvariable (d.h. normalverteilt mit Erwartungswert \mu und Varianz \sigma^2), so ist die Zufallsvariable X=\mathrm{e}^Y Log-normalverteilt mit diesen Parametern \mu und \sigma^2, allerdings bilden diese Parameter nicht Erwartungswert und Varianz von X. Ist ein bestimmter Erwartungswert und eine bestimmte Varianz gewünscht, so kann man dies leicht durch die folgenden Formeln erreichen:

\sigma^2 = \ln\left( \frac{\mathit{Var}}{E^2} + 1 \right) und
\mu = \ln(E)-\frac{\sigma^2}{2} oder direkt \mu = \ln\left( E^2\ \sqrt[]{\frac{1}{\mathit{Var}+E^2}} \right)

Anwendungen[Bearbeiten]

Black-Scholes-Modell[Bearbeiten]

Im Black-Scholes-Modell folgen Aktienkurse einer geometrischen Brownschen Bewegung und sind damit logarithmisch normalverteilt. In diesem Modell lassen sich explizit Preise von Finanzoptionen bestimmen.

Einkommensverteilung[Bearbeiten]

Häufig sind Einkommen lognormalverteilt. Ein Grund ist, dass es einfach viel weniger bestdotierte Positionen gibt, die Hauptmasse sind Jobs mit mehr oder weniger geringem Einkommen, wobei besonders niedrige Einkommen wieder seltener werden. Das entspricht genau dem Verlauf der meisten Lognormalverteilungen. Dieser Umstand kann in jedem operativ funktionierenden Unternehmen überprüft werden.

Schätzung von Umsatzziffern von Unternehmen[Bearbeiten]

Die Logarithmen aller Fakturenbeträge eines Unternehmens folgen annähernd einer Normalverteilung. Der Abstand zwischen dem Logarithmus des kleinsten und dem Logarithmus des größten Fakturenbetrages repräsentiert annähernd die 6-fache Standardabweichung der Normalverteilung der Logarithmen. Dadurch ist es möglich, auf den Mittelwert oder Erwartungswert der Fakturenbeträge (s.o.) der Lognormalverteilung zu schließen. Multiplikation dieses Mittelwertes mit der Anzahl der gültigen Fakturen ergibt in den meisten Fällen einen akzeptablen Schätzwert für die Größenordnung des Umsatzes eines Unternehmens; wertmäßig liegt er tendenziell zu hoch: Da für solche Schätzungen häufig auch das Benfordsche Gesetz gelten sollte, sollte in diesen Fällen auch die Benford-Verteilung zu Rate gezogen werden. Dabei ist zu beachten, dass die Größenordnungen (Stellenwerte) der Rechnungsbeträge nicht gleichverteilt, sondern annähernd normalverteilt sind.

Versicherungsmathematik[Bearbeiten]

Die logarithmische Normalverteilung wird wegen der oben besprochenen Schiefe und der damit verbundenen Großschadenneigung bei der Modellierung von Risiken häufig als Verteilung der Schadenshöhe eingesetzt. Sind der Erwartungswert E und die Standardabweichung stdev vorgegeben, so erhält man die Parameter der logarithmischen Normalverteilung wie folgt:

\sigma = \sqrt{\ln \left( 1 + \left( \frac{{\rm stdev}}{{\rm E}} \right)^2 \right)}

und

\mu = \ln {\rm E} - \frac{1}{2} \ln \left( 1 + \left( \frac{{\rm stdev}}{{\rm E}} \right)^2 \right) .

Literatur[Bearbeiten]

  •  Eckhard Limpert, Werner Stahel, Markus Abbt: Lognormal distributions across the sciences: keys and clues. In: BioScience. 51, Nr. 5, 2001, S. 341-352 (PDF).