Dichtefunktion

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Wahrscheinlichkeitsdichtefunktion)
Wechseln zu: Navigation, Suche
Dieser Artikel behandelt die Wahrscheinlichkeitsdichte einer reellen Zufallsvariablen. Zu Dichten von Maßen siehe Satz von Radon-Nikodým. Zu physikalischen Dichtefunktionen siehe Dichtekurve und Massenverteilung.

In der Wahrscheinlichkeitstheorie ist die Wahrscheinlichkeitsdichtefunktion, oft kurz Dichtefunktion, Wahrscheinlichkeitsdichte oder nur Dichte (abgekürzt WDF oder pdf von engl. probability density function) genannt, ein Hilfsmittel zur Beschreibung einer stetigen Wahrscheinlichkeitsverteilung. Die Integration der Wahrscheinlichkeitsdichte über ein Intervall [a,b] ergibt die Wahrscheinlichkeit dafür, dass eine Zufallsvariable mit dieser Dichte einen Wert zwischen a und b annimmt. Die Wahrscheinlichkeitsdichte kann Werte größer als 1 annehmen und sollte nicht mit der Wahrscheinlichkeit selbst verwechselt werden.

Formal handelt es sich um eine Dichte bezüglich des Lebesgue-Maßes.

Während im diskreten Fall Wahrscheinlichkeiten von Ereignissen durch Aufsummieren der Wahrscheinlichkeiten der einzelnen Elementarereignisse berechnet werden können (ein idealer Würfel zeigt beispielsweise jede Zahl mit einer Wahrscheinlichkeit von \tfrac 1 6), gilt dies nicht mehr für den kontinuierlichen Fall. Beispielsweise sind zwei Menschen kaum exakt gleich groß, sondern nur bis auf Haaresbreite oder weniger. In solchen Fällen sind Wahrscheinlichkeitsdichtefunktionen nützlich. Mit Hilfe dieser Funktionen lässt sich die Wahrscheinlichkeit für ein beliebiges Intervall – beispielsweise eine Körpergröße zwischen 1,80 m und 1,81 m – bestimmen, obwohl unendlich viele Werte in diesem Intervall liegen, von denen jeder einzelne die Wahrscheinlichkeit 0 hat.

Definition[Bearbeiten]

Es sei P ein Wahrscheinlichkeitsmaß und X sei eine reellwertige Zufallsvariable. Eine Funktion f\colon\R\rightarrow [0,\infty) heißt Wahrscheinlichkeitsdichte der Zufallsvariable X (oder genauer: der Verteilung \mu von X), falls gilt

P(a\leq X\leq b)=\int_a^bf(x)\,\mathrm dx     bzw.      \mu([a,b])=\int_a^bf(x)\,\mathrm dx

für alle reellen Zahlen a<b.

Eigenschaften[Bearbeiten]

Normierung und Eindeutigkeit[Bearbeiten]

Wahrscheinlichkeitsdichte der Lognormalverteilung (mit \mu=0)
Kumulative Verteilungsfunktion der Lognormalverteilung (mit \mu=0)

Die Fläche unter der Dichtefunktion hat den Inhalt 1, d. h.

\int_{-\infty}^\infty f(x) \, {\rm d}x = 1.

Die Wahrscheinlichkeitsdichte ist bis auf Abweichungen in einer Nullmenge eindeutig bestimmt. Sie ist stets nicht-negativ und kann (im Gegensatz zu Wahrscheinlichkeiten) beliebig große Werte annehmen, wie aus dem Bild ersichtlich ist.

Umgekehrt gilt: Jede Funktion f\colon\R\to\R mit f(x) \geq 0 für alle x \in \R und \textstyle\int_{-\infty}^\infty f(x)\,{\rm d}x = 1 ist die Dichtefunktion einer eindeutig bestimmten Wahrscheinlichkeitsverteilung.

Berechnung von Wahrscheinlichkeiten[Bearbeiten]

Die Wahrscheinlichkeit für ein Intervall lässt sich mit der Wahrscheinlichkeitsdichte f oder der zugehörigen kumulativen Verteilungsfunktion F berechnen als

P(X\in [a,b]) = \int_a^b f(x)\, {\rm d}x = F(b)-F(a).

Diese Formel gilt ebenso für die Intervalle (a,b), (a,b] und [a,b), denn einzelne Punkte haben bei Zufallsvariablen mit Dichte die Wahrscheinlichkeit 0; die Verteilungsfunktion ist stetig.

Für komplexere Mengen kann die Wahrscheinlichkeit analog durch Integrieren über Teilintervalle ermittelt werden. Allgemein erhält die Wahrscheinlichkeit die Form

P(X\in A) = \int_A f(x)\, {\rm d}x.

Bedingung für die Existenz einer Wahrscheinlichkeitsdichte[Bearbeiten]

X besitzt eine Wahrscheinlichkeitsdichte f genau dann, wenn die Verteilung von X absolutstetig bezüglich des Lebesgue-Maßes ist, d. h. wenn

P(X \in A) = 0

für jede Lebesgue-Nullmenge A (Satz von Radon-Nikodým).

Zusammenhang von Verteilungsfunktion und Dichtefunktion[Bearbeiten]

Die (kumulative) Verteilungsfunktion F wird als Integral über die Dichtefunktion gebildet:

 F(x) = \int_{-\infty}^x f(t)\,\operatorname dt

Umgekehrt gilt: Wenn die Verteilungsfunktion F differenzierbar ist, ist ihre Ableitung eine Dichtefunktion der Verteilung:

 f(x) = F^\prime(x) = \frac{\operatorname{d}F(x)}{\operatorname{d}x}

Das gilt auch dann noch, wenn es abzählbar viele Stellen x gibt, an denen F stetig, aber nicht differenzierbar ist; welche Werte man an diesen Stellen für f(x) verwendet, ist unerheblich.

Allgemein existiert eine Dichtefunktion genau dann, wenn die Verteilungsfunktion F absolut stetig ist. Diese Bedingung impliziert unter anderem, dass F stetig ist und fast überall eine Ableitung besitzt, die mit der Dichte übereinstimmt.

Es ist jedoch zu beachten, dass es Verteilungen wie die Cantor-Verteilung gibt, die eine stetige, fast überall differenzierbare Verteilungsfunktion besitzen, aber dennoch keine Wahrscheinlichkeitsdichte. Fast überall differenzierbar sind Verteilungsfunktionen immer, aber die entsprechende Ableitung erfasst generell nur den absolutstetigen Anteil der Verteilung.

Dichten auf Teilintervallen[Bearbeiten]

Die Wahrscheinlichkeitsdichte einer Zufallsvariable X, die nur Werte in einem Teilintervall I der reellen Zahlen annimmt, kann so gewählt werden, dass sie außerhalb des Intervalls den Wert 0 hat. Ein Beispiel ist die Exponentialverteilung mit I=[0,\infty[. Alternativ kann die Wahrscheinlichkeitsdichte als eine Funktion f\colon I\to\R betrachtet werden, d. h. als eine Dichte der Verteilung auf I bezüglich des Lebesgue-Maßes auf I.

Erwartungswerte[Bearbeiten]

Mithilfe von Dichtefunktionen können auch Erwartungswerte berechnet werden. Ist X eine Zufallsvariable mit Dichte f, dann gilt für ihren Erwartungswert

\operatorname{E}(X) = \int_{-\infty}^{\infty} x f(x) \, \mathrm dx,

falls das Integral existiert. Allgemeiner ist im Falle der Existenz

\operatorname{E}(g(X)) = \int_{-\infty}^{\infty} g(x) f(x) \, \mathrm dx.

Beispiele[Bearbeiten]

Durch f(x) = 3x^2 für x \in [0,1] und f(x) = 0 sonst ist eine Dichtefunktion f \colon \R \to \R gegeben, denn f ist auf ganz \R nichtnegativ und es gilt

\int_{-\infty}^{\infty} f(x) \, \mathrm dx = \int_0^1 3x^2 \, \mathrm dx = 1.

Für die zugehörige Verteilungsfunktion ergibt sich für x \in [0,1]

F(x) = \int_{-\infty}^{x} f(t) \, \mathrm dt = \int_0^x 3t^2 \, \mathrm dt = x^3

sowie F(x) = 0 für x < 0 und F(x) = 1 für x > 1. Ist X eine Zufallsvariable mit Dichte f, so folgt daher beispielsweise

P(X \leq \tfrac{1}{2}) = F(\tfrac{1}{2}) = \tfrac{1}{8}.

Für den Erwartungswert von X ergibt sich

\operatorname{E}(X) = \int_{-\infty}^{\infty} x f(x) \, \mathrm dx = \int_0^1 3x^3 \, \mathrm dx = \tfrac{3}{4}.

Weitere Beispiele für Wahrscheinlichkeitsdichten sind in der Liste univariater Wahrscheinlichkeitsverteilungen zu finden.

Mehrdimensionale Zufallsvariable[Bearbeiten]

Wahrscheinlichkeitsdichten kann man auch für mehrdimensionale Zufallsvariablen, also für Zufallsvektoren definieren. Ist X eine \R^n-wertige Zufallsvariable, so heißt eine Funktion f\colon\R^n\rightarrow[0,\infty] Wahrscheinlichkeitsdichte (bezüglich des Lebesgue-Maßes) der Zufallsvariable X, falls gilt

P(X\in A)=\int_A f(x) \mathrm d^n x

für alle Borelmengen A\in\mathcal{B}(\R^n).

Speziell folgt dann für n-dimensionale Intervalle I = [a_1,b_1] \times \dotsb \times [a_n,b_n] mit reellen Zahlen a_1<b_1,\dotsc,a_n<b_n:

P(X \in I) = \int_{a_1}^{b_1} \dotsi \int_{a_n}^{b_n} f(x_1, \dotsc, x_n)\ \mathrm{d}x_n \dotso \mathrm{d}x_1.

Der Begriff der Verteilungsfunktion lässt sich ebenfalls auf mehrdimensionale Zufallsvariablen erweitern. Hier ist in der Notation F(x)=P(X\leq x) das x ein Vektor und das \leq\,-Zeichen komponentenweise zu lesen. F ist also hierbei eine Abbildung von \R^n\, in das Intervall [0,1] und es gilt

F(x_1, \dotsc, x_n) = \int_{-\infty}^{x_1} \dotsi \int_{-\infty}^{x_n} f(t_1, \dotsc, t_n)\ \mathrm{d}t_n \dotso \mathrm{d}t_1.

Wenn F n-mal stetig differenzierbar ist, erhält man eine Wahrscheinlichkeitsdichte durch partielle Differentiation:

f(x_1,x_2, \dotsc, x_n) = \frac{\partial^n F(x_1,x_2, \dotsc, x_n)}{\partial x_1 \dotso \partial x_n}.

Die Dichten f_i der Komponentenvariablen X_i lassen sich als Dichten der Randverteilungen durch Integration über die übrigen Variablen berechnen.

Des Weiteren gilt: Ist X=(X_1,\dots X_n) eine \R^n-wertige Zufallsvariable mit Dichte, so sind äquivalent:

  • X besitzt eine Dichte der Form f(x_1,\dots, x_n) = f_1(x_1) \cdot \ldots \cdot f_n(x_n), wobei f_i die reelle Wahrscheinlichkeitsdichte von X_i ist.
  • Die Zufallsvariablen X_1,\dots, X_n sind unabhängig.

Schätzung einer Wahrscheinlichkeitsdichte anhand diskreter Daten[Bearbeiten]

Häufigkeitsdichte

Diskret erfasste, aber eigentlich stetige Daten (Beispielsweise die Körpergröße in Zentimetern) können als Häufigkeitsdichte repräsentiert werden. Das so erhaltene Histogramm ist eine stückweise konstante Schätzung der Dichtefunktion. Alternativ kann beispielsweise mit sogenannten Kerndichteschätzern die Dichtefunktion durch eine stetige Funktion geschätzt werden. Der dazu verwendete Kern sollte dem erwarteten Messfehler entsprechen.

Literatur[Bearbeiten]

  • Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. de Gruyter Lehrbuch, Berlin 2009, ISBN 978-3-11-021526-7.
  • Norbert Henze: Stochastik für Einsteiger. 7. Auflage. Vieweg Verlag, Wiesbaden 2008, ISBN 978-3-8348-0423-5.
  • Achim Klenke: Wahrscheinlichkeitstheorie. 2. Auflage. Springer-Verlag, ISBN 978-3-540-76317-8.
  • Lothar Sachs, Jürgen Hedderich: Angewandte Statistik: Methodensammlung mit R. 12. Auflage. Springer-Verlag, Berlin Heidelberg 2006, ISBN 978-3-540-32160-6.