Kullback-Leibler-Divergenz
Die Begriffe Kullback-Leibler-Divergenz (kurz KL-Divergenz), Kullback-Leibler-Entropie, Kullback-Leibler-Information oder Kullback-Leibler-Abstand (nach Solomon Kullback und Richard Leibler) bezeichnen ein Maß für die Unterschiedlichkeit zweier Wahrscheinlichkeitsverteilungen. Diese werden häufig mit
und
bezeichnet, typischerweise repräsentiert dabei
Beobachtungen oder eine präzise Wahrscheinlichkeitsverteilung, während
ein Modell oder eine Approximation darstellt.
Vorsicht: Die KL-Divergenz wird auch relative Entropie genannt, wobei der Begriff relative Entropie gelegentlich auch für die Transinformation verwendet wird.
Formal lässt sich die KL-Divergenz für die Wahrscheinlichkeitsfunktionen
und
diskreter Werte folgendermaßen bestimmen:
Werden die Verteilungen
und
für kontinuierliche Werte durch die Wahrscheinlichkeitsdichtefunktionen
und
dargestellt, wird hingegen ein Integral berechnet:
Die Kullback-Leibler-Divergenz gibt aus informationstheoretischer Sicht an, wie viele Bits durchschnittlich verschwendet werden, wenn eine eigentlich auf
basierende Kodierung auf Ereignisse angewendet wird, die
folgen. Somit besteht ein Zusammenhang zur Kanalkapazität.
Anstatt der Kullback-Leibler-Divergenz wird auch oft die Kreuzentropie verwendet. Diese liefert qualitativ vergleichbare Werte, kann jedoch ohne die Kenntnis von
berechnet werden. In praktischen Anwendungen ist dies vorteilhaft, da dort
meist unbekannt ist.
[Bearbeiten] Belege
- S. Kullback, R. A. Leibler: On information and sufficiency. In: Annals of Mathematical Statistics. 22, Nr. 1, März 1951, S. 79–86.
- S. Kullback, John Wiley & Sons (Hrsg.): Information theory and statistics. 1959.
- Springer Online Reference Works. eom.springer.de, abgerufen am 31. März 2008 (englisch).

