Überdispersion

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Überdispersionsparameter)
Zur Navigation springen Zur Suche springen

In der Statistik liegt bei der Modellierung von Zähldaten Überdispersion, auch Überstreuung genannt (lateinisch dispersio = „Zerstreuung“ bzw. dispergere = „verteilen, ausbreiten, zerstreuen“) vor, wenn die Daten eine größere Streuung (Varianz) aufweisen als durch das Modell (z. B. Binomialmodell oder Poisson-Modell) zu erwarten wäre.

Bei einer Poisson-Regression ist im Falle des Vorliegens von Überdispersion die Varianz größer als der Erwartungswert. Das Gegenstück der Überdispersion ist die Unterdispersion. Unterdispersion liegt vor, wenn die Daten eine geringere Streuung aufweisen als durch das Modell angenommen.

Ursachen[Bearbeiten | Quelltext bearbeiten]

Im Wesentlichen sind die Hauptursachen von Überdispersion das Vorliegen von

Theoretische Beispiele[Bearbeiten | Quelltext bearbeiten]

Anhand des Beispiels einer Poisson-Regression[Bearbeiten | Quelltext bearbeiten]

Ein Charakteristikum der Poisson-Verteilung ist, dass zugleich der Erwartungswert und die Varianz ist:

.

Aus ähnlichen Gründen wie bei Binomialdaten wird bei Anwendungen der Poisson-Regression häufig eine signifikant höhere empirische Varianz beobachtet. Aus diesem Grund ist es oft nützlich, einen Überdispersionsparameter unter der Annahme einzuführen, dass[1]

.

Geschätzter Überdispersionsparameter κ bei ausgewählten Infektionskrankheiten[Bearbeiten | Quelltext bearbeiten]

Der Überdispersionsparameter κ (fälschlicherweise auch als Dispersionsparameter oder Dispersionsfaktor und mit statt [A 1] bezeichnet) gibt in der Epidemiologie an, wie sich das Ausbreitungsgeschehen im zunehmenden Maß auf einzelne, bereits mit einem Krankheitserreger infiziere Organismen konzentriert; die Basisreproduktionszahl ermöglicht Aussagen über die Verteiltung von κ. Bei einem Wert von stecken alle infizierten Organismen, gleich viele nichtinfizierte an. Bei Werten von erfolgt die Ansteckung mit einer Infektionskrankheit mehr und mehr durch sog. Superspreader.

Dispersionsgrad von ausgewählten Infektionskrankheiten[2]
Infektionskrankheit Geschätzter Überdispersionsparameter κ
Saisonale Grippe 1
SARS-Pandemie 2002/2003 0,16
MERS 0,25
Spanische Grippe 1

Anmerkungen[Bearbeiten | Quelltext bearbeiten]

  1. In der Statistik werden konventionell für Populationsgrößen griechische Buchstaben und für Stichprobengrößen lateinische Buchstaben verwendet.

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Ludwig Fahrmeir, Thomas Kneib, Stefan Lang, Brian Marx: Regression: models, methods and applications. Springer Science & Business Media, 2013, ISBN 978-3-642-34332-2, S. 294.
  2. Wie Superspreader die Pandemie beeinflussen. Abgerufen am 31. Mai 2020.