Galton-Watson-Prozess

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der Galton-Watson-Prozess, benannt nach dem britischen Naturforscher Francis Galton (1822–1911) und seinem Landsmann, dem Mathematiker Henry William Watson (1827–1903), ist ein spezieller stochastischer Prozess, der benutzt wird, um die zahlenmäßige Entwicklung einer Population von sich selbst replizierenden Individuen mathematisch zu modellieren. Er wird bisweilen auch als Bienaymé-Galton-Watson-Prozess bezeichnet, zu Ehren des Franzosen Irénée-Jules Bienaymé (1796–1878), der dasselbe Problem bereits längere Zeit vorher bearbeitet hatte.

Geschichte[Bearbeiten]

50 unabhängige GW-Prozesse mit Startwert 20 und Poisson-verteilten Nachkommen mit Parameter 0.95. Bereits bei t=41 sind alle bis auf 6 Populationen ausgestorben.

Im England des viktorianischen Zeitalters war die Aristokratie zunehmend besorgt über den Umstand, dass immer wieder Adelsgeschlechter aus Mangel an männlichen Nachkommen ausstarben und somit immer mehr traditionsreiche Namen aus der adligen Gesellschaft verschwanden. Galton, der selbst kein Mathematiker war, veröffentlichte 1873 in der Wissenschaftszeitschrift Educational Times die Frage nach der Wahrscheinlichkeit einer solchen Auslöschung und erhielt prompt Antwort von Watson. Im darauffolgenden Jahr erschien ihre Gemeinschaftsarbeit On the probability of extinction of families, in welcher sie ein stochastisches Konzept vorstellten, das heute als Galton-Watson-Prozess bekannt ist. Das Ergebnis, zu dem sie kamen, war, dass bei konstanter Bevölkerungszahl im Laufe der Zeit alle Namen bis auf einen aussterben würden. Offenbar entstand diese Arbeit im Unwissen über die Ergebnisse von Bienaymé.

Zuerst blieb das Problem der aussterbenden Nachnamen das einzige, auf das das Galton-Watson-Konzept angewendet wurde. Doch schon bald begannen Biologen, damit die Ausbreitung von Lebewesen zu modellieren. Heute wird der Prozess in vielfältigen Gebieten eingesetzt, von der Warteschlangentheorie bis hin zur Verbreitung von Computerviren und Kettenbriefen.

Mathematische Modellierung[Bearbeiten]

Dasselbe Experiment mit Poisson-Parameter 1 (statt 0.95). Diesmal haben bis t=50 ganze 24 von 50 Populationen überlebt.

Im mathematischen Modell gibt der Prozess (X_t),\;t \in \N_0 die Anzahl der Individuen zum Zeitpunkt t an, wobei der Startwert X_0 fest vorgegeben ist. Die Verteilung \rho, die nur Werte in \N_0 annimmt, gibt an, wie viele Nachkommen ein einzelnes Individuum erzeugt (im ursprünglichen Fall also die männlichen Nachkommen eines männlichen Stammhalters). Es wird angenommen, dass die Individuen ihre Nachkommen unabhängig von den anderen Individuen zeugen und selbst nach einer Periode sterben, womit die Verteilung des Prozesses durch die Übergangswahrscheinlichkeit

(X_t|X_{t-1}=n) \sim \rho^{n*}

gegeben, wobei \rho^{n*} die n-fache Faltung der Verteilung \rho bezeichnet (die null-fache Faltung einer Verteilung ergibt nach Definition eine Verteilung, die fast sicher Null ist).

Somit ist X eine (zeitlich homogene) Markow-Kette, bei der die (abzählbar unendlich große) Übergangsmatrix durch

\Pi_{k,n}:= \rho^{k*}(n)

gegeben ist. Da \Pi_{0,0}=1 ist, kann ein Prozess, der einmal den wert 0 erreicht hat, in Zukunft keinen anderen Wert als 0 annehmen (ausgestorbene Populationen können nicht wieder auferstehen). Die 0 ist also ein absorbierender Zustand, und im Allgemeinen auch der einzige. Eine Ausnahme bildet der (uninteressante) Spezialfall, in dem \rho(1)=1 ist, dass also jedes Individuum fast sicher genau einen Nachkommen hat. Dann bleibt die Anzahl der Individuen natürlich fast sicher konstant und jeder Zustand ist absorbierend.

Die Aussterbewahrscheinlichkeit[Bearbeiten]

Die Frage, an der Galton und Watson interessiert waren, war die nach der Wahrscheinlichkeit des Aussterbens einer Population, also nach der Variable

h(k):=P(\lim_{n \to \infty}X_n=0|X_0=k).

Zunächst sieht man schnell, dass h(k)=h(1)^k\;\forall k \in \N_0, deshalb genügt es, Populationen zu betrachten, die mit einem Individuum starten.

Das wichtigste Ergebnis ist das folgende: Die Aussterbewahrscheinlichkeit ist der kleinste Fixpunkt der erzeugenden Funktion von \rho, also der Potenzreihenfunktion

\phi_{\rho}(s)=\sum_{n=0}^{\infty}s^n\rho(n).

Eine Folgerung daraus besagt, dass die Aussterbewahrscheinlichkeit genau dann echt kleiner als 1 ist, wenn der Erwartungswert der Verteilung \rho echt größer als 1 ist, wenn also jedes Individuum im Mittel mehr als einen Nachkommen generiert. Auch hier ist der Spezialfall \rho(1)=1 eine Ausnahme: obwohl der Erwartungswert exakt 1 beträgt, ist hier natürlich ein Aussterben unmöglich. Dies ist letztlich immer genau dann der Fall, wenn \rho(0)=0, wenn also jedem Individuum mindestens ein Nachkomme garantiert ist.

Eine weitere Eigenschaft der Galton-Watson-Prozesses lässt sich auch aus den erzeugenden Funktionen gewinnen: falls X_0=1 fast sicher gilt, so gilt für die erzeugende Funktion der Zufallsvariablen X_n:

\phi_{X_n}(s)= \phi_{\rho}^{n \circ} (s),

wobei  f^{n \circ} die n-fache Komposition (Hintereinanderausführung) einer Funktion f bezeichnet.