Benutzer:Pardox/Spielwiese

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Geburtstagsparadoxon[Bearbeiten | Quelltext bearbeiten]

Das Geburtstagsparadoxon, manchmal auch als Geburtstagsproblem bezeichnet, ist ein Beispiel dafür, dass bestimmte Wahrscheinlichkeiten (und auch Zufälle) intuitiv häufig falsch abgeschätzt werden. Das Geburtstagsparadoxon wird oft Richard von Mises zugeschrieben:

Befinden sich in einem Raum mindestens 23 Personen, dann ist die Chance, dass zwei oder mehr dieser Personen am selben Tag Geburtstag haben, größer als 50%.

Laut Donald Ervin Knuth ist dieser Ursprung nicht so sicher: Das Geburtstagsparadoxon wurde informell unter Mathematikern in den 1930er Jahren diskutiert, ein genauer Urheber lässt sich aber nicht nachvollziehen.[1]

Mathematische Herleitung[Bearbeiten | Quelltext bearbeiten]

Im Folgenden wird der 29. Februar vernachlässigt und angenommen, dass die Geburtstage der Personen unabhängig identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung auf der 365-elementigen Menge sind. Diese Annahme ist beispielsweise dann nicht erfüllt, wenn sich unter den anwesenden Personen Zwillinge befinden.

Im Urnenmodell entspricht diese Annahme einer Ziehung von Kugeln mit Zurücklegen aus einer Urne, die 365 Kugeln mit der Beschriftung „1. Januar“, „2. Januar“, bis „31. Dezember“ enthält.

Die Anzahl aller möglichen Fälle ist für Personen , wobei alle Fälle gleich wahrscheinlich sind. Zum Beispiel ergeben sich für zwei Personen mögliche Fälle von Geburtstagskombinationen.

Von diesen möglichen Fällen beinhalten

nur unterschiedliche Geburtstage. Für die erste Person kann der Geburtstag frei gewählt werden, für die zweite gibt es dann 364 Tage, an denen die erste nicht Geburtstag hat etc.

Damit ergibt sich nach der Formel von Laplace die Wahrscheinlichkeit von

dass alle Personen an unterschiedlichen Tagen Geburtstag haben.

Die Wahrscheinlichkeit für mindestens einen doppelten Geburtstag im Verlauf eines Jahres ist somit

Mit der Stirling-Formel lässt sich dies gut nähern zu

Berechnet man etwa für =10, 11, …, bis 23 mit einem Taschenrechner nach der oben angegebenen Formel für mindestens einen doppelten Geburtstag im Verlauf eines Jahres, kommt man zu dem Ergebnis, dass für eine Wahrscheinlichkeit von mindestens 50 % nur 23 Personen benötigt werden. In Gruppen ab 57 Personen beträgt die Wahrscheinlichkeit schon über 99 % (siehe Grafik).

Ungleichmäßig verteilte Geburtstage[Bearbeiten | Quelltext bearbeiten]

In der Realität sind nicht alle Geburtstermine gleich wahrscheinlich, so werden z. B. im Sommer mehr Kinder geboren als im Winter.[2] Dadurch nimmt die Wahrscheinlichkeit, dass zwei Personen am gleichen Tag Geburtstag haben, leicht zu.[3][4] Simulationen zeigen allerdings, dass auch für echte Daten die Wahrscheinlichkeit, dass zwei Personen am gleichen Tag Geburtstag haben, nach wie vor bei 23 Personen 50 % übersteigt.[5] Auch die Berücksichtigung des in der Herleitung vernachlässigten Schalttags ändert daran nichts.

Bedeutung in der Kryptographie[Bearbeiten | Quelltext bearbeiten]

Dieser Effekt hat eine Bedeutung bei kryptographischen Hash-Funktionen, die einen eindeutigen Prüfwert aus einem Text ergeben sollen. Es ist dabei viel einfacher, zwei zufällige Texte zu finden, die denselben Prüfwert haben, als zu einem vorgegebenen Text einen weiteren zu finden, der denselben Prüfwert aufweist (siehe Geburtstagsangriff).

Variante des Geburtstagsparadoxons[Bearbeiten | Quelltext bearbeiten]

Im Unterschied dazu steht die Wahrscheinlichkeit, dass jemand an einem ganz bestimmten Tag (ohne Beachtung des Jahrgangs) Geburtstag hat: Wenn man sich zum Beispiel eine der 23 Personen nimmt und fordert, dass jemand mit genau dieser am selben Tag Geburtstag hat. Ist also durch den Geburtstag einer der anwesenden Personen der bestimmte Tag festgelegt, sind weitere 253 Personen (also insgesamt 254 Personen) notwendig, um eine Wahrscheinlichkeit von 50 % zu erreichen (siehe Binomialverteilung).

= Wahrscheinlichkeit für mindestens einen doppelten Geburtstag
= Wahrscheinlichkeit, dass ein Geburtstag mit deinem zusammenfällt

Der Grund für diesen großen Unterschied liegt darin, dass es bei Personen verschiedene Paare gibt, die am selben Tag Geburtstag haben könnten. Die Wahrscheinlichkeit für das Zusammentreffen beziehungsweise Kollidieren zweier Geburtstage steigt daher für kleine Werte von ungefähr mit dem Quadrat der Anzahl an.

Mathematische Herleitung[Bearbeiten | Quelltext bearbeiten]

Unter den oben getroffenen Annahmen ist die Wahrscheinlichkeit, an einem bestimmten Tag Geburtstag zu haben

.

Die Wahrscheinlichkeit für das Gegenteil, also die Wahrscheinlichkeit, an einem bestimmten Tag nicht Geburtstag zu haben, ist damit

.

Bei zwei unabhängigen Versuchen (die Geburtstage zweier Personen werden als unabhängig betrachtet) ist die Wahrscheinlichkeit, keinen Treffer zu haben (am bestimmten Tag hat keiner von beiden Geburtstag) .

Dabei mindestens einen Treffer zu haben (mindestens eine Person von zweien hat an einem bestimmten Tag Geburtstag), ist wieder die Gegenwahrscheinlichkeit, also

.

Allgemein ausgedrückt ist die Wahrscheinlichkeit , mit der mindestens eine Person von anwesenden Personen an einem bestimmten Tag Geburtstag hat

.

Damit lässt sich ausrechnen, wie viele Personen man braucht, um eine bestimmte Wahrscheinlichkeit zu erreichen, dass mindestens eine Person an einem bestimmten Tag Geburtstag hat.

Für eine Wahrscheinlichkeit von 50 % benötigt man

Teilnehmer.

Schließlich errechnet sich für den Fall, dass eine der anwesenden Personen Geburtstag hat, die Wahrscheinlichkeit, dass von den übrigen Personen mindestens eine am gleichen Tag Geburtstag hat, zu

.

Die Wahrscheinlichkeit ist gleichzeitig der adäquate Vergleichsmaßstab, wenn im Gegensatz zu den Betrachtungen für einen bestimmten Tag der Fokus auf die Gesamtheit aller Tage des Jahres gerichtet wird.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Auch das Lincoln-Kennedy-Mysterium ist ein Phänomen, das mit der Übereinstimmung von biographischen Daten zu tun hat.

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Donald E. Knuth: The Art of Computer Programming, Volume 3, Sorting and Searching. Second Edition, ISBN 0-201-89685-0. S. 513.
  2. Emma Hawe, Alison Macfarlane and John Bithell: Daily and seasonal variation in live births, stillbirths and infant mortality in England and Wales, 1979–96 in Health Statistics Quarterly 9 Spring 2001 S 7: There was a clear seasonal pattern in the number of daily live births throughout the entire period, with lower numbers of births in the winter than the summer months.
  3. Bloom, D. (1973), A birthday problem, American Mathematical Monthly, vol. 80, S. 1141–1142 enthält einen Beweis mit Lagrange-Multiplikatoren, dass für nicht gleichmäßig verteilte Geburtstage die Wahrscheinlichkeit zunimmt, dass zwei Personen am selben Tag Geburtstag haben.
  4. Stefan Kirchner in de.sci.mathematik, 3. Nov. 2005
  5. Hugo Pfoertner in de.sci.mathematik, 22. Jan. 2005

Weblinks[Bearbeiten | Quelltext bearbeiten]