Geburtstagsparadoxon

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Die fraglichen Angaben werden daher möglicherweise demnächst entfernt. Bitte hilf der Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst. Näheres ist eventuell auf der Diskussionsseite oder in der Versionsgeschichte angegeben. Bitte entferne zuletzt diese Warnmarkierung.

Das Geburtstagsparadoxon, manchmal auch als Geburtstagsproblem bezeichnet, ist ein Beispiel dafür, dass bestimmte Wahrscheinlichkeiten (und auch Zufälle) intuitiv häufig falsch geschätzt werden:

„Befinden sich in einem Raum mindestens 23 Personen, dann ist die Chance, dass zwei oder mehr dieser Personen am gleichen Tag (ohne Beachtung des Jahrganges) Geburtstag haben, größer als 50 %.“[1]

Zum falschen Schätzen der Wahrscheinlichkeit kommt es, weil im Geburtstagsparadoxon danach gefragt wird, wie wahrscheinlich es ist, dass zwei beliebige Personen aus einer Gruppe an ein und demselben beliebigen Tag im Jahr Geburtstag haben. Fälschlicherweise wird das Problem oft interpretiert als „wie wahrscheinlich es ist, dass eine bestimmte Person aus einer Gruppe an einem bestimmten Tag im Jahr Geburtstag hat“ (z. B. Übereinstimmung mit dem Geburtstag einer anderen, zusätzlichen Person), und diese Wahrscheinlichkeit ist tatsächlich deutlich kleiner.

Das Paradoxon wird oft Richard von Mises zugeschrieben z.B. von Persi Diaconis und Frederick Mosteller. [2] Laut Donald E. Knuth ist dieser Ursprung nicht sicher: Das Geburtstagsparadoxon wurde informell unter Mathematikern schon in den 1930er Jahren diskutiert, ein genauer Urheber lässt sich aber nicht ermitteln.[3]

Eingrenzung[Bearbeiten | Quelltext bearbeiten]

Frage: Wie hoch ist die Wahrscheinlichkeit, dass bei 23 Personen mindestens zwei von ihnen am gleichen Tag im Jahr Geburtstag haben?

Die Antwort ist für die meisten verblüffend und wird deshalb als paradox wahrgenommen. So schätzen die meisten Menschen die Wahrscheinlichkeit um eine Zehnerpotenz falsch ein. Sie liegt nicht (wie zumeist geschätzt) zwischen 1 % und 5 %, sondern über 50 %, bei 50 Personen sogar bei über 97 %.

Im Unterschied dazu steht die Wahrscheinlichkeit, dass jemand an einem ganz bestimmten Tag (ohne Beachtung des Jahrgangs) Geburtstag hat: Wenn man sich zum Beispiel eine der 23 Personen nimmt und fordert, dass jemand mit genau dieser am gleichen Tag Geburtstag hat. Ist also durch den Geburtstag einer der anwesenden Personen der bestimmte Tag festgelegt, sind weitere 231 Personen (also insgesamt 254 Personen) notwendig, um eine Wahrscheinlichkeit von 50 % zu erreichen (siehe Binomialverteilung).

Der Grund für diesen großen Unterschied liegt darin, dass aus Personen verschiedene Paare gebildet werden können; die Zahl der möglichen Paare steigt daher mit wachsender Zahl der Personen in der Gruppe immer schneller an – wenn die -te Person dazukommt, steigt die Zahl der Paare um . Die Bedingung für das in Frage stehende Ereignis ist schon erfüllt, wenn ein einziges dieser Paare am gleichen Tag Geburtstag hat. Da die Wahrscheinlichkeit, am gleichen Tag Geburtstag zu haben, für jedes Paar gleich groß ist und die Anzahl der Paare mit wachsender Zahl an Personen immer schneller ansteigt, steigt auch die Wahrscheinlichkeit, dass zwei Personen in der Gruppe am gleichen Tag Geburtstag haben, mit wachsender Gruppengröße immer schneller an.

Ungleichmäßig verteilte Geburtstage[Bearbeiten | Quelltext bearbeiten]

In der Realität sind nicht alle Geburtstermine gleich wahrscheinlich, so werden z. B. im Sommer mehr Kinder geboren als im Winter.[4] Dadurch nimmt die Wahrscheinlichkeit, dass zwei Personen am gleichen Tag Geburtstag haben, leicht zu.[5][6] Simulationen zeigen allerdings, dass auch für echte Daten die Wahrscheinlichkeit, dass zwei Personen am gleichen Tag Geburtstag haben, nach wie vor bei 23 Personen 50 % übersteigt.[7] Auch die Berücksichtigung des in der Herleitung vernachlässigten Schalttags ändert daran nichts.

Bedeutung in der Kryptographie[Bearbeiten | Quelltext bearbeiten]

Dieser Effekt hat eine Bedeutung bei kryptographischen Hashfunktionen, die einen eindeutigen Prüfwert aus einem Text ergeben sollen. Es ist dabei viel einfacher, zwei zufällige Texte zu finden, die denselben Prüfwert haben, als zu einem vorgegebenen Text einen weiteren zu finden, der denselben Prüfwert aufweist (siehe Kollisionsangriff).

Mathematische Herleitungen[Bearbeiten | Quelltext bearbeiten]

Im Folgenden wird der 29. Februar vernachlässigt und angenommen, dass die Geburtstage der Personen unabhängige, identisch verteilte Zufallsvariablen aus der diskreten Gleichverteilung auf der 365-elementigen Menge {1. Jan., 2. Jan., …, 31. Dez.} sind. Diese Annahme ist beispielsweise dann nicht erfüllt, wenn sich unter den anwesenden Personen Zwillinge befinden.

Im Urnenmodell entspricht diese Annahme einer Ziehung von Kugeln mit Zurücklegen aus einer Urne, die 365 Kugeln mit der Beschriftung „1. Januar“, „2. Januar“ usw. bis „31. Dezember“ enthält.

Wahrscheinlichkeit, dass mindestens zwei Personen am gleichen Tag Geburtstag haben[Bearbeiten | Quelltext bearbeiten]

Die Anzahl aller möglichen Kombinationen ist für n Personen m = 365n, wobei alle Fälle gleich wahrscheinlich sind. Zum Beispiel ergeben sich für zwei Personen 3652 = 133225 mögliche Fälle von Geburtstagskombinationen.

= Wahrscheinlichkeit für mindestens einen doppelten Geburtstag
= Wahrscheinlichkeit, dass mindestens ein Geburtstag mit deinem zusammenfällt

Von diesen möglichen Fällen beinhalten

nur unterschiedliche Geburtstage. Für die erste Person kann der Geburtstag frei gewählt werden, für die zweite gibt es dann 364 Tage, an denen die erste nicht Geburtstag hat etc.

Damit ergibt sich nach der Formel von Laplace die Wahrscheinlichkeit von

dass alle n Personen an unterschiedlichen Tagen Geburtstag haben.

Die Wahrscheinlichkeit für mindestens einen doppelten Geburtstag im Verlauf eines Jahres ist somit

Für n = 23 ergibt sich:

Nach dem Schubfachprinzip ist (unter Vernachlässigung des 29. Februars) für alle n > 365 die Wahrscheinlichkeit gleich 1, es gibt also mit Sicherheit zwei Personen mit gleichem Geburtstag. Wenn der 29. Februar als Geburtstag nicht vernachlässigt wird, dann gilt dies erst ab n > 366.

Eine Approximation

Der Ausdruck für P kann weiter umgeformt werden:

Mit der Stirlingformel lässt sich dies gut nähern zu

was man leicht mit einem Taschenrechner auswerten kann.

In einer Gruppe von 23 Personen muss man verschiedene Vergleiche anstellen, um einen vollständigen Überblick zu bekommen, ob es gemeinsame Geburtstage gibt, und wenn ja, wie viele.

Wahrscheinlichkeit für einen bestimmten Tag[Bearbeiten | Quelltext bearbeiten]

Eine andere Frage liegt vor, wenn man nicht nach beliebigen Übereinstimmungen der Geburtstage sucht, sondern nach Übereinstimmung mit einem fest ausgewählten Tag im Jahr.

Ignoriert man wie bisher den 29. Februar, so ist die Wahrscheinlichkeit für eine Person, an einem solchen bestimmten Tag Geburtstag zu haben, gleich 1/365 ≈ 0,27 %.

Die Wahrscheinlichkeit für das Gegenteil, also die Wahrscheinlichkeit, an einem bestimmten Tag nicht Geburtstag zu haben, ist damit

Bei zwei Personen ist die Wahrscheinlichkeit, dass an dem vorher ausgewählten Tag keine von beiden Geburtstag hat, gleich (wie bisher nehmen wir an, dass die Geburtstage der Personen unabhängig sind).

Dabei mindestens einen Treffer zu haben (mindestens eine Person von zweien hat an einem bestimmten Tag Geburtstag), ist wieder die Gegenwahrscheinlichkeit, also

So fortfahrend für größere Anzahlen von Personen erhält man: Die Wahrscheinlichkeit , dass mindestens eine Person von anwesenden Personen an einem bestimmten Tag Geburtstag hat, ist

Damit lässt sich ausrechnen, wie viele Personen man braucht, um eine bestimmte Wahrscheinlichkeit P zu erreichen, dass mindestens eine Person an einem bestimmten Tag Geburtstag hat:

Für eine Wahrscheinlichkeit von 50 % benötigt man

Personen.

Wie beim vorigen Problem sind auch hier bei 253 Personen 253 Vergleiche mit dem bestimmten Datum erforderlich, um einen vollständigen Überblick über die Situation zu haben.

Schließlich errechnet sich für den Fall, dass eine der anwesenden Personen Geburtstag hat, die Wahrscheinlichkeit, dass von den übrigen Personen mindestens eine am gleichen Tag Geburtstag hat, zu

Im Unterschied zur Wahrscheinlichkeit, dass mindestens zwei Personen an einem Tag Geburtstag haben (siehe oben), gibt es hier kein n, für das man eine sichere Aussage treffen kann: für jede Personenzahl gibt es die Möglichkeit, dass der ausgewählte Tag nicht als Geburtstag vorkommt (das Schubfachprinzip ist nicht anwendbar). Für alle n gilt:

Wahrscheinlichkeit, dass genau zwei Personen am gleichen Tag Geburtstag haben[Bearbeiten | Quelltext bearbeiten]

Bei diesem Problem lautet das konkrete Ereignis : „2 Personen haben am gleichen Tag Geburtstag, alle anderen an unterschiedlichen Tagen.“ Es gibt 365 Möglichkeiten für den Tag des Doppelgeburtstags. Die beiden Personen lassen sich auf Arten auswählen. Die verbleibenden n - 2 Personen werden nacheinander auf die restlichen 364 Tage verteilt, und zwar so, dass es keine weitere Mehrfachbelegung gibt. Dafür gibt es Möglichkeiten. Danach bleiben noch Tage des Jahres übrig, an denen niemand Geburtstag hat. Insgesamt erhält man für das Eintreten des Ereignisses günstige Fälle. Die gesuchte Wahrscheinlichkeit für das Eintreten des Ereignisses beträgt , da wieder alle 365 Tage des Jahres als gleich wahrscheinlich angenommen werden. Die Wahrscheinlichkeiten stellen eine Zahlenfolge in Abhängigkeit von n dar, die streng monoton bis n = 28 wächst. Dort beträgt die Wahrscheinlichkeit rund 38,6 %. Danach fällt die Folge streng monoton. Ab n = 367 ist die Wahrscheinlichkeit 0, da das Ereignis in diesen Fällen nicht mehr eintreten kann, weil es dann Mehrfachgeburtstage oder mehrere Doppelgeburtstage gibt.

Verwandte Fragen[Bearbeiten | Quelltext bearbeiten]

Bei dem Spiel Memory sind die Paare unter 2N Karten (bestehend aus N Paaren) aufzudecken. Zu Beginn des Spiels liegen alle Karten verdeckt, und solange nur verschiedene Karten aufgedeckt werden, haben die Spieler nur zufällig die Möglichkeit, ein Paar zu finden. Deshalb stellt sich die Frage – ähnlich wie beim Geburtstagsparadoxon – wie viele Karten man aufdecken muss, um mit einer gewissen Wahrscheinlichkeit (z. B. 50 %) mindestens ein Paar zu bekommen.

Die Anzahl N der verschiedenen Motive entspricht hier der Anzahl der Tage im Jahr (365) im Geburtstagsparadoxon. Üblicherweise wird Memory mit 32 Paaren gespielt, es gibt aber auch andere Varianten, sodass es sinnvoll ist, die Zahl N variabel zu halten.

Setzt man für die Wahrscheinlichkeit, durch Aufdecken von n Karten nur verschiedene Karten aufzudecken, so gilt:

Als Ergebnis bekommt man für N = 32: bei Aufdecken von 10 Karten ist die Wahrscheinlichkeit größer als 50 %, mindestens ein Paar zu erhalten (1 - P32(10) = 56,4 %). Für N = 50 liegt die Grenze bei 12 Karten. Bei einem hypothetischen Memory mit 183 Paaren muss man 23 Karten aufdecken, bei 365 Paaren sind 32 Karten notwendig.[8]

Dieses Ergebnis hat wichtige praktische Auswirkungen auf das Spiel, da die Spieler die Lust verlieren würden, wenn es zu lange dauert, bis das erste Paar aufgedeckt wird.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

  • Das Sammelbilderproblem behandelt eine ähnliche Frage. Hier geht es – übertragen auf die Beobachtung von Geburtstagen in einer Gruppe von Menschen – darum, wie viele Personen ausgewählt werden müssen, damit jeder Tag des Jahres als Geburtstag einer der Personen vorkommt.
  • Auch das Lincoln-Kennedy-Mysterium ist ein Phänomen, das mit der Übereinstimmung von biographischen Daten zu tun hat.

Weblinks[Bearbeiten | Quelltext bearbeiten]

 Wiktionary: Geburtstagsparadoxon – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Richard von Mises: Über Aufteilungs- und Besetzungswahrscheinlichkeiten Revue de la Faculté de Sciences de l'Université d'Istanbul N.S.4. 1938–39, S. 145–163
  2. P. Diaconis, F. Mosteller, Methods for Studying Coincidences. In : Journal of the American Statistical Association, 84,4, S. 853-861
  3. Donald E. Knuth: The Art of Computer Programming. Bd. 3, Sorting and Searching. Second Edition, ISBN 0-201-89685-0. S. 513.
  4. Emma Hawe, Alison Macfarlane and John Bithell: Daily and seasonal variation in live births, stillbirths and infant mortality in England and Wales, 1979–96 in Health Statistics Quarterly 9 Spring 2001 (PDF; 180 kB) S 7: There was a clear seasonal pattern in the number of daily live births throughout the entire period, with lower numbers of births in the winter than the summer months.
  5. D. Bloom (1973): A birthday problem. American Mathematical Monthly, Bd. 80, S. 1141–1142 enthält einen Beweis mit Lagrange-Multiplikatoren, dass für nicht gleichmäßig verteilte Geburtstage die Wahrscheinlichkeit zunimmt, dass zwei Personen am gleichen Tag Geburtstag haben.
  6. Stefan Kirchner in de.sci.mathematik, 3. November 2005
  7. Hugo Pfoertner in de.sci.mathematik, 22. Januar 2005
  8. Dass man bei 183 (≈ 365/2) die gleiche Zahl n = 23 bekommt wie beim Geburtstagsparadoxon, ist kein Zufall: Die Produktdarstellung für die Wahrscheinlichkeit zeigt (zumindest für die ersten Faktoren) eine große Ähnlichkeit.