Seien beliebig und eine stetige Funktion. Dann gilt für alle : Es existiert ein Polynom , das erfüllt.
Ohne Beschränkung der Allgemeinheit gelte .
Sei eine binomialverteilte Zufallsvariable mit den Parametern der Anzahl der Versuche bis zum ersten Erfolg (bei einer Folge unabhängiger Bernoulli-Versuche) und Erfolgswahrscheinlichkeit . Dann gilt .
Mit dem schwachen Gesetz der großen Zahlen (!) folgt
für alle (Konvergenz in Wahrscheinlichkeit von gegen ).
Diese Konvergenz bzgl. ist sogar gleichmäßig in , weil gemäß dem folgenden Lemma die Varianz von durch eine Nullfolge ohne Abhängigkeit von nach oben hin und nach unten hin durch 0 beschränkt ist.
Die Varianz von ist beschränkt durch .
Da binomialverteilt ist, ist
. Wir suchen das globale Maximum bezüglich auf .
. Bei befindet sich also ein lokaler Extremwert. Wegen
an der Stelle ist dieses lokale Extremum ein lokales Maximum. Auf dem Rand (für oder ) ist die Varianz 0 und damit kleiner dem lokalen Maximum. Also liegt bei ein globales Maximum mit Funktionswert .
Das Intervall ist abgeschlossen und beschränkt, also kompakt (Satz von Heine-Borel). ist stetig (in ), also insbesondere fast überall stetig. ist stetig, also messbar. Außerdem ist auf einem kompakten Intervall definiert.
Also ist auf diesem Intervall auch gleichmäßig stetig und beschränkt (durch , eine integrierbare Funktion mit endlichem Erwartungswert, siehe Lemma).
Daraus folgt für alle die gleichmäßige Konvergenz in Wahrscheinlichkeit in (nach dem gleichmäßigen Gesetz der großen Zahl, ), also
- .
(siehe auch hier????????) Aus der Beschränktheit von (auf dem gegebenen Intervall) folgt mit dem Satz über die majorisierte Konvergenz für Zufallsvariablen die (gleichmäßige, weil Absolutbetrag unabhängig von beschränkt und damit Erwartungswert ebenso (Monotonie des Erwartungswertes)) Konvergenz der Erwartungswerte
- .
Für alle Funktionen und alle natürlichen Zahlen gilt:
aufgrund des Binomischen Lehrsatzes.
Gemäß dem Lemma 2 gilt . Sei . Wegen der Stetigkeit von existiert dann ein , sodass gilt:
Zerlege die Summe in zwei Teile:
- einen Teil mit -Werten, die erfüllen und
- einen Teil mit -Werten, die diese Bedingung nicht erfüllen.
Wegen der Stetigkeit von gilt für alle Summenglieder von : und für all jene von : wegen der Beschränktheit von auf . Daraus ergibt sich:
. Mit der Dreiecksgleichung des Erwartungswertes und seiner Linearität folgt für ein beliebiges, fixes :
. Definiere die Bernstein-Polynome durch
mit
Dann genügt es, Lemma 3 zu zeigen, denn dann ist zusammengefasst (mit ):
Es folgt schrittweise aus dem Gesetz des bewusstlosen Statistikers (»law of unconscious statistician«), der Berechnung der Wahrscheinlichkeitsfunktion und dem Einsetzen der Wahrscheinlichkeitsfunktion der Binomialverteilung das Ergebnis.