Mittelwertsatz der Differentialrechnung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der Mittelwertsatz ist ein zentraler Satz der Differentialrechnung, eines Teilgebiets der Analysis (Mathematik).

Veranschaulicht lässt sich der Mittelwertsatz geometrisch so deuten, dass es unter den unten genannten Voraussetzungen zwischen zwei Punkten eines Funktionsgraphen mindestens einen Kurvenpunkt gibt, für den die Tangente parallel zur Sekante durch die beiden gegebenen Punkte ist.

Die Aussage des Satzes lässt sich sowohl auf den Quotienten zweier Funktionen übertragen als auch auf Funktionen mehrerer Variablen anwenden.

Aussage des Mittelwertsatzes[Bearbeiten]

Geometrische Darstellung des Mittelwertsatzes: Sekante und Tangente an der Stelle x0 sind parallel.

Es sei f: [a,b] \to \mathbb{R} eine Funktion, die auf dem abgeschlossenen Intervall [a,b] (mit a < b) definiert und stetig ist. Außerdem sei die Funktion f im offenen Intervall (a,b) differenzierbar. Unter diesen Voraussetzungen gibt es mindestens ein x_0 \in (a,b), so dass

f'\left(x_0\right)=\frac{f\left(b\right)-f\left(a\right)}{b-a}

gilt.

Geometrisch gedeutet bedeutet dies, dass die Sekantensteigung an mindestens einer Zwischenstelle als Steigung der Tangente an den Graphen der Funktion auftritt.

Beweis im eindimensionalen Fall[Bearbeiten]

Es sei eine Hilfsfunktion h: [a,b] \to \mathbb{R} definiert, mit

h(x)=f(x)-\frac{f(b)-f(a)}{b-a}(x-a)

h ist stetig in [a,b] und in (a,b) differenzierbar. Es gilt h(b)=f(a)=h(a).

Nach dem Satz von Rolle existiert daher ein x_0\in (a,b) mit h'\left(x_0\right)=0. Da

h'(x_0)=f'(x_0)-\frac{f(b)-f(a)}{b-a}

folgt die Behauptung.

Beispiel einer Anwendung des Mittelwertsatzes[Bearbeiten]

Als typische Anwendung des Mittelwertsatzes kann gezeigt werden, dass

\left| \sin b - \sin a\right| \le \left| b-a \right|

für alle a,b \in \R gilt: Ohne Einschränkung können wir a<b annehmen. Da die Sinusfunktion im Intervall [a,b] differenzierbar ist, existiert nach dem Mittelwertsatz ein x_0 \in (a,b), so dass

\frac{\sin b - \sin a}{b-a} = \sin'x_0 = \cos x_0

gilt. Wegen \left| \cos x\right|\le 1 für alle x\in \R, erhält man


  \left| \sin b - \sin a \right|
   = \left| \cos x_0\right| \left| b-a\right|
   \le \left| b-a\right|\,.

Allgemein kann so nachgewiesen werden, dass stetig differenzierbare Funktionen lokal Lipschitz-stetig sind.

Erweiterter Mittelwertsatz der Differentialrechnung[Bearbeiten]

Der Mittelwertsatz lässt sich in folgender Weise verallgemeinern:

Es seien f: [a,b] \to \mathbb{R} und g: [a,b] \to \mathbb{R} zwei Funktionen, die auf dem abgeschlossenen Intervall [a,b] (mit a < b) definiert und stetig und auf dem offenen Intervall (a,b) differenzierbar sind. Unter diesen Voraussetzungen existiert mindestens ein x_0 \in (a,b), so dass

f'(x_0)\,(g(b)-g(a)) = g'(x_0)\,(f(b)-f(a))

gilt.

Wird zusätzlich g'(x)\ne 0 auf dem Intervall [a,b] vorausgesetzt, so ist insbesondere g'(x_0)\ne 0 sowie g(a)\ne g(b) und man kann den erweiterten Mittelwertsatz in der üblichen Bruchform schreiben,

\dfrac{f(b)-f(a)}{g(b)-g(a)} = \dfrac{f'(x_0)}{g'(x_0)}.

Beweis[Bearbeiten]

Ist g(a)=g(b), so muss für den verallgemeinerten Mittelwertsatz der Differentialrechnung gezeigt werden, dass für ein x_0\in(a,b) Folgendes gilt

0 = g'(x_0)\,(f(b)-f(a)).

Nach dem Satz von Rolle gibt es ein x_0, für das g'(x_0)=0 gilt.

Ist g(a)\neq g(b), so kann man die Funktion

h(x):=f(x)-\frac{f(b)-f(a)}{g(b)-g(a)}g(x)

auf dem Intervall [a,b] definieren. Da h(a)=h(b) gilt, gibt es nach dem Satz von Rolle ein x_0\in(a,b) mit h'(x_0) = 0. Es folgt damit

f'(x_0)=\frac{f(b)-f(a)}{g(b)-g(a)}g'(x_0).

Mittelwertsatz für reellwertige Funktionen mehrerer Variablen[Bearbeiten]

In der mehrdimensionalen Analysis lautet der Mittelwertsatz wie folgt:

Es sei {f} eine Abbildung mit f: \mathbb{R}^{n} \to \mathbb{R}, weiter sei f differenzierbar auf einer offenen Menge G \subseteq D(f). Außerdem seien \vec x_1, \vec x_2 \in G mit \vec x_1 \neq \vec x_2 und ihre Verbindungsstrecke \overline{x_1 x_2} \subseteq G. Dann existiert mindestens ein \vec x_0 \in \overline{x_1 x_2} mit  \vec x_0 \neq \vec x_1 und \vec x_0 \neq \vec x_2 und es gilt:

f(\vec x_2) - f(\vec x_1) = \nabla f(\vec x_0) \cdot (\vec x_2 - \vec x_1)

Für n = 1 entspricht der Satz dem oben erwähnten Mittelwertsatz der eindimensionalen Differentialrechnung. \nabla f(\vec x_0) bezeichnet hierbei den Gradienten an der Stelle x_0, der in einem Skalarprodukt auftritt.

Geometrisch gedeutet, tritt die Sekantensteigung zwischen f(\vec x_1) und f(\vec x_2) an mindestens einer Stelle aus \overline{x_1 x_2} als Steigung in Richtung des Vektors (\vec x_2 - \vec x_1) auf.

Beweis im mehrdimensionalen Fall[Bearbeiten]

Betrachtet man die Funktion h: \mathbb{R} \to \mathbb{R} mit

h(t) = f(\vec x_1 + t \cdot (\vec x_2 - \vec x_1)),

so ist h stetig auf [0,1] und differenzierbar auf (0,1). Somit folgt aus dem Mittelwertsatz der eindimensionalen Analysis, dass ein  y_0 derart existiert, dass

h(1) - h(0) = h'(y_0).

Aus der Kettenregel folgt nun:

h'(t) = \nabla f(\vec x_1 + t \cdot (\vec x_2 - \vec x_1)) \cdot (\vec x_2 - \vec x_1).

Dies lässt sich folgendermaßen zusammenfassen:

h(1) - h(0) = \nabla f(\vec x_1 + y_0 \cdot (\vec x_2 - \vec x_1)) \cdot (\vec x_2 - \vec x_1)

Substituiert man nun \vec x_1 + y_0 \cdot (\vec x_2 - \vec x_1) durch \vec x_0, so ergibt sich

f(\vec x_2) - f(\vec x_1) = h(1) - h(0) = \nabla f(\vec x_0) \cdot (\vec x_2 - \vec x_1),

womit die Aussage des Satzes bewiesen wäre.

Mittelwertsatz für vektorwertige Funktionen mehrerer Variablen[Bearbeiten]

Eine Ausdehnung des Satzes auf Funktionen f: \mathbb{R}^{n} \to \mathbb{R}^{m} ist nur unter veränderten geometrischen Voraussetzungen bzw. Verschärfungen möglich. Insbesondere wird der Pool der in Frage kommenden linearen Abbildungen erheblich über die Ableitungen auf der Strecke \overline{x_1 x_2} hinaus erweitert:

Falls die Ableitungen von f auf der gesamten Strecke \overline{x_1 x_2} beschränkt sind (es handelt sich um Jacobimatrizen, also beschränkt bezüglich einer Norm auf \mathrm{Hom}(\mathbb{R}^{n},\mathbb{R}^{m}), zum Beispiel der Operatornorm), so gibt es eine lineare Abbildung A aus der abgeschlossenen konvexen Hülle der Ableitungen auf der Verbindungsstrecke, sodass

f(\vec x_2) - f(\vec x_1) = A \cdot (\vec x_2 - \vec x_1) \, , \, 
A =\int_0^1D\!f\left(\vec x_1+t\left(\vec x_2-\vec x_1\right)\right)\,\mathrm dt\in \overline{\mathrm{conv}} \left\{ D\!f(x) \big| \vec x \in \overline{x_1 x_2} \right\}

gilt.

Der Beweis hierfür erfordert einige Vorarbeit, u. a. die Hahn-Banach’schen Trennungssätze, folgt aber letztlich dem Prinzip der Rückführung auf den reellwertigen Fall. Warum die Ableitungen auf der Strecke \overline{x_1 x_2} nicht ausreichen, kann man folgendermaßen verstehen: Auf die einzelnen Komponenten f_i der vektorwertigen Funktion f = (f_1,f_2,\dots, f_m) kann einerseits der Mittelwertsatz für reellwertige Funktionen mehrerer Veränderlicher angewandt werden. Andererseits ist keinesfalls gewährleistet, dass die zugehörige Stelle auf \overline{x_1 x_2}, an der die passende Ableitung gefunden wird, für alle Komponentenfunktionen dieselbe ist. Man muss sich daher in einer größeren Menge umschauen, eben der konvexen Hülle der Ableitungen auf der Strecke.

Anschauliche Bedeutung[Bearbeiten]

Beschreibt die Funktion beispielsweise eine Strecke in Abhängigkeit von einer Zeit, dann ist die Ableitung die Geschwindigkeit. Der Mittelwertsatz besagt dann: Auf dem Weg von A nach B muss man mindestens zu einem Zeitpunkt so schnell gewesen sein wie seine Durchschnittsgeschwindigkeit.

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]