Satz von der impliziten Funktion

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der Satz von der impliziten Funktion ist ein wichtiger Satz in der Analysis. Er beinhaltet ein relativ einfaches Kriterium, wann eine implizite Gleichung oder ein Gleichungssystem (lokal) eindeutig aufgelöst werden kann.

Der Satz sagt, wann durch eine Gleichung oder ein Gleichungssystem F(x,y)=0 implizit eine Funktion y = f(x) definiert wird, für die F(x,f(x)) = 0 gilt. So eine Funktion kann im Allgemeinen nur lokal in einer Umgebung einer Stelle x_0 gefunden werden.

Weiter von Bedeutung ist das implizite Differenzieren, womit die Ableitung \tfrac{df}{dx} (als Funktion von x und y) ohne explizite Kenntnis von y = f(x) bestimmt werden kann.

Begriffsbestimmung[Bearbeiten]

Eine implizit definierte Funktion (kurz implizite Funktion) ist eine Funktion, die nicht durch eine explizite Zuordnungsvorschrift y = f(x) gegeben ist, sondern deren Funktionswerte implizit durch eine Gleichung F(x,y)=0 definiert sind. Dabei ist F eine vektorwertige Funktion, die genauso viele Einzelfunktionen enthält, wie y Komponenten hat. Wird x fixiert, so ergibt sich ein Gleichungssystem in y mit genauso vielen Gleichungen wie Unbekannten. Der Satz über die implizite Funktion beschreibt Voraussetzungen, unter denen die folgende Aussage gilt:

Wenn eine Lösung y_0 für einen Parametervektor x_0 bekannt ist, dann kann für jeden Parametervektor x\approx x_0 in einer kleinen Umgebung von x_0 auch immer eine eindeutig bestimmte Lösung y\approx y_0 des Gleichungssystems F(x,y)=0 gefunden werden, die in einer Umgebung der ursprünglichen Lösung y_0 liegt.

Diese Aussage des Satzes erlaubt nun, eine Funktion f zu definieren, die jedem Parametervektor x\approx x_0 gerade den Lösungsvektor y=f(x)\approx y_0 zuordnet, sodass diese Funktion auf ihrem Definitionsbereich die Gleichung F(x,f(x))=0 erfüllt. Der Satz von der impliziten Funktion stellt zudem sicher, dass diese Zuordnung x\mapsto f(x) unter gewissen Bedingungen und Einschränkungen an F, x und y wohldefiniert ist, insbesondere, dass sie eindeutig ist.

Beispiel[Bearbeiten]

Der Einheitskreis wird als die Menge aller Punkte (x,y) beschrieben, welche die Gleichung F(x,y)=0 erfüllen, mit F(x,y)=x^2+y^2-1. In einer Umgebung des Punktes A kann y als Funktion von x ausgedrückt werden: y=f(x)=\sqrt{1-x^2}. Bei Punkt B geht das nicht.

Setzt man F(x,y)=x^2+y^2-1, so beschreibt die Gleichung F(x,y)=0 den Einheitskreis in der Ebene. Der Einheitskreis kann nicht als Graph einer Funktion y=f(x) geschrieben werden, denn zu jedem x aus dem Intervall (-1,1) gibt es zwei Möglichkeiten für y, nämlich y=\pm\sqrt{1-x^2}.

Es ist jedoch möglich, Teile des Kreises als Funktionsgraph darzustellen. Den oberen Halbkreis bekommt man als Graph der Funktion

f_1\colon (-1,1) \to \R, f_1(x)=\sqrt{1-x^2},

den unteren als Graph von

f_2\colon (-1,1) \to \R, f_2(x)=-\sqrt{1-x^2}.

Der Satz von der impliziten Funktion gibt Kriterien für die Existenz von Funktionen wie f_1 oder f_2. Er garantiert auch, dass diese Funktionen differenzierbar sind.

Satz von der impliziten Funktion[Bearbeiten]

Aussage[Bearbeiten]

Seien U \subseteq \mathbb{R}^m und V \subseteq \mathbb{R}^n offene Mengen und

 F\colon U \times\, V \to \mathbb{R}^n,\quad (x,y)=(x_1,\dots,x_m,y_1,\dots,y_n) \mapsto F(x,y)=(\,F_1(x,y),\dots,F_n(x,y)\,)

eine stetig differenzierbare Abbildung. Die Jacobi-Matrix


  DF = \frac{\partial F}{\partial (x, y)} 
  = \frac{\partial (F_1,\dots,F_n)}{\partial(x_1,\dots,x_m,y_1,\dots,y_n)}
  = \begin{pmatrix}
  \frac{\partial F_1}{\partial x_1} & \cdots & \frac{\partial F_1}{\partial x_m} &
     \frac{\partial   F_1}{\partial y_1} & \cdots & \frac{\partial F_1}{\partial y_n} \\ 
  \vdots & & \vdots &\vdots & & \vdots \\ 
  \frac{\partial F_n}{\partial x_1} & \cdots & \frac{\partial F_n}{\partial x_m} &
     \frac{\partial F_n}{\partial y_1} & \cdots & \frac{\partial F_n}{\partial y_n} 
  \end{pmatrix}

besteht dann aus zwei Teilmatrizen

\frac{\partial F}{\partial x} 
  = \frac{\partial (F_1,\dots,F_n)}{\partial(x_1,\dots,x_m)}
  = \begin{pmatrix}
  \frac{\partial F_1}{\partial x_1} & \cdots & \frac{\partial F_1}{\partial x_m} \\ 
  \vdots & & \vdots  \\ 
  \frac{\partial F_n}{\partial x_1} & \cdots & \frac{\partial F_n}{\partial x_m}  
  \end{pmatrix}

und

\frac{\partial F}{\partial y} 
  = \frac{\partial (F_1,\dots,F_n)}{\partial(y_1,\dots,y_n)}
  = \begin{pmatrix}
  \frac{\partial F_1}{\partial y_1} & \cdots & \frac{\partial F_1}{\partial y_n} \\ 
  \vdots & & \vdots  \\ 
  \frac{\partial F_n}{\partial y_1} & \cdots & \frac{\partial F_n}{\partial y_n}  
  \end{pmatrix},

wobei letztere quadratisch ist.

Der Satz von der impliziten Funktion besagt nun:

Erfüllt  (x_0, y_0) \in U \times\ V die Gleichung F(x_0, y_0)=0 und ist die zweite Teilmatrix  \tfrac{\partial F}{\partial y} im Punkt  (x_0,y_0) invertierbar, so existieren offene Umgebungen U_0(x_0) und V_0(y_0) sowie eine eindeutige stetig differenzierbare Abbildung

 f\colon {U_0} \subseteq {U} \subseteq {\mathbb{R}^m}  \to {V_0} \subseteq {V} \subseteq {\mathbb{R}^n}  ,

mit f(x_0) = y_0 so, dass

F\big(x, f(x)\big)=0

für alle  x \in U_0 gilt.

Beispiel[Bearbeiten]

Man wende nun diesen Satz auf das anfangs gegebene Beispiel der Kreisgleichung an: Dazu sind die partiellen Ableitungen nach den y-Variablen zu betrachten. (In diesem Fall ist n=1, also ergibt das eine 1 \times 1 Matrix, beziehungsweise einfach eine reelle Funktion): Die partielle Ableitung der Funktion F(x,y) = x^2 + y^2 -1 nach y ergibt \tfrac{\partial F(x,y)}{\partial y} = 2 \cdot y. Diese Ableitung hat einen Kehrwert genau dann, wenn  y \neq 0 ist. Damit folgert man mit Hilfe des Satzes, dass diese Gleichung lokal nach y auflösbar ist, wenn y \neq 0. Der Fall y=0 tritt nur an den Stellen x = -1 oder x = 1 auf. Dies sind also die Problempunkte. Tatsächlich sieht man, dass die Formel y = \pm \sqrt{1 - x^2} sich genau in diesen Problempunkten in eine positive und negative Lösung verzweigt. In allen anderen Punkten ist die Auflösung lokal eindeutig.

Beweisansatz[Bearbeiten]

Der klassische Ansatz betrachtet zur Lösung der Gleichung F(x,y)=0 das Anfangswertproblem der gewöhnlichen Differentialgleichung


    \phi_v'(t)=-G(x_0+tv,\phi_v(t))
  \;\text{ mit }\;
    G(x,y)=\left(\tfrac{\partial F}{\partial y}(x,y)\right)^{-1}\tfrac{\partial F}{\partial x}(x,y)
  \;\text{ und }\;
   \phi_v(0)=y_0
  .

Da \tfrac{\partial F}{\partial y} in (x_0,y_0) invertierbar ist, ist dies auch in einer kleinen Umgebung der Fall, d.h. für kleine Vektoren v existiert die Differentialgleichung und ihre Lösung für alle t\in [0,1]. Die Lösung der impliziten Gleichung ist nun durch

f(x)=\phi_{x-x_0}(1)

gegeben, die oben angegebenen Eigenschaften dieser Lösung ergeben sich aus den Eigenschaften der Lösungen parameterabhängiger Differentialgleichungen.

Der moderne Ansatz formuliert das Gleichungssystem F(x,y)=0 mit Hilfe des vereinfachten Newton-Verfahrens als Fixpunktproblem und wendet darauf den Fixpunktsatz von Banach an. Für die dazugehörige Fixpunktabbildung wird die Inverse A der Teilmatrix \tfrac{\partial F}{\partial y}(x_0,y_0) der Jacobi-Matrix von F im vorgegebenen Lösungspunkt (x_0,y_0) gebildet. Zu der Abbildung

T(y)=y-A\,F(x,y)

kann man nun zeigen, dass für Parametervektoren x nahe x_0 diese Abbildung auf einer Umgebung von y_0 kontraktiv ist. Dies folgt daraus, dass T stetig differenzierbar ist und \tfrac{\partial T}{\partial y}(x_0,y_0)=0 gilt.

Zusammenfassung[Bearbeiten]

Der Vorteil des Satzes ist, dass man die Funktion f gar nicht explizit kennen muss, und trotzdem eine Aussage über deren Existenz und Eindeutigkeit folgern kann. In vielen Fällen ist die Gleichung für y auch gar nicht mit Formeln lösbar, sondern nur mit numerischen Verfahren. Interessant ist, dass die Konvergenz solcher Verfahren meist gleiche oder ähnliche Voraussetzung wie der Satz von der impliziten Funktion (die Invertierbarkeit der Matrix der y-Ableitungen) erfordert.

Eine weitere wertvolle Schlussfolgerung des Satzes ist, dass die Funktion f differenzierbar ist, falls F(x,y) es ist, was bei Anwendung des Satzes über implizite Funktionen vorausgesetzt wird. Die Ableitung kann sogar explizit angegeben werden, indem man die Gleichung F(x,f(x)) = 0 nach der mehrdimensionalen Kettenregel ableitet:

\frac{\partial F}{\partial x}(x,f(x)) + \frac{\partial F}{\partial y}(x,f(x)) \cdot \frac{\partial f}{\partial x}(x) = 0

und dann nach \frac{\partial f}{\partial x}(x) auflöst:

 \frac{\partial f }{\partial x}(x) = - \left( \frac{\partial F }{\partial y}(x,f(x))  \right)^{-1} \cdot \frac{\partial F }{\partial x}\big(x,f(x)\big) .

Eine ähnliche Folgerung gilt für höhere Ableitungen. Ersetzt man die Voraussetzung „F ist stetig differenzierbar“ durch „F ist k-mal stetig differenzierbar“ (oder beliebig oft oder analytisch), kann man folgern, dass f k-mal differenzierbar (bzw. beliebig oft bzw. analytisch) ist.

Satz von der Umkehrabbildung[Bearbeiten]

Ein nützliches Korollar zum Satz von der impliziten Funktion ist der Satz von der Umkehrabbildung. Er gibt eine Antwort auf die Frage, ob man eine (lokale) Umkehrfunktion finden kann:

Sei U \subseteq \mathbb{R}^n offen und

f \colon U \to \mathbb{R}^n

eine stetig differenzierbare Abbildung. Sei a \in U und b := f(a). Die Jacobi-Matrix \mathrm{D}f(a) sei invertierbar. Dann gibt es eine offene Umgebung U_a \subseteq U von a und eine offene Umgebung V_b von b, so dass f die Menge U_a bijektiv auf V_b abbildet und die Umkehrfunktion

g = f^{-1} \colon V_b \to U_a

stetig differenzierbar ist, oder kurz: f|_{U_a} ist ein Diffeomorphismus. Es gilt

\mathrm{D} (f^{-1})(b) = \mathrm{D} g(b) = (\mathrm{D} f(a))^{-1} = (\mathrm{D} f(g(b)))^{-1}

Literatur[Bearbeiten]