Gâteaux-Differential

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Das Gâteaux-Differential, benannt nach René Gâteaux (1889-1914), stellt eine Verallgemeinerung des gewöhnlichen Differentiationsbegriffes dar, indem es die Richtungsableitung auch in unendlichdimensionalen Räumen definiert. Gewöhnlich hat man für eine Funktion f:G \to \mathbb{R},\ G \subset \mathbb{R}^n offene Menge, die an der Stelle x_0 \in G differenzierbar ist, als Definition der partiellen Ableitung

\frac{\partial f(x_0)}{\partial x_i} = \lim_{h \to 0} \frac{f(x_{0,1},x_{0,2},\ldots,x_{0,i}+h,\ldots,x_{0,n})-f(x_0)}{h},\ \ (i={1,2,...,n}).

Insbesondere ergibt sich für n=1 das bekannte Differential

\frac{\mathrm{d}f(x_0)}{\mathrm{d}x} = \lim_{h \to 0} \frac{f(x_0+h)-f(x_0)}{h}.

Das Gâteaux-Differential verallgemeinert diese Konzepte auf unendlichdimensionale Vektorräume.

Definitionen[Bearbeiten]

Weierstraß'sche Zerlegungsformel[Bearbeiten]

f \colon D \subset X \to Y mit D offen und X,Y normierte Räume. Dann heißt f in x_0 \in D Gateaux-differenzierbar, falls eine lineare Funktion A\in L(X,Y) existiert, sodass

\lim_{t \rightarrow 0} \frac{1}{t}[f(x_0 + th) - f(x_0) - tAh] = 0

für alle h \in X mit \lVert h \rVert = 1. Dies ist äquivalent zu:

f(x_0 + th) - f(x_0) = tAh + o(|t|)

Dann bezeichnet man A =: f'(x_0) als die Gateaux-Ableitung von f im Punkt x_0.

1. Variation; Variationsableitung[Bearbeiten]

Sei nun für das Gâteaux-Differential folgende Situation gegeben: Es sei wie üblich f \colon D(f) \to \mathbb{R} ein in  D(f) \subseteq \Omega definiertes Funktional; \Omega sei ein linearer normierter Raum (das heißt ein Vektorraum, versehen mit einer Norm \|\cdot\|) oder ein allgemeinerer topologischer Vektorraum mit Voraussetzungen, über die man sich im konkreten Anwendungsfall nähere Gedanken machen muss; ferner sei x_0 \in D(f) und v \in \Omega. Dann ist das Gâteaux-Differential an der Stelle x_0 in Richtung v, falls es existiert, definiert durch die folgende Ableitung nach \epsilon:

\delta f(x_0, v) =\lim_{\epsilon \to 0} \frac{f(x_0+\epsilon\cdot v)-f(x_0)}{\epsilon } = \left. \frac{\mathrm{d}f(x_0+\epsilon\cdot v)}{\mathrm{d}\epsilon} \right|_{\epsilon=0}

oder auch für x_1 \in D(f) durch

\delta f(x_0,x_1-x_0)
=\lim_{\epsilon\to 0} \frac{f(x_0+\epsilon\cdot (x_1-x_0))-f(x_0)}{\epsilon}\,.\,

Man beachte dabei x_0 \in D(f),  v \in \Omega und ebenfalls  x_1- x_0 darin, aber \epsilon \in \mathbb{R}.

Die Gâteaux-Ableitung nach \epsilon ist bezüglich der Größe  h:= x_1- x_0 ein Funktional, das auch als 1. Variation von f an der Stelle x_0 bezeichnet wird.

Eine andere Möglichkeit ist, anstelle normierter Vektorräume allgemeinere topologische Vektorräume mit entsprechendem Konvergenzbegriff zu benutzen. Vor allem in Physikbüchern werden Funktionale üblicherweise mit dem Buchstaben I bezeichnet, und statt der Größe   h:= x_1- x_0 schreibt man meist  \delta q(x), mit distributionswertigen Größen. Statt der Ableitung \tfrac{d I(x+\epsilon\cdot h)}{d\epsilon}_{\,|\epsilon=0} führt man in einem Zusatzschritt die sogenannte Variationsableitung ein, die eng mit der Gâteaux-Ableitung zusammenhängt.

Beispiel[Bearbeiten]

Für

f(\epsilon ):=\int\,{\rm d}t\, \mathcal L \left( t,q(t)+\epsilon\cdot\delta q(t), \dot q(t)+\epsilon\cdot\frac{{\rm d} (\delta q(t))}{{\rm d} t}\right)

erhält man nach einer partiellen Integration mit verschwindendem ausintegrierten Teil ein Resultat der Form \textstyle \frac{{\rm d}f}{{\rm d}\epsilon}(\epsilon \to 0)\,=\,\int\,{\rm d}t \,\frac{\delta \mathcal L}{\delta q(t)}\cdot \delta q(t) mit der Variationsableitung

\frac{\delta \mathcal L}{\delta q(t)}\equiv \frac{\partial \mathcal L}{\partial q(t)}-\frac{{\rm d}}{{\rm d}t}\frac{\partial\mathcal L}{\partial \dot q(t)}\,.

(Die Variationsableitung "an der Stelle q(t)" bei kontinuierlichen Variablen ist also die Verallgemeinerung der partiellen Ableitung \tfrac{\partial \mathcal L}{\partial x_i} einer Funktion von n Variablen, also zum Beispiel für den fiktiven Fall  \mathcal L=\mathcal L(x_1, ..., x_n). So ähnlich wie im fiktiven Fall das totale Differential einer Funktion von n Variablen, so hat auch hier \delta f, das totale Differential des Funktionals, invariante Bedeutung. Weitere Einzelheiten im Kapitel Lagrange-Formalismus.)

In Folgenden wird wegen der Einfachheit auf die Kennung der Vektoren durch „fett geschriebene“ Buchstaben verzichtet.

2. Variation[Bearbeiten]

\delta^2 f(x_0,v) = \left. \frac{\mathrm{d}^2 f(x_0+\epsilon \cdot v)}{\mathrm{d}\epsilon^2} \right|_{\epsilon=0}

Halbseitiges Differential und Richtungsableitung[Bearbeiten]

Unter denselben Voraussetzungen wie oben ist das einseitige Gâteaux-Differential durch

\delta_+ f(x_0,v)
=\lim_{\epsilon \to 0^+} \frac{f(x_0+\epsilon\cdot v)-f(x_0)}{\epsilon }

beziehungsweise durch

\delta_- f(x_0,v) =\lim_{\epsilon \to 0^-} \frac{f(x_0+\epsilon\cdot v)-f(x_0)}{\epsilon }

definiert. Das einseitige Gâteaux-Differential wird auch Richtungsdifferential von f an der Stelle x_0 genannt. Für die zum Vektor v gehörende Richtung verallgemeinert nämlich bei „kontinuierlichen Variablen“ das einseitige Gâteaux-Differential (genauer: die zugehörige Variationsableitung) gerade die Richtungsableitung von f in Richtung v an der Stelle x_0.

Gâteaux-Ableitung[Bearbeiten]

Ist \delta f(x_0,v) ein in v stetiges, lineares Funktional (d. h. die Funktion vermittelt durch v \mapsto \delta f(x_0,v) ist homogen, additiv und stetig im Argument v), dann heißt f'(x_0) Gâteaux-Ableitung an der Stelle x_0. und f Gâteaux-differenzierbar in x_0.

Eigenschaften der 1. Variation[Bearbeiten]

  • Das Gâteaux-Differential ist homogen, das bedeutet
    \delta f(x_0,k\cdot v)=k\cdot \delta f(x_0,v)
    für alle k \in \mathbb{R}. Die Eigenschaft gilt analog für das einseitige Gâteaux-Differential.
  • Das Gâteaux-Differential ist nicht linear. Im Allgemeinen Fall gilt also
    \delta f(x_0,v)+\delta f(x_0,w)\ne \delta f(x_0,v+w).
    Für ein Beispiel, dass das Gâteaux-Differential nicht linear ist, betrachte f(x)=\tfrac{x_1^2 x_2}{x_1^2+x_2^2} für  x \ne 0 und  f(0) = 0, wobei x=(x_1,x_2), dann ist
    \delta f(0,v)=\lim_{\epsilon\to 0} \frac{f(0+\epsilon\cdot v)-f(0)}{\epsilon } = \lim_{\epsilon\to 0}\frac{f(\epsilon\cdot v)}{\epsilon } = \lim_{\epsilon \to 0} \frac{\epsilon^2 v_1^2 \cdot \epsilon v_2}{(\epsilon^2 v_1^2 + \epsilon^2 v_2^2)\epsilon } = \frac{v_1^2 v_2}{v_1^2 + v_2^2} = f(v).
    Die Funktion f ist nicht linear. Es gilt zum Beispiel  \delta f(0,(0,1)) + \delta f(0,(1,0)) = 0 + 0 \ne \tfrac{1}{2} = \delta f(0,(1,1)).

Beispiele[Bearbeiten]

  1. f(x_1,x_2)= 1, falls x_2=x_1^2, x_1\ne 0 bzw 0 sonst \delta f((0,0),v)=\lim_{t\to 0} \frac{0-0}{t}=0.
  2. f(x)=|x|,\ x \in \mathbb{R}^n \delta_+ f(0,v)=\lim_{\epsilon \to 0^+}\frac{|0+\epsilon\cdot v|-0}{\epsilon }=|v|
  3. f(x_1,x_2)= x_1^2 \left(1+\frac{1}{x_2}\right) für x_2\ne 0 und -\frac{x_1^2}{x_2^2} für x_2=0, \nabla f(x_1,x_2)=\left( 2\cdot x_1 \cdot\left(1+\frac{1}{x_2}\right),-\frac{x_1^2}{x_2^2}\right)^T

\delta f((0,0),v)=\lim_{\epsilon\to 0}\frac{(\epsilon\cdot v_1)^2\cdot\left(1+\frac{1}{\epsilon\cdot v_2}\right)}{\epsilon}=\frac{v_1^2}{v_2} (wobei v=(v_1,v_2)^{T})

Anwendungen[Bearbeiten]

Wie die gewöhnliche Ableitung ist das Gâteaux-Differential zum Bestimmen von Extrema und daher in der Optimierung von Nutzen. Sei f: X \to \mathbb{R},\ X \subset D(f) \subset \Omega offen, \Omega linearer normierter Raum, x_0 \in \operatorname{int}(X) (das Innere der Menge X), \operatorname{int}(X) \ne \emptyset und B_\varepsilon(x_0) der offene Ball um x_0 mit Radius \varepsilon. Notwendige Optimalitätsbedingung: Sei x_0 ein lokales Minimum von f auf X, dann ist \delta_+ f(x_0,v)\geq 0\ \forall v 
\in \Omega, falls das einseitige Gâteaux-Differential in x_0 existiert. Hinreichende Optimalitätsbedingung: f besitze in B_\varepsilon (x_0) eine 2. Variation \forall v \in \Omega und \forall x \in B_\varepsilon (x_0). Falls gilt \delta f(x_0,v)=0\ \forall v \in \Omega und für ein c>0 \delta^2 f(x_0,v)\geq c\cdot\|v\|^2\ \forall v \in \Omega und \forall x \in B_\varepsilon (x_0), dann ist x_0 strenge lokale Minimalstelle von f auf \operatorname{int}(X).

Siehe auch[Bearbeiten]