Hesse-Matrix

Die nach Otto Hesse benannte Hesse-Matrix ist eine quadratische Matrix, die in der mehrdimensionalen reellen Analysis ein Analogon zur zweiten Ableitung einer Funktion ist.

Die Hesse-Matrix taucht bei der Approximation einer mehrdimensionalen Funktion in der Taylor-Entwicklung auf. Sie ist unter anderem in Zusammenhang mit der Optimierung von Systemen von Bedeutung, die durch mehrere Parameter beschrieben werden, wie sie beispielsweise in den Wirtschaftswissenschaften, in der Physik, theoretischen Chemie oder in den Ingenieurwissenschaften häufig auftreten.

Definition[Bearbeiten | Quelltext bearbeiten]

Sei $f\colon D\subset \mathbb {R} ^{n}\to \mathbb {R}$ eine zweimal stetig differenzierbare Funktion. Dann ist die Hesse-Matrix von $f$ am Punkt $x=(x_{1},\ldots ,x_{n})\in D$ definiert durch

\operatorname {H} _{f}(x):=\left({\frac {\partial ^{2}f}{\partial x_{i}\partial x_{j}}}(x)\right)_{i,j=1,\dots ,n}={\begin{pmatrix}{\frac {\partial ^{2}f}{\partial x_{1}\partial x_{1}}}(x)&{\frac {\partial ^{2}f}{\partial x_{1}\partial x_{2}}}(x)&\cdots &{\frac {\partial ^{2}f}{\partial x_{1}\partial x_{n}}}(x)\\[0.5em]{\frac {\partial ^{2}f}{\partial x_{2}\partial x_{1}}}(x)&{\frac {\partial ^{2}f}{\partial x_{2}\partial x_{2}}}(x)&\cdots &{\frac {\partial ^{2}f}{\partial x_{2}\partial x_{n}}}(x)\\\vdots &\vdots &\ddots &\vdots \\{\frac {\partial ^{2}f}{\partial x_{n}\partial x_{1}}}(x)&{\frac {\partial ^{2}f}{\partial x_{n}\partial x_{2}}}(x)&\cdots &{\frac {\partial ^{2}f}{\partial x_{n}\partial x_{n}}}(x)\end{pmatrix}}.

Mit ${\tfrac {\partial ^{2}f}{\partial x_{i}\partial x_{j}}}$ werden die zweiten partiellen Ableitungen bezeichnet. Die Hesse-Matrix entspricht der Transponierten der Jacobi-Matrix des Gradienten, ist aber bei stetigen zweiten Ableitungen wegen der Vertauschbarkeit der Differentiationsreihenfolge symmetrisch,^[1] so dass das Transponieren der Matrix keine Änderung bewirkt.

Beispiele[Bearbeiten | Quelltext bearbeiten]

Für $f\colon \mathbb {R} ^{2}\to \mathbb {R}$ , $f(x,y)=x^{3}+y^{3}-3xy$ gilt

{\tfrac {\partial f}{\partial x}}(x,y)=3x^{2}-3y

und

{\tfrac {\partial f}{\partial y}}(x,y)=3y^{2}-3x

,

und für die zweiten Ableitungen dementsprechend:

{\tfrac {\partial ^{2}f}{\partial x\partial x}}(x,y)=6x

und

{\tfrac {\partial ^{2}f}{\partial x\partial y}}(x,y)=-3

, beziehungsweise

{\tfrac {\partial ^{2}f}{\partial y\partial x}}(x,y)=-3

, sowie

{\tfrac {\partial ^{2}f}{\partial y\partial y}}(x,y)=6y

.

Somit ergibt sich die Hessematrix zu:

\operatorname {H} _{f}(x,y)={\begin{pmatrix}6x&-3\\-3&6y\end{pmatrix}}

.

Die Funktion $r\colon \mathbb {R} ^{n}\to \mathbb {R}$ , $\textstyle r(x)=\|x\|={\sqrt {\sum _{j=1}^{n}x_{j}^{2}}}$ , die jedem Vektor im $\mathbb {R} ^{n}$ seine euklidische Norm zuordnet, ist für alle $x\neq 0$ zweimal stetig differenzierbar und es gilt nach der Kettenregel

{\frac {\partial r}{\partial x_{j}}}(x)={\frac {x_{j}}{\|x\|}}

sowie weiter nach der Quotientenregel

{\frac {\partial ^{2}r}{\partial x_{i}\partial x_{j}}}(x)={\frac {\delta _{ij}\|x\|-x_{j}{\frac {x_{i}}{\|x\|}}}{\|x\|^{2}}}={\frac {1}{\|x\|}}\delta _{ij}-{\frac {x_{i}x_{j}}{\|x\|^{3}}}

,

wobei

\delta _{ij}={\frac {\partial x_{j}}{\partial x_{i}}}

das Kronecker-Delta bezeichnet. In Matrixschreibweise folgt also

\operatorname {H} _{r}(x)={\frac {1}{\|x\|}}E_{n}-{\frac {1}{\|x\|^{3}}}xx^{T}

mit der

n\times n

-Einheitsmatrix

E_{n}

.

Anwendungen[Bearbeiten | Quelltext bearbeiten]

Taylor-Entwicklung[Bearbeiten | Quelltext bearbeiten]

Die Taylor-Entwicklung einer zweimal stetig differenzierbaren Funktion $f\colon D\to \mathbb {R}$ mit $D\subseteq \mathbb {R} ^{n}$ um eine Entwicklungsstelle $a\in D$ beginnt mit

T(x)=f(a)+(x-a)^{T}\operatorname {grad} f(a)+{\frac {1}{2}}(x-a)^{T}\operatorname {H} _{f}(a)(x-a)+\ldots

Die Terme zweiter Ordnung dieser Entwicklung sind also durch die quadratische Form gegeben, deren Matrix die an der Entwicklungsstelle ausgewertete Hesse-Matrix ist.

Extremwerte[Bearbeiten | Quelltext bearbeiten]

Mit Hilfe der Hesse-Matrix lässt sich der Charakter der kritischen Punkte einer Abbildung in $\mathbb {R} ^{n}$ bestimmen. Dazu bestimmt man für die zuvor ermittelten kritischen Punkte die Definitheit der Hesse-Matrix.

Ist die Matrix an einer Stelle positiv definit, so befindet sich an diesem Punkt ein lokales Minimum der Funktion.
Ist die Hesse-Matrix dort negativ definit, so handelt es sich um ein lokales Maximum.
Ist sie indefinit, dann handelt es sich um einen Sattelpunkt der Funktion.

Falls die Hesse-Matrix an der untersuchten Stelle nur semidefinit ist, so versagt dieses Kriterium und der Charakter des kritischen Punktes muss auf anderem Wege ermittelt werden. Welcher dieser Fälle vorliegt, kann – wie unter Definitheit beschrieben – zum Beispiel mit Hilfe der Vorzeichen der Eigenwerte der Matrix oder ihrer Hauptminoren entschieden werden.

Beispiel: Die Funktion $f(x,y)=x^{2}-y^{2}$ hat in $(0,0)$ einen kritischen Punkt, aber $H(f)(0,0)={\begin{pmatrix}2&0\\0&-2\end{pmatrix}}$ ist weder positiv noch negativ definit und auch nicht semidefinit, sondern indefinit. Die Funktion hat in diesem Punkt kein Extremum, sondern einen Sattelpunkt, in dem sich zwei Höhenlinien schneiden.

Konvexität[Bearbeiten | Quelltext bearbeiten]

Es besteht zudem ein Zusammenhang zwischen der positiven Definitheit der Hesse-Matrix und der Konvexität einer zweimal stetig differenzierbaren Funktion $f$ , die auf einer offenen, konvexen Menge $D$ definiert ist: Eine solche Funktion ist genau dann konvex, wenn ihre Hesse-Matrix überall in $D$ positiv semidefinit ist. Ist die Hesse-Matrix sogar positiv definit in $D$ , dann ist die Funktion auf $D$ strikt konvex.

Entsprechend gilt: Eine zweimal stetig differenzierbare Funktion $f$ ist auf ihrer konvexen Definitionsmenge $D$ genau dann konkav, wenn ihre Hesse-Matrix negativ semidefinit ist. Ist die Hessematrix sogar negativ definit auf $D$ , so ist $f$ auf $D$ strikt konkav.

Ist $f$ auf ihrer Definitionsmenge $D$ strikt konvex, so besitzt $f$ höchstens ein globales Minimum auf $D$ . Jedes lokale Minimum ist zugleich das (einzige) globale Minimum. Ist $f$ strikt konkav, so besitzt $f$ höchstens ein globales Maximum. Jedes lokale Maximum ist zugleich ihr (einziges) globales Maximum.^[2]

Laplace-Operator[Bearbeiten | Quelltext bearbeiten]

Der Laplace-Operator einer zweimal stetig differenzierbaren Funktion $f\colon D\to \mathbb {R}$ mit $D\subseteq \mathbb {R} ^{n}$ ist gleich der Spur ihrer Hesse-Matrix und daher unabhängig von der Wahl der Koordinaten:

\Delta f=\mathrm {Spur} ({H}_{f})

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Geränderte Hesse-Matrix

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

↑ Otto Forster: Analysis 2. Differentialrechnung im Rⁿ, gewöhnliche Differentialgleichungen. 8. Auflage. Vieweg+Teubner Verlag, Wiesbaden 2008, ISBN 978-3-8348-0575-1, S. 78.
↑ Konvexe Funktionen. S. 16, archiviert vom Original (nicht mehr online verfügbar) am 2. November 2013; abgerufen am 16. September 2012.

Weblinks[Bearbeiten | Quelltext bearbeiten]

Weiteres zum Zusammenhang Konvexität – Hesse-Matrix

Literatur und Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Konrad Königsberger: Analysis. Band 2. 3. überarbeitete Auflage. Springer-Verlag, Berlin u. a. 2000, ISBN 3-540-66902-7.

[1] Otto Forster: Analysis 2. Differentialrechnung im Rⁿ, gewöhnliche Differentialgleichungen. 8. Auflage. Vieweg+Teubner Verlag, Wiesbaden 2008, ISBN 978-3-8348-0575-1, S. 78.

[2] Konvexe Funktionen. S. 16, archiviert vom Original (nicht mehr online verfügbar) am 2. November 2013; abgerufen am 16. September 2012.

[1]

[2]

Hesse-Matrix

Inhaltsverzeichnis

Definition[Bearbeiten | Quelltext bearbeiten]

Beispiele[Bearbeiten | Quelltext bearbeiten]

Anwendungen[Bearbeiten | Quelltext bearbeiten]

Taylor-Entwicklung[Bearbeiten | Quelltext bearbeiten]

Extremwerte[Bearbeiten | Quelltext bearbeiten]

Konvexität[Bearbeiten | Quelltext bearbeiten]

Laplace-Operator[Bearbeiten | Quelltext bearbeiten]

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Literatur und Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Navigationsmenü

Hesse-Matrix

Definition[Bearbeiten | Quelltext bearbeiten]

Beispiele[Bearbeiten | Quelltext bearbeiten]

Anwendungen[Bearbeiten | Quelltext bearbeiten]

Taylor-Entwicklung[Bearbeiten | Quelltext bearbeiten]

Extremwerte[Bearbeiten | Quelltext bearbeiten]

Konvexität[Bearbeiten | Quelltext bearbeiten]

Laplace-Operator[Bearbeiten | Quelltext bearbeiten]

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Literatur und Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Navigationsmenü

Suche