Gradientenverfahren
Das Verfahren des steilsten Abstiegs, auch Gradientenverfahren genannt, ist ein Verfahren, das in der Numerik eingesetzt wird, um allgemeine Optimierungsprobleme zu lösen. Dabei geht man (am Beispiel eines Minimierungsproblemes) von einem Näherungswert aus. Von diesem schreitet man in Richtung des negativen Gradienten (der die Richtung des steilsten Abstiegs von diesem Näherungswert angibt) fort, bis man keine numerische Verbesserung mehr erzielt.
Das Verfahren konvergiert oftmals sehr langsam, da es sich dem Optimum entweder mit einem starken Zick-Zack-Kurs nähert oder der Betrag des Gradienten in der Nähe des Optimums sehr klein ist, wodurch die Länge der Iterationsschritte dann ebenfalls sehr klein ist. Für die Lösung von symmetrisch positiv definiten linearen Gleichungssystemen bietet das Verfahren der konjugierten Gradienten hier eine immense Verbesserung. Der Gradientenabstieg ist mit dem Bergsteigeralgorithmus (hill climbing) verwandt.
Inhaltsverzeichnis |
[Bearbeiten] Das Optimierungsproblem
Das Gradientenverfahren ist einsetzbar, wenn es um die Minimierung einer reellwertigen, differenzierbaren Funktion
geht; also um das Optimierungsproblem
Hierbei handelt es sich um ein Problem der Optimierung ohne Nebenbedingungen, auch unrestringiertes Optimierungsproblem genannt.
[Bearbeiten] Das Verfahren
Ausgehend von einem Anfangspunkt
wird die Richtung des steilsten Abstiegs durch die Ableitung
bestimmt, wobei
den Nabla-Operator bezeichnet, d.h. den Vektor der partiellen Ableitungen von
nach den Variablen
. Dann wird wie folgt iteriert:
Hier ist
der negative Gradient von
, also die Abstiegsrichtung dieses Verfahrens, und
bezeichnet die Schrittweite. Diese Schrittweite muss in jedem Schritt des Iterationsverfahrens bestimmt werden; hierfür gibt es unterschiedliche Möglichkeiten. Eine Methode besteht darin,
durch die Minimierung der Funktion auf dem (eindimensionalen) "Strahl"
zu bestimmen, der ausgehend von
in Richtung des negativen Gradienten zeigt:
Man berechnet in diesem Fall also die Schrittweite durch
. Dies ist ein einfaches, eindimensionales Optimierungsproblem, für das es spezielle Verfahren der Schrittweitenbestimmung gibt.
[Bearbeiten] Spezialfall: Quadratische Funktionale
Typischerweise wird ein Energiefunktional der Form
minimiert. Dabei ist
eine symmetrisch positiv definite Matrix. Ausgehend von einem Anfangspunkt
wird die Richtung des steilsten Abstiegs natürlich durch die Ableitung
bestimmt, wobei
den Nabla-Operator bezeichnet. Dann wird wie folgt iteriert
bezeichnet die Schrittweite des Verfahrens und kann durch
berechnet werden. Das Verfahren konvergiert dann für einen beliebigen Startwert gegen einen Wert
, so dass
minimal ist.
[Bearbeiten] Algorithmus in Pseudocode
Eingabe: geeigneter Startvektor 
For k = 0 To n
end
Ausgabe: Minimum des Energiefunktionals.
[Bearbeiten] Konvergenzgeschwindigkeit
Das Gradientenverfahren liefert eine Folge
mit
Dabei bezeichnet
die Kondition der Matrix
.
[Bearbeiten] Literatur
- Andreas Meister: Numerik linearer Gleichungssysteme. 2. Auflage. Vieweg, Wiesbaden 2005, ISBN 3-528-13135-7.









