Eigenwertproblem

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Eigenfunktion)
Wechseln zu: Navigation, Suche
In dieser Scherung der Mona Lisa wurde das Bild so verformt, dass der rote Pfeil (Vektor) seine Richtung (entlang der vertikalen Achse) nicht geändert hat, der blaue Pfeil jedoch schon. Der rote Vektor ist ein Eigenvektor der Scherabbildung, während der blaue Vektor dies aufgrund seiner Richtungsänderung nicht ist. Da der rote Vektor nicht skaliert wird, ist sein zugehöriger Eigenwert 1.

Ein Eigenvektor einer Abbildung ist in der linearen Algebra ein vom Nullvektor verschiedener Vektor, dessen Richtung durch die Abbildung nicht verändert wird. Ein Eigenvektor wird also nur skaliert und man bezeichnet den Skalierungsfaktor als Eigenwert der Abbildung.

Eigenwerte charakterisieren wesentliche Eigenschaften linearer Abbildungen, etwa ob ein entsprechendes lineares Gleichungssystem eindeutig lösbar ist oder nicht. In vielen Anwendungen beschreiben Eigenwerte auch physikalische Eigenschaften eines mathematischen Modells. Die Verwendung der Vorsilbe „Eigen-“ für charakteristische Größen in diesem Sinne lässt sich auf eine Veröffentlichung von David Hilbert aus dem Jahre 1904 zurückführen.[1]

Die im Folgenden beschriebene mathematische Problemstellung heißt spezielles Eigenwertproblem und bezieht sich nur auf lineare Abbildungen eines endlichdimensionalen Vektorraums in sich (Endomorphismen), wie sie durch quadratische Matrizen dargestellt werden.

Die Frage, die sich hier stellt, lautet: Unter welchen Bedingungen ist eine Matrix ähnlich zu einer Diagonalmatrix?[2]

Definition[Bearbeiten]

Ist V ein Vektorraum über einem Körper K (in Anwendungen meist der Körper \R der reellen Zahlen oder der Körper \C der komplexen Zahlen) und f\colon V \to V eine lineare Abbildung von V in sich selbst (Endomorphismus), so bezeichnet man als Eigenvektor einen Vektor v \ne 0, der durch f auf ein Vielfaches \lambda\,v von sich selbst mit \lambda \in K abgebildet wird:

f(v) = \lambda \, v

Den Faktor \lambda nennt man dann den zugehörigen Eigenwert.

Anders formuliert: Hat für ein \lambda \in K die Gleichung

f(v) = \lambda \, v

eine Lösung v \ne 0 (der Nullvektor ist natürlich immer eine Lösung), so heißt \lambda Eigenwert von f. Jede Lösung v \ne 0 heißt Eigenvektor von f zum Eigenwert \lambda.

Hat der Vektorraum eine endliche Dimension \operatorname{dim}(V)=n\in\N, so kann jeder Endomorphismus f durch eine quadratische \left(n\times n\right)\text{-Matrix } A beschrieben werden. Die obige Gleichung lässt sich dann als Matrizengleichung

A \cdot x = \lambda \,x

schreiben, wobei x hier einen Spaltenvektor bezeichnet. Man nennt in diesem Fall eine Lösung x \ne 0 Eigenvektor und \lambda Eigenwert der Matrix A.

Diese Gleichung kann man auch in der Form

A \cdot x = \lambda \,E \cdot x

schreiben, wobei E die Einheitsmatrix bezeichnet, und äquivalent zu

(A - \lambda E) \cdot x = 0

oder

(\lambda E - A) \cdot x = 0

umformen.

Berechnung der Eigenwerte[Bearbeiten]

Bei kleinen Matrizen können die Eigenwerte symbolisch (exakt) berechnet werden. Bei großen Matrizen ist dies oft nicht möglich, sodass hier Verfahren der numerischen Mathematik zum Einsatz kommen.

Symbolische Berechnung[Bearbeiten]

Die Gleichung

\left(A - \lambda E\right) \cdot x = 0

definiert die Eigenwerte und stellt ein homogenes lineares Gleichungssystem dar. Da x \neq 0 vorausgesetzt wird, ist dieses genau dann lösbar, wenn

\det\left(A - \lambda E\right) = 0

gilt. Diese Determinante heißt „charakteristisches Polynom“. Es handelt sich um ein normiertes Polynom \chi_A(\lambda)\in K(\lambda) n-ten Grades in \lambda. Seine Nullstellen, also die Lösungen der Gleichung

\lambda^n+\alpha_{n-1}\cdot\lambda^{n-1}+\dotsb+\alpha_1\cdot\lambda+\alpha_0=0

über K sind die Eigenwerte. Da ein Polynom vom Grad n höchstens n Nullstellen hat, gibt es auch höchstens n Eigenwerte. Zerfällt das Polynom vollständig, so gibt es genau n Nullstellen, wobei mehrfache Nullstellen mit ihrer Vielfachheit gezählt werden.

Eigenraum zum Eigenwert[Bearbeiten]

Ist \lambda ein Eigenwert der linearen Abbildung f\colon V \to V, dann nennt man die Menge aller Eigenvektoren zu diesem Eigenwert vereinigt mit dem Nullvektor den Eigenraum zum Eigenwert \lambda. Der Eigenraum ist durch

\mathrm{Eig} (f, \lambda) := \{v \in V \,|\, f(v) = \lambda \cdot v \}

definiert. Falls die Dimension des Eigenraums größer als 1 ist, wenn es also mehr als einen linear unabhängigen Eigenvektor zum Eigenwert \lambda gibt, so nennt man den zum Eigenraum zugehörigen Eigenwert entartet.[3] Die Dimension des Eigenraums \mathrm{Eig} \left (f, \lambda\right) wird als geometrische Vielfachheit von \lambda bezeichnet.

Eine Verallgemeinerung des Eigenraums ist der Hauptraum.

Spektrum und Vielfachheiten[Bearbeiten]

Für den Rest dieses Abschnittes sei K=\C. Dann besitzt jede \left(n\times n\right)\text{-Matrix } A genau n Eigenwerte, wenn man diese mit ihren Vielfachheiten zählt. Mehrfaches Vorkommen eines bestimmten Eigenwertes fasst man zusammen und erhält so nach Umbenennung die Aufzählung \lambda_1,\dots, \lambda_k der verschiedenen Eigenwerte mit ihren Vielfachheiten  \mu_1,\dots,\mu_k. Dabei ist 1\leq k \leq n und \textstyle \sum_{i=1}^k \mu_i=n.

Die eben dargestellte Vielfachheit eines Eigenwertes als Nullstelle des charakteristischen Polynoms bezeichnet man als algebraische Vielfachheit.

Die Menge der Eigenwerte wird Spektrum genannt und \sigma\left(A\right) geschrieben, sodass also

\sigma(A)=\{\lambda\in\mathbb{C}\,|\,\exists x\neq 0: Ax =\lambda x\}

gilt. Als Spektralradius bezeichnet man den größten Betrag aller Eigenwerte.

Gilt für einen Eigenwert, dass seine algebraische Vielfachheit gleich seiner geometrischen Vielfachheit ist, so spricht man von einem halbeinfachen Eigenwert (aus dem englischen 'semisimple'). Dies entspricht genau der Diagonalisierbarkeit der Blockmatrix zum gegebenen Eigenwert.

Kennt man die Eigenwerte und ihre Vielfachheiten (die algebraische und die weiter unten erklärte geometrische), kann man die Jordansche Normalform der Matrix erstellen.

Beispiel[Bearbeiten]

Gegeben sei die quadratische Matrix

A=\begin{pmatrix}0 & 2 & -1 \\
  2 & -1 & 1 \\
  2 & -1 & 3
  \end{pmatrix}.

Subtraktion der mit \lambda multiplizierten Einheitsmatrix von A ergibt


  A-\lambda E =
  \begin{pmatrix}
  0 - \lambda & 2 & -1 \\
  2 & -1 - \lambda & 1 \\
  2 & -1 & 3 - \lambda
  \end{pmatrix}.

Ausrechnen der Determinante dieser Matrix (mit Hilfe der Regel von Sarrus) liefert

\begin{matrix}\det(A-\lambda E)&=&(0-\lambda)(-1-\lambda)(3-\lambda)+4+2-(2\lambda+2+\lambda +12- 4\lambda) \\ &=&-\lambda^3+2\lambda^2+4\lambda-8 \\ &=&-(\lambda-2)(\lambda-2)(\lambda+2) \end{matrix}.

Die Eigenwerte sind die Nullstellen dieses Polynoms, man erhält

\lambda_{1,2}=2,\ \lambda_3=-2.

Der Eigenwert 2 hat algebraische Vielfachheit 2, da er doppelte Nullstelle des charakteristischen Polynoms ist.

Numerische Berechnung[Bearbeiten]

Während die exakte Berechnung der Nullstellen des charakteristischen Polynoms schon für dreireihige Matrizen nicht so einfach ist, wird sie für große Matrizen meist unmöglich, sodass man sich dann auf das Bestimmen von Näherungswerten beschränkt. Hierzu werden Verfahren bevorzugt, die sich durch numerische Stabilität und geringen Rechenaufwand auszeichnen. Dazu gehören Methoden für dichtbesetzte kleine bis mittlere Matrizen, wie

sowie spezielle Methoden für symmetrische Matrizen, als auch Methoden für dünnbesetzte große Matrizen, wie

Des Weiteren gibt es noch Methoden zur Abschätzung, z. B. mithilfe

die immer eine grobe Abschätzung (unter gewissen Bedingungen sogar genaue Bestimmung) zulassen.

  • Die Folded Spectrum Method liefert mit jedem Durchlauf einen Eigenvektor, der jedoch auch aus der Mitte des Spektrums stammen kann.

Berechnung der Eigenvektoren[Bearbeiten]

Algorithmus[Bearbeiten]

Für einen Eigenwert \lambda lassen sich die Eigenvektoren aus der Gleichung

(A-\lambda E) \cdot x = 0

bestimmen. Die Eigenvektoren spannen den Eigenraum auf, dessen Dimension als geometrische Vielfachheit des Eigenwertes bezeichnet wird. Für einen Eigenwert \lambda der geometrischen Vielfachheit \mu lassen sich also \mu linear unabhängige Eigenvektoren x_1, \ldots ,x_\mu finden, sodass die Menge aller Eigenvektoren zu \lambda gleich der Menge der Linearkombinationen von x_1, \ldots ,x_\mu ist. Die Menge \left\{x_1, \ldots ,x_\mu\right\} heißt dann eine Basis aus Eigenvektoren des zum Eigenwert \lambda gehörenden Eigenraumes.

Die geometrische Vielfachheit eines Eigenwertes kann man also auch als die maximale Anzahl linear unabhängiger Eigenvektoren zu diesem Eigenwert definieren.

Die geometrische Vielfachheit ist höchstens gleich der algebraischen Vielfachheit.

Beispiel[Bearbeiten]

Gegeben ist wie in obigem Beispiel die quadratische Matrix

A=\begin{pmatrix}0 & 2 & -1 \\ 2 & -1 & 1 \\ 2 & -1 & 3 \end{pmatrix}.

Die Eigenwerte \lambda_{1,2}=2 ,\  \lambda_3=-2 wurden oben schon berechnet. Zunächst werden hier die Eigenvektoren (und der durch die Eigenvektoren aufgespannte Eigenraum) zum Eigenwert \lambda=2 berechnet:


  A - 2 \cdot E =
  \begin{pmatrix}
  -2 & 2 & -1 \\
  2 & -3& 1 \\
  2 & -1 & 1
  \end{pmatrix}

Man muss also das folgende lineare Gleichungssystem lösen:


  \begin{pmatrix}
  -2 & 2 & -1 \\
  2 & -3& 1 \\
  2 & -1 & 1
  \end{pmatrix} \cdot x= \begin{pmatrix}0\\ 0\\ 0 \end{pmatrix}

Bringt man die Matrix auf obere Dreiecksform, so erhält man


  \begin{pmatrix}
  1 & 0 & \frac{1}{2} \\
  0 & 1 & 0 \\
  0 & 0 & 0
  \end{pmatrix} \cdot x= \begin{pmatrix}0\\ 0\\ 0 \end{pmatrix}.

Die gesuchten Eigenvektoren sind alle Vielfachen des Vektors x=\begin{pmatrix}\frac{1}{2}, & 0, & -1 \end{pmatrix}^\top (jedoch nicht das Nullfache des Vektors, da der Nullvektor niemals ein Eigenvektor ist).

Obwohl der Eigenwert \lambda=2 eine algebraische Vielfachheit von 2 hat, existiert nur ein linear unabhängiger Eigenvektor (der Eigenraum zu dem Eigenwert ist eindimensional); also hat dieser Eigenwert eine geometrische Vielfachheit von 1. Das hat eine wichtige Konsequenz: Die Matrix ist nicht diagonalisierbar. Man kann nun versuchen, die Matrix stattdessen in die Jordansche Normalform überzuführen. Dazu muss ein weiterer Eigenvektor zu diesem Eigenwert „erzwungen“ werden. Solche Eigenvektoren nennt man generalisierte Eigenvektoren oder Hauptvektoren.

Für den Eigenwert \lambda=-2 geht man genauso vor:


  \begin{pmatrix}
  2 & 2 & -1 \\
  2 & 1 & 1 \\
  2 & -1 & 5
  \end{pmatrix} \cdot x= \begin{pmatrix}0\\ 0\\ 0 \end{pmatrix}

Wieder bringt man die Matrix auf Dreiecksform:


  \begin{pmatrix}
  1 & 0 & \frac{3}{2} \\
  0 & 1 & -2 \\
  0 & 0 & 0
  \end{pmatrix} \cdot x= \begin{pmatrix}0\\ 0\\ 0 \end{pmatrix}

Hier ist die Lösung der Vektor \begin{pmatrix}\frac{3}{2}, & -2, & -1 \end{pmatrix}^\top, wieder mit allen seinen vom Nullvektor verschiedenen Vielfachen.

Eigenschaften[Bearbeiten]

\sum_{i=1}^n \lambda_i = \operatorname{Spur} \; A und  \prod_{i=1}^n \lambda_i = \operatorname{det} \; A,
wobei bei mehrfachen Eigenwerten die Vielfachheit zu beachten ist.
  • Anhand der Eigenwerte kann man die Definitheit einer Matrix bestimmen. So sind die Eigenwerte von reellen symmetrischen Matrizen reell. Im Rahmen von Hauptachsentransformationen werden reelle Eigenwerte symmetrischer Matrizen auch Hauptwert genannt.[4] Ist die Matrix echt positiv definit, so sind die Eigenwerte reell und echt positiv.
  • Zu einer symmetrischen reellen Matrix A lässt sich deshalb immer eine Basis aus orthogonalen Eigenvektoren angeben.[5] Dies ist eine direkte Folgerung aus dem Spektralsatz. Insbesondere sind Eigenvektoren zu verschiedenen Eigenwerten dann zueinander orthogonal.
  • Eigenvektoren zum Eigenwert 1 sind Fixpunkte in der Abbildungsgeometrie. Nach dem Satz vom Fußball gibt es beispielsweise zwei Punkte auf einem Fußball, die sich zu Beginn der ersten und der zweiten Halbzeit an der jeweils gleichen Stelle im Raum befinden.
  • Die aus den Vorzeichen der Eigenwerte errechnete Signatur einer symmetrischen Matrix verhält sich gemäß dem Trägheitssatz von Sylvester.
  • Jede quadratische Matrix A über dem Körper \mathbb{C} der komplexen Zahlen ist ähnlich zu einer oberen Dreiecksmatrix B. Die Eigenwerte von A sind genau die Diagonaleinträge der Matrix B.
  • Das Spektrum einer Matrix A ist gleich dem Spektrum der transponierten Matrix, also:
\sigma\left(A\right) = \sigma\left(A^\top\right).
Analog gilt
\sigma\left(A^*\right) = \sigma\left(\overline{A}\right) = \overline{\sigma\left(A\right)}.

Eigenvektoren kommutierender Matrizen[Bearbeiten]

Für kommutierende diagonalisierbare (insbesondere symmetrische) Matrizen ist es möglich, ein System gemeinsamer Eigenvektoren zu finden:

Kommutieren zwei Matrizen A und B (gilt also AB=BA) und ist \lambda ein nichtentarteter Eigenwert (d. h. der zugehörige Eigenraum ist eindimensional) von A mit Eigenvektor v, so gilt

ABv=BAv=\lambda Bv.

Auch Bv ist also ein Eigenvektor von A zum Eigenwert \lambda. Da dieser Eigenwert nicht entartet ist, muss Bv ein Vielfaches von v sein. Das bedeutet, dass v auch ein Eigenvektor der Matrix B ist.

Aus diesem einfachen Beweis geht hervor, dass die Eigenvektoren zu nichtentarteten Eigenwerten mehrerer paarweise kommutierender Matrizen Eigenvektoren aller dieser Matrizen sind.

Allgemein können auch für kommutierende diagonalisierbare Matrizen mit entarteten Eigenwerten gemeinsame Eigenvektoren gefunden werden.[6] Aus diesem Grund können mehrere paarweise kommutierende diagonalisierbare Matrizen auch simultan (d. h. mit einer Basistransformation für alle Matrizen) diagonalisiert werden.

Linkseigenvektoren und verallgemeinertes Eigenwertproblem[Bearbeiten]

Manchmal bezeichnet man einen so definierten Eigenvektor auch als Rechtseigenvektor und definiert dann entsprechend den Begriff des Linkseigenvektors durch die Gleichung

x^\top \cdot A= \lambda \, x^\top.

Linkseigenvektoren finden sich z. B. in der Stochastik bei der Berechnung von stationären Verteilungen von Markow-Ketten mittels einer Übergangsmatrix.

Wegen x^\top \cdot A = (A^\top \cdot x)^\top sind die Linkseigenvektoren von A gerade die Rechtseigenvektoren der transponierten Matrix A^\top. Bei normalen Matrizen fallen Links- und Rechtseigenvektoren zusammen.

Allgemeiner kann man auch quadratische Matrizen A und B und die Gleichung

A \cdot x = \lambda \, B \cdot x

untersuchen. Dieses verallgemeinerte Eigenwertproblem wird hier jedoch nicht weiter betrachtet.

Spektraltheorie in der Funktionalanalysis[Bearbeiten]

Hauptartikel: Spektraltheorie

Eigenwerte und Eigenfunktionen[Bearbeiten]

In der Funktionalanalysis betrachtet man lineare Abbildungen zwischen linearen Funktionenräumen (also lineare Abbildungen zwischen unendlichdimensionalen Vektorräumen). Meistens spricht man von linearen Operatoren anstatt von linearen Abbildungen. Sei V ein Vektorraum über einem Körper K mit \dim(V) = \infty und A ein linearer Operator. In der Funktionalanalysis ordnet man A ein Spektrum zu. Dieses besteht aus allen \lambda \in K, für die der Operator A - \lambda\operatorname{Id} nicht invertierbar ist. Dieses Spektrum muss jedoch nicht - wie bei Abbildungen zwischen endlichdimensionalen Vektorräumen - diskret sein. Denn im Gegensatz zu den linearen Abbildungen zwischen endlichdimensionalen Vektorräumen, die nur n \in \N verschiedene Eigenwerte haben, haben lineare Operatoren im Allgemeinen unendlich viele Elemente im Spektrum. Daher ist es zum Beispiel möglich, dass das Spektrum von linearen Operatoren Häufungspunkte besitzt. Um die Untersuchung des Operators und des Spektrums zu vereinfachen, unterteilt man das Spektrum in unterschiedliche Teilspektren. Elemente, die die Gleichung Ax - \lambda \operatorname{Id}x=0 für ein x \neq 0 lösen, nennt man wie in der linearen Algebra Eigenwerte. Die Gesamtheit der Eigenwerte nennt man das Punktspektrum von A. Wie in der linearen Algebra wird jedem Eigenwert ein Raum von Eigenvektoren zugeordnet. Da die Eigenvektoren meist als Funktionen aufgefasst werden, spricht man auch von Eigenfunktionen.

Beispiel[Bearbeiten]

Sei \Omega \subset \R offen. Dann besitzt der Ableitungsoperator \tfrac{d}{d x}\colon C^\infty(\Omega,\C) \to C^\infty(\Omega,\C) ein nichtleeres Punktspektrum. Betrachtet man nämlich für alle x \in \Omega die Gleichung

\frac{d f}{d x}(x) = \lambda f(x)

und wählt f(x) = e^{\lambda x}, dann sieht man, dass die Gleichung \tfrac{d}{d x}e^{\lambda x} = \lambda e^{\lambda x} für alle \lambda \in \C erfüllt ist. Also ist jedes \lambda\in\C ein Eigenwert mit zugehöriger Eigenfunktion e^{\lambda x}.

Praktische Beispiele[Bearbeiten]

Durch Lösung eines Eigenwertproblems berechnet man

Eigenwerte spielen in der Quantenmechanik eine besondere Rolle. Physikalische Größen wie z. B. der Drehimpuls werden hier durch Operatoren repräsentiert. Messbar sind nur die Eigenwerte der Operatoren. Hat z. B. der Hamiltonoperator, der die Energie eines quantenmechanischen Systems repräsentiert, ein diskretes Spektrum, so kann die Energie nur diskrete Werte annehmen, was z. B. für die Energieniveaus in einem Atom typisch ist. So stellen bei den Lösungen der bekannten Schrödingergleichung (im Jahr 1926 durch den Physiker Erwin Schrödinger aufgestellt) die Eigenwerte die erlaubten Energiewerte der Elektronen und die Eigenfunktionen die zugehörigen Wellenfunktionen der Elektronen dar. Auch die Unmöglichkeit der gleichzeitigen präzisen Messung gewisser Größen (z. B. von Ort und Impuls), wie von der Heisenbergschen Unschärferelation ausgedrückt, ist letztlich darauf zurückzuführen, dass für die jeweiligen Operatoren kein gemeinsames System von Eigenvektoren existiert.

Literatur[Bearbeiten]

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. FAQL.de, abgerufen am 10. Juni 2013, zitiert David Hilberts Artikel Grundzüge einer allgemeinen Theorie der linearen Integralgleichungen, veröffentlicht 1904 in den Nachrichten von der Königlichen Gesellschaft der Wissenschaften zu Göttingen, mathematisch-physikalische Klasse.
  2.  Hans-Joachim Kowalsky, Gerhard O. Michler: Lineare Algebra. 12 Auflage. Walter de Gruyter, Berlin 2003, ISBN 3-11-017963-6, S. 121.
  3. Moderne mathematische Methoden der Physik. Springer, 9. September 2010, ISBN 978-3-642-05184-5 (Zugriff am 29. Februar 2012).
  4.  Reiner Kreissig, Ulrich Benedix: Höhere technische Mechanik: Lehr- und Übungsbuch. Springer DE, ISBN 978-3-7091-6135-7 (eingeschränkte Vorschau in der Google-Buchsuche).
  5. Uni Tübingen Symmetrische Abbildungen und MatrizenTheorem 10.75, abgerufen am 19. Februar 2007.
  6. A. W. Joshi: Matrices and tensors in physics. New Age International, 1995, ISBN 978-81-224-0563-7 (Zugriff am 29. Februar 2012).