Lineare Algebra

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die lineare Algebra (auch Vektoralgebra) ist ein Teilgebiet der Mathematik, das sich mit Vektorräumen und linearen Abbildungen zwischen diesen beschäftigt. Dies schließt insbesondere auch die Betrachtung von linearen Gleichungssystemen und Matrizen mit ein.

Vektorräume und deren lineare Abbildungen sind ein wichtiges Hilfsmittel in vielen Bereichen der Mathematik. Außerhalb der reinen Mathematik finden sich Anwendungen u. a. in den Naturwissenschaften, in der Informatik und in der Wirtschaftswissenschaft (z. B. in der Optimierung).

Die lineare Algebra entstand aus zwei konkreten Anforderungen heraus: einerseits dem Lösen von linearen Gleichungssystemen, andererseits der rechnerischen Beschreibung geometrischer Objekte, der sogenannten analytischen Geometrie (daher bezeichnen manche Autoren lineare Algebra als lineare Geometrie).

Geschichte[Bearbeiten]

Während die Entwicklung der Algebra bereits im alten Ägypten begann, begann die Entwicklung der linearen Algebra als eigenständiges Teilgebiet erst im 17. Jahrhundert mit der Theorie der Determinante. Die Entwicklung dieser Theorie wurde unabhängig voneinander von Gottfried Wilhelm Leibniz und Seki Takakazu gestartet. Im Jahr 1750 veröffentlichte dann Gabriel Cramer die nach ihm benannte cramersche Regel. Damit war man erstmals im Besitz einer Lösungsformel für viele lineare Gleichungssysteme.[1]

Die Geschichte der modernen linearen Algebra reicht zurück bis in die Jahre 1843 und 1844. 1843 erdachte William Rowan Hamilton (von dem der Begriff Vektor stammt) mit den Quaternionen eine Erweiterung der komplexen Zahlen. 1844 veröffentlichte Hermann Graßmann sein Buch Die lineale Ausdehnungslehre. Arthur Cayley führte dann 1857 mit den 2×2-Matrizen eine der grundlegendsten algebraischen Ideen ein.

Ab dem 20. Jahrhundert befasste man sich dann mehrheitlich mit dem Begriff des Vektorraums. Insbesondere die Mathematiker August Ferdinand Möbius, Constantin Carathéodory und Hermann Weyl leisteten hierfür die Vorarbeit. So wurde beispielsweise festgestellt, dass lineare Abbildungen zwischen endlichdimensionalen Vektorräumen durch Matrizen beschrieben werden können. Auf dieser Erkenntnis basierend konnte Stefan Banach als Erster eine axiomatische Definition für reelle Vektorräume angeben.

Lineare Gleichungssysteme[Bearbeiten]

Hauptartikel: Lineares Gleichungssystem

Als lineares Gleichungssystem bezeichnet man eine Zusammenfassung von Gleichungen der Art

x_1+x_2 = 1
3x_1+6x_2 = 4

Derartige Gleichungssysteme erhält man aus vielen alltäglichen Fragestellungen, beispielsweise:

In welchem Verhältnis muss man eine 30%-ige Lösung und eine 60%-ige Lösung mischen, um eine 40%-ige Lösung zu erhalten?

Der wesentliche Abstraktionsschritt der linearen Algebra besteht nun darin, die linken Seiten als eine Funktion A der Unbekannten x=(x_1,x_2) aufzufassen:

A(x)=\begin{pmatrix}x_1+x_2\\ 3x_1+6x_2\end{pmatrix}

Dann wird die Lösung des Gleichungssystems zu der Aufgabe: Finde ein x, sodass

A(x)=\begin{pmatrix}1\\4\end{pmatrix}

gilt. Das Übereinanderschreiben ist dabei lediglich ein Formalismus, um mit mehr als einer Zahl gleichzeitig umgehen zu können.

Statt A schreibt man auch einfach die relevanten Zahlen in Form eines Rechtecks auf und nennt das Objekt eine Matrix:

A=\begin{pmatrix}1 & 1 \\ 3 & 6\end{pmatrix}

Man stellt fest, dass die Funktion A spezielle Eigenschaften hat, sie ist eine lineare Abbildung. Ist x eine Lösung für das Gleichungssystem A(x)=b, und y eine Lösung des Gleichungssystems A(y)=c, so ist

z=x+y=\begin{pmatrix}x_1+y_1\\x_2+y_2\end{pmatrix}

eine Lösung von A(z)=b+c. Man kann das auch in der Form A(x+y)=A(x)+A(y) schreiben. Ist weiter \lambda irgendeine reelle Zahl, so ist A(\lambda x)=\lambda\cdot A(x); dabei ist

\lambda x=\begin{pmatrix}\lambda x_1\\\lambda x_2\end{pmatrix}.

Analytische Geometrie[Bearbeiten]

Hauptartikel: Analytische Geometrie

Der andere Ursprung der linearen Algebra findet sich in der rechnerischen Beschreibung des 2- und 3-dimensionalen (euklidischen) Raumes, auch „Anschauungsraum“ genannt. Mit Hilfe eines Koordinatensystems können Punkte im Raum durch Tripel (x_1,x_2,x_3) von Zahlen beschrieben werden. Der Abbildungstyp der Verschiebung führt zum Begriff des Vektors, der Richtung und Betrag der Verschiebung angibt. Viele physikalische Größen, beispielsweise Kräfte, haben stets diesen Richtungsaspekt.

Da man auch Vektoren durch Zahlentripel (a_1,a_2,a_3) beschreiben kann, verschwimmt die Trennung zwischen Vektoren und Punkten: Einem Punkt P entspricht sein Ortsvektor, der vom Koordinatenursprung nach P zeigt.

Viele der in der klassischen Geometrie betrachteten Abbildungstypen, beispielsweise Drehungen um Achsen durch den Ursprung oder Spiegelungen an Ebenen durch den Ursprung, gehören zur Klasse der linearen Abbildungen, die schon oben erwähnt wurde.

Vektorräume und lineare Algebra[Bearbeiten]

Hauptartikel: Vektorraum

Der Begriff des Vektorraumes entsteht als Abstraktion der obigen Beispiele: Ein Vektorraum ist eine Menge, deren Elemente Vektoren genannt werden, zusammen mit

Diese Addition und die Skalarmultiplikation müssen noch einige einfache Eigenschaften erfüllen, die auch für die Vektoren im Anschauungsraum gelten.

Man könnte sagen, dass Vektorräume gerade so definiert sind, dass man von linearen Abbildungen zwischen ihnen sprechen kann.

In gewisser Weise ist der Begriff des Vektorraums für die lineare Algebra bereits zu allgemein. Man kann jedem Vektorraum eine Dimension zuordnen, beispielsweise hat die Ebene Dimension 2 und der Anschauungsraum die Dimension 3. Es gibt aber Vektorräume, deren Dimension nicht endlich ist, wodurch viele der bekannten Eigenschaften verloren gehen. Es hat sich aber als sehr erfolgreich erwiesen, unendlichdimensionale Vektorräume mit einer zusätzlichen topologischen Struktur auszustatten; die Untersuchung topologischer Vektorräume ist Gegenstand der Funktionalanalysis.

Der Rest dieses Artikels beschäftigt sich mit dem Fall endlicher Dimensionen.

Wichtige Sätze und Ergebnisse[Bearbeiten]

Jeder Vektorraum hat mindestens eine Basis. Je zwei Basen eines Vektorraumes haben gleich viele Elemente; nur deshalb ist es sinnvoll, von der Dimension eines Vektorraumes zu sprechen. Für Summen und Durchschnitte von Untervektorräumen gilt die Dimensionsformel und für die Dimensionen von Faktorräumen die Formel \dim V/U = \dim V - \dim U.

Jede lineare Abbildung f \colon V \rightarrow W ist durch die Angabe der Bilder einer Basis von V eindeutig festgelegt. Für lineare Abbildungen gelten der Homomorphiesatz und der Rangsatz. Lineare Abbildungen können bezüglich fest gewählter Basen durch Matrizen dargestellt werden. Dabei entspricht der Hintereinanderausführung von linearen Abbildungen die Multiplikation ihrer Darstellungsmatrizen.

Ein lineares Gleichungssystem A \cdot x = b mit A \in \mathbb{K}^{{m}\times{n}}, b \in \mathbb{K}^{m} und x \in \mathbb{K}^{n} ist genau dann lösbar, wenn der Rang der Matrix A gleich dem Rang der erweiterten Koeffizientenmatrix \begin{pmatrix}A & b\end{pmatrix} ist. In diesem Fall ist die Lösungsmenge des Systems ein affiner Unterraum von \mathbb{K}^{n} der Dimension n - \mathrm{rang}(A). Für nicht zu große Gleichungssysteme können die Rangbestimmung und die Berechnung des Lösungsraumes mit dem Gaußschen Eliminationsverfahren durchgeführt werden.

Eine lineare Abbildung f \colon V \rightarrow V (also ein Endomorphismus) eines endlichdimensionalen Vektorraumes V ist bereits invertierbar, wenn sie injektiv oder surjektiv ist. Dies ist wiederum genau dann der Fall, wenn ihre Determinante ungleich null ist. Hieraus folgt, dass die Eigenwerte eines Endomorphismus genau die Nullstellen seines charakteristischen Polynoms sind. Eine weitere wichtige Aussage über das charakteristische Polynom ist der Satz von Cayley-Hamilton.

Ein Endomorphismus (bzw. eine quadratische Matrix) ist genau dann diagonalisierbar, wenn das charakteristische Polynom in Linearfaktoren zerfällt und für jeden Eigenwert dessen algebraische Vielfachheit gleich der geometrischen Vielfachheit, also die Nullstellenordnung des Eigenwerts im charakteristischen Polynom gleich der Dimension des zugehörigen Eigenraumes ist. Äquivalent dazu ist die Existenz einer Basis des Vektorraumes, die aus Eigenvektoren der linearen Abbildung besteht. Endomorphismen, deren charakteristisches Polynom in Linearfaktoren zerfällt, sind immerhin noch trigonalisierbar, können also durch eine Dreiecksmatrix dargestellt werden. Ein etwas tiefer liegendes Ergebnis ist, dass die darstellende Matrix dabei sogar in jordansche Normalform gebracht werden kann.

In Vektorräumen, auf denen zusätzlich ein Skalarprodukt \langle \cdot,\cdot \rangle gegeben ist, wird durch \|x\| := \sqrt{\langle x,x \rangle} eine Norm definiert. In diesen Skalarprodukträumen existieren stets Orthonormalbasen, die etwa durch das Gram-Schmidtsche Orthonormalisierungsverfahren konstruiert werden können. Nach dem Projektionssatz kann man in diesen Räumen die Bestapproximation aus einem Untervektorraum durch orthogonale Projektion bestimmen.

Bezüglich der Diagonalisierbarkeit von Endomorphismen in Skalarprodukträumen stellt sich die Frage, ob eine Orthonormalbasis aus Eigenvektoren existiert. Das zentrale Resultat hierzu ist der Spektralsatz. Insbesondere gilt im reellen Fall: Zu jeder symmetrischen Matrix A \in \mathbb{\R}^{{n}\times{n}} gibt es eine orthogonale Matrix Q, sodass Q^TAQ eine Diagonalmatrix ist. Wendet man dieses Ergebnis auf quadratische Formen an, ergibt sich der Satz von der Hauptachsentransformation.

Auch Bilinearformen und Sesquilinearformen können bei fest gewählten Basen durch Matrizen dargestellt werden. Eine Bilinearform ist genau dann symmetrisch und positiv definit, also ein Skalarprodukt, wenn ihre darstellende Matrix symmetrisch und positiv definit ist. Eine symmetrische Matrix ist genau dann positiv definit, wenn alle ihre Eigenwerte positiv sind. Allgemein gilt für symmetrische Bilinearformen und hermitesche Sesquilinearformen der Trägheitssatz von Sylvester, der besagt, dass die Anzahl der positiven und negativen Eigenwerte der darstellenden Matrizen nicht von der Wahl der Basis abhängen.

Vektoren und Matrizen[Bearbeiten]

Hauptartikel: Vektor und Matrix (Mathematik)

Vektoren können durch ihre Komponenten beschrieben werden, die (je nach Anwendung) als (hier 3-dimensionaler) Spaltenvektor

\mathbf{a}=\begin{pmatrix} 3 \\ 7 \\ 2 \end{pmatrix}

oder (hier 4-dimensionaler) Zeilenvektor

\mathbf{b}=\begin{pmatrix} 4 & 6 & 3 & 7 \end{pmatrix}

geschrieben werden.

In der Literatur werden Vektoren auf unterschiedliche Weise von anderen Größen unterschieden: Es werden Kleinbuchstaben, fettgedruckte Kleinbuchstaben, unterstrichene Kleinbuchstaben, Kleinbuchstaben mit einem Pfeil darüber oder kleine Frakturbuchstaben benutzt. Dieser Artikel verwendet Kleinbuchstaben.

Eine Matrix wird durch ein 'Raster' von Zahlen angegeben. Hier ist eine Matrix mit 4 Zeilen und 3 Spalten:

\mathbf{M}=\begin{pmatrix}
8 & 2 & 9 \\
4 & 8 & 2 \\
8 & 3 & 7 \\
5 & 9 & 1
\end{pmatrix}

Matrizen werden meistens mit Großbuchstaben bezeichnet.

Einzelne Elemente eines Vektors werden bei Spaltenvektoren in der Regel durch einen Index angegeben: Das 2. Element des oben angegebenen Vektors a wäre dann a2=7. In Zeilenvektoren wird manchmal eine Hochzahl verwendet, wobei man aufpassen muss, ob eine Vektorindizierung oder ein Exponent vorliegt: Mit dem obigen Beispiel b hat man etwa b4=7.

Matrixelemente werden durch zwei Indizes angegeben. Dabei werden die Elemente durch Kleinbuchstaben dargestellt: m2,3=2 ist das Element in der 2. Zeile der 3. Spalte (statt „in der 3. Spalte der 2. Zeile“, denn so lässt sich m2,3 leichter lesen).

Der verallgemeinerte Begriff dieser Gebilde ist Tensor, Skalare sind Tensoren 0-ter Stufe, Vektoren Tensoren 1-ter Stufe, Matrizen Tensoren 2-ter Stufe. Ein Tensor n-ter Stufe kann durch einen n-dimensionalen Zahlen-Würfel repräsentiert werden.

Oftmals ist es erforderlich, Matrizen mittels elementarer Zeilenumformungen oder Basiswechsel auf eine spezielle Form zu bringen. Wichtig sind dabei insbesondere die Dreiecksform, die Diagonalform und die Jordansche Normalform.

Endomorphismen und quadratische Matrizen[Bearbeiten]

Bei der Darstellung einer linearen Abbildung – wie unter Matrix beschrieben – gibt es den Sonderfall einer linearen Abbildung f eines endlichdimensionalen Vektorraums auf sich selbst (eines sog. Endomorphismus). Man kann dann dieselbe Basis v für Urbild- und Bildkoordinaten verwenden und erhält eine quadratische Matrix A, sodass die Anwendung der linearen Abbildung der Linksmultiplikation mit A entspricht. Um die Abhängigkeit von f und v zum Ausdruck zu bringen, verwendet man Schreibweisen wie A=M_v(f) oder A = {}_vf_v. Die zweimalige Hintereinanderausführung dieser Abbildung entspricht dann der Multiplikation mit A^2 usw., und man kann alle polynomialen Ausdrücke mit A (Summen von Vielfachen von Potenzen von A) als lineare Abbildungen des Vektorraums auffassen.

Invertierbarkeit[Bearbeiten]

Analog zur Rechenregel x^0=1 bei Zahlen ist die nullte Potenz einer quadratischen Matrix die Diagonalmatrix E (Einheitsmatrix) mit Einsen auf der Diagonalen und in der alle restlichen Elemente Null sind, sie entspricht der Identitätsabbildung jedes Vektors auf sich selbst. Negative Potenzen einer quadratischen Matrix A lassen sich nur berechnen, wenn die durch A gegebene lineare Abbildung invertierbar ist, also keine zwei unterschiedlichen Vektoren u_1 und u_2 auf denselben Vektor Au_1=Au_2 abbildet. Anders ausgedrückt, muss für eine invertierbare Matrix A aus u_1-u_2\ne 0 stets A(u_1-u_2)\ne 0 folgen, das lineare Gleichungssystem Au=0 darf also nur die Lösung 0 haben. Zu einer invertierbaren Matrix A existiert eine inverse Matrix A^{-1} mit A^{-1}A=AA^{-1}=E.

Determinanten[Bearbeiten]

Hauptartikel: Determinante

Eine Determinante ist eine spezielle Funktion, die einer quadratischen Matrix eine Zahl zuordnet. Diese Zahl gibt Auskunft über einige Eigenschaften der Matrix. Beispielsweise lässt sich an ihr erkennen, ob eine Matrix invertierbar ist. Eine weitere wichtige Anwendung ist die Berechnung des charakteristischen Polynoms und damit der Eigenwerte der Matrix.

Es gibt geschlossene Formeln zur Berechnung der Determinanten, wie den Laplace’schen Entwicklungssatz oder die Leibniz-Formel. Diese Formeln sind jedoch eher von theoretischem Wert, da ihr Aufwand bei größeren Matrizen stark ansteigt. In der Praxis kann man Determinanten am leichtesten berechnen, indem man die Matrix mit Hilfe des Gauß-Algorithmus in obere oder untere Dreiecksform bringt, die Determinante ist dann einfach das Produkt der Hauptdiagonalelemente.

Beispiel[Bearbeiten]

Obige Begriffe sollen an einem durch die Fibonacci-Folge motivierten Beispiel verdeutlicht werden.

Berechnung von Potenzen mittels Diagonalisierung[Bearbeiten]

Die Fibonacci-Folge f_n ist rekursiv durch die Gleichungen f_0 = 0, f_1 = 1 und f_{n+1} = f_n + f_{n-1} für n\ge 1 definiert, was gleichbedeutend ist mit

{f_1\choose f_0} = {1\choose 0}

und

{f_{n+1}\choose f_n} = \begin{pmatrix}1&1\\1&0\end{pmatrix} \cdot {f_n\choose f_{n-1}} \quad \text{für} \quad n\ge 1,

also mit der nichtrekursiven Formel

{f_{n+1}\choose f_n} = \begin{pmatrix}1&1\\1&0\end{pmatrix}^n \cdot {1\choose 0} \quad \text{für} \quad n\ge 0,

in der die n-te Potenz einer Matrix A vorkommt.

Das Verhalten einer solchen Matrix bei Potenzierung ist nicht leicht zu erkennen; hingegen wird die n-te Potenz einer Diagonalmatrix einfach durch Potenzierung jedes einzelnen Diagonaleintrags berechnet. Wenn es nun eine invertierbare Matrix T gibt, so dass T^{-1}A T Diagonalform hat, lässt sich die Potenzierung von A auf die Potenzierung einer Diagonalmatrix zurückführen gemäß der Gleichung (T^{-1} A T)^n = T^{-1} A^n T (die linke Seite dieser Gleichung ist dann die n-te Potenz einer Diagonalmatrix). Allgemein lässt sich durch Diagonalisierung einer Matrix ihr Verhalten (bei Potenzierung, aber auch bei anderen Operationen) leichter erkennen.

Fasst man A = {}_vf_v als Matrix einer linearen Abbildung auf, so ist die Transformationsmatrix T die Basiswechselmatrix zu einer anderen Basis v', also T = {}_ve_{v'} (wobei die Identitätsabbildung e jeden Vektor auf sich selbst abbildet). Dann ist nämlich T^{-1}AT = {}_{v'}f_{v'}.

Im oben genannten Beispiel lässt sich eine Transformationsmatrix T finden, sodass

T^{-1}\cdot A\cdot T = \begin{pmatrix}\phi&0\\0&1-\phi\end{pmatrix}

eine Diagonalmatrix ist, in der der goldene Schnitt \phi = \frac{1+\sqrt5}{2} vorkommt. Hieraus erhält man schließlich die Formel

f_n = \frac{1}{\sqrt5} \cdot \left[ \left(\frac{1+\sqrt5}{2}\right)^n - \left(\frac{1-\sqrt5}{2}\right)^n \right].

Eigenwerte[Bearbeiten]

Wie kommt man von der Matrix A auf die Zahl \phi? An der Diagonalmatrix erkennt man sofort, dass

\begin{pmatrix}\phi&0\\0&1-\phi\end{pmatrix} \cdot {1\choose 0} = {\phi\choose 0},

es also einen Vektor u ungleich Null gibt, der durch Multiplikation mit der Diagonalmatrix komponentenweise vervielfacht (genauer: ver-\phi-facht) wird: (T^{-1}AT)u = \phi u. Die Zahl \phi heißt wegen dieser Eigenschaft ein Eigenwert der Matrix T^{-1}AT (mit Eigenvektor u). Im Fall von Diagonalmatrizen sind die Eigenwerte gleich den Diagonaleinträgen.

\phi ist aber auch zugleich Eigenwert der ursprünglichen Matrix A (mit Eigenvektor Tu, denn A(Tu) = \phi(Tu)), die Eigenwerte bleiben bei Transformation der Matrix also unverändert. Die Diagonalform der Matrix A ergibt sich demnach aus deren Eigenwerten, und um die Eigenwerte von A zu finden, muss man untersuchen, für welche Zahlen x das lineare Gleichungssystem Au = xu eine von Null verschiedene Lösung u hat (oder, anders ausgedrückt, die Matrix xE-A nicht invertierbar ist).

Die gesuchten Zahlen x sind genau diejenigen, die die Determinante der Matrix xE-A zu Null machen. Diese Determinante ist ein polynomialer Ausdruck in x (das sogenannte charakteristische Polynom von A); im Falle der oben genannten 2×2-Matrix A ergibt dies die quadratische Gleichung x^2 - x - 1=0 mit den beiden Lösungen x=\phi und x=1-\phi. Die zugehörigen Eigenvektoren sind Lösungen der linearen Gleichungssysteme Au = \phi u bzw. Au = (1-\phi)u, sie bilden dann die Spalten der Transformationsmatrix T.

Diagonalisierbarkeit[Bearbeiten]

Ob eine Matrix diagonalisierbar ist, hängt vom verwendeten Zahlbereich ab. A ist z. B. über den rationalen Zahlen nicht diagonalisierbar, weil die Eigenwerte \phi und 1-\phi irrationale Zahlen sind. Die Diagonalisierbarkeit kann aber auch unabhängig vom Zahlbereich scheitern, wenn nicht „genügend“ Eigenwerte vorhanden sind; so hat etwa die Jordanform-Matrix

\begin{pmatrix}1&1\\0&1\end{pmatrix}

nur den Eigenwert 1 (als Lösung der quadratischen Gleichung (x-1)^2 = 0) und ist nicht diagonalisierbar. Bei genügend großem Zahlbereich (z. B. über den komplexen Zahlen) lässt sich aber jede Matrix diagonalisieren oder in Jordansche Normalform transformieren.

Da die Transformation einer Matrix dem Basiswechsel einer linearen Abbildung entspricht, besagt diese letzte Aussage, dass man zu einer linearen Abbildung bei genügend großem Zahlbereich stets eine Basis wählen kann, die „auf einfache Weise“ abgebildet wird: Im Fall der Diagonalisierbarkeit wird jeder Basisvektor auf ein Vielfaches von sich abgebildet (ist also ein Eigenvektor); im Fall der Jordanform auf ein Vielfaches von sich plus evtl. den vorigen Basisvektor. Diese Theorie der linearen Abbildung lässt sich auf Körper verallgemeinern, die nicht „genügend groß“ sind; in ihnen müssen neben der Jordanform andere Normalformen betrachtet werden (z. B. die Frobenius-Normalform).

Literatur[Bearbeiten]

 Wikibooks: Lineare Algebra – Lern- und Lehrmaterialien

Weblinks[Bearbeiten]

 Commons: Lineare Algebra – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise[Bearbeiten]

  1.  Heinz-Wilhelm Alten: 4000 Jahre Algebra. Geschichte, Kulturen, Menschen. Springer, Berlin u. a. 2003, ISBN 3-540-43554-9, S. 335–339.