„Konvergenzgeschwindigkeit“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K Konvergenzrate
logarithmische Konvergenz + Einführung des Begriffs Q-Ordnung + Löschung des Abschnitts "Kritik an dem Konzept"
Zeile 1: Zeile 1:
Unter '''Konvergenzgeschwindigkeit''' (auch '''Konvergenzordnung''') versteht man die Geschwindigkeit, mit der sich die Glieder einer [[Konvergenz (Mathematik)|konvergenten]] [[Folge (Mathematik)|Folge]] (<math>x_n</math>) dem [[Grenzwert (Folge)|Grenzwert]] <math>x</math> nähern. In der [[Numerische Mathematik|numerischen Mathematik]] ist die Konvergenzgeschwindigkeit ein wichtiges Qualitätsmerkmal [[Iteratives Verfahren|iterativer Verfahren]], neben dem Rechenaufwand pro Iteration und der [[Stabilität (Numerik)|numerischen Stabilität]].
Unter '''Konvergenzgeschwindigkeit''' (auch '''Konvergenzordnung''') versteht man die Geschwindigkeit, mit der sich die Glieder einer [[Konvergenz (Mathematik)|konvergenten]] [[Folge (Mathematik)|Folge]] <math>\left(x_n\right)_{n\in\N}</math> dem [[Grenzwert (Folge)|Grenzwert]] <math>x</math> nähern. In der [[Numerische Mathematik|numerischen Mathematik]] ist die Konvergenzgeschwindigkeit ein wichtiges Qualitätsmerkmal [[Iteratives Verfahren|iterativer Verfahren]], neben dem Rechenaufwand pro Iteration und der [[Stabilität (Numerik)|numerischen Stabilität]].


== Konvergenzordnung bei Iterationsverfahren ==
== Konvergenzordnung ==


Man unterscheidet zwischen linearer, superlinearer sowie ''p''-ter Konvergenz''ordnung''.
Man unterscheidet zwischen linearer, superlinearer sowie ''p''-ter Konvergenz''ordnung''.


'''Lineare Konvergenz''' liegt vor, falls
'''Lineare Konvergenz''' liegt vor, falls
: <math> \limsup_{k\to \infty} \frac{\|x_{k+1}-x\|}{\|x_k-x\|} = c < 1</math>
: <math> \limsup_{k\to \infty} \frac{\|x_{k+1}-x\|}{\|x_k-x\|} = c < 1 \, .</math>
Manche Autoren bezeichnen <math>c</math> als die Konvergenz''rate'' (engl. ''rate of convergence'').
Manche Autoren bezeichnen <math>c</math> als die Konvergenz''rate'' (engl. ''rate of convergence'').


'''Superlineare Konvergenz''' liegt vor, wenn <math>c=0</math> ist, d.&nbsp;h., wenn es eine gegen Null konvergente Zahlenfolge (<math>c_k</math>) gibt mit:
'''Unterlineare''' oder '''sublineare Konvergenz''' liegt vor bei <math>c=1 \, .</math> Konvergiert die Folge unterlinear und ist zusätzlich
: <math> \lim_{k\to \infty} \frac{\|x_{k+2}-x_{k+1}\|}{\|x_{k+1}-x_k\|} = 1 \, ,</math>
dann spricht man von '''logarithmischer Konvergenz'''.


'''Superlineare Konvergenz''' liegt vor, wenn <math>c=0</math> ist, d.&nbsp;h., wenn es eine gegen Null konvergente Zahlenfolge (<math>c_k</math>) gibt mit:
: <math> \|x_{k+1}-x\| \leq c_k\|x_{k}-x\|, k=0,1,... </math>
: <math> \|x_{k+1}-x\| \leq c_k\|x_{k}-x\|, \; k=0,1,\ldots \, .</math>


Eine Folge, die superlinear konvergiert, konvergiert also schneller als linear.
Eine Folge, die superlinear konvergiert, konvergiert also schneller als linear.


'''Konvergenz der Ordnung ''p'' ''' mit <math>p>1</math> liegt vor, wenn (<math>x_k</math>) konvergiert und ein <math>c>0</math> existiert, so dass
'''Konvergenz der Ordnung ''p'' ''' mit <math>p>1</math> liegt vor, wenn <math>(x_k)</math> konvergiert und ein <math>c>0</math> existiert, so dass
: <math> \|x_{k+1}-x\| \leq c\|x_{k}-x\|^{p}, \; k=0,1,\ldots \, .</math>


In der Literatur findet sich auch die Formulierung »konvergiert mit der ''Q''-Ordnung (wenigstens) <math>p</math>« oder »hat die ''Q''-Konvergenzordnung (wenigstens) <math>p</math>« (engl. ''converges with Q-order at least p'') für denselben Sachverhalt.<ref>{{cite journal | last = Potra | first = F. A. | year = 1989 | title = On Q-order and R-order of convergence | journal = J. Optim. Th. Appl. | volume = 63 | issue = 3 | pages = 415–431 | doi = 10.1007/BF00939805}}</ref>
: <math> \|x_{k+1}-x\| \leq c\|x_{k}-x\|^{p}, k=0,1,... </math>
Konvergiert die Folge <math>\left(x_n\right) </math> mit der ''Q''-Ordnung wenigstens <math>p</math>, dann konvergiert sie auch mit der ''Q''-Ordnung wenigstens <math>p^\prime</math> für jedes <math>1 < p^\prime \le p \, .</math>
Man sagt, die Folge <math>\left(x_n\right) </math> hat die exakte ''Q''-Ordnung <math>p \, ,</math> wenn es positive <math>a,b </math> mit
: <math> a\|x_{k}-x\|^p \leq \|x_{k+1}-x\| \leq b\|x_{k}-x\|^p, \; k=0,1,\ldots </math>
gibt.
Die exakte ''Q''-Ordnung ist eindeutig, wenn sie existiert.


Für <math>p=2</math> spricht man von '''quadratischer Konvergenz'''. Konvergenz der Ordnung <math>p>1</math> impliziert superlineare Konvergenz und superlineare Konvergenz impliziert lineare Konvergenz.
Für <math>p=2</math> spricht man von '''quadratischer Konvergenz'''. Konvergenz der Ordnung <math>p>1</math> impliziert superlineare Konvergenz und superlineare Konvergenz impliziert lineare Konvergenz.
Zeile 31: Zeile 40:


== Allgemeine Definition der Konvergenzgeschwindigkeit ==
== Allgemeine Definition der Konvergenzgeschwindigkeit ==
Um die Konvergenzgeschwindigkeit zu beschreiben, mit der eine Folge (<math>x_n</math>) gegen den Grenzwert ''x'' konvergiert, vergleicht man die Konvergenzgeschwindigkeit der [[Nullfolge]] <math>(a_n) = (x - x_n)</math> mit gewissen anderen Nullfolgen, für deren Konvergenzgeschwindigkeit man ein gutes Gefühl hat wie z.&nbsp;B. <math>(n^{-a})</math>, <math>(n^{-a} \log n)</math> für <math>a>0</math>, <math>(q^n)</math> für 0<q<1 oder <math>(e^{-2^n})</math>.
Um die Konvergenzgeschwindigkeit zu beschreiben, mit der eine Folge (<math>x_n</math>) gegen den Grenzwert <math>x</math> konvergiert, vergleicht man die Konvergenzgeschwindigkeit der [[Nullfolge]] <math>(a_n) = (x - x_n)</math> mit gewissen anderen Nullfolgen, für deren Konvergenzgeschwindigkeit man ein gutes Gefühl hat wie z.&nbsp;B. <math>(n^{-a})</math>, <math>(n^{-a} \log n)</math> für <math>a>0</math>, <math>(q^n)</math> für <math>0<q<1</math> oder <math>(e^{-2^n})</math>.


;Definition
;Definition
Man sagt, eine Nullfolge (<math>a_n</math>) konvergiert mindestens so schnell wie eine Nullfolge (<math>b_n</math>), wenn gilt <math>\sup |a_n /b_n| < \infty</math>.
Man sagt, eine Nullfolge (<math>a_n</math>) konvergiert mindestens so schnell wie eine Nullfolge (<math>b_n</math>), wenn gilt <math>\sup |a_n /b_n| < \infty</math>.


Eine Folge (<math>a_n</math>) heißt [[Nuklearer Raum#Schnell fallende Folgen|schnell fallend]], wenn sie schneller als jede Folge der Art (<math>n^{-k}</math>), ''k'' eine [[natürliche Zahl]], fällt, also <math>\sup |a_n| n^k
Eine Folge (<math>a_n</math>) heißt [[Nuklearer Raum#Schnell fallende Folgen|schnell fallend]], wenn sie schneller als jede Folge der Art (<math>n^{-k}</math>), <math>k</math> eine [[natürliche Zahl]], fällt, also <math>\sup |a_n| n^k
< \infty</math> für jedes ''k'' (ein Beispiel ist etwa die Folge <math>\left(e^{-n}\right)</math>.)
< \infty</math> für jedes <math>k</math> (ein Beispiel ist etwa die Folge <math>\left(e^{-n}\right)</math>.)


Von besonderem Interesse ist also die Beschreibung der Konvergenzordnung numerischer Verfahren in [[Normierter Raum|normierten Räumen]], wo also die Folgenglieder die Gestalt <math>\|x-x_n \|</math> haben.
Von besonderem Interesse ist also die Beschreibung der Konvergenzordnung numerischer Verfahren in [[Normierter Raum|normierten Räumen]], wo also die Folgenglieder die Gestalt <math>\|x-x_n \|</math> haben.


Im Sinne dieser Definition nennt man ein Iterationsverfahren linear konvergent, wenn es so schnell wie die Folge (<math>q^n</math>) mit 0<q<1 konvergiert. Man nennt es quadratisch konvergent, wenn es so schnell wie die Folge <math>\left(e^{-2^n}\right)</math> konvergiert. Ebenso lassen sich auch höhere Konvergenzordnungen (kubisch, superlinear) definieren.
Im Sinne dieser Definition nennt man ein Iterationsverfahren linear konvergent, wenn es so schnell wie die Folge <math>\left(q^n\right)</math> mit <math>0<q<1</math> konvergiert. Man nennt es quadratisch konvergent, wenn es so schnell wie die Folge <math>\left(e^{-2^n}\right)</math> konvergiert. Ebenso lassen sich auch höhere Konvergenzordnungen (kubisch, superlinear) definieren.


== Beliebig langsame Konvergenz ==
== Beliebig langsame Konvergenz ==
Viele wichtige numerische Verfahren sind ''beliebig langsam'' konvergent. Sei also ''X'' ein [[Banachraum]] und <math>X_n</math> eine Folge von n-dimensionalen [[Teilraum|Teilräumen]] und sei ''V'' ein Verfahren, das zu jeder Lösung einer Gleichung <math>f(x) = y</math> eine angenäherte Lösung <math>x_n</math> in <math>X_n</math> liefert. Das Verfahren V heißt dann '''beliebig langsam konvergent''', wenn es zu jeder positiven Nullfolge <math>(a_n)</math> ein ''y'' gibt, so dass <math>(x-x_n)</math> für die zugehörigen angenäherten Lösungen <math>x_n</math> langsamer als die Folge <math>(a_n)</math> konvergiert.
Viele wichtige numerische Verfahren sind ''beliebig langsam'' konvergent. Sei also <math>X</math> ein [[Banachraum]] und <math>X_n</math> eine Folge von {{nowrap|<math>n</math>-dimensionalen}} [[Teilraum|Teilräumen]] und sei ''V'' ein Verfahren, das zu jeder Lösung einer Gleichung <math>f(x) = y</math> eine angenäherte Lösung <math>x_n</math> in <math>X_n</math> liefert. Das Verfahren ''V'' heißt dann '''beliebig langsam konvergent''', wenn es zu jeder positiven Nullfolge <math>(a_n)</math> ein ''y'' gibt, so dass <math>(x-x_n)</math> für die zugehörigen angenäherten Lösungen <math>x_n</math> langsamer als die Folge <math>(a_n)</math> konvergiert.


Setzt man z.&nbsp;B. bei der [[Numerische Integration|numerischen Integration]] nur die [[Stetigkeit]] der zu integrierenden Funktion voraus, nicht aber eine gewisse [[Differenzierbarkeit]]sordnung, so ist das Verfahren der numerischen Integration beliebig langsam konvergent, d.&nbsp;h. zu jeder beliebig langsam gegen Null konvergierenden [[Monotone Folge|monotonen Folge]] positiver Zahlen gibt es eine stetige Funktion f, so dass die Folge der [[Numerische Quadratur|Quadraturwerte]] langsamer gegen das [[Integralrechnung|Integral]] konvergieren als die gegebene Nullfolge. Andere Beispiele findet man bei der Interpolation oder der Lösung [[inkorrekt gestellte Probleme|inkorrekt gestellter Probleme]].
Setzt man z.&nbsp;B. bei der [[Numerische Integration|numerischen Integration]] nur die [[Stetigkeit]] der zu integrierenden Funktion voraus, nicht aber eine gewisse [[Differenzierbarkeit]]sordnung, so ist das Verfahren der numerischen Integration beliebig langsam konvergent, d.&nbsp;h. zu jeder beliebig langsam gegen Null konvergierenden [[Monotone Folge|monotonen Folge]] positiver Zahlen gibt es eine stetige Funktion <math>f</math>, so dass die Folge der [[Numerische Quadratur|Quadraturwerte]] langsamer gegen das [[Integralrechnung|Integral]] konvergieren als die gegebene Nullfolge. Andere Beispiele findet man bei der Interpolation oder der Lösung [[inkorrekt gestellte Probleme|inkorrekt gestellter Probleme]].


== Umgekehrte Resultate ==
== Umgekehrte Resultate ==
In etlichen Disziplinen der [[Analysis]] lassen sich aus der Konvergenzgeschwindigkeit Erkenntnisse über die Struktur des zu untersuchenden Problems gewinnen. Als Beispiel seien die [[Sergei Natanowitsch Bernstein|Bernstein]]&shy;sätze aus der [[Approximationstheorie]] erwähnt: Ist eine stetige Funktion durch [[Polynom]]e vom [[Grad (Polynom)|Grad]] ''n'' mit der Konvergenzgeschwindigkeit <math>\mathcal{O}(n^{-k-a})</math> für ein ''a>0'' approximierbar, so ist sie ''k''-fach differenzierbar.
In etlichen Disziplinen der [[Analysis]] lassen sich aus der Konvergenzgeschwindigkeit Erkenntnisse über die Struktur des zu untersuchenden Problems gewinnen. Als Beispiel seien die [[Sergei Natanowitsch Bernstein|Bernstein]]&shy;sätze aus der [[Approximationstheorie]] erwähnt: Ist eine stetige Funktion durch [[Polynom]]e vom [[Grad (Polynom)|Grad]] <math>n</math> mit der Konvergenzgeschwindigkeit <math>\mathcal{O}(n^{-k-a})</math> für ein <math>a>0</math> approximierbar, so ist sie {{nowrap|<math>k</math>-fach}} differenzierbar.

== Kritik an dem Konzept ==
Oftmals ist man lediglich an einem Verfahren interessiert, welches schnell (<math>k\leq 10</math>) eine bestimmte Genauigkeit, z.&nbsp;B. [[IEEE]]-[[double precision]],

: <math> \|x_{k}-x\| < \epsilon </math>

erreicht. Dafür ist es jedoch zweitrangig, ob das Verfahren für große <math>k</math>, beispielsweise <math>k>100</math>, lineare, quadratische oder kubische Konvergenzgeschwindigkeit besitzt.


== Siehe auch ==
== Siehe auch ==
Zeile 66: Zeile 68:
* Eberhard Schock, ''Arbitrarily Slow Convergence, Uniform Convergence and Superconvergence of Galerkin-like Methods'', IMA J. Numer. Analysis 5 (1985) 153-160
* Eberhard Schock, ''Arbitrarily Slow Convergence, Uniform Convergence and Superconvergence of Galerkin-like Methods'', IMA J. Numer. Analysis 5 (1985) 153-160
* Hans R. Schwarz, Norbert Köckler: ''Numerische Mathematik''. 5. Auflage. Teubner, Stuttgart 2004,
* Hans R. Schwarz, Norbert Köckler: ''Numerische Mathematik''. 5. Auflage. Teubner, Stuttgart 2004,

== Einzelnachweise ==
<references/>


[[Kategorie:Numerische Mathematik]]
[[Kategorie:Numerische Mathematik]]

Version vom 4. Oktober 2017, 18:00 Uhr

Unter Konvergenzgeschwindigkeit (auch Konvergenzordnung) versteht man die Geschwindigkeit, mit der sich die Glieder einer konvergenten Folge dem Grenzwert nähern. In der numerischen Mathematik ist die Konvergenzgeschwindigkeit ein wichtiges Qualitätsmerkmal iterativer Verfahren, neben dem Rechenaufwand pro Iteration und der numerischen Stabilität.

Konvergenzordnung

Man unterscheidet zwischen linearer, superlinearer sowie p-ter Konvergenzordnung.

Lineare Konvergenz liegt vor, falls

Manche Autoren bezeichnen als die Konvergenzrate (engl. rate of convergence).

Unterlineare oder sublineare Konvergenz liegt vor bei Konvergiert die Folge unterlinear und ist zusätzlich

dann spricht man von logarithmischer Konvergenz.

Superlineare Konvergenz liegt vor, wenn ist, d. h., wenn es eine gegen Null konvergente Zahlenfolge () gibt mit:

Eine Folge, die superlinear konvergiert, konvergiert also schneller als linear.

Konvergenz der Ordnung p mit liegt vor, wenn konvergiert und ein existiert, so dass

In der Literatur findet sich auch die Formulierung »konvergiert mit der Q-Ordnung (wenigstens) « oder »hat die Q-Konvergenzordnung (wenigstens) « (engl. converges with Q-order at least p) für denselben Sachverhalt.[1] Konvergiert die Folge mit der Q-Ordnung wenigstens , dann konvergiert sie auch mit der Q-Ordnung wenigstens für jedes Man sagt, die Folge hat die exakte Q-Ordnung wenn es positive mit

gibt. Die exakte Q-Ordnung ist eindeutig, wenn sie existiert.

Für spricht man von quadratischer Konvergenz. Konvergenz der Ordnung impliziert superlineare Konvergenz und superlineare Konvergenz impliziert lineare Konvergenz.

Der Begriff ist vor allem in der Numerik wichtig, wo eine Näherung des Grenzwertes eines Iterationsverfahrens meist durch Berechnung einer kleinen Anzahl von Folgengliedern geschieht. Konvergenz der Ordnung bedeutet dann, dass in jedem Iterationsschritt die Anzahl der genauen Dezimalstellen (bzw. Stellen in einem beliebigen Stellenwertsystem) ver--facht werden, also beispielsweise bei quadratischer Konvergenz verdoppelt.

Die schnellere Konvergenz von Verfahren höherer Ordnung wird meist mit größerem Aufwand pro Iteration bezahlt, in vielen Fällen auch mit schlechteren Stabilitätseigenschaften oder Einschränkungen an die behandelbaren Problemklassen (z. B. Forderung nach höherer Differenzierbarkeitsordnung der Daten).

Beispiele

  • Das Newton-Verfahren konvergiert bei einer einfachen Nullstelle mit zweiter Ordnung. Vereinfachte Varianten des Newton-Verfahrens konvergieren langsamer, teilweise superlinear, teilweise mit erster Ordnung. Im Vergleich zum Newton-Verfahren ist ein Iterationsschritt aber möglicherweise deutlich günstiger.
  • Fixpunktverfahren, deren Konvergenz mit dem Fixpunktsatz von Banach nachgewiesen ist (beispielsweise Splitting-Verfahren), haben mindestens lineare Konvergenzgeschwindigkeit.
  • Das Sekantenverfahren hat eine gebrochene Konvergenzordnung mit (goldener Schnitt), es konvergiert insbesondere superlinear.

Allgemeine Definition der Konvergenzgeschwindigkeit

Um die Konvergenzgeschwindigkeit zu beschreiben, mit der eine Folge () gegen den Grenzwert konvergiert, vergleicht man die Konvergenzgeschwindigkeit der Nullfolge mit gewissen anderen Nullfolgen, für deren Konvergenzgeschwindigkeit man ein gutes Gefühl hat wie z. B. , für , für oder .

Definition

Man sagt, eine Nullfolge () konvergiert mindestens so schnell wie eine Nullfolge (), wenn gilt .

Eine Folge () heißt schnell fallend, wenn sie schneller als jede Folge der Art (), eine natürliche Zahl, fällt, also für jedes (ein Beispiel ist etwa die Folge .)

Von besonderem Interesse ist also die Beschreibung der Konvergenzordnung numerischer Verfahren in normierten Räumen, wo also die Folgenglieder die Gestalt haben.

Im Sinne dieser Definition nennt man ein Iterationsverfahren linear konvergent, wenn es so schnell wie die Folge mit konvergiert. Man nennt es quadratisch konvergent, wenn es so schnell wie die Folge konvergiert. Ebenso lassen sich auch höhere Konvergenzordnungen (kubisch, superlinear) definieren.

Beliebig langsame Konvergenz

Viele wichtige numerische Verfahren sind beliebig langsam konvergent. Sei also ein Banachraum und eine Folge von -dimensionalen Teilräumen und sei V ein Verfahren, das zu jeder Lösung einer Gleichung eine angenäherte Lösung in liefert. Das Verfahren V heißt dann beliebig langsam konvergent, wenn es zu jeder positiven Nullfolge ein y gibt, so dass für die zugehörigen angenäherten Lösungen langsamer als die Folge konvergiert.

Setzt man z. B. bei der numerischen Integration nur die Stetigkeit der zu integrierenden Funktion voraus, nicht aber eine gewisse Differenzierbarkeitsordnung, so ist das Verfahren der numerischen Integration beliebig langsam konvergent, d. h. zu jeder beliebig langsam gegen Null konvergierenden monotonen Folge positiver Zahlen gibt es eine stetige Funktion , so dass die Folge der Quadraturwerte langsamer gegen das Integral konvergieren als die gegebene Nullfolge. Andere Beispiele findet man bei der Interpolation oder der Lösung inkorrekt gestellter Probleme.

Umgekehrte Resultate

In etlichen Disziplinen der Analysis lassen sich aus der Konvergenzgeschwindigkeit Erkenntnisse über die Struktur des zu untersuchenden Problems gewinnen. Als Beispiel seien die Bernstein­sätze aus der Approximationstheorie erwähnt: Ist eine stetige Funktion durch Polynome vom Grad mit der Konvergenzgeschwindigkeit für ein approximierbar, so ist sie -fach differenzierbar.

Siehe auch

Literatur

  • Martin Hanke-Bourgeois, Grundlagen der Numerischen Mathematik und des Wissenschaftlichen Rechnens, Teubner, Stuttgart 2002
  • Arnold Schönhage, Approximationstheorie, de Gruyter, Berlin 1971
  • Eberhard Schock, Arbitrarily Slow Convergence, Uniform Convergence and Superconvergence of Galerkin-like Methods, IMA J. Numer. Analysis 5 (1985) 153-160
  • Hans R. Schwarz, Norbert Köckler: Numerische Mathematik. 5. Auflage. Teubner, Stuttgart 2004,

Einzelnachweise

  1. F. A. Potra: On Q-order and R-order of convergence. In: J. Optim. Th. Appl. 63. Jahrgang, Nr. 3, 1989, S. 415–431, doi:10.1007/BF00939805.