Der Alternantensatz in der Approximationstheorie gibt eine notwendige und hinreichende Bedingung für die beste Approximation einer stetigen Funktion durch Polynome. Er wird dem russischen Mathematiker Pafnuti Lwowitsch Tschebyschow zugeschrieben.[ 1]
Sei
[
a
,
b
]
{\displaystyle [a,b]}
ein Intervall
⊂
R
{\displaystyle \subset \mathbb {R} }
und
f
:
[
a
,
b
]
→
R
{\displaystyle f\colon [a,b]\to \mathbb {R} }
eine stetige Funktion . Unter allen Polynomen eines Grades
≤
n
{\displaystyle \leq n}
, minimiert das Polynom
p
{\displaystyle p}
die Supremumsnorm
‖
f
−
p
‖
∞
{\displaystyle \|f-p\|_{\infty }}
dann und nur dann, wenn es
n
+
2
{\displaystyle n+2}
Extremstellen
a
≤
x
0
<
x
1
<
⋯
<
x
n
+
1
≤
b
{\displaystyle a\leq x_{0}<x_{1}<\cdots <x_{n+1}\leq b}
gibt, so dass
f
(
x
i
)
−
p
(
x
i
)
=
σ
(
−
1
)
i
E
{\displaystyle f(x_{i})-p(x_{i})=\sigma (-1)^{i}E}
für alle
i
=
0
,
…
,
n
+
1
{\displaystyle i=0,\ldots ,n+1}
ist mit
E
:=
‖
f
−
p
‖
∞
{\displaystyle E:=\|f-p\|_{\infty }}
und festem
σ
=
±
1
{\displaystyle \sigma =\pm 1}
.[ 2] [ 3]
E
{\displaystyle E}
ist der Minimalabstand (oder Approximationsfehler ) von
f
{\displaystyle f}
zu
P
n
{\displaystyle {\mathcal {P}}_{n}}
, dem Raum der algebraischen Polynome vom Grad kleiner oder gleich
n
{\displaystyle n}
. Ein Polynom
p
∈
P
n
{\displaystyle p\in {\mathcal {P}}_{n}}
mit Minimalabstand zu
f
{\displaystyle f}
heißt Proximum oder beste Approximation an
f
{\displaystyle f}
bezüglich
P
n
{\displaystyle {\mathcal {P}}_{n}}
.[ 4]
Beste Approximation der Quadratwurzelfunktion durch eine lineare Funktion: Die maximale Differenz 1/8 wird dreimal mit wechselndem Vorzeichen angenommen
Nach dem Alternantensatz ist das Polynom
p
(
x
)
=
x
+
1
8
{\displaystyle p(x)=x+{\tfrac {1}{8}}}
dasjenige Polynom vom Grad kleiner oder gleich
n
=
1
{\displaystyle n=1}
, das die Quadratwurzelfunktion
f
:
[
0
,
1
]
→
R
{\displaystyle f\colon [0,1]\to \mathbb {R} }
,
f
(
x
)
=
x
{\displaystyle f(x)={\sqrt {x}}}
auf dem Intervall
[
a
,
b
]
=
[
0
,
1
]
{\displaystyle [a,b]=[0,1]}
bezüglich der Supremumsnorm am besten approximiert. Da nämlich
f
{\displaystyle f}
und damit auch die Fehlerfunktion
f
−
p
{\displaystyle f-p}
streng konkav ist, nimmt letztere an den Intervallgrenzen
x
0
:=
0
{\displaystyle x_{0}:=0}
und
x
2
:=
1
{\displaystyle x_{2}:=1}
jeweils ein lokales Minimum an, ferner ein Maximum
x
1
{\displaystyle x_{1}}
im Inneren von
[
0
,
1
]
{\displaystyle [0,1]}
. Dieses bestimmt sich durch Nullsetzen der Ableitung
f
′
−
p
′
=
1
2
x
1
−
1
{\displaystyle f'-p'={\tfrac {1}{2{\sqrt {x_{1}}}}}-1}
zu
x
1
=
1
4
{\displaystyle x_{1}={\tfrac {1}{4}}}
. Nun ist mit
E
:=
1
8
{\displaystyle E:={\tfrac {1}{8}}}
an diesen Extremstellen
f
(
0
)
−
p
(
0
)
=
−
E
,
f
(
1
4
)
−
p
(
1
4
)
=
+
E
,
f
(
1
)
−
p
(
1
)
=
−
E
{\displaystyle f(0)-p(0)=-E,\ f({\tfrac {1}{4}})-p({\tfrac {1}{4}})=+E,\ f(1)-p(1)=-E}
, ist also erstens
E
=
max
0
≤
x
≤
1
|
f
(
x
)
−
p
(
x
)
|
=
‖
f
−
p
‖
∞
{\displaystyle E=\max _{0\leq x\leq 1}|f(x)-p(x)|=\|f-p\|_{\infty }}
und zweitens
f
(
x
i
)
−
p
(
x
i
)
=
σ
(
−
1
)
i
E
{\displaystyle f(x_{i})-p(x_{i})=\sigma (-1)^{i}E}
mit
σ
=
−
1
{\displaystyle \sigma =-1}
.
Die Funktion
f
(
x
)
=
1
r
−
x
{\displaystyle f(x)={\frac {1}{r-x}}}
mit einem
r
>
1
{\displaystyle r>1}
wird im Intervall
[
−
1
,
1
]
{\displaystyle [-1,1]}
für jedes
n
∈
N
0
{\displaystyle n\in \mathbb {N} _{0}}
durch das Polynom
p
n
(
x
)
:=
1
r
−
x
−
E
n
V
n
{\displaystyle p_{n}(x):={\frac {1}{r-x}}-E_{n}V_{n}}
vom Grad
n
{\displaystyle n}
optimal approximiert.
Dabei ist
E
n
:=
(
r
−
r
2
−
1
)
n
r
2
−
1
{\displaystyle E_{n}:={\frac {{\bigl (}r-{\sqrt {r^{2}-1}}{\bigr )}^{n}}{r^{2}-1}}}
sowie
V
n
(
x
)
:=
cos
(
n
φ
+
ψ
)
{\displaystyle V_{n}(x):=\cos(n\varphi +\psi )}
gesetzt
und
φ
{\displaystyle \varphi }
durch
cos
φ
:=
x
{\displaystyle \cos \varphi :=x}
sowie
ψ
{\displaystyle \psi }
durch
tan
ψ
2
:=
r
+
1
r
−
1
tan
φ
2
{\displaystyle \tan {\frac {\psi }{2}}:={\sqrt {\frac {r+1}{r-1}}}\tan {\frac {\varphi }{2}}}
implizit definiert.
Bemerkung
Die (besten) Polynome
p
n
(
x
)
{\displaystyle p_{n}(x)}
konvergieren für wachsendes
n
{\displaystyle n}
(gleichmäßig und) mit linearer Konvergenzgeschwindigkeit gegen die Funktion
f
{\displaystyle f}
.
Beweisskizze
Polynomeigenschaft: Durch Umrechnungen u. a. über Tschebyschow-Polynome erster und zweiter Art erweist sich die Funktion
q
(
x
)
:=
1
−
(
r
−
x
)
E
n
V
n
{\displaystyle q(x):=1-(r-x)\,E_{n}V_{n}}
im Zähler von
p
n
(
x
)
=
1
r
−
x
−
E
n
V
n
{\displaystyle p_{n}(x)={\frac {1}{r-x}}-E_{n}V_{n}}
als ein Polynom vom Grade
n
+
1
{\displaystyle n+1}
. Damit ist
p
n
(
x
)
{\displaystyle p_{n}(x)}
zunächst eine gebrochenrationale Funktion. Ferner hat
q
(
x
)
{\displaystyle q(x)}
die Nullstelle
r
{\displaystyle r}
, so dass sich der Faktor
(
x
−
r
)
{\displaystyle (x-r)}
von
q
(
x
)
{\displaystyle q(x)}
abspalten und mit dem Nenner
(
r
−
x
)
{\displaystyle (r-x)}
von
p
n
(
x
)
{\displaystyle p_{n}(x)}
wegkürzen lässt. Am Ende ist
p
n
(
x
)
{\displaystyle p_{n}(x)}
ein Polynom vom Grad
n
{\displaystyle n}
.Beste Approximation der Funktion
1
37
/
12
−
x
{\displaystyle {\tfrac {1}{37/12-x}}}
(rot) durch Polynome vom Grad 0 , 1 und 2 . Die Maximalabweichungen sind durch senkrechte Balken dargestellt, die in alternierender Richtung von der Funktion abstehen. Beim Grad 3 würden die Fehlerbalken unter die Pixelgrenze fallen.
Beste Approximation: Die angegebenen Relationen definieren eine monotone und bijektive Abbildung
]
−
1
,
1
[
←
→
]
→
0
,
(
n
+
1
)
π
[
x
↦
n
φ
+
ψ
{\displaystyle {\begin{array}{clc}{]-1,1{\overleftarrow {[}}}\;\;&\to \;\;&{{\overrightarrow {]}}0,(n+1)\pi [}\\x&\mapsto &n\varphi +\psi \\\end{array}}}
zwischen zwei offenen Intervallen , bei der unter den Vielfachen von
π
{\displaystyle \pi }
(und damit den Extremstellen des Kosinus ) genau die Werte
π
,
2
π
,
…
,
n
π
{\displaystyle \pi ,2\pi ,\ldots ,n\pi }
getroffen werden. (Dabei sind die jeweiligen Hauptwerte der Arkusfunktionen genommen worden.) Fügt man die Intervallgrenzen
x
0
=
1
{\displaystyle x_{0}=1}
mit
n
φ
+
ψ
=
0
{\displaystyle n\varphi +\psi =0}
und
x
n
+
1
=
−
1
{\displaystyle x_{n+1}=-1}
mit
n
φ
+
ψ
=
(
n
+
1
)
π
{\displaystyle n\varphi +\psi =(n+1)\pi }
hinzu, dann hat man die
n
+
2
{\displaystyle n+2}
Alternanten
x
0
>
⋯
>
x
i
>
⋯
>
x
n
+
1
{\displaystyle x_{0}>\dots >x_{i}>\dots >x_{n+1}}
, für die die Fehlerfunktion
f
(
x
)
−
p
n
(
x
)
=
E
n
cos
(
n
φ
+
ψ
)
{\displaystyle f(x)-p_{n}(x)=E_{n}\cos(n\varphi +\psi )}
genau
n
+
2
{\displaystyle n+2}
mal alternierend den jeweiligen Extremwert
(
−
1
)
i
E
n
{\displaystyle (-1)^{i}E_{n}}
annimmt.
Die ersten 4 Approximationen für
r
=
37
12
{\displaystyle r={\tfrac {37}{12}}}
n
{\displaystyle n}
bestes Polynom
p
n
{\displaystyle p_{n}}
Extremstellen
max. Fehler
E
n
{\displaystyle E_{n}}
0
{\displaystyle 0}
444
1225
{\displaystyle {\tfrac {444}{1225}}}
1
−
1
{\displaystyle 1\qquad \qquad \qquad \qquad -\!1}
1
s
2
=
144
1225
≈
0.1176
{\displaystyle {\tfrac {1}{s^{2}}}={\tfrac {144}{1225}}\;\approx 0.1176}
1
{\displaystyle 1}
144
1225
x
+
12
35
{\displaystyle {\tfrac {144}{1225}}\;x+\;{\tfrac {12}{35}}}
1
1
6
−
1
{\displaystyle 1\qquad \qquad {\tfrac {1}{6}}\qquad \quad \;\;-\!1}
r
−
s
s
2
=
24
1225
≈
0.0196
{\displaystyle {\tfrac {r-s}{s^{2}}}={\tfrac {24}{1225}}\;\approx 0.0196}
2
{\displaystyle 2}
48
1225
x
2
+
4
35
x
+
396
105
{\displaystyle {\tfrac {48}{1225}}\,x^{2}+{\tfrac {4}{35}}\,x+{\tfrac {396}{105}}}
1
7
12
−
5
12
−
1
{\displaystyle 1\quad \;\;\;{\tfrac {7}{12}}\quad \;\;\;-\!{\tfrac {5}{12}}\quad \;\,-\!1}
(
r
−
s
)
2
s
2
=
4
1225
≈
0.0033
{\displaystyle {\tfrac {(r-s)^{2}}{s^{2}}}={\tfrac {4}{1225}}\approx 0.0033}
3
{\displaystyle 3}
16
1225
x
3
+
4
105
x
2
+
128
1225
x
+
34
105
{\displaystyle {\tfrac {16}{1225}}\,x^{3}+{\tfrac {4}{105}}\,x^{2}+{\tfrac {128}{1225}}\,x+{\tfrac {34}{105}}}
1
3
4
1
12
−
2
3
−
1
{\displaystyle 1\quad \;{\tfrac {3}{4}}\quad \;{\tfrac {1}{12}}\quad -\!{\tfrac {2}{3}}\quad -\!1}
(
r
−
s
)
3
s
2
=
2
3675
≈
0.0005
{\displaystyle {\tfrac {(r-s)^{3}}{s^{2}}}={\tfrac {2}{3675}}\approx 0.0005}
Man nennt eine Approximation eine Minimax-Approximation, wenn sie
max
a
≤
x
≤
b
|
f
(
x
)
−
p
(
x
)
|
{\displaystyle \max _{a\leq x\leq b}|f(x)-p(x)|}
minimiert.
Es gibt einige Minimax-Approximationsalgorithmen, der gebräuchlichste ist der Remez-Algorithmus .
↑ Leçons sur l’approximation des fonctions d’une variable réelle . Gauthier-Villars, Paris 1919, 1952, S. 75, archive.org
↑ Aus der Stetigkeit auf dem Kompaktum folgt auch die Beschränktheit .
↑ René Grothmann: Skriptum Approximationstheorie 1.38 Satz (mit Beweis) (PDF)
↑ Der Alternantensatz gilt auch für wesentlich allgemeinere Räume, bspw. für trigonometrische Polynome (s. a. Proximum#Alternanten-Kriterium in Tschebyschow-Systemen ).