Spline-Interpolation

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Beispiel eines Splines mit 8 Knoten

Bei der Spline-Interpolation versucht man, gegebene Stützstellen, auch Knoten genannt, mit Hilfe stückweise stetiger Polynome, genauer Splines, zu interpolieren. Während das Ergebnis einer Polynominterpolation durch unvorteilhaft festgelegte Stützstellen oft bis zur Unkenntlichkeit oszilliert, liefert die Splineinterpolation mit nur geringem Rechenaufwand auch dann noch brauchbare Kurvenverläufe und Approximationseigenschaften (Rungephänomen). Die Spline-Interpolation lässt sich mit geringem linearen Aufwand berechnen, sie liefert aber im Vergleich zur Polynominterpolation eine geringere Konvergenzordnung.

Vorlage für die Splineinterpolation (dritten Grades) ist das traditionelle, biegsame Lineal der Schiffbauer, die Straklatte (englisch Spline). Diese wird an beliebig vielen, vom Konstrukteur vorgegebenen Punkten fixiert und verbindet die Punkte dann durch eine glatte und harmonische Biegelinie. Die Straklatte erzeugt so die Linie durch alle Punkte mit minimaler Biegeenergie und kleinsten Krümmungen. Während bei der Straklatte die Wendestellen (Orte maximaler Linearität und minimaler Biegeenergie) in der Regel zwischen den Stützstellen liegen und die Stützstellen selbst Orte maximaler Krümmung sind (Orte maximaler Kraft durch Fixierung), liegen die Wendestellen bei der Polynomeninterpolation nahe an den Stützstellen, bei der polynomialen Bestapproximation sogar in den Stützstellen.

Die Begriffe Splineinterpolation und Splinefunktion ohne weitere Zusätze bezeichnen immer die Splineinterpolation/Splinefunktion dritten Grades. Beide Begriffe werden zumeist synonym verwendet. Der Begriff Spline wird jedoch zunehmend als Abkürzung für B-Spline, seltener auch für andere splineartige Linien wie die Bézierkurven, benutzt.

Einfacher Ansatz (Streckenzug)[Bearbeiten]

Die einfachste Methode ist die Verwendung von Geraden zwischen jeweils zwei benachbarten Punkten, die Berechnung eines einfachen Splines als Streckenzug erfolgt auf dieselbe Weise, mit der man auch den Graphen zwischen zwei Punkten ermittelt:

\begin{align}
s(x) &= m \cdot x + b \\
  &= \underbrace{\frac{y_2 - y_1}{x_2 - x_1}}_{=\,m} \cdot x 
     + \underbrace{y_1 - \frac{y_2 - y_1}{x_2 - x_1} \cdot x_1}_{=\,b \,=\, y_{{}_1}-m\cdot x_{{}_1}}
\end{align}

Es ist klar, dass diese „einfachen“ Spline-Polynome – wie oben angesprochen – sehr ungenau sein können. Wesentlich bessere Ergebnisse liefern kubische Spline-Polynome.

Der kubische C2-Spline[Bearbeiten]

Kubische Splines sind Splines, die auf jedem Teilintervall [x_{i-1},x_i] (also zwischen zwei Stützstellen) mit einem kubischen Polynom übereinstimmen. Sie sind zweimal stetig differenzierbar (C^2) und erfüllen eine Minimalitätsbedingung für die zweite Ableitung, was sie gegenüber anderen Splines besonders interessant macht.

Zur Interpolation der Funktion f fordert man nun S_\Delta(x_j) = y_j = f(x_j),\ j=0,1, \ldots , n. Die kubischen Splines eignen sich auf Grund ihrer Glattheit gut zur Approximation von „glatten“ Funktionen. Auf Grund ihrer Konstruktion neigen sie im Gegensatz zu Interpolationspolynomen nicht zu Überschwingern.

Auf jedem Teilintervall wählt man nun das Polynom s_j(x) in Newtondarstellung, um die Spline-Interpolation anzusetzen.

s_j(x) = a_j + b_j \cdot (x - x_j) + c_j \cdot (x-x_j)^2 + d_j \cdot (x-x_j)^3 für x_{j-1}\leq x\leq x_j und j=1,\ldots,n

Um das Gleichungssystem eindeutig zu lösen, werden 4n Bedingungen benötigt. Für jedes der n Intervalle sind zwei Interpolationsbedingungen zu erfüllen:

\begin{align}
s_j(x_{j-1}) = y_{j-1} \qquad j=1,\ldots,n\\
s_j(x_j) = y_j \qquad \qquad j=1,\ldots,n
\end{align}

Dadurch entstehen 2n Bedingungen. Weitere 2n-2 Bedingungen erhält man dadurch, dass der Spline an allen n-1 inneren Stützstellen zweimal stetig differenzierbar sein muss:

\begin{align}
s'_j(x_j) = s'_{j+1}(x_j) \qquad j=1,\ldots,n-1\\
s''_j(x_j) = s''_{j+1}(x_j) \qquad j=1,\ldots,n-1
\end{align}

Für die restlichen 2 Bedingungen (Randbedingungen) gibt es verschiedene Möglichkeiten, so z. B.:

  • freier Rand oder natürlicher Spline: s_1''(x_0)=0,s_n''(x_n)=0.
  • eingespannter Rand: s_1'(x_0)=y_0',s_n'(x_n)=y_n', wobei y_0' und y_n' vorgegeben, normalerweise entweder durch die Ableitung der zu interpolierenden Funktion f oder durch eine Approximation derselben.
  • periodische Randbedingung: s_1'(x_0)=s_n'(x_n), s_1''(x_0)=s_n''(x_n)
  • not-a-knot (verwendet zum Beispiel vom Programm Matlab): Die äußeren drei Punkte werden je durch ein Polynom interpoliert.

Die erste Ableitung (Steigung) sieht so aus:

s_j'(x) = b_j + {2 \cdot c_j} \cdot (x-x_j) + {{3 \cdot d_j} \cdot (x-x_j)^2}

Die zweite Ableitung (Krümmung) sieht so aus:

s_j''(x) = 2 \cdot c_j + {6 \cdot d_j} \cdot (x-x_j)

Obiger naheliegender Ansatz erfordert einige Rechenarbeit.

Baryzentrische Koordinaten[Bearbeiten]

Zur Vereinfachung werden innerhalb des Intervalls [x_{i-1},x_i] für i=1,\dots,n die Hilfsgrößen h_i:=x_i-x_{i-1} und die baryzentrischen Variablen u:=\tfrac{x-x_{i-1}}{h_i} und v:=1-u=\tfrac{x_i-x}{h_i} eingeführt. Jedes Teilintervall wird hierbei auf das Intervall [0,1] linear transformiert. Für das resultierende kubische Polynom wird die Notation \sigma_i(u,v) verwendet. Die Ableitungen nach x ergeben sich als u'(x)=h_i^{-1} und v'(x)=-h_i^{-1}. Es gilt nach der Kettenregel: s'_i(x) = \sigma'_i h_i^{-1}. Die Stützstelle x_i ist rechter Rand im Intervall [x_{i-1},x_i] und linker Rand in [x_i,x_{i+1}]. Das ergibt auf [x_{i-1},x_i] den neuen Ansatz

\sigma_i(u,v)=:y_iu^3+p_iu^2v+q_iuv^2+y_{i-1}v^3 mit 0\le u,v\le 1,

durch den die Stetigkeit S \in C^0[a,b] bereits hergestellt ist.

Die ersten Ableitungen sind

s_i'(x)=h_i^{-1}((3y_i-p_i)u^2+2(p_i-q_i)uv+(q_i-3y_{i-1})v^2).

Nun sei zur Abkürzung s_i'(x_i)=:g_i für i=0,1,\dots,n mit den noch unbekannten Parametern g_i. Die Stetigkeit der ersten Ableitung S \in C^1[a,b] wird über die Anschlussbedingungen hergestellt: s_i'(x_i)=s_{i+1}'(x_i)=g_i für i=1,2,\dots,n-1. Somit gilt: h_i^{-1}(3y_i-p_i)=g_i=h_{i+1}^{-1}(q_{i+1}-3y_i); die unbekannten Parameter p_i und q_i können nun durch g_i ausgedrückt werden:


\begin{align}p_i&=3y_i-h_ig_i
\\q_i&=3y_{i-1}+h_ig_{i-1}\end{align}.

Über die zweiten Ableitungen s_i''(x)=h_i^{-2}(6y_i-4p_i+2q_i)u+h_i^{-2}(6y_{i-1}-4q_i+2p_i)v werden die Anschlussbedingungen für S \in C^2[a,b] hergestellt:

h_i^{-2}(6y_i-4p_i+2q_i)=h_{i+1}^{-2}(6y_i-4q_{i+1}+2p_{i+1}).

Nach Einsetzen von p_i und q_i wird daraus:

h_{i+1}^2(6y_i-12y_i+4h_ig_i+6y_{i-1}+2h_ig_{i-1})=h_i^2(6y_i-12y_i-4h_{i+1}g_i+6y_{i+1}-2h_{i+1}g_{i+1}).

Dies führt zu dem tridiagonalen, streng diagonaldominanten, linearen Gleichungssystem

h_{i+1}g_{i-1}+2(h_i+h_{i+1})g_i+h_ig_{i+1}=3\left(\frac{h_{i+1}}{h_i}(y_i-y_{i-1})+\frac{h_i}{h_{i+1}}(y_{i+1}-y_i)\right),\;i=1,2,\dots,n-1

mit noch zwei freien Parametern, etwa g_0 und g_n, die zur eindeutigen Lösbarkeit noch festgelegt werden müssen.

Bei äquidistanten Stützstellen mit Abstand h vereinfacht sich das Gleichungssystem zu

g_{i-1}+4g_i+g_{i+1}=3(y_{i+1}-y_{i-1})/h,\;i=1,2,\dots,n-1.

Hier lässt sich das Gleichungssystem folgendermaßen symmetrisch verlängern, um eine leichte Invertierbarkeit der Matrix sicherzustellen. [Quelle] \begin{align} 4g_0+g_1   &  = 3y_1/h & (\text{Zeile}~ i=0) \\ g_{n-1}+4g_n & = -3y_{n-1}/h & (\text{Zeile}~ i=n) \end{align}

was der Parameterisierung y_{-1}=0=y_{n+1} entspricht und zu der Tridiagonal-Toeplitz-Matrix

A := \begin{bmatrix}
4 & 1 & 0 & \cdots & 0 & 0 & 0\\
1 & 4 & 1 & \cdots & 0 & 0 & 0\\
0 & 1 & 4 & \cdots & 0 & 0 & 0\\
\vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots\\
0 & 0 & 0 & \cdots  & 4 & 1 & 0\\
0 & 0 & 0 & \cdots & 1 & 4 & 1\\
0 & 0 & 0 & \cdots & 0 & 1 & 4\\
\end{bmatrix} \in \R^{n+1\times n+1}

führt. Diese hat die Inverse

B := b_{n+1}^{-1}\begin{bmatrix}
b_nb_0           & -b_{n-1}b_0      & \cdots & (-1)^{n-1}b_1b_0 & (-1)^nb_0b_0\\
-b_{n-1}b_0      & b_{n-1}b_1       & \cdots & (-1)^nb_1b_1     & (-1)^{n-1}b_0b_1\\
\vdots           & \vdots           & \ddots & \vdots           & \vdots\\
(-1)^{n-1}b_1b_0 & (-1)^nb_1b_1     & \cdots & b_1b_{n-1}       & -b_0b_{n-1}\\
(-1)^nb_0b_0     & (-1)^{n-1}b_0b_1 & \cdots & -b_0b_{n-1}      & b_0b_n\\
\end{bmatrix}

mit Koeffizienten b_i, die den Gleichungen b_0:=1, b_1:=4, der Rekursion b_i:=4b_{i-1}-b_{i-2} und explizit der Formel

b_i=(\sqrt{3}(2+\sqrt{3})^{i+1}-\sqrt{3}(2-\sqrt{3})^{i+1})/6

genügen. Die Übertragung auf Räume mit Dimension größer als eins, zum Beispiel auf Rechteckgitter, ist möglich.

Eigenschaften[Bearbeiten]

Im Jahr 1957 bewies Holladay[1] die folgende nach ihm benannte Identität von Holladay. Mit K^2([a,b]) wird der Raum der zweimal differenzierbaren Funktionen bezeichnet, für welche die nullte und erste Ableitung absolutstetig sind und die zweite Ableitung in L^2([a,b]) liegt. Sei S_\Delta eine interpolierende Splinefunktion zu f \in K^2([a,b]) und \|.\| die  L^2 -Norm, so gilt

 \|f'' - S''_\Delta\|^2 = \| f'' \|^2 - \|S''_\Delta\|^2 - 2 D

mit D := \left. (f'(x) - S'_\Delta(x))S''_\Delta(x) \right|_a^b - \sum_{i=1}^n \left. (f(x) - S_\Delta(x)) S'''_\Delta \right|_{x_{i-1}}^{x_i} .

Erfüllt die Splinefunktion die natürlichen, periodischen oder vollständigen Randbedingungen, so ist D = 0 , also

 \|f'' - S''_\Delta\|^2 = \|f''\|^2 - \|S''_\Delta\|^2 \geq 0
\Rightarrow \|f''\|^2 \geq \|S''_\Delta \|^2.

Minimalität der Splineinterpolierenden: S_\Delta sei \in K^2 und erfülle eine der drei Randbedingungen, dann gilt

 \|f'' - S''_\Delta\|^2 = \min_{T \in K^2}\|f'' - T''\|^2.

Interpolation mit Formerhaltung[Bearbeiten]

Splines sind aufgrund ihrer Eigenschaften im CAD weit verbreitet. Es stellt sich die Frage, unter welchen Bedingungen eine Spline-Interpolante eine der folgenden formerhaltenden Eigenschaften der zu interpolierende Funktion f:[a,b]\to\mathbb R erbt:

Hier zeigt sich, dass klassische Splines etwas schlechtere Eigenschaften haben als Bézierkurven. Zunächst stellt sich die Frage, wann ein interpolierender Spline konvex ist.

Für klassische Splines gilt, dass die Menge möglicher Splines auf dem Intervall [a,b] zum Gitter \Delta:a=x_0<x_1<\dots<x_n=b ein endlichdimensionaler Vektorraum ist. Für die Interpolation werden (nicht notwendig mit dem Gitter zusammenfallenden) Knoten a=t_0<t_1<\dots<t_m=b und zugehörige Ordinaten f_0,\dots,f_m\in\mathbb R vorgegeben und gefordert, dass der Spline s stetig differenzierbar in (a,b) ist und darüber hinaus \displaystyle s(t_k)=f_k für k=0,1,\dots,m gilt. Fordert man zusätzlich die Konvexität des interpolierenden Splines und geringe technische Annahmen, so stellt man fest, dass die Menge Y aller Ordinatentupel (f_0,\dots,f_m), für die ein solcher Spline existiert, abgeschlossen ist[2].

Das hat weitreichende Konsequenzen. Y ist eine echte Teilmenge des {\mathbb R}^{m+1}, falls m\ge 2, da die Eingangsdaten nicht in konvexer Lage zu sein brauchen. Bei Vorgabe eines Tupels auf dem Rand von Y kann infolge Rechenungenauigkeiten oder anderer Störungen die Menge Y verlassen worden sein, so dass trotz Lösbarkeit des Ausgangsproblems keine Lösung gefunden wird. Die andere Folgerung des Satzes ist noch schlimmer. Dazu seien fünf Punkte in Form des Zeichens „\lor“ so angeordnet, dass der mittlere Punkt genau auf der Spitze liegt. Die einzige konvexe Interpolierende ist dann die Betragsfunktion, und diese ist nicht stetig differenzierbar. Also gehört das 5-Tupel zum Komplement von Y, und dieses ist offen. Somit gibt es eine Umgebung des 5-Tupels, in der es ebenfalls keine konvexe, stetig differenzierbare Interpolierende gibt. Verschiebt man den mittleren Punkt geringfügig nach oben, ohne die Umgebung zu verlassen, dann erhält man folglich fünf Punkte in streng konvexer Lage, zu denen dennoch die Interpolationsaufgabe keine Lösung besitzt. Da dieser Effekt bei Vorgabe vieler Interpolationspunkte zunimmt, bleibt nur ein Ausweg, die Lösbarkeit für Eingangsdaten in streng konvexer Lage zu gewährleisten, nämlich die Voraussetzungen des Satzes zu verletzen. Die Menge, aus der die Splines entnommen werden dürfen, soll kein endlichdimensionaler Vektorraum sein. Dafür bieten sich u. a. an:

  • (gebrochen-)rationale Splines
  • Splines mit frei wählbaren Zwischenknoten
  • Exponentialsplines
  • lakunäre (lückenhafte) Splines

Literatur[Bearbeiten]

  •  Stoer, Bulirsch: Numerische Mathematik 1. 10. Auflage. Springer Verlag, Berlin, Heidelberg, New York 2007, ISBN 978-3-540-45389-5, 2.5 Spline-Interpolation, S. 112-148 (mit Beispielen, Beweisen, Übungsaufgaben und umfangreichen Angaben zu weiterer speziellerer Literatur).

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. John C. Holladay, 1928–1986. http://texts.cdlib.org/view?docId=hb767nb3z6&doc.view=frames&chunk.id=div00051&toc.depth=1&toc.id=
  2. Jochen W. Schmidt: Staircase Algorithm and Construction of Convex Spline Interpolants up to the Continuity C^3 Computers and Mathematics with Applications, Volume 31, Number 4, February 1995, pp. 67-79.