Konvexe und konkave Funktionen

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Beispiel einer konvexen Funktion
Beispiel einer konkaven Funktion

In der Analysis heißt eine reellwertige Funktion konvex, wenn ihr Graph unterhalb jeder Verbindungsstrecke zweier seiner Punkte liegt. Dies ist gleichbedeutend dazu, dass der Epigraph der Funktion, also die Menge der Punkte oberhalb des Graphen, eine konvexe Menge ist.

Eine reellwertige Funktion heißt konkav, wenn ihr Graph oberhalb jeder Verbindungsstrecke zweier seiner Punkte liegt. Dies ist gleichbedeutend dazu, dass der Hypograph der Funktion, also die Menge der Punkte unterhalb des Graphen, eine konvexe Menge ist.

Einer der ersten, der sich mit den Eigenschaften konvexer und konkaver Funktionen beschäftigte, war der dänische Mathematiker Johan Ludwig Jensen. Die nach ihm benannte Jensensche Ungleichung ist Grundlage wichtiger Resultate in der Wahrscheinlichkeitsrechnung, Maßtheorie und Analysis.

Die besondere Bedeutung konvexer bzw. konkaver Funktionen liegt darin, dass sie eine weitaus größere Gruppe als die linearen Funktionen bilden, aber ebenfalls viele einfach zu untersuchende Eigenschaften haben, welche Aussagen über nichtlineare Systeme ermöglichen. Da beispielsweise Minima strikt konvexer Funktionen eindeutig sind, sind sie bei vielen Optimierungsproblemen von Bedeutung (siehe auch: Konvexe Optimierung). Selbst für konvexe Funktionale, die auf unendlichdimensionalen Räumen definiert sind, lassen sich unter bestimmten Voraussetzungen, ähnliche Aussagen treffen. Daher spielt Konvexität auch eine wichtige Rolle in der Variationsrechnung.

Definition[Bearbeiten]

Auf einem Intervall definierte strikt konvexe Funktion

Eine reellwertige Funktion f\colon C \to \R, die auf einer konvexen Teilmenge C eines reellen Vektorraums definiert ist, heißt konvex, wenn für alle x,y aus C und für alle t \in [0,1] gilt, dass

f(t x+(1-t)y) \le t f(x)+(1-t)f(y).

Gilt hingegen stets die umgekehrte Ungleichung, also

 f(t x+(1-t)y) \ge t f(x)+(1-t)f(y),

so wird die Funktion konkav genannt.[1]

Eine Funktion heißt streng konvex oder strikt konvex, wenn die obige Ungleichung im strengen Sinn gilt; das heißt für zwei Elemente x \neq y aus C und alle t \in (0,1) gilt, dass

f(t x+(1-t)y) < t f(x)+(1-t)f(y).

Analog dazu heißt eine Funktion streng konkav oder strikt konkav, wenn für x \neq y und alle t \in (0,1) gilt, dass

f(t x+(1-t)y) > t f(x)+(1-t)f(y).[1]

Die Punktmenge oberhalb (bzw. unterhalb) des Graphen einer konvexen (bzw. konkaven) Funktion ist eine konvexe Menge. Um Missverständnisse im Zusammenhang mit dieser geometrischen Bedeutung vorzubeugen, kann man die Begriffe durch die Angabe einer Blickrichtung kennzeichnen. So werden die Eigenschaften konvex und konkav seltener auch als konvex von unten und konvex von oben bezeichnet.[2]

Des Weiteren gibt es den Begriff der gleichmäßig konvexen Funktion. Eine Funktion heißt gleichmäßig konvex, wenn eine Konstante \mu > 0 existiert, sodass für alle x,y aus C und für alle t \in [0,1] gilt:

f(t x+(1-t)y) +\mu t (1-t) \Vert x-y \Vert^2 \le t f(x)+(1-t)f(y).

Analog lässt sich der Begriff der gleichmäßigen Konkavität definieren.

Beispiele[Bearbeiten]

Die Normparabel ist konvex
  • Lineare Funktionen sind auf ganz \R konvex und konkav, jedoch nicht strikt.
  • Die quadratische Funktion f(x)=x^2 ist auf ganz \R streng konvex.
  • Die zu ihr additiv inverse Funktion f(x)=-x^2 ist auf ganz \R streng konkav.
  • Die Betragsfunktion ist auf ganz \R konvex, jedoch nicht streng konvex.
  • Die Exponentialfunktion ist streng konvex auf ganz \R.
  • Der natürliche Logarithmus ist streng konkav auf dem Intervall der positiven reellen Zahlen.
  • Die kubische Funktion f(x)=x^3 ist streng konkav auf dem Intervall (-\infty,0] und streng konvex auf dem Intervall [0,\infty).
  • Die Funktion, welche einen Punkt der euklidischen Ebene auf seinen Abstand vom Ursprung, abbildet, also
f\colon \R^2 \to \R, (x,y) \mapsto \sqrt{x^2 + y^2}
ist ein Beispiel für eine konvexe Funktion auf einem mehrdimensionalen reellen Vektorraum.

Geschichte[Bearbeiten]

Wesentliche Aussagen zu konvexen und konkaven Funktionen finden sich bereits 1889 bei Otto Hölder, wobei er aber noch nicht die heute üblichen Bezeichnungen verwendete.[3] Die Begriffe konvexe und konkave Funktion wurden 1905 von Johan Ludwig Jensen eingeführt.[4] Jensen verwendete allerdings eine schwächere Definition, die noch gelegentlich, vor allem in älteren Werken,[5] zu finden ist. In dieser Definition wird nur die Ungleichung

 f\left(\frac{x+y}{2}\right) \le \frac{f(x)+f(y)}{2}

vorausgesetzt. Wie Jensen aber zeigte, folgt dann für stetige Funktionen bereits die in der heute üblichen Definition verwendete Ungleichung

 f(t x+(1-t)y) \le t f(x)+(1-t)f(y)

für alle t zwischen 0 und 1.[6] (siehe auch: Abschnitt Konvexität und Stetigkeit)

Elementare Eigenschaften[Bearbeiten]

x³ ist auf der positiven Halbachse konvex, auf der negativen konkav

Verhältnis konvex und konkav[Bearbeiten]

Die Funktion f ist genau dann (streng) konvex, wenn die Funktion -f (streng) konkav ist. Eine nicht-konvexe Funktion muss jedoch nicht notwendigerweise konkav sein. Konvexität und Konkavität sind somit keine komplementären Eigenschaften.

Lineare Funktionen sind die einzigen Funktionen, die sowohl konkav als auch konvex sind.

Beispiel

Die kubische Funktion f(x) = x^3 ist auf ganz \R betrachtet weder konvex, noch konkav. Im Intervall aller positiven reellen Zahlen ist f streng konvex. Die zu ihr additiv inverse Funktion -f(x) = -x^3 ist dort somit streng konkav.

Da f eine ungerade Funktion ist, also f(-x) = -f(x) gilt, folgt daraus, dass sie im Bereich aller negativen Zahlen streng konkav ist.

Niveaumengen und Epigraph[Bearbeiten]

Der Epigraph einer konvexen Funktion

Der Epigraph einer konvexen Funktion, also die Menge aller Punkte, die sich über dem Graphen der Funktion befinden, ist konvex. Ebenso ist der Hypograph einer konkaven Funktion, also die Menge aller Punkte, die sich unter dem Graphen der Funktion befinden, konvex. Diese Eigenschaft ist sogar äquivalent zur Konvexität der Funktion und lässt sich demnach auch als Charakterisierung nutzen.

Außerdem sind bei einer konvexen Funktion alle Subniveaumengen, also Mengen der Form

\mathcal L^\leq_f(c) := \{x \in C \mid f(x) \leq c\}

konvex. Bei einer konkaven Funktion sind alle Superniveaumengen konvex.

Jensensche Ungleichung[Bearbeiten]

Die jensensche Ungleichung besagt, dass der Funktionswert einer konvexen Funktion f an einer endlichen Konvexkombination von Stützstellen kleiner oder gleich der Konvexkombination von den Funktionswerten an den Stützstellen ist. Für eine konvexe Funktion f\; und für nichtnegative \lambda_i\; mit \textstyle \sum_{i=1}^n \lambda_i = 1 gilt also:

f\left(\sum_{i=1}^n\lambda_i x_i\right) \leq \sum_{i=1}^n \lambda_i f\left(x_i\right).

Für konkave Funktionen gilt die Ungleichung in umgekehrte Richtung.

Reduktion auf Konvexität reeller Funktionen[Bearbeiten]

Der Urbildraum einer konvexen Funktion kann ein beliebiger reeller Vektorraum wie zum Beispiel der Vektorraum der reellen Matrizen oder der stetigen Funktionen. Die Konvexität einer Funktion  f: V \supset C_1 \to \R ist aber äquivalent zur Konvexität der Funktion  g: \R \supset C_2 \to \R definiert durch g(t)=f(x+tv) für alle  x,v , wobei  x \in C_1 ist und  v eine beliebige Richtung aus  V ist. Es ist dann  C_2=\{t \in \R \, | \,x+tv \in C_1 \} . Dies macht es möglich, die Dimension des Vektorraumes zu verringern, was die Überprüfung der Konvexität erleichtert.

Ungleichungen für t < 0 und t > 1[Bearbeiten]

Für t<0 oder t>1 drehen sich die Ungleichungen aus den Definitionen von (strikter) Konvexität bzw. Konkavität um. Sei f beispielsweise eine auf C konvexe Funktionen. Für Punkte x und y aus C gilt dann

f(t x+(1-t)y) \ge t f(x)+(1-t)f(y),

sofern auch der Punkt u := t x+(1-t)y im Definitionsbereich C liegt. Wenn f eine reelle konvexe Funktion ist, bedeutet die Ungleichung anschaulich, dass die Funktionswerte von f außerhalb des Intervalls (x,y) stets oberhalb der Verbindungsgeraden durch die Funktionswerte f(x),f(y) liegen.

Rechenregeln[Bearbeiten]

Positivkombinationen[Bearbeiten]

Die Summe zweier (gegebenenfalls erweiterter) konvexer Funktionen ist wieder eine konvexe Funktion. Außerdem bleibt Konvexität beim Multiplizieren mit einer positiven reellen Zahl erhalten. Zusammenfassend gilt also, dass jede Positivkombination von konvexen Funktionen wiederum konvex ist. Sie ist sogar streng konvex, falls einer der auftretenden Summanden streng konvex ist. Analog dazu ist auch jede Positivkombination von konkaven Funktionen konkav. Somit bilden die konvexen Funktionen einen konvexen Kegel. Das Produkt konvexer Funktionen ist jedoch nicht notwendigerweise konvex.

Beispiel

Die Funktionen

f_1(x) = x^2, f_2(x) = x, f_3(x) = 1

sind konvex auf ganz \R, die Normparabel x^2 ist sogar strikt konvex. Daraus folgt, dass auch alle Funktionen der Form

f(x) := a x^2 + b x + c

mit a,b,c > 0 strikt konvex auf ganz \R sind. Dies ist auch anschaulich klar, es handelt sich um nach oben gekrümmte Parabeln. Das Produkt der Funktionen f_1 und f_2 ist die kubische Funktion x \to x^3, welche (über ganz \R betrachtet) nicht konvex ist.

Grenzfunktionen[Bearbeiten]

Die Grenzfunktion einer punktweise konvergenten Folge konvexer Funktionen ist eine konvexe Funktion. Ebenso ist die Grenzfunktion einer punktweise konvergenten Reihe konvexer Funktionen wieder eine konvexe Funktion. Analoges gilt klarerweise für konkave Funktionen. Strikte Konvexität bleibt unter der Grenzwertbildung jedoch nicht notwendigerweise erhalten, wie man anhand des ersten der beiden folgenden Beispiele erkennt.

Beispiele
  • Die Funktionenfolge \textstyle f_n(x) := \frac1n x^2 mit n \in \N ist eine Folge von auf ganz \R strikt konvexen Funktionen. Ihre punktweise Grenzfunktion ist die konstante Nullfunktion. Diese ist als lineare Funktion zwar konvex, aber nicht strikt konvex.
  • Der Cosinus Hyperbolicus lässt sich auf \R folgendermaßen als Potenzreihe entwickeln:
\cosh x = \sum_{i=0}^{\infty} \frac{x^{2n}}{(2n)!}.
Alle Summanden, die vorkommen, sind konvexe Funktionen. Daraus folgt, dass auch der Cosinus Hyperbolicus eine konvexe Funktion ist.

Supremum und Infimum[Bearbeiten]

Ist \lbrace f_\alpha:\alpha \in A \rbrace eine Menge konvexer Funktionen und existiert punktweise das Supremum

f(x):=\sup_{\alpha\in A}f_\alpha(x)

für alle x, so ist auch f eine konvexe Funktion. Der Übergang zur Funktion -f zeigt, dass das Infimum einer Menge konkaver Funktionen (falls es existiert) ebenfalls wieder eine konkave Funktion ist. Das Bilden des Infimums erhält jedoch nicht notwendigerweise Konvexität wie das folgende Beispiel zeigt.

Beispiel

Die reellen Funktionen

f_1(x)=-x, f_2(x)=x

sind linear und deshalb sowohl konvex, als auch konkav. Das Supremum von f_1 und f_2 ist die Betragsfunktion x \to |x|. Diese ist zwar konvex, jedoch nicht konkav. Das Infimum von f_1 und f_2 ist die negative Betragsfunktion x \to -|x|. Diese ist konkav, aber nicht konvex.

Komposition[Bearbeiten]

Über die Komposition g\circ f zweier konvexer Funktionen f und g lässt sich im Allgemeinen keine Aussage treffen. Gilt jedoch zusätzlich, dass g monoton steigend ist, so ist die Komposition ebenfalls konvex.

Des Weiteren ist die Komposition g\circ f einer konkaven Funktion f mit einer konvexen, monoton fallenden reellen Funktion g wiederum eine konvexe Funktion.

Beispiel

Jede Komposition einer konvexen Funktion f mit der Exponentialfunktion g(x) = e^x liefert wieder eine konvexe Funktion. Dies funktioniert auch im allgemeinen Fall, in dem f auf einem reellen Vektorraum definiert ist. So ist beispielsweise für


\begin{align}
f\colon & \R^2 \to \R, (x,y) \mapsto x^2+y^2\\
g\circ f\colon & \R^2 \to \R, (x,y) \mapsto e^{x^2+y^2}\\
\end{align}

wiederum eine konvexe Funktion. Insbesondere ist also jede logarithmisch konvexe Funktion eine konvexe Funktion.

Umkehrfunktionen[Bearbeiten]

Ist f eine auf einem Intervall definierte, invertierbare und konvexe Funktion, so folgt aus der Konvexitätsungleichung

f(t f^{-1}(u)+(1-t)f^{-1}(v)) \le t u+(1-t)v.

Sei f eine monoton steigende Funktion. Dann dreht sich obige Ungleichung beim Anwenden von f^{-1} um. Es gilt somit:

t f^{-1}(u)+(1-t)f^{-1}(v) \le f^{-1}(t u+(1-t)v).

Also ist die Umkehrfunktion f^{-1} eine konkave (und monoton wachsende) Funktion. Für eine invertierbare, monoton steigende und konvexe bzw. konkave Funktion hat daher die Umkehrfunktion die umgekehrte Art der Konvexität.

Für eine monoton fallende und konvexe Funktion f gilt hingegen

t f^{-1}(u)+(1-t)f^{-1}(v) \ge f^{-1}(t u+(1-t)v).

Für eine invertierbare monoton fallende und konvexe bzw. konkave Funktion hat daher die Umkehrfunktion die gleiche Art der Konvexität.

Beispiele
  • Die Normparabel x^2 ist monoton steigend und streng konvex auf [0, \infty). Ihre Umkehrfunktion, die Wurzelfunktion \sqrt{x} ist streng konkav auf ihrem Definitionsintervall [0, \infty)
  • Die Funktion e^{-x} ist monoton fallend und streng konvex auf ganz \R. Ihre Umkehrfunktion -\ln{x} ist streng konvex auf dem Intervall (0, \infty)

Extremwerte[Bearbeiten]

e^x hat kein globales Minimum

Konvexität bzw. Konkavität von Funktionen werden oft verwendet um die Eindeutigkeit von Extremwerten sicherstellen. Wenn der Ausgangsraum ein topologischer Vektorraum ist (was insbesondere auf alle endlichdimensionalen reellen Vektorräume und somit auch auf \R zutrifft), können auch Aussagen über das Verhältnis von lokalen und globalen Extremalstellen getroffen werden.

Existenz und Eindeutigkeit[Bearbeiten]

Eine stetige konvexe oder konkave Funktion  f: \R^n \supset D \to \R nimmt auf der konvexen kompakten Menge  D ein Minimum und ein Maximum an. Die Kompaktheit von  D ist auf  \R^n äquivalent dazu, dass  D beschränkt und abgeschlossen ist. Dies ist der Satz vom Minimum und Maximum angewendet auf konvexe und konkave Funktionen. Ist die Funktion strikt konvex, so ist das Minimum eindeutig bestimmt, ist sie strikt konkav, so ist das Maximum eindeutig bestimmt. Der Umkehrschluss gilt jedoch nicht: die Funktion e^x hat kein globales Minimum in \R, ist aber strikt konvex.

Für eine stetige Funktion  V \supset D \to \R auf einem reflexiven Banachraum gibt es analoge Aussagen: Ein stetiges konvexes Funktional auf der konvexen abgeschlossenen und beschränkten Menge  D nimmt dort ein Minimum an. Ist das Funktional strikt konvex, so ist das Minimum eindeutig.

Geometrie der Optimalwertmengen[Bearbeiten]

In topologischen Vektorräumen (welche fast immer gegeben sind) kann man auch lokale Minima untersuchen. Es gilt:

  • Ist die Funktion konvex, so ist jedes lokale Minimum auch ein globales Minimum.
  • Ist die Funktion konkav, so ist jedes lokale Maximum auch ein globales Maximum.

Dies lässt sich direkt mit der definierenden Ungleichungen von konvexen und konkaven Funktionen zeigen.

Außerdem ist die Menge der Minimalstellen einer konvexen Funktion konvex und die Menge der Maximalstellen einer konkaven Funktion konvex. Dies folgt aus der Konvexität der Subniveaumengen bzw. Superniveaumengen.

Kriterien für Extremwerte[Bearbeiten]

Für differenzierbare konvexe und konkave Funktionen nutzt man zur Bestimmung der Extremalwerte aus, dass für konvexe Funktionen gilt, dass  f(y) \geq f(x)+ \nabla f(x)^T(y-x) ist für alle  x,y \in D , bzw im Falle reeller Funktionen  f(y) \geq f(x)+ f'(x)(y-x) für alle  x,y \in D . Ist nun der Gradient oder die Ableitung in einem Punkt  \tilde x gleich null, so ist  f(y) \geq f(\tilde x) für alle  y \in D und damit ist  \tilde x ein lokales (und damit globales) Minimum. Analog liegt bei konkaven Funktionen in einem Punkt immer ein lokales (und damit globales) Maximum vor, wenn der Gradient bzw. die Ableitung an diesem Punkt verschwindet.

Konvexität und Stetigkeit[Bearbeiten]

Setzt man die Stetigkeit einer reellen Funktion f voraus, so reicht, um ihre Konvexität zu zeigen, bereits die Bedingung, dass für alle x, y aus dem Definitionsintervall folgende Ungleichung gilt:

f\left(\frac{x+y}2\right) \le \frac{f(x)+f(y)}2.

Dies entspricht der Konvexitätsdefinition nach Jensen. Umgekehrt gilt, dass jede auf einem Intervall definierte Funktion, die die obige Ungleichung erfüllt, in den inneren Punkten stetig ist. Unstetigkeitsstellen können höchstens in Randpunkten auftreten, wie das Beispiel der Funktion [0,\infty)\to \R mit


f(x)=\begin{cases}
  1, & \text{falls } x=0,\\
  0, & \text{sonst},
\end{cases}

zeigt, die zwar konvex ist, aber am Randpunkt x=0 eine Unstetigkeit aufweist.

Somit sind die beiden Möglichkeiten Konvexität zu definieren zumindest für offene Intervalle äquivalent. Inwiefern dieses Resultat auf allgemeine topologische Räume übertragen werden kann, wird in den beiden folgenden Abschnitten behandelt.

Eine schwächere Definition der Konvexität[Bearbeiten]

Eine stetige Funktion f auf einer konvexen Teilmenge C eines reellen topologischen Vektorraums ist konvex, wenn ein festes \lambda\in\R mit 0<\lambda<1 existiert, sodass für alle x,y aus C gilt:

f\left(\lambda x + (1-\lambda)y\right) \le \lambda f(x) + (1-\lambda)f(y).

Dies kann man mittels geeigneter Intervallschachtelung zeigen. Ein vollständig ausgeführter Beweis befindet sich im Beweisarchiv.

Dass in dieser schwächeren Definition von Konvexität Stetigkeit benötigt wird, lässt sich anhand des folgenden Gegenbeispiels erkennen.

Gegenbeispiel

Sei b_j \in \R, j\in J eine Hamelbasis des Vektorraums der reellen Zahlen über dem Körper der rationalen Zahlen, also eine über den rationalen Zahlen linear unabhängige Menge reeller Zahlen, in der jede reelle Zahl r eine Darstellung der Art r=\sum_{j\in J}q_j b_j mit nur endlich vielen rationalen q_j\neq 0 hat. Dann erfüllt bei beliebiger Wahl von f(b_j) die Funktion \textstyle f(r):=\sum_{j\in J}q_j f(b_j) zwar \textstyle f\left(\frac{x+y}{2}\right) \le \frac{f(x)+f(y)}{2}, ist aber nicht notwendigerweise konvex.

Beschränktheit und Stetigkeit in normierten Räumen[Bearbeiten]

Setzt man für eine Funktion f zusätzlich zur Bedingung, dass für ein fixes \lambda\in(0,1)\! die Beziehung

f\left(\lambda x + (1-\lambda)y\right) \le \lambda f(x) + (1-\lambda) f(y)

für alle x,y aus einer konvexen Teilmenge C eines normierten Vektorraums gilt, noch voraus, dass f nach oben beschränkt ist, so folgt daraus bereits die Stetigkeit von f in den inneren Punkten von C. Anschaulich wird dies daraus klar, dass man an einer Unstetigkeitsstelle eine beliebig steile Verbindungsgerade zwischen zwei Funktionswerten ziehen kann, wobei die Funktion zwischen den beiden Werten unterhalb der Verbindungsgeraden und außerhalb der beiden Werte oberhalb der Verbindungsgerade liegen muss. Kann die Verbindungsgerade nun beliebig steil werden, so stößt man irgendwann über die obere Schranke der Funktion.

Formal ist der Beweis allerdings etwas komplizierter. Eine vollständige Ausführung befindet sich im Beweisarchiv.

Die Aussage, dass eine konvexe beschränkte Funktion stetig in den inneren Punkten ist, ist auch bedeutsam für das Lösen der cauchyschen Funktionalgleichung

f(x+y)=f(x)+f(y)
f(1)=a.

Aus dieser Aussage folgt nämlich, dass diese Funktionalgleichung eine eindeutige Lösung hat, wenn zusätzlich gefordert wird, dass f beschränkt ist.

In endlichdimensionalen Räumen[Bearbeiten]

Konvexe Funktionen f, die auf einer konvexen Teilmenge C eines endlichdimensionalen reellen Vektorraums \R^n definiert sind, sind stetig in den inneren Punkten. Um das zu sehen, betrachte man einen inneren Punkt a\in C. Für diesen existiert ein Simplex S_n\subseteq C mit den Eckpunkten p_1,\dotsc,p_n,p_{n+1}, der a wieder als inneren Punkt enthält. Jeder Punkt x\in S_n ist aber in der Form

x=\sum_{j=1}^{n+1}t_jp_j   mit  \sum_{j=1}^{n+1} t_j = 1\,

und 0\le t_j\le 1 für alle j darstellbar. Nach der jensenschen Ungleichung gilt nun

f(x)=f\left(\sum_{j=1}^{n+1}t_jp_j\right)\le\sum_{j=1}^{n+1}t_j f(p_j)\le\max f(p_j).

f ist daher nach oben beschränkt und somit, wie oben gezeigt wurde, stetig im inneren Punkt a.

In unendlichdimensionalen Räumen[Bearbeiten]

Im unendlichdimensionalen Fall sind konvexe Funktionen nicht notwendigerweise stetig, da es insbesondere lineare (und somit auch konvexe) Funktionale gibt, die nicht stetig sind.

Konvexität und Differenzierbarkeit[Bearbeiten]

Konvexität und erste Ableitung[Bearbeiten]

Eine auf einem offenen Intervall definierte, konvexe bzw. konkave Funktion ist lokal lipschitz-stetig und somit nach dem Satz von Rademacher fast überall differenzierbar. Sie ist in jedem Punkt links- und rechtsseitig differenzierbar.

Die Ableitung als Konvexitätskriterium[Bearbeiten]

Die erste Ableitung lässt sich auf zweierlei Arten als Konvexitätskriterium verwenden. Eine stetig differenzierbare reelle Funktion  f: \R \supset D \to \R ist

  • genau dann konvex auf  D , wenn ihre Ableitung dort monoton wachsend ist.
  • genau dann streng konvex auf  D , wenn ihre Ableitung dort streng monoton wachsend ist.
  • genau dann konkav auf  D , wenn ihre Ableitung dort monoton fallend ist.
  • genau dann streng konkav auf  D , wenn ihre Ableitung dort streng monoton fallend ist.

Dieses Resultat findet sich im Wesentlichen schon 1889 bei Otto Hölder.[3]. Mit dem erweiterten Monotoniebegriff für vektorwertige Funktionen lässt sich dies auch für Funktionen  f:D \mapsto \mathbb{R} erweitern, wobei  D \subset \mathbb{R}^n konvex ist. Dann ist  f genau dann (strikt/gleichmäßig) konvex, genau dann wenn  \nabla f (strikt/gleichmäßig) monoton ist.

Alternativ ist eine differenzierbare Funktion  f:\R^n \supset D \to \R genau dann

  • konvex, wenn  f(y) \geq f(x)+ \nabla f(x)^T(y-x) ist für alle  x,y \in D .
  • strikt konvex, wenn  f(y) > f(x)+ \nabla f(x)^T(y-x) ist für alle  x,y \in D , \, x \neq y.
  • konkav, wenn  f(y) \leq f(x)+ \nabla f(x)^T(y-x) ist für alle  x,y \in D .
  • strikt konkav, wenn  f(y) < f(x)+ \nabla f(x)^T(y-x) ist für alle  x,y \in D , \, x \neq y.

Im Falle einer Funktion  f: \R \supset D \to \R vereinfacht sich  \nabla f(x)^T(y-x) zu  f'(x)(y-x).

Beispiel[Bearbeiten]

Betrachtet man als Beispiel den Logarithmus  f(x)=\ln (x) . Er ist auf dem Intervall  (0,\infty) stetig differenzierbar mit Ableitung  f'(x)=\tfrac{1}{x} .

Nach dem ersten Konvexitätskriterium muss jetzt die Ableitung auf Monotonie untersucht werden. Ist  x<y \iff 0<y-x und  x,y \in (0,\infty) , so ist  f'(x)-f'(y)=\tfrac{1}{x}-\tfrac{1}{y}=\tfrac{y-x}{xy}>0 , da Zähler und Nenner echt positiv sind. Somit ist  f' streng monoton fallend und folglich ist  f streng konkav auf  (0, \infty) .

Nach dem zweiten Monotoniekriterium überprüft man für  x \neq y

 \ln(y)-\ln(x)=\ln(\tfrac{y}{x}) < \tfrac{y-x}{x} = \tfrac{y}{x}-1.

Da aber  \ln (z) < z-1 für  z \neq 1 ist, gilt die Ungleichung, wenn  \tfrac{y}{x} \neq 1 ist und  x,y > 0 sind. Also ist der Logarithmus steng konkav auf  (0,\infty) .

Betrachtet man die Funktion

 f(x_1,x_2)=e^{x_1}+\tfrac{1}{2}x_1^2+x_2^2-4x_1+x_2 ,

so sind alle partiellen Ableitungen stetig und für den Gradient gilt

 \nabla f=
\begin{pmatrix} e^{x_1}+x_1-4 \\ 2x_2+1 \end{pmatrix}

Zur Überprüfung des ersten Konvexitätskriteriums bildet man für  x \neq y

 (x-y)^T(\nabla f(x)-\nabla f(y))=(x_1-y_1)^2+2(x_2-y_2)^2+(x_1-y_1)(e^{x_1}-e^{y_1})> 0 ,

da die quadratischen Terme immer echt positiv sind, die Positivität der Terme mit  e folgt aus der Monotonie der e-Funktion. Somit ist die Funktion strikt monoton, also auch strikt konvex.

Tangenten[Bearbeiten]

Die Graphen differenzierbarer konvexer Funktionen liegen oberhalb jeder ihrer Tangenten. Analog dazu liegen konkave Funktionen stets unterhalb ihrer Tangenten. Dies Folgt direkt aus dem zweiten Konvexitätskriterium. Dieses lässt sich auch so interpretieren, dass die Taylor-Echtwicklung ersten Grades die eine konvexe Funktion stehts global unterschätzt. Aus diesen Eigenschaften folgt beispielsweise die Verallgemeinerung der bernoullischen Ungleichung:

(1+x)^r\geq 1+rx für r\leq 0 oder r\geq 1
(1+x)^r\leq 1+rx für 0\le r\leq 1.

Konvexität und zweite Ableitung[Bearbeiten]

Konvexitätskriterien und zweimalige Differenzierbarkeit[Bearbeiten]

Für eine zweimal differenzierbare Funktion f lassen sich weitere Aussagen treffen. f ist genau dann konvex, wenn ihre zweite Ableitung nicht negativ ist. Ist f'' durchweg positiv, f also stets linksgekrümmt, dann folgt daraus, dass f streng konvex ist. Analog dazu ist f genau dann konkav, wenn f''\leq 0 gilt. Ist f'' durchweg negativ, f also stets rechtsgekrümmt, so ist f streng konkav.

Ist die mehrdimensionale Funktion f\colon\R^n \to \R zweimal stetig differenzierbar, dann gilt, dass f genau dann konvex ist, wenn die Hesse-Matrix von f positiv semidefinit ist. Ist die Hesse-Matrix von f positiv definit, so ist f strikt konvex. Umgekehrt ist f ist genau dann konkav, wenn die Hesse-Matrix von f negativ semidefinit ist. Ist die Hesse-Matrix von f negativ definit, so ist f strikt konkav.

Im Kern basieren die Konvexitätskriterien zweiter Ordnung auf der Überprüfung der Monotonie der Ableitung durch Monotoniekriterien, die wiederum auf Differenzierbarkeit basieren.

Beispiele[Bearbeiten]

Die Funktion f(x)=x^4 mit f''(x) = 12 x^2 ist konvex, da  f''(x)\geq 0 für alle  x . Sie ist sogar streng konvex, was beweist, dass strenge Konvexität nicht impliziert, dass die zweite Ableitung positiv ist (f'' hat bei 0 eine Nullstelle).

Die oben betrachtete Funktion f(x)=\ln(x) ist zweimal stetig differenzierbar auf I= (0,\infty) mit zweiter Ableitung  f''(x)=-\tfrac{1}{x^2}<0 für alle  x \in I . Also ist die Funktion streng konkav.

Betrachtet man die Funktion

 f(x_1,x_2)=e^{x_1}+\tfrac{1}{2}x_1^2+x_2^2-4x_1+x_2 ,

so ist ihre Hesse-Matrix

 H_f(x)=
\begin{pmatrix} e^{x_1}+1 & 0\\ 0& 2 \end{pmatrix}
.

Sie ist positiv definit, da alle ihre Eigenwerte echt positiv sind. Also ist  f strikt konvex.

Konvexe Funktionen in der Geometrie[Bearbeiten]

Eine Teilmenge A\subset\R^n ist eine konvexe Menge genau dann, wenn die durch

f(x):=d(x,A), x\in\R^n

definierte Abstandsfunktion eine konvexe Funktion f:\R^n\to\R ist.

Dieselbe Eigenschaft gilt nicht nur für Teilmengen des \R^n, sondern auch allgemein für Teilmengen von CAT(0)-Räumen, insbesondere von Riemannschen Mannigfaltigkeit nichtpositiver Schnittkrümmung. Die Konvexität der Abstandsfunktion ist ein wichtiges Hilfsmittel bei der Untersuchung nichtpositiv gekrümmter Räume.[7]

Verallgemeinerungen[Bearbeiten]

Für reellwertige Funktionen[Bearbeiten]

 M_{\alpha}=\{x|f(x)\le \alpha\}
konvex sind. Eine Funktion ist quasikonvex, wenn jede Subniveaumenge konvex ist. Jede konvexe Funktion ist quasikonvex, die Umkehrung gilt nicht.
  • Eine pseudokonvexe Funktion ist eine differenzierbare Funktion, für die gilt, dass wenn \nabla f\left(x_{1}\right)^T \left(x_{2}-x_{1}\right)\ge 0 gilt, so folgt f\left(x_{2}\right)\ge f\left(x_{1}\right). Diese Funktionen verallgemeinern die Eigenschaften einer konvexen Funktion, dass an einer Stelle mit verschwindendem Gradienten ein globales Minimum vorliegt. Jede differenzierbare konvexe Funktion ist pseudokonvex.
  • Logarithmische Konvexität einer Funktion  f liegt vor, wenn  g=\ln \circ f konvex ist. Streng genommen sind logarithmisch konvexe Funktionen keine Verallgemeinerung, sondern ein Spezialfall von konvexen Funktionen.

Für Funktionen in endlichdimensionale Vektorräume[Bearbeiten]

Für Abbildungen in allgemeine reelle Vektorräume[Bearbeiten]

  • Die fast konvexen Funktionen verallgemeinern die Konvexität so, dass für sie möglichst gute Regularitätsvorraussetzungen in der Optimierung gelten.
  • Eine konvexe Abbildung ist eine Abbildung  f: V_1 \mapsto V_2 zwischen zwei reellen Vektorräumen, für die
 \lambda f(x) + (1-\lambda) f(y)-f(\lambda x + (1-\lambda)y) \in K
für alle  \lambda \in [0,1] und  x,y aus der konvexen Menge  M gilt. Hierbei ist  K ein Ordnungskegel auf  V_2 .

Im Bezug auf Referenzsysteme[Bearbeiten]

  • Verallgemeinerte Konvexität definiert die Konvexität einer Funktion im Bezug auf eine Menge von Abbildungen, das sogenannte Referenzsystem.

Quellen[Bearbeiten]

  1. a b Harro Heuser: Lehrbuch der Analysis (Teil 1), 10. Auflage, B. G. Teubner, Stuttgart 1993, ISBN 3-519-32231-5. (49.2)
  2. z. B. in I. N. Bronstein, K. A. Semendjajew, Taschenbuch der Mathematik, 19. Auflage, BSB B.G. Teubner, Leipzig, 1979. 3.1.5.4 Monotonie und Konvexität von Funktionen
  3. a b  Otto Hölder: Ueber einen Mittelwerthssatz. In: Nachrichten von der Königl. Gesellschaft der Wissenschaften und der Georg-Augusts-Universität zu Göttingen. Aus dem Jahre 1889., Nr. 1-21, Dieterichsche Verlags-Buchhandlung, Göttingen 1889, S. 38ff. (in Wikisource, abgerufen am 24. März 2012).
  4. Earliest Known Uses of Some of the Words of Mathematics, 28. Juli 2006: A. Guerraggio and E. Molho write, „The first modern formalization of the concept of convex function appears in J. L. W. V. Jensen Om konvexe funktioner og uligheder mellem midelvaerdier, Nyt Tidsskr. Math. B 16 (1905), S. 49–69. Since then, at first referring to Jensen’s convex functions, then more openly, without needing any explicit reference, the definition of convex function becomes a standard element in calculus handbooks.“ („The Origins of Quasi-concavity: a Development between Mathematics and Economics,“ Historia Mathematica, 31, (2004), 62–75.)
  5. z. B. in I. P. Natanson, Theorie der Funktionen einer reellen Veränderlichen, 4. Auflage, Verlag Harri Deutsch, Thun, 1981, ISBN 3-87144-217-8.
  6. Jensen, J. L. W. V. Sur les fonctions convexes et les inégalités entre les valeurs moyennes. In Acta Math. 30, 175–193, 1906.
  7. Ballmann, Werner; Gromov, Mikhael; Schroeder, Viktor: Manifolds of nonpositive curvature. Progress in Mathematics, 61. Birkhäuser Boston, Inc., Boston, MA, 1985. ISBN 0-8176-3181-X

Weblinks[Bearbeiten]

Literatur[Bearbeiten]

 Stephen Boyd, Lieven Vandenberghe: Convex Optimization. Cambridge University Press, Cambridge, New York, Melbourne 2004, ISBN 978-0-521-83378-3 (online).