Benutzer:Heinrich Puschmann/Pivotverfahren

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

( Für die hier unter meinem Benutzernamen geführten Seite (Bilder ausgenommen) übernehme ich als Autor die inhaltliche Verantwortung. Sie weicht naturgemäß etwas von der veröffentlichten Seite ab, auf welche wie in jedem Wikipedia-Artikel verschiedene Autoren Zugriff haben. --Heinrich Puschmann 08:46, 21. Dez. 2007 (CET) )

<-- Geordnete Liste der Literaturnachweise:   [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13]'   [14] [15] [16] [17] [18] -->




Pivotverfahren (auch Basisaustauschverfahren) sind Algorithmen der mathematischen Optimierung, insbesondere der linearen Optimierung. Für ein vorgegebenes System linearer Gleichungen in nichtnegativen Variablen (im Wesentlichen dasselbe wie ein System linearer Ungleichungen) wird nach der bestmöglichen von vielen Alternativlösungen (einer sogenannten Optimallösung) gesucht, und auf dieser Suche das Gleichungssystem Schritt für Schritt umgewandelt ohne dabei die Lösungsmenge zu verändern.  Wichtige Pivotverfahren sind die Simplexverfahren und die Criss-Cross-Verfahren.

Pivotverfahren spielen für die Behandlung von linearen Ungleichungen eine analoge und ähnlich wichtige Rolle wie das Gaußsche Eliminationsverfahren für die Lösung linearer Gleichungssysteme in unbeschränkten Variablen. Hauptanwendungsgebiet der Pivotverfahren ist die lineare Optimierung: sie gehören zu den meistverwendeten Lösungsmethoden in der Unternehmensforschung, der Wirtschaftswissenschaft, dem Gütertransport, und sie werden auch in vielen anderen Gebieten wie im Ingenieurbau (Strukturoptimierung), in der Statistik (Regressionsanalyse) und der Spieltheorie zunehmend eingesetzt.[5] Aufgaben mit zehntausenden Variablen und Ungleichungen sind an der Tagesordnung.[6]


Pivotansatz[Bearbeiten | Quelltext bearbeiten]

Problemstellung[Bearbeiten | Quelltext bearbeiten]

Ein Pivotverfahren geht immer von einem besonders gearteten linearen Gleichungssystem aus, in dem alle Variablen, außer vielleicht einer, nichtnegative Werte annehmen sollen. Jedes System linearer Ungleichungen oder Gleichungen, und auch jede lineare Optimierungsaufgabe, lässt sich nämlich in folgende (englisch dictionary genannte [4]) Buchform bringen:

Hier sind reelle (in der Praxis freilich immer rationale) Zahlen. Die obige Darstellung soll aussagen, dass eine Lösung in den Unbekannten gesucht wird, welche die entsprechenden Gleichungen beziehungsweise Ungleichungen erfüllt und dabei die sogenannte Zielvariable so groß wie möglich wählt.

( Bei der Verwandlung der Aufgabe in die obige Form werden die Ungleichungen des Systems keinesfalls weniger: sie bleiben in (mindestens) gleicher Anzahl weiter vorhanden und treten nun als nichtnegative Variablen auf. Eine übliche lineare Ungleichung wie beispielsweise

wird umgeformt in

   )


Mit Hilfe der Indexmengen

lässt sich diese Aufgabe auch wie folgt in gedrungener Form ausdrücken:

In jedem Schritt eines Pivotverfahrens ist wie oben eine Teilmenge der Variablen als unabhängig hervorgehoben, während die restlichen Variablen, sogenannte Basisvariablen, als lineare Funktionen der unabhängigen Variablen ausgedrückt werden; in aufeinanderfolgenden Schritten wechselt immer eine der Variablen von unabhängig auf Basisvariable und eine zweite in die umgekehrte Richtung; solche Variablenpaare werden Pivots genannt.

Optimumbedingungen[Bearbeiten | Quelltext bearbeiten]

Falls im oben aufgestellten linearen Gleichungssystem beide folgende Optimumbedingungen erfüllt sind,

  •   für alle     (Zulässigkeit)  und
  •   für alle     (Zielbeschränkung),

dann kann man eine Lösung für die obige Aufgabe erhalten, indem man die unabhängigen Variablen auf die Werte setzt. Zum einen sind die Werte der freigelegten Variablen    dann nichtnegativ, wie gefordert. Zum anderen dürfen sonstige mögliche Lösungen nur unabhängige Variable mit ebenfalls nichtnegativen Werten enthalten, so dass für jede dieser Lösungen die Ungleichung    gilt.

( Im folgenden Beispielsystem,

werden die Optimumbedingungen an zwei Stellen verletzt, da    und    ist. Zum ersten würde die Versuchslösung    den negativen Wert    enthalten, und zum zweiten könnte dessen Zielvariablenwert    bei Lösungen mit    unter Umständen erhöht werden )

Austausch der Basisvariablen[Bearbeiten | Quelltext bearbeiten]

Falls die Optimumbedingungen nicht erfüllt sind, was in der Regel der Fall sein wird, lässt sich das obige lineare Gleichungssystem aber auch andersartig ausdrücken, indem man an Stelle von eine andere, gleich große Teilmenge der Unbekannten auswählt und diese freilegt. Es sei     eine Umstellung der Unbekannten,

Anhand folgender Aufteilung der Variablen,

in neue unabhängige Variablen mit und neue Basisvariablen mit , wird das Gleichungssystem nun umgewandelt zu

wobei zu beachten ist, dass Einträge wie nur für Indexpaare mit und definiert sind. Die Einträge des so umgewandelten Gleichungssystems lassen sich nun erneut auf die Optimumbedingungen überprüfen,

  •   für alle      (Zulässigkeit)   und
  •   für alle      (Zielbeschränkung),

was wiederum unter Umständen zu einer Lösung der Aufgabe führt.

Ein Standardergebnis der linearen Optimierung sagt aus[4][5], dass für jede lösbare Aufgabe ein Satz Basisvariablen existiert, der zu einer Lösung führt. Bei erfüllten Optimumbedingungen bilden die Basisvariablen eine sogenannte Optimalbasis des Systems.

Pivots und Pivotelemente[Bearbeiten | Quelltext bearbeiten]

Jedes nichtverschwindende des obigen Gleichungssystems, dem Pivotsystem, nennt sich Pivotelement, und erlaubt es, die unabhängige Variable an Stelle der Basisvariablen freizulegen, um so weiter nach einer Lösung zu suchen. Das ist die Vorgehensweise eines allgemeinen Pivotverfahrens, wobei aber nicht irgendwelche Pivotelemente gewählt werden, sondern nur sogenannte erlaubte (admissible) Pivots,[9] die Folgendes erfüllen müssen:

  • Entweder gilt gleichzeitig     und      (Zulässigkeitspivot),
  • oder es gilt gleichzeitig     und      (Zielfortschrittspivot).

( Im obigen Beispielsystem,

sind wegen der Optimalitätsverletzung    Pivotelement    mit Pivot   und Pivotelement    mit Pivot   erlaubt. Wegen der Optimalitätsverletzung    sind aber ebenfalls Pivotelement    mit Pivot ,  und Pivotelement    mit Pivot   erlaubt )

Die Beschränkung auf erlaubte Pivots verhindert, dass derselbe Pivot zweimal hintereinander ausgewählt wird. Die Regeln, nach denen in jedem Schritt eines dieser erlaubten Pivotelemente ausgewählt wird, hängen vom jeweiligen Verfahren ab; ein Mindestanspruch ist dabei natürlich, dass das Verfahren nach endlich vielen Schritten anhält, was bei ungeeigneter Auswahl von erlaubten Pivots nicht der Fall ist. Fukuda & Terlaky haben 1999 bewiesen, dass für jede lösbare Aufgabe und für jede Ausgangsbasis eine Folge von maximal erlaubten Pivots existiert, die zu einer Optimalbasis führt.[10] Leider liefert ihr Beweis keine Vorgehensweise, um diese Pivots in jedem Optimierungsschritt auch zu finden.

Wie aus der Definition zu ersehen ist, haben Optimalbasen keine erlaubten Pivots, das Verfahren kann in so einem Fall gar nicht fortgeführt werden. Anderseits kann anhand von Argumenten wie im obigen Abschnitt leicht gezeigt werden, dass eine nichtoptimale Basis ohne erlaubte Pivots immer zu einer Aufgabe gehört, die keine Lösung hat; entweder, weil das System der Gleichungen und Ungleichungen überhaupt keine Lösung hat (unzulässige Aufgabe), oder, weil sich Lösungen mit beliebig großem finden lassen (unbeschränkte Aufgabe).


Beispiele[Bearbeiten | Quelltext bearbeiten]

Direkte Umsetzung[Bearbeiten | Quelltext bearbeiten]

Um Rundungsfehler zu vermeiden, arbeiten wir in den folgenden Beispielen mit Bruchzahlen und wählen einen gemeinsamen Nenner für sämtliche Einträge. Um in jedem Schritt einen gemeinsamen Nenner für das Gesamtsystem zu finden, müssen wir die Einträge nicht zusätzlich untersuchen. Falls das Startsystem ganzzahlig ist (was sich normalerweise durch Erweiterung erreichen lässt), gilt die Regel:

  • Der Zähler des gewählten Pivotelements ist ein gemeinsamer Nenner für das darauffolgende System.

Wenn die Einträge des Folgesystems mit diesem gemeinsamen Nenner multipliziert werden, erhält man ganzzahlige Werte. Bei der Aufstellung des Folgesystems veraltet der gemeinsame Nenner des Vorgängersystems, weshalb sämtliche Einträge des Folgesystems ungeprüft durch diesen veralteten Nenner gekürzt werden können.[2][12]


Eine Tabelle mit den Einträgen eines Pivotsystems wird oftmals Tableau genannt. Das folgende Schema zeigt an, wie sich die Einträge des Pivotsystems von einem Schritt auf den nächsten verändern:

   

Das Zeichen steht hier für den gemeinsamen Nenner des Gleichungssystems, das Zeichen für den Zähler des Pivotelements, für einen sonstigen Eintrag der Pivotzeile, für einen sonstigen Eintrag der Pivotspalte, und für einen beliebigen Eintrag abseits von Pivotzeile und Pivotspalte. Einträge der Zielbeitragszeile () und der Basiswertspalte () werden nach denselben Regeln umgewandelt.


Die Bilder zu den Schritten in den folgenden Beispielen zeigen alle dasselbe Gleichungssystem in verschiedenen orthogonalen Koordinaten; dabei gilt:

  • Die grün umrandete Fläche ist der zulässige Bereich, in dem alle Variablen nichtnegative Werte haben.
  • Koordinatenachsen entsprechen den Gleichungen von unabhängigen Variablen; sonstige Geraden beschreiben freigelegte Variablen.
  • Schnittpunkte erlaubter Pivots sind rot markiert; der schwarzumrandete Schnittpunkt zeigt den ausgewählten Pivot.
  • Die gelbe Fläche wird im nächsten Schritt zum nichtnegativen Quadranten.


Eine erfolgssichere Pivotauswahlregel[Bearbeiten | Quelltext bearbeiten]

Wir wählen vorerst ein Beispiel ohne Zielvariable, das heißt, mit . In so einem Fall wird keine der Variablen maximiert; es werden nur beliebige (nichtnegative) Werte für die Unbekannten    gesucht, die ein vorgegebenes Gleichungssystem erfüllen. In jedem Schritt wollen wir dann den erlaubten Pivot nach folgender Regel wählen:

  1. Wähle   ,
  2. danach wähle   .

Diese (nicht besonders effiziente) Auswahlregel fällt wegen   mit der Kleinster-Index-Pivotauswahl zusammen; es lässt sich beweisen,[9] dass diese Auswahl bei jeder lösbaren Aufgabe mit   zu einer Optimalbasis führt.


Wir suchen nun Werte für die Unbekannten  , die das Gleichungssystem

erfüllen. Die erlaubten Pivots im obigen Gleichungssystem sind und ; aufgrund der obigen Auswahlregel legen wir die unabhängige Variable an Stelle der Basisvariablen frei:

(Skalierbare animierte Darstellung eines Pivotverfahren-Schrittes)
Basis 0 zu Basis 1   (skalierbar und von Firefox animiert bei 2-mal anklicken und gedrückt halten)

Wir erhalten nun das folgende, umgewandelte Gleichungssystem:

Im neuen System sind die erlaubten Pivots und ; dieses Mal legen wir legen wir an Stelle von frei:

(Skalierbare animierte Darstellung eines Pivotverfahren-Schrittes)
Basis 1 zu Basis 2

Wir erhalten das System

Der einzige erlaubte Pivot hier ist ; deshalb können wir nur an Stelle von freilegen:

(Skalierbare animierte Darstellung eines Pivotverfahren-Schrittes)
Basis 2 zu Basis 3

Nun erhalten wir:

Da dieses System die Optimalitätsbedingungen erfüllt (und dem entsprechend auch keine erlaubten Pivots hat), erhalten wir die Lösung:

       


Kreislaufanfällige Pivotauswahlregeln[Bearbeiten | Quelltext bearbeiten]

Es folgt nun ein Beispiel einer ungeeigneten Pivotauswahl; bei ungeeigneter Pivotwahl kann ein Pivotverfahren nämlich in einen unendlichen Kreislauf (eine Endlosschleife) geraten. Es sei wieder Wie bei folgender Regel vorgeschlagen, könnten wir beispielsweise der Versuchung erliegen, die Pivotzeile nur unter den "meistverletzten" Nebenbedingungen auszuwählen, und dabei "meistverletzt" als diejenigen mit den am weitesten negativen Konstanten verstehen:

  1. Wähle ,
  2. danach wähle .

Um zu zeigen, dass so etwas falsch gehen kann, starten wir mit dem System:

Wir wählen hier und legen an Stelle dessen frei. Dadurch erhalten wir das System:

Wir wählen Basisvariable , legen an deren Stelle frei, und erhalten:

Die Einträge in diesem Gleichungssystem sind dieselben wie im Startsystem, weshalb sich bei ähnlicher Pivotfolge auch die Einträge der folgenden Systeme alle zwei Schritte wiederholen werden. Nach Auswahl der Basisvariablen um an deren Stelle freizulegen erhalten wir:

Nach der kreislauffreien Regel im vorherigen Beispiel müssten wir nun wählen um freizulegen. Anstelle dessen folgen wir der abgewandelten Regel und wählen dafür die Basisvariable , was zu folgendem System führt:

Dieses Gleichungssystem hat wieder dieselben Einträge wie das Startsystem; weil diese aber immer noch anderen Variablen zugeordnet sind, ist der Kreislauf nach diesen 4 Schritten noch nicht beendet. Dennoch ist leicht zu überprüfen, dass der Algorithmus in insgesamt 6 Schritten zum Startsystem in vertauschter Reihenfolge und in 12 Schritten zum genauen Startsystem zurückkehrt. Das Gesamtsystem von Gleichungen und Ungleichungen hat in Wirklichkeit gar keine Lösung, doch kann das Pivotverfahren das mit der oberen Pivotwahl nicht herausfinden.


Die Reihenfolge, in der Variable und Gleichungen eines Pivotsystems aufgelistet werden ist grundsätzlich willkürlich. Dennoch wurden die ersten Pivotauswahl-Strategien, die Variablen und Gleichungen unabhängig von deren Darstellung im Pivotsystem behandeln (und dazu noch leicht umsetzbar waren), erst 1977 von Bland [3] vorgestellt. In der Anfangszeit der Pivotverfahren (1950-1970), als noch nicht streng zwischen Algorithmen und Datenstrukturen unterschieden wurde, hat man Pivotauswahl-Strategien eher anhand von Datenstrukturen (sogenannten Tableaus) beschrieben, und bei dieser Art Strategien konnte die Endlichkeit des Verfahrens ohne Zusatzberechnungen meist nicht gewährleistet werden.

Wenn zum Beispiel die betrachtete Pivotauswahl-Regel im Sinne der ursprünglich verwendeten Dantzig-Auswahl verändert wird, bei der einfach die erste der in Frage kommenden Zeilen und Spalten ausgewählt wird, dann ist auch damit nicht geholfen. Die Auswahlregel wäre dann

  1. Wähle das kleinste     mit   ,
  2. Danach wähle das kleinste     mit   ,
  3. Der Pivot sei ,

doch führt diese beim obigen Beispiel in genau dieselbe endlose Schleife.


Eine kreislaufanfällige Pivotauswahlregel (veraltet)[Bearbeiten | Quelltext bearbeiten]

Es folgt nun ein Beispiel einer ungeeigneten Pivotauswahl. Es sei wieder .  Bei ungeeigneter Pivotwahl kann ein Pivotverfahren in einen unendlichen Kreislauf (eine Endlosschleife) geraten, wenn wir beispielsweise wie bei folgender Regel einfach die erste der in Frage kommenden Zeilen und Spalten auswählen:

  1. Wähle das kleinste     mit   ,
  2. Danach wähle das kleinste     mit   ,
  3. Der Pivot sei .

Wir starten mit dem System:

Wir wählen hier und legen an Stelle dessen frei. Dadurch erhalten wir das System:

Wir wählen Basisvariable , legen an deren Stelle frei, und erhalten:

Dieses Gleichungssystem hat bereits dieselben Einträge wie das Startsystem. Nach Auswahl der Basisvariablen um an deren Stelle freizulegen erhalten wir:

Darauf wählen wir , legen an Stelle dessen frei, und erhalten:

Jetzt werden wir angehalten, zu wählen und an Stelle dessen freizulegen, aber nach der kreissicheren Regel im vorherigen Beispiel müssten wir dafür und wählen. Die Einträge des Gleichungssystems sind wieder die des Startsystems, nach 6 Schritten wiederholen sich die Startgleichungen in umgestellter Reihenfolge, und nach 12 Schritten wiederholt sich das Startsystem genau. Das Gesamtsystem von Gleichungen und Ungleichungen hat in Wirklichkeit gar keine Lösung, doch kann das Pivotverfahren mit der oberen Pivotwahl das nicht herausfinden.


Dualität[Bearbeiten | Quelltext bearbeiten]

Duale Optimierungsaufgaben[Bearbeiten | Quelltext bearbeiten]

Jeder linearen Optimierungsaufgabe lässt sich, von der obigen Buchform abhängig, eine zweite Optimierungsaufgabe zuordnen; die Koeffizientenmatrix dieser sogenannten dualen Aufgabe ist die negative Transponierte der Koeffizientenmatrix der ursprünglichen Aufgabe:

In gedrungener Form wird das zu

(Vorsicht: Bei der Herleitung über diese Formulierung dürfen     nicht durch     ersetzt werden!   Oftmals wird die duale Aufgabe auch mit der Zielfunktion anstelle von definiert, was zwar machbar, aber auch unübersichtlicher ist.)

Offenbar führt die duale Umwandlung einer dualen Aufgabe wieder zur ursprünglichen Aufgabe; das ist aber nur dann leicht ersichtlich, wenn die Aufgabe in die hier verwendete Form gebracht wurde. Wie gleich gezeigt wird, ist das Maximum der Dualaufgabe (soweit vorhanden) genau das negative Maximum der Primalaufgabe.

Schrittweise Umwandlung[Bearbeiten | Quelltext bearbeiten]

Die obige Beziehung der Koeffizienten zwischen Primalaufgabe und Dualaufgabe gilt nicht etwa nur für die Ausgangsbasis, sondern bleibt erhalten, solange die Basisvariablen nach denselben Pivots umgewandelt werden. Es gilt

Diese Dualitätsbeziehung lässt sich am leichtesten an einem Pivotsystem betrachten, das ausschließlich zwei unabhängige Unbekannte und zwei freigelegte Unbekannte enthält. Wir erhalten dasselbe System, wenn wir zuerst zwei der Unbekannten austauschen und danach die duale Aufgabe herleiten, oder wenn wir diese Schritte in umgekehrter Reihenfolge tun:

   

Aus der Dualbeziehung folgt, dass ein Optimalsystem für die Primalaufgabe auch ein Optimalsystem für die duale Aufgabe liefert.

Zur Aufgabe im ersten Rechenbeispiel gehört folgende duale Aufgabe (wegen   ist hier  ):

Das Optimalystem dazu ist, wie erwartet,

und die optimale Lösung dazu ist natürlich für alle .   Die Primalaufgabe hatte eine implizite Zielfunktion ; sämtliche Optimallösungen der primalen und auch der dualen Aufgabe hätten deshalb, soweit vorhanden, einen Zielwert . Das ist derselbe Wert, den auch schon die Anfangslösung der dualen Aufgabe hatte, doch ist die Existenz einer Optimallösung aus dem ersten Gleichungssystem allein nicht ersichtlich: es hätte grundsätzlich auch Lösungen mit unendlich großem und somit gar keine Optimallösung geben können.

Komplementärer Schlupf[Bearbeiten | Quelltext bearbeiten]

Falls für eine lineare Optimierungsaufgabe nur eine optimale Lösung, aber keine optimale Basis bekannt ist, dann lässt sich trotzdem "schnell" über ein lineares Gleichungssystem eine optimale Lösung für die entsprechende duale Aufgabe finden. Dazu verhilft der Satz vom komplementären Schlupf: jedes Paar optimaler Lösungen (falls ein solches existiert) erfüllt die zusätzlichen Bedingungen

eine Eigenschaft, die unmittelbar aus der Existenz einer optimalen Basis folgt.

Ausgeschrieben besagt das

und daraus folgt das Gleichungssystem

Lösungspaarsuche[Bearbeiten | Quelltext bearbeiten]

Eine weitere theoretisch bedeutsame Folge der Dualitätstheorie ist: Wir brauchen nicht unbedingt einen Maximierungs-Algorithmus, um lineare Optimierungsprobleme zu lösen; es genügt dazu jeder Algorithmus, der Systeme linearer Ungleichungen löst. Aus der Dualitätsbeziehung folgt nämlich, dass jede Optimalbasis der ursprünglichen Aufgabe auch unmittelbar eine Optimalbasis für die duale Aufgabe liefert; der optimale Wert der Zielvariable  ist das Negative des Optimalwerts von  Für zulässige Lösungspaare der beiden Aufgaben gilt demzufolge

und für optimale Lösungspaare gilt

Daraus folgt, dass die optimalen Lösungen beider Aufgaben genau die Lösungen der obigen Gleichungssysteme mit folgenden Ungleichungen sind:

Ausgeschrieben ist das

In der Praxis ist so ein Vorgehen freilich nur dann konkurrenzfähig, wenn die gemeinsame Datenstruktur beider Aufgaben auch ausgenützt wird.


Besondere Pivotverfahren[Bearbeiten | Quelltext bearbeiten]

Aufgabenbereiche[Bearbeiten | Quelltext bearbeiten]

Die einfachsten aller Pivotverfahren gehören zu den Criss-Cross-Verfahren,[9] die in den 80er Jahren für Aufgabenstellungen im Kontext orientierter Matroide[19] entwickelt wurden. Die wesentlich komplexeren Simplexverfahren[4][5] wurden aber bereits 1947 von George Dantzig für die Lösung linearer Optimierungsprobleme veröffentlicht[1] und haben danach dank ihrer weiten Verbreitung die Suche nach Criss-Cross-Verfahren maßgeblich motiviert. Weitere Pivotverfahren wurden für das lineare Komplementaritätsproblem mit suffizienten[14] Matrizen (einschließlich quadratischer[15] Programmierung) und für linear-fraktionale[16] Optimierungsprobleme entwickelt.

Bei der Ausarbeitung verschiedener Pivotverfahren geht es in der Hauptsache darum, die Anzahl der Pivotschritte und damit auch die Laufzeit des Verfahrens gering zu halten. Während die derzeit bekannten Simplexverfahren alle eine überpolynomial beschränkte Laufzeit beanspruchen - das ist eine Laufzeit, die sich nicht durch ein Polynom in der Datenspeichergröße beschränken lässt - sind Laufzeitschranken für die Criss-Cross-Verfahren ein (bis 2010) noch offenes Forschungsthema.[11] Zusammenfassend lässt sich darüber sagen, dass Criss-Cross-Verfahren mehr Freiheitsgrade aufweisen als Simplexverfahren, und dass ein Criss-Cross-Verfahren genau aus diesem Grund bei einer guten Pivotauswahl schneller[10] und bei einer schlechten Pivotauswahl langsamer[13] als Simplexverfahren sein kann.


Primale Simplexverfahren[Bearbeiten | Quelltext bearbeiten]

Primale Simplexverfahren [4][5] (meist nur Simplexverfahren genannt) waren die ersten Pivotverfahren für die Lineare Optimierung, und wurden 1947 von George Dantzig veröffentlicht. Diese Pivotverfahren gehen von einer sogenannten zulässigen Basis mit   für alle  aus, und untersuchen ausschließlich zulässige Basen, bis eine Optimalbasis gefunden wird. Eine wichtige Eigenschaft der primalen Simplexverfahren ist, dass der Wert der Zielvariablen, also , mit jedem Schritt monoton anwächst; würde er streng monoton anwachsen, wäre die Endlichkeit des Verfahrens gesichert. Ein primales Simplexverfahren muss seine Pivots wie folgt wählen:

  1. Wähle ein beliebiges , das erfüllt.  Zum Beispiel, suche das kleinste mit dieser Eigenschaft (Bland-Regel [3]).
  2. Wähle ein beliebiges , das erfüllt.  Zum Beispiel, suche das kleinste mit dieser Eigenschaft (Bland-Regel).

Um eine zulässige Ausgangsbasis zu erhalten, muss in einer sogenannten Phase 1 eine Hilfsaufgabe gelöst werden.

Ein Standardergebnis der lineare Optimierung|Linearen Optimierung besagt[4][5], dass für jede lösbare Aufgabe und für jede zulässige Basis eine Folge erlaubter Pivots existiert, die über ausschließlich zulässige Basen zu einer Optimalbasis führt; unbekannt ist dagegen, ob es eine Folge dieser Art gibt, deren Länge sich polynomial in der Speichergröße der Daten beschränken lässt.

Beispiel zum primalen Simplexverfahren[Bearbeiten | Quelltext bearbeiten]

Im folgenden Beispiel sollen Werte für die Variablen gefunden werden, die das Gleichungssystem

erfüllen und dabei die zusätzliche Zielvariable  auf ein Maximum bringen. Da bei dieser besonderen Aufgabe sämtliche Zulässigkeitsbedingungen bereits erfüllt sind, , können wir uns die Suche nach einer zulässigen Basislösung sparen und ein primales Simplexverfahren direkt anwenden; wir benutzen dazu die oben angeführten Bland-Regeln um die Pivots auszuwählen.

Im Sinne allgemeiner Pivotverfahren wären in unserem Ausgangssystem sämtliche Pivots erlaubt; damit aber die folgende Basislösung weiterhin die Zulässigskeitsbedingungen erfüllt schreibt die Auswahlregel von Bland vor, dass wir freilegen und gegen austauschen:

Das führt zum neuen Gleichungssystem:

Hier sind , und allgemein erlaubte Pivots; anhand der Auswahlregel müssen wir aber an Stelle von freilegen:

Wir erhalten das System:

Die erlaubten Pivots dieses Gleichungssystems wären und ; wir legen davon an Stelle von frei:

Nun erhalten wir das System;

Dieses Gleichungssystem ist optimal; die Werte der Unbekannten für die dazugehörige Lösung sind

          


Duale Simplexverfahren[Bearbeiten | Quelltext bearbeiten]

Duale Simplexverfahren sind Pivotverfahren, die von einer sogenannten dual-zulässigen Basis mit   für alle   ausgehen, und in ihrer Suche nach einer Optimalbasis ausschließlich dual-zulässige Basen untersuchen; der Wert der Zielvariablen nimmt dabei monoton ab. Ein duales Simplexverfahren wählt seine Pivots wie folgt:

  1. Wähle ein beliebiges , das erfüllt.  Zum Beispiel, suche das kleinste mit dieser Eigenschaft (Bland-Regel [3]).
  2. Wähle ein beliebiges , das erfüllt.  Zum Beispiel, suche das kleinste mit dieser Eigenschaft (Bland-Regel).

Duale Simplexverfahren erzeugen die gleichen Pivotfolgen wie die auf die duale Aufgabe angewandten primalen Simplexverfahren, und haben deshalb auch grundsätzlich die gleichen Eigenschaften wie die primalen Verfahren. Dass sie für die Lösung vieler angewandter Aufgaben trotzdem den Primalverfahren vorgezogen werden liegt daran, dass es für viele angewandte Aufgaben leichter ist, eine dual-zulässige Ausgangsbasis zu finden.


Criss-Cross-Verfahren[Bearbeiten | Quelltext bearbeiten]

Criss-Cross-Verfahren (englisch: kreuz und quer) sind allgemeine Pivotverfahren, die von einer beliebigen Basis ausgehen;[9] in der Regel wird dieser Name für kombinatorische Pivotverfahren verwendet, das heißt, für Pivotverfahren, welche nur die Vorzeichen der Systemkoeffizienten und nicht die Koeffizienten selbst für die Pivotauswahl in Betracht ziehen.

Das bekannteste aller Criss-Cross-Verfahren erweitert die Kleinster-Index Pivotauswahl [9] aus dem ersten Beispiel. Dafür werden die Unbekannten in einer mehr oder weniger festen Reihenfolge angeordnet und die Pivots wie folgt ausgewählt (wie üblich, sei das Minimum der leeren Menge unendlich groß):

  1. Suche die Indices     und   .
  2. Falls ,  ist, wähle Pivot  mit  .
  3. Falls ,  ist, wähle Pivot  mit  .

Das lässt natürlich die Frage offen, wie die Variablen angeordnet werden sollen.

Beispiel zu einem Criss-Cross-Verfahren[Bearbeiten | Quelltext bearbeiten]

Im folgenden Beispiel sollen Werte für die Variablen gefunden werden, die das Gleichungssystem

erfüllen und dabei die zusätzliche Zielvariable  auf ein Maximum bringen. Wir benutzen dazu die oben angeführte Pivotauswahl des kleinsten Index.

In unserem Ausgangssystem sind sämtliche Pivots erlaubt; die Auswahlregel schreibt aber vor, dass wir freilegen und gegen austauschen:

(Skalierbare animierte Darstellung eines Pivotverfahren-Schrittes)
Basis 0 zu Basis 1   (skalierbar und von Firefox animiert bei 2-mal anklicken und gedrückt halten)

Das führt zum neuen Gleichungssystem:

Hier sind die Pivots , und , erlaubt; anhand der Auswahlregel legen wir an Stelle von frei:

(Skalierbare animierte Darstellung eines Pivotverfahren-Schrittes)
Basis 1 zu Basis 2

Wir erhalten das System:

Die erlaubten Pivots dieses Gleichungssystems sind und ; wir legen darum an Stelle von frei:

(Skalierbare animierte Darstellung eines Pivotverfahren-Schrittes)
Basis 2 zu Basis 3

Nun erhalten wir das System;

Dieses Gleichungssystem ist optimal; die Werte der Unbekannten für die dazugehörige Lösung sind

          


Große Aufgaben[Bearbeiten | Quelltext bearbeiten]

Eine Implementierung der Pivotverfahren für praktische Aufgaben ist oft weit von trivial entfernt.[7] Die Einträge großer Gleichungssysteme – mit zehntausenden von Variablen – weisen so gut wie immer irgendeine Struktur auf, die es auszunutzen gilt, um die Berechnung derselben schnell und rundungsfehlerarm durchzuführen:

  • Im Startsystem großer Aufgaben (nicht in den umgewandelten Gleichungssystemen) ist die überwältigende Mehrheit dieser Einträge Null (das System ist dünnbesetzt), was es ermöglicht, einen Großteil der Rechnungen einzusparen, wenn man auch in späteren Umwandlungen teilweise vom Startsystem ausgeht.
  • Bei den Vorgehensweisen mit verzögerter Auswertung (über Umstellung der Startmatrix, teilweise LR-Zerlegung der Koeffizientenmatrix, Produktform inverser Matrizen und anderem mehr) berechnet man einen Eintrag nur und erst dann, wenn man ihn wirklich braucht, um den Pivot zu finden. Dabei muss man aber oft auf Einträge aus älteren Gleichungssystemen zurückgreifen, so dass die Formeln zur Berechnung komplizierter und vielfältiger werden.
  • Für manche Sonderstrukturen, wie zum Beispiel dem Netzflussproblem,[8] wurden besonders effiziente Umsetzungen entwickelt, und diese Sonderstrukturen sind oft eingebettet in größere Systeme.

Nichtdestominder kommen auch in der Praxis auch kleinere Aufgaben vor, für welche die oben beschriebene Direktumsetzung durchaus sinnvoll ist.

Literatur[Bearbeiten | Quelltext bearbeiten]

Obwohl viele Texte der linearen Optimierung auf dem Markt zu finden sind, erreichen wenige die übersichtliche Klarheit und den zugänglichen Lesestil der Bücher von Chvátal[4] und von Vanderbei.[5] Beide wurden vielfach empfohlen[17][18] und das letztere in der Auflage von 2007 aktualisiert. Das Geschichtswerk vom Begründer der linearen Optimierung, George Dantzig,[1] liefert dazu viele lesenswerte Einzelheiten, ist aber für eine Einführung in das Thema weniger geeignet.

  • George B. Dantzig: Lineare Programmierung und Erweiterungen. Deutsche Auflage 1966[1]
  • Vašek Chvátal: Linear Programming. Auflage 1983[4]
  • Robert J. Vanderbei: Linear Programming. Foundations and Extensions. Revidierte 3. Auflage 2007[5]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. a b c d George Dantzig (1963): Lineare Programmierung und Erweiterungen., Springer-Verlag, 1963/1966, (Originalausgabe: Linear Programming and Extensions, Princeton University Press, ISBN 0-691-05913-6, pdf, 9.1 MB)
  2. a b Erwin Bareiss (1968): Sylvester's Identity and Multistep Integer-Preserving Gaussian Elimination, Mathematics of Computation, vol.22 (102), 565-578, pdf-Datei
  3. a b c d Robert G. Bland (1977): New finite pivoting rules for the simplex method, Mathematics of Operations Research, vol.2, 103-107, pdf-Datei
  4. a b c d e f g h Vašek Chvátal (1983): Linear Programming., Freeman and Company, ISBN 0-7167-1587-2
  5. a b c d e f g h Robert J. Vanderbei (1996/2007): Linear Programming; Foundations and Extensions, 3.ed. Springer, ISBN 978-0-387-74387-5, pdf, 2.3 MB), (Alternativausgabe: Linear Programming; Foundations and Extensions, Kluwer, ISBN 978-0-7923-9804-2)
  6. a b Robert J. Vanderbei (2007): Linear Programming; Foundations and Extensions (s.o.), Kap.21.4: Simplex Method vs Interior-Point Methods
  7. a b Robert J. Vanderbei (2007): Linear Programming; Foundations and Extensions (s.o.), Kap.8: Implementation Issues
  8. a b Robert J. Vanderbei (2007): Linear Programming; Foundations and Extensions (s.o.), Kap.13: Network Flow Problems
  9. a b c d e f Komei Fukuda & Tamás Terlaky (1997): Criss-cross methods: A fresh view on pivot algorithms, Mathematical Programming, 79, 369-395, ps-Datei
  10. a b c Komei Fukuda & Tamás Terlaky (1999): On the Existence of a Short Admissible Pivot Sequences for Feasibility and Linear Optimization Problems, Pure Mathematics and Applications, vol.10, 431-447, ps-Datei
  11. a b Shuzhong Zhang (1999): New variants of finite criss-cross pivot algorithms for linear programming, European Journal of Operations Research, vol.116(3), 607-614, pdf-Datei
  12. a b Thom Mulders (2001): A Generalized Sylvester Identity and Fraction-free Random Gaussian Elimination, Journal of Symbolic Computation, vol.31(4), 447-460, pdf-Datei
  13. a b Komei Fukuda & Bohdan Kaluzny (2004): The criss-cross method can take Ω(n^d) pivots, Symposium on Computational Geometry 2004, 401-408, ps-Datei
  14. a b Referenzfehler: Ungültiges <ref>-Tag; kein Text angegeben für Einzelnachweis mit dem Namen sufficient matrix.
  15. a b Quadratic Programming
  16. a b Linear Fractional Programming
  17. a b Leserbewertung von Chvatal's Linear Programming
  18. a b Leserbewertung von Vanderbei's Linear Programming
  19. Oriented matroid

Referenzfehler: Das in <references> definierte <ref>-Tag mit dem Namen „sufficient_matrix“ wird im vorausgehenden Text nicht verwendet.


Weblinks[Bearbeiten | Quelltext bearbeiten]

  • Interaktives Pivotverfahren-Applet von Robert Vanderbei aus dem Jahr 1997. Das Applet erlaubt dem Benutzer, ein lineares Gleichungssystem mit freigelegten Basisvariablen aufzustellen und anschließend beliebige Variablen dieses Gleichungssystems umzustellen. Obwohl sich das Applet „Simplex Pivot Tool“ nennt, ist es auf ganz allgemeine Pivotverfahren ausgerichtet. Die Koeffizienten können auch rundungsfrei als Bruchzahlen eingesehen werden, werden aber nicht auf einen gemeinsamen Nenner gebracht.