Stackelberg-Duopol

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Das Stackelbergmodell ist ein strategisches Spiel in den Wirtschaftswissenschaften, das dadurch gekennzeichnet ist, dass das marktführende Unternehmen zuerst zieht und danach die marktfolgenden Unternehmen sich entscheiden. Handelt es sich nur um zwei Unternehmen spricht man von einem Stackelberg-Duopol. Es ist nach dem deutschen Ökonomen Heinrich Freiherr von Stackelberg benannt, der sein Werk Marktform und Gleichgewicht 1934 veröffentlichte, in dem das Modell beschrieben wurde, und stellt eine Weiterentwicklung von Cournots Duopol-Modell dar.

Wir bezeichnen die beiden Spieler als Stackelbergführer bzw. Leader und Stackelbergfolger bzw. Follower, und sie konkurrieren in Mengeneinheiten. Der Stackelbergführer wird dabei auch manchmal als Marktführer bezeichnet.

Für die Existenz eines Gleichgewichts im Stackelberg-Duopol gibt es einige weitere Bedingungen: Der Leader muss wissen, dass der Follower seine Aktion beobachtet. Der Follower darf keine Möglichkeit haben, sich vor dem Leader auf eine zukünftige Aktion festzulegen (also auch nicht auf eine Aktion außerhalb des Gleichgewichts im Stackelberg-Modell), und dem Leader muss dies bekannt sein. Wenn dies möglich wäre, würde der Follower sich auf die Menge festlegen, die der Leader im Stackelberg-Modell wählt, und die beste Antwort des Leaders darauf wäre die Menge zu wählen, die der Follower im Stackelberg-Modell wählt. (Das Ganze würde sich also umdrehen!)

Unternehmen können sich im Stackelberg-Wettbewerb befinden, wenn eines von ihnen einen irgendwie gearteten Vorteil hat, der es in die Lage versetzt, zuerst zu entscheiden. Üblicherweise sollte der Leader in der Lage dazu sein, sich festzulegen. Seine Aktion offen zuerst zu wählen, ist die offensichtlichste Form dabei; sobald der Leader seine Aktion gewählt hat, kann er sie nicht rückgängig machen, er ist an sie gebunden. Die Möglichkeit des ersten Zuges kann zum Beispiel in einer Situation gegeben sein, in der der Leader ein Monopol innehat und der Follower neu auf dem Markt ist.

Nash-Gleichgewicht[Bearbeiten]

Das Stackelberg-Modell kann gelöst werden, um ein (oder mehrere) Nash-Gleichgewicht(e) aufzufinden, also die Strategiekonfiguration(en), bei der jeder der Spieler die optimale Menge gewählt hat bei gegebener Wahl der Mengen der anderen Spieler.

Ganz allgemein sei die inverse Nachfragefunktion für den Markt im Duopol gegeben durch P(q_1+q_2) , wobei der Index 1 den Leader und der Index 2 den Follower bezeichnet. Der Preis ergibt sich somit als eine Funktion des Gesamtoutputs. Das Unternehmen i habe die Kostenfunktion C_i(q_i). Das Modell wird durch Rückwärtsinduktion gelöst. Unternehmen 1 ermittelt die Beste Antwort von Unternehmen 2, d.h. wie dieses reagieren wird, wenn es die Wahl der Menge  q_1 beobachtet. Unternehmen 1 (der Leader) wählt dann eine Menge so, dass es unter Antizipation der Antwort von Unternehmen 2 (dem Follower) seine Auszahlung maximiert. Unternehmen 2 beobachtet dies und wählt im Gleichgewicht tatsächlich die erwartete Menge als Antwort.

Um das Nash-Gleichgewicht zu berechnen, muss die Beste-Antwort-Funktion des Followers zuerst berechnet werden (→Rückwärtsinduktion).

Der Gewinn von Unternehmen 2 (Follower) ist dessen Erlös minus dessen Kosten; der Erlös ist das Produkt aus Preis und der produzierten Menge von Unternehmen 2 und die Kosten sind durch die Kostenstruktur des Unternehmens gegeben, der Gewinn ist also: \Pi_2 = P(q_1+q_2)\cdot q_2 - C_2(q_2). Die beste Antwort ist der Wert von q_2, der \Pi_2 maximiert, gegeben q_1, den Output des Leaders (Unternehmen 1). Dieser Wert gibt den Output an, der den Gewinn von Unternehmen 2 maximiert. Also muss das Maximum von \Pi_2 unter q_2 gefunden werden. Leite dazu zunächst \Pi_2 nach q_2 ab:

\frac{\partial \Pi_2 }{\partial q_2} = \frac{\partial P(q_1+q_2) }{\partial q_2}\cdot q_2 + P(q_1+q_2) - \frac{\partial C_2 (q_2)}{\partial q_2}\cdot

Nach der hinreichenden Bedingung für ein Extremum muss dies 0 ergeben (anschließend ist noch zu prüfen, ob die zweite Ableitung negativ ist oder es einen Vorzeichenwechsel von + nach – gibt):

\frac{\partial \Pi_2 }{\partial q_2} = \frac{\partial P(q_1+q_2) }{\partial q_2}\cdot q_2 + P(q_1+q_2) - \frac{\partial C_2 (q_2)}{\partial q_2}=0\cdot

Die Werte von q_2, die diese Gleichung erfüllen, liegen in der Menge der besten Antworten. Nun wird die Gewinnfunktion von Unternehmen 1 betrachtet. Sie wird berechnet, in dem bei der Berechnung des Preises die Beste-Antwort-Funktion von Unternehmen 2 eingesetzt wird.

Der Gewinn von Unternehmen 1 (dem Leader) ergibt sich zu \Pi_1 = P(q_1+q_2(q_1))\cdot q_1 - C_1(q_1), wobei q_2(q_1) den Output von Unternehmen 2 als Funktion (nämlich die Beste Antwort-Funktion von oben) von Unternehmen 1 angibt. Es wird nun der Wert von q_1 gesucht, der \Pi_1 maximiert, gegeben q_2(q_1). Das heißt gegeben die Reaktionsfunktion des Followers (Unternehmen 2), muss der Output gefunden werden, der den Gewinn von Unternehmen 1 maximiert. Also muss das Maximum von \Pi_1 unter q_1 gefunden werden. Leite dazu zunächst \Pi_1 nach q_1 ab:

\frac{\partial \Pi_1}{\partial q_1} = \frac{\partial P(q_1+q_2)}{\partial q_2}\cdot\frac{\partial q_2(q_1)}{\partial q_1}\cdot q_1 + P(q_1+q_2(q_1)) - \frac{\partial C_1 (q_1)}{\partial q_1}.

Nach der hinreichenden Bedingung für eine Extremstelle muss dies 0 ergeben (s.o.):

\frac{\partial \Pi_1}{\partial q_1} = \frac{\partial P(q_1+q_2)}{\partial q_2}\cdot\frac{\partial q_2(q_1)}{\partial q_1}\cdot q_1 + P(q_1+q_2(q_1)) - \frac{\partial C_1 (q_1)}{\partial q_1}=0.

Beispiel[Bearbeiten]

Das folgende Beispiel ist charakteristisch. Es setzt eine lineare Nachfragekurve voraus und stellt einige Bedingungen an die Kostenstrukturen der Einfachheit halber, sodass das Problem gelöst werden kann.

\frac{\partial ^2C_i (q_i)}{\partial q_i \partial q_j}=0,\forall j and \frac{\partial C_i (q_i)}{\partial q_j}=0, j \ne \ i

um die Berechnung zu vereinfachen. Die Kostenstruktur eines Unternehmens ist also unabhängig vom Output des anderen Unternehmen.

Der Gewinn von Unternehmen 2 (Follower) ist:

\Pi_2 = \bigg(a - b(q_1+q_2)\bigg)\cdot q_2 - C_2(q_2).

Das Maximierungsproblem wird wie folgt allgemein gelöst (notwendige Bedingung):

\frac{\partial \bigg(a - b(q_1+q_2)\bigg) }{\partial q_2}\cdot q_2 + a - b(q_1+q_2) - \frac{\partial C_2 (q_2)}{\partial q_2}=0,
\Rightarrow \ - bq_2 + a - b(q_1+q_2) - \frac{\partial C_2 (q_2)}{\partial q_2}=0,
\Rightarrow \ q_2 = \frac{a - bq_1 - \frac{\partial C_2 (q_2)}{\partial q_2}}{2b}.

Betrachten wir das Problem von Unternehmen 1 (Leader):

\Pi_1 = \bigg(a - b(q_1+q_2(q_1))\bigg)\cdot q_1 - C_1(q_1).

Einsetzen der Reaktionsfunktion q_2(q_1) , die wir aus dem Maximierungsproblem von Unternehmen 2 erhalten haben:

\Pi_1 = \bigg(a - b\bigg(q_1+\frac{a - bq_1 - \frac{\partial C_2 (q_2)}{\partial q_2}}{2b}\bigg)\bigg)\cdot q_1 - C_1(q_1),
\Rightarrow \Pi_1 = \bigg(\frac{a - b\cdot q_1 + \frac{\partial C_2 (q_2)}{\partial q_2}}{2})\bigg)\cdot q_1 - C_1(q_1).

Das Maximierungsproblem wird wie folgt allgemein gelöst (notwendige Bedingung):

\frac {\partial \Pi_1}{\partial q_1} = \bigg(\frac{a - 2bq_1 + \frac{\partial C_2 (q_2)}{\partial q_2}}{2}\bigg) - \frac{\partial C_1 (q_1)}{\partial q_1}=0.

Durch Auflösen nach q_1 ergibt q_1^*, die optimale Wahl des Leaders:

q_1^*=\frac{a + \frac{\partial C_2 (q_2)}{\partial q_2}- 2\cdot \frac{\partial C_1 (q_1)}{\partial q_1}}{2b}.

Dies ist die beste Wahl des Leaders unter Antizipation der Antwort des Followers im Gleichgewicht. Die Aktion des Followers kann nun gefunden werden, indem man den Output von Unternehmen 1 in die oben erhaltene Reaktionsfunktion einsetzt:

q_2^* = \frac{a - b\cdot \frac{a + \frac{\partial C_2 (q_2)}{\partial q_2}- 2\cdot \frac{\partial C_1 (q_1)}{\partial q_1}}{2b} - \frac{\partial C_2 (q_2)}{\partial q_2}}{2b},
\Rightarrow q_2^* = \frac{a - 3\cdot \frac{\partial C_2 (q_2)}{\partial q_2}+ 2\cdot \frac{\partial C_1 (q_1)}{\partial q_1}}{4b}.

Die Nash-Gleichgewichte sind alle (q_1^*, q_2^*). Offensichtlich (wenn man die Kosten außen vor lässt) hat der Leader einen großen Vorteil. Wenn das nicht der Fall wäre, könnte er auch einfach die Menge aus dem Cournot-Gleichgewicht wählen. Da er dies nicht tut, obwohl er die Möglichkeit dazu hat, erhält er einen Vorteil durch seine Marktführer-Stellung.

Ökonomische Analyse[Bearbeiten]

Eine Darstellung in Extensiv-Form wird oft benutzt um das Stackelberg-Duopol zu analysieren. Das auch als Entscheidungsbaum bekannte Modell zeigt die Outputkombinationen und Auszahlungen beider Unternehmen im Stackelberg-Spiel.

Das Bild auf der linken Seite zeigt ein Stackelberg-Spiel in Extensivform. Die Auszahlungen stehen dabei rechts. Das Beispiel ist recht einfach. Die Kostenstruktur beinhaltet nur Grenzkosten (es gibt keine Fixen Kosten). Die Nachfragefunktion ist linear und der Betrag ihrer Preiselastizität ist 1. Dennoch zeigt es den Vorteil des Leaders.

Der Follower wählt eine Menge q_2, die seine Auszahlung q_2(5000-q_1-q_2-c_2) maximiert. Indem man dies ableitet und Null setzt (zur Bestimmung des Maximums), erhält man q_2=\frac{5000-q_1-c_2}{2} als den Wert von q_2, der genau dies erfüllt.

Der Leader möchte eine Menge q_1 wählen, die seine Auszahlung q_1(5000-q_1-q_2-c_1) maximiert. Er weiß dabei, dass der Follower im Gleichgewicht das q_2 von oben wählen wird. Also wird der Leader tatsächlich seine Auszahlung q_1(5000-q_1-\frac{5000-q_1-c_2}{2}-c_1) (q_2 als Reaktionsfunktion des Followers wurde eingesetzt) maximieren. Durch Ableiten ergibt sich, dass die maximale Auszahlung sich für q_1=\frac{5000-2c_1+c_2}{2} einstellt. Einsetzen in die Reaktionsfunktion des Follower ergibt q_2=\frac{5000+2c_1-3c_2}{4}. Angenommen die Grenzkosten der beiden Kurven sind identisch (so dass der Leader keinen anderen Vorteil hat außer dem, zuerst am Zug zu sein) und im speziellen c_1=c_2=1000. Der Leader würde 2000 Einheiten produzieren und der Follower 1000. Dies würde dem Leader einen Gewinn von 2 Millionen und dem Follower einen Gewinn von einer Million generieren. Nur dadurch, zuerst am Zug zu sein, hat der Leader einen doppelt so hohen Gewinn wie der Follower erreicht. Im Cournot-Wettbewerb wären die Gewinne bei etwa 1.78 Millionen jeweils, das heißt im Vergleich dazu hat der Leader verhältnismäßig wenig gewonnen, der Follower dafür relativ viel verloren. Dies ist jedoch nicht allgemein der Fall. Es kann auch Fälle geben, in denen der Leader verhältnismäßig viel im Vergleich zum Cournot-Wettbewerb dazu gewinnt, die an Monopol-Gewinne heranreichen (zum Beispiel, wenn der Leader zusätzlich noch einen großen Vorteil in der Kostenstruktur hat, etwa durch eine bessere Produktionsfunktion). Ebenso kann es der Fall sein, dass der Follower sogar einen höheren Gewinn als der Leader erzielt, aber nur wenn er sehr viel niedrigere Kosten hat.

Unglaubwürdige Drohungen des Followers[Bearbeiten]

Wenn nach der Wahl der Gleichgewichtsmenge durch den Leader der Follower vom Gleichgewicht abweichen würde und eine nicht-optimale Menge wählen würde, würde es nicht nur ihm selbst schaden, sondern auch dem Leader. Würde der Follower eine weitaus größere Menge als seine beste Antwort wählen, so würde der Marktpreis sinken und der Gewinn des Leaders würde erheblich sinken, möglicherweise unter den Gewinn, der im Cournot-Wettbewerb erzielbar wäre. In diesem Fall könnte der Follower dem Leader vor dem Start des Spiels bekanntgeben, dass es für den Fall, dass der Leader nicht die Cournot-Menge wählt, vom Gleichgewicht abweichen wird, sodass der Gewinn des Leaders erhebliche Einbußen erleidet. Grund für die Überlegung ist die Tatsache, dass die Menge, die vom Leader im Gleichgewicht gewählt wird, nur dann optimal ist, wenn der Follower ebenso die Gleichgewichtsmenge wählt. Der Leader ist jedoch in keiner Gefahr. Sobald er seine Gleichgewichtsmenge gewählt hat, ist es irrational für den Follower abzuweichen; denn ein Abweichen würde seine Auszahlung verringern, die dieser ja gerade zu maximieren versucht. Sobald der Leader gewählt hat, ist der Follower gut beraten, den Gleichgewichtspfad zu wählen. Deshalb wäre eine solche Drohung, wie oben vom Follower ausgesprochen, unglaubwürdig (siehe auch Teilspielperfektes Gleichgewicht).

In einem (unendlich oft) wiederholten Stackelberg-Spiel jedoch würde der Follower möglicherweise eine Bestrafungsstrategie(Tit for Tat) spielen, die den Leader in der jeweiligen Periode für das Spielen des Stackelberg-Gleichgewichts bestraft. Diese Drohung ist glaubwürdig, da es für den Marktfolger rational ist, seine Drohung nicht leer aussehen zu lassen, um den Leader dazu zu bringen, in den kommenden Perioden die Menge aus dem Cournot-Gleichgewicht zu spielen.

Stackelberg im Vergleich mit Cournot[Bearbeiten]

Das Stackelberg-Modell und das Cournot-Modell sind einander ähnlich, da in beiden Fällen in Mengeneinheiten konkurriert wird. Jedoch gibt der erste Zug dem Leader einen entscheidenden Vorteil. Die Annahme der Existenz von perfekter Information im Stackelberg-Duopol ist essentiell: Der Follower muss die vom Leader gewählte Menge beobachten, sonst ist das Cournot-Modell anzuwenden. Bei imperfekter Information können die oben beschriebenen Drohungen glaubhaft sein. Wenn der Stackelberg-Folger die Wahl des Leaders nicht beobachten kann, ist es nicht mehr länger irrational für ihn zum Beispiel diejenige Menge zu wählen, die er im Cournot-Modell spielen würde (was hier tatsächlich ein Gleichgewicht darstellt). Jedoch muss imperfekte Information dahingehend existieren, dass der Follower nicht in der Lage ist, die Aktion des Leaders zu verfolgen, denn es wäre irrational für den Follower, dies nicht zu tun, wenn er dazu in der Lage wäre: Um eine optimale Entscheidung zu treffen, wird er den Leader beobachten. Jede Drohung des Followers dahingehend, die Aktion des Leaders nicht zu beobachten, obwohl er dazu in der Lage wäre, ist daher ebenso unglaubwürdig wie die anderen bisher beschriebenen. Dies ist ein Beispiel dafür, dass das Vorhandensein von Information einem Spieler schaden kann. Im Cournot-Wettbewerb ist es die Simultanität des Spiels, die darin resultiert, dass kein Spieler c.p. im Nachteil ist.

Spieltheoretische Überlegungen[Bearbeiten]

Wie bereits erwähnt, führt imperfekte Information dazu, dass Cournot-Wettbewerb herrscht. Im Stackelberg-Duopol sind dennoch einige Cournot-Gleichgewichte als Nash-Gleichgewichte erhalten geblieben, die allerdings als unglaubwürdige Drohungen (wie oben beschrieben) identifiziert werden können, indem man das Lösungskonzept der Teilspielperfektheit anwendet. Es stellt sich heraus, dass genau der Grund, der dafür sorgt, dass das Cournot-Gleichgewicht ein Nash-Gleichgewicht im Stackelberg-Spiel ist, dafür verantwortlich ist, dass es nicht teilspielperfekt ist.

Betrachten wir ein Stackelberg-Spiel (also eines, das die oben beschriebenen Bedingungen zur Existenz eines Stackelberg-Gleichgewichts erfüllt), in dem aus irgendeinem Grund der Leader glaubt, dass der Follower die Cournot-Menge wählen wird, egal welche Aktion er selbst wählt. (Vielleicht glaubt der Leader, der Follower sei irrational.) Wenn der Leader die Menge aus dem Stackelberg-Gleichgewicht spielt, so glaubt er, würde der Follower mit der Menge aus dem Cournot-Gleichgewicht reagieren. Deshalb ist es nicht optimal für den Leader, die Stackelberg-Menge zu spielen. Tatsächlich besteht seine beste Antwort (nach der Definition des Cournot-Gleichgewichts) darin, die Cournot-Menge zu wählen. Sobald er das getan hat, ist es die beste Antwort des Followers, ebenfalls die Cournot-Menge zu spielen.

Betrachten wir also die folgende Strategiekombination:

Der Leader spielt die Cournot-Menge. Der Follower spielt die Cournot-Menge, egal was der Leader spielt.

Diese Strategiekonfiguration ist ein Nash-Gleichgewicht, da jeder der Spieler, gegeben die Strategie des anderen Spielers, optimal reagiert. Die Cournot-Menge zu wählen, wäre allerdings nicht optimal für den Leader, wenn der Follower auf die Stackelberg-Menge ebenfalls mit der Stackelberg-Menge reagieren würde. In diesem Fall bestünde nämlich die beste Antwort des Leaders darin, die Stackelberg-Menge zu wählen. Was diese Strategiekombination zu einem Nash-Gleichgewicht macht, ist also die Tatsache, dass der Follower nicht die Stackelberg-Menge wählt, falls der Leader dies tut.

Gerade diese Tatsache bedeutet jedoch, dass diese Strategiekombination kein Nash-Gleichgewicht des Teilspiels ist, das an der Stelle startet, an der der Leader bereits die Stackelberg-Menge gewählt hat. (Dieses Teilspiel liegt außerhalb des Gleichgewichtspfades.) Sobald der Leader die Stackelberg-Menge gewählt hat, ist es die beste Antwort des Followers, ebenfalls die Stackelberg-Menge zu wählen (und damit ist es die einzige Aktion, die ein Nash-Gleichgewicht in diesem Teilspiel erzeugt). Damit ist diese Strategiekombination, die im Cournot-Gleichgewicht resultiert, nicht teilspielperfekt.

Vergleich mit anderen Oligopol-Modellen[Bearbeiten]

Im Vergleich mit anderen Oligopol-Modellen gilt im Gleichgewicht:

  • Der Gesamtoutput ist im Stackelberg-Duopol größer als im Cournot-Duopol, aber geringer als im Bertrand-Wettbewerb
  • Der Preis ist im Stackelberg-Duopol geringer als im Cournot-Duopol, aber größer als im Bertrand-Wettbewerb
  • Die Konsumentenrente ist im Stackelberg-Duopol größer als im Cournot-Duopol, aber geringer als im Bertrand-Wettbewerb
  • Der Gesamtoutput ist im Stackelberg-Duopol größer als im Monopol oder Kartell, aber geringer als im perfekten Wettbewerb
  • Der Preis ist im Stackelberg-Duopol geringer als im Monopol oder Kartell, aber größer als im perfekten Wettbewerb.

Diese Ergebnisse sind als Mustervoraussagen zu sehen, deren Eintreffen im Einzelfall von der Art der Kostenfunktionen und der Marktgröße abhängt (vgl. hierzu z.B. Steckelbach (2002)).

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

  • D. Fudenberg und J. Tirole: Game Theory. MIT Press, 1993 (besonders Chapter 3, sect 1)
  • R. Gibbons: A primer in game theory. Harvester-Wheatsheaf, 1992 (besonders Chapter 2, section 1B)
  • M. J. Osborne und A. Rubenstein: A Course in Game Theory. MIT Press, 1994 (besonders S. 97-98)
  • L. Steckelbach: Wirkungen wettbewerbspolitischer Regulierungen auf oligopolistischen Märkten. Hamburg 2002
  • J. Tirole: The Theory of Industrial Organization. Cambridge, 1988