Trembling-hand-perfektes Gleichgewicht

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Reinhard Selten, 2001

Beim Trembling-hand-perfekten Gleichgewicht handelt es sich um eine Möglichkeit der Selektion von Nash-Gleichgewichten. Entwickelt wurde es von Reinhard Selten, der die Idee 1975 unter dem Namen "A Model of Slight Mistakes" im "International Journal of Game Theorie" veröffentlichte. Hierbei geht es darum festzustellen, wie anfällig ein Gleichgewicht gegenüber Fehlern eines Spielers ist. Nach Selten gibt es keine Fehler, wenn die Spieler absolut rational handeln. In der Realität muss man allerdings mit falschen Entscheidungen des Gegenspielers rechnen. Um dies spieltheoretisch darzustellen, wurde das Trembling-hand-perfekte Gleichgewicht eintwickelt.[1]

Einfache Darstellung des Ansatzes[Bearbeiten]

Einfach ausgedrückt bedeutet die Idee des trembling-hand-perfekten Gleichgewichts: Angenommen Spieler A geht davon aus, dass Spieler B immer die Strategie \begin{align} b_1 \end{align} spielt und die beste Antwort von Spieler A auf \begin{align} b_1 \end{align} ist seine Strategie \begin{align} a_1 \end{align}. Ist dann immer Strategie \begin{align} a_1 \end{align} zu spielen auch dann noch die Optimale Wahl, wenn Spieler B aus Versehen, sprich mit einer geringen Fehlerwahrscheinlichkeit von (\epsilon), \begin{align} b_2 \end{align} spielt? Wenn unter diesen Umständen \begin{align} a_1 \end{align} noch immer die beste Strategie von Spieler A ist, so handelt es sich um eine Trembling-hand-perfekte Strategie.

Trembling-hand-perfektes Gleichgewicht in Normalformspielen[Bearbeiten]

Durch das folgende Normalformspiel, wird der Ansatz des Trembling-hand-perfekten Gleichgewichts anhand folgender Auszahlungsmatrix sehr einfach verdeutlicht:

Spieler A/Spieler B (\begin{align} b_1 \end{align}) (\begin{align} b_2 \end{align})
(\begin{align} a_1 \end{align}) (3, 3) (5, 0)
(\begin{align} a_2 \end{align}) (-2, -2) (5, 0)

Die beiden Nash-Gleichgewichte sind in diesem Beispiel bei \begin{align} (a_1,b_1) \end{align} und \begin{align} (a_2,b_2) \end{align}. Nun soll ermittelt werden, ob eines der beiden Gleichgewichte (oder auch beide), Trembling-hand-perfekte Gleichgewichte sind. Angenommen Spieler A möchte seine Strategie \begin{align} a_1 \end{align} spielen und geht davon aus, dass Spieler B seine Strategie \begin{align} b_1 \end{align} spielen wird, da beide dann eine Auszahlung von 3 bekämen. Spieler A ist sich allerdings nicht vollkommen sicher, ob Spieler B nicht doch mit einer geringen Fehlerwahrscheinlichkeit seine Strategie \begin{align} b_2 \end{align} spielt. Um herauszufinden, ob \begin{align} a_1 \end{align} trotz dieser Fehlerwahrscheinlichkeit von Spieler 2 noch immer die beste Wahl von Spieler 1 und somit Trembling-hand-perfekt ist, muss folgendes überprüft werden: Die erwartete Auszahlung von Spieler 1 wenn er \begin{align} a_1 \end{align} wählt muss mindestens so groß sein, wie die erwartete Auszahlung für die Wahl von \begin{align} a_2 \end{align}.

(\epsilon) sei die Fehlerwahrscheinlichkeit von Spieler B, die als sehr klein angenommen wird. Das heißt (1-\epsilon) ist die damit verbundene Gegenwahrscheinlichkeit. Mit 0<(\epsilon)<1

Die erwartete Auszahlung von Spieler 1 für die Wahl von \begin{align} a_1 \end{align} ist also:

\Epsilon[u(a_1)] = (1-\epsilon)[u(a_1,b_1)]  +  (\epsilon)[u(a_1,b_2)]
= (1-\epsilon)\cdot3 + (\epsilon)\cdot5

Im Vergleich dazu die erwartete Auszahlung der Strategie \begin{align} a2 \end{align}:

\Epsilon[u(a_2)] = (1-\epsilon)[u(a_2,b_1)]  +  (\epsilon)[u(a_2,b_2)]
= (1-\epsilon)\cdot(-2) + (\epsilon)\cdot5

Es ist unschwer zu erkennen, dass:

(1-\epsilon)\cdot3 + (\epsilon)\cdot5 > (1-\epsilon)\cdot(-2) + (\epsilon)\cdot5

Auch wenn Spieler B mit einer geringen Fehlerwahrscheinlichkeit \begin{align} b_2 \end{align} spielt, ist \begin{align} a_1 \end{align} für Spieler A die bestmögliche Wahl. Also ist die Strategie \begin{align} a_1 \end{align} Trembling-hand-perfekt. Ein Trembling-hand-perfektes Gleichgewicht besteht allerdings aus einer Kombination zweier Trembling-hand-perfekten Strategien. Um also zu prüfen, ob es sich bei der Strategiekombination \begin{align} (a_1,b_1) \end{align} um ein Solches handelt, muss auch \begin{align} b_1 \end{align} von Spieler 2 getestet werden. Analog zur Strategie \begin{align} a_1 \end{align} sieht dies folgendermaßen aus:

Die erwartete Auszahlung von Spieler 2 für die Wahl von \begin{align} b_1 \end{align} beträgt:

\Epsilon[u(b_1)] = (1-\epsilon)[u(a_1,b_1)]  +  (\epsilon)[u(a_2,b_1)]
= (1-\epsilon)\cdot3 + (\epsilon)\cdot(-2)

Im Vergleich dazu die erwartete Auszahlung der Strategie \begin{align} b_2 \end{align}:

\Epsilon[u(b_2)] = (1-\epsilon)[u(a_1,b_2)]  +  (\epsilon)[u(a_2,b_2)]
= (1-\epsilon)\cdot0 + (\epsilon)\cdot0

Und wiederum ist eindeutig zu erkennen, dass:

0  <  (1-\epsilon)\cdot3 + (\epsilon)\cdot(-2) = 3-(5\cdot\epsilon)

Damit ist auch die Strategie \begin{align} b_1 \end{align} Trembling-hand-perfekt und es handelt sich beim Nash-Gleichgewicht \begin{align} (a_1,b_1) \end{align} um ein Trembling-hand-perfektes Gleichgewicht.[2]

Formale Definition mithilfe eines perturbierten Spiels[Bearbeiten]

Einfache Definition eines perturbierten Spiels[Bearbeiten]

Ein perturbiertes Spiel, ist eine Kopie des zugrundeliegenden Spiels, mit der Einschränkung, dass jeder Spieler alle reinen Strategien mit einer positiven Wahrscheinlichkeit spielen muss. Das heißt im normalen Spiel ist es Spieler A möglich seine Strategien 0\le\epsilon_a\le1 zu spielen. Im perturbierten Spiel muss \epsilon > 0 sein.

Formale Definition[Bearbeiten]

Ausgangspunkt sei ein Spiel in strategischer Form:

\begin{align} G=(I,(M_i), (P_i)) \end{align}, und \begin{align} (i \in I) \end{align}

Wobei \begin{align} I \end{align} die Menge der Spieler darstellt, \begin{align} M_i \end{align} das Set an gemischten Strategien ist, welches auf der möglichen Verteilung der reinen Strategien \begin{align} S_i \end{align} basiert und es sich bei \begin{align} P_i \end{align} um die erwartete Auszahlung von Spieler \begin{align} i \end{align} handelt. Die Zentrale Idee, um mögliche Fehler der Spieler abzubilden, ist es anzunehmen, dass keine reine Strategie mit einer Wahrscheinlichkeit von null gespielt werden kann. In einem solchen perturbierten Spiel gilt:

Für jeden Spieler \begin{align} (i \in I) \end{align} mit \begin{align} n_i \end{align} reinen Strategien, ist \begin{align} \epsilon_i = (\epsilon_i^1, \epsilon_i^2,...,\epsilon_i^n) \end{align} die Menge an positiven Wahrscheinlichkeiten, für die gilt:
\begin{align} \epsilon_i \gg 0 \end{align} und  \sum\nolimits_{j=1}^{n_i} \epsilon_i^j < 1 .

Die Menge an gemischten Strategien im perturbierten Spiel ist also:

\begin{align} M_i^\epsilon = (m_i \in {M_i}|m_i^k \ge \epsilon_i^k) \end{align}, für \begin{align} k = (1...n_i) \end{align}.

Das heißt, dass Spieler \begin{align} i \end{align}, \begin{align} (i \in I) \end{align}, jede seiner reinen Strategien der Anzahl \begin{align} k \end{align}, mindestens mit der Wahrscheinlichkeit \begin{align} \epsilon_i^k \end{align} spielen muss. Daraus folgt das perturbierte Spiel:

\begin{align} G(\epsilon) = (I,(M_i^\epsilon), (P_i)) \end{align}, und \begin{align} (i \in I) \end{align}

Ein Nash-Gleichgewicht im perturbierten Spiel sei \begin{align} m^* (\epsilon) \end{align} und ein Nash-Gleichgewicht im Ausgangsspiel sei: \begin{align} m^* \end{align}. Wenn man die Fehlerwahrscheinlichkeit \begin{align} \epsilon  \end{align} im perturbierten Spiel gegen null gehen lässt und dadurch das Gleichgewicht des perturbierten Spiels zum Gleichen wird wie im normalen Spiel, spricht man von einem trembling-hand-perfekten Gleichgewicht. Formal ausgedrückt heißt das, wenn

\begin{align} \lim_{\epsilon \to 0}m^*(\epsilon) = m^* \end{align},

handelt es sich um ein trembling-hand-perfektes Gleichgewicht.[3]

Beispiel[Bearbeiten]

Als Ausgangsspiel wird ein Normalformspiel mit folgender Auszahlungsmatrix betrachtet:

Spieler A/Spieler B (\begin{align} b_1 \end{align}) (\begin{align} b_2 \end{align})
(\begin{align} a_1 \end{align}) (3, 3) (0, 0)
(\begin{align} a_2 \end{align}) (0, 0) (0, 0)

Im normalen Spiel gibt es zwei Nash-Gleichgewichte, die sich aus den Strategiekombinationen \begin{align} (a_1/b_1) \end{align} und \begin{align} (a_2/b_2) \end{align} ergeben. Es kommt für die beiden Spieler bei der Wahl ihrer jeweils besten Antwort darauf an, welche Strategie der jeweilige Gegenspieler wählt.

Im perturbierten Spiel ist dies nicht der Fall. Denn wenn es auch nur eine winzige Wahrscheinlichkeit gibt, dass Spieler B seine Strategie \begin{align} b_1 \end{align} wählt, dann ist die beste Antwort von Spieler A darauf \begin{align} a_1 = 1 \end{align} zu spielen. Da diese Wahrscheinlichkeit im perturbierten Spiel per Definition existiert, würde Spieler A immer \begin{align} a_1 = 1 \end{align} spielen. Aber auch Spieler A muss im perturbierten Spiel seine Strategie \begin{align} a_2 \end{align} mit einer positiven Wahrscheinlichkeit spielen. Deshalb ist seine beste Antwort, die gemischte Strategie \begin{align} a_2 = a_2^{min} \end{align}zu spielen - also die kleinstmögliche Wahrscheinlichkeit für \begin{align} a_2 \end{align}.

Aufgrund der Symmetrie des Spiels ist die beste Strategie für Spieler B dementsprechend: \begin{align} b_2 = b_2^{min} \end{align}

Das Gleichgewicht im perturbierten Spiel ist also:

\begin{align} (1-a_2^{min},a_2^{min}) , (1-b_2^{min},b_2^{min}) \end{align}

Wenn man jetzt \begin{align} a_2^{min} \end{align} und \begin{align} b_2^{min} \end{align} gegen \begin{align} 0 \end{align} gehen lässt, dann wird aus dem perturbierten Spiel fast wieder das Normale, denn:

\lim_{a_2^{min},b_2^{min} \to 0}[(1-a_2^{min},a_2^{min}),(1-b_2^{min},b_2^{min})] = [(1,0),(1,0)] = (a_1,b_1)

Wenn man die Fehlerwahrscheinlichkeit gegen Null gehen lässt und sich das Gleichgewicht des perturbierten Spiels dadurch auf ein Nash-Gleichgewicht des zugrundeliegenden Spiels zubewegt, dann handelt es sich bei diesem Gleichgewicht um ein Trembling-hand-perfektes.

In diesem Beispiel bewegt sich das perturbierte Spiel gegen das Gleichgewicht \begin{align} (a_1/b_1) \end{align} und ist somit Trembling-hand-perfekt.

\begin{align} (1-a_2^{min},a_2^{min}) , (1-b_2^{min},b_2^{min}) \end{align}[4]

Trembling-hand-perfektes Gleichgewicht in Sequentiellen Spielen[Bearbeiten]

Auch für Sequentielle Spiele ist das Konzept des Trembling-hand-perfekten Gleichgewichtes anwendbar. Ähnlich wie bei den Normalformspielen, ist es hierbei für die Selektion von Teilspielperfekten Gleichgewichten von Nutzen, um festzustellen, ob ein solches Gleichgewicht auch bei einer geringen Fehlerwahrscheinlichkeit bestehen bleibt.

Beispiel[Bearbeiten]

Spielbaum eines Extensivformspiels zweier Spieler

Im auf der rechten Seite gibt es vier Teilspielperfekte Gleichgewichte:

\begin{align} (A, (X|A, X|B)) \end{align}, also Spieler 1 spielt seine Strategie \begin{align} A \end{align} und Spieler 2 spielt \begin{align} X \end{align}, für den Fall, das Spieler 1 \begin{align} A \end{align} gewählt hat und auch \begin{align} X \end{align} für den Fall, dass Spieler 1 \begin{align} B \end{align} gewählt hat. \begin{align} (A, (Y|A, X|B)) , (B, (X|A, X|B)) , (B, (Y|A, X|B)) \end{align} sind die anderen drei Teilspielperfekten Gleichgewichte.
Allerdings sind nur die beiden Gleichgewichte, in denen Spieler 1 seine Strategie \begin{align} A \end{align} wählt Trembling-hand-perfekt. Denn auch wenn es nur eine winzige Wahrscheinlichkeit gibt, dass Spieler 2 seine Strategie \begin{align} Y \end{align} spielt, ist es für Spieler 1 besser immer \begin{align} A \end{align} zu spielen, da er hier immer eine Auszahlung von 2 bekommt und er sich durch die Strategie \begin{align} B \end{align} nie besser stellen kann, als durch die Strategie \begin{align} A \end{align}.
Die beiden Trembling-hand-perfekten Gleichgewichte sind also: \begin{align} (A, (X|A, X|B)) , (A, (Y|A, X|B)) \end{align}.[5]

Trembling-hand-perfektes Gleichgewicht in extensiven Spielen mit der Agentennormalform[Bearbeiten]

Elon Kohlbergs Dalekspiel in extensiver Form

Das vom Spieltheoretiker Elon Kohlberg entwickelte, und hier leicht abgewandelte Dalekspiel, ist ein Beispiel für eine weitere Anwendung des Trembling-hand-perfekten Gleichgewichtes. Die 1953 von Harold W. Kuhn entwickelte Agentennormalform wird angewendet, um den Informationsverlust bei einer Reduktion eines Extensivspiels auf die Normalform, auszugleichen. Wie im Dalekspiel auf der rechten Seite zu sehen, wird Spieler 1 in zwei Agenten aufgeteilt, um an jedem Entscheidungsknoten unkorrelierte Entscheidungen mathematisch abbilden zu können.[6]

Spieler 1/Spieler 2 (L) (R)
(gl) (2, 5) (2, 5)
(gr) (2, 5) (2, 5)
(ul) (4, 1) (0, 0)
(ur) (0, 0) (1, 4)

In der Normalform kann man sehr leicht erkennen, dass es drei Nash-Gleichgewichte in reinen Strategien gibt: \begin{align} (gl, R) ,  (gr, R) ,  (ul, L) \end{align} . Um diese Gleichgewichte nun auf ihre Trembling-hand-Perfektheit zu untersuchen, muss man sicherstellen, dass die Fehlerwahrscheinlichkeiten, die Spieler 1 an seinen beiden Entscheidungsknoten hat, nicht miteinander korrelieren. Das heißt, dass ein Fehler am ersten Entscheidungsknoten nicht dazu führen darf, dass die Wahrscheinlichkeit für einen weiteren Fehler steigt oder sinkt. Um dies sicherzustellen, wird Spieler 1 wie bereits oben beschrieben in zwei Agenten aufgeteilt, die unabhängig voneinander ihre Entscheidungen treffen.

Nun nehmen wir an, dass der erste Agent (Sp1A) mit einer geringen Wahrscheinlichkeit von \epsilon einen Fehler begeht und \begin{align} u \end{align} anstatt von \begin{align} g \end{align} spielt.
Dementsprechend begeht der zweite Agent (Sp1B) mit der Wahrscheinlichkeit von \begin{align} \delta \end{align} einen Fehler und spielt \begin{align} l \end{align} anstatt von \begin{align} r \end{align}.
Spieler 2 begeht schließlich mit einer Wahrscheinlichkeit von \begin{align} \lambda \end{align} einen Fehler und spielt \begin{align} L \end{align} anstatt von \begin{align} R \end{align}.

Mit den Eingetragenen Wahrscheinlichkeiten sieht die Normalform von oben wie folgt aus:

Spieler 1/Spieler 2 (L) (R) Wahrscheinlichkeit
(gl) (2, 5) (2, 5) (1-\epsilon)\cdot\delta
(gr) (2, 5) (2, 5) (1-\epsilon)\cdot(1-\delta)
(ul) (4, 1) (0, 0) \epsilon\cdot\delta
(ur) (0, 0) (1, 4) \epsilon\cdot(1-\delta)
Wahrscheinlichkeit \begin{align} \lambda \end{align} \begin{align} (1-\lambda) \end{align}

Nun kann man leicht erkennen, dass die Strategien \begin{align} (gr) \end{align} und \begin{align} (gl) \end{align} für Spieler 1 für kleine \begin{align} \lambda \end{align} Trembling-hand-perfekte Strategien sind. Denn er erhält eine sichere Auszahlung von 2 egal wie sich Spieler 2 entscheidet. Bei der einzigen besseren Auszahlung von 4 bei der Wahl von \begin{align} (ul) \end{align} erhält er aufgrund der Wahrscheinlichkeiten im Erwartungswert die Auszahlung:

\begin{align} \Epsilon[u(ul)] = (1-\lambda)\cdot0  +  (\lambda)\cdot4 \end{align} und für \begin{align} \lambda > 0,5 \end{align} ist dieser Erwartungswert schlechter als bei \begin{align} (gr) \end{align} und \begin{align} (gl) \end{align}.
Auch für Spieler 2 ist die Strategie \begin{align} (R) \end{align} Trembling-hand-perfekt, weil die einzige Strategiekombination, bei der Spieler 2 eine größere Auszahlung für \begin{align} (L) \end{align} als für \begin{align} (R) \end{align} bekommt ist \begin{align} (ul, L) \end{align} im Gegensatz zu \begin{align} (ul, R) \end{align}. Da \begin{align} (ul) \end{align} aber nur eintritt, wenn beide Agenten von Spieler 1 einen Fehler machen, hat \begin{align} (ul) \end{align} die geringste Wahrscheinlichkeit (\epsilon\cdot\delta).
Damit sind die beiden Gleichgewichte \begin{align} (gr, R) \end{align} und \begin{align} (gl, R) \end{align} Trembling-hand-perfekt. Das Gleichgewicht \begin{align} (ul, L) \end{align} ist es nicht, weil die Strategie \begin{align} (ul) \end{align}, wie gerade gezeigt keine Trembling-hand-perfekte Strategie ist.[7][8]

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

  •  Reinhard Selten: A reexamination of the perfectness concept for equilibrium points in extensive games, in: International Journal of Game Theorie. Physica-Verlag, Vienna 1975, S. 25 - 55.
  •  Harold William Kuhn: Extensive Games and the Problem of Informations, in: Contribution to the Theorie of Games, Vol. 2. Princeton Univ. Press, Princeton 1953, S. 193 - 216.
  •  Elon Kohlberg, Jean-Francois Mertens: On the Strategic Stability of Equilibria. Econometrica, 1986, S. 1003 - 1037.
  •  Robert Gibbons: A Primer in Game Theory. Financial Times, Harlow 1992.
  •  Thomas Riechmann: Spieltheorie. 3 Auflage. Vahlen, München 2010.
  •  Christian Rieck: Spieltheorie. 8 Auflage. Rieck, Eschborn 2008.
  •  Alexander Mehlmann: Strategische Spiele für Einsteiger. Friedr. Vieweg & Sohn Verlag, Wiesbaden 2007.
  •  Ken Binmore: Fun and Games. 1 Auflage. Heath, Lexington 1992.
  •  Jürgen Eichberger: Game Theorie for Economists. 1 Auflage. Emerald, Bingley 2007.

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1.  Reinhard Selten: A reexamination of the perfectness concept for equilibrium points in extensive games, in: International Journal of Game Theorie. Physica-Verlag, Vienna 1975, S. 25 - 55. S.35
  2.  Thomas Riechmann: Spieltheorie. 3 Auflage. Vahlen, München 2010. S.38-40
  3.  Jürgen Eichberger: Game Theorie for Economists. 1 Auflage. Emerald, Bingley 2007. S.111 - 113
  4.  Thomas Riechmann: Spieltheorie. 3 Auflage. Vahlen, München 2010. S.94 - 95
  5.  Thomas Riechmann: Spieltheorie. 3 Auflage. Vahlen, München 2010. S.53
  6.  Harold William Kuhn: Extensive Games and the Problem of Informations, in: Contribution to the Theorie of Games, Vol. 2. Princeton Univ. Press, Princeton 1953, S. 193 - 216.
  7.  Alexander Mehlmann: Strategische Spiele für Einsteiger. Friedr. Vieweg & Sohn Verlag, Wießbaden 2007. S.88 - 92
  8.  Ken Binmore: Fun and Games. 1 Auflage. Heath, Lexington 1992. S.454 - 462