Rationalisierbarkeit

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

In der Spieltheorie ist Rationalisierbarkeit ein Lösungskonzept, welches das Nash-Gleichgewicht generalisiert. Rationalisierbarkeit basiert auf der iterierten Eliminierung derjenigen Strategien, die niemals beste Antworten sind. Strategien, die den Prozess der Eliminierung überleben, heißen rationalisierbar. Zu Grunde liegende Annahmen über Verhalten der Spieler sind Kenntnis über die Spielstruktur und das gemeinsame Wissen von Rationalität. Das Konzept der Rationalisierbarkeit wurde zuerst unabhängig von Bernheim (1984) und von Pearce (1984) formuliert und von Aumann (1987) sowie von Brandenburger und Dekel (1987) verwendet.

Forschung und die zentralen Ergebnisse[Bearbeiten]

Bernheim (1984) und Pearce (1984) sind der Frage nachgegangen, welche Restriktionen den individuellen Erwartungen an das Verhalten von Spielern allein durch die Forderung nach Rationalität auferlegt werden. Sie untersuchen, welche Strategien rationalisierbar sind, wenn die Spieler über ein gemeinsames Wissen der Spielstruktur sowie über die Tatsache, dass alle Spieler rational sind, verfügen. Die Restriktionen an das Verhalten der Spieler besteht darin, das jedes Verhalten mit diesem gemeinsamen Wissen konsistent sein muss. Die zentralen Ergebnisse in Bezug auf rationalisierbare Strategien sind:

  1. Eine Strategie ist rationalisierbar, wenn sie beste Antwort in Bezug auf eine andere rationalisierbare Strategie ist. Daraus folgt:
  2. Jede Strategie, die ein Bestandteil des Nash-Gleichgewichts darstellt, ist demnach rationalisierbar. [1]

Wichtige Definitionen[Bearbeiten]

Die folgenden Begriffe sind eng mit der Definition der Rationalisierbarkeit verbunden.

Erwartung (belief)
Für Spieler i ist seine Erwartung hinsichtlich der Strategiewahl der Mitspieler \textstyle\sigma_{-i} eine Wahrscheinlichkeitsverteilung \textstyle\sigma_{-i}\in\prod_{j\not=i}\sum\nolimits_j, wobei S_{j} die Strategiemenge für einen beliebigen Mitspieler j ist und \textstyle\sum\nolimits_j die Menge der Wahrscheinlichkeitsverteilungen über S_{j}. In dieser Definition erwartet Spieler i, dass alle Mitspieler unabhängig voneinander verhalten (independent mixing).
Rationaler Spieler
Ein rationaler Spieler spielt nur Strategie \textstyle\sigma_{i}, wenn es eine mögliche Erwartung \textstyle\sigma_{-i} hinsichtlich der Strategiewahl der Mitspieler gibt, für die \textstyle\sigma_i die beste Antwort ist. Die Annahme, dass sich Spieler i rational verhält, sagt allerdings nichts darüber, ob die Strategiewahl seines Mitspielers j auch rational ist. (Schließlich kann ein irrationaler Mitspieler alles spielen.)
Beste Antwort
Eine Strategie \textstyle \sigma_{i}\in \sum\nolimits_i des Spielers i heißt eine beste Antwort auf \textstyle \sigma_{-i}, wenn  \textstyle u_i (\sigma_i,\sigma_{-i})\geq u_i (\sigma_i^{'},\sigma_{-i}) für alle \textstyle \sigma_i^{'}\in \sum\nolimits_i.

Unter gemeinsamem Wissen der Rationalität wird verstanden, dass:

  1. alle Spieler als vollständig rational angesehen werden; und
  2. die allgemeine Rationalität sogenanntes "gemeinsames Wissen" ist, bei dem jeder weiß, dass jeder weiß, dass alle rational

handeln ... Das heißt, dass die Erwartung \textstyle\sigma_{-i} auch rational sein muss.

Man beachte, dass die Strategienwahl der Spieler unterschiedlich sein kann bei der An- und Abwesenheit der Rationalität als gemeinsames Wissen.

Beispiel[Bearbeiten]

Das folgende Beispiel ist dem Aufsatz von Bernheim (1984) entnommen.[2]

Spieler 2
b_1 b_2 b_3 b_4
Spieler 1 a_1 0, 7 2, 5 7, 0 0, 1
a_2 5, 2 3 , 3 5, 2 0, 1
a_3 7, 0 2, 5 0, 7 0, 1
a_4 0, 0 0,- 2 0, 0 10, -1
Bei Anwesenheit der Rationalität als gemeinsames Wissen
In diesem Fall wird Spieler 2 niemals die Strategie b_4 wählen, denn sie ist für keine Strategie des Spielers 1 die beste Antwort. Dann aber ist es für den Spieler 1 nie vorteilhaft, a_4 zu spielen, da diese Strategie nur in Bezug auf b_4 für 1 profitabel ist. Strategien b_4 und a_4 sind somit nicht zu rationalisieren. Betrachtet man die verbleibenden Strategien, dann ist festzustellen, dass sie rationalisierbar sind: während Strategien a_1, b_3, a_3, b_1 einen Zyklus von besten Antworten bilden, stellt a_2 und b_2 wechselseitig eine beste Antwort dar.
Bei Abwesenheit des gemeinsamen Wissens der Rationalität
Spieler 1 muss damit rechnen, dass Spieler 2 b_4 spielen wird, in diesem Fall ist a_4 die beste Antwort und somit rational.

Rationalisierbarkeit und rationalisierbare Strategie[Bearbeiten]

Rationalisierbarkeit ist definiert über eine Rekursion, in welcher Strategien, welche niemals beste Antwort sind, iterativ eliminiert werden. Ist das Spiel rationalisierbar, endet die Rekursion in einer nicht leeren Menge von Strategien, welche beste Antworten gegenüber mindestens einer anderen Strategie in dieser Menge darstellen.

Gegeben sei ein Normalformspiel; mathematisch wird Rationalisierbarkeit durch die folgende Rekursion definiert:

Setze \textstyle \widetilde{\sum\nolimits_i^0}\equiv\sum\nolimits_i. Für jedes i und für jedes n\geq 1,

\textstyle \widetilde{\sum\nolimits_i^n} = \Bigl\lbrace \sigma_i\in  \widetilde{\sum\nolimits_{i}^{n-1}} |  \exist \sigma_{-i}\in\prod_{j\not=i}\operatorname{conv}  (\textstyle \widetilde{\sum\nolimits_{j}^{n-1}}) so dass  u_i (\sigma_i,\sigma_{-i})\geq u_i (\sigma_i^{'},\sigma_{-i}) für alle \sigma_i^{'}\in\textstyle\widetilde{{\sum\nolimits_i^{n-1}}}\Bigr\rbrace . [3]

Die rationalisierbare Strategien für Spieler i sind:

R_i= \bigcap\nolimits_{n=0}^\infty\widetilde{\sum\nolimits_i^n}.[4]

Verbal bedeutet \textstyle \widetilde{\sum\nolimits_{-i}^{n-1}} die Menge der nach der (n-1)-ten Runde überlebenden Strategien für alle Mitspieler, und \textstyle \widetilde{\sum\nolimits_i^n} die Menge der überlebenden Strategien, die beste Antwort auf bestimmte Strategie in \textstyle \widetilde{{\sum\nolimits_{-i}^{n-1}}} darstellen. Die Strategien, die die iterierte Eliminierung der Strategien, die niemals beste Antwort sind, überleben, heißen rationalisierbare Strategien eines Spielers.

Man beachte, in der Definition von Rationalisierbarkeit wird die konvexe Hülle von \textstyle \widetilde{\sum\nolimits_j^{n-1}} verwendet. Der Grund liegt darin, dass Spieler i unsicher ist, welche Strategien \textstyle\sigma_j\in\widetilde{\sum\nolimits_j^{n-1}} Spieler j spielen wird. Es kann auch sein, obwohl \textstyle \sigma_j^{'} und \textstyle \sigma_j^{''} in \textstyle\widetilde{\sum\nolimits_j^{n-1}} sind, liegt die Mischung \textstyle (\tfrac{1}{2}\sigma_j^{'}, \tfrac{1}{2}\sigma_j^{''}) allerdings nicht in \textstyle\widetilde{\sum\nolimits_j^{n-1}} und soll ausgeschlossen werden. [4]

Bernheim (1984) und Pearce (1984) zeigen, dass die Menge der rationalisierbaren Strategien R_i nicht leer ist und mindestens eine reine Strategie für jedes i behält.

Beispiel[Bearbeiten]

Gegeben sei ein Spiel in reinen Strategien:

Spieler 2
L R
Spieler 1 O 4, 2 0, 3
M 1, 1 1, 0
U 3, 0 2, 2
Status Quo
Für Spieler 1 gilt \textstyle \widetilde{\sum\nolimits_1^0} = \sum\nolimits_1= \{ O, M, U\} und für Spieler 2 gilt \textstyle \widetilde{\sum\nolimits_2^0} = \sum\nolimits_2= \{ L. R\}.
1. Runde
Strategie O ist beste Antwort auf L, U ist beste Antwort auf R, L ist beste Antwort auf M, R ist beste Antwort auf O und U. Zusammenfassend: Es überleben Strategien O und U für Spieler 1 und L und R für Spieler 2, weil sie jeweils beste Antwort auf mindestens 1 gegnerische Strategie darstellen. Mit anderen Worten: Strategie M wird in dieser Runde eliminiert weil es niemals beste Antwort ist. Mathematisch: \textstyle \widetilde{\sum\nolimits_1^1} = \{ O,  U\} für Spieler 1 und \textstyle \widetilde{\sum\nolimits_2^1} = \{ L, R\} für Spieler 2.
2. Runde
L ist nur beste Antwort auf M aber M hat die erste Runde nicht überlebt. Strategie L wird in dieser Runde eliminiert weil es niemals beste Antwort ist auf die in der letzten Runde überlebenden Strategien. Es gilt dann \textstyle \widetilde{\sum\nolimits_1^2} = \{ O,  U\} für Spieler 1 und \textstyle \widetilde{\sum\nolimits_2^2}  = \{ R\} für Spieler 2.
3. Runde
O ist nur beste Antwort auf L aber L hat die zweite Runde nicht überlebt. Strategie O wird in dieser Runde eliminiert weil es niemals beste Antwort ist auf die in der letzten Runde überlebenden Strategien. Es gilt dann \textstyle \widetilde{\sum\nolimits_1^3} = \{ U\} für Spieler 1 und \textstyle \widetilde{\sum\nolimits_2^3} = \{ R\} für Spieler 2.

Die Rekursion endet an dieser Stelle, weil U und R wechselseitig beste Antwort darstellen.

Iterierte Eliminierung von streng dominierten Strategien und Rationalisierbarkeit[Bearbeiten]

Iterierte Eliminierung von streng dominierten Strategien und Rationalisierbarkeit im Zwei-Personen Spiel[Bearbeiten]

Theorem
Rationalisierbarkeit und Iterierte Eliminierung von streng dominierten Strategien sind im zwei-Spieler Spiel äquivalent.[5]

Der Startpunkt der iterierte Eliminierung von streng dominierten Strategien (IESDS) ist die Betrachtung, dass rationale Spieler niemals eine dominierte Strategie spielen, während am Startpunkt der Rationalisierbarkeit die komplementäre Frage steht: Was für alle Strategien kann ein rationaler Spieler spielen? [6] ´

Eine streng dominierte Strategie ist nicht rationalisierbar, d.h., sie ist nie eine beste Antwort, ganz gleich, welche Strategien man von seinen Gegenspielern erwartet: wenn \sigma_i^{'} strikt dominiert ist von \sigma_i in Bezug auf \textstyle\sum\nolimits_{-i}, dann ist \sigma_i^{'} ein strikte bessere Antwort als \sigma_i auf jedes \sigma_{-i} in \textstyle\sum\nolimits_{-i}.[6] Zusammenfassend: Notwendige Bedingung für die Rationalisierbarkeit einer Strategie ist, dass sie den Prozess der IESDS überlebt.[7]

Bernheim (1984) und Pearce (1984) zeigen, dass für Spiele mit zwei Spielern alle Strategien rationalisierbar sind, die nach IESDS übrig bleiben. Dies ist die hinreichende Bedingung für Rationalisierbarkeit einer Strategie.[7]

Beispiel[Bearbeiten]

Betrachtet sei das Beispiel vom Bernheim (1984). Hier ist die hinreichende Bedingung bestätigt: die rationalisierbare Strategien a_1, a_2, a_3, b_1, b_2, b_3 überleben die IESDS, weil sie nicht dominiert sind. Strategie b_4 ist strikt dominiert von der gemischten Strategie (1/3a_1, 1/3a_2, 1/3a_3). Nachdem b_4 eliminiert wird, ist a_4 strikt dominiert von a_2.

Notwendige Bedingung ist auch bestätigt: die Strategie, die IESDS überleben, sind a_1, a_2, a_3, b_1, b_2, b_3, sie sind tatsächlich rationalisierbar.

Anhand dieses Beispiels ist dann die Äquivalenz zwischen Iterierte Eliminierung von streng dominierten Strategien und Rationalisierbarkeit im zwei-Personen Spiel zu beobachten.

Iterierte Eliminierung der strikt dominierten Strategien und (korrelierte) Rationalisierbarkeit im Mehr-Personen Spiel[Bearbeiten]

Wie gezeigt, es besteht eine Äquivalenz zwischen IESDS und Rationalisierbarkeit im Zwei-Personen Spiel. Allerdings muss die Äquivalenz zwischen „ strikt dominiert werden“ und „niemals beste Antwort sein“ nicht gültig sein in Mehr-Personen Spielen. Also: IESDS und Rationalisierbarkeit müssen in Mehr-Personen Spielen nicht äquivalent sein. Der Grund liegt in der Erwartung (belief) an das Verhalten der Mitspieler: wenn die Spieler erwarten, dass die anderen sich unabhängig verhalten (independent mixing), dann gilt die Äquivalenz nicht. Man beachte, dass Independent mixing bereits in der Definition der Erwartung \textstyle\sigma_{-i}\in\prod_{j\not=i}\sum\nolimits_j angenommen wird.

Nur in Spielen wo die Erwartung an Korrelation der Strategien ermöglicht wird (siehe korrelierte Strategie), gilt die Äquivalenz wieder. In diesem Fall muss die Definition von Erwartung modifiziert werden: \textstyle\sigma_{-i}\in\Delta S_{-i} wobei \textstyle\Delta S_{-i} alle mögliche Wahrscheinlichkeitsverteilung über S_{-i} ist.

Beispiel[Bearbeiten]

Das folgendes Beispiel ist dem Spieltheorieskript von Asu Ozdalar am MIT entnommen. [8] Es zeigt, dass IESDS nicht äquivalent sind im Drei-Personen Spiel wo keine korrelierte Strategie zugelassen wird. In diesem Beispiel sind die Auszahlungen für alle Spieler gleich. Spiele 1 wählt A oder B, Spieler 2 wählt C oder D und Spieler 3 wählt M_i für i=1,2,3,4.

C D
A 8 0
B 0 0
M_1
C D
A 4 0
B 0 4
M_2
A B
C 0 0
D 0 8
M_3
A B
C 3 3
D 3 3
M_4

Es ist zu beobachten, dass M_2 niemals beste Antwort ist auf die Strategien von Spieler 1 und Spieler 2:

Sei die Wahrscheinlichkeit, dass Spieler 1 A wählt, p und die Wahrscheinlichkeit, dass Spieler 2 C wählt, q. Außerdem wird angenommen, dass p und q unabhängig voneinander sind. Die Auszahlung von Spieler 3 u_3, wenn er M_2 spielt, ist dann u_3(M_2, p, q)\ = 4pq + 4 (1-p)(1-q)\ = 8pq + 4 -4p -4q .

Wenn M_2 eine beste Antwort auf bestimmtes p und q wäre, dann sollten drei Ungleichungen gelten:

 8pq + 4 -4p -4q \geq u_3(M_1, p, q)= 8pq  (1)
  8pq + 4 -4p -4q \geq u_3(M_3, p, q)= 8 + 8pq -8p -8q  (2)
  8pq + 4 -4p -4q \geq u_3(M_4, p, q)= 3 (3)

Aus den ersten beiden Ungleichungen gilt: p + q \geq 1  und p + q \leq 1  . Daraus folgt:  p + q \ = 1.

Setzt man  p + q \ = 1 in die dritte Ungleichung ein, dann erhält man  pq \geq 3/8.

Nach Substitution von q mit p, ergibt sich  p^2 -p +3/8 \leq 0.

Nach der Umformung erhält man (p - 1/2)^2 + (8/3 -1/4) \leq 0  und es ist klar dass die Ungleichung niemals gelten kann, somit ist M_2 niemals beste Antwort ist, egal welchen Wert p annimmt.

Auf der anderen Seite ist es klar, dass M_2 nicht eine dominierte Strategie ist.

Rationalisierbarkeit und Nash-Gleichgewicht[Bearbeiten]

Nash-Gleichgewicht ist ein rationalisierbares Gleichgewicht. Im Gleichgewicht werden nur beste Antworten gespielt. Nicht-rationalisierbare Strategie sind nicht beste Antworten.

Rationalisierbare Strategiekombination muss allerdings nicht Nash-Gleichgewicht sein. Das Nash-Gleichgewicht verlangt als Konsistenzbedingung, dass die Erwartungen der Spieler ex post auch tatsächlich erfüllt werden.[9]Mit anderen Worten: im Nash-Gleichgewicht ist die Strategie s_i des Spielers i optimal gegeben seine Erwartungen über Spieler j und für Spieler j ist es tatsächlich optimal sich entsprechend den Erwartungen von Spieler i zu verhalten, wenn er selbst korrekt erwartet, dass Spieler i die Strategie s_i wählen wird. Ein Nash-Gleichgewicht basiert also auf einer Kombination miteinander konsistenter Erwartungen. In einem Spielergebnis, das aus der Wahl rationalisierbarer Strategien resultiert und das kein Nash-Gleichgewicht ist, hat wenigstens ein Spieler falsche Erwartungen. Rationalisierbarkeit allein ist keine ausreichende Bedingung zur Erzeugung Nash-Gleichgewichte, denn sie fordert keine Wahrscheinlichkeitseinschätzungen der Spieler als gemeinsames Wissen und somit keine Konsistenz der Erwartung.

Beispiel[Bearbeiten]

Betrachtet sei das folgendes Spiel Kampf der Geschlechter:

Spieler 2
B F
Spieler 1 F 0, 0 2, 1
B 1, 2 0, 0

In dem Spiel gibt es zwei Nash-Gleichgewichte in reinen Strategien. Strategien F und B sind rationalisierbare weil F beste Antwort auf F und B beste Antwort auf B ist. Rationalisierbarkeit erlaubt die Prognose, dass das Spiel mit (F, B) endet und beide Spieler die Auszahlung 0 bekommen. (F, B) kann zustande kommen, weil Spieler 1 denkt, dass Spieler zwei F spielt und 2 denkt, dass Spieler 1 F spielt. Beide Prognosen machen Sinn, weil sie durch rationale Prognosen über das Verhalten des Mitspielers gerechtfertigt werden können – und doch werden sich beide Spieler verfehlen. Dies liegt darin, dass die Wahrscheinlichkeitseinschätzung der Spieler nicht gemeinsames Wissen ist.[10]

Rationalisierbarkeit, subjektives korreliertes Gleichgewicht und korreliertes Gleichgewicht[Bearbeiten]

Brandenburger und Dekel (1987) haben in ihrer Arbeit nachgewiesen, dass jede rationalisierbare Strategiekombination äquivalent mit einem subjektiven korrelierten Gleichgewicht im Zwei-Personen Spiel ist. Ein subjektives korreliertes Gleichgewicht ist ein korreliertes Gleichgewicht, in dem die ex ante Wahrscheinlichkeitseinschätzungen der Spieler nicht übereinstimmen müssen. Bei Mehr-Personen-Spielen gilt eine analoge Äquivalenz; es macht dann aber einen Unterschied, ob die Spieler glauben, dass alle anderen Spieler ihre Strategien unabhängig voneinander wählen müssen oder ihre Wahl untereinander korrelieren können.[11]

Nach Aumann (1987) weist eine spieltheoretische Analyse, die den Spielern unterschiedliche Prior-Wahrscheinlichkeitsschätzungen erlaubt, eine konzeptionelle Inkonsistenz auf. Er plädiert dafür, davon auszugehen, dass die Spieler Common Prior nicht nur über die Spielzüge der Natur, sondern auch über das Verhalten aller Spieler besitzen. Akzeptiert man diese strenge Common-Prior-Annahme, dann bleiben nur die rationalisierbaren Strategien solche, die ein Nash-Gleichgewicht in korrelierten Strategien ergeben (siehe Gleichgewicht in korrelierten Strategien).[11]

Diskussion[Bearbeiten]

Rationalisierbarkeit als Technik nützt zur Diskriminierung plausibler Lösungen nur beschränkt[2], da damit oft nur wenige Strategien ausgeschlossen werden können. Sie liefert sehr schwache Prognose; zwischen den rationalisierbaren Ergebnissen unterscheidet sie kaum. In dem Spiel Kampf der Geschlechter sind alle Strategiekombinationen als Ergebnis der Wahl rationalisierbarer Strategien denkbar während es nur zwei Nash-Gleichgewichte besteht; die Forderung nach Rationalität der Erwartungen legt hier keinerlei Restriktionen bezüglich der Strategiewahl auf.

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

  • Holler/Illing: Einführung in die Spieltheorie, 6. Auflage, Springer, Berlin 2006
  • Gernot Sieg: Spieltheorie, 3. Auflage, Oldenbourg, München 2010
  • Harald Wiese: Entscheidungs- und Spieltheorie, Springer, Berlin 2002
  • Robert Gibbons: A Primer in Game Theory, First Edition, Financial Times, Harlow 1992
  • Fudenberg, Drew and Jean Tirole: Game Theory, MIT Press, Cambridge, 1993
  • Bernheim, D. (1984) Rationalizable Strategic Behavior. Econometrica 52: 1007–1028.
  • Pearce, D. (1984) Rationalizable Strategic Behavior and the Problem of Perfection. Econometrica 52: 1029–1050

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. Holler/Illing: Einführung in die Spieltheorie, 6. Auflage, Springer, Berlin 2006, Seite 95–96
  2. a b Holler/Illing: Einführung in die Spieltheorie, 6. Auflage, Springer, Berlin 2006, Seite 97
  3. Drew Fudenberg, Jean Tirole: Game Theory. The MIT Press, Cambridge, Massachusetts 1991, Seite 49–50
  4. a b Drew Fudenberg, Jean Tirole: Game Theory. The MIT Press, Cambridge, Massachusetts 1991, Seite 49
  5. Drew Fudenberg, Jean Tirole: Game Theory. The MIT Press, Cambridge, Massachusetts 1991, Seite 51–52
  6. a b Drew Fudenberg, Jean Tirole: Game Theory. The MIT Press, Cambridge, Massachusetts 1991, Seite 48–49
  7. a b Statische Spiele mit vollständiger Information: (PDF; 185 kB) Spieltheorieskript von Prof. Dr. Ana B. Ania an der Ludwig-Maximilians-Universität München, Seite 9
  8. Rationalizability and Strict Dominance (PDF; 116 kB) - Asu Ozdaglar's Spieltheorieskript am MIT
  9. Holler/Illing: Einführung in die Spieltheorie, 6. Auflage, Springer, Berlin 2006, Seite 95
  10. Holler/Illing: Einführung in die Spieltheorie, 6. Auflage, Springer, Berlin 2006, Seite 96
  11. a b Holler/Illing: Einführung in die Spieltheorie, 6. Auflage, Springer, Berlin 2006, Seite 98