Dominacja ryzyka
Dominacja ryzyka Dominacja wypłaty | |
---|---|
Koncepcja rozwiązania w teorii gier | |
Relacja | |
Podzbiór | Równowaga Nasha |
Znaczenie | |
Zaproponowany przez | John Harsanyi , Reinhard Selten |
Używany do | Gry niekooperacyjne |
Przykład | Polowanie na jelenie |
Dominacja ryzyka i dominacja wypłat to dwa powiązane udoskonalenia koncepcji rozwiązania równowagi Nasha (NE) w teorii gier , zdefiniowane przez Johna Harsanyi i Reinharda Seltena . Równowaga Nasha jest uważana za dominującą pod względem wypłat , jeśli jest Pareto lepsza od wszystkich innych równowag Nasha w grze. W obliczu wyboru między równowagami wszyscy gracze zgodziliby się co do dominującej równowagi wypłat, ponieważ zapewnia ona każdemu graczowi co najmniej taką samą wypłatę, jak inne równowagi Nasha. I odwrotnie, rozważana jest równowaga Nasha dominuje ryzyko , jeśli ma największy basen przyciągania (tj. jest mniej ryzykowny). Oznacza to, że im większa niepewność graczy co do działań innych graczy, tym większe prawdopodobieństwo, że wybiorą odpowiednią strategię.
Macierz wypłat na rysunku 1 przedstawia prosty przykład gry dla dwóch graczy i dwóch strategii z dwoma czystymi równowagami Nasha. Para strategii (polowanie, polowanie) jest dominująca pod względem wypłat, ponieważ wypłaty są wyższe dla obu graczy w porównaniu z innym czystym NE (zbieranie, zbieranie). Z drugiej strony dominuje ryzyko (Zbieranie, zbieranie) (polowanie, polowanie), ponieważ jeśli istnieje niepewność co do działania drugiego gracza, zbieranie zapewni wyższą oczekiwaną wypłatę. Gra przedstawiona na rycinie 1 jest dobrze znanym dylematem teorii gier, zwanym polowaniem na jelenie . Ma to uzasadnienie w tym, że wspólne działanie (polowanie) przynosi wyższy zysk, jeśli wszyscy gracze łączą swoje umiejętności, ale jeśli nie wiadomo, czy drugi gracz pomaga w polowaniu, zbieractwo może okazać się lepszą indywidualną strategią dostarczania żywności, ponieważ nie zależy od koordynacji z drugim graczem. Ponadto samotne zbieranie jest preferowane niż gromadzenie się w rywalizacji z innymi. Podobnie jak w przypadku dylematu więźnia , przedstawia powód, dla którego działanie zbiorowe może się nie powieść przy braku wiarygodnych zobowiązań .
|
|
Definicja formalna
Gra przedstawiona na rysunku 2 jest grą koordynacyjną , jeśli dla gracza 1 (rzędy) zachodzą następujące nierówności wypłat: A > B, D > C, a dla gracza 2 (kolumny): a > b, d > c. Pary strategii (H, H) i (G, G) są wtedy jedynymi czystymi równowagami Nasha. Ponadto istnieje mieszana równowaga Nasha, w której gracz 1 gra H z prawdopodobieństwem p = (dc)/(ab-c + d) i G z prawdopodobieństwem 1 – p; gracz 2 gra H z prawdopodobieństwem q = (DC)/(AB-C+D) i G z prawdopodobieństwem 1–q.
pary strategii (H, H) dominuje (G, G), jeśli A ≥ D, a ≥ d i co najmniej jedna z nich jest ścisłą nierównością: A > D lub a > d.
pary strategii (G, G) dominuje (H, H), jeśli iloczyn strat odchylenia jest najwyższy dla (G, G) (Harsanyi i Selten, 1988, Lemma 5.4.4). Innymi słowy, jeśli zachodzi następująca nierówność: (C – D)(c – d)≥(B – A)(b – a) . Jeśli nierówność jest ścisła, to (G, G) dominuje ścisłe ryzyko (H, H). (Oznacza to, że gracze mają większą motywację do odchylenia).
Jeśli gra jest symetryczna, więc jeśli A = a, B = b itd., nierówność pozwala na prostą interpretację: zakładamy, że gracze nie są pewni, którą strategię wybierze przeciwnik i przypiszą prawdopodobieństwa każdej strategii. Jeśli każdy gracz przypisze prawdopodobieństwa ½ każdemu H i G, to ryzyko (G, G) dominuje (H, H), jeśli oczekiwana wypłata z gry G przekracza oczekiwaną wypłatę z gry H: ½ B + ½ D ≥ ½ A + ½ C lub po prostu B + D ≥ A + C .
Innym sposobem obliczenia dominującej równowagi ryzyka jest obliczenie czynnika ryzyka dla wszystkich równowag i znalezienie równowagi z najmniejszym czynnikiem ryzyka. Aby obliczyć współczynnik ryzyka w naszej grze 2x2, rozważ oczekiwaną wypłatę dla gracza, jeśli zagra H: (gdzie p to prawdopodobieństwo, że drugi gracz zagra H) i porównaj je z oczekiwaną wypłatą, jeśli zagra G: . Wartość p , która zrównuje te dwie wartości oczekiwane, jest czynnikiem ryzyka dla równowagi (H, H), przy czym gry (G, G) Możesz również obliczyć współczynnik ryzyka dla gry (G, G), wykonując te same obliczenia, ale ustawiając p jako prawdopodobieństwo, że drugi gracz zagra G. Interpretacja dla p jest najmniejszym prawdopodobieństwem, że przeciwnik musi zastosować tę strategię w taki sposób, że jego własna wypłata z kopiowania strategii przeciwnika jest większa niż w przypadku zastosowania innej strategii.
Wybór równowagi
Szereg podejść ewolucyjnych wykazało, że grając w dużej populacji, gracze mogą nie stosować strategii równowagi zdominowanej przez wypłaty i zamiast tego skończyć w równowadze zdominowanej przez wypłaty i ryzyko. Dwa oddzielne modele ewolucyjne oba wspierają ideę, że równowaga dominująca nad ryzykiem jest bardziej prawdopodobna. Pierwszy model, oparty na dynamice replikatorów , przewiduje, że populacja z większym prawdopodobieństwem przyjmie równowagę dominującą pod względem ryzyka niż równowagę dominującą pod względem wypłat. Drugi model, oparty na rewizji i mutacji strategii najlepszej odpowiedzi , przewiduje, że stan dominujący ryzyko jest jedynym stabilnym stochastycznie równowaga. Oba modele zakładają, że w populacji N graczy rozgrywanych jest wiele gier dwuosobowych. Gracze są dobierani losowo do przeciwników, przy czym każdy gracz ma równe prawdopodobieństwo wylosowania któregokolwiek z N-1 innych graczy. Gracze rozpoczynają z czystą strategią, G lub H, i grają tą strategią przeciwko swojemu przeciwnikowi. W dynamice replikatorów gra populacyjna jest powtarzana w kolejnych pokoleniach, w których subpopulacje zmieniają się w zależności od powodzenia wybranych strategii. W najlepszej odpowiedzi gracze aktualizują swoje strategie, aby poprawić oczekiwane wypłaty w kolejnych pokoleniach. Kandori, Mailath i Rob (1993) oraz Young (1993) uznali, że jeśli reguła aktualizacji strategii dopuszcza mutację, a prawdopodobieństwo mutacji znika, tj. zostanie osiągnięty, wynosi jeden, nawet jeśli jest zdominowany przez wypłatę.
Notatki
- ^ 1 Pojedyncza równowaga Nasha jest trywialnie opłacalna i dominująca pod względem ryzyka, jeśli jest jedyną NE w grze.
- ^ 2 Podobne rozróżnienie między ścisłymi i słabymi istnieje dla większości definicji tutaj, ale nie są one wyraźnie zaznaczone, chyba że jest to konieczne.
- ^ 3 Harsanyi i Selten (1988) proponują, że dominująca równowaga wypłat jest racjonalnym wyborem w grze o polowanie na jelenie, jednak Harsanyi (1995) wycofał się z tego wniosku, przyjmując dominację ryzyka jako odpowiednie kryterium wyboru.
- Samuel Bowles: Mikroekonomia: zachowanie, instytucje i ewolucja , Princeton University Press, s. 45–46 (2004) ISBN 0-691-09163-3
- Drew Fudenberg i David K. Levine: Teoria uczenia się w grach , MIT Press, s. 27 (1999) ISBN 0-262-06194-5
- John C. Harsanyi: „A New Theory of Equilibrium Selection for Games with Complete Information”, Games and Economic Behavior 8, s. 91–122 (1995)
- John C. Harsanyi i Reinhard Selten: Ogólna teoria wyboru równowagi w grach , MIT Press (1988) ISBN 0-262-08173-3
- Michihiro Kandori , George J. Mailath i Rafael Rob : „Uczenie się, mutacja i długotrwała równowaga w grach”, Econometrica 61, s. 29–56 (1993) Streszczenie
- Roger B. Myerson: Teoria gier, analiza konfliktu , Harvard University Press, s. 118–119 (1991) ISBN 0-674-34115-5
- Larry Samuelson : Gry ewolucyjne i wybór równowagi , MIT Press (1997) ISBN 0-262-19382-5
- H. Peyton Young: „Ewolucja konwencji”, Econometrica , 61, s. 57–84 (1993) Streszczenie
- H. Peyton Young: Indywidualna strategia i struktura społeczna , Princeton University Press (1998) ISBN 0-691-08687-7