Matematické metody v ekonomii 1 Tento učební materiál vznikl za přispění Evropského sociálního fondu a státního rozpočtu ČR prostřednictvím Operačního programu Vzdělávání pro konkurenceschopnost v rámci projektu Univerzitní výuka matematiky v měnícím se světě (CZ.1.07/2.2.00/15.0203). 2 Obsah 1 Dominované strategie a Nashova rovnováha 5 1.1 Statické hry . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2 Dominované strategie . . . . . . . . . . . . . . . . . . . . . . . 6 1.3 Redukce dominovaných strategií . . . . . . . . . . . . . . . . . 7 1.4 Nashova rovnováha . . . . . . . . . . . . . . . . . . . . . . . . 9 1.5 Model duopolu . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2 Smíšené strategie a Nashova věta 13 2.1 Očekávaná výhra . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.2 Smíšené strategie . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.3 Nashova věta . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3 Dynamické hry s úplnou informací 17 3.1 Extenzivní tvar hry . . . . . . . . . . . . . . . . . . . . . . . . 17 3.2 Zpětná indukce . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.3 Model oligopolu s dominantní firmou . . . . . . . . . . . . . . 20 3.4 Podhry . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 4 Bayesovské hry s neúplnou informací 23 4.1 Statické bayesovské hry . . . . . . . . . . . . . . . . . . . . . . 23 4.2 Signální hry . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.3 Signální model trhu práce. . . . . . . . . . . . . . . . . . . . . 28 4.4 Kapitálová struktura firmy . . . . . . . . . . . . . . . . . . . . 30 5 Opakované hry 32 5.1 Konečně opakované hry . . . . . . . . . . . . . . . . . . . . . . 32 3 5.2 Diskontování výplat . . . . . . . . . . . . . . . . . . . . . . . . 33 5.3 Nekonečně opakované hry . . . . . . . . . . . . . . . . . . . . 34 5.4 Reputace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 6 Aukce a další modely 37 6.1 Tragedie společného vlastnictví . . . . . . . . . . . . . . . . . 37 6.2 Aukce s tajnou nabídkou . . . . . . . . . . . . . . . . . . . . . 39 6.3 Strategie volební kampaně . . . . . . . . . . . . . . . . . . . . 40 4 Kapitola 1 Dominované strategie a Nashova rovnováha 1.1 Statické hry V této podkapitole se budeme zabývat nejjednodušším typem her, kdy rozhodování probíhá jen v jednom kroku a všichni hráči mají úplné informace o možných strategiích ostatních, i o jejich výplatních funkcích. Statické hry s úplnou informací tedy modelují situace v nichž si účastníci hry současně a nezávisle na sobě zvolí svoji akci, a jimi zvolená kombinace akcí určí výsledek hry, tedy výplaty jednotlivých hráčů. Výplatu přitom chápeme v širším smyslu než jen jako peněžní výplatu. Vyjadřuje užitek z výsledku hry pro jednotlivé hráče. Ve statické hře s úplnou informací se zadává 1. seznam účastníků hry 2. množina dostupných strategií každého hráče 3. výplatní funkce jednotlivých hráčů pro každou kombinaci strategií Definice 1.1.1. Hra v normálním tvaru pro n hráčů je tvořena prostorem strategií jednotlivých hráčů S1, S2, ..., Sn a výplatními funkcemi u1, u2, ..., un, kde každé ui zobrazuje S1 × S2 × · · · × Sn do R. Takovou hru budeme označovat H = {S1, S2, ..., Sn; u1, u2, ..., un}. 5 Následující klasický příklad, nazývaný vězeňské dilema, velmi dobře ilustruje řadu základních pojmů teorie her. K jeho opakované verzi se vrátíme při analýze dynamických her. Příklad 1.1.2. Hráči v této hře jsou dva zločinci. Jsou obviněni, že společně spáchali závažný trestný čin, za který mohou být odsouzeni jen když se alespoň jeden z nich přizná. Žalobce jim slíbí, že pokud se přizná právě jeden z nich, bude osvobozen, zatímco druhý hráč dostane 10 let vězení (9 let za zločiny a jeden rok za křivou výpověď). Pokud se přiznají oba, půjdou do vězení na 9 let. Pokud se nepřizná ani jeden, dostanou oba trest na jeden rok, za daňové úniky které je snadné jim prokázat. Každý hráč má tedy dvě strategie, přiznat se (P) a nepřiznat se (N). Abychom nemuseli počítat se zápornými hodnotami výplatní funkce, budeme výplatou chápat celkový počet let strávených na svobodě v následujících deseti letech. Výplaty příslušné všem možným kombinacím strategií zapíšeme do tabulky P N P 1,1 10,0 N 0,10 9,9 Strategie prvního hráče budeme zapisovat do sloupců, strategie druhého hráče do řádků. V každé kolonce je na prvním místě výplata prvního hráče, na druhém místě výplata druhého hráče při příslušné kombinaci strategií. 1.2 Dominované strategie Vězeňské dilema je hra, kterou můžeme studovat s využitím jednoduchého předpokladu, že totiž racionální hráč nikdy nezvolí strategii která ve všech možných situacích dává horší výsledek, než jiná pevně daná strategie. Takovou strategii budeme nazývat striktně dominovaná. Formálně je tento pojem popsán v následující definici. 6 Definice 1.2.1. Nechť H je hra v normálním tvaru, H = {S1, S2, ..., Sn; u1, u2, ..., un}. Nechť si a si jsou dvě různé strategie i-tého hráče. Řekneme, že strategie si je striktně dominovaná strategií si , jestliže pro každou kombinaci strategií ostatních hráčů je výplata i-tého hráče při strategii si menší než při strategii si , tedy ui(s1, ..., si−1, si, si+1..., sn) < ui(s1, ..., si−1, si , si+1..., sn) pro každou volbu s1, ..., si−1, si+1..., sn z množiny S1×...×Si−1×Si+1×...×Sn. Vraťme se ještě ke strategiím vězeňského dilematu. Hraje-li první hráč strategii P, je pro druhého hráče lepší hrát P než N. Zvolí-li první hráč strategii N, je pro druhého znovu lepší P než N. Strategie P je tedy pro druhého hráče ve všech případech lepší než N. Podle předchozí definice je strategie N striktně dominovaná strategií P. Stejný závěr dostaneme pro strategie prvního hráče. Strategie N je opět dominovaná strategií P. Je vidět, že racionální hráč nebude používat striktně dominovanou strategii. Tedy jediným racionálním výsledkem vězeňského dilematu je (P, P), oba hráči se přiznají a výplata je (1, 1). Zajímavé na tomto výsledku je, že existuje kombinace strategií, (N, N), která dává lepší výsledek pro oba hráče. Výsledek hry tedy není Pareto optimální. 1.3 Redukce dominovaných strategií Pokud předpokládáme, že se hráči chovají racionálně, můžeme ve statické hře striktně dominované strategie zcela ignorovat (později uvidíme že v dynamických hrách je situace složitější). Tím se hra redukuje na jednodušší. V ní ale mohou být znovu striktě dominované strategie a redukce může pokračovat dál. Jako příklad uvažujme následující hru, v níž má první hráč dvě strategie, A a B, zatímco druhý hráč má tři strategie, C, D a E. V normálním tvaru je hra dána tabulkou 7 A B C 2,1 1,4 D 2,3 1,2 E 1,2 3,1 Z tabulky zjistíme, že strategie E druhého hráče je striktně dominovaná strategií D (porovnáme druhé položky ve třetím řádku se stejnými položkami ve druhém řádku, ve třetím jsou všechny menší) . Racionální hráč tedy strategii E hrát nebude. První hráč, pokude ví že jeho soupeř je racionální, ji z dalších úvah může vyřadit. Tím se hra redukuje na následující jednodušší hru A B C 2,1 1,4 D 2,3 1,2 V této hře je strategie B prvního hráče striktně dominovaná strategií A (porovnáváme první položky v prvním a druhém sloupci). Pokud tedy druhý hráč ví, že první hráč je racionální, a ví, že první hráč ví že druhý je racionální, může hru dále redukovat. Vynecháním této strategie dostaneme tabulku A C 2,1 D 2,3 Nakonec i v této hře existuje striktně dominovaná strategie, Pro druhého hráče je lepší hrát D než C. Racionálním výsledkem hry je tedy kombinace strategií (A,D), s výplatou (2,3). Úvaha, kterou jsme právě provedli, se nazývá postupná eliminace striktně dominovaných strategií. Zdůrazněme ještě, že předpoklad racionality neznamená jen to, že oba hráči jsou racionální, ale i to že vědí o druhém že je racionální, že vědí že on to ví o nich, a tak dál. To se obvykle vyjadřuje slovy: racionalita hráčů je všeobecně známa. 8 1.4 Nashova rovnováha Existují-li v dané hře striktně dominované strategie, pak jejich eliminace je obvykle prvním krokem v analýze hry. Často ale takové strategie žádné nejsou a metoda z předchozí podkapitoly se nedá použít. Uvažujme jako příklad následující hru K H K 2,3 0,0 H 0,0 3,2 Snadno se přesvědčíme, že nemá žádné dominované strategie. Hra se obvykle nazývá partnerský souboj . Hráči jsou dva přátelé, Petr a Jana, kteří by rádi byli večer spolu, ale nemohou spolu komunikovat. Oba mají dvě možnosti, buď jít do kina (strategie K), nebo do hospody (strategie H). Předchozí tabulka výplat odpovídá faktu, že oba by raději strávili večer spolu než sami, Petr ale dává přednost hospodě před kinem, zatímco Jana kinu před hospodou. Abychom mohli analyzovat hry ve kterých postupná eliminace dominovaných strategií není použitelná, zavedeme obecnější pojem Nashovy rovno- váhy. Definice 1.4.1. Nechť H je hra v normálním tvaru, H = {S1, S2, ..., Sn; u1, u2, ..., un}. Pak n-tice strategií s∗ 1, s∗ 2, ..., s∗ n dává Nashovu rovnováhu, jestliže pro každého hráče je s∗ i nejlepší odpověď (případně jednou z nejlepších odpovědí, pokud je jich více) na strategii určenou pro ostatních n − 1 hráčů, s∗ 1, ..., s∗ i−1, s∗ i+1..., s∗ n. Tedy ui(s∗ 1, ..., s∗ i−1, s∗ i , s∗ i+1..., s∗ n) ≥ ui(s∗ 1, ..., s∗ i−1, si, s∗ i+1..., s∗ n) pro každé si ∈ Si. Jinými slovy, s∗ i je řešením maximalizační úlohy max si∈Si ui(s∗ 1, ..., s∗ i−1, si, s∗ i+1..., s∗ n) 9 Pokud daná kombinace strategií není Nashova rovnováha, pak nejméně jeden z hráčů má důvod se od této kombinace odchýlit. Z tabulky výplat v partnerském souboji je vidět, že tato hra nemá striktně dominované strategie. Nashova rovnováha se hledá zpravidla tak, že v každém řádku najdeme nejlepší odpověď (případně odpovědi, je-li jich víc) na strategii druhého hráče určenou tímto řádkem, a příslušnou výplatu prvního hráče podtrhneme. Potom uděláme totéž pro sloupce, v každém u nejlepší odpovědi druhého hráče podtrhneme jeho výplatu. Nashovu rovnováhu tvoří právě ty kombinace strategií, u kterých jsou obě výplaty podtržené. Partnerský souboj má dvě Nashovy rovnováhy, kombinace (K,K) a (H,H). Vzájemný vztah mezi redukcí dominovaných strategií a Nashovou rovnováhou popisuje následující tvrzení: pokud eliminace striktně dominovaných strategií vede k jednoznačnému výsledku hry, danému kombinaci strategií s∗ 1, ..., s∗ n, pak tato kombinace je jedinou Nashovou rovnováhou této hry. Příklad 1.4.2. Budeme analyzovat hru dvou hráčů, kteří se chtějí rozdělit o 100 Kč. Každý z nich současně oznámí částku, kterou by chtěl pro sebe, c1, resp. c2, kde 0 ≤ c1, c2 ≤ 100 . Je-li c1 + c2 ≤ 100 pak každý dostane částku kterou oznámil. Je-li c1 +c2 > 100 nedostane nikdo nic. V této hře je prostor strategií obou hráčů teoreticky nekonečný, popsaný intervalem [0, 100]. To naštěstí nijak nekomplikuje hledání Nashovy rovnováhy. Snadno se ukáže, že pro libovolné s ∈ [0, 100] je kombinace strategií c1 = s, c2 = 100−s Nashovou rovnováhou, neboť při takové kombinaci by odchýlení se libovolného z hráčů, jak směrem nahoru, tak směrem dolu, vedlo k nižší výplatě. Další kombinací strategií splňující podmínky Nashovy rovnováhy je c1 = 100, c2 = 100. Více příkladů Nashovy rovnováhy uvidíme v následující podkapitole na klasickém ekonomickém modelu duopolu. 10 1.5 Model duopolu V této podkapitole popíšeme takzvaný Bertrandův model duopolu. Budeme uvažovat trh ovládaný dvěma výrobci, kteří vyrábějí dva podobné, ale ne úplně stejné výrobky. Firmy současně určují cenu svého výrobku (na rozdíl od Cournotova modelu, kde současně určují velikost produkce). Předpokládejme, že pokud firma 1 zvolí cenu c1 a firma 2 cenu c2, bude poptávka po výrobku firmy i rovna pi(ci, cj) = a − ci + bcj, kde b je kladný koeficient reprezentující míru s jakou je výrobek firmy i náhražkou za výrobek firmy j. Taková funkce poptávky zachycuje samozřejmou skutečnost, že zvýšení ceny jednoho výrobku zvýší poptávku po druhém. Dále budeme předpokládat, že marginální náklady na výrobu pro obě firmy jsou rovny m < a, a fixní náklady jsou nulové.K tomu, abychom mohli problém zformulovat jako statickou hru, musíme ještě zadat výplatní funkci. Předpokládejme, že je přímo rovna zisku firmy. Tedy při cenách c1, c2 je výplata i-té firmy zi(ci, cj) = pi(ci, cj)[ci − m] = [a − ci + bcj][ci − m]. Kombinace strategií c∗ 1, c∗ 2 bude Nashova rovnováha, pokud bude c∗ i řešením maximalizační úlohy max 0≤ci<∞ zi(ci, c∗ j ). Po dosazení dostaneme max 0≤ci<∞ [a − ci + bc∗ j ][ci − m]. Funkce kterou chceme maximalizovat, je kvadratická v proměnné ci. Má tedy jediné maximum, které snadno najdeme, c∗ i = 1 2 (a + bc∗ j + m). Kombinace c∗ 1, c∗ 2 bude tedy Nashova rovnováha, pokud bude platit c∗ 1 = 1 2 (a + bc∗ 2 + m) 11 c∗ 2 = 1 2 (a + bc∗ 1 + m). Jediným řešením těchto rovnic je c∗ 1 = c∗ 2 = a + m 2 − b . Odtud vidíme, že Bertrandův model dává smysl jen pro hodnoty parametru b menší než dvě. Čím je b blíž této limitní hodnoty, tím vyšší je rovnovážná cena. 12 Kapitola 2 Smíšené strategie a Nashova věta Zopakujme si nejdříve některé pojmy z teorie pravděpodobnosti, které budeme dále potřebovat. 2.1 Očekávaná výhra Připomeňme, že pravděpodobnostní prostor zpravidla označujeme (Ω, A, P), kde Ω je prostor elementárních jevů, t.j. všech možných stavů modelovaného systému, které chceme rozlišovat. A je množina všech pozorovatelných jevů. PrvkyA jsou podmnožiny Ω. Jev je tedy množina elementárních jevů, které jsou s ním slučitelné. P : A → 0, 1 je pravděpodobnostní míra. V diskrétním případě stačí znát hodnoty této míry na elementárních jevech, tedy P : Ω → 0, 1 . P(ω) je pak pravděpodobnost elementárního jevu ω a pro obecný jev A ∈ A platí P(A) = ω∈A P(ω). Diskrétní náhodná veličina je funkce X : Ω → {x1, x2, ...} ⊆ R, kde {x1, x2, ...} je diskrétní podmnožina R. 13 Definice 2.1.1. Pravděpodobnostní funkce náhodné veličiny X je definována jako f(x) = P(X = x). Definice 2.1.2. Distribuční funkce náhodné veličiny X je F(x) = P(X ≤ x). Připomeňme si ještě definici nezávislosti dvou jevů. Definice 2.1.3. Jevy A, B ⊆ Ω jsou nezávislé, jestliže P(A) = P(A ∩ B) P(B) , tedy P(A ∩ B) = P(A)P(B). Jinými slovy, víme-li, že nastal jev B, nezmění to pravděpodobnost jevu A. Definice 2.1.4. Diskrétní náhodné veličiny X a Y jsou nezávislé, jestliže jevy {X = x} a {Y = y} jsou nezávislé pro všechna x a y. Jinými slovy, znalost hodnoty X nedává žádnou informaci o hodnotě Y . Pravděpodobnostní funkce obsahuje všechny informace o uvažované náhodné veličině. Často nám ale stačí její číselné charakteristiky. Definice 2.1.5. Očekávání (střední hodnota) náhodné veličiny X s pravděpodobnostní funkcí f(x) je definována jako E(X) = x: f(x)>0 xf(x), je-li řada absolutně konvergentní. Očekávání můžeme vypočítat také pomocí vztahu E(X) = ω∈Ω X(ω)P(ω). 14 2.2 Smíšené strategie Jak jsme již viděli, v některých jednoduchých hrách neexistuje žádná Nashova rovnováha, v některých hrách jich naopak může být několik. V některých situacích je hlavní snahou hráče zabránit tomu, aby protivník byl schopen odhadnout jeho strategii. Jednou možností jak toho dosáhnout, je volit strategii náhodně. Definice 2.2.1. Uvažujme hru v normálním tvaru H = {S1, S2, ..., Sn; u1, u2, ..., un}, kde Si = (si1, . . . , sik). Pak smíšenou strategií i-tého hráče rozumíme pravděpodobnostní rozdělení na Si, pi = (pi1, . . . , pik), kde pij udává s jakou pravděpodobností bude i-tý hráč hrát j-tou strategii. Ryzí strategie můžeme zřejmě chápat jako speciální případ smíšených strategií, kde pravděpodobnostní funkce degeneruje a přiřazuje pravděpodobnost jedna této strategii a pravděpodobnost nula všem ostatním strategiím. Uvažujme hru dvou hráčů a jejich strategie S1 = (s11, ..., s1J ) a S2 = (s21, ..., s2K). Jejich smíšené strategie nechť jsou dány pravděpodobnostními rozděleními p1 = (p11, ..., p1J ) a p2 = (p21, ..., p2K). Pak očekávaná výplata prvního hráče při použití těchto strategií bude rovna v1(p1, p2) = J j=1 p1j K i=1 p2iu1(s1j, s2i). Analogicky, výplata druhého hráče bude rovna 15 v2(p1, p2) = K i=1 p2i J j=1 p1ju2(s1j, s2i). 2.3 Nashova věta Pojem Nashovy rovnováhy má přirozené rozšíření na smíšené strategie. Definice 2.3.1. Uvažujme hru dvou hráčů v normálním tvaru H = {S1, S2; u1, u2},. Dvojice smíšených strategií p∗ 1, p∗ 2 je Nashova rovnováha, jestliže platí v1(p∗ 1, p∗ 2) ≥ v1(p1, p∗ 2) pro všechny smíšené strategie prvního hráče p1 a v2(p∗ 1, p∗ 2) ≥ v2(p∗ 1, p2) pro všechny smíšené strategie druhého hráče p2. Analogicky se definuje Nashova rovnováha pro hru více než dvou hráčů. Jedním ze zásadních výsledků teorie her je Nashova věta, která zaručuje existenci Nashovy rovnováhy ve smíšených strategiích, pro libovolnou konečnou hru. Věta 2.3.2. Nechť H je hra v normálním tvaru, pro konečný počet hráčů s konečným počem strategií, H = {S1, S2, ..., Sn; u1, u2, ..., un}. Pak existuje alespoň jedna Nashova rovnováha v prostoru smíšených strategií. Poznamenejme ještě, že platí následující elementární vlastnost. Smíšená strategie p∗ 1 je nejlepší odpovědí na smíšenou strategii p∗ 2, jestliže každá ryzí strategie, které je přiřazena nenulová pravděpodobnost, je také nejlepší odpovědí na strategii p∗ 2. Důkaz Nashovy věty je založen na větách o pevném bodu. 16 Kapitola 3 Dynamické hry s úplnou informací V této kapitole shrneme základní pojmy a příklady dynamických her s úplnou informací. 3.1 Extenzivní tvar hry V dynamických hrách probíhá rozhodování v několika krocích. Na rozdíl od statických her je výhodné popisovat hru ne v normálním tvaru, ale pomocí posloupnosti ”tahů” jednotlivých hráčů. Takový popis se nazývá extenzivní tvar hry. Z předchozí kapitoly víme, že v normálním tvaru hry se zadává 1. seznam hráčů ve hře 2. strategie které mají jednotlivý hráči k dispozici 3. výplata každého z hráčů při všech kombinacích strategií které hráči mohou vybrat. V extenzivním (rozšířeném) tvaru hry se zadává 1. seznam hráčů ve hře 17 2. kdy je který hráč na tahu; jaké má hráč možnosti v každé situaci kdy je na tahu; jaké má hráč informace v každé situaci kdy je na tahu 3. výplata každého hráče při všech možných kombinacích tahů které mohli hráči zvolit. V normálním tvaru se tedy zadávají celkové strategie hráčů, zatímco v extenzivním tvaru jednotlivé tahy. Definice 3.1.1. Strategie hráče je úplný plán jeho akcí, který určuje kterou z možných akcí hráč zvolí v každé situaci, která může ve hře nastat a v níž je tento hráč na tahu. Poznamenejme, že je nutné určit i akce v situacích, které by při racionálním průběhu hry nemohli nastat. Příklad převodu z rozšířeného tvaru do normálního tvaru si ukážeme na třídě jednoduchých dynamických her. Jejich časování je následující: 1. V prvním kroku hráč 1 zvolí svoji akci a1 z množiny možných akcí A1. 2. Ve druhém kroku hráč 2 pozoruje a1 a zvolí svoji akci a2 z množiny možných akcí A2 3. Ve třetím kroku obdrží hráči výplaty u1(a1, a2) a u2(a1, a2). Hra je tedy daná v rozšířeném tvaru. Abychom ji převedli do normálního tvaru, musíme určit celkové strategie obou hráčů v celé hře. Předpokládejme pro jednoduchost, že A1 i A2 mají dva prvky, A1 = {α1, α2}, A2 = {β1, β2}. První hráč má dvě strategie, vybrat buď α1 nebo α2. . Na druhé straně, druhý hráč má celkem čtyři strategie: 1. Na akci α1 reagovat tahem β1 a na akci α2 tahem β1. 2. Na akci α1 reagovat tahem β1 a na akci α2 tahem β2. 18 3. Na akci α1 reagovat tahem β2 a na akci α2 tahem β1. 4. Na akci α1 reagovat tahem β2 a na akci α2 tahem β2. Prostor celkových strategií druhého hráče musíme tedy odlišit od prostoru jeho možných tahů ve druhém kroku. Hlavní metodou pro řešení dynamických her je zpětná indukce. 3.2 Zpětná indukce Hra v extenzivním tvaru se obvykle znázorňuje pomocí herního stromu. Do uzlů zapisujeme který hráč je na tahu, hrany představují možné akce jednotlivých hráčů. Ke koncovým uzlům píšeme příslušnou výplatu hráčů. Uvažujme následující hru • 1     • 2 A ƒ ƒ ƒ ƒƒ • 2 B        • 5,1 C d d dd • 1,2 D        • 2,1 E d d dd • 0,0 F Hru budeme řešit pomocí zpětné indukce. Začneme od posledního kroku, kdy je na tahu druhý hráč. Pokud první hráč hraje A, bude racionální druhý hráč hrát D, s výslednými výplatami (1,2), protože dává pro něj lepší výsledek než C. Podobně, hraje-li první hráč B, je pro druhého racionální odpověď E, 19 s výplatami (2,1). Teď můžeme přejít k prvnímu kroku hry. Racionální první hráč ví všechno, co jsme právě odvodili. Jeho rozhodování se tedy redukuje na výběr mezi A, které po racionální odpovědi druhého dá výplatu (1,2), a mezi B, které po racionální odpovědi dá výplatu (2,1). Pro prvního hráče je tedy výhodnější druhá možnost, hrát B. Racionálním výsledkem hry je tedy posloupnost akcí (C, E), s výslednou výplatou (2,1). Pro srovnání převedeme teď hru do normálního tvaru a budeme hledat Nashovu rovnováhu. Strategie druhého hráče budeme označovat takto. (P’, P’) bude označovat strategii: na tah A prvního hráč odpověz C, na tah B prvního hráč odpověz D, a analogicky pro ostaní tři strategie druhého hráče, (P’, D’), (D’, P’), (D’, D’). Přitom první odpovědí druhého hráče se rozumí krok nahoru v předchozí tabulce, tedy C nebo E. V normální tvaru hry dostaneme následující tabulku: P’,P’ P’,D’ D’,P’ D’,D’ P 5,1 5,1 1,2 1,2 D 2,1 0,0 2,1 0,0 Ukazuje se, že hra má překvapivě dvě Nashovy rovnováhy. Vedle řešení které jsme našli zpětnou indukcí ješte kombinaci P, (P , P ) s výplatou (1,2). Abychom pochopili proč je to tak, podívejme se znovu na obrázek znázorňující extenzivní tvar hry. Pro druhého hráče je výhodnější, aby první hrál P, protože pak může získat 2 namísto 1. Jeho strategii (D’,D’) tedy můžeme chápat tak, že druhý hráč prvnímu vyhrožuje, že na jeho tak D zahraje D’, a první na tom bude hůř než kdyby hrál P. Tato hrozba ale není věrohodná, protože v situaci kdy by racionální druhý hráč měl příležitost ji uskutečnit, neudělal by to. 3.3 Model oligopolu s dominantní firmou V této podkapitole uvažujme znovu model duopolu, tentokrát v situaci kdy na trhu existují dvě firmy, z nichž jedna je dominantní. Ta určuje cenu svého 20 výrobku jako první. Ostatní předpoklady budou stejné jako v původním statickém Bertrandově modelu z předchozí kapitoly. Hru budeme řešit zpětnou indukcí. Pro zvolenou cenu první firmy c1 řeší druhá firma úlohu max c2 (a − c2 + bc1)(c2 − m). Tak jako v původním modelu najdeme optimální řešení (funkce je opět kva- dratická), c2 = 1 2 (a + bc1 + m). První hráč ví, že tato hodnota je optimální odpověďí druhého hráče. V prvním kroku tedy řeší optimalizační úlohu, kdy do své výplatní funkce dosadí optimální odpověď druhého hráče. Hledá tedy max c1 (a − c1 + b 1 2 (a + bc1 + m))(c1 − m). Maximalizovaná funkce je znovu kvadratická. Po jednoduchých úpravách do- staneme c1 = (2 + b)(a + m) − mb2 2 − b2 . K tomu, aby měl model smysl, musí být v tomto případě parametr b menší než √ 2. Definice 3.3.1. Informační množina pro daného hráče je soubor rozhodovacích bodů s následujícími vlastnostmi: 1. hráč je na tahu v každém bodě dané informační množiny 2. když se hra dostane do některého bodu informační množiny, hráč neví ve kterém jejím bodě se hra nachází. Speciálně z této definice plyne, že hráč musí mít v každém bodě dané informační množiny stejné možnosti. Jinak by její body od sebe rozeznal právě podle lišících se možností. 21 3.4 Podhry Definice 3.4.1. Podhra hry v extenzivním tvaru je hra která začíná v rozhodovacím bodu B, který má následující tři vlastnosti. Je jednoprvkovou informační množinou, obsahuje všechny rozhodovací body které v herním schématu následují za B, a nerozděluje žádnou informační množinu Každou podhru tedy můžeme analyzovat jako samostatnou hru. Definice 3.4.2. (Selten) Nashova rovnováha je dokonalá (perfektní) vzhledem k podhrám, jestliže strategie hráčů dávají Nashovu rovnováhu v každé podhře. Přívlastek vzhledem k podhrám se často vynechává. Hlavním významem této definice je, že takto modifikovaná definice Nashovy rovnováhy už vyloučí nevěrohodné hrozby. Jediná dokonalá Nashova rovnováha ve hře z odstavce 2.2.1 je ta kterou jsme našli zpětnou indukcí. 22 Kapitola 4 Bayesovské hry s neúplnou informací Cílem této kapitoly je zavést základní pojmy Bayesovských her na příkladu statických her. Potom se budeme věnovat konkrétním příkladům dynamických Bayesovských her. Hra s neúplnou informací je hra ve které každý hráč zná svoji vlastní výplatní funkci, ale není si jist výplatní funkcí ostatních hráčů. Označme možné výplatní funkce i-tého hrače jako ui(a1, a2, ..., an, ti), kde ti označuje typ i-tého hráče. Každé ti je prvkem množiny možných typů itého hráče, Ti. i-tý hráč sice nezná typ ostatních hráčů, ale má o nich nějaký názor, vyjádřený pravděpodobnostním rozdělením pi(t−i|ti), kde t−i = (t1, ..., ti−1, ti+1, ..., tn) označuje typy ostatních hráčů. 4.1 Statické bayesovské hry Definice 4.1.1. Ve statické Bayesovské hře se zadává 1. prostor možných akcí jednotlivých hráčů A1, ..., An, 23 2. prostor možných typů hráčů, T1, ..., Tn, 3. pravděpodobnosti p1, ..., pn, které jednotlivý hráči přiřazují typům ostat- ních Typ i-tého hráče ti ∈ Ti je znám jemu samotnému, a určuje jeho výplatní funkci ui(a1, ..., an; ti). Takovou hru budeme označovat H = (A1, ..., An, T1, ..., Tn, p1, ..., pn, u1, ..., un). Časování statické bayesovské hry je následující: 1. je určen vektor typů hráčů (t1, . . . , tn). 2. každému hráči je oznámen jeho typ, ale ne typy ostatních 3. hráči současně vyberou akce a1, ..., an z prostorů A1, ..., An. 4. hráči obdrží výplaty ui(a1, ..., an; ti). Definice 4.1.2. Strategie i-tého hráče ve statické bayesovské hře je funkce si(ti) která pro každý z možných typů ti určuje akci z množiny Ai kterou by typ ti zvolil kdyby byl v prvním kroku vybrán. Mohlo by se zdát zbytečné aby i-tý hráč určoval svoje akce i pro typy kterými není, když on sám svůj typ zná. Při svém rozhodování ale musí brát v úvahu akce ostatních hráčů, a ty závisí na tom co si ostatní hráči myslí o jeho vlastní akci, která závisí na ti. Ve hře s neúplnou informací se hráči snaží maximalizovat očekávanou výplatu vzhledem k pravděpodobnostem přiřazeným jednotlivým typům soupeřů. Následující definice zobecňuje pojem Nashovy rovnováhy na hry s neúplnou informací. Definice 4.1.3. n-tice strategií (s∗ 1, ..., s∗ n) ve statické bayesovské hře H = (A1, ..., An, T1, ..., Tn, p1, ..., pn, u1, ..., un), tvoří bayesovskou Nashovu 24 rovnováhu, pokud platí s∗ i (ti) = max ai∈Ai t−i∈T−i ui(s∗ 1(t1), ..., s∗ i−1(ti−1), ai, s∗ i+1(ti+1), ..., s∗ n(tn); ti)pi(t−i|ti). Zdůrazněme, že v této definici podmínka musí platit pro všechny možné typy každého hráče. V bayesovské Nashově rovnováze tedy žádný hráč nemá důvod měnit svoji strategii, i kdyby se tato změna týkala jen jednoho jeho možného typu, ať už realizovaného, nebo nerealizovaného. Ilustraci tohoto pojmu uvidíme v dalších příkladech. 4.2 Signální hry V této podkapitole se začneme věnovat dynamickým hrám s neúplnou informací. V těchto hrách hráči znají svoji výplatní funkci, ale nejsou si jisti výplatní funkcí svých soupeřů. Při analýze hry musí každý hráč brát v úvahu možné typy soupeřů a jim příslušné výplatní funkce. Nutným předpokladem pro analýzu hry je schopnost přiřadit jednotlivým typům soupeřů pravděpodobnost jejich výskytu. Základní myšlenky a pojmy popíšeme na jednoduchém případu signálních her. Signální hry představují jeden z nejjednodušších a současně nejdůležitějších příkladů dynamických bayesovských her. Signální hry se zúčasní dva hráči, odesílatel (hráč O) a příjemce (hráč P). Časování hry je následující: 1. Je vybrán typ odesílatele z množiny možných typů T = {t1, t2, ..., tn}. Přitom pravděpodobnosti jednotlivých typů jsou p(ti), kde p(ti) > 0 pro všechna i a n i=1 p(ti) = 1 . 2. Odesílatel pozoruje ti a vybere zprávu z množiny přípustných zpráv (signálů) Z = {z1, z2, ..., zl}. 25 3. Příjemce pozoruje zprávu odesílatele zi, ale nepozoruje jeho typ ti. Na základě zprávy vybere akci z množiny přípustných akcí A = {a1, ..., am). 4. Hráči obdrží výplaty uo(ti, zj, ak) a up(ti, zj, ak) . Poznamenejme, že jako obvykle, T, Z, A mohou být i nekonečné množiny, nejčastěji intervaly na reálné ose. Uvažujme teď jednoduchý případ kdy T = {t1, t2}, Z = {z1, z2}, A = {a1, a2}. Připomeňme že strategie hráče je úplný plán jeho akcí pro všechny situace které mohou ve hře nastat. V naší signální hře má tedy hráč O celkem čtyři strategie: 1. hrát z1 je - li vybraný typ t1 a stejně tak z1 je-li vybraný typ t2. 2. hrát z1 , resp. z2 je-li vybraný typ t1 , resp. t2. 3. hrát z2 , resp. z1 je-li vybraný typ t1 , resp. t2. 4. hrát z2 je-li vybraný typ t1 a stejně tak pro t2. Podobně má i příjemce P čtyři strategie 1. hrát a1 je - li odeslaná zpráva t1 a stejně tak a1 je-li odeslaná zpráva z2. 2. hrát a1 , resp. a2 je-li odeslaná zpráva z1 , resp. z2. 3. hrát a2 , resp. a1 je-li odeslaná zpráva t1 , resp. t2. 4. hrát a2 je-li odeslaná zpráva t1 a stejně tak a2 je-li odeslaná zpráva z2. Strategiím 1 a 4 budeme říkat spojující (odpověď je v nich stejná pro oba možné výsledky předchozího tahu), strategiím 2 a 3 budeme říkat rozdělující. Budeme předpokládat, že hra má následující přirozené vlastnosti: 26 1. Hráč P, potom co pozoruje zprávu od hráče O, musí mít nějaký názor na to který z typů mohl zprávu poslat. Ten je vyjádřen pravděpodobnostním rozdělením µ(ti|zj) kde µ(ti|zj) ≥ 0 pro ti ∈ T a ti∈T µ(ti|zj) = 1. Hráč P bude zřejmě chtít maximalizovat očekávanou výplatu, při pravděpodobnostech které přiřazuje jednotlivým typům hráče O. To vyjadřuje následující vlastnost. 2 (pro příjemce). Pro každé zj ∈ Z akce příjemce maximalizuje očekávanou výplatu pro daný názor µ(ti|zj). Tedy a∗ (zj) je řešením úlohy max ak∈A ti∈T µ(ti|zj)up(ti, zj, ak) Na rozdíl od příjmce má odesílatel úplnou informaci. Jeho optimální strategii popisuje následující vlastnost. 2 (pro odesílatele). Pro každé ti ∈ T odesílatelova zpráva z∗ (ti) maximalizuje jeho výplatu při strategii příjemce a∗ (zj) . Tedy z∗ (ti) je řešením úlohy max zj∈Z uo(ti, zj, a∗ (zj)) Pro danou strategii odesílatele z∗ (ti) nechť Tj označuje množinu typů které odesílají zj . Tedy ti ∈ Tj jestliže z∗ (ti) = zj. 3. Pro každé zj , pokud existuje ti ∈ T takové, že z∗ (ti) = zj pak názor hráče P v informační množině odpovídající zj musí vyplývat z Bayesova vzorce a ze strategie odesílatele. Tedy µ(ti|zj) = p(ti) tj∈Tj p(tj) Definice 4.2.1. Dokonalá Bayesovská rovnováha v signální hře je dvojice strategií µ∗ (ti) a a∗ (zj) spolu s názorem µ(ti|zj), splňující vlastnosti 1-3. 27 4.3 Signální model trhu práce. Budeme uvažovat následující verzi Spenceova signálního modelu trhu práce se třemi hráči. Prvním hráčem je uchazeč o zaměstnání (hráč U), dalšími dvěma jsou firmy nabízející práci (F1, F2). Časování hry je následující: 1. Jsou určeny schopnosti α hráče U, buď jsou vysoké (α = V ) , nebo nízké (α = N). Pravděpodobnost toho že α = V je rovna q. 2. Uchazeč pozoruje svoje schopnosti a určí si úroveň svého vzdělání e ≥ 0. 3. Firmy F1 a F2 pozorují uchazečovo vzdělání, ale ne jeho schopnosti, a současně nabídnou uchazeči plat. 4. Uchazeč si vybere vyšší nabídku mzdy (pokud jsou stejné, hodí si korunou). Její hodnotu označíme w. 5. Výplatní funkce pro uchazeče je w−c(α, e) , kde c(α, e) je cena vzdělání pro uchazeče typu α. Pro firmy je výplata y(α, e)−w , kde y(α, e) je hodnota pracovního výkonu uchazeče se schopnostmi α a vzděláním e. Pokud firma nezaměstná uchazeče, je její výplata nula. Budeme studovat rovnováhu v níž firma interpretuje úroveň vzdělání jako signál o schopnostech uchazeče. Přirozeným předpokladem Spenceova modelu je ce(N, e) > ce(V, e), tedy marginální cena vzdělání je vyšší pro uchazeče typu N. Cenou vzdělání se v tomto případě nemyslí školné ani jiné podobné výdaje, ale pouze úsilí které musí uchazeč do vzdělání vložit. To je samozřejmě menší má-li hráč schopnosti V . Dalším zjednodušujícím předpokladem je, že konkurence stlačuje zisk firem na nulu. Uvažujme nejdřív analogii této hry, ve které jsou schopnosti uchazeče 28 veřejně známé. V tom případě firma nabídne (z předpokladu nulového zisku) uchazeči mzdu w = y(α, e) . Uchazeč při výběru vzdělání prostě maximalizuje svoji výplatní funkci y(α, e) − c(α, e) přes všechny možné hodnoty e. Označme řešení této úlohy e∗ (α). Protože v původní hře schopnosti uchazeče jsou jeho soukromá informace, uchazeči s nižšími schopnostmi se otvírá možnost tvářit se že má vysoké schopnosti. V závislosti na marginální ceně vzdělání obou typů můžeme dostat dva případy. V prvním případě je pro uchazeče se schopnostmi N příliš drahé získat vzdělání e∗ (V ) . V tomto případě se dá říct že typ N nemá důvod závidět typu V jeho vyšší výplatu. Tak tomu bude pokud w∗ (N) − c(N, e∗ (N)) > w∗ (V ) − c(N, e∗ (V )). V opačném případě, kdy platí opačná nerovnost, může typ N závidět typu V, a chtít se tvářit jako V. Budeme se věnovat tomuto zajímavějšímu případu. Kdybychom schopnosti uchazeče modelovali jako spojitou veličinu, dostali bychom vždy tento případ, pro dostatečně blízké hodnoty schopností. Existují jak spojující tak rozdělující perfektní Bayesovské rovnováhy, my se omezíme na několik příkladů. Ve spojující rovnováze zvolí oba typy stejnou úroveň vzdělání, es. Podle vlastnosti 3 se názor firem po přijetí zprávy es nezmění, rovná se tedy apriorní pravděpodobnosti q. Firmy tedy následně nabídnou wp = qy(V, ep) + (1 − q)y(N, ep). K úplnému popisu rovnovážných strategií musíme přidat jednak názor firem pro výběr vzdělání odlišný od es, který určí jejich nabídku v tomto případě, a dále ukázat že nejlepší odpovědí uchazečů na strategii firem w(e) je hrát e = es. To odpovídá vlastnostem 1 a 2(O). 29 4.4 Kapitálová struktura firmy V tomto modelu vyatupují dva hráči. Majitel existující firmy (M), který má nový projekt, a investor, který může nebo nemusí chtít projekt financovat (I). Předpokládejme, že existující zisk firmy je buď vysoký, Z = V , nebo nízký, Z = N. Dále označíme I hodnotu investice, R zisk z projektu. Budeme předpokládat, že projekt je atraktivní, tedy R > I(1 + r), kde r je míra zisku v alternativní investiční možnosti investora (například vkladu v bance). Časování hry je následující: 1. Je určen zisk existující firmy, V nebo N . Pravděpodobnost že Z = N je p . 2. Majitel firmy pozoruje Z a nabídne potenciálnímu investorovi akciový podíl na firmě, a , kde 0 ≤ a ≤ 1 . 3. Investor pozoruje a (ale ne Z ) a buď přijme nebo odmítne nabídku. 4. Výplaty hráčů jsou následující: investor, pokud odmítne nabídku, dostane I(1 + r) a majitel Z. Pokud přijme nabídku, má investor a(Z + R) a majitel (1 − a)(Z + R). Pokud I věří, že Z = N s pravděpodobností q, pak přijme nabídku pokud a[qN + (1 − q)V + R] ≥ I(1 + r). Pro hráče M je financování projektu výhodné pokud (Z + R)a ≤ R. Ve spojující rovnováze, víra investora musí být q = p. Protože tato podmínka je silnější pro Z = V než pro Z = N, , spojovací rovnováha existuje, 30 pokud I(1 + r) pN + (1 − p)V + R ≤ R V + R . Pro p blízko nuly to platí vždy. Naopak, pro p blízko jedné to platí jen pokud R − I(1 + r) ≥ I(1 + r)V R − V. Rozdělující rovnováha existuje vždy. Majitel typu N nabídne invesorovi a = I(1 + r) V + R , který nabídku přijme. Majitel typu V nabídne investorovi a < I( 1 + r V + R ), což investor odmítne. Výsledek analýzy hry ukazuje, že míra investic je neefektivně nízká. Projekt firmy typu V je určitě ziskový, ale investor jej přesto odmítne. Podmínky pro majitele typu N jsou vždy lepší než pro V . 31 Kapitola 5 Opakované hry V této části se budeme zabývat opakovanými hrami, tedy hrami ve kterých se jedna základní hra opakuje, buď konečně, nebo nekonečně mnohokrát. Většinou budeme předpokládat že hráči znají výsledky předchozích her, je ale možná i situace kdy výsledky neznají, nebo znají jen částečně. 5.1 Konečně opakované hry Definice 5.1.1. Nechť je dána základní statická hra H. Pak H(T) bude označovat hru ve které se základní hra H hraje T-krát. Přitom hráči pozorují výsledky všech předchozích her před tím, než začne další hra. Výplaty v opakované hře jsou součtem výplat v jednotlivých kolech základní hry. Základním tvrzením o těchto hrách je následující věta, která velmi silně redukuje možnosti pro Nashovu rovnováhu. Věta 5.1.2. Pokud základní hra má jedinou Nashovu rovnováhu, pak opakovaná hra H(T) má jedinou rovnováhu perfektní vzhledem k podhrám. Tou je opakování Nashovy rovnováhy v každém kole hry. Předchozí tvrzení můžeme dobře ilustrovat na opakovaném vězeňském dilematu. Předpokládejme tedy, že hrajeme dvakrát po sobě vězeňské dilema, s pravidly a výplatami jako v první kapitole. Protože Nashova rovnováha pro celou hru musí být dokonalá vzhledem k podhrám, ve druhé, tedy poslední hře musí dojít k Nashově rovnováze. Výplatní funkce druhé hry je ale stejná jako u základního vězeňského dilematu, tedy 32 P N P 1,1 10,0 N 0,10 9,9 Víme tedy, že výsledkem hry bude výplata (1, 1). Díky tomu můžeme napsat tabulku výplat celé opakované hry v závislosti na výsledku první hry. Ke každému prvku tabulky přičteme známý výsledek druhé hry. Dostaneme tak tabulku P N P 2,2 11,1 N 1,11 10,10 Snadno ověříme, že jedinou Nashovou rovnováhou v této hře je opět kombinace strategií (P, P), s výslednou celkovou výplatou (2, 2). 5.2 Diskontování výplat Při výpočtu celkové výplaty jednotlivých hráčů ze všech odehraných her dohromady se obvykle bere v úvahu časová hodnota peněz. Je tedy třeba jednotlivé výplaty diskontovat. Pokud uvažujeme nekonečněkrát opakovanou hru, je tento postup také nutný k tomu, abychom se vyhnuli nekonečně velkým výhrám. Uvažujme teď nekonečněkrát opakovanou základní hru. Budeme předpokládat, že hráči se snaží maximalizovat diskontovaný součet výplat z jednotlivých her. Diskontovací faktor, odpovídající bezrizikové úrokové míře, označíme δ. Současná hodnota příjmu ze všech her, p = (p1, . . . pt, . . . ) bude rovna PV (p, δ) = ∞ t=0 δt pt. Průměrnou hodnotou budeme rozumět výraz (1 − δ)PV (p, δ). 33 Pokud jsou výplaty z jednotlivých her stejné, tedy p1 = p2 = ..., pak je průměrná hodnota přímo rovna výplatě z jednotlivé základní hry. 5.3 Nekonečně opakované hry Důležitým pojmem při analýze nekonečněkrát opakované hry je spouštěcí strategie. Ilustrujme ji na příkladu opakovaného vězeňského dilematu. Spouštěcí strategie začíná v prvním kole zahráním spolupráce. V dalších kolech, pokud byla vždy hrána oboustraná spolupráce hrát ji opět. Pokud ale byla spolupráce porušena, hrát již stále nespolupráci. V dalším využijeme diskontování výplat, zavedené v předchozí části a ukážeme že použití spouštěcí strategie dává v nekonečně opakované hře Nashovu rovnováhu, přesto, že v každé jednotlivé hře spolupráce rovnováhu nedává. Předpokládejme tedy, že první hráč hraje spouštěcí strategii. Ukážeme, že pro diskontovací faktor dostatečně blízký jedné, bude spouštěcí strategie nejlepší odpovědí druhého hráče. Výplata druhého hráče, pokud by porušil spolupráci hned v prvním kole, bude 10 + δ · 1 + δ2 · 1 + · · · = 10 + δ 1 − δ . Tedy spolupráce bude optimální, pokud 9 1 − δ ≥ 10 + δ 1 − δ . Odtud dostaneme δ ≥ 1 9 . Pro takové hodnoty δ dává dvojice spouštěcích strategií Nashovu rovnováhu. 5.4 Reputace V této podkapitole budeme znovu uvažovat opakovaně hrané vězeňské di- lema. 34 Teoreticky je v opakovaném vězeňském dilematu jediná perfektní Nashova rovnováha, opakování nespolupráce v každém kroku. Nespolupráci přitom označuje strategii přiznat se. Výsledky experimentů s vězeňským dilematem ale ukazují že přesto dochází často ke spolupráci (tedy strategii nepřiznat se) hlavně v hrách které nejsou příliš blízko ke konci. Jedním z vysvětlení je právě model který bere v úvahu reputaci. Pro větší sugestivnost budeme strategii přiznat se označovat N (nespolupráce) a strategii nepřiznat se jako S (spolupráce). Předpokládejme, že s pravděpodobností p má hráč 1 typ jehož strategie je následující: Hráč hraje v prvním tahu spolupráci. V každém dalším tahu vybere přesně tu akci kterou jeho soupeř zahrál v předchozím kole. Typ hráče s touto strategií označíme ZZ (zub za zub). Druhým typem je ”racionální” hráč, který může hrát libovolnou strategii dostupnou v této hře (typ R). Důsledkem předpokladů je fakt že jakmile se 2. hráč odchýlí od strategie ZZ, je jisté že je typu R. Uvažujme následující časování: 1. Příroda vybere typ prvního hráče, s pravděpodobností p je to typ ZZ, s pravděpodobností 1 − p je to typ R. První hráč se dozví svůj typ. 2. Hráči hrají poprvé VD. Pozorují výsledek prvního kola a hrají VD podruhé. 3. Výplaty hráčů jsou součtem výplat v jednotlivých kolech. V posledním tahu hraje 2.hráč N , protože striktně dominuje S .Tedy racionální hráč nemá důvod spolupracovat v 1. hře, zatímco typ ZZ začne hru spoluprácí. Zbývá tedy dopočítat 1. tah prvního hráče, který 2. hráč zopakuje ve 2. tahu, pokud má typ ZZ. Pokud zahraje S, dostane p1 + (1 − p)b v 1. tahu a pa ve 2. tahu. (1. hráč ve druhém tahu už zná typ 2. hráče, protože oba typy začínají jiným tahem). Vybere-li N, dostane v 1.tahu pa a 0 ve 2. 35 tahu Celkem tedy 1. hráč vybere S jestliže p(1 − a) + (1 − p)b ≥ 0. 36 Kapitola 6 Aukce a další modely Pomocí teorie her je možné modelovat, případně i vysvětlit, některé ekonomické a sociologické jevy. V této kapitole si ukážeme několik takových příkladů. 6.1 Tragedie společného vlastnictví Uvažujme následující situaci. Celkový počet N sedláků se rozhoduje, nezávisle jeden na druhém, kolik krav bude chovat. Označme ki počet krav i-tého sedláka. Celkový počet krav je tedy K = k1 + · · · + kN . Sedláci mají k dispozice pouze jednu společnou pastvinu. Dále budeme předpokládat, že – náklady na nákup a chování jedné krávy jsou rovny e. Tato hodnota nezávisí na celkovém počtu chovaných krav. – hodnota, kterou jedna kráva sedlákovi přinese, závisí na celkovém počtu chovaných krav a je rovna v(K). Pro funkci v platí v (x) < 0 a v (x) < 0, tedy funkce v je klesající a konkávní. To odráží fakt, že při rostoucím počtu krav na každou krávu připadne na pastvině méně trávy. Maximální počet krav, které se vejdou na pastvinu, označíme Km a budeme předpokládat, že v(Km) = 0. 37 – Dále budeme pro jednoduchost předpokládat, že sedláci mohou chovat i neceločíselný počet krav. Budeme tedy uvažovat jako definiční obor funkce v interval [0, Km]. Celkový užitek i-tého sedláka v popsané situaci je tedy roven kiv(k1 + . . . kN ) − cki. Pro nalezení Nashovy rovnováhy musíme za i-tého sedláka řešit optimalizační úlohu max ki kiv(k∗ 1 + · · · + ki + · · · + k∗ N ) − cki. Řešení musí splňovat nutné podmínky prvního řádu, tedy v(ki + k∗ −i) + kiv(ki + k∗ −i) − c = 0, kde jsme označili k∗ −i = k∗ 1 + · · · + k∗ i−1 + k∗ i+1 + · · · + k∗ N . Po sečtení těchto rovnic a vydělení N dostaneme pro celkový počet krav v rovnovážné situaci rovnici v(K∗ ) − K∗ N v (K∗ ) − c = 0. Budeme-li naopak hledat společensky optimální počet krav K∗∗ , tedy počet pro který je celkový užitek maximální, dostaneme rovnici v(K∗∗ ) − K∗∗ v (K∗∗ ) − c = 0. Z našich předpokladů na funkci v dostaneme vztah mezi jednotlivými řeše- ními, K∗ > K∗∗ . Pokud jsou na společné pastvině chovány krávy soukromými sedláky, pak bude pastvina využívána více než je společensky optimální. Intuitivně je to způsobeno tím, že každý sedlák bude zvyšovat počet svých krav až do chvíle, kdy přírůstek hodnoty jeho stáda zvýšením počtu o jednu krávu se přesně 38 vyrovná se ztrátou, která je způsobena snížením produkce všech ostatních krav. Naproti tomu, ve společensky optimální situaci je zvýšení hodnoty po přidání jedné krávy porovnáváno se snížením produkce krav i všech ostatních sedláku. 6.2 Aukce s tajnou nabídkou Při tomto typu aukce napíší účastníci dražby draženou částku do obálky. Nejvyšší nabízená částka pak získává dražený předmět. Uvažujme pro jednoduchost tento typ dražby se dvěma účastníky. Dražbu můžeme modelovat jako bayesovskou statickou hru. Předpokládejme, že skutečná hodnota předmětu pro jednotlivé hráče je v1 a v2. Hráč zná svoji hodnotu, ale ne soupeřovu, které přiřadí stejnoměrné rozdělení. Přitom prostor všech stategií hráčů je dán draženou cenou, tedy B1 = B2 = (0, ∞). Výplata prvního hráče je pak v1 − b1 pokud je b1 > b2 a je rovna nule pokud je b1 < b2. Situaci kdy b1 = b2 budeme moci zanedbat, protože její pravděpodobnost bude rovna nule. Strategií je v této hře funkce bi(vi), která udává nabízenou cenu v závislosti na skutečné hodnotě pro i-tého účastníka aukce. Strategie (b1(v1), b2(v2)) dávají bayesovskou Nashovu rovnováhu, pokud každá z nich řeší optimalizační úlohu max bi (vi − bi)P(bi > bj(vj)). V další analýze se omezíme na strategie dané lineárními funkcemi. Takové omezení je ospravedlněné stejnoměrným rozdělením hodnot vi. 39 Máme tedy b1(v1) = c1 + d1v1 a b2(v2) = c2 + d2v2. Úloha se tak zjednoduší na problém max bi(vi − bi)P(bi > aj + cjvj) Budeme dále předpokládat, že kupujicí nebude nabízet více než maximální možnou nabídku soupeře, a stejně tak ani méně než minimální možnou nabídku soupeře. To znamená aj ≤ bi ≤ aj + cj. Potom P(bi > aj + cjvj) = P(vj > bi − aj cj ), což je rovno bi − aj cj . Řešením optimalizační úlohy dostaneme následující výsledek, bi(vi) = vi + aj 2 pokud vi ≥ aj a bi(vi) = aj pokud vi < aj. Tak dostaneme bayesovskou Nashovu rovnováhu, ve které každý hráč napíše do obálky polovinu hodnoty na kterou si dražený předmět cení. 6.3 Strategie volební kampaně Uvažujme situaci, kdy ve volbách kandidují dvě politické strany. Předpokládejme, že voliči jsou rovnoměrně rozděleni od extremní levice y = 0 po extrémní pravici y = 1. Strategie volební kampaně pro každou stranu spočívá 40 ve zvolení své polohy v politickém spektru, tedy výběru hodnoty si z intervalu (0, 1). Strany tedy nejednají podle svého skutečného přesvědčení, ale strategii zcela podřizují vítězství ve volbách. Volič si ve volbách vybere tu stranu, která je blíže jeho názorům, tedy tu pro kterou je vzdálenost si od voličova y menší. Pokud jsou stejné, rozhodne se náhodně. Výplatní funkce hráčů je dána výsledkem voleb, výhra odpovídá výplatě 1, prohra výplatě 0. Uvažujme nejdříve situaci kdy první strana zvolí levicově orientovanou kampaň, tedy s1 < 1 2 . Pak druhé straně stačí k vítězství zvolit s2 = s1 + pro dostatečně malé , například tak, aby s2 < 1 2 . První strana pak získá všechny hlasy od 0 do průměru s1 a s2, druhá strana získá ostatní hlasy a tedy zvítězí. Taková dvojice strategií není Nashova rovnováha, protože s1 zřejmě není nejlepší odpovědí na s2. Podobně, pokud by první strana zvolila pravicově orientovanou kampaň, tedy s1 > 1 2 , pak by druhé straně stačilo k vítězství zvolit s2 = s1 − pro dostatečně malé , tak, aby s2 > 1 2 . První strana pak získá všechny hlasy od průměru s1 a s2 do 1, druhá strana získá ostatní hlasy a tedy zvítězí. Opět taková situace nemůže být Nashova rovnováha. Zbývá tedy možnost přesně středové kampaně, tedy zvolit s1 = 1 2 . Optimální odpovědí druhého hráče pak je s2 = 1 2 . Naopak, s1 je nejlepší odpovědí na takto zvolené s2. Tato dvojice strategií je tedy jediná volební rovnováha v této hře. 41 Literatura [1] Gibbons R., Game Theory for Applied Economists Princeton University Press, 1992 [2] Binmore K., Playing for Real Oxford University Press, 2007 42