Dacă ni se prezintă un joc de două persoane cu sumă zero, știm că primul nostru pas este să căutăm un punct de echilibru. Dacă un joc are un punct de echilibru, atunci știm că jucătorii noștri ar trebui să joace perechea de strategii corespunzătoare. În acest caz, perechea de echilibru și vectorul său de câștig este „soluția” pentru joc. În acest capitol vom explora jocurile care nu au neapărat un punct de echilibru. Vom încerca, de asemenea, să stabilim ce ar trebui să facă un jucător dacă joacă jocul în mod repetat.
Acum că suntem experți în găsirea perechilor de echilibru, ce se întâmplă atunci când un joc nu are perechi de echilibru? Ce ar trebui să facă jucătorii noștri?
Exemplul 3.1.1 Un joc repetat 2 x 2. Luați în considerare următorul joc cu sumă zero
1 | 0 |
-1 | 2 |
Acest joc are o pereche de echilibru? Joacă acest joc cu un adversar de 10 ori. Înregistrați-vă câștigurile și pierderile. Descrieți cum ați ales ce strategie să jucați. Descrieți cum a ales oponentul ce strategie să joace.
Când joci de mai multe ori, are sens ca oricare dintre jucători să joace aceeași strategie tot timpul? De ce da, sau de ce nu?
Deși folosim termenul „strategie” pentru a însemna ce rând (sau coloană) alege un jucător să joace, ne vom referi și la modul în care un jucător joacă un joc repetat ca strategie a jucătorului. Pentru a evita confuziile, în jocurile repetate vom defini câteva strategii specifice.
Definiția 3.1.2 Într-un joc repetat, dacă un jucător joacă întotdeauna același rând (sau coloană), spunem că joacă o strategie pură.
De exemplu, dacă jucătorul 1 joacă întotdeauna rândul A, spunem că joacă strategia pură A.
Definiția 3.1.3 Dacă un jucător variază rândul (sau coloana) pe care îl joacă, atunci spunem că joacă o strategie mixtă.
De exemplu, dacă un jucător joacă rândul A 40% din timp și rândul B 60% din timp, vom spune că joacă o strategie (.4, .6), deoarece în general folosim probabilitatea mai degrabă decât procentul. Probabilitățile fiecărei strategii vor fi enumerate în aceeași ordine ca strategiile din matrice.
Nu este suficient doar să determinați cât de des să jucați o strategie. Să presupunem că jucătorul 1 doar alternează rândurile din exemplul 3.1.1. Jucătorul 2 îl poate „depăși” pe jucătorul 1? Care ar putea fi o modalitate mai bună pentru jucătorul 1 de a juca?
Ne-am dori foarte mult să găsim o modalitate de a determina cea mai bună strategie mixtă pentru fiecare jucător în jocuri repetate. Să începem cu ceea ce știm deja: jocuri cu puncte de echilibru. Dacă un joc are o pereche de echilibru, ar dori un jucător să joace o strategie mixtă? Amintiți-vă că o pereche de strategie este o pereche de echilibru dacă niciun jucător nu câștigă prin schimbarea strategiei.
Exemplul 3.1.4 Repetarea unui joc cu un echilibru. Luați în considerare următorul joc cu sumă zero:
-1 | 1 |
0 | 2 |
Acest joc are o pereche de echilibru. Convinge-te că, dacă acest joc este jucat în mod repetat, fiecare jucător ar trebui să aleagă să joace o strategie pură.
Astfel, dacă jocul are un echilibru, știm că jucătorii vor juca strategiile pure determinate de perechile de echilibru. Așa că să revenim la jocurile fără perechi de echilibru. Dacă jucăm un astfel de joc o dată, putem prezice rezultatul? Dar dacă repetăm jocul de mai multe ori – putem prezice rezultatul? Gândește-te să arunci o monedă. Dacă o arunci o dată, poți prezice rezultatul? Ce se întâmplă dacă o arunci de 100 de ori – poți prezice rezultatul? Nu tocmai, dar putem spune la ce ne așteptăm: dacă aruncăm o monedă de 100 de ori, ne așteptăm să avem jumătate din cazuri să cadă banul (revers) și jumătate să cadă stema (avers). Acesta poate să nu fie rezultatul real, dar este o predicție rezonabilă. Acum este un moment bun să vă amintiți despre găsirea valorii așteptate!!
Amintiți-vă de jocul familiar Piatră-Hârtie-Foarfecă: PIATRA învinge FOARFECA, FOARFECA învinge HÂRTIA și HÂRTIA învinge PIATRA. Folosind matricea de plăți și experimente, vom încerca să determinăm cea mai bună strategie pentru acest joc.
Exercițiul 3.1.5 Matricea plăților PHF. Construiți o matrice de joc pentru piatră-hârtie-foarfecă.
Exercițiul 3.1.6 RPS și puncte de echilibru. Este Piatră-Hârtie-Foarfecă un joc cu sumă zero? Are un punct de echilibru? Explică.
Exercițiul 3.1.7 Joacă PHF. Vrem să ne uităm la ce se întâmplă dacă repetăm jocul piatră-hârtie-foarfecă. Jucați jocul de zece ori cu un adversar. Înregistrați rezultatele (listați perechile de strategii și câștigurile pentru fiecare jucător).
Exercițiul 3.1.8 Conjectura unei strategii. Descrieți orice strategie pe care ați folosit-o în Exercițiul 3.1.7.
Exercițiul 3.1.9 Punctele tari și punctele slabe ale strategiei dvs. Reflectați asupra strategiei alese. Vă garantează un „câștig”? Ce ar trebui să însemne „a câștiga” într-un joc repetat? Care sunt punctele forte și punctele slabe ale strategiei dvs.?
Exercițiul 3.1.10 Împărtășiți strategia. Discutați strategia dvs. cu altcineva (poate fi chiar adversarul dvs.). După ce v-ați împărtășit ideile pentru o strategie, vă puteți îmbunătăți strategia anterioară?
Deși este posibil să fi venit cu o strategie bună, să vedem dacă nu putem decide care ar trebui să fie „cea mai bună” strategie pentru Piatră-Hârtie-Foarfecă. Să presupunem că jucăm Piatră-Hârtie-Foarfecă împotriva celui mai inteligent jucător care a existat vreodată. Vom numi un astfel de adversar jucătorul „perfect”.
Exercițiul 3.1.11 Slăbiciunea unei strategii pure. Explicați de ce nu este o idee bună să folosiți o strategie pură; adică să jucați doar PIATRĂ, doar HÂRTIE sau doar FOARFECĂ.
Exercițiul 3.1.12 O strategie neuniformă. Are sens să jucați o opțiune mai des decât alta (de exemplu, PIATRĂ mai des decât HÂRTIE)? Explicați.
Exercițiul 3.1.13 Frecvența lui P, H, F. Cât de des ar trebui să jucați fiecare opțiune?
Exercițiul 3.1.14 Redarea unui model. Vreți să jucați într-un model previzibil sau aleatoriu? Care sunt unele avantajele și dezavantajele unui model? Care sunt unele avantajele și dezavantajele unei strategii aleatorii?
Sper că ați ajuns la concluzia că cea mai bună strategie împotriva jucătorului nostru perfect ar fi să jucați PIATRĂ, HÂRTIE, FOARFECĂ 1/3 din timp pentru fiecare, și să jucați la întâmplare. Putem spune că strategia noastră este să jucăm aleatoriu fiecare opțiune cu o probabilitate de 1/3 și numim aceasta strategie aleatoriu (1/3, 1/3, 1/3).
Exercițiul 3.1.15 Rambursare pe termen lung. Folosind această „cea mai bună” strategie, care preziceți că va fi câștigul pe termen lung pentru jucătorul 1? Dar pentru jucătorul 2?
Exercițiul 3.1.16 Testarea strategiei aleatoriu (1/3, 1/3, 1/3). Să ne verificăm predicția. Folosind o matrice, fie ca 1 și 2 să reprezinte PIATRĂ, 3 și 4 reprezintă HÂRTIE, iar 5 și 6 reprezintă FOARFECĂ. Jucați jocul de 20 de ori cu altcineva, unde fiecare jucător alege dintre PIATRĂ, HÂRTIE sau FOARFECĂ. Urmăriți perechile de strategii și câștigurile. Care a fost câștigul total pentru fiecare jucător? (În acest moment, dacă tot simțiți că aveți o strategie mai bună, încercați strategia împotriva celei aleatorii – vedeți ce se întâmplă!)
Exercițiul 3.1.17 Comparați cu predicția dvs. Cum se compară rezultatul real cu rezultatul previzionat? Ce vă așteptați să se întâmple dacă jucați jocul de 100 de ori? (sau mai multe?)
Folosind ideile despre probabilitate și valoarea așteptată, putem răspunde mai precis la Exercițiul 3.1.17.
Exercițiul 3.1.18 Probabilități când ambii jucători joacă strategia aleatorie. Să presupunem că ambii jucători folosesc strategia aleatorie (1/3, 1/3, 1/3). Enumerați toate rezultatele posibile pentru un singur joc (rețineți că rezultatul este perechea de strategii și câștigul, de exemplu [P, H], (-1,1)). Care este probabilitatea ca o anumită pereche de strategii să fie jucată? Sunt perechile de strategii la fel de probabile?
Exercițiul 3.1.19 Valoarea așteptată. Folosind probabilitățile și câștigurile din exercițiul 3.1.18, calculați valoarea așteptată a jocului pentru fiecare jucător.
Exercițiul 3.1.20 Strategie pentru jocul repetat 2 x 2. Acum luați în considerare matricea din Exemplul 3.1.1 de mai sus:
1 | 0 |
-1 | 2 |
Vedeți dacă puteți determina cât de des ar trebui să joace jucătorul 1 fiecare rând și cât de des ar trebui să joace jucătorul 2 fiecare coloană. Încercați să testați strategia propusă (s-ar putea să puteți utiliza o variație a zarurilor, așa cum am văzut în Exercițiul 3.1.16). Scrieți orice strategii presupuse și rezultatele din jocul cu strategia dvs. Credeți că ați folosit cea mai bună strategie? Explicați.
Poate că ați avut o idee despre cel mai bun mod de a juca Piatră-Hârtie-Foarfecă înainte de a lucra prin această secțiune, dar cum putem găsi soluții pentru alte jocuri, cum ar fi cel din Exercițiul 3.1.20? Nu vrem să folosim doar o metodă „ghiciți și verificați”. Mai ales că există o infinitate de strategii mixte posibile de încercat! Restul capitolului va dezvolta metode matematice pentru rezolvarea jocurilor repetate fără punct de echilibru.
Sursa: Nordstrom, Jennifer Firkins, „Introduction to Game Theory: A Discovery Approach” (2020). Linfield Authors Book Gallery. 83, licența CC BY-SA 4.0. Traducere și adaptare Nicolae Sfetcu
Lasă un răspuns