Dacă doi jucători joacă dilema prizonierului de mai multe ori la rând, își amintesc acțiunile anterioare ale adversarului ceea ce le permite să-și schimbe strategia în consecință; jocul se numește dilema prizonierului repetată.
În plus față de forma generală de mai sus, versiunea repetată necesită, de asemenea, ca 2 R > T + S , pentru a preveni cooperarea alternativă și defectarea, oferind o recompensă mai mare decât cooperarea reciprocă. (Dacă ambii jucători cooperează, amândoi primesc recompensa R pentru cooperare. Dacă ambii jucători defectează, amândoi primesc plata pedepsei P. Dacă Albastrul defectează în timp ce Roșu cooperează, atunci Albastrul primește recompensa pentru tentație T, în timp ce Roșu primește plata „fraierului”, S. În mod similar, dacă Albastru cooperează în timp ce Roșu defectează, atunci Albastrul primește recompensa S, în timp ce Roșu primește recompensa T pentru tentație.)
Jocul dilemei prizonierului repetată este fundamental pentru unele teorii ale cooperării și încrederii umane. Presupunând că jocul modelează în mod eficient tranzacțiile dintre doi oameni care necesită încredere, comportamentul cooperant în populații poate fi modelat printr-o versiune repetată a jocului pentru mai mulți jucători. În 1975, Grofman și Pool au estimat numărul articolelor academice dedicate acesteia la peste 2.000. Dilema repetată a prizonierului este numită și „jocul pace-război”.
Strategia generală
Dacă dilema prizonierului repetată este jucată de un număr finit de ori și ambii jucători știu acest lucru, atunci strategia dominantă și echilibrul Nash este defectarea în toate rundele. Dovada este inductivă: la fel de bine s-ar putea defecta la ultima rundă, deoarece adversarul nu va avea șansa de a riposta ulterior. Prin urmare, ambii vor defecta la ultima rundă. Astfel, jucătorul ar putea la fel de bine să defecteze în penultima rundă, deoarece adversarul va defecta în ultima, indiferent de ceea ce se face și așa mai departe. Același lucru se aplică dacă durata jocului este necunoscută, dar are o limită superioară cunoscută.
Pentru ca o cooperare să apară între jucători raționali, numărul de runde trebuie să fie necunoscut sau infinit. În acest caz, „defectarea întotdeauna” poate să nu mai fie o strategie strict dominantă, ci doar un echilibru Nash. După cum a arătat Robert Aumann într-o lucrare din 1959, jucătorii raționali care interacționează în mod repetat pentru jocuri de lungă durată pot susține cooperarea. Mai exact, un jucător poate fi mai puțin dispus să coopereze dacă omologul său nu a cooperat de multe ori, ceea ce provoacă dezamăgire. În schimb, odată cu trecerea timpului, probabilitatea cooperării tinde să crească, datorită stabilirii unui „acord tacit” între jucătorii participanți. Un alt aspect al dilemei prizonierului repetată este că acest acord tacit între jucători a fost întotdeauna stabilit cu succes chiar și atunci când numărul de iterații este făcut public ambelor părți.
Potrivit unui studiu experimental din 2019 din American Economic Review, care a testat ce strategii au folosit subiecții din viața reală în situațiile de dilemă ale deținuților repetate cu monitorizare perfectă, majoritatea strategiilor alese au fost întotdeauna defectarea, retorsiunea și severitatea. Strategia aleasă de subiecți depindea de parametrii jocului.
(Include texte traduse și adaptate din Wikipedia de Nicolae Sfetcu)
Lasă un răspuns