Hvad er fangernes dilemma?

I selve spillet er straffe (og belønninger, hvor det er relevant) repræsenteret af nytte numre. Positive tal repræsenterer gode resultater, negative tal repræsenterer dårlige resultater, og et resultat er bedre end et andet, hvis antallet der er knyttet til det er større. (Vær dog forsigtig med, hvordan dette fungerer for negative tal, da -5 for eksempel er større end -20!)

I tabellen ovenfor henviser det første tal i hver boks til resultatet for spiller 1, og det andet nummer repræsenterer resultatet for spiller 2. Disse tal repræsenterer kun et af mange sæt numre, der er i overensstemmelse med fangenes dilemmaopsætning.

Når et spil er defineret, er det næste trin i at analysere spillet at vurdere spillernes strategier og prøve at forstå, hvordan spillerne sandsynligvis opfører sig. Økonomer laver et par antagelser, når de analyserer spil - først antager de, at begge spillere er opmærksomme på udbetalingen både for sig selv og for den anden spiller, og for det andet antager de, at begge spillere kigger efter til rationelt maksimere deres egen udbetaling fra spillet.

instagram viewer

En let indledende tilgang er at kigge efter, hvad der kaldes dominerende strategier- strategier, der er bedst uanset hvilken strategi den anden spiller vælger. I eksemplet ovenfor er det at vælge at tilstå en dominerende strategi for begge spillere:

I betragtning af at tilståelse er bedst for begge spillere, er det ikke overraskende, at resultatet, hvor begge spillere tilstår, er et ligevægtsresultat af spillet. Når det er sagt, er det vigtigt at være lidt mere præcis med vores definition.

Begrebet a Nash-ligevægt blev kodificeret af matematiker og spilteoretiker John Nash. Kort sagt er en Nash Equilibrium et sæt best-respons-strategier. For et to-player-spil er en Nash-ligevægt et resultat, hvor spiller 2's strategi er det bedste svar på spiller 1's strategi, og spiller 1's strategi er det bedste svar på spiller 2's strategi.

At finde Nash-ligevægten via dette princip kan illustreres i tabellen over resultater. I dette eksempel cirkler spiller 2's bedste svar på spiller en med grønt. Hvis spiller 1 tilstår, er spiller 2's bedste respons at tilstå, da -6 er bedre end -10. Hvis spiller 1 ikke tilstår, er spiller 2's bedste respons at tilstå, da 0 er bedre end -1. (Bemærk, at denne begrundelse ligner meget den begrundelse, der bruges til at identificere dominerende strategier.)

Player 1s bedste svar er cirklet i blåt. Hvis spiller 2 tilstår, er spiller 1's bedste respons at tilstå, da -6 er bedre end -10. Hvis spiller 2 ikke tilstår, er spiller 1's bedste respons at tilstå, da 0 er bedre end -1.

Nash-ligevægten er resultatet, hvor der er både en grøn cirkel og en blå cirkel, da dette repræsenterer et sæt bedste responsstrategier for begge spillere. Generelt er det muligt at have flere Nash-ligevægte eller slet ingen (i det mindste i rene strategier som beskrevet her).

Du har måske bemærket, at Nash-ligevægten i dette eksempel virker suboptimal på en måde (specifikt, idet det ikke er Pareto optimalt), da det er muligt for begge spillere at få -1 snarere end -6. Dette er et naturligt resultat af den interaktion, der er til stede i spillet - i teorien, ville det ikke være en at tilstå optimal strategi for gruppen samlet, men individuelle incitamenter forhindrer, at dette resultat bliver opnået. For eksempel, hvis spiller 1 troede, at spiller 2 ville forblive tavs, ville han have et incitament til at ratere ham frem for at forblive tavs, og vice versa.

Af denne grund kan en Nash-ligevægt også betragtes som et resultat, hvor ingen spiller har et incitament til ensidigt (dvs. af sig selv) at afvige fra strategien, der førte til dette resultat. I eksemplet ovenfor, når spillerne først vælger at tilstå, kan ingen af spillerne gøre det bedre ved at skifte mening.