淘客熙熙

主题:【原创】日志随笔短平快-by 老马丁 -- 老马丁

共:💬988 🌺3533 🌵17
全看分页树展 · 主题 跟帖
家园 重复囚徒困境和囚徒困境还是不一样的吧

正如你所说的,囚徒困境只是两个人博弈;重复囚徒困境是多人博弈。我所指的重复囚徒困境好像就是演化博弈论的范围内的呀。

这里还是把原文链接和文摘都放这里吧:

美国密西根大学一位叫做罗伯特·爱克斯罗德的人是一个政治科学家,他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。关键问题在于,他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”。

    “重复的囚徒困境”更逼真地反映了具有经常而长期性的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过多次的交手树立了或好或差的声誉。虽然如此,对方的程序下一步将会如何举动却仍然极难确定。实际上,这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗?或者,它能总是采取背叛行动吗?它是否应该对对手的举动回之以更为复杂的举措?如果是,那会是怎么样的举措呢?

1. "Effective Choice in the Prisoner's Dilemma", Robert Axelrod, The Journal of Conflict Resolution, Vol. 24, No.1 (Mar., 1980), 3-25.

2. "More Effective Choice in the Prisoner's Dilemma", Robert Axelrod, The Journal of Conflict Resolution, Vol. 24, No. 3(Sep., 1980), 279-403.

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河