主题：【原创】纳什均衡即为势--对博弈论的分析 -- baiqi

：比如说石头剪刀布。如果没有混合策略模型，照里说虽然有平衡点（三个平衡点：两人出石头，两人出剪刀，两人出布），但是根本就不会趋于这三个平衡点（三个，如何趋于？）。但是，如果对方就认准你出三者的概率是p1,p2,p3,而你认识他出三者的概率为q1,q2,q3,这个平衡点经过运算后就只会是一个（如：两人出包）。

你举的这个例子，诠释当中有不少需要补充的内容，正好博弈论是我的论文方向，而我导师也有一篇很有意思的文章研究过石头剪刀布游戏。

首先，“如果没有混合策略模型”是个超级大的假设。这三个策略是如此的对称，因此最有意义的均衡自然是每个玩家以1/3，1/3，1/3的混合策略参与游戏。你提出的其实是一个已有不少理论研究话题，即有多个Nash Equilibria时的Equilibrium Selection问题。因为某些原因settle在某个特定的均衡上（如两人出包）是可以的，但是需要一些额外的东西来break the symmetry，比如你提到的熟人之间的默契，类似于focal point的解释。

接下来说那个自然的混合策略，我导师提出的问题是，真的就必然要收敛到这个混合均衡吗？回答这个问题需要之前game theory没有太多深究的一样东西，即off equilibrium dynamics：玩家在尚未到达均衡之际（其实大部分时间都是off equilibrium的）是如何对别人的策略做出反应的。简单说一下结论，如果是个good Rock-paper-scissors game（比如赢了得1，输了扣0.5），那么混合策略是收敛且稳定的；而要是个bad Rock-paper-scissors（赢了得1，输了扣2），那才有趣，不收敛，且只要稍有扰动就会奔一个围绕着1/3,1/3,1/3打转转。

点看全图

外链图片需谨慎，可能会被源头改

注：上图仅左下角的那个金字塔描述了RPS game,其他三张无关本主题，请忽视。

而且如果是带平局的Rock-paper-scissors，混沌可以观察到。

复我有一个想法

家园

有點道理

我有個cornell的朋友就是做power law的社會心理學研究的.人類都有羊群心理. 容易出現正反饋的現象,就是越多人這麽做,其他人也容易做.

复补充一下

家园

重复博弈相比一次博弈产生了质变

其实是我的失误，在混合策略下的均衡点就是一个概率向量（p1,p2,p3,q1,q2,q3),在一般的包剪锤游戏中为(1/3,1/3,1/3,1/3,1/3,1/3).熟人之间产生经常有相同的出拳情况，应该是另有解释。比如说在重复博弈时pi,qi不断的变动，最后产生了p(A出某拳【此拳与B相同】|B出某拳）的概率十分大，在无穷次重复博弈时，概率为100%。这个也可与纳什均衡无矛盾，他们出各拳的概率为1/3,但是出相同的拳的概率为1.但是这个具体是怎么来的，真应了你说的那句，要考虑“玩家在尚未到达均衡之际（其实大部分时间都是off equilibrium的）是如何对别人的策略做出反应的”。如果你有什么见解，请不吝赐教。

另外一个，不光是你这儿提到的，混合策略模型中重复博弈不能趋于绝对理性人一次博弈得到的结果；其实重复博弈相比一次博弈产生了质变，普遍会得到不同的结果。

例如囚徒困境，如果是重复博弈的话，那么囚徒会认识到合作的可能性，并试探之。如果某个囚徒采取一报还一报的策略（1.第一次是合作2.以后每一次视对方上一次是合作还是背叛来作出决择：对方上一次与我合作[即两人都不招供]我这回就合作，上一回背叛我，那么我这回也要背叛）那么如果有n个囚徒两两重复博弈，这一策略却是得分最高的。

所以重复博弈、多人博弈都带来了游戏的质变。

你给出的链接我看了，你要阐述的主旨大体明白，但图例还有不懂的地方，尤其是一些字母的含义。另外有个想法，不妨这样思考：重复博弈会带来质变，如果在重复博弈下考察趋进这个问题，事实上整个游戏都变了，不如换成绝对理性人一次博弈，根据你给出的bad rps game的规则，看看会得到什么结果。按照纳什的博弈论，有个均衡解。也就是有个均衡概率向量。而如果变成重复博弈，每个理性人在第一次就产生了均衡解，往后会如何发展呢？重复博弈到底有什么本质的不同？这真是个很大的问题啊。

复重复博弈相比一次博弈产生了质变

家园

我认为重复博弈的和一次博弈的本质不同是

受到规则的“奖惩”而不停修正自己的行为。

我认为，纳什模型的一个本质缺陷是没有把规则当作博弈本身的一部分，因而是静态的。

如考虑囚徒困境，不能只把囚徒当作一个整体，而是要把警察和囚徒当成一个整体来看，从而得出一个整体的博弈结果--从这个整体结果的趋向来看才合理，而不是把囚徒就看成一个整体。因而，囚徒困境的实质只是一个规则导向的问题--就是您说的“势”。

请您看下我这个根据八卦折腾出来的模型：http://www.ccthere.com/article/3034853。

“你我他”模型，我以为是这个世界运行的本质模型，可以无限推广。

所以，我以为人类社会其实也是有分形的，本质是：

1。所有行为从长期来看都是受到我们未能掌握的天道制约的。

2。人类社会的存在形式

a。目的：拥有更多的“力”