淘客熙熙

主题:【半原创】“游客困境”的介绍(1) -- 四处张望

共:💬66 🌺104
分页树展主题 · 全看首页 上页
/ 5
下页 末页
    • 家园 【8】作者的观点

      这个场景是作者90年提出来得(从参考文献的时间来看),实际上第一篇已经附录了文章的概述,已经可以看到作者提出这个问题的主要关键所在:理性

      我想这个问题之所以引起很多人的疑问其实主要也在“理性”这个词上面,我个人感觉很多人把“理性”解释等同于“合理”,我觉得这个理性(rationality)在西方的哲学理念上到底有何共识值得探讨,不过无论如何在博弈论这个前提下是一个无限回归的相互理解对方是理性的过程。以那个猴子的故事为例,当帽商的孙子不知道猴子是理性的时候,他的行为是理性的(扔帽子),但是猴子其实是理性的,因此他的行为就变成不是理性的了。而在博弈论里面,帽商和猴子相互之间都知道自己是理性的,对方是理性的,对方知道自己是理性的......,因此不会发生这个情况。

      现在的问题,作者认为,就是这个“理性即共识”的假设是逻辑于直觉冲突的根源,而在游客困境这个博弈模型中,直觉才是正确的。目前博弈论的这个问题和数学中的集合论早期遇到的“全集”(包括所有事务的集合)有异曲同工之妙,而这个“全集”导致了集合论的几个悖论。他认为,现在博弈论也要解决这个问题。

      最后如果作者玩这个游戏他会怎样选择?

      赶快把那些博弈论的逻辑忘到九霄云外。我要选一个大数(可能是95),而且我知道我的对手出招也跟我差不多。我还知道,对于那些理性论证,诸如下一个较小的数回避我们已选择的数俄国那国好云云,我统统都会置之不理。
      嘻嘻,是不是有些用理性态度拒绝行为呢?

    • 家园 何必用复杂的话语来解释简单的博弈论原理和例子?
    • 家园 哈哈

      跟我预测的差不多吧,其实大家没想那么多。不过大家的讨论很是深入,这系列的帖子读下来真长见识。

      • 哈哈
        家园 这里的意义就是不管你想多少

        都不会有多少人选2

    • 家园 计算表明,95元利益最大化

      纯理性应该是100元,双赢。但是现实中要考虑到其他人的性格和智力。根据你对手的情况而定。从西西河的统计看,目前71人投票,52人选100,11人选95-99。

      选100,赢得概率是52 / 71,收益是100 X (52 / 71) = 72.2,

      选95的收益是95 X (63 / 71) = 84.3,

      选2的胜率是100%,但收益只有2。

      95胜出。如上面强调的,这是博弈,这和你所在的人群有直接关系。在其他人群,你的选择也应该相应变化。

      • 家园 你的计算有问题,因为选100或95的话,输了也不是0。
      • 家园 你和友来有趣兄的解释本质上是一样的

        其中的想法也正是我在看这篇文章时有所感触的地方,因为这个正好和我看到的老马丁的帖子,我正在重看的《基地》小说交相辉映,才让我在鼓励之下捣鼓这个。

        你们的解释其实都基于对特定人群或者扩大来说对人性的“理性”分析的结果上。但是这样解释可以,形成一个模型就有麻烦。

        有来有趣兄的“非完全理性程度”和你说的概率的前提基础都是事先获得,你统计了西西河投票结果计算的概率能确定在其他地方能用吗?或者说这个统计比率能在其他环境下使用吗?

        假设你们事先获得了足够的非理性数值和概率值,也的确足够准确(假设),用来预测特定场景的时候,参与人自己知道你们的工具或者已经多次参与开始逻辑思考,实现获得的数据是否还能否适用?

        这样看看你们的解释是否类似量子力学的“测不准”原理和《基地》里面心理史学的前提

        • 家园 有统计规律的不确定因素

          你统计了西西河投票结果计算的概率能确定在其他地方能用吗?或者说这个统计比率能在其他环境下使用吗?

          博弈理论,说俗了就是做游戏。玩游戏,你怎么能不了解你的对手呢?西西河的统计我有了,我就可以在西西河玩这个游戏。我有信心,我的玩法,比那些一直出2的人赢得多。事实是检验真理的唯一标准,对不对?所以,出2,是不能指导现实的理论歧途,并不是理性选择。你说分析其他人的行为“这样解释可以,形成一个模型就有麻烦。”那当然是麻烦了,博弈就是麻烦啊。简单的模型有,就是出2,但是输啊。

          这不能普遍适用,就好像玩游戏你不能总一个策略。但是,你的方法是对的,就是,找出你对手的规律。其实囚徒困境,也不是那么简单。如何我们一回合一回合的玩下去,你绝对不可能总选一个结果的。

          参与人自己知道你们的工具或者已经多次参与开始逻辑思考,实现获得的数据是否还能否适用?

          着啊。这是关键所在啊。你怎么能简单总结一个出一个结论,而一直不变呢?那就是刻舟求剑,那就是食古不化。

          说开去,你对手是不确定因素,游戏里有很多不确定因素,他也不过是其中之一。其实这个不确定因素并不是那么不可预测,并不是色子那样的纯随机因素。举个例子,比如你出门遇见的第一辆车的牌子,是随机的,但是有统计规律。

          • 家园 刚刚那个帖子是被吵醒后回复的

            现在再思考了一下,你说得和我说得其实不是一个东西。你说的是一个做为一个玩家计算的方法,从这点上和友来有趣兄的解释其实并不一样。做为一个理论,除了要能解释,还要能预测。对于涉及人的理论,不能够预测个体的行为的话要能够预测群体下的行为或者能从统计结果上和预测对应。

            从玩家的角度上计算这个角度上你的计算没有问题,我也不是质疑这个,而是说如果拿这个去预测就会有问题,最简单就是95这个结果和实际100最多的统计结果冲突。

            刚才刚醒,有些迷迷糊糊,因此没注意到这个问题。

            • 家园 博弈和进化

              你说得对,这个方法不能预测。但是呢,这里面确实不存在预测的问题,而只有两点:适应和变化。这是从生物进化来的。

              其实博弈和生物进化有千丝万缕的联系。生物的生存策略,在亿万年的适者生存的淘汰中已经被优化很多了。他们是没有预测能力,进化的诀窍在于,适应和突变。同样,假如人要为这个游戏建立数学模型,写个程序,最上乘的无疑是有进化能力的,那最接近智能。

              博弈是研究智能的,对不对?你知道你的对手是个人,这条信息本身就有巨大的信息量。他是一个经历了亿万年进化的产物,是高级生命的一员,他的智能是可以预测的。我不是在和一个色子玩。如果和色子玩,那是另一个玩法了。那他可不可能是个傻子呢?可能,但这仍然是个概率问题。

              我看了你最新的帖子,后面提到了利他。那个作者显然不懂进化论,把利他行为当作一个既成事实接受了,而看不出其后的大道理。也就是说,一直出2的人,以最保守的不合作的态度确保最低限度的收益,在自然环境中,是出于生存劣势的,不可能在人口中占大比例。其实人性是进化的产物,利他行为正是深烙在人性里的策略优化的产物,这才正是博弈要研究的。

              • 家园 先花上

                河里的兄弟果然厉害,直觉太好。谈到进化论,我举个好玩的例子请大家猜猜。

                除了纯策略之外(就是说要么一定选A,要么一定选B),引进概率的话,那么这个策略就称为混合策略。比如说我有两个选项,我的策略是以概率p选择A,概率1-p选择B.这称为一个混合策略。

                题目:假设现在有两条狗,碰到同一只猎物,它们决定是决斗(称为策略鹰),还是让开(称为策略鸽)。支付矩阵如下:

                鹰 鸽

                鹰 -2,-2 4,0

                鸽 0 ,4 2,2

                意思就是说:两只都决定决斗,那么,狗咬狗,一嘴毛,都受伤。两只都决定退让,那么平分食物。如果一只决斗,另一只退让,那么狠的那只得到全部食物。

                狗的选择代表它的类型。也就是说,如果选择鹰的概率为p,意即狗群里面有比例为p的狗选择鹰,1-p的狗选择鸽。

                大家猜一猜进化的结果会是怎样?(即决定选择决斗的概率p的数值)。

                答案就在下帖,大家可以先猜猜看在看答案。

                • 家园 答案。

                  -----

                  答案

                  -----

                  也许大家都猜出来了,p=1/2。是一个进化下的稳定均衡。也可称为一个进化稳定策略(Evolutionarily Stable Strategy)。

                  大家可能各有各的理由,我说一下博弈论的思路。

                  假设狗群里面鹰派的比例为p*,则对某只狗的选择来说,它碰到对手是鹰派的概率为p*,鸽派概率为1-p*,它将选择概率p以最大化它的预期收益:

                  -2pp* + 4p(1-p*) + 0 + 2(1-p)(1-p*)

                  = (2-4p*)p -2p* +2

                  当p*<1/2时,选择是p=1。

                  当p*=1/2时,选择两者都无所谓。

                  当p*>1/2时,选择是p=0。

                  让我们看看会发生什么事情,

                  当p*<1/2时,狗都会以概率1选择鹰派,使得种群里面p*(鹰派比例)上升。

                  当p*=1/2时,随机选择。

                  当p*>1/2时,狗都会以概率1选择鸽派,使得种群里面p*(鹰派比例)下降。

                  结果是:狗种群中鹰鸽比例维持在1:1的稳定结构。

                  博弈论应用于生物进化论的研究应该是已经有很长时间的历史了。

                  事实上可以证明ESS就是一个Nash均衡。

                  大家都看过《美丽心灵》吧,就是讲这位Nash的故事,以短短几页(十几页?不好意思记不清了)的一篇论文拿到纪念诺贝尔经济学奖,绝对是荣至实归的,呵呵。

                  可参看:http://www.nobelprizes.com/nobel/economics/1994b.html

                  • 家园 觉得鹰-鸽组合概率最大

                    呵呵,不懂博弈论,觉得鹰-鸽组合概率最大,也可以说明双赢,双输现象在社会进化中输给“阶级”的现象

分页树展主题 · 全看首页 上页
/ 5
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河