淘客熙熙

主题:【原创】囚徒和胆小鬼 -- 淮夷

共:💬20 🌺170
全看分页树展 · 主题
家园 【原创】囚徒和胆小鬼

点看全图

外链图片需谨慎,可能会被源头改

《Prisoner's Dilemma》是我近来读的一本非常精彩的科普书籍。此书的名字来自博弈论中的囚徒困境问题。

我对博弈论的兴趣大约是一份无名报纸触发的。大约15年前,有一次在阅报栏看报,那天的报纸介绍了囚徒困境以及该问题的纳什均衡解。我站在阅报栏前,被那个有趣的问题深深吸引。此事引发我后来读了一些博弈论的书籍,在我的brainstorm中甚至构思过用博弈论解释中国古典小说中的一些情节,比如水浒传中晁盖和宋江两大团伙的共生现象。

这部《Prisoner's Dilemma》不仅是关于博弈论的,作者很巧妙的把冯诺依曼(John Von Neumann)的生平、博弈论的演化、美苏的冷战,编织在一起。不论你喜欢的是传记、数学、或历史,这本书也许都是你的那杯茶。

冯诺依曼是20世纪最杰出的数学家之一。书中对他在计算机和原子弹研制等领域的天才贡献皆有叙述,而最吸引我的部分,是他创立了博弈论。

冯诺依曼对博弈论的兴趣,发源于他童年时代的一种德国军棋游戏,叫做kriegspiel。这个词是德语,字面意思是war game。19世纪时,这种游戏在德国军校用于训练军官的战略能力。棋盘上画着军事地图,象征德法边界,游戏者调动棋子模拟两国交战,根据对方的反应决定自己的最佳行棋策略。

点看全图

外链图片需谨慎,可能会被源头改

(德国军棋)

棋类游戏与博弈论的联系似乎是天然的,这从博弈论的名字Game Theory就看得出来,它的本源乃是关于游戏的。任何游戏都涉及合作和对抗,合作与对抗正是博弈论研究的对象。

军棋游戏让冯诺依曼认识到博弈论的价值。他之后的另一个天才John Nash也是位棋迷。在传记电影《A Beautiful Mind》里面,我记得有一个镜头描写Nash在普林斯顿大学的草坪上,和同学对弈中国围棋,这种古老的游戏蕴含着深刻的人生之道。除了围棋,据史料记载,Nash常玩的游戏还有西洋象棋、西洋双陆棋、以及德国军棋。

今天的博弈论作为一门科学已经发展出相当复杂的抽象模型,不再是简单的棋牌游戏,但是此书的一大优点在于,作者并未借助任何复杂的数学工具来说明博弈论问题。实际上,许多经典的博弈论问题均来自人们的日常生活,而不是数学家的纸上想象。理解这些问题有助于看清很多社会和自然现象,这不需要什么高等数学,只需要common sense就够了。

譬如书中讲到自然界存在的动物互惠关系。有一种小鸟叫做ziczacs,和鳄鱼生活在一起。小鸟钻入鳄鱼的口中吃掉寄生虫,鳄鱼得到了口腔卫生,小鸟得到了食物。这种行为令生物学家感到困惑。在达尔文主义看来,弱肉强食和尔虞我诈乃是自然界的竞争法则,鳄鱼完全可以选择欺骗,等小鸟吃掉口中的虫子之后,再吃掉小鸟。难道鳄鱼没有“欺骗基因”吗?

鳄鱼和小鸟面临的是一个典型的囚徒困境问题。鳄鱼的最优选择是欺骗,那么小鸟的最优对策是不合作(远离鳄鱼),以欺骗对付欺骗,这就是所谓的纳什均衡。纳什均衡显然并非动物的选择,鳄鱼与小鸟选择了令生物学家不解的合作关系,对此,博弈论的解释是两者是重复博弈而不是单次博弈,重复博弈的最佳策略是合作而非欺骗。

我几乎可以肯定鳄鱼或小鸟是不懂博弈论的,它们的选择并不是脑子里进行了数学计算,而是一代代的行为记忆,使其自然发展出了符合博弈论预测的共存关系。

我几乎还可以肯定“欺骗”或“自私”的基因深藏于鳄鱼乃至人类的本能之中。博弈论并没有挑战亚当斯密的自私人性假说,也不关心道德的高尚或者卑鄙,它只是一门纯粹的应用数学。但是,博弈论的诞生对古典经济学家赞颂的自私贪婪之心是一个绝好的讽刺,须知,在许多博弈论的实验中,一个极度自私的人在博弈程序中往往是最后的输家。

从这个角度来说,尽管博弈论没能扭转我对人性本恶的悲观态度,但是它揭示出的道理是值得广为传播的----合作和利他在人类社会中往往是最佳的博弈策略,这并不是为了追求善,而只是为了你最大的私利。

若说胡锦涛根据博弈论提出了“和谐社会”理论或许只是我的玩笑,但是中国人常说的“吃亏是福”的理念确实可用博弈论给予很好的解读。这方面有一个经典例子,就是本书中提及的Shubik’s dollar auction。

Shubik是一个经济学家,他创设出了一个拍卖游戏。拍卖标的是1美元现钞,竞拍人以1美分为单位逐步加价。拍卖的规则很简单:出价最高者得到1美元,但是出价第二高者也必须支付其出价且一无所得。

假如你和另外一个人竞拍1美元,而你是第一个报价的,那么你的最优策略是什么呢?

策略1:出价1美分。

你的对手肯定愿意出2美分。你面临的是要么出3美分得到97美分利润,要么放弃竞拍而承担1美分损失。无疑,你会选择出3美分。同样逻辑,对手愿意出4美分。竞标会一直攀升下去,直到竞价远大于1美元。用超出1美元现金竞买1美元现金,是荒谬的。但是,出价次高者为了其损失最小,双方必定会拍出一个lose-lose的结果,也就是所谓的winner’s curse。

策略2:直接出价99美分。

你最多只有1美分的利润。而一旦你的对手报价1美元,你为了止损只得加价,winner’s curse再次出现。

策略3:直接出价1美元。

你无利可图,还要承担风险(假如你的对手发疯出价1.01美元,你该怎么办)。

策略4:直接出价超过1美元。

你的对手也许没疯,但是你肯定疯了。

显然,以上策略都不是最优的。最优的策略其实是不要参加,听任你的对手用1美分得到1美元。博弈论教一个人要抑制贪念,选择吃亏,这和中国的处世哲学可谓不谋而合。

不过,博弈论并非一味的教人温良恭让。在某些类型的游戏中,最好的策略是做一个蛮不讲理的恶人,而不是做规规矩矩的好人。

这类游戏的最典型代表,当属书中介绍的chicken game (胆小鬼游戏)。

胆小鬼游戏来自50年代电影里面洛杉矶青少年比赛撞车的场面。设想两个人各自开车,沿着高速公路迎面相对,在即将相撞的一刹,假如一方怕死而打方向盘避让,不怕死的那个成为英雄,选择避让的被称作chicken(英语中意为胆小鬼)而成为输家。

囚徒困境的最优选择是双方互相欺骗,胆小鬼游戏不同。如果两个车手都选择了欺骗(伪装不怕死),那么结果必定是两人撞死,这是最惨的一种结果。如果用一个2x2的矩阵表示,胆小鬼游戏是存在两个纳什均衡解的,那就是当一方避让时,另一方不避让。这意味着,胆小鬼游戏必然存在赢家和输家,win-win(双方同时避让)是没有可能的。

避让 不避让

避让 2,2 1,3

不避让 3,1 0,0

那么,在胆小鬼游戏的实验中,什么样的人可以获胜呢?

本书作者设想了这样一些情形,比如,你的对面来车司机是一个醉汉、或者有自杀倾向、或者开到中途把方向盘扔出窗外、或者是一个被遥控的玩偶其避让与否完全随机决定,等等。总之,你的对手是非理性的,那么你的最优策略是选择避让。

换言之,有些时候你必须选择做一个胆小鬼,这是你针对不讲理的对手最好的策略。这种现象在国际政治角力之中,可算屡见不鲜。比如美苏冷战时代的古巴导弹危机,面对肯尼迪总统的战争威胁,苏联在最后一刻选择了避让,充当了胆小鬼。

这种国际政治中的chicken game衍生出一些意思相近的博弈策略,比如brinkmanship(铤而走险的边缘政策)以及madman theory(疯子理论)。

疯子理论的创造者是尼克松。70年代,面对越南战争的泥潭,尼克松自创出一个新词“madman theory”。尼克松把自己比喻成疯子,他说,“我希望北越明白,我已经到了不顾一切的地步。如果越战还不能迅速结束,我的手会放在核按钮上。”

尼克松认为,他的疯子理论会让胡志明两天之内乖乖的乞和。但是历史已经证明,胡志明比尼克松更疯,所以最后当了胆小鬼的是美国而非越共。

无疑,brinkmanship并不适合尼克松,因为美国是一个民主国家,民众不会允许总统发疯。反倒是当今美国圈定的流氓国家,譬如不怕死的朝鲜和死不怕的伊朗,倒是很适合把疯子理论运用到极致。

如今美韩在黄海的军演闹的沸沸扬扬。中国声称要做一个负责任的大国,想来这一次是选择理性,而不肯大动干戈。记得在美国读书时,我的一个博弈论老师曾在课堂上举台湾独立的例子,来解释什么是brinkmanship。他说,当美国军舰驶向台湾海峡的时候,中国的最优策略并不是外交抗议而是直接把潜艇开入台海,然后在海峡举行实弹演习。

想想也对。中国固然要负责任,但是偶然也可random walk一下,这是更优的博弈论策略。须知,做一回疯子也不容易,虚张声势是没用的,最管用的是真疯,那样的话,美国舰队一准儿被中国吓跑。

关键词(Tags): #博弈论(洗心)元宝推荐:老马丁, 通宝推:老坏,大眼,游识猷,煮酒正熟,

本帖一共被 1 帖 引用 (帖内工具实现)
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河