【博弈论】策略分析|电子爱好者

admin管理员组
文章数量:1539574

文章目录

前言
- 为什么要收取漫游费
- 沃尔玛与麦德龙连锁店在选址上就不会十分接近
- 疯狂艾迪和纽马克&路易斯
- 中东和平进程为什么受阻，就是因为目前的停滞状态是博弈论中的纳什均衡。
- 混合策略博弈：恋爱中的模糊策略
- 博弈论：进化论中的数学模型。
- 信号博弈：一种对专制社会中贪污现象的解释
- 占优策略：朝鲜对美国的反抗
第一章 10个策略问题
- 妙手问题
- 领先还是不领先
- 囚徒困境
- 坚持到底
- 给猫拴上铃铛
- 尖端效应
- 三思而后行
- 多管齐下
- 没必要跟笨蛋打赌
- 博弈的时机
第二章准备接招
- 两种策略的互动
- 策略的第一法则
- 讨价还价
- 英国人的博弈
第三章看穿对手的策略
- 优势策略
- 封面之战
- 均衡策略
- 盛宴还是饥荒
- 莽汉软招
- - 分析
第四章走出囚徒困境
- 如何达成合作
- 觉察作弊
- 对作弊者的惩罚
- 惩罚的保证
- 以牙还牙
- 一个案例
第五章策略行动
- 无条件行动
- 威胁和许诺
- 核恐吓
- 更多的策略活动
第六章可信的承诺
- 建立可信度的八正道
- 信誉
- 只有一次生命可以献给你的祖国
- 案例分析之六：你会不会宁可向IBM租一台电脑？
第七章不可预测性
- 怎样使输赢机会均等
- 网球例子
- 怎样随机行动？
- 谎言的安全机制
- 例外
- 得势不饶人
第八章边缘政策
第九章合作与协调
- 丧钟为谁而鸣
- 那条人迹罕至的路线
- 他们为什么离开？
- 高处不胜寒
- 政治家与苹果酒
股市与选美
第10章投票的策略
- 法庭的秩序
第十一章讨价还价
- 谈判中的锄强扶弱体系
- “这对你的伤害大于对我的伤害”
- 边缘政策与罢工
- 同时就许多事情讨价还价
- 案例分析：施比受好？
- 附录：耐性自有回报
第十二章激励
- 怎样奖励工作表现
- 怎样组织一个合作项目
- 合同
- 按成本付账
- 招标、拍卖的策略
- 案例分析：取胜的风险
第十三章案例分析
- 别人的信封总是更诱人
- 末位变成首位
- 三方对决
- 弄巧成拙的防鲨网
- 大好时节和时机选择
- 坚持就是胜利？
- 贵人行为理应高尚
- 独霸天下
- 公用地悲剧
- 1美元的价格

前言

作为研究策略性互动的学问，博弈论在解释经济行为的原因、政治制度的形成与演化、进化心理学假说的模型构建、进化生物学的数学化、市场设计与供求匹配等方面大获成功，已经成为生命体行为现象微观研究的重要方法——不仅仅是人类的经济行为。

为什么要收取漫游费

博弈论让我们很容易推演出运营商难言的秘密：如果取消漫游费，那么运营商们就处于全国统一的竞争性市场中，它们之间就会打起价格战，导致大多数运营商退出，而留下极少数幸存者垄断市场。并不是所有的运营商都有这样的自信：我会是最后的幸存者。

所以它们之间就达成这样的默契：通过漫游费将市场分割为各个区域性市场。漫游费是地区市场分割的壁垒，各个地区的运营商都在自己的地盘里过着垄断带来的好日子。

比如，在漫游费的高墙下，你是北京的用户，想用重庆的电话，因为重庆的话费可能要便宜一些。但是，漫游费就让你用重庆的电话比用北京的电话还要贵。这样，即使重庆的电话费比北京的电话费便宜，漫游费也让你难以企及，因为加上漫游费，对你来说用重庆的电话就要比用北京的电话贵了。同样，重庆的用户也会只用重庆的电话，各个地区的用户都只用本地区的电话，全国性的统一竞争性市场就被分割成各个地区的垄断市场，而用户们也不得不支付高额的话费。

博弈论所起的作用是：它预言统一市场中会出现价格战。因为如果你知道一点博弈论，就一定知道“囚徒困境”这样简单的博弈论模型，也知道两个小偷在警察面前都会相互出卖同伙的结果。竞争性市场里的企业相互杀价，进行价格战就是“囚徒困境”，而相互出卖是它们的选择。

沃尔玛与麦德龙连锁店在选址上就不会十分接近

即使居住在沃尔玛附近的消费者知道麦德龙的商品可能较沃尔玛便宜，但是较远的空间距离也让他对于放弃沃尔玛而去麦德龙购物望而却步。同样，居住在麦德龙附近的消费者也会是麦德龙的客户。

沃尔玛与麦德龙之间拉开空间距离，就能够相互维护二者之间的市场细分而避免价格战对于双方的伤害。这是一种默契，也是博弈的结果。

疯狂艾迪和纽马克&路易斯

疯狂艾迪为了阻止纽马克&路易斯私下进行降价竞争，陷入价格战导致双方同归于尽，便打出了这样一个广告：凡是在疯狂艾迪购买商品的顾客，如果发现在其他商店可以以更低的价格买到同样的商品，疯狂艾迪可以按照差价的双倍对顾客进行补偿。

这样，如果纽马克&路易斯私下降价，任何人都不会去它那里买东西。因为所有人为了获得两倍差价的补偿都会去疯狂艾迪买商品。这意味着一旦纽马克&路易斯私下降价，则对方会自动降价更多，并且纽马克&路易斯的顾客还会流失。这种方式就迫使纽马克&路易斯不敢私下降价，价格战就这样避免了。

在政治领域，博弈论更是如鱼得水。现今的政治科学研究，大量采用博弈论的方法已经是世风。一些令人头疼的政治现象，用博弈论方法看就是直截了当的了。

中东和平进程为什么受阻，就是因为目前的停滞状态是博弈论中的纳什均衡。

巴勒斯坦要求以色列首先交还被占领土，然后才声明放弃恐怖活动；而以色列要求巴勒斯坦首先宣布放弃恐怖活动，然后它们才交还占领的巴勒斯坦领土。双方都不愿意首先改变自己的策略。因为如果巴勒斯坦宣布放弃恐怖活动，以色列也可以不交还被占领土，巴勒斯坦就惨了。同样，如果以色列交还了占领的巴勒斯坦领土，巴勒斯坦也可以不宣布放弃恐怖活动，以色列也会吃大亏的。

因此，双方都不会首先改变自己目前的策略，这就是博弈论里的纳什均衡。既然是纳什均衡，就是一种难以改变的胶着状态。

混合策略博弈：恋爱中的模糊策略

混合策略博弈是指博弈的参与人通过模糊自己的策略动机迷惑对手的博弈。在人们的生活中，谈恋爱就是一种混合策略博弈。

在谈恋爱的过程中，女孩子通常会对于男孩子的追求反应含糊。因为如果女孩子说她爱男孩子，男孩子就认为已经搞定，就不会继续狠追女孩子了，女孩子会因此失去被追的愉悦。如果女孩子说她不爱男孩子，男孩子就会放弃，女孩子就会失去继续考察男孩子的机会。所以，女孩子总是对于男孩子的追求若即若离，不轻易说她对他爱与不爱。

博弈论：进化论中的数学模型。

生命的个体也许并不是对于许多不同的生存策略进行理性的选择，而是通过偶然的试错过程发现了最优的策略。当所有个体都完成了最优生存策略的“自然选择”之后，就达到了纳什均衡。

个体因为发生突变而面对不同的生存策略，而不同的生存策略给个体带来了不同的生存适应度。只有那些带来最大适应度的策略才可以让个体生存下去，而通过遗传，那些成功地“自然”选择了最优策略的个体便把自己的基因遗传了下来，而其他物种个体便灭绝了。博弈论专家证明，这种自然选择出来的最优策略是纳什均衡策略，尽管并不假定生命个体一定是理性人——这避免了传统经济学理性人假设带来的尴尬，因为心理学家经常会批评这样的假定。

在人类出现的东非大峡谷，那些高个子的人类祖先，因为生存更加困难(高个子更容易被豺狼虎豹看见，在野兽追来时更难以躲避)，心脏负荷大，需要更多的食物而处于生存劣势。因此，只有那些生存能力较强的高个子基因遗传下来了。这是一种不对称信息博弈中的信号博弈现象。高个子是发送优良基因的信号，所以人们在谈对象的时候，一般喜欢高个子，这是因为他们或许载有更加优良的基因，可以通过与他们结合把自己的基因遗传下去，因为既然高个子生存更加困难，但是当他们还生存着时，就意味着他们具有更加强大的生存基因。表面看起来，喜欢高个子是因为我们觉得高个子赏心悦目，是美的元素。

其实，人类的美感是与生存能力联系起来的。这是所谓进化博弈论的发现。

信号博弈：一种对专制社会中贪污现象的解释

博弈论中最具魅力的部分是信号博弈。在进化博弈论里，信号博弈把过去人们认为是纯粹主观性的审美解读成进化中的生存博弈形成的策略，当然是物种在进化过程中的纯粹是自然选择的策略。

信号博弈还可以解释官僚贪污现象。官员贪污腐败是忠诚的信号。读者可能会觉得奇怪：贪污腐败怎么与忠诚联系在一起?其实，政府官员贪污尽管是古今中外都普遍存在的现象，但是从历史上看，在东方要盛于西方。在东方，至少在过去，特别是东方一些完成现代化进程之前的国家，贪污甚至是人们习以为常的，或者说是老百姓看来无可奈何的现象。同时，我们注意到，在历史上，东方也普遍采取专制社会的社会治理模式，以至在文献上会出现“东方专制社会”的术语。

我们下面从博弈论的信号发送机制出发，说明这两个社会现象之间存在着密切的联系，即专制社会与官员贪污腐败之间存在着因果关系。专制会带来贪污腐败，或者说比非专制社会更加普遍的贪污腐败现象，这种因果关系并不是简单地因为专制社会缺乏对于官员的监督，而是因为在专制社会里，官员向其上司表忠诚，可以通过自己贪污腐败来发送忠诚的信号，以利于保护自己。

在专制社会，官员的全部命运基本上都掌握在他上司手里。上司可以决定他们的升迁，甚至掌控着他们的身家性命！官员为了保护自己，让上司找不到任何可以灭掉自己的口实，或者让上司相信自己不会谋反，自己是完全忠诚于上司的，就需要发送这样的信号给上司——我是忠诚于您的！

但是，发送的信号必须要满足“可置信”的条件。上司怎么才会相信你的表白呢？如果你非常清廉，这样就会有好的声誉。一旦你谋反成功，譬如谋朝篡位，你的好声望就会让人民接受你，而让想攻击你的潜在敌人感到要击败你是比较困难的。正是你的好声誉会助你谋反成功。但是，如果你的声誉很糟糕，即使你谋反成功，人民也不会接受你，你的敌人也会利用这一点对你发起攻击，并且会得到人民的响应，你会落败的。

这样，当你具有好的声誉时，你谋反成功并且取而代之的动机就会比较强烈，相反，你的坏声誉会增加你谋反成功的难度，你的谋反动机也就比较小了。如果你并不想谋反，同时也要向上司表明你的忠诚，你就可以采取自毁声誉的办法，增加你谋反成功的难度，同时也告诉你的上司，你是不会谋反的，因为你谋反成功的机会很小！这种信号是可置信的。当你的上司相信你不会谋反时，你就成功地保护了自己。

当然，官员的贪污不仅仅是为了实施这样的策略，也有真正对于财富的贪婪。但是，人们对于财富的贪婪无论在东方还是西方社会都应该是一样的，为什么在东方社会要更加普遍？这是因为东方社会普遍存在的专制治理模式给这一信号发送提供了动力。所以，贪污作为信号是有一定解释力的。

当然，这种信号理论比较适合解释皇帝身边的权臣贪污，并不能解释下层官员的贪污。譬如，和珅生活在乾隆皇帝身边，但是其贪得无厌到了不能企及的程度，乾隆皇帝反而对他宠爱有加。据说张良在跟随刘邦进入京城的时候，便叫家丁们到街上去打砸抢。这样的自毁声誉与贪污行为其实都是保护自己的策略，两者异曲同工。

占优策略：朝鲜对美国的反抗

如果从博弈策略的角度分析，朝鲜是有充分的自信的。

朝鲜知道，美国其实是不会打击朝鲜的。如果美国对朝鲜进行核打击，则东北亚会出现核污染，会伤及驻日本和韩国的美军。美国政府在选民的压力下不得不从东北亚撤出。这样，美国在东北亚核战争中不仅一无所得，而且还会遭到全世界的责骂，并且灰溜溜地从长期盘踞的东北亚撤出。

如果美国用高科技常规武器打击朝鲜，朝鲜会用核武器反击，美军大败，加上东北亚的核污染，导致美国同样会从东北亚撤出，朝鲜会崛起，统一半岛。

所以，美国人并不会对朝鲜进行打击，无论是用核武器还是常规武器。由此，朝鲜核爆反美是它的占优策略——这是博弈论的术语，即在任何情况下都是最优的策略。

因此，朝鲜完全可以大张旗鼓地反美，不断进行核爆挑衅，并不担心美国会拿它怎么样。我们看到，在朝鲜不断升级的挑衅下，美国人基本上是无动于衷的。因为一方面是朝鲜猜透了美国人的想法——他们不敢动真格；另一方面，美国人也猜出了朝鲜的想法，知道他们知道自己的想法——这就是博弈论——你知道他知道你知道他的……这就是博弈！

既然是这样，双方都是在演戏，那么，朝鲜演这出戏是给谁看呢？答案是：演给朝鲜的老百姓看。这样，新上台的领导会树立威信——瞧瞧，咱弄得美国佬都拿咱没有办法！

在这样的情况下，当朝鲜雄起的时候，美国只有处于守势，而给定美国处于守势，朝鲜当然会选择攻势——这是众所周知的胆小鬼博弈，或者叫做斗鸡博弈。胆小鬼博弈（chicken game）是博弈论中一个影响深远的模型。其基本原理是，一个玩家让步对于双方都有好处，而玩家的最佳选择取决于其对手会做什么：如果对手让步，那本方就不应该让步，但如果对手不让步，本方就应该让步。简而言之就是**“不要命的最大“**

第一章 10个策略问题

妙手问题

体育比赛解说员们看到长期存在、永不落空的成功事迹，就会宣称这名运动员具有出神入化的妙手。但根据统计，一名运动员投篮命中之后，下一次出手就不大可能命中了；假如他在上一次出手没有命中，再出手时反倒更可能命中。

博弈论提出了一个不同的解释。尽管统计数据否定了一朝命中、百发百中之说，却没有驳倒一个“鸿运当头”的运动员很可能在比赛当中通过其他方式热身，渐入佳境。

事实还不仅如此。当防守一方集中力量对付托尼的时候，他的某个队友就无人看管，更有机会投篮得分。换句话说，妙手大大改善了团队表现，尽管个人表现可能有所下降。

这提醒我们，明星球员的价值不能单凭他的得分表现来衡量；他对其他队友的贡献更为至关重要。

领先还是不领先

帆船比赛给我们提供了一个很好的机会，观察“跟随领头羊”策略的一个很有意思的反例。成绩领先的帆船，通常都会照搬尾随船只的策略。一旦遇到尾随的船只改变航向，那么成绩领先的船只也会照做不误。实际上，即便成绩尾随的船只采用一种显然非常低劣的策略时，成绩领先的船只也会照样模仿。

因为帆船比赛与在舞厅里跳舞不同，在这里，成绩接近是没有用的，只有最后胜出才有意义。假如你成绩领先了，那么，维持领先地位的最可靠的办法就是看见别人怎么做，你就跟着怎么做。

不过，这一策略在竞争者超过两个之后就不再适用了。即便只有三条船只，假如一条船偏向右边，一条船偏向左边，成绩领先者就得择其一，确定自己要跟哪一条船。

跟在别人后面第二个出手有两种办法。

一旦看出别人的策略，你立即模仿，好比帆船比赛的情形；
再等一等，直到这个策略被证明成功或者失败之后再说，好比电脑产业的情形。

而在商界，等得越久越有利，这是因为，商界与体育比赛不同，这里的竞争通常不会出现赢者通吃的局面。结果是，市场上的领头羊们，只有当它们对新生企业选择的航向同样充满信心时，才会跟随这些企业的步伐。

囚徒困境

假如他们在接受审问之前有机会见面好好谈清楚，那该有多好，他们一定会同意拒不认罪。不过，接下来他们很快就会意识到，无论如何，那样一个协定也不见得管用。一旦他们被分开，审问开始，每个人内心深处那种企图通过出卖别人而换取一个更好判决的想法就会变得非常强烈。这么一来，他们还是逃脱不了最终在牢狱相遇的命运，大概还会在那里好好算一账，看看谁欠谁更多。

囚徒困境的故事还体现了一个普遍的现象：大多数经济的、政治的或社会的博弈游戏都跟类似橄榄球或扑克这样的博弈游戏不同。橄榄球和扑克是零和博弈：一个人的得就是另一个人的失。

但在囚徒困境里，有可能出现共同利益，也有可能出现利益冲突；不招供的结果对两个囚徒都是有利的，而不是相反。

与此相仿，在劳资双方的讨价还价中，虽然存在利益冲突，一方希望降低工资，而另一方要求提高工资，不过，大家都知道，假如谈判破裂而导致罢工，双方都将遭受更大的损失。任何一个关于博弈的有用的分析，都应该考虑到怎样处理冲突与利益同时存在的情形。

坚持到底

在实践中，“坚持到底，拒不妥协”说起来容易做起来难，理由有二。
第一个理由在于，讨价还价通常会将今天谈判桌上的议题以外的事项牵扯进来。大家知道你一直以来都是贪得无厌的，因此以后不大愿意跟你进行谈判。又或者，下一次他们可能采取一种更加坚定的态度，力求挽回他们认为自己将要输掉的东西。在个人层面上，一次不公平的胜利很可能破坏商业关系，甚至破坏人际关系。一个短期妥协可能从长期来看会是一个更好的策略。

第二个理由在于达到必要程度的拒不妥协并不容易。一种顽固死硬的个性可不是你想有就有，想改变就能改变的。尽管有些时候顽固死硬的个性可能拖垮一个对立者，迫使他做出让步，但同样可能使小损失变成大灾难。

给猫拴上铃铛

童话故事里有一个给猫拴铃铛的故事，大意是这样：老鼠们意识到，假如可以在猫脖子上拴一个铃铛，那么，它们的小命就会大有保障。问题在于，谁会愿意冒赔掉小命的风险给猫拴上铃铛呢？

占据支配地位的党派或独裁暴君怎样才能通过规模相对较小的军队长期控制数目很大的一个人群呢？整架飞机的众多乘客为什么只要出现一个持枪劫机者就会显得无计可施，束手就擒？

在这两个例子里，只要大多数人同时采取行动，就很容易取得成功。不过，统一行动少不了沟通与合作，偏偏沟通与合作在这个时候变得非常困难，而压迫者由于深知群众的力量有多大，还会采取特殊的措施，阻挠他们进行沟通与合作。一旦人们不得不单独行动，希望聚沙成塔，集腋成裘，问题就出来了：“谁该第一个采取行动？”大多数人会认为这么做的代价超出了收益。

在苏共第二十次代表大会上，赫鲁晓夫首次谴责斯大林的大清洗运动。他那充满戏剧性的讲话刚刚结束，听众里就有人大叫起来，质问赫鲁晓夫自己那个时候又在做什么。赫鲁晓夫的反应是请提问者站起来，报出自己的姓名。听众一片沉默。赫鲁晓夫答道：“当时我也是这么做的。”

这只不过是涉及超过两个人的囚徒困境；你也可以把它称为“人质困境”。现在我们要用这个困境阐述一个不同的观点，确切地说，就是惩罚经常压倒回报而处于上风。独裁者可以通过向大众提供物质乃至精神安慰保持局势稳定，不过，这个做法可能需要付出高昂代价。建立在人质困境之上的压迫和恐吓可能是一种代价小得多的替代选择。

汽车制造业工人工会在跟汽车制造商一个接一个进行谈判的时候也占有类似的优势。单是一场针对福特汽车公司的罢工就会使福特处于非常不利的地位，因为通用汽车公司和克莱斯勒公司继续对工会采取合作态度，因此，福特很有可能迅速采纳对工会有利的条件，达成和解。这么一场罢工在工会这边看来代价也是较小的，毕竟只有1/3的工会成员失去工作。赢得福特一役之后，工会转而会跟通用谈判，接着是克莱斯勒，引用前面各次战役的胜利作为先例，进一步壮大自己的声威。

日本工会则另有一套做法，因为日本工会是由公司组织的，在公司里占有很大的利润份额。假如丰田的工会罢工，其成员的薪水就会随着丰田的利润下跌而下跌，他们以前的努力什么也得不到。

尖端效应

当美国运用进口配额保护钢铁、纺织或制糖产业，大家就不得不购买价格更高的产品，换算过来，相当于每保住这些产业一个职位，美国国内其他人就要付出10万美元的代价。极少数人的得益怎么总是会压倒更大多数人的损失而得到优先考虑呢？

秘诀在于一次提出一件事情。谁不愿意付出4美元保住1万个职位呢？即便素昧平生的陌生人也会愿意的吧，接着就轮到服装产业、钢铁产业、汽车产业，等等。没等我们明白过来，我们已经点头同意付出500多亿美元，相当于人均付出200多美元，或每个家庭付出1 000多美元。

实际上，一项决定即便获得多数人投票赞成，仍然有可能导致一个在每个人看来都比现状更糟的结果。

逐项否决权使总统可以有选择地否决法案。假如一个法案授权拨款资助学校提供午餐和建造一架新的航天飞机，总统本可以选择两个都否定、只批准其中一个或两个都批准，但是目前却只有两个选择，即两个都否定或者两个都批准。虽然第一反应可能是这将赋予总统更大的权力，控制立法过程，但若是反过来，结果可能是国会将更有选择性地看待有待它通过的法案，

三思而后行

人们陷入某种境地而发现从此难以脱身的情况实在是太普遍了。比如，一旦你在某个城市找到一份工作，那么，换一个地方重新安置下来的代价就会变得很高；一旦你买了一台电脑，学会了怎样使用其操作系统，那么，学会另一种操作系统，改写你的全部程序，其代价就会变得很高。同样，参加了一家航空公司的里程积分计划的旅行者若想搭乘另一家航空公司的飞机，付出的代价也会更高。还有，当然了，从婚姻围城中逃脱出来的代价也很高。

能够预见到上述后果的策略家会赶在他们的讨价还价能力仍然存在的时候充分利用，换句话说就是在他们订下契约之前。一般情况是采取预先支付酬劳再签约的形式。潜在的利益谋取者相互竞争会导致同样的结果。比如，公司不得不提供更具吸引力的起薪；电脑制造商不得不为它们生产的中央处理器(CPU)标出足够低的价格；而航空公司的里程积分计划也不得不为登记参加者提供更多的积分奖励以吸引他们。

同样的深谋远虑也使许多好奇却又理智的人，不至于亲身尝试会上瘾的毒品，比如海洛因，他们会在自己还能拒绝这些东西的时候，选择果断拒绝，否则就将失去选择的能力。

多管齐下

在橄榄球比赛里，每一次贴身争抢之前，攻方都会在传球或带球突破之中择其一，而守方则会把赌注押在其中一个选择上，做好准备进行反击。

多管齐下并不等于说要按照一个可以预计的模式交替使用你的策略。若是那样的话，你的对手就会通过观察得出一个模式，从而最大限度地利用这个模式还击，其效果几乎跟你使用单一策略一样好。实施多管齐下策略，诀窍在于不可预测性。

设想一下剃须刀市场的竞争情况。假设吉列定期举行购物券优惠活动，比如每隔一个月的第一个星期天进行，那么毕克可以通过提前一个星期举行购物券优惠活动的方式予以反击（毕竟在一个星期内买两次剃须刀是很少见的情况）。当然，这么一来毕克的路数就会变得具有可预见性，吉列可以照搬毕克的策略，相应将自己的优惠活动提前到毕克前面去。这种做法最终导致刺刀见红的残酷竞争，双方的利润都会下跌。

不过，假如双方都采用一种难以预见或者多管齐下的混合策略，那么很可能会一起降低竞争的惨烈程度。

没必要跟笨蛋打赌

内森·底特律要跟斯凯·马斯特森打赌，看看明迪糕饼店的苹果酥和奶酪蛋糕哪一样卖得比较好。正好，内森刚刚发现了答案(苹果酥！)。他当然愿意打赌，只要斯凯把赌注压在奶酪蛋糕上。

这个例子听上去也许有些极端。当然没有人会打这么一个愚蠢的赌。不过，仔细看看芝加哥交易所的期货合同市场吧。假如一个精明的交易者提出要卖给你一份期货合同，那他只会在你损失的情况下得益。这个交易是一宗零和博弈，就跟体育比赛一样，一方的胜利意味着另一方的失败。因此，假如有人愿意卖给你一份期货合同，你绝对不应该买下来。反过来（有人愿意买一份期货合同）也是如此。

其中的策略意义在于，其他人的行动向我们提示了他们究竟知道什么，我们应该利用这些信息指导我们自己的行动。

事实上，斯凯应该问一下内森，看他在什么情况下愿意把赌注压在奶酪蛋糕上。假如回答是“无论什么情况都不会”，那么斯凯就能推断答案一定是苹果酥。假如内森回答说他下注在苹果酥和奶酪蛋糕上的可能性一样大，他显然是在隐瞒自己知道的信息，甘愿冒让斯凯在赌博中可能猜中的风险。

博弈的时机

司机表示，他可以提供比打表数目更低的价格。当他们到酒店的时候，司机要求他们支付2500，事实上，谁知道什么样的价格是合理的呢。于是经济学家和司机讨价还价，被司机带回了出发地，又以2200的价格来到酒店。

这个故事却很有价值。它描述了跟那些没有读过我们这本书的人讨价还价可能存在什么样的危险。更普遍的情况是，我们不能忽略自尊和失去理性这两种要素。

其次，如果经济学家下车了之后再讨家还价，情况大概会完全不同。

第二章准备接招

连环漫画《花生》里有一个反复出现的主题，说的是露西将一个橄榄球按住，竖在地上，招呼查理·布朗过去踢那个球。不过，每次到了最后一刻，露西总要拿走橄榄球，查理·布朗因为一脚踢空，仰天跌一跤，心怀不轨的露西就会高兴得不得了。

任何人都会劝告查理·布朗不要上露西的当。即便露西去年没有在他身上玩过这个花招，他也应该从其他事情了解她的性格，完全有可能预见她会采取什么行动。

他应该知道，在两种可能的结果——让他踢中那个球以及让他仰天跌一跤——当中，露西倾向于后者。因此，他应该预见到，一旦时机到了，她就会拿走橄榄球。从逻辑推理得出的露西会让他踢中那个球的可能性实际上已经毫无影响。

对这样一种可能性的信心，是希望压倒经验的胜利。查理不应该那样想，而应预见到接受露西的邀请最终会让自己仰天跌一跤。他应该拒绝露西的邀请。

两种策略的互动

策略博弈的精髓在于参与者的决策相互依存。这种相互影响或互动通过两种方式体现出来。

第一种方式是相继发生，参与者轮流出招。每个参与者在轮到自己的时候，必须展望一下他的这一步行动将会给其他人以后的行动造成什么影响，反过来又会对自己以后的行动造成什么影响。

第二种互动方式是同时发生，比如第1章囚徒困境故事的情节。参与者同时出招，完全不理会其他人刚刚走了哪一步。不过，每个人必须心中有数，知道这个博弈游戏存在其他参与者，而这些人反过来也非常清楚这一点，如此类推。因此，每个人必须设想一下若是自己处在其他人的位置，会做出什么反应，从而预计自己这一步会带来什么结果。他选择的最佳策略也是这一全盘考虑的一个组成部分。

策略的第一法则

**法则1：向前展望，倒后推理。**向前展望，估计对手的反应，从而倒后推理，决定自己这一轮应该怎么走。
大多数策略情况都会涉及一系列更长的决策结果，每个结果都有几种选择，单是口头上进行推理实在是无法表述清楚。要想成功地运用这个向前展望、倒后推理的法则，我们需要一个更好的视觉辅助工具。一个涵盖了博弈当中全部选择的“树状图”就是这么一个工具。

我们把一棵反映一场策略博弈当中的决策次序的树称为“博弈树”，而把“决策树”留做描述只有一个人参加的情形。

查理应该预计到她一定会选择上面那个分枝。因此，他应该置身于她的地位，从这棵树上剪掉下面那个分枝。现在，回到他自己的两个选择，也是上下两个分枝，假如他选择上面那个分枝，结果一定是仰天跌一大跤。因此，相比之下，他更好的选择是沿着下面的分枝前进。

讨价还价

我们必须认识讨价还价的两个普遍特征。我们必须知道谁向谁提出了一个什么条件，换言之，就是这个博弈的规则是什么；接着，我们还要知道，假如各方不能达成一个协定，将会导致什么后果。

在大多数零售店里，卖方会标出价钱，买方的唯一选择就是要么接受这个价格，要么到别的店里碰运气。这是一个简单的“接受或者放弃”的法则。

在工资谈判的例子中，工会首先提出一个价码，接着公司决定是不是接受。假如公司不接受，可以还一个价码，或者等待工会调整自己要求的价码。有些时候，相继行动的次序是由法律或者习俗决定的，还有些时候这一次序本身就具有策略意义。

谈判的一个必不可少的特征在于时间就是金钱，在收益缩水的条件下，各方都愿意尽快达成协议。设想这是一个冰淇淋蛋糕，孩子们一边争吵怎么分配，蛋糕一边融化。

英国人的博弈

通过向前展望和倒后推理，撒切尔夫人可以预计，假如她选择平坦大道，金诺克先生一定会选择崎岖小径，反之亦然。既然两个方案赋予她的取胜概率相同，她愿意选择平坦大道。

不过，假如撒切尔夫人想到金诺克先生也会这么想，她就会为自己选择崎岖小径的策略。金诺克先生并不确实知道她的选择。一个普遍的观点是若要运用向前展望、倒后推理的原理，不可缺少的前提是后行者可以观察到先行者的行动。

假设只有选民得到的最后印象才算数，而撒切尔夫人在第一次发表声明的时候说了什么无关紧要。金诺克先生绝不能信以为真，并据以制定自己的策略。反过来，撒切尔夫人在考虑自己应该怎么迈出第一步的时候，也不能指望金诺克先生只有一种反应方式。这样，我们就得到向前展望、倒后推理原理的另一个适用条件：策略必须是不可逆转的。

第三章看穿对手的策略

每个星期，《时代》和《新闻周刊》都会暗自较劲，非要做出最引人注目的封面故事不可。一个富有戏剧性或者饶有趣味的封面，可以吸引站在报摊前的潜在买主的目光。因此，每个星期，《时代》的编辑们一定会举行闭门会议，选择下一个封面故事。他们这么做的时候，很清楚在某个什么地方，《新闻周刊》的编辑们也在关起门来开会，选择下一个封面故事。反过来，《新闻周刊》的编辑们也知道《时代》的编辑们正在做同样的事情，而《时代》的编辑们也知道《新闻周刊》的编辑们知道这一点……

第2章讨论的博弈是由一系列相继进行的行动组成的。查理·布朗在选择要不要踢那个橄榄球时，心里明白露西现在还没有决定要不要拿走那个球。相反，《时代》与《新闻周刊》的行动却是同时进行的。双方不得不在毫不知晓对手的决定的情况下采取行动。等到彼此发现对方做了什么，再想做什么改变就太迟了。当然，这个星期的输家下个星期很可能竭力反扑。

对于第2章讨论的相继行动的博弈，每个参与者不得不向前展望，估计对手的反应，从而倒后推理，决定自己这一轮应该怎么走。

而在同时行动的博弈里，没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下，互动推理不是通过观察对方的策略进行，而是必须通过看穿对手的策略才能展开。要想做到这一点，单单假设自己处于对手的位置会怎么做还不够。即便你那样做了，你又能发现什么？你只会发现，你的对手也在做同样的事情，即他也在假设自己处于你的位置会怎么做。因此，每一个人不得不同时担任两个角色，一个是自己，一个是对手，从而找出双方的最佳行动方式。与一条线性的推理链不同，这是一个循环——“假如我认为他认为我认为……”。诀窍在于怎样破解这个循环。

优势策略

某些时候它胜于其他策略，且任何时候都不会比其他策略差。

假如一个球员拥有这么一个策略，他的决策就会变得非常简单；他可以选择这个优势策略，完全不必担心其他对手怎样行事。因此，寻找优势策略是每一个人的首要任务。

“爱过之后失去总比从来没有爱过好。”

封面之战

以策略观点来看，各方均有一个优势策略的博弈是最简单的一种博弈。虽然其中存在策略互动，却有一个可以预见的结局：全体参与者都会选择自己的优势策略，完全不必理会其他人会怎么做。

但这一点并不会降低参与或者思考这种博弈的趣味性。比如，在百码短跑中，优势策略是能跑多快就跑多快，但许多人还是很喜欢参加或者观看这种比赛。

只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略，另一方则针对这个策略采用自己的最佳策略。

法则2：假如你有一个优势策略，请照办。

法则3：剔除所有劣势策略，不予考虑，如此一步一步做下去。

均衡策略

利用优势策略方法与劣势策略方法进行简化之后，整个博弈的复杂程度已经降到最低限度，不能继续简化，而我们也不得不面对循环推理的问题。你的最佳策略要以对手的最佳策略为基础，反过来从你的对手的角度分析也是一样。接下来我们将会介绍解开这个循环的技巧，最终走出这个循环。

现在我们可以想象两种杂志的经理正各自埋头琢磨。《时代》的经理说：“如果他卖1美元，我就卖2美元。不过，他因为知道我这么想，所以不会真的卖1美元，而是执行他在我卖2美元时的最佳对策，即2.50美元。那样的话我就不能卖2美元，而是采用我在他卖2.50美元时的最佳对策，卖2.75美元。不过，他因为知道我这么想……”这样一层一层分析下去，究竟有完没完呢？

该图同时反映了两者的对策。可以看到，两条线在两家都卖3美元的一点相交。

法则4：寻找这个博弈的均衡，即一对策略，按照这对策略做，各个参与者的行动都是对对方行动的最佳回应。

为什么一个博弈的参与者非得达到这么一个结局呢？我们可以说出好几个理由。没有一个理由本身就有足够的说服力，不过，只要把几个理由结合起来，就能形成一个有力的答案。

首先，存在避免循环推理的必要，因为循环推理帮不上忙。均衡在没完没了的“我知道他知道我知道……”的循环里是稳定不变的，这使参与者对其他人的行动的估计能保持连贯性。各方正确预计别人的行动，并且确定自己的最佳对策。

均衡策略的第二个好处出现在零和博弈中。在这种博弈里，参与者的利益严格相悖。你的对手不能通过引诱你采取一个均衡策略而得到任何好处。你已经充分考虑到他们对你正在做的事情会有什么样的最佳对策。

第三个理由是，均衡方法注重实效。

博弈的结果是均衡，并不自动意味着这就是对博弈的全体参与者最有利的结果，更不意味着是对整个社会作为一个整体而言最有利的结果。有利或者不利的评价永远属于另外一个问题，答案视各个案例的具体情况而各有不同。

盛宴还是饥荒

有些博弈存在好几个均衡，有些博弈却一个均衡也没有，而在另外一些博弈里，均衡的概念还会由于接纳新型策略而变得更加微妙。

开车的时候你应该走哪一边？这个问题不能通过运用优势策略或者劣势策略理论予以回答。不过，即便如此，答案却显得很简单。假如别人都靠右行驶，你也会留在右边。套用“假如我认为他认为”的框架进行分析，假如每个人都认为其他人认为每个人都会靠右行驶，那么每个人都会靠右行驶，而他们的预计也全都确切无误。靠右行驶将成为一个均衡。

不过，靠左行驶也是一个均衡，正如在英国、澳大利亚和日本出现的情况。这个博弈有两个均衡。均衡的概念没有告诉我们哪一个更好或者哪一个应该更好。假如一个博弈具有多个均衡，所有参与者必须就应该选择哪一个达成共识，否则就会导致困惑。

若是遇到彼得和波拉打电话打到一半突然断了的事，你该怎么办？假如彼得马上再给波拉打电话，那么波拉应该留在电话旁(且不要给彼得打电话)，好把自家电话的线路空出来。另一方面，假如波拉等待彼得给她打电话，而彼得也在等待，那么他们的聊天就永远没有机会继续下去。一方的最佳策略取决于另一方会采取什么行动。这里又有两个均衡，一个是彼得打电话而波拉等在一边，另一个则是恰好相反。

另一个复杂因素在于，并非所有博弈都有我们前面描述的那种均衡，哪怕是一个。关键在于，如果一方坚守某种确定行为，另一方就会因此大占便宜。双方唯一明智的做法在于随机选择自己这一步怎么走。

这种“混合策略”即便在双方打算合作的时候也会出现。在前面提到的打电话的例子中，设想双方都投硬币决定自己是不是应该给对方打电话，根据前面给出的条件，两人这种随机行动的组合成为第三个均衡：假如我打算给你打电话，我有一半机会可以打通(因为这时你恰巧在等我打电话)，还有一半机会发现电话占线；假如我等你打电话，那么，我同样会有一半机会接到你的电话，因为你有一半机会主动给我打电话。每一个回合双方完全不知道对方将会采取什么行动，他们的做法实际上对彼此都最理想。因为我们只有一半机会重新开始被打断的电话聊天，我们知道我们(平均来说)要尝试两次才能成功接通。

莽汉软招

罗伯特·坎普在第一次投标收购联盟商店(及其掌上明珠布鲁明代尔百货商店)的时候，运用了一个称为两阶段出价法的竞购方案。这个案例分析将会研究这种出价方案作为一个策略行动的效能。

典型的两阶段出价法给先出让股份的股东支付的价格高，给后出让股份的股东支付的价格低。为避免复杂的计算，我们假设出价收购前的股价是每股100美元。收购者在第一阶段提出一个较高价格，即每股105美元，向先出让股份的股东支付，直到全部股份的一半出让为止。另一半待出让股份则进入第二阶段，收购者愿意支付的股价只有90美元。

出于公平原则，股份不是按照股东出让的时间次序分属不同阶段。相反，每个人都会得到一个混合的价格：所有出让股份会按照一定比例均等划入两个阶段(假如招标成功，那些未出让自己股份的人就会发现他们的股份落入第二阶段)。

假如愿意出让的股份不超过50%，每个人都会得到105美元的股价；假如这家公司的全部股份当中有X%愿意出让，且X%≥50%，那么，每股平均价格就是105×50/X＋90×（X-50/X）＝90＋15×50/X。

值得注意的一点是，两阶段出价的竞购方案是无条件进行的；即便收购者没能得到公司的控制权，仍然应该按照第一阶段的价格收购全部愿意拍卖的股票。

第二个特点在于，两阶段出价法的性质决定了假如所有人都愿意出让自己的股票，那么每股的平均价格只有97.50美元。这个价格不仅低于收购者提出收购前的股价，也低于股东们在收购失败后可能得到的股价，这是因为，假如收购者被击败，股东们将会看到股价回到原来100美元的水平。

因此，股东们希望要么收购者被击败，要么再出现一个收购者。实际上，当时真的出现了另一个收购者，那就是梅西百货公司。现在就让我们假设梅西提出一个有条件的收购计划：它愿意用每股102美元的价钱收购股份，前提是它能得到该公司大部分股份，那么，你将向哪一家出让你的股份，而你又觉得哪一家的计划会成功呢？

分析

总共存在3种可能性，分别是：

两阶段出价的竞购方案吸引到的股份不足50%，因而收购失败。
两阶段出价的竞购方案吸引到超过50%的股份，因而收购成功。
两阶段出价的竞购方案刚好吸引到50%的股份；假如这时你同意出让你的股份，收购就能成功，否则的话收购只能失败。

在第一种情形下，两阶段出价的竞购方案遭到失败，因此，股价要么回到100美元水平，要么达到102美元，后者是在竞争对手成功收购的条件下。不过，假如你出让自己的股份，你就能得到105美元的股价，比前面提到的两个结果都要好。

在第二种情形下，假如你不出让你的股份，你能得到的股价只有90美元，而出让股份则能让你得到不小于97.50美元的价格。因此，出让股份仍然是一个更好的选择。

在第三种情形下，假如收购成功，别人得到的价格都不如以前，但你自己的结果却变好了。理由是，由于出让的股份刚好达到50%，你将得到105美元的股价。这个价格值得出让。因此你愿意促成这桩收购。

因为出让是一种优势策略，我们可以预计人人都愿意出让自己的股份。一旦人人都出让股份，每股的平均混合价格可能低于收购前的价格，甚至可能低于预期收购失败后的价格。因此，两阶段出价的竞购方案可以使收购者以低于公司价值的价格收购成功。由此可见，股东们拥有一个优势策略的事实并不意味着他们就能占先。

我们还会发现，一个有条件的竞购方案对于一个无条件的两阶段出价竞购方案不是一个有力的抵御策略。在我们给出的例子中，假如梅西许诺无条件支付每股102美元的话，那么它的竞购方案就会更难对付。梅西的无条件竞购将会破坏两阶段出价竞购方案取胜而达到的均衡。

理由在于，假如人们认为两阶段出价竞购方案笃定取胜，他们将会得到的只是97.50美元的平均混合价格，而这个数字显然低于他们把股份出让

本文标签：策略博弈论

版权声明：本文标题：【博弈论】策略分析内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1727007398a1093921.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

【博弈论】策略分析

文章目录

前言

为什么要收取漫游费

沃尔玛与麦德龙连锁店在选址上就不会十分接近

疯狂艾迪和纽马克&路易斯

中东和平进程为什么受阻，就是因为目前的停滞状态是博弈论中的纳什均衡。

混合策略博弈：恋爱中的模糊策略

博弈论：进化论中的数学模型。

信号博弈：一种对专制社会中贪污现象的解释

占优策略：朝鲜对美国的反抗

第一章 10个策略问题

妙手问题

领先还是不领先

囚徒困境

坚持到底

给猫拴上铃铛

尖端效应

三思而后行

多管齐下

没必要跟笨蛋打赌

博弈的时机

第二章 准备接招

两种策略的互动

策略的第一法则

讨价还价

英国人的博弈

第三章 看穿对手的策略

优势策略

封面之战

均衡策略

盛宴还是饥荒

莽汉软招

分析

更多相关文章

策略（strategy）模式的原理以及应用范围

C# 策略模式（Strategy Pattern）

Design Pattern-----策略设计模式（Strategy Design Pattern）

C#设计模式系列：策略模式（Strategy）

设计模式总结之Strategy Pattern（策略模式）

strategy策略模式与adapter适配器模式的区别

数据库必知必会系列：数据库备份策略与恢复方案

浏览器缓存策略与 webpack 持久化缓存

设备策略管理－－－设备管理器

Windows密码策略

Mac上解决Chrome浏览器跨域问题（关闭浏览器同源策略）

浏览器同源策略的行为限制以及规避方法

浏览器的同源策略机制以及跨域请求

Python flask跨域支持（Access-Control-Allow-Origin（CORS）跨域资源共享（访问控制允许来源：允许指定的来源进行跨域请求）浏览器同源策略、OPTIONS预检请求

浏览器的几种防护策略

浏览器拦截跨域请求处理方法（同源策略不允许读取服务器远程资源）

移动硬盘损坏无法读取：故障解析与数据恢复策略

探究暴风影音安装后缺失stormres.dll文件的原因及解决策略

Comparison of Germany and China, the industry 4.0 strategy and approach for China 中德比较以及中国工业4.0策略和手段

SAP MTSATOMTOETO专题之九：M+M模式前后台操作，策略用50，提前准备原材料和半成品

发表评论

推荐文章

分享9款AI抠图神器：不会PS？AI一键批量抠图，3秒轻松搞定！（建议收藏）

Pycharm使用产生的缓存文件占用c盘空间，修改缓存路径，转移到其他盘

[网络安全自学篇] 七.快手视频下载之Chrome浏览器Network分析及Python爬虫探讨

小米android手机密码忘了怎么解锁,小米手机锁屏密码忘了怎么解锁？

linux centos 开机密码,centos开机就让我输root密码怎么办答

热门文章

计算机热重启的键应该是,电脑热开启按那几个键

windows10 输入法快捷键是Ctrl+空格键 ctrl+shift切换不生效

windows和android结合,Android和Windows 10可以很好地合作的10种方式

Linux单用户和多用户的区别,什么是多用户操作系统(多用户操作系统和单用户操作系统的区别)...

android rmvb格式下载,rmvb格式转换器安卓版

Visual Studio 2015离线版msdn帮助文档下载和安装

VS2019安装MSDN离线文档

所谓情商高就是会说话（摘录）

win10系统配置服务器地址,win10系统配置服务器地址

计算机更新失败项怎么强制关闭,电脑windows10系统怎么强制关闭烦人的自动更新，无需借助工具...

最新文章

win7系统计算机打不开6,Win7系统打不开ppt文件的六种原因和解决方法

win7，win10虚拟机安装保姆级教程

[ 云计算相关 ] mobaxterm 及 KVM 介绍 &amp;&amp; KVM 命令行创建 win7 虚拟机详解

win11系统更新蓝屏的5种解决办法

Windows文件系统

第二章准备接招

第三章看穿对手的策略

[ 云计算相关 ] mobaxterm 及 KVM 介绍 && KVM 命令行创建 win7 虚拟机详解

pe系统运行 mysql_win7旗舰版电脑无法启动MySQL服务，提示错误1067怎么办？

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载