博弈论在政治经济领域的运用-*忧忧国愁*-万维博客-万维读者网（电脑版）

设万维读者为首页

万维读者网 -- 全球华人的精神家园

广告服务

联系我们

关于万维

首　页

新　闻

视　频

博　客

论　坛

分类广告

购　物




忧忧国愁
我的中华大帝国
		https://blog.creaders.net/u/5696/ > 复制 > 收藏本页

网络日志正文

		博弈论在政治经济领域的运用	2011-12-05 19:54:37

博弈论在政治经济领域的运用(团队讨论稿）

一、博弈论概述及基本策略说明

博弈论也被称为“对策论”，按西方数学体系来看，其起源于二十世纪，最早是微观经济学的组成部分。但其实早在我国春秋战国时期，就已经有军事家，政治家在政治，军事，经济领域中使用博弈论的思想来制定策略，比如孙膑的“田忌赛马”，苏秦张仪的“合纵连横”等。非常可惜的是，我国古代对数学知识不太重视，士农工商中，只有比较底层的技工和商人才会学习算术，虽然中华文明在很早就一些辉煌的数学发现，但没有像西方那样重视数字逻辑及推理证明，导致我们并没有将这些数学发现进一步归纳，形成体系，最终让西方文明摘取了数学皇冠中的绝大部分明珠。

博弈论虽然是经济学家提出的概念，但应该看成是数学的一个分支。博弈论的基本概念包括参与人、行动、信息约束、策略、收益(效用)、结果和均衡等，其中，参与人、策略和收益是描述一个博弈需要的最少的三要素。下面，我们以“田忌赛马”为例，画出其收益矩阵，再根据其中的规律探寻如何选择博弈策略：

上面博弈中，参与人有2个，分别是田忌和齐威王；每个参与人各有上、中下三种策略，双方采用同等级的策略时，田忌会输给齐威王，而田忌的高级策略能赢过齐威王的较低级策略；每一场赛马的结果出来后，胜者赢得收益1，负者的收益则为-1。另外，还有一个信息约束，即参与人的每种策略都必须使用一次，一共将进行三场比赛，最终总收益最多者赢得最终的胜利。

从上面的表格中，我们可以发现，三场比赛下来，田忌只可能取得如下结果：胜2场输1场，胜1场输2场，胜0场输3场。为了让田忌赢得最终胜利，我们只有尽可能的让田忌取得“胜2场输1场”的结果。由此，我们可以遵循以下原则来选择策略：

1、不要选择严格劣势策略（如果都是负收益的情况下就是避免选择损失最大的策略，迭代剔除最劣策略）；

2、站在别人的立场去思考（还要思考别人在博弈时有多老练）；

对照上面的表格，我们可以观察到，当田忌选用下马出战时，不管齐威王选择哪个等级的马出赛，田忌都会输，所以田忌的下马是其最劣策略。但是，在上面的博弈中，最劣策略必须使用，那么我们来看，该如何通过这个最劣策略尽可能的减少损失，最后我们发现，如果我们用下马消耗掉齐威王的上马，可以做到损失最小化，孙膑正是这样处理。

之后，我们还要来思考一下齐威王会采取什么样的策略。之前田忌和齐威王进行过多次赛马博弈，双方一直使用的策略是上对上，中对中，下对下。那么这样来看，齐威王在不知道我方打算变更策略的情况下，将有非常大的概率重复之前一直采取的出战策略，即齐威王第一次会出上马，第二次出中马，第三次出下马。这样，我们就可以在第一场让下马出战，消耗掉齐威王的上马，之后第二场使用上马，第三场使用中马出战，从而取得2胜1负的最终战果。

当然，上面的策略是建立在齐威王不会更换策略的前提下，当齐威王上过一次当后，他为了重新取得胜利，有可能改变自己的出战策略。这个时候，孙膑想要取胜，最关键的是猜测齐威王会如何改变自己的策略，这就是我们不单单要站在别人的立场上思考，还要思考别人在博弈时有多老练的原因。如果齐威王比较笨，会按之前输的策略调整为：第一次下马出战，第二场上马出战，第三场中马出战的话，那么我们可以与之对应，第一场用中马出战，第二场换下马出战，第三场上马出战。结果还是田忌胜。经过多轮博弈后，齐威王可能吸收了教训，决定随机派遣出战，那么这个时候我们就不能再站在齐威王的立场上来思考，而是该转换一条思路，尝试从其他途径提前获知齐威王的出战策略，比如从齐威王的御马者处下手。

介绍完博弈论的策略选择原则后，我们接下来看看博弈论中非常重要的“纳什均衡(Nash Equilibrium)”，其定义如下：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的收益将会降低，此时形成的策略组合被称为纳什均衡点。

要注意的是：纳什均衡点在博弈中并不是唯一的，同一个博弈中，可能出现多个纳什均衡点。比如出现一个让所有参与人收益最大的纳什均衡点，还有可能出现一个让所有参与人收益较小的纳什均衡点，而且这两个均衡点是可以相互转换的，后面我会在经济领域中举例介绍一个纳什均衡的例子，其中将讲述如何改变纳什均衡点。

最后，用一个博弈小游戏来结束本段落，欢迎本文的读者将这个游戏（摘自耶鲁大学开发课程：博弈论）分享给你周围的朋友：这个游戏的方式是，让你周围的人各自从1~100中选择一个整数，你将所有人的数收集起来，然后算出其平均值，最终越靠近平均数2/3的人将获胜，你可以拿出10元钱将其当做获胜奖励（如果有多个获胜者答案相同的话，奖金将平分），看看你周围的人中，哪些人比较有博弈头脑。另外，你还可以让同样的人群重复进行这个游戏多次，看看结果会否有所变化。

二、博弈策略的融会贯通

在人类历史长河中，涌现了不少杰出的军事家，战略家，政治家，商者，这些伟人对博弈策略的理解，其实远远超越了目前纯理论研究的博弈论数学家和经济学家。我们学习西方的博弈论，是为了吸收其思想，借助其体系来分析实际情况，从而指导自己在现实社会中选取比较好的策略。但是，仅仅依靠上面的博弈论模型和收益矩阵来制定策略，并将其运用到实际环境中，结果可能并不理想。原因其实很简单，并不是所有的收益都能用数值来计算衡量的，总会有你没考虑到的情况，或你估算错误的收益。

博弈水平的高低，借用我从《火凤燎原》中看到的一句话来形容：发计，有三种。第一种，是单向而发；第二种，是双方互发；第三种，是融会贯通。

绝大多数人学完博弈论后，还只处于第一阶段，即会建立一个策略组合的收益矩阵，根据表格迭代剔除最劣策略，最后迭代选出最优策略。这个阶段的人，其思维模式是单向的，他们认为世界的规律都是非黑即白，依此心智模式选取出来的最佳策略，其实是给自己划地为牢，最后的结局要么是走极端，要么是被更高阶的对手来回反制，疲于奔命。

第一阶段的人，其中一部分在经历过现实社会的磨练后，能进阶到第二阶段，即站在别人的立场上思考。这个时候他所使用的策略是一个策略组合。其中可能有最佳策略，但是不排除还包含有次优策略，而这些策略的选择是根据对手的动向而选择的。比如故意让对手知道自己的第一步策略，引导对手针对该策略选择对策，然后在后续策略中蕴藏变招，让对手之前累积的优势一下子逆转为劣势，甚至为了防止对手猜出自己的策略，而从策略组合中随机选择的策略。要注意的是，双方互发的策略是在连续博弈中运用的，如果仅进行一次博弈时，在无法获知对手的情报时，只能采取最佳策略或随机选择一个次优测了。第二阶段的博弈思想，《火凤燎原》中战神吕布的“下一步理论”阐述的比较精辟：要让人知道你的下一步。偶尔，可以议别人猜到你的再下一步。却永远不要让别人洞悉你的真正意图。下一步理论的极致精髓那就是，让自己也猜不到，自己的下一步。

虽然“下一步理论”这种将计就计的博弈思维已有相当程度的博弈水平，但这并不是博弈思维的极限，战神吕布最终命丧白门楼，恰恰因为他的对手已经到达了融会贯通的第三阶段。

进入这一阶段的智者，除了会站在别人的立场上思考，还能通过心理学，情报信息确定对手的老练程度外，制定相应的混合策略组合外，最关键的是，能将事前无法推演的不确定因素，包容到自己的策略组合中去。即使出现无法包容的不确定因素，也要能因时制宜，随机应变，从危机找到转机。要能达成这一阶段，除了智商够格外，情商和逆商也不可或缺，情况越危急，困难越艰难，心态越要冷静，思维推演要越快越周密。不体验常人不愿涉及的艰难险阻，不经历一场脱胎换骨的蜕变，是很难锻炼出这样的心态的。据说不死的囚徒比任何人都富有梦想。据说只有被斥逐的人才能达到永恒。历史长河中的大成就者，很多都有过九死一生的经历，这段经历对常人而言是致命的，但对他们来说，恰恰是其成长蜕变的催化剂。苦难里面有黄金，但是并不是所有人都能从苦难中找到黄金，但如果你想成为融会贯通的博弈智者，最重要的一条就是：绝对不要逃避苦难，而是用积极的心态去拥抱苦难，甚至要主动找苦吃。

平常情况下，这样的智者和周围的聪明人相比，并无出色之处，甚至会比聪明人显得略差一点，当有捷径可走，他人投机取巧轻松过关时，他反而选择最难走的一条路。但一旦发生万分火急的大变故，大厦将倾之际，融会贯通者将会成为最佳智囊，帮组其周围的人一起走出困境，或利用危机成就一番大事业。

最后，要锻炼提升自己的博弈思维，不是单单学习博弈论就足够的，还需要了解人性，学习心理学，政治经济学，多看历史/军事/政治资料，建立自己的思维体系，并将其带入到现实生活中，不断检验并完善，同时，还要密切关注外界环境的变化，根据外界环境给自己建立的思维体系和策略行为设定一个或数个阀门（对投资来说即止损点和离场）。一般对常人而言，进入博弈思维的第二阶段即可让你平安度过这一辈子，后面的融汇贯通阶段如果觉得不适合自己的话就不要强求了。用博弈思想来看也是如此，并不是最好的策略最适合你自己，每个人最重要的是找到最适合自己的策略。

三、博弈思想在政治领域中的运用

在介绍政治领域的博弈案例之前，先向大家介绍一下博弈论中的两个最常见的博弈均衡：纳什均衡和帕累托最优。

纳什均衡是对参与人自身而言，各自所选取的收益最大的策略所形成的均衡点。而帕累托最优，是所有参与人收益总和最大的均衡点。其定义如下：指资源分配的一种理想状态。假定固有的一群人和可分配的资源，如果从一种分配状态到另一种状态的变化中，在没有使任何人境况变坏的前提下，使得至少一个人变得更好，这就是帕累托改善。帕累托最优的状态就是不可能再有更多的帕累托改善的状态；换句话说，不可能再改善某些人的境况，而不使任何其他人受损。

要注意的是，帕累托最优的经济系统只是在“最低”的意义上是“理想”的，并不能保证其中没有贫困或严重的贫富差距。举例说明，假如一项资源，分配给生产效率最高的人能获得最大收益，那么帕累托最优状态下，所有的资源全都会分配给生产效率最高的人，生产效率较低的人将一无所获。

在一个博弈案例中，如果有多个纳什均衡点的情况下，所有博弈者通过相互合作达成总利益最大的纳什均衡点即为帕累托最优。为了说明这一点，拿“囚徒困境”做为例子给大家剖析：囚徒困境是一个非零和博弈。大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被立即释放，而对方将被判刑十年；如果两人均招供，将均被判刑两年。如果两人均不招供，将最有利，只被判刑半年。其收益矩阵大致如下：

根据矩阵，我们可以发现这个博弈中存在两个纳什均衡点，分别是两人都招供及两人都不招供。都招供对双方来说所获得的总收益较小(损失最大)，而都不招供对双方来说所获得的总收益最大（损失最小），都不招供即为这个博弈的帕累托最优。

当囚犯之间无法沟通，且这个博弈只进行一次的情况下，囚犯们通常会选择都招供的策略。但如果囚犯之间有沟通或这个博弈在规则不变的情况重复进行多次时，囚犯们会选择帕累托最优的策略组合。

对执政者而言，如果他考虑的是推行一个长期执行的，可持续的政策时，都是期望这个政策能让所有参与人选择帕累托最优的策略组合。另外插播一个有趣的观点，生物学家从生物进化的模拟实验中也发现了类似的规律，绝对利己的策略模式只能保证生命物种个体的强大，对物种的繁衍壮大是不利的。当然，无条件的利他策略也是不可取的。为了让种群发展壮大，最佳策略是“一报还一报”，即在一个可重复的博弈中，一开始以合作的方式对待其他参与者，如果对方不合作，则下次碰到对方时也采用不合作策略，但要给对方改正错误的空间，只不合作一次，反之则继续合作，用成语来形容的话是“以德报德，以血还血”。

下面将继续介绍三个政治策略及其中的博弈分析：

1）中间选民定理

中间选民定理是一个理论，用来分析选民投票的行为。虽然这个定理的建立条件有些苛刻和不切合实际，但其结论却也能解释现实生活中的一些政治现象，大家不妨抛开脑中的限制思考下这个定理的适用范围。下面详细介绍一下这个定理的产生过程和推论：

假设在一场选举中有两位候选人，所有选民的偏好假设按人数平均分配，选民会把手上的选票投给离自己偏好最近的候选人。为了方便大家更清晰的理解这个模型，假设如下场景：有十一位食客（即选民），他们对菜肴的咸味偏好值从0到10，现在有两位厨师给这十一位食客做菜，两位厨师做的菜式完全一样，仅仅咸味有差别。食客会选择离自己咸味偏好最近的菜，请问厨师该选择咸味值为多少，才能在比赛中获得最多食客的青睐？

如果厨师A选择咸味9，厨师B选择咸味3。结果将是：厨师A得到咸味喜爱度10,9,8的食客的选票，厨师B则能获得余下食客的选票取得胜利。看到这里，相信大家都能想到，两位厨师为了获胜都会选择咸味5。如果把咸味偏好的刻度修改一下，变成从1到10，那么会出现厨师A选择咸味5，厨师B选择咸味6的情况，不管如何，都是平局，两位候选人为了获得胜利，其选择都会尽量向中间靠拢。如果只有一个中点，那么两位候选人的政见都对称罗列，如果没有中点的话，候选人的政见将会在中点左右两边对称分布，这就是中间选民定理。

在现实政治中，大家会发现，相对中立的政治家比较容易得到大多数人的认同，并且我国推崇的中庸之道，帝王的权衡之术，无不和中间选民定理有一丝淡淡的联系。再更进一步，当下的左右之争，我个人的观点是，如果想要实现中华民族的再次崛起，极左或极右都不可取，只有走中间线路，团结各阶层一切可团结的力量才是唯一的途径。这个定理从数学模型上来分析比较简单，但如何根据现实情况赋值度量是极其困难的，中点的选取一旦不当，失败也就是时间问题了。

2）种族隔离

种族隔离指在日常生活中，按照不同种族将人群分割开来，使得各种族不能同时使用公共空间或者服务。种族隔离是一种种族歧视行为。那么是什么原因导致了种族隔离呢？博弈论对此有一个非常有意义的解释，这个分析不单单解释了种族隔离形成的原因，还可以类比到为什么总是“人以群分，物以类聚”。

下面我们假设如下的博弈场景，为了简化分析，假设10万人分为两个种族，种族A和种族B。现在要给这群人在一个城市中分配住所。城市分为东区和西区两个部分。这群人在在选择住所时的获得收益如下所述：

绝大多数人对周围邻居的的心态变化大致是这样的：如果周围和自己同族的人越来越多（即周围的老乡越来越多），那么自己的快乐收益会越来越高，但是当周围自己的同族（老乡）人数超过异族（非老乡）时，快乐收益开始递减，但即使周围全是自己的同族（老乡），自己的快乐收益也会高于周围一个同族(老乡)都没有的情况。这个收益变化可以用下面的一个图表来模拟：

下面我们来看看每个人的最佳选择策略是什么，而这又会导致什么情况发生：当A族的某个人发现自己区域的同族比率较少时，他会考虑是否搬到和A族比率较多的区域去。从上面的收益曲线来看，当他发现自己周围同族的比率低于1/4时，他将会毫不犹豫的搬到和A族比率较多的一区去，因为当自己居所的同族比率低于1/4时，他的快乐收益怎么都比不上全是同族的1/2。而一旦A族的少部分人开始搬家后，将会导致这一地区的A族人的比率持续下降，于是形成搬迁潮，该地区的A族人都会陆续搬离该区，最终，该区仅仅剩下B族人。于此同时，另外一区由于A族的比率增加，导致B族人的快乐收益开始下降，于是该地区的B族人也将陆续搬入到之前B族人较多的地区。最终结果是，A族人集中居住在一边，而B族人集中居住在另外一边。

在上面的情景中，当每个人都选择自己的最佳策略时，最终导致整体群体形成较差的纳什均衡点（即自发形成了种族隔离），群体收益只有完全随机分配的一般。在现实社会中，虽然人们都不喜欢种族隔离，但在利己思想的影响下，让人们全都自主选择居住地址的话，最终往往形成种族隔离。如果政府完全不限制人们的居住地选择权的话，城市中会自发形成所谓的富人区和贫民窟，如果扩大到一个国家，会形成发达地区和不发达地区。马太效应之所以会一直存在，其根源和这个博弈过程也有相当的关联。所以，绝对的民主和绝对自由的市场经济并不一定能形成整个社会的效率最大化。为了防止这种自发隔离的状况发生，一个强有力的管理集团还是有必要存在的，但是这个集权团体要保证一定的公平和随机，才能让整个系统迸发出最大的活力，整个群体获得最大收益。

3）混合策略在外交谈判中的运用

在完全信息博弈中，如果在每个给定信息下，只能选择一种特定策略，这个策略为纯策略（pure strategy）。如果在每个给定信息下只以某种概率选择不同策略，称为混合策略（mixed strategy）。

在不存在纯策略的博弈中，为了实现混合策略的最优策略，即混合策略的纳什均衡，我们的原则是保证组合中每种策略的预期收益都相等。之所以采用这样的原则能达到最佳，是因为保证每种策略的预期收益都相等后，对博弈中的其他参与者而言，你的策略选择就显得随机而不好被猜测了，在多次重复博弈过程中，对手也只得从自己的策略组合中随机选择，从而达到一个博弈均衡。

为了实现这个目的，我们会根据每种策略收益的比率来调整每种策略出现的概率。拿石头剪刀布游戏来说，这个游戏不存在必胜的策略，所以将采用混合策略，由于每种策略的收益都是相等的，故每种策略的概率都是1/3。

下面我们分析更复杂些的混合策略博弈例子：两国A,B进行一场经贸合作的谈判，每个国家可以选择贸易合作或不进行贸易合作两种策略。其目的都是尽可能的让自己国家的收益最大，这场谈判的收益矩阵类似如下：

（B国收益在左，A国收益在右）

要计算出上面收益列表中的混合策略均衡点，我们可以假设A国使用合作策略的概率为p，那么使用不合作策略的概率是1-p。相对应的，B国使用合作策略的概率为q，使用不合作策略的概率是1-q。

根据上面的收益矩阵，我们可以计算出B国选用2种不同策略时的收益

B国采取合作策略的收益：5*p + 8*(1-p)

B国采取不合作的收益；9*p + 2*(1-p)

根据求解混合策略的纳什均衡原则，我们要保证B国选择每种策略的收益都相等，即：5p+8(1-p)=9p+2(1-p)，求解得：p=0.6，反之1-p=0.4。

即A国采取合作策略的概率为0.6，采取不合作策略的概率为0.4。

我们再来通过A国的收益计算下B国的策略概率情况：

A国采取合作策略的收益：5*q + 1*(1-q)

A国采取不合作策略的收益：2*q + 8*(1-q)

同理，要使A过选择每种策略的收益都相等，即：5q+(1-q)=2q+8(1-q)，求解得：q=0.7反之1-q=0.3。

即B国采取合作策略的概率为0.7，采取不合作策略的概率是0.3。

下面我们看看，假如上面的收益矩阵的某一项发生了变化，会导致博弈均衡朝什么方向变化。假设A国修改了自己的某项经济政策，提高了双方合作时自己的收益，使得上面的收益矩阵变为：

下面我们猜测下A国采取合作的概率会增加还是会减少？

如果仅从A国自己的利益出发，新政策的实施能让自己合作策略的收益提高，那么为了提高自己的收益，应该是加大合作概率的概率。但从B国的角度来看，和A国合作后A国的收益增加，对应导致自己的收益减少，那么B国应该减少自己使用合作策略的概率才对。那么这两种角度哪种正确或影响更大一些呢？我们可以通过计算上面混合策略的纳什均衡点来得出结论。

B国采取合作策略的收益：3*p + 8*(1-p)

B国采取不合作的收益；9*p + 2*(1-p)

根据求解混合策略的纳什均衡原则，我们要保证B国选择每种策略的收益都相等，即：3p+8(1-p)=9p+2(1-p)，求解得：p=0.5，反之1-p=0.5。

即A国采取合作策略的概率为0.5，和之前的0.6相比，其采取合作策略的概率有下降。

我们再来通过A国的收益计算下B国的策略概率情况：

A国采取合作策略的收益：7*q + 1*(1-q)

A国采取不合作策略的收益：2*q + 8*(1-q)

同理，要使A国选择每种策略的收益都相等，即：7q+(1-q)=2q+8(1-q)，求解得：q=7/12=0.583反之1-q=0.417。

即B国采取合作策略的概率为0.583，和之前的0.7相比，其采取合作策略的概率也有下降。

由此可见，是后一种的影响更大一些：当合作后A国的收益增加，会使得B国减少合作的可能性，之后A国为了应对对手策略概率的变化，也因此调低了自己采取合作策略的概率。

在使用混合策略的博弈过程中，当其中的某一项策略收益发生变动时，也需要根据对手的变化调整自己的策略概率。所以这个均衡一直是动态的，当某一方出招时，均衡就会被打破，从而导致预期的结果产生偏差。博弈参与者会因此修改自己的策略概率，达到一个新的纳什均衡。

要注意的是，使用混合策略的博弈一般都是多次重复的无限博弈。所以在后续的博弈过程中，某一项策略的收益有相当大的可能性发生变动。如果不注意到这一点，一直采用最初的策略概率来进行博弈，那么更加聪明的对手会根据这一点修改自己的策略概率来提高自己的收益。就拿上面的外贸合作例子来看，假如A国在修改某项经济政策提高自己合作后的收益后，还是维持之前0.6的合作概率，那么B国可以更多的采取不合作策略，减少A国的收益来使自己的收益增加。

这个例子衍生开来，可以用来解释现实社会中的不少博弈现象：比如在现实政治军事博弈，每个国家都不可能做到全知全能，前期因为手头掌握的信息有限，制定的对策方案会随着信息的增加，对手对自己策略的调整而逐渐改变，最终的博弈走向会和当初构想的完全不同。一般来说，战术层面上的博弈，预测的准确率能超过60%就算不错了。如果制定10年左右的战略规划，能保证10年后的结果能实现前期80%目标就算非常完美了。所以，我们在制定策略时，不要太过在乎前期策略的准确率，只要把握住大方向即可，一些战术层面上的博弈，应放手让第一线的决策人自己把握。如果为了提高前期策略的准确率，强行要求按照的最初策略方案来执行，最终极有可能导致整个战略层面的失败。

四、博弈思想在经济领域的运用

经济领域的博弈运用我将通过剖析几个经济方面的博弈案例来阐述：

1）银行挤兑分析

银行挤兑是存款人集中大量提取存款的行为，是一种突发性、集中性、灾难性的危机。由于消费者对银行给付能力失去信心而产生的从银行大量支取现金的现象。

对银行和存款人来说，两者之间有一个博弈过程：存款人将手上的资金存入银行，银行将存款人的资金部分用来放贷，获取利润，银行为了吸引更多的人到其中存款，会将获取的部分利润以存款利息方式返还给存款人。在这样一个博弈中，存在两个纳什均衡，好的纳什均衡即存款人积极存款，银行有足够的资金用来贷款以获取利润，同时使得存款人收益持续增加，这是一个双赢的局面。差的纳什均衡即存款人对银行失去信心，从而集中大量提现，导致银行资金链断裂破产，使得所有存款人利益受损，于之前相对应的，这是一个双输的局面。

如果一个博弈有多个纳什均衡点，那么有办法引导参与者达成一个较好的纳什均衡吗？或者将现有较差的纳什均衡点改变成为较好的纳什均衡点？具体到上面的例子，即当出现银行挤兑时，有什么办法能扭转当前的危机呢？

在美国的一部电影《生活多美好It's a Wonderful Life》中，就有一个这样的案例。电影中，等待提现的人群中跳出一个小伙子，他给大家提供了两种方案：一种是把把钱取出来，避免风险，但是，银行没有这么多钱，最后破产，大家都损失；另外一个是只提取满足日常开支的资金，或者继续存钱，那么银行保住了，最后通过时间来化解危机，大家都没有损失。

虽然电影中的案例不太真实，但这个思路是没有错的。当博弈过程中所有参与者之间能进行沟通时，参与者们会更倾向于通过合作方式获取更大的收益，这正是多个纳什均衡点之间转换的关键。反之，如果博弈的参与者之间无法顺利沟通，那么参与者会更倾向于选择不合作方式来保障自己的最大利益，从而形成较差的纳什均衡。在发生危机时，如果一方极力掩盖事件真相，造成信息不对称局面，那么另外一方会更多的选择不合作策略，最终导致整个形势朝着更坏的方向行进。

2）商品定价博弈

假设两家公司生产完全同质的商品，仅仅是两家的定价有所不同，这意味着消费者在购买这件商品时的唯一权衡指标是商品的价格。那么这件商品的定价博弈会出现什么情况呢？

结果将会有两种：

结果一：两家公司私下达成协议，双方使用相同的价格，并保留比较高的利润；

结果二：其中一家偷偷降价，来抢夺对方的市场份额，另外一家发现后，也下调价格，最终结果是两家公司都把商品售价价格降低至成本价，形成另外一个均衡；

前面一种结果即垄断，对消费者而言是损失最大的，所以各国都制定了《反垄断法》，来尽可能减少这种结果的发生。后一种结果对消费者最有利，但是对生产商来说，没有利润意味着公司无法发展壮大，且公司的抗风险能力极低，稍有差错就可能破产倒闭，从长远预期来看，后面一种结果对消费者也会造成一定的损失。

那么该如何避免这种情况的发生呢？答案是：产品差异化。即两家公司在生产相同功能的一件商品时，各自根据部分消费者群体的需求，开发出额外附属功能，使得消费者相信这些产品存在差异而产生不同的偏好，以此来避免同质商品的价格战博弈发生，比较明显的例子如手机，电脑等等。

对消费者而言，知道了产品差异化后的原因，我们在选择同类产品时，也能根据自己的特定需求选择更适合自己的产品，从而达到双赢的局面。

3）新产品发布：提前还是延后？

假设两家公司都在研发功能相同的一项产品，该产品的目标用户只可能选用其中一种产品。如果先发布的产品大受欢迎，将赢得所有目标用户，导致后面一家公司还未发布的产品直接失败。反之，如果先发布的产品品质很差，则用户会集体放弃已发布的产品，转而等待之后发布的产品，之后发布的产品一定会获得成功。另外，较晚推出的产品，其品质肯定比之前推出的产品高。在这样一个博弈案例中，如果你是其中一家公司的CEO，你将会如何抉择呢？是先发制人还是等待对手的失误取得胜利？

我们可以假设公司A发布产品成功的概率为p，公司B发布产品成功的概率为q，每过一段时间后，p和q的概率都会有一定程度的增长。下面我们来看看如何通过这些条件制定出最优策略：

以公司A为参照点，当公司A成功的概率 < 公司B失败的概率时，此时公司A如果率先推出自己的产品，随后公司B也立即推出自己的产品，由于p < 1-q，可以看到，公司B此时推出产品的成功率是高于公司A的成功率的，公司A的产品由于品质敌不过公司B，将立即遭遇失败。如果公司B不立即推出产品，而是继续等待打磨产品，这个结果也不会改变。

同理，当公司A成功的概率 > 公司B失败的概率时，公司A率先推出自己的产品，此时p >1-q，即使公司B立即推出自己的产品，但公司A的产品已经率先得到了用户的认可，用户不会转向比公司A产品品质稍差一些的公司B的产品。即使公司B不立即推出产品，而是等待品质超过公司A的产品后再推出，但已经被对手抢占了所有目标用户，最终公司B仍旧会失败。

所以，这个博弈的最佳策略是：没有到D点(即你成功的几率<对手失败的几率)之前，等待是一个好策略，当到达D点之时，尽量先下手为强。

另外，在类似这样的博弈中，人的心理作用不容忽视，心理学家通过多项心理实验得出如下结论：人们通常倾向于高估自己的成功率和能力。所以，不妨在等待的期间给对手制造错误的信息，诱使对手错误的高估自己的能力，主动犯错，从而给自己增加胜利的几率。兵法有云：预先取之必先予之也正是这个道理。

4）智猪博弈对员工激励机制的启发

　　智猪博弈的例子是：猪圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。

　　那么，两只猪各会采取什么策略？答案是：小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。

相信不少公司都有这种“小猪躺着大猪跑”的现象，即公司的一部分员工为公司带来可观效益，另外一部分员工没有出力却跟着享受收益。想要改变这种博弈结果的办法有三种：

方案一：减少食物的投放。将投食减少仅够一边的猪吃完，这样无论哪一边去踩踏板，在让另外一边守候的受益，而自己得不到任何利益。这样的结果是谁都不会有踩踏板的动力。这种办法会导致最坏的结果发生，对公司而言结局一定是倒闭；

方案二：增加投食的分量。保证每次投放的食量能让大猪小猪都吃饱。这种物质极大丰富的共产主义条件是很难实现的，所以也不具备可操作性；

方案三：改变投食的位置，同时减少投食的分量。将投食口改到踏板附近，同时减少投放的食量，仅保证投放的食量能让踏动踏板的一方吃完，而不踏的一方抢不到投放的食物。这种“多劳多得”的方案最具可操作性。

　　但是，方案三照搬到现实企业中，容易在企业中形成个人英雄主义和“唯KPI论”的氛围，所以在执行时也不能绝对化，一方面要在公司内营造一个良好的沟通氛围，通过员工间融洽和谐的沟通氛围来促进员工间相互协作，另外一方面还要保留少部分利益给不创造效益，但能促进员工相互合作的人，通过允许他们“搭便车”来培育公司的凝聚力和同心力。

举个例子，微软公司在创立的早期，曾经雇佣了一部分完全不会编程的女性从事项目管理方面的工作，这些员工虽然不能从事软件开发的工作，但她们能比较好的协调开发人员，并帮助其处理杂事，让其专心高效协作，从而大大提高了软件的开发效率。所以，凡事都不要走极端，最优的方案搬到现实生活工作中往往并不如分析中那么完美，我们在设计方案时最重要的是把握住“两利相权取其重，两害相较取其轻”的原则。

五、总结及注意要点

博弈论研究的一些案例都简化了相当一部分条件，同时将博弈对手削减为两个，主要目的是通过筛选出一些基本条件，方便推断出最佳策略，并形成结论。但现实社会中，有些条件对博弈的影响是相当大的，不恰当的删减这些条件，将会制定出和现实环境相背离的“最佳策略”，成为纸上谈兵的笑柄。

另外，参与博弈的人也不可能都是100%理性，在博弈过程中都有一定概率被非理性思维引导，从而选择对自己的非最佳策略，所以现实社会中的博弈往往很难达成一个完美的纳什均衡，通常情况下都只是接近一个纳什均衡，而且是可以通过一些外加条件的刺激来改变现有的均衡的。所以，我们在分析现实场景的博弈事件时，要尽可能的用中立的立场来思考，不要一开始就给自己定下枷锁，认定事情的发展走向一定会朝某个方向行进，非黑即白的观点是不可取的。举个例子，经济学中的货币政策里，增加货币的发行量会提高通货膨胀率，这一点被很多人认定是绝对真理了。但美国的两次量化宽松QE，对本国的通货膨胀提升刺激却并不大，这其中的原因是什么呢？类似的案例还有很多，我就不一一列举了，希望大家以后能带着疑问和中立的心态看待每一条结论和公理。