《博弈论精彩资料例子汇总.doc》由会员分享,可在线阅读,更多相关《博弈论精彩资料例子汇总.doc(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、笔记博弈论经典例子的思考摘要:博弈论就是关于在包含相互依存情况中的理性行为的研究,是研究对策现象中各方是否存在最合理的行动方案,以及如何找到合理的行动方案的理论和方法。本文分析思考了博弈论的两个典型例子,也对博弈价格战提出了自己的看法,希望能带给大家一些启发。关键词:纳什均衡非合作博弈无限博弈田忌赛马战国时期,齐王和大将田忌赛马,双方各出三匹 马各赛一局。各方的马根据好坏分别称为上马、中马、下马。田忌的马比齐王同一级的马差但比齐王低一级的马好一些。若用同一级马比赛,田忌必然连输三局。每局的赌注为1千金,田忌要输3千金。田忌的谋士建议田忌在赛前先探听齐王赛马的出场次序,然后用自己的下马对齐王的上
2、马,用中马对齐王的下马,用上马对齐王的中马。结果负一局胜两局赢得1千金。但若事先并不知道对方马的出场次序,双方应取何种策略?双方采用的赛马出场次序安排及相应的结果(齐王赢的千金数)可由下表所示列出。 齐王田忌上中下上下中中上下中下上下中上下上中上中下311111上下中131111中上下113111中下上111311下中上111131下上中111113由图可知,田忌赢的概率只有六分之一,孙膑只是掌握了齐王的思维定势侥幸赢了一把,在一把定胜负的时候管用,当试验的机会增多,田忌就输了。如果赛马的规则发生变化,每个人要将自己的马严格的划分等级,上等马速度必须比中等马快,中等马必须比下等马快,且比赛时同
3、等级的马才可以比赛的话,那么田忌就只有输的份了。孙膑只是一时抓住了规则的某些漏洞耍了些小聪明才取得一盘的胜利,我们只对他的小聪明淡然一笑罢了。博弈根据不同的游戏规则会产生与之相适应的策略。囚徒的困境有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话:检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,我可以和你做个交易。如
4、果你单独坦白杀人的罪行,你将无罪释放,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他无罪释放。但是,如果你们两人都坦白交代,那么,你们都要被判8年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况下无法串供,所以,按照亚当斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到无罪释放,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己
5、就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判8年,总比被判10年好。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突
6、,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要延长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时问的监禁的结果。有理由相信现实生活当中不是冤家不聚头。结果第二次,第三次这两个囚徒又被抓到一起。有了第一次教训之后他们会在接下来的审讯里做何选择呢?这就是有限次重复的囚徒的困境。博弈论里有一种倒推法来解决这个问题。假设这个例子只重复5次,因为在狱中渡过太多的岁月之后他们都老到做不动坏事了。我们先看第 5次他们会怎么选。显然第5次的面临的选择和第1次是一模一样的,因此没有理由相信
7、这两个囚徒会在第5次审讯里合作。如果第5次不合作,为什么他们会在第 4次合作呢?如此倒推,有限次重复的囚徒的困境和一次的结果没有任何不同,即双双坦白,入狱8年。如果把这种体验无限延长,或至少是他们俩知道肯定还有这种事,只是不知道什么时候才能停止这种把戏,这就是无限次重复的囚徒的困境,让我们再来看看这会不会有不同。因为无限博弈不存在最后一次,倒推法不再适用。假设一个人在监狱里呆久了会适应这种环境变得油滑。因此第一个8年最长,后来再进去的8年变得只有象6年一样长,再后来是4年.。因此这里引入一个表示监狱生活适应性指数的符号&,0&1。这个 &值越大表明对监狱生活越难适应,前一个8年和后一个8年差不
8、多一样漫长。如果&越小则表示这个囚犯对环境适应很快,后来呆上8年都没什么感觉了。对于一个经常被判8年的人来说,他的受惩罚实际感受的总量是:(-8)+&(-8)+&(-8)+.。易知,如果0&1,则1+&+&+&+.的极限值是1/(1-&)。假设这两个囚徒选择这样一种战略:最开始选择抵赖,然后一直选择抵赖直到另一方选择了坦白,然后就永远选择坦白。这样的话其中任一个囚徒选择永远抵赖的总收益是:(-1)+&(-1)+&(-1)+.=(-1)/1-&。如果其中某一次他选择了坦白,则那一次他将获无罪释放,之后对方将用永远坦白来惩罚他,他们俩都一直被判8年。因此总收益是:0+&(-8)+& &(-8)+.
9、=(-8&)/(1-&)。如果要使某次坦白对其中一个囚犯有利,显然需要其中坦白一次这种选择所带来的收益(-8&)/(1-&)大于等于一直互相合作抵赖所带来的总收益(-1)/1-&,也就是&=1/8的情况下(即某人实在认为狱中岁月妙不可言,判得久对他来说无所谓,&值极低)才会有人选择中途坦白,否则在无限次重复的囚徒的困境当中他们都会选择一直抵赖以使自己能尽量减少在监狱中渡过时光。因此在无限次重复的囚徒的困境中最后的结果和一次或是有限次完全不同。在很大概率上囚徒会选择合作而不是各自为战。也就是说,在长期的双方关系中任何短视的行为都是得不偿失的。这个结果可以用来说明为什么我们的传统文化里强调人与人的
10、关系以和为贵。数千年来中国一直是农业国家,农业人口缚系于土地,乡间邻里相对固定。因此人们彼此之间的很多利益冲突可以用无限次重复的囚徒困境来描述。也就是说如果某次利益是通过冲突而不是合作解决,那么失利的一方必然会设法报复,而且这种对立的情绪很有可能在后辈中延续,也就是无限次被重复,结果必然是双方都得不偿失。此所谓冤冤相报何时了!我的看法是:现实中囚徒要考虑更多的因素,即使他们合谋决定合作,他们商量好都抵赖,但是真正面对警察的审讯时,他们又会考虑对放是否会出卖自己,他们有可能会继续出卖对方。但是人都有报复心理的,如果一方违背了约定,虽然能很快出狱,但是若干年后呢,那位囚徒刑满释放后会放过他吗?考虑
11、到若干年后的情况,两个囚徒也许会都选择抵赖。如果惩罚和奖赏的度发生改变:两人都坦白的话,则均判刑1年;A坦白B抵赖,则A无罪释放,B判刑5年;两人都抵赖的话,则均判刑3个月,这样的情况下,两个囚徒会做怎样的选择呢?这样两个囚徒都选择坦白的可能性比较大,毕竟一年的时间比较短,不必为了3个月的刑而冒坐牢5年的风险。这里涉及到了风险收益不对称问题,湖北省的一些官员,明明知道某些问题存在,却坐视不理,很大的原因就是风险收益不对称,不治理问题不会太大,治理好了奖励表彰也不怎么样,治理差了要受到责怪,于是湖北就有些落后,原因就是湖北的官太聪明了。总之,囚徒的困境涉及到的问题众多,不仅仅是心理与智力的较量,
12、游戏规则的指定对结果产生的影响是比较明显的。而现实中我们要考虑的相关因素会更多,博弈论只有与我们已经掌握的情况充分的结合才能得出比较满意的策略。博弈价格战现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两
13、个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润、如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润:从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中
14、,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。我对博弈价格战的看法是:各个公司的实力是不一样的,一些国际上知名的家电厂商,和国内厂商一样采取低价战略,同样低价的情况下,老百姓当然愿意选择国际知名的大公司的产品,因为国际知名大公司的产品有档次,质量也不会比国内的差。虽然说厂家都会亏本,但是国际大公司资金雄厚,他亏本几年甚至十几年都亏得起,国内一些脆弱的公司亏本几个月或
15、者一年就倒下了,一家家国内家电厂商退出后,国际大公司形成垄断,适当提高价格,不久就会把以前亏损的钱弥补回来,也许还会赚得更多。但是当一些普通品牌家电厂商采取低价策略的时候,一些名牌家电厂商会采取提价的策略,也许一些经济能力差点的消费者会买相对便宜的普通品牌家电,但是有能力买名牌家电的人会觉得名牌家电不降价是因为质量好,所以尽管名牌家电提价后仍然获得了丰厚的利润,同时在中国这个社会,攀比非常严重,人们的思维定势是便宜没好货,在中国,少数消费者目前处于盲目消费阶段,不管多贵的东西都有人买,商家不愁卖不出去,。所以说,商家不管是采取提价还是降价都是可取的,但是要结合当时的情况,还有就是厂家的目的到底
16、是为了立竿见影还是在几年后的翻盘。结语博弈渗透到生活的各个方面,实际情况往往比理论复杂得多,不按常理出牌也许会收到意想不到的效果,只有知己知彼才能做出最正确的决策。参考文献1、施锡铨著博弈论上海:上海财经大学出版社,20002 刘加福新管理博弈学中国纺织出版社,20053 张维迎博弈论与信息经济学上海人民出版社,19964 谢识予经济博弈论石家庄:复旦大学出版社,2002http:/www.1zhao.org/viewthread.php?tid=105717博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各
17、自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。下面介绍几个关于博弈论的例子:1。智猪博弈这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
18、 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩
19、踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 对于游戏设计者,这是
20、一个最好的方案。成本不高,但收获最大。原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈” 增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也
21、不会有动力了-就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三-减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。 许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。 2囚徒困境在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(pris
22、oners dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。 我们来看看这个博弈可预测的均衡是什么
23、。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。(抵赖、抵赖)是最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。3笨蜗居Ross和Rachel是一对情侣,暗地里都有过不忠的行为。但他们并不想分开,而是希望能继续生活在一起,于是不得不面对一个问题:是否应该向对方坦白自己的不忠行为?对于Ross来说,他有两个战略,“坦白”或者“隐瞒”。如
24、果他向Rachel坦白自己的过错,Rachel作为“清白”的一方(Ross并不知道Rachel的不忠行为,当Rachel选择“隐瞒”)将在二人关系中占据心理优势,从而使得Ross处于弱势状态。如果他决定隐瞒,则将背负良心上的谴责。这个博弈是对称的,因此对于Rachel来说同样存在这样的两难抉择。我们引入经济学的收益概念来衡量博弈中战略的优劣,设收益上限为10分。如果Rachel选择“隐瞒”而Ross选择“坦白”的话,Rachel将占据“我是清白的”的心理优势,从而获得9的收益,而劣势一方的Ross的收益只有5。反过来对Ross来说也是一样。如果两人都不约而同地选择“坦白”,虽然彼此都会感到被背
25、叛的痛苦,但是能够将心比己地互相原谅,二人的收益都是8。如果两人都选择“隐瞒”,他们之间感情得以维系的信任基础已经在事实上消失了,对双方来说都是非常大的损失,收益都只有6。下表列出了四种情况下双方的收益,Rachel在前。Ross坦白隐瞒Rachel坦白8 , 85 , 9 隐瞒9 , 56 , 6直观地说,肥皂剧观众和经济学家们最愿意看到的结果自然是双方都坦承错误并互相原谅,这样可以使这部肥皂剧更加吸引人并且使双方收益之和最大。但博弈论给出的结论却正好相反。从表中可以看出,在Rachel选择“坦白”的情况下,Ross选择“隐瞒”的收益大于选择“坦白”的收益;在Rachel选择“隐瞒”的情况下
26、,Ross选择“隐瞒”的收益也大于选择“坦白”的收益。因此,“隐瞒”对于Ross来说是一个占优战略,无论对方做出什么选择,这个战略都可以保证他的收益最大。作为一个理性的人(这是博弈论的基本假设),Ross必然会选择“隐瞒”。同样,Rachel也会选择“隐瞒”。于是,博弈的结果就是双方都选择“隐瞒”,各得到6收益。 这是个稳定的纳什均衡,虽然结果出乎意料:博弈双方都选择了使自己利益最大化的战略,却得到了最差的收益(总收益是四种方案中最低的)。而观众所期待的“彼此坦白”的情况下,任何一方都可以通过改变策略而获得更大的收益,比如Ross由“坦白”转向“隐瞒”可以使自己的收益由8上升到9。因此它是一个
27、不稳定解,必须依靠某种外界约束才能存在。我们设想Ross和Rachel之间达成某种形式的协议,承诺对对方的不忠行为既往不咎。在这个约束条件下“彼此坦白”的解能够稳定存在,这就是合作解。这是个典型的社会两难问题。各自从自身利益出发的博弈双方会自然而然地达到稳定的纳什均衡,但这往往导致最坏的收益。如果双方能建立有约束力的协议,则可以形成合作解,从而获得最好的收益。http:/ 博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。 一个完整的博弈应当包括五个方面的内容:第一,博弈的
28、参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。 囚徒困境 囚徒困境是博弈论里最经典的例子之一。讲的是两个嫌疑犯(和)作案后被警察抓住,隔离审讯;警方的政策是坦白从宽,抗拒从严,如果两人都坦白则各判年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判年;如果都不坦白则因证据不足各判年。在这个例子里,博弈的参加者就是两个嫌疑犯和,他们每个人都有两个策略即坦白和不坦白,判刑的年数就
29、是他们的支付。可能出现的四种情况:和均坦白或均不坦白、坦白不坦白或者坦白不坦白,是博弈的结果。和均坦白是这个博弈的纳什均衡。这是因为,假定选择坦白的话,最好是选择坦白,因为坦白判年而抵赖却要判十年;假定选择抵赖的话,最好还是选择坦白,因为坦白判不被判刑而抵赖确要被判刑年。即是说,不管坦白或抵赖,的最佳选择都是坦白。反过来,同样地,不管是坦白还是抵赖,的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑年。在(坦白、坦白)这个组合中,和都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。 囚徒困境反映了个人理性和集体理性的矛盾。如果和都选择抵赖,各判刑
30、年,显然比都选择坦白各判刑年好得多。当然,和可以在被警察抓到之前订立一个攻守同盟,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。 实证分析: 囚犯困境在经济学上有很多应用,也有力地解释了一些经济现象。 一电信价格竞争 根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。 正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优
31、惠,其中就有B的价格可以比P0低10。这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。这时候,A该怎么做?不妨假定: A降价而B维持,则A获利15,B损失5,整体获利10; A维持且B也维持,则A获利5,B获利10,整体获利15; A维持而B降价,则A损失10,B获利15,整体获利5; A降价且B也降价,则A损失5,B损失5,整体损失10。 从A角度看,显然降价要比维持好,降价至少可以保证比B好,在概率均等的情况下,A降价的收益为15505505,维持的收益为550
32、105025,为了自身利益的最大化,A就不可避免地选择了降价。从B角度看,效果也一样,降价同样比维持好,其降价收益为5,维持收益为25,它也同样会选择降价。在这轮博弈中,A、B都将降价作为策略,因此各损失5,整体损失10,整体收益是最差的。这就是此博弈最终所出现的纳什均衡。我们构造的这一电信业价格战博弈模型是典型的囚徒困境现象,各个局部都寻求利益的最大化,而整体利益却不是最优,甚至是最差。 许多其他行业的价格竞争都是典型的囚徒困境现象,如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。二OPEC组织成员国之间的合作与背叛 囚徒困境告诉我们,个人理性和集体理性之间存在矛盾,
33、基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。 上述我们在对电信价格竞争的博弈分析中,只是一次性的囚徒困境博弈,因此得到了互相降价的纳什均衡。而在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,合作都是一种随处可见的现象。比如中东石油输出国组织( 简称)的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。OPEC之所以能够成立,各组织成员国之间之所以能够合作,是因为囚徒困境如果是一次性博弈(One shot game)的话,基于个人利益最大化,得到纳什均衡解
34、,但如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的大众定理(Folk Theorem)的含义。 但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺(Credible commitment) ,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。这里可信的承诺是一个很牵强的翻译,Credible commitment并不是什么空口诺言,
35、而是实实在在的付出。所以合作是非常困难的。 所以OPEC组织经常会有成员国不遵守组织的协定,私自增加石油产量。每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降-结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌.。 理论上,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。但只要是有限次的合作,合作就不会成功。比如合作次,那么在第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作.一直到,从第一次开始大家都不会采取合作态度。 以上是运用博弈论中的经典案例囚徒困境对现实经济生活的一些简单的理论上的分析,虽然在现实生活当中影响人们决策和态度的因素很多,但是,博弈论作为现代经济学的前沿领域,始终是一个强有力的分析工具。http:/
限制150内