竞争与博弈论.ppt
《竞争与博弈论.ppt》由会员分享,可在线阅读,更多相关《竞争与博弈论.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、博弈论与竞争策略博弈论与竞争策略博奕理论基础博奕理论基础几种典型博奕模型及应用几种典型博奕模型及应用策策略略行行动动几种相关的策略几种相关的策略几种相关的策略几种相关的策略 小小结结例题例题博弈论博弈论(GameTheory)也叫做对策论或竞赛论,在20世纪50年代由数学家约翰冯诺依曼和经济学家奥斯卡摩根斯坦引入经济学,目前已经成为经济分析的主要工具之一。博弈论在近数十年中获得了长足的发展,且应用的领域十分广泛,它对寡头理论、信息经济学等经济理论的发展作出了非常重要的贡献。1994年的诺贝尔经济学奖颁发给了约翰纳什等三位在博弈论研究中作出重大贡献的经济学家,1996年的诺贝尔经济学奖又授予在博
2、弈论的应用方面有着重大成就的经济学家,由此可见博弈论在现代经济学中有相当重要的地位。博奕问题的刻画博奕问题的刻画博奕论:描述和研究行为者之间策略相互依存和相互作用的决策理论,其目的在于说明决策主体如何在缺乏其决策后果的充分信息的条件下做出合理的决策。博奕问题的构成:1、参与博奕的博奕者,也称为参与者;为一个决策主体,可以是一个自然人,也可以是一个组织,其目的是通过选择某种策略使自己的收益最大化。2、每个博奕者可能采取的策略,即博奕参与者所采取的行动方案;3、所有博奕者可能选择的每一种策略组合情况下每一个博奕者所得到的收益(也称为支付)。所谓收益就是策略实行后的结果。收益矩阵又称为支付矩阵、得益
3、矩阵或报酬矩阵,它表明了博奕的参与者采取的每种策略组合的结果或收益。某一寡头市场上有A、B两个企业,他们的目标是通过价格变化来增加他们的利润。假定每家企业有两种可能的策略:或保持现在的价格水平;或涨价。在这一搏奕中,有四种可能的策略组合:两家企业都涨价、两家企业都不涨价、企业A涨价但企业B不涨价和企业B涨价但企业A不涨价。四种策略组合的每一结果可以用收益矩阵来表示。企业B价格不变涨价价格不变企业A涨价10,26,815,010,5占优策略均衡与纳什均衡占优策略均衡与纳什均衡如何决定什么是最优策略?如何确定一个博奕的大致结果?占优策略:指不管对方选择什么策略,对博奕方来说都是最优的策略。也就是说
4、,在一个博奕中,如果某一个博奕者具有占有策略,那么无论其他博奕者选择什么策略,该博奕者确信自己选择的唯一策略都是最优的在上表所表示的博奕中,涨价是企业B的占优策略。涨价也是企业A的占优策略。博奕均衡:指博奕中的所有参与者都不想改变自己的策略的这样一种状态。在上面分析的例子中,(涨价,涨价)这一对策略组合下的博奕状态,就是一种均衡状态。占优策略均衡:由博奕中的所有参与者的占优策略组合所构成的均衡。纳什均衡:假定其他的参与者的策略既定的话,博奕中所有的参与者都不会改变自己的策略。将上表做一点改变,变成下表,现在企业A没有了占优策略.两企业都涨价是一个纳什均衡企业B价格不变涨价价格不变企业A涨价20
5、,26,815,010,5总总结结占占优优策策略略均均衡衡是不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。纳什均衡是纳什均衡是给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。关系:占优策略均衡是占优策略均衡是纳什均衡的一种特殊情况况,但纳什均衡却不一定是占优策略均衡。最大最小策略最大最小策略纳什均衡的概念是建立在博奕者理性行为基础之上的。而在有些博奕中博奕者的理性行为是有局限性的,这一局限性,使得某些博奕达不到纳什均衡。请看下面这个例子。(新产品,新产品)是一个纳什均衡,且是唯一的纳什均衡企业B无新产品有新产品无新产品企业A有新产品1,01
6、,1-1000,02,1企业可能采用一种风险厌恶策略,即最大最小策略,也就是在确保在最坏结果中得到最好的结果,即指博奕者所采取的策略是使自己能够获得的最小收入最大化最大最小策略的实施:首先确定每一种策略的最低收益;在最小值中选取最大值。在上面的例子中,如果博弈双方都采取最大最小策略,就是(无新产品,新产品)。最大最小策略特点:最大最小策略特点:非利润最大化,避免亏损过多。几种典型博奕模型及应用几种典型博奕模型及应用非合作性和合作博奕非合作性和合作博奕性别之战与公共标准的争夺性别之战与公共标准的争夺重复博弈与序列博弈重复博弈与序列博弈非合作性和合作博奕非合作性和合作博奕非合作性博奕:囚犯的困境非
7、合作性博奕:囚犯的困境非合作性博奕是指在这种博奕中博弈双方无法通过协商达成某种形式的用来约束彼此行为的协议。现实中的企业竞争通常是处于非合作性的博奕中。在有些情况下,非合作性博奕能够导致既非参与者也非社会所需要的结果。例囚犯的两难境地囚犯的两难境地有两个犯罪嫌疑人A和B在校园里偷自行车时被逮捕,检察官将他们分别关在两处进行审讯。检察官对嫌疑人A说,“我们实行的是坦白从宽,抗拒从严的政策,如果你们两个人都不坦白,你们都将被起诉判刑2年;如果你坦白了而他不坦白,那么你将只被判1年,他将被判8年;如果他坦白了而你不坦白,那么你判8年他判1年;如果你们两个都坦白,你们都将被从轻宣判。”当然,检察官对嫌
8、疑人B说的话也是完全一样的。但实际上,如果两个人都坦白,却会因涉及更多的罪案而都被判刑5年。案犯案犯B 坦白坦白 不坦白不坦白 坦白坦白案犯案犯A 不坦白不坦白5,51,88,12,2最可能出现的结局是两人都坦白,即最可能出现的结局是两人都坦白,即(坦白,坦白坦白,坦白)的结局。的结局。囚犯的困境反映了一个深刻的问题,即个人理性与集体理性的矛盾。囚犯的困境反映了一个深刻的问题,即个人理性与集体理性的矛盾。每个人都以自身利益最大化为出发点进行决策,结果是不符合集体每个人都以自身利益最大化为出发点进行决策,结果是不符合集体理性的。理性的。例例2寡头垄断市场的价格竞争广告竞争寡头垄断市场的价格竞争广
9、告竞争假假设设一一个个市市场场中中只只有有A、B两两家家企企业业,每每家家企企业业可可采采取取的的定定价价策策略略都都是是10元元或或15元元,我我们们可可用用下下面面的的收收益益矩矩阵阵来来说说明明每每种种策策略略组组合合的的结结果果。在在矩矩阵阵中中每每一一对对数数字字,前前一一数数字字表表示示企企业业A可可获获得得的的利利润润,后后一一数数字字表表示示企企业业B能能获获得得的的利润,单位为万元。利润,单位为万元。企业B10元15元10元企业A15元100,80180,3050,170150,120企业B少做多做少做企业A多做30,3010,4040,1020,20广广告告之之战战例例3应
10、用应用囚囚犯犯的的两两难难境境地地适适用用于于许许多多博博奕奕场场合合。其其中中一一个个重重要要的的例例子子就就是是前前苏苏联联和和美美国国之之间间的的军军备备竞竞赛赛。两两个个国国家家都都在在导导弹弹花花了了几几万万亿亿美美元元,其其能能力力足足以以毁毁灭灭对对方方几几次次。这这些些消消费费是是有有机机会会成成本本的的,是是以以牺牺牲牲教教育育、住住房房建建设设、医医疗疗保保健健等等为为代代价价的的。但但是是谁谁也也不不愿愿意意减减少少这这方方面面的的支支出出,因因为为怕怕对对方方会取得军事上的优势。会取得军事上的优势。合作性博奕合作性博奕合作性博奕是指在这种博奕中,博奕双方有可合作性博奕是
11、指在这种博奕中,博奕双方有可能彼此协商、签订协议,从而都有义务执行既定的能彼此协商、签订协议,从而都有义务执行既定的策略。策略。合作和非合作博奕之间的基本差别在于签订合合作和非合作博奕之间的基本差别在于签订合同的可能性。在合作博奕中有约束力的合同是存在同的可能性。在合作博奕中有约束力的合同是存在的,而在非合作博奕中他们是不可能的。的,而在非合作博奕中他们是不可能的。女音乐会电影音乐会男电影2,10,00,01,2从上述得益矩阵中可以看到,分开将使他们两人得不到任何满足,只要在一起,不管是看电影还是听音乐会,两人都会得到一定的满足。但音乐会将使男的得到更大满足,看电影则使女的得到更大满足。在这样
12、一个对局中,男的和女的最优策略依赖于对方的选择,一旦对方选定了某一项活动,另个人选择同样的活动就是最好的策略。因此,如果男的已经买好了音乐会的门票,女的当然就不再反对;反之,如果女的已经买好了电影票,男的也就会与她一起去看电影。那么,在这个对局中是否存在均衡状态呢?容易看到,两人都去看电影即(电影,电影)是一种均衡状态。也就是说,在这种状态下,双方都不想再改变他们的策略。显然,完全类似地,(音乐会,音乐会)也是种均衡状态。在市场竞争中,同样存在与性别之战类似的情况。例一对恋人准备在周末晚上一起出去,男的喜欢听音乐会,但女的比较喜欢看电影。当然,两个人都不愿意分开活动。不同的选择给他们带来的满足
13、由上表表示。性别之战性别之战公共标准的争夺公共标准的争夺例20世纪90年代初,日本企业在高清晰度电视(HDTV)的发展方面居于领先地位。高清晰度电视技术将极大地改善电视图像的质量,并将成为未来的互动式电视传播方式的基础。但高清晰度电视的发展面临一个重大的战略问题,即如何确定世界范围的技术标准?日本企业已经有了它们的标准,这种标准被称为MUSE,而欧洲企业也在开发它们自己的技术标准。假定这两类企业的技术标准的策略选择将使它们得到如表所示的得益矩阵。上述得益矩阵可见,对日本企业来说,如果日本企业和欧洲企业都采用日本标准,它们获得最大得益;同样地,对欧洲企业来说,它们的最大得益也要求双方都采用欧洲标
14、准。由此可见,协调对双方都非常重要,如果它们各自采用自己的标准,它们的得益都将远远低于采用同种标准的情况。表表高清晰度电视技术标准的争夺高清晰度电视技术标准的争夺欧洲企业日本标准欧洲标准日本标准日本企业欧洲标准100,5030,200,060,90在这对局中,我们也可以找到两个均衡点,即(日本标准,日本标准),或者(欧洲标准,欧洲标准)。也就是说,旦方选定了某种标准,另方的最好策略就是采用与对方同样的技术标准。但问题是,双方对于采用何种技术标准的意见是完全对立的。或许我们会期望,两个均衡中总有个会成为最终的结局,但实际情况是,日本与欧洲至今并未达成有关HDTV技术标准的协议,他们仍在各自发展自
15、己的标准。美国的态度使这一问题进一步复杂化。美国联邦通讯委员会决定,美国的HDTV信号必须与美国现存的电视机相兼容。因此,美国企业也在发展它们自己的技术标准,而这一标准既不同于日本的技术标准,也不同于欧洲的技术标准。世界上最终能否实行一个统一的高清晰度电视技术标准,还是像电视机和录像机那样同时存在几十个制式被不同的国家采用,我们将拭目以待。中国的CVD与SVCD也存在着上述标准之争,最后用超级VCD重复博弈与序列博弈重复博弈与序列博弈(一)重复博弈(一)重复博弈1、无限次重复博弈、无限次重复博弈在在前前面面的的分分析析中中我我们们看看到到,在在寡寡头头垄垄断断市市场场中中,企企业业在在进进行行
16、价价格格或或产产量量决决策策时时常常常常会会发发现现自自己己处处于于囚囚犯犯的的困困境境中中,为为了了摆摆脱脱这这种种困困境境,企企业业之之间间可可以以合合作作,但但是是,合合作作常常常常因因为为履履行行协协议议不不可可能能从从而而使使合合作作瓦瓦解解。除除此此之之外外,企企业业还还能能找找到到其其他他方方法法脱脱离离这这种种困困境境,从从而而使使寡寡头头之之间间的的协协调调和和合作能够成功吗?下面我们来分析这个问题。合作能够成功吗?下面我们来分析这个问题。在在现现实实中中的的大大多多数数企企业业之之间间的的竞竞争争一一般般都都将将持持续续一一个个较较长长的的时时期期,也也就就是是说说企企业业
17、之之间间进进行行的的是是重重复复博博奕奕,即即反反复复进进行行多多次次的的博博奕奕。在在博博奕奕可可以以多多次次重重复复的的情情况况下下,竞竞争争的的结结局局是是否否会会有有所所改改变变呢呢?对对博博弈的参与者来说,此时是否存在一种最好的策略呢弈的参与者来说,此时是否存在一种最好的策略呢?仍以企业的价格竞争这一博奕来作分析。如表那样仍以企业的价格竞争这一博奕来作分析。如表那样.企业B低价高价低价企业A高价10,10100,-50-50,10050,50如如果果这这个个博博奕奕可可以以一一次次次次重重复复,例例如如企企业业A和和企企业业B在在每每一一周周的的第第一一天天同同时时宣宣布布价价格格,
18、此此时时这这个个博博奕奕会会如如何何进进行行下下去,企业会以什么样的方式进行这个博奕呢?去,企业会以什么样的方式进行这个博奕呢?在重复博弈的情况下,容易想象,企业在选择策略的时候在重复博弈的情况下,容易想象,企业在选择策略的时候不仅需要考虑当前的博奕,而且还需考虑当前选择的策略不仅需要考虑当前的博奕,而且还需考虑当前选择的策略对于以后的博奕将产生怎样的影响。对于以后的博奕将产生怎样的影响。美国密执安大学教授罗伯特美国密执安大学教授罗伯特阿克赛罗对无限次重复博弈阿克赛罗对无限次重复博弈进行了系列研究,他曾邀请博弈理论家就案犯的困境问题进行了系列研究,他曾邀请博弈理论家就案犯的困境问题提出他们各自
19、能想到的以重复方式进行这个博奕的最好策提出他们各自能想到的以重复方式进行这个博奕的最好策略,然后,用计算机模拟的方式来决定哪种策略将是最好略,然后,用计算机模拟的方式来决定哪种策略将是最好的策略。有的策略。有14位来自经济学、心理学、政治学、社会学和位来自经济学、心理学、政治学、社会学和数学领域的博弈论专家提交了程序。阿克赛罗让这些程序数学领域的博弈论专家提交了程序。阿克赛罗让这些程序及一个随机程序进行循环赛,重复了及一个随机程序进行循环赛,重复了5次,总共进行了次,总共进行了12万次对局。万次对局。结果令人吃惊,获胜的程序就是最简单的程序:结果令人吃惊,获胜的程序就是最简单的程序:“以牙还以
20、牙还牙牙”。这一程序以合作的策略开始,以后每一次的选择都。这一程序以合作的策略开始,以后每一次的选择都只是模仿对方上一次的选择。其后,阿克赛罗公布了第一只是模仿对方上一次的选择。其后,阿克赛罗公布了第一次竞赛的结果,并再次征集新的程序。这一次他收到了次竞赛的结果,并再次征集新的程序。这一次他收到了62个程序,许多程序设计复杂而精巧,个程序,许多程序设计复杂而精巧,还有的程序是对还有的程序是对“以牙还牙以牙还牙”策略的改进。但第二次竞赛的结果与第一次一策略的改进。但第二次竞赛的结果与第一次一样,获胜的仍然是最简单的原则:样,获胜的仍然是最简单的原则:“以牙还牙以牙还牙”。在在企企业业的的价价格格
21、竞竞争争中中,这这一一策策略略意意味味着着:在在第第一一次次博博奕奕中中,企企业业应应选选择择高高价价策策略略。如如果果对对方方在在第第一一次次选选择择高高价价,你你也也就就选选择择合合作作:定定高高价价;如如果果对对方方在在第第一一次次选选择择低低价价竞竞争争,你你就就在在第第二二次次也也降降价价竞竞争争。只只要要对对方方在在某某一一次次降降价价竞竞争争,你你就就马马上上选选择择降降价价作作为为报报复复;反反之之,如如果果对对方方保保持持“合合作作”的态度,你也就一直合作下去。的态度,你也就一直合作下去。为为什什么么这这种种以以牙牙还还牙牙策策略略的的结结果果是是最最好好呢呢?特特别别是是企
22、企业业用用了以牙还牙策略就能促使他的对手进行合作吗?了以牙还牙策略就能促使他的对手进行合作吗?设设该该博博奕奕是是无无限限重重复复的的。也也就就是是说说,我我的的竞竞争争者者和和我我的的每每周周定定价价要要永永远远重重复复进进行行下下去去。这这时时合合作作行行为为是是对对以以牙牙还还牙牙策策略略的的理理性性反反应应。设设想想在在某某周周中中我我的的竞竞争争者者定定了了一一个个低低价价,即即降降价价与与我我竞竞争争,因因而而在在这这个个周周中中获获得得较较大大的的利利润润,但但该该竞竞争争者者也也知知道道下下个个周周我我也也会会降降价价,从从而而它它的的利利润润就就会会下下降降,并并且且只只要要
23、我我们们俩俩一一直直都都定定低低价价就就一一直直将将是是低低价价。由由于于该该博博奕奕是是无无限限重重复复的的,所所导导致致的的累累计计损损失失必必然然会会超超过过第第一一个个周周降降价价所所得得到到的的短短期期利利润润。因因而而降降价价竞竞争争是是不不明明智智的的。事事实实上上,在在一一个个无无限限重重复复博博奕奕中中,竞竞争争者者并并不不必必须须肯肯定定对对手手会会采采用用以以牙牙还还牙牙策策略略,才才会会采采用用合合作作这这种种理理性性的的策策略略,即即使使只只要要相相信信竞竞争争对对手手相相信信有有可可能能采采用用以以牙牙还还牙牙策策略略,就就会会采采取取合合作作这这种种理理性性的的策
24、策略略。因因为为在在一一个个无无限限重重复复的的博博奕奕中中,合作的期望收益会超过降价竞争的收益。合作的期望收益会超过降价竞争的收益。序列博弈序列博弈在在上上述述讨讨论论中中,实实际际上上还还假假定定各各个个博博奕奕者者是是同同时时选选择择他他们们的的策策略略的的,比比如如两两个个企企业业同同时时决决定定产产量量,同同时时决决定定价价格格,但但实实践践中中大大量量存存在在的的另另一一种种情情况况是是,博博奕奕者者选选择择策策略略有有时时间间先先后后的的顺顺序序,某某些些博博奕奕者者可可能能率率先先采采取取行行动动。这这种种博博弈弈被被称称为为序序列列博博弈弈。重重复复博博弈弈是是一一种种动动态
25、态博博弈弈,序序列列博博弈弈则则是是另另一一种种动动态态博博弈弈。在在序序列列博博奕奕中中,有有一一名名下下奕奕者者先先行行动动,而而后后另另一一名名下下奕奕者者做做出出反反应应。进进入入新新的的市市场场就就是是序序列列博博奕奕的的一一个个例例子子。新新企企业业首首先先决决定定是是否否要要进进入入,然然后后现现有有企企业业决定是不管它,还是阻止它的进入。决定是不管它,还是阻止它的进入。先先行行者者优优势势:在在序序列列博博弈弈中中,先先行行动动的的下下奕奕者者会会占占据据一一定定的的有有利利地地位位。涉涉及及市市场场进进入入的的竞竞争争时时,先先行行者者优优势势对对于于企企业的经营却具有关键意
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 竞争 博弈论
限制150内