第二章 经济博弈论.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第二章 经济博弈论.pptx》由会员分享,可在线阅读,更多相关《第二章 经济博弈论.pptx(88页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章完全信息静态博弈基本分析思路和方法纳什均衡无限策略博弈分析和反应函数混合策略和混合策略纳什均衡纳什均衡的存在性纳什均衡的选择和分析方法扩展2.1基本分析思路和方法2.1.1上策均衡上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略囚徒的困境中的“坦白”;双寡头削价中“低价”。上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果上策均衡不是普遍存在的例如:猜硬币博弈、1,18,0 0,85,5囚徒1不坦白不坦白坦白坦白囚徒2两个罪犯的得益矩阵(Payoff Matrix)n2.1.2 严
2、格下策反复消去法 n严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略n例如,“囚徒困境”中的“不坦白”2.1.2严格下策反复消去法严格下策严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略应用:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中博弈方2博弈方1唯一剩下的策略组合(上,中)就是博弈的解。注:(上,中)不是原博弈的上策均衡,事实上原博弈也没有上策均衡。2.1.3划线法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚囚
3、徒徒困困境境-1,11,-11,-1-1,1猜猜硬硬币币2,10,00,01,2夫夫妻妻之之争争2.1.4 箭头法1,01,30,10,40,22,0博弈方 左 中 右纳什均衡为(纳什均衡为(上,中上,中)。)。-5,-50,-8-8,0-1,-1囚囚徒徒困困境境-1,11,-11,-1-1,1猜猜硬硬币币2,10,00,01,3夫夫妻妻之之争争2.2纳什均衡2.2.1纳什均衡的定义2.2.2纳什均衡的一致预测性质2.2.3纳什均衡与严格下策反复消去法纳什均衡纳什均衡(Nash Equilibrium)纳什均衡是著名博弈论专家纳什(JohnNash)对博弈论的重要贡献之一。纳什在19世纪50年
4、1951年的两篇重要论文中,在一般意义上给定了非合作博弈及其均衡解,并证明了解的存在性。正是纳什的这一贡献奠定了非合作博弈论的理论基础。纳什所定义的均衡称之谓“纳什均衡”。策略空间:博弈方的第个策略:博弈方的得益:博弈:纳什均衡纳什均衡:在博弈中,如果由各个博弈方的各一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略的组合的最佳对策,也即对任意都成立,则称为的一个纳什均衡2.2.1纳什均衡的定义通俗地说,纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。诺贝尔经济学奖获得者萨缪尔森有一句
5、幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大,对其他社会科学意义也同样重大。2.2.2纳什均衡的一致预测性质博弈分析最基本的目的之一是预测。也就是说,我们之所以要进行博弈分析,最重要的原因就是预测特定博弈中的博弈方究竟会采取什么行动,博弈将有怎样的结果。一般来说,人类的历史是不可预测的,也就是说,人类的集体行动是不可能预知的。但是,在某些假定的条件下,某种集体行动是可预测的。博弈论中对行动者的假
6、定是,行动者是理性的。理性的人不可能作出非理性的事情,在这个假定下,许多结果就能预测出来。博弈的均衡就是可预测的结果。在囚徒困境中,囚犯除了选择“坦白”外其他还有吗?对于理性的或者说自私的囚徒来说,肯定没有。这是理性人的假定下的必然结论。因此,纳什均衡的价值主要在于它的一些非常重要的性质,其中“一致预测性”就是最重要的性质之一。也就是说,纳什均衡是关于博弈将会如何进行“一致预测”(Consistent Forecast)的。这里所说的“一致预测”是指这样一种性质:如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会不顾这种预测或者这种预测能力,去选择与预测结果不一致的策略,即没
7、有哪个博弈方有动力采取与这个预测结果不同的行为,没有哪个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终真会成为博弈的结果。也就是说,这里“一致预测”中“一致”的意义是,各博弈方的实际行为选择与他们的预测一致,而不是不同博弈方的预测相同、无差异。纳什均衡的一致预测性质正是博弈预测能力的基本保证。其他的博弈分析概念要么不具备这种性质,从而不存在预测的稳定性,因此不可能成为具有普遍意义的博弈分析概念,要么本身也是纳什均衡,是纳什均衡的一部分。值得注意的是,虽然纳什均衡是博弈结果的一致预测,但纳什均衡分析却并不一定能对所有博弈的结果都作出准确的预测。因为纳什均衡的一致预测性质本身并不保证各博弈方
8、的预测是相同的,相同的预测是一致预测性质的前提而不是结果。有许多博弈其实根本无法准确预测,因为有些博弈不存在纳什均衡,而另一些博弈又有多重纳什均衡且相互无显著的优劣或效率差别。2.2.3纳什均衡与严格下策反复消去法上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡命题2.1:在n个博弈方的博弈中,如果严格下策反复消去法排除了除之外的所有策略组合,那么一定是该博弈的唯一的纳什均衡命题2.2:在n个博弈方的博弈中中,如果是的一个纳什均衡,那么严格下策反复消去法一定不会将它消去上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的 根据上一节的分析已经明白,分析完全信息静态博
9、弈的关键是找出其中的纳什均衡。但前面所讨论都是可通过策略之间的两两比较进行分析的有限策略博弈模型。在无限策略、连续策略空间的博弈中,纳什均衡的概念同样适用。我们通过具体模型来说明这种博弈的纳什均衡分析方法。2.3无限策略分析和反应函数 古诺模型是研究寡头垄断市场的经典模型,在古诺模型中,假设一个市场有两家生产同一种产品厂商。如果厂商1的产量为q1,厂商2的产量为q2,则市场总产量为Q Qq q1 1十十q q2 2。设市场出清价格P(即可以将产品全部卖出去的价格)是市场总产量的函数(即逆需求函数)P=P(Q)=a-P=P(Q)=a-Q=aq q1 1q q2 2。2.3.1古诺的寡头模型寡头产
10、量竞争以两厂商产量竞争为例再设两厂商有相同的单位生产成本c1=c2=c,且都没有固定成本,则该博弈中两博弈方的得益(即两厂商各目的利润)分别为:222126qqqq-=因此,如果假设策略组合(q1*,q2*)是本博弈的纳什均衡,则(q1*,q2*)必须是使得两博弈方的得益达到最大值,即满足:要求上式的最大值,只需(1)、(2)两式分别对q1、q2求偏导并令两个偏导数都等于零,由此可得q1*,q2*应满足方程组:解之得该方程组唯的一组解:均衡总产量为:两博弈方的均衡得益(利润)分别为:具体地,若设:则则:如果想对上述博弈结果作效率评价,可以再从两厂商总体利益最大化的角度作一次产量选择,根据市场条
11、件求实现总得益(总利润)最大的总产量。设总产量为Q,则总得益为:UP(Q)cQQ(8Q)2Q6Q Q2很容易求得使总得益最大的总产量:Q*3最大总得益:U*9 将此结果与两厂商独立决策,追求自身而不是共同利益最大化时的博弈结果相比,不难发现此时总产量较小,而总利润却较高。因此从两厂商的总体来看,根据总体利益最大化确定产量效率更高。换句话说,如果两厂商更多考虑合作,联合起来决定产量,先定出使总利益最大的产量后各自生产一半(1.5,1.5单位),则各自可分享到的利益为4.5,比只考虑自身利益的独立决策行为得到的利益要高。当然,在独立决策、缺乏协调机制的两个企业之间,上述合作的结果并不容易实现,即使
12、实现了也往往是不稳定的。合作难以实现或维持的原因主要是。各生产一半实现最大总利润产量的产量组合(1.5,1.5)不是该博弈的纳什均衡策略组合。也就是说,在这个策略组合下,双力都可以通过独自改变(增加)自己的产量而得到更高的利润,它们都有突破1.5单位产量的冲动。在缺乏由强制作用的协议等保障手段的情况下,这种冲动注定了维持上述较低水平的产量组合是不可能的,两厂商早晚都会增产,只有达到纳什均衡的产量水平(2,2)时才会稳定下来。因为只有这时候任一厂商单独改变产量才不利于自己,这实际上也是一种“囚徒困境囚徒困境”,如果将遵守限额还是突破限额作为厂商面临的选择,则构成了得益矩阵如下图的博弈。4.5,4
13、.53.75,55,3.754,4厂商2不突破 突破当然不难看出该博弈是一个囚徒困境博弈。F4以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5 古诺模型的纳什均衡也可以通过对划线法思路的推广来求,划线法的思路是先找出每个博弈方针对其他博弈方所有策略(或策略组合)的最佳对策,然后再找出相互构成最佳对策的各博弈方策略组成的策略组合,也就是博弈的纳什均衡。在无限策略的古诺博弈模型中这样的思路实际上也是可行的,只是其他博弈方的策略现在有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数关系。2.3.2反应函数 在上
14、面讨论的两寡头古诺模型中,对厂商2的任意产量q2,厂商1的最佳对策产量q1,就是使白己在厂商2生产产量q2的情况下利润最大化的产量,即q1是最大化问题:的解。上式对q1求导并令导数等于0由此得:由此得:这样我们得到了对于厂商2的每个可能的产量,厂商1的最佳对策最佳对策产量的计算公式,它是厂商2产量的一个连续函数,我们称这个连续函数为厂商1对厂商2产量的一个“反应函数”(Reaction Function)。q q2 26363q q1 1 由于这两个反应函数都是连续的线性函数,因此可以用坐标平面上的两条直线表示它们,如图:(2,2)同样的方法,我们可再求出厂商2对厂商1产量q1的反应函数:从图
15、中可以看出,当一方的产量选择为当一方的产量选择为0时,另一方的最时,另一方的最佳反应为佳反应为3。这正是实现市场总利润最大的产量,因为这时候等于由一个厂商垄断市场,市场总体利润就是该厂商的利益;当一方的产量达到6时,另一方被迫选择0,因为这时后者坚持生产已经无利可图。在两个反应函数对应的两条直线上,只有它们的交点(2,2)代表的产量组合,才是由相互对对方的最佳反应产量构成的。R1(q2)上的其他所有点(q1,q2)只有q1是对q2的最佳反应,q2 不是对q1的最佳反应,而R2(q1)上的点则刚好相反。根据纳什均衡的定义,根据纳什均衡的定义,(2,2)是该古是该古诺模型的纳什均衡,并且因为它是惟
16、的一诺模型的纳什均衡,并且因为它是惟的一个,因此应该是该个,因此应该是该博弈的结果博弈的结果。这个结论。这个结论与前面直接根据纳什均衡定义得到的完全与前面直接根据纳什均衡定义得到的完全样。样。q q2 26363q q1 1(2,2)现在我们把反应函数法应用到伯特兰德模型的分析。伯持兰德1883年提出了另一种形式的寡占模型。这种模型与选择产量的古诺模型的区别在于,伯特兰德模型中各厂商所选择的是价格价格而不是产量。我们用简单的两寡头且产品有一定差别的伯特兰德价格博弈模型进行分析。2.3.3伯特兰德寡头模型 上述产品有一定差别是指两个厂商生产的是同类产品,但在品牌、质量和包装等方面有所不同,因此伯
17、特兰德模型中厂商的产品之间有很强的替代性但又不是完全可替代,即价格不同时,价格较高的不会完全销不出去。当厂商1和厂商2价格分别为P1和P2时,它们各自的需求函数需求函数为:和和 从上式可以看出产品之间是有差别的,其中d1,d20即两厂商产品的替代系数。我们也假设两厂商无固定成本,假设边际生产成本分别为c1和c2。两博弈方的得益函数分别为:求出两厂商对对方策略(价格)的反应函数分别为:和和 我们直接用反应函数法分析这个博弈。上两式分别对P1和P2求偏导,并令偏导数为0,由此得:纳什均衡(P1*,P2*)必是两反应函数的交点,即必须满足:求解此方程组即可得到纳什均衡纳什均衡(P1*,P2*):记:
18、记:具体地,如果进一步假设模型中的参数分别为:将P1*,P2*代入得益函数则可进一步得到两厂商的均衡得益值。则可以得到:P1*P2*20,u1*u2*324。值得一提的另外一点是,这种价格决策与古诺模型中的产量决策一样,其纳什均衡也不如各博弈方通过协商、合作得到的最佳结果,因此也是囚徒困境的一种。上述模型是伯特兰德模型较简单的情况。更一般的情况是有n个寡头的价格决策,并且产品也可以是无差别的。随着社会经济的不断发展,我们越来越无法回避公共资源利用、公共设施提供和公共环境保护等方面的问题。而在这些问题中,也包含了众多的博弈关系。我们以人们对公共资源利用方面的博弈关系为例来作一些讨论。2.3.4公
19、共资源问题 在经济学中,所谓公共资源是指具有:(1)没有哪个个人、企业或组织拥有所有权;(2)大家都可以自由利用,这样两个特征的自然资源或人类生产的供大众免费使用的设施和财货。例如大家都可以开采使用的地下水,可自由放牧的草地,可自由排放废水的公共河道(假设政府未予限制),以及公共道路、楼道的照明灯等。由于公共资源有上述两个特征,因而利用这些资源时不支付任何代价,除非政府将这些资源收归国有,并对使用者征收资源税或收取类似的费用。经济学者们很早就己经开始认识到,在人们完全从自利动机出发自由利用公共资源时,公共资源倾向于被过度利用、低效率使用和浪费,并且过度利用会达到任何利用它们的人都无法得到实际好
20、处的程度。我们用下面这个公共草地的放牧为例来论证这个结论。设某村庄有n个农户,该村有一片大家都可以自由放牧羊群的公共草地。出于这片草地的面积有限,因此只能让不超过某一数量的羊群吃饱,如果在这片草地上放牧羊只的实际数量超过这个限度,则每只羊都无法吃饱,从而每只羊的产出(毛、皮、肉的总价值)就会减少,甚至只能勉强存活或要饿死。假设这些农户在夏天才到公共草地放羊,而每年春天就要决定养羊的数量,因此可看作各农户在决定自己的养羊数量时是不知道其他农户养羊数的,即各农户决定养羊数的决策是同时作出的。再假设所有农户都清楚这片公共草地最多能养多少只羊和在羊只总数的不同水平下每只羊的产出。这就构成了n个农户之间
21、关于养羊数的一个博弈问题,并且是一个静态博弈。在此博弈中,博弈方就是n个农户;他们各自的策略空间就是他们可能选择的养羊数目qi(i=1,2,n)的取值范围。当各农户养羊数为q1、q2、qn时,在公共草地上放牧羊只的总数为Qq1q2qn,根据前面的介绍,每只羊的产出应是羊群总数Q的减函数 VV(Q)V(q1、q2、qn)假设购买和照料每只羊的成本对每个农户都是相同的不变常数c,则农户i养qi只羊的得益函数为:为了使讨论比较简单和能得到直观的结论,我们进一步设定下列具体数值。每只羊的产出函数为:V100Q100(q1q2qn)由于羊的数量不是连续可分的,田此上述函数不是连续函数。但我们在技术上也可
22、以把羊的数量看作连续可分的,因此上述得益函数仍然可当作连续函数来处理。假设n3,即只有三个农户,成本c4。这时,三农户的得益函数分别为:三个反应函数的交点(q1*,q2*,q3*)就是博弈的纳什均衡。我们将q1*,q2*,q3*代入上述应函数,并解此联立方程组,即得q1*q2*q3*24,再将其代入三农户的得益函数,则可得u1*u2*u3*576,此即三农户独立同时决定在公共草地放羊数量时所能得到的利益。分别求三农户各自对其他两农户策略(养羊数)的反应函数,得:为了对公共资源的利用效率作出评价,我们同样也可讨论总体利益最大的最佳羊只数量。设在该草地上羊只的总数为Q。则总得益为:使总得益u最大的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二章 经济博弈论 第二 经济 博弈论
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内