高鸿业版微观经济学博弈论.ppt
《高鸿业版微观经济学博弈论.ppt》由会员分享,可在线阅读,更多相关《高鸿业版微观经济学博弈论.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、返回返回返回返回博弈论初步博弈论初步 引言:引言:目前,博弈论发展的非常深入,这里只目前,博弈论发展的非常深入,这里只是介绍一些初步知识。在二十世纪四、五十年是介绍一些初步知识。在二十世纪四、五十年代,由冯代,由冯诺依曼、摩根斯坦把对策论、运筹诺依曼、摩根斯坦把对策论、运筹学引入经济学,形成了最早的博弈论。几十年学引入经济学,形成了最早的博弈论。几十年来,博弈论在经济学中发挥着越来越大的重要来,博弈论在经济学中发挥着越来越大的重要作用,作用,19941994年的诺贝尔经济学奖就授予三位博年的诺贝尔经济学奖就授予三位博弈论学家:纳什(弈论学家:纳什(NashNash)、泽尔腾()、泽尔腾(Sel
2、tenSelten)和海萨尼(和海萨尼(HarsanyiHarsanyi)返回返回返回返回 博博弈弈论论字字面面的的意意思思是是游游戏戏策策略略,及及用用类类似似游游戏戏中中解解决决问问题题的的方方法法,揭揭示示解解决决社社会会、经经济济及及其其他他领领域域问问题题的的策策略略、对对策策,因因此此有有的的还还把把博博弈弈论论译译成成对对策策论论。准准确确的的说说博博弈弈论论是是在在给给定定的的条条件件下下寻寻求求最最优优策策略略,这这里里给给定定的的条条件件包包含含其其他他人人的的策策略略以以及及本本人人的的决决策策对对其其他他决决策策主主体体的影响。的影响。返回返回返回返回 策略性活动在社会
3、、经济、政治生活中大量存策略性活动在社会、经济、政治生活中大量存在,也可以说,整个社会、经济、政治生活都在,也可以说,整个社会、经济、政治生活都是博弈行为。因此,博弈论作为一种方法,广是博弈行为。因此,博弈论作为一种方法,广泛的应用在经济、政治、军事、外交中,只是泛的应用在经济、政治、军事、外交中,只是博弈论在经济学中应用的最广泛、最成功。如博弈论在经济学中应用的最广泛、最成功。如前面介绍过的古诺均衡,就属于经济学中的博前面介绍过的古诺均衡,就属于经济学中的博弈过程。弈过程。返回返回返回返回三、博奕论模型(对策论模型)三、博奕论模型(对策论模型)(一)博奕论或称对策论是指这样一(一)博奕论或称
4、对策论是指这样一种竞争状况,其中有两个或两个以上种竞争状况,其中有两个或两个以上的人(厂商)各自追求自身的利益,的人(厂商)各自追求自身的利益,而任何一方都不能单独决定其结果。而任何一方都不能单独决定其结果。1、零和博弈(不合作博弈)、零和博弈(不合作博弈)一个参与者所得是另一个参与者所失。一个参与者所得是另一个参与者所失。所得与所失之和为零。所得与所失之和为零。例例1:参与人:参与人:甲、乙;甲、乙;行动或策略:行动或策略:猜硬币;猜硬币;结果:结果:都为正面或都为反面都为正面或都为反面甲输给乙甲输给乙1角,如果是一正一反,甲角,如果是一正一反,甲赢乙赢乙1角;角;报酬:报酬:一个一个1角硬
5、币角硬币乙乙 正正反反甲甲正正(-1,1)(1,-1)反反(1,-1)(-1,1)2、非零和博弈、非零和博弈(1)合作博弈(局中人都希望行动)合作博弈(局中人都希望行动或策略保持一致的博弈)或策略保持一致的博弈)例例2:参与人:参与人:小王、小李;小王、小李;行动或行动或策略:策略:两人约会但都忘记了见面地点;两人约会但都忘记了见面地点;结果:结果:相遇共进晚餐,否则扫兴而归;相遇共进晚餐,否则扫兴而归;报酬:报酬:共进晚餐每人得到效用共进晚餐每人得到效用100,扫兴,扫兴而归效用为而归效用为-20小王小王 AB小小李李A(100,100)(-20,-20)B(-20,-20)(100,100
6、)返回返回返回返回(2)不合作博弈)不合作博弈例例3:参与人:参与人:邦德、詹妮;邦德、詹妮;行行动或策略:动或策略:坦白或抵赖;坦白或抵赖;结果:结果:一方坦白可释放,另一方抵赖一方坦白可释放,另一方抵赖判判10年,如果都抵赖各判年,如果都抵赖各判1年,年,如果都坦白各判如果都坦白各判8年;年;报酬:报酬:各各自刑期的负数自刑期的负数詹妮詹妮 坦白坦白抵赖抵赖邦邦德德坦坦白白(-8,-8)(0,-10)抵抵赖赖(-10,0)(-1,-1)(二)上策均衡与纳什均衡(二)上策均衡与纳什均衡1、上策均衡:、上策均衡:一个有理性的一个有理性的选手在博弈中不会运用下策选手在博弈中不会运用下策囚徒困境:
7、囚徒困境:在信息不对称的在信息不对称的情况下,若邦德认为詹妮会情况下,若邦德认为詹妮会坦白,则邦德会选择坦白,坦白,则邦德会选择坦白,若邦德认为若邦德认为詹妮会抵赖,则邦詹妮会抵赖,则邦德还会选择坦白。同理詹妮的最德还会选择坦白。同理詹妮的最有利的选择也是坦白。有利的选择也是坦白。坦白是两坦白是两个人的上策。个人的上策。当不管对方选择什么策略,己方当不管对方选择什么策略,己方都能以不变应万变,这种博弈成都能以不变应万变,这种博弈成为上策均衡的博弈。为上策均衡的博弈。上策均衡即指每一个人都有上策上策均衡即指每一个人都有上策可用,而仅仅是用这一策略的状可用,而仅仅是用这一策略的状况。(况。(一个均
8、衡解一个均衡解)返回返回返回返回2、纳什均衡、纳什均衡例例2:小王小王 AB小小李李A(100,100)(-20,-20)B(-20,-20)(100,100)(1 1)纳什均衡:如果给定局中人)纳什均衡:如果给定局中人i i的的策略是策略是SiSi*,则局中人,则局中人j j的上策是的上策是SjSj*;如果给定局中人如果给定局中人j j的策略是的策略是SjSj*,则局,则局中人中人i i的上策是的上策是SiSi*。(SiSi*,SjSj*)就)就是纳什均衡。是纳什均衡。两个纳什均衡:(两个纳什均衡:(A A,A A)()(B B,B B)例例1:乙乙 正正反反甲甲正正(-1,1)(1,-1)
9、反反(1,-1)(-1,1)(2 2)在零和博弈中,甲乙两人无绝)在零和博弈中,甲乙两人无绝对的上策,上策的选择取决于对方对的上策,上策的选择取决于对方的选择,不存在纳什均衡。的选择,不存在纳什均衡。无均衡解无均衡解若策略组合(若策略组合(SiSi*,SjSj*)是上策均)是上策均衡,则对于衡,则对于i i和和j j而言无论对方选择而言无论对方选择什么策略(什么策略(SiSi*,SjSj*)都是上策。)都是上策。若策略组合(若策略组合(SiSi*,SjSj*)是纳什均)是纳什均衡,对于衡,对于i i,当对方选择,当对方选择SjSj*时,时,SiSi*才是上策;对于才是上策;对于j j,当对方选
10、择,当对方选择SiSi*时,时,SjSj*才是上策。才是上策。上策均衡是纳什均衡的特例。上策均衡是纳什均衡的特例。返回返回返回返回第一节第一节基本概念基本概念 一、博弈论一、博弈论 定义:定义:博弈论是描述、分析多人决策行博弈论是描述、分析多人决策行为的一种决策理论,是多个经济主体在相互为的一种决策理论,是多个经济主体在相互影响下的多元决策,决策的均衡结果取决于影响下的多元决策,决策的均衡结果取决于双方或多方的决策。双方或多方的决策。如下棋,最后的结果就如下棋,最后的结果就是由下棋双方你来我往轮流做出决策,决策是由下棋双方你来我往轮流做出决策,决策又相互影响、相互作用而得出的结果。又相互影响、
11、相互作用而得出的结果。返回返回返回返回二、参与者(二、参与者(PLAYER)参与博弈的利益主体叫做参与者。参与博弈的利益主体叫做参与者。英文原英文原意为玩主,也有译成局中人的。在二人博弈中,意为玩主,也有译成局中人的。在二人博弈中,有两个参与者;在三人博弈中,有三个参与者;有两个参与者;在三人博弈中,有三个参与者;在多人博弈中,有多个参与者。在多人博弈中,有多个参与者。返回返回返回返回 三、策略和策略空间三、策略和策略空间 1 1策略策略 在给定条件博弈中,参与者完整的一套行动在给定条件博弈中,参与者完整的一套行动计划叫做策略。计划叫做策略。例如我国古代著名的谋略故事例如我国古代著名的谋略故事
12、“田忌赛马田忌赛马”中,国王的赛马计划是:先出上等马,中,国王的赛马计划是:先出上等马,再出中等马,最后出下等马;田忌的赛马计划是:再出中等马,最后出下等马;田忌的赛马计划是:先出下等马,再出上等马,最后出中等马。这里先出下等马,再出上等马,最后出中等马。这里的赛马计划就是一套完整的行动计划,也就是一的赛马计划就是一套完整的行动计划,也就是一个策略。个策略。返回返回返回返回 2 2策略空间策略空间 参与者可以选择的策略的全体就组成了策略空参与者可以选择的策略的全体就组成了策略空间。间。例如在例如在“田忌赛马田忌赛马”中,共有六种行动方案可中,共有六种行动方案可供选择:上中下(先出上等马,再出中
13、等马,最后供选择:上中下(先出上等马,再出中等马,最后出下等马)、上下中、中上下、中下上、下上中、出下等马)、上下中、中上下、中下上、下上中、下中上。决策时田忌可以选择其中任何一个策略,下中上。决策时田忌可以选择其中任何一个策略,在故事中,因为国王固定选择了上中下,所以田忌在故事中,因为国王固定选择了上中下,所以田忌选择了下上中,从而赢得了比赛。任何一人策略的选择了下上中,从而赢得了比赛。任何一人策略的改变都将使结果也随之改变,比如国王选择了中下改变都将使结果也随之改变,比如国王选择了中下上,而田忌选择了下上中,则国王将赢得比赛。上,而田忌选择了下上中,则国王将赢得比赛。返回返回返回返回 四、
14、报酬函数与报酬矩阵四、报酬函数与报酬矩阵 1 1报酬函数报酬函数 每一个参与博弈的参与者,他的收益依附于每一个参与博弈的参与者,他的收益依附于各个参与者所出的策略,这种收益与策略的依附各个参与者所出的策略,这种收益与策略的依附关系就构成了报酬函数。关系就构成了报酬函数。也就是说,第也就是说,第i i个参与个参与者的收益取决于所有参与者的策略,而不仅仅是者的收益取决于所有参与者的策略,而不仅仅是自己的策略,表示成数学式子就是:自己的策略,表示成数学式子就是:Ri=Ri(S1,S2,Sn)。其中其中Ri表示第表示第i个参与者的收益,个参与者的收益,Si(i=1,n)表示第表示第i个参与者所出的策略
15、。个参与者所出的策略。返回返回返回返回 2 2报酬矩阵报酬矩阵 参参与与博博弈弈的的多多个个参参与与者者的的报报酬酬可可以以用用一一个个矩矩阵阵或或框框图图表表示示,这这样样的的矩矩阵阵或或框框图图就就叫叫做做报报酬酬矩矩阵阵。例例如如有有甲甲乙乙两两个个供供货货商商组组成成一一个个价价格格卡卡特特尔尔,双双方方都都有有选选择择遵遵守守约约定定价价格格或或者者违违反反约约定价格的权利。报酬矩阵如下图所示:定价格的权利。报酬矩阵如下图所示:返回返回返回返回乙守约违约 甲守约 8,8 6,10 违约 10,6 7,7 图 8-1返回返回返回返回 矩阵中每组数字中的前一个数字表示甲的收益,后矩阵中每
16、组数字中的前一个数字表示甲的收益,后一个数字表示乙的收益。当甲守约时,乙如果守约,一个数字表示乙的收益。当甲守约时,乙如果守约,收益为收益为8,乙如果违约,收益为,乙如果违约,收益为10;当甲违约时,;当甲违约时,乙如果守约,收益为乙如果守约,收益为6,乙如果违约,收益为,乙如果违约,收益为7。所。所以,当甲守约时,乙会选择违约(以,当甲守约时,乙会选择违约(108);当甲);当甲违约时,乙也会选择违约(违约时,乙也会选择违约(76)。反之不管乙如)。反之不管乙如何选择,甲都会选择违约,最终的结果是双方都选何选择,甲都会选择违约,最终的结果是双方都选择违约。报酬矩阵改变,就会影响到双方的决策。
17、择违约。报酬矩阵改变,就会影响到双方的决策。例如双方的报酬矩阵变成下图所示例如双方的报酬矩阵变成下图所示:返回返回返回返回乙守约违约 甲守约 12,12 2,10 违约 10,2-4,-4图 8-2返回返回返回返回 此时双方可能都选择此时双方可能都选择守约守约,因为当甲守约,因为当甲守约时,乙会选择守约(时,乙会选择守约(12101210);当甲违约时,);当甲违约时,乙也会选择守约(乙也会选择守约(2-42-4)。反之不管乙如)。反之不管乙如何选择,甲都会选择守约,最终的结果是何选择,甲都会选择守约,最终的结果是双方都选择守约。双方都选择守约。返回返回返回返回 博弈过程参与者的决策行为要受到
18、博弈过程参与者的决策行为要受到博弈规博弈规则则的影响,即博弈规则的变化会改变报酬矩的影响,即博弈规则的变化会改变报酬矩阵中的报酬值。比如在图阵中的报酬值。比如在图 8-18-1中,由于卡特中,由于卡特尔中的每一个供货商都追求自身利益的最大尔中的每一个供货商都追求自身利益的最大化,并且没有措施来保证遵守价格约定,表化,并且没有措施来保证遵守价格约定,表面上可能都信誓旦旦的承诺守约,但是实际面上可能都信誓旦旦的承诺守约,但是实际中双方会违约。中双方会违约。返回返回返回返回 如果卡特尔追求整体利益的最大化,并且由如果卡特尔追求整体利益的最大化,并且由于历史、政治、制度、惩罚等措施来保证遵守价于历史、
19、政治、制度、惩罚等措施来保证遵守价格约定,双方就可能和平共处,遵守价格约定。格约定,双方就可能和平共处,遵守价格约定。在历次中东战争中,由于民族宗教原因,在历次中东战争中,由于民族宗教原因,OPECOPEC石石油的产量和价格都得到了严格的执行。油的产量和价格都得到了严格的执行。返回返回返回返回 五、均衡及博弈的解五、均衡及博弈的解 当博弈的所有参与者都不想改换策略时所达当博弈的所有参与者都不想改换策略时所达到的稳定状态叫做均衡,均衡的结果叫做博弈的到的稳定状态叫做均衡,均衡的结果叫做博弈的解。解。比如图比如图8-18-1中甲乙两个供货商组成的卡特尔。中甲乙两个供货商组成的卡特尔。不管甲如何选择
20、,乙必然选择违约,同样不论乙不管甲如何选择,乙必然选择违约,同样不论乙如何选择,甲必然选择违约。最终双方都选择了如何选择,甲必然选择违约。最终双方都选择了违约,并且只要给定的条件不变,双方就都不会违约,并且只要给定的条件不变,双方就都不会改变策略,结果非常稳定,达成均衡。改变策略,结果非常稳定,达成均衡。返回返回返回返回 在这个均衡中,在这个均衡中,不管甲如何选择,乙都不会改不管甲如何选择,乙都不会改变策略,同样无论乙如何选择,甲也不会改变策变策略,同样无论乙如何选择,甲也不会改变策略,这种均衡就叫做占优均衡。略,这种均衡就叫做占优均衡。这种这种无论对方如无论对方如何决策,自己总是会选择的策略
21、叫做占优策略,何决策,自己总是会选择的策略叫做占优策略,由双方的占优策略所达成的均衡叫做由双方的占优策略所达成的均衡叫做占优均衡占优均衡占优均衡占优均衡。再比如,在学校中,学生平时学习可能是非再比如,在学校中,学生平时学习可能是非常努力也可能是非常懒散;老师可能把考试题出常努力也可能是非常懒散;老师可能把考试题出的很难,也可能出的很容易。从博弈论的角度,的很难,也可能出的很容易。从博弈论的角度,这里的老师和学生就构成了一个博弈,双方的报这里的老师和学生就构成了一个博弈,双方的报酬矩阵如下:酬矩阵如下:返回返回返回返回老师出考题难 易学生 学习 努力 90,85 100,90 懒散 50,60
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高鸿业版 微观经济学 博弈论
限制150内