博弈论课件3.ppt
《博弈论课件3.ppt》由会员分享,可在线阅读,更多相关《博弈论课件3.ppt(130页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第三章 完全且完美信息动态博弈前前 言言l现实生活中许多决策活动往往是依次选择行为而不是同现实生活中许多决策活动往往是依次选择行为而不是同时选择行为,而且后选择行为者能够看到先选择行为者时选择行为,而且后选择行为者能够看到先选择行为者的选择内容,如:的选择内容,如:打麻将,打麻将,讨价还价、拍卖等。诸如此讨价还价、拍卖等。诸如此类博弈问题称为类博弈问题称为“动态博弈动态博弈”(Dynamic Game)。l本章讨论所有博弈方都对本章讨论所有博弈方都对博弈过程博弈过程和和得益得益完全了解的完全了解的完完全且完美信息动态博弈全且完美信息动态博弈。这类博弈也是现实中常见的基。这类博弈也是现实中常见
2、的基本博弈类型。本博弈类型。l由于动态博弈中博弈方的选择、行为有先后次序,因此由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。都与静态博弈有很大区别。前前 言言l在动态博弈问题中,为了做出最优的行动选择,每个参在动态博弈问题中,为了做出最优的行动选择,每个参与人都必须这样思考问题:与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?给定他的应对,什么是
3、我的最优选择?l本章对动态博弈分析的本章对动态博弈分析的概念和方法概念和方法,特别是,特别是子博弈完美子博弈完美均衡均衡和和逆推归纳法逆推归纳法作系统介绍,并介绍各种作系统介绍,并介绍各种经典的动态经典的动态博弈模型博弈模型。本章主要内容本章主要内容l3.1 动态博弈的表示法和特点动态博弈的表示法和特点l3.2 可信性和纳什均衡的问题可信性和纳什均衡的问题l3.3 子博弈和子博弈完美纳什均衡子博弈和子博弈完美纳什均衡l3.4 几个经典动态博弈模型几个经典动态博弈模型l3.5 有同时选择的动态博弈模型有同时选择的动态博弈模型l3.6 动态博弈分析的问题和扩展讨论动态博弈分析的问题和扩展讨论3.1
4、 动态博弈的表示法和特点动态博弈的表示法和特点l3.1.1 阶段和扩展形表示阶段和扩展形表示l3.1.2 动态博弈的基本特点动态博弈的基本特点3.1.1 阶段和扩展形表示阶段和扩展形表示l3.1.1 阶段和扩展形表示阶段和扩展形表示l阶段:动态博弈中一个博弈方的一次选择行为常称为一阶段:动态博弈中一个博弈方的一次选择行为常称为一个个“阶段阶段”。l动态博弈:动态博弈:至少有两个阶段,因此有时也被称为至少有两个阶段,因此有时也被称为多阶段博弈多阶段博弈。动态博弈中的次序特征使得其也被称为动态博弈中的次序特征使得其也被称为序列博弈序列博弈。3.1.1 阶段和扩展形表示阶段和扩展形表示l使用使用扩展
5、形扩展形(博弈树博弈树)表示具有次序特征动态博弈表示具有次序特征动态博弈:A,1右右(0)B,1左左右右左左(M)(0)1.8 单人迷宫单人迷宫入口入口AB B出口出口(奖金奖金M)M)0M00A左左B左左A左左B右右A右右B左左A右右B右右单人迷宫得益矩阵单人迷宫得益矩阵游游戏戏者者得益得益终点结终点结枝枝:行为选择行为选择决策结决策结3.1.1 阶段和扩展形表示阶段和扩展形表示l先来后到博弈先来后到博弈市场进入博弈市场进入博弈B打进打进(1,10)A不进不进打击打击和平和平(-2,3)(5,5)决策结决策结终点结终点结枝枝:行为选择行为选择结分割的结分割的信息集信息集1.12 先来后到先来
6、后到得益:一般来说,先得益:一般来说,先行动的参与人的得益行动的参与人的得益写在前面:写在前面:(U(B),U(A))(1)A独占市场,独占市场,10的得益的得益;(2)B不进入,则仍然是不进入,则仍然是A独独占占;(3)B进入,进入,A若和若和B平分市平分市场,场,A、B各得到各得到5的得益的得益;(4)B进入,进入,A实行打击,实行打击,B亏损亏损2,A得益减低到得益减低到3.(0,10)3.1.1 阶段和扩展形表示阶段和扩展形表示l博弈的扩展形表述中的要素博弈的扩展形表述中的要素 参与人集合参与人集合:谁参与博弈谁参与博弈;用用N表示虚拟参与人表示虚拟参与人“自然自然”;参与人的行动顺序
7、参与人的行动顺序:谁在什么时候行动谁在什么时候行动;参与人的行动空间参与人的行动空间:在每次行动时,参与人有些什么选择在每次行动时,参与人有些什么选择;参与人的信息集参与人的信息集:每次行动时,参与人知道些什么每次行动时,参与人知道些什么;参与人的支付函数参与人的支付函数:每次行动时参与人得到些什么;每次行动时参与人得到些什么;外生事件(即自然的选择)的概率分布。外生事件(即自然的选择)的概率分布。3.1.1 阶段和扩展形表示阶段和扩展形表示l扩展形(博弈树)的基本组成扩展形(博弈树)的基本组成 结:结:包括决策结和终点结包括决策结和终点结;枝:枝:是从一个决策结到它的直接后续结的连线,每一是
8、从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择个枝代表参与人的一个行动选择;信息集:信息集:博弈树上的所有决策结分割成不同的信息集,博弈树上的所有决策结分割成不同的信息集,每个信息集是决策结集合的一个子集。引入信息集的目每个信息集是决策结集合的一个子集。引入信息集的目的是描述下列情况:当一个参与人要做出决策时他可能的是描述下列情况:当一个参与人要做出决策时他可能并不知道并不知道“之前之前”发生的所有事情。对于信息集,我们发生的所有事情。对于信息集,我们用到的时候再进行讨论。用到的时候再进行讨论。3.1.1 阶段和扩展形表示阶段和扩展形表示l例子:仿冒和反仿冒博弈例子:仿冒
9、和反仿冒博弈多多(4)阶段动态博弈阶段动态博弈制止BA不仿冒(0,10)仿冒不制止(-2,5)仿冒AB不制止制止(2,2)(10,4)(5,5)不仿冒A:仿冒企业;仿冒企业;B:被仿冒企业。被仿冒企业。得益得益(A,B)A第一次第一次仿冒仿冒A第二次第二次仿冒仿冒最多进行最多进行两次仿冒两次仿冒的情形:的情形:考虑更多次仿冒和不同反考虑更多次仿冒和不同反仿冒力度的话,博弈的扩仿冒力度的话,博弈的扩展形就会复杂很多。展形就会复杂很多。3.1.1 阶段和扩展形表示阶段和扩展形表示l并不是所有的动态博弈都可以用扩展形表示并不是所有的动态博弈都可以用扩展形表示 如:过多阶段;如:过多阶段;过多选择;过
10、多选择;有先后决策顺序的无限策略寡头定产问题。有先后决策顺序的无限策略寡头定产问题。用文字或数学函数表示。用文字或数学函数表示。3.1.2 动态博弈的基本特点动态博弈的基本特点1.动态博弈的策略和结果动态博弈的策略和结果l策略策略是各个博弈方在整个博弈中轮到选择的每个阶段,是各个博弈方在整个博弈中轮到选择的每个阶段,针对前面阶段的各种情况作相应选择和行为的针对前面阶段的各种情况作相应选择和行为的完整完整计划,计划,以及由不同博弈方的这种计划构成的组合。以及由不同博弈方的这种计划构成的组合。不能孤立不能孤立不能孤立不能孤立地研究某个阶段或者将各个阶段行为割地研究某个阶段或者将各个阶段行为割地研究
11、某个阶段或者将各个阶段行为割地研究某个阶段或者将各个阶段行为割裂开来进行研究。裂开来进行研究。裂开来进行研究。裂开来进行研究。3.1.2 动态博弈的基本特点动态博弈的基本特点l结果结果是各博弈方上述类型的策略构成的策略组合,构成联结各是各博弈方上述类型的策略构成的策略组合,构成联结各个阶段的一条路径,包括双方采用的个阶段的一条路径,包括双方采用的策略组合策略组合、实现的、实现的博弈路博弈路径径和各博弈方的和各博弈方的得益得益l得益得益对应每条路径,而不是对应每步选择、行为对应每条路径,而不是对应每步选择、行为制止BA不仿冒(0,10)仿冒不制止(-2,5)仿冒AB不制止制止(2,2)(10,4
12、)(5,5)不仿冒对应于对应于“红色路径红色路径”的得益的得益(2,2)3.1.2 动态博弈的基本特点动态博弈的基本特点2.动态博弈的非对称性动态博弈的非对称性l动态博弈的非对称性动态博弈的非对称性动态博弈必然是非对称的。动态博弈必然是非对称的。先后次序决定了后行为者可以观察到此前选择行为先后次序决定了后行为者可以观察到此前选择行为博弈方的选择行为,因此动态博弈中各博弈方的地博弈方的选择行为,因此动态博弈中各博弈方的地位是不对称的。位是不对称的。l先行优势与后动优势先行优势与后动优势3.2 可信性和纳什均衡的问题可信性和纳什均衡的问题l静态博弈问题的纳什均衡分析在动态博弈中并不完全有静态博弈问
13、题的纳什均衡分析在动态博弈中并不完全有效,这是因为动态博弈各博弈方的策略中选择行为的效,这是因为动态博弈各博弈方的策略中选择行为的“可信性可信性”问题。因此,首先就要讨论问题。因此,首先就要讨论“可信性可信性”。l3.2.1 相机选择和策略中的可信性问题相机选择和策略中的可信性问题l3.2.2 纳什均衡的问题纳什均衡的问题l3.2.3 逆推归纳法逆推归纳法3.2.1 相机选择和策略中的可信性问题相机选择和策略中的可信性问题l相机选择:相机选择:动态博弈的策略实施起来具有过程性,只要符动态博弈的策略实施起来具有过程性,只要符合博弈方自己的利益,就可以在博弈过程中改变计划。随合博弈方自己的利益,就
14、可以在博弈过程中改变计划。随之而来的就是所谓的之而来的就是所谓的“可信性问题可信性问题”。l可信性问题:可信性问题:相机选择问题的存在使得博弈方的策略中各相机选择问题的存在使得博弈方的策略中各阶段、各情况下采取行为的阶段、各情况下采取行为的“可信性可信性”有了疑问。有了疑问。各个博弈方是否会真正、始终按照自己的策略所设定的方各个博弈方是否会真正、始终按照自己的策略所设定的方案行为,还是可能临时改变自己的行动方案呢?案行为,还是可能临时改变自己的行动方案呢?3.2.1 相机选择和策略中的可信性问题相机选择和策略中的可信性问题私奔博弈私奔博弈 汉时,司马相如不得志时,汉时,司马相如不得志时,在临邛
15、富户卓王孙家操琴。才在临邛富户卓王孙家操琴。才貌双全的卓女文君貌双全的卓女文君17岁新寡,岁新寡,司马相如仰慕文君,借琴音倾司马相如仰慕文君,借琴音倾诉心曲,二人订盟,因卓王孙诉心曲,二人订盟,因卓王孙不允,文君遂偕相如私逃,返不允,文君遂偕相如私逃,返回家乡当垆卖酒,卓王孙不得回家乡当垆卖酒,卓王孙不得以相认。后来相如献以相认。后来相如献子虚赋子虚赋,汉武帝拜为中郎将。,汉武帝拜为中郎将。(孤本元明杂剧孤本元明杂剧私奔相如私奔相如,清袁于令清袁于令肃霜裘肃霜裘传奇。)传奇。)3.2.1 相机选择和策略中的可信性问题相机选择和策略中的可信性问题l私奔博弈私奔博弈不可置信的威胁不可置信的威胁卓文
16、君卓文君父亲父亲与司马相如与司马相如断绝关系断绝关系默认默认断绝父断绝父女关系女关系结婚结婚(-1,1)(0,-2)(1,-1)3.2.1 相机选择和策略中的可信性相机选择和策略中的可信性l开金矿博弈开金矿博弈分钱和打官司的可信性(承诺与威胁)分钱和打官司的可信性(承诺与威胁)(1)甲分钱的不可信甲分钱的不可信乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈开金矿博弈得益得益:(乙乙,甲甲)甲不会考虑道德因甲不会考虑道德因素,因此会选择使素,因此会选择使得自己得益最大化得自己得益最大化的策略,因此到甲的策略,因此到甲行动,必选行动,必选“不分不分”因此,对乙来说,本博因此,对乙来说,本
17、博因此,对乙来说,本博因此,对乙来说,本博弈中甲有一个不可信的弈中甲有一个不可信的弈中甲有一个不可信的弈中甲有一个不可信的“分钱分钱分钱分钱”许诺许诺许诺许诺.3.2.1 相机选择和策略中的可信性相机选择和策略中的可信性(2)乙可以通过打官司保护自身利益)乙可以通过打官司保护自身利益甲分钱可信甲分钱可信不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈有法律保障的开金矿博弈分钱打官司都可信分钱打官司都可信第三阶段,第三阶段,甲知道乙一甲知道乙一定会打官司定会打官司甲知道乙一定会甲知道乙一定会打官司,所以一打官司,所以一定会定会“分钱分钱”,避免打官司的损避免
18、打官司的损失失在法律保证的情况下在法律保证的情况下在法律保证的情况下在法律保证的情况下,甲甲甲甲的的的的“分钱分钱分钱分钱”许诺变得可许诺变得可许诺变得可许诺变得可信信信信.乙乙乙乙“借借借借”成为合理的选成为合理的选成为合理的选成为合理的选择择择择.法律保障充分,保障社法律保障充分,保障社法律保障充分,保障社法律保障充分,保障社会公平。会公平。会公平。会公平。3.2.1 相机选择和策略中的可信性相机选择和策略中的可信性(3)乙不能通过打官司保护自身利益)乙不能通过打官司保护自身利益甲分钱不可信甲分钱不可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博
19、弈法律保障不足的开金矿博弈分钱打官司都不可信分钱打官司都不可信法律保障不充分,法律法律保障不充分,法律法律保障不充分,法律法律保障不充分,法律作用有限或完全无效。作用有限或完全无效。作用有限或完全无效。作用有限或完全无效。第三阶段,由于乙打第三阶段,由于乙打官司并不能收回本钱官司并不能收回本钱并要进一步承受并要进一步承受1万万的损失,甲知道乙一的损失,甲知道乙一定不会打官司定不会打官司甲知道乙一定不甲知道乙一定不会打官司,所以会打官司,所以一定会一定会“不分不分”,最大化自己最大化自己利润利润在不完善法律保证的情在不完善法律保证的情在不完善法律保证的情在不完善法律保证的情况下况下况下况下,甲的
20、甲的甲的甲的“分钱分钱分钱分钱”许诺许诺许诺许诺仍不可信仍不可信仍不可信仍不可信.“.“不借不借不借不借”是乙合是乙合是乙合是乙合理的选择。理的选择。理的选择。理的选择。3.2.1 相机选择和策略中的可信性相机选择和策略中的可信性l三个不同版本的金矿动态博弈中,各个博弈方的选择和三个不同版本的金矿动态博弈中,各个博弈方的选择和博弈的结果,与各个博弈方在各个博弈阶段选择各种行博弈的结果,与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大关系。为的可信程度有很大关系。l威胁或承诺缺乏以经济利益(得益)为基础的可信性,威胁或承诺缺乏以经济利益(得益)为基础的可信性,这些威胁和承诺就没有真正的效力
21、。这些威胁和承诺就没有真正的效力。l可信性问题是动态博弈分析中的一个中心问题。可信性问题是动态博弈分析中的一个中心问题。现实中的威胁与承诺现实中的威胁与承诺l爱的承诺爱的承诺 有个小伙子在给心爱的姑娘的信中写道:有个小伙子在给心爱的姑娘的信中写道:“我我爱你爱得如此之深,以至愿为你赴汤蹈火;我是那爱你爱得如此之深,以至愿为你赴汤蹈火;我是那么地想见到你,任凭艰难险阻也挡不住我的脚步!么地想见到你,任凭艰难险阻也挡不住我的脚步!本周六如不下雨,我一定去找你!本周六如不下雨,我一定去找你!”l为什么恋人会乐于把彼此介绍给自己的父母亲朋?为什么恋人会乐于把彼此介绍给自己的父母亲朋?l为什么婚前要送昂
22、贵的彩礼?为什么婚前要送昂贵的彩礼?l为什么要举行高档的婚宴?为什么要举行高档的婚宴?现实中的威胁与承诺现实中的威胁与承诺l商业中的威胁与承诺商业中的威胁与承诺 过度投资和生产过度投资和生产 生产耐用品的企业推出最惠条款生产耐用品的企业推出最惠条款l政府的烦恼政府的烦恼 招商引资,承诺税费减免招商引资,承诺税费减免 法不容情法不容情l截断退路,背水一战截断退路,背水一战 哀兵必胜哀兵必胜 置于死地而后生置于死地而后生 破釜沉舟破釜沉舟l承诺行动的基本思想承诺行动的基本思想是通过承诺行动使自己的威胁是通过承诺行动使自己的威胁变得可信。也就是说通过限制自己的某些策略选择,变得可信。也就是说通过限制
23、自己的某些策略选择,使其选择特定策略的宣称或意图变得可信。或者说,使其选择特定策略的宣称或意图变得可信。或者说,承诺行动是局中人通过减少自己在博弈中的可选行承诺行动是局中人通过减少自己在博弈中的可选行动来迫使对手选择自己所希望的行动。动来迫使对手选择自己所希望的行动。l其中的道理在于:其中的道理在于:既然对方的最优反应行动依赖于既然对方的最优反应行动依赖于我的行动,那么限制我自己的某些行动实际上也就我的行动,那么限制我自己的某些行动实际上也就是限制了对方采取某些行动。是限制了对方采取某些行动。l行胜于言行胜于言3.2.2 纳什均衡的问题纳什均衡的问题l前面的几个不同版本的开金矿博弈,说明了动态
24、前面的几个不同版本的开金矿博弈,说明了动态博弈问题的相机选择引出的可信性问题,以及可博弈问题的相机选择引出的可信性问题,以及可信性在动态分析中的关键意义。信性在动态分析中的关键意义。l实际上,可信性问题最重要的意义,还在于它对实际上,可信性问题最重要的意义,还在于它对纳什均衡在动态分析博弈中的有效性提出了质疑。纳什均衡在动态分析博弈中的有效性提出了质疑。3.2.2 纳什均衡的问题纳什均衡的问题l第三种开金矿博弈中第三种开金矿博弈中法律保障不足的情况。法律保障不足的情况。l(1)(借借-打,分打,分)是纳什均衡是纳什均衡乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)第一阶段:
25、乙第一阶段:乙“借借”;第三阶段:如果甲在第二阶段第三阶段:如果甲在第二阶段“不分不分”,乙选择,乙选择“打打”;第二阶段:甲第二阶段:甲“分分”;静态纳什均衡分析推断,如果给定了乙在第一、静态纳什均衡分析推断,如果给定了乙在第一、三阶段的选择,即三阶段的选择,即“借借”、“打打”,甲在第二阶,甲在第二阶段选择段选择“分分”最好,因为这样可以免去法律纠纷。最好,因为这样可以免去法律纠纷。如果给定了甲在第二阶段选择如果给定了甲在第二阶段选择“分分”,那么乙第,那么乙第一阶段选择一阶段选择“借借”,第三阶段选择,第三阶段选择“打打”也是最也是最好的应对策略。乙第三阶段选择好的应对策略。乙第三阶段选
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 课件
限制150内