最新完全信息动态博弈PPT课件.ppt
《最新完全信息动态博弈PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新完全信息动态博弈PPT课件.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、完全信息动态博弈完全信息动态博弈v动态博弈的表示法动态博弈的表示法v动态博弈的基本特点动态博弈的基本特点v可信性和纳什均衡的问题可信性和纳什均衡的问题v逆向归纳法逆向归纳法第一部分第一部分v男方策略是两个:足球,芭蕾。女方是在知道男方决策后才男方策略是两个:足球,芭蕾。女方是在知道男方决策后才行动的,其策略可以归纳为四个:追随策略(他选什么我就行动的,其策略可以归纳为四个:追随策略(他选什么我就选什么)、对抗策略(他选什么我偏不选什么)、芭蕾策略选什么)、对抗策略(他选什么我偏不选什么)、芭蕾策略(无论他选什么我都选芭蕾)、足球策略(无论他选什么我(无论他选什么我都选芭蕾)、足球策略(无论他选
2、什么我都选他喜欢的足球)。都选他喜欢的足球)。男男足球足球芭蕾芭蕾女女女女足球足球芭蕾芭蕾足球足球芭蕾芭蕾(2,1)(-1,-1)(1,2)(0,0)v动态博弈中各博弈方的行动有先后次序,且后行为者能观察动态博弈中各博弈方的行动有先后次序,且后行为者能观察到此前选择行动博弈方的行动,因此动态博弈中各博弈方的到此前选择行动博弈方的行动,因此动态博弈中各博弈方的地位是不对称的。地位是不对称的。v一般来说,由于后行动的博弈方有更多的信息帮助自己选择一般来说,由于后行动的博弈方有更多的信息帮助自己选择行动,可减少决策的盲目性,因此处于较有利的地位。不过,行动,可减少决策的盲目性,因此处于较有利的地位。
3、不过,后行动和具有较多信息并不总是有利的。后行动和具有较多信息并不总是有利的。动态博弈的非对称性动态博弈的非对称性甲甲左左中中上上下下乙乙右右4,123,102,123,122,101,11v甲有后动优势:如果让乙先行动,乙会消去中策略和右甲有后动优势:如果让乙先行动,乙会消去中策略和右策略这两个劣策略,这样甲可以很有把握达到左上(策略这两个劣策略,这样甲可以很有把握达到左上(4 4,1212)这个均衡,得益)这个均衡,得益4.4.而如果甲先行动,他只能消去下而如果甲先行动,他只能消去下策略,乙只需在得益相同的左右两个策略中随便选择一策略,乙只需在得益相同的左右两个策略中随便选择一个即可。个即
4、可。v甲有先动优势:如果先选定下策略,可稳得甲有先动优势:如果先选定下策略,可稳得10.而乙也最好而乙也最好让对方先行,自己得让对方先行,自己得100.若乙为得若乙为得100,先占了左策略的位,先占了左策略的位置,则将自己处于不确定的位置。置,则将自己处于不确定的位置。甲甲左左右右上上下下乙乙10,05,410,1005,0三、可信性与纳什均衡的问题三、可信性与纳什均衡的问题v可信性:在某一博弈中,一参与人承诺当某种情况可信性:在某一博弈中,一参与人承诺当某种情况发生时,比如其他参与人作出某一特定行动选择时,发生时,比如其他参与人作出某一特定行动选择时,其将作出某种具体行动。而当该情况真的发生
5、时,其将作出某种具体行动。而当该情况真的发生时,承诺人如果真的履行其承诺将会付出相当大的代价,承诺人如果真的履行其承诺将会付出相当大的代价,而不履行则会受益更大,那么该承诺就是不可信的。而不履行则会受益更大,那么该承诺就是不可信的。例例开金矿博弈及其不同版本开金矿博弈及其不同版本v甲在开采一价值甲在开采一价值4万元的金矿时缺万元的金矿时缺1万元资金,而乙正好有万元资金,而乙正好有1万元资金可以投资。甲想说服乙将这万元资金可以投资。甲想说服乙将这1万元资金借给自己用万元资金借给自己用于开矿,并许诺在采到金子后与乙对半分成,乙是否该将钱于开矿,并许诺在采到金子后与乙对半分成,乙是否该将钱借给甲呢?
6、借给甲呢?v假设金矿的价值是经过权威部门探测确定的,没必要怀疑。假设金矿的价值是经过权威部门探测确定的,没必要怀疑。则乙最需要关心的就是甲采到金子后是否会履行诺言跟自己则乙最需要关心的就是甲采到金子后是否会履行诺言跟自己平分。平分。v甲甲“分分”的许诺是不可信的,因此乙的合理选择是的许诺是不可信的,因此乙的合理选择是“不借不借”乙乙借借不借不借甲甲分分不分不分(1,0)开金矿博弈开金矿博弈(0,4)(2,2)v当博弈进行到第三阶段即甲选择当博弈进行到第三阶段即甲选择“不分不分”时,乙的合理选择是时,乙的合理选择是“打打”官司,这一威胁是可信的;则甲在第二阶段的合理选择官司,这一威胁是可信的;则
7、甲在第二阶段的合理选择是是“分分”,这一许诺是可信的;乙在第一阶段选择,这一许诺是可信的;乙在第一阶段选择“借借”是合理是合理的。因此,乙的完整策略是的。因此,乙的完整策略是“第一阶段选择第一阶段选择借借,若第二阶,若第二阶段甲选择段甲选择不分不分,则第三阶段选择,则第三阶段选择打打官司官司”,甲的完整策略,甲的完整策略是是“第二阶段选择第二阶段选择分分”,这就是这个博弈的解。,这就是这个博弈的解。乙乙借借不借不借甲甲分分不分不分(1,0)有法律保障的开金矿博弈有法律保障的开金矿博弈(0,4)(2,2)(1,0)打打不打不打乙乙v乙在第三阶段选择乙在第三阶段选择“打打”官司的威胁是不可信的,因
8、此甲在第官司的威胁是不可信的,因此甲在第二阶段将选择二阶段将选择“不分不分”,“分分”是不可信的,所以乙在第一阶段是不可信的,所以乙在第一阶段的合理选择是的合理选择是“不借不借”。乙乙借借不借不借甲甲分分不分不分(1,0)法律保障不足的开金矿博弈法律保障不足的开金矿博弈(0,4)(2,2)(-1,0)打打不打不打乙乙v可信性问题最重要的意义在于,它对纳什均衡在动态博弈分可信性问题最重要的意义在于,它对纳什均衡在动态博弈分析中的有效性提出了质疑。析中的有效性提出了质疑。v静态博弈下,各参与人同时选择,既无法知道别人的选择,静态博弈下,各参与人同时选择,既无法知道别人的选择,也无暇对此作出反应。但
9、动态博弈中,后行动者会根据先行也无暇对此作出反应。但动态博弈中,后行动者会根据先行动者的选择来调整自己的选择,而先行动者也会预期到这一动者的选择来调整自己的选择,而先行动者也会预期到这一点,所以会考虑自己的选择对其他参与人有什么影响,从而点,所以会考虑自己的选择对其他参与人有什么影响,从而调整自己的策略。调整自己的策略。v纳什均衡不能排除不可信的威胁(或承诺),因此在分析动纳什均衡不能排除不可信的威胁(或承诺),因此在分析动态博弈时不能往往不能做出可靠的判断。态博弈时不能往往不能做出可靠的判断。v因此,动态博弈的均衡概念除了要满足纳什均衡的基本要求因此,动态博弈的均衡概念除了要满足纳什均衡的基
10、本要求外,还要能排除不可信的威胁和承诺。外,还要能排除不可信的威胁和承诺。可信性与纳什均衡可信性与纳什均衡四、逆向归纳法四、逆向归纳法v逻辑基础:动态博弈中先行动的博弈方,在前面阶逻辑基础:动态博弈中先行动的博弈方,在前面阶段选择行为时必然会考虑后行为博弈方在后面阶段段选择行为时必然会考虑后行为博弈方在后面阶段的选择,只有在博弈最后一个阶段选择的博弈方才的选择,只有在博弈最后一个阶段选择的博弈方才能直接作出明确选择。而当后面阶段博弈方的选择能直接作出明确选择。而当后面阶段博弈方的选择确定后,前一阶段博弈方的行为也就容易确定了。确定后,前一阶段博弈方的行为也就容易确定了。v一般方法:从动态博弈的
11、最后一个阶段开始分析,一般方法:从动态博弈的最后一个阶段开始分析,每一次确定出所分析阶段博弈方的选择和路径,然每一次确定出所分析阶段博弈方的选择和路径,然后再确定前一个阶段博弈方的选择和路径,逐步向后再确定前一个阶段博弈方的选择和路径,逐步向前逆推以求解出动态博弈均衡。前逆推以求解出动态博弈均衡。第二部分第二部分v子博弈子博弈v子博弈精炼纳什均衡子博弈精炼纳什均衡v子博弈精炼纳什均衡求解方法子博弈精炼纳什均衡求解方法v承诺行动与子博弈精炼纳什均衡承诺行动与子博弈精炼纳什均衡一、子博弈一、子博弈v定义:由一个单结信息集开始的与所有该决策结的定义:由一个单结信息集开始的与所有该决策结的后续结(包括
12、终点结)组成的能自成一个博弈的原后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。博弈的一部分。乙乙借借不借不借甲甲分分不分不分(1,0)法律保障不足的开金矿博弈法律保障不足的开金矿博弈(0,4)(2,2)(-1,0)打打不打不打乙乙乙乙借借不借不借甲甲分分不分不分(1,0)法律保障不足的开金矿博弈法律保障不足的开金矿博弈(0,4)(2,2)(-1,0)打打不打不打乙乙A仿冒仿冒不仿冒不仿冒B制止制止不制止不制止A(0,10)(-2,5)仿冒仿冒不仿冒不仿冒B制止制止不制止不制止(5,5)(2,2)(10,4)仿冒与反仿冒博弈仿冒与反仿冒博弈二、子博弈精炼纳什均衡二、子博弈精炼纳什均衡
13、v定义:如果在一个完全信息动态博弈中,各博弈方定义:如果在一个完全信息动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个博弈及它的策略构成的一个策略组合满足,在整个博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个子博弈精炼纳什均衡。合称为该动态博弈的一个子博弈精炼纳什均衡。以法律保障不足的开金矿博弈为例以法律保障不足的开金矿博弈为例v策略组合策略组合“乙在第一阶段选择乙在第一阶段选择借借,第三阶段选择,第三阶段选择打打;甲在;甲在第二阶段选择第二阶段选择分分”,即(借,打),(分),虽然是整,即(借,打),(分),虽然
14、是整个博弈的一个纳什均衡,但这个策略组合中乙的策略要求乙个博弈的一个纳什均衡,但这个策略组合中乙的策略要求乙在第三阶段的子博弈中选择的在第三阶段的子博弈中选择的“打打”,不是该子博弈的一个纳,不是该子博弈的一个纳什均衡,因此这个策略组合不是子博弈精炼纳什均衡。什均衡,因此这个策略组合不是子博弈精炼纳什均衡。v而策略组合(不借,不打),(不分)则是该博弈的子而策略组合(不借,不打),(不分)则是该博弈的子博弈精炼纳什均衡。因为该策略组合的双方策略不仅在整个博弈精炼纳什均衡。因为该策略组合的双方策略不仅在整个博弈中构成纳什均衡,而且在两级子博弈中也都构成纳什均博弈中构成纳什均衡,而且在两级子博弈中
15、也都构成纳什均衡(从而不存在任何不可信的威胁或承诺)。衡(从而不存在任何不可信的威胁或承诺)。v注意:当博弈方按上述子博弈精炼纳什均衡策略组合行动时,注意:当博弈方按上述子博弈精炼纳什均衡策略组合行动时,实际上不会进行到博弈的第二、三阶段,两博弈方在第二、实际上不会进行到博弈的第二、三阶段,两博弈方在第二、三阶段的行为实际上不会发生。但作为完整策略的表达,在三阶段的行为实际上不会发生。但作为完整策略的表达,在描述子博弈精炼纳什均衡的策略选择时,必须将其给出。描述子博弈精炼纳什均衡的策略选择时,必须将其给出。v(不进),(打击,打击)和(进入),(默许,默(不进),(打击,打击)和(进入),(默
16、许,默许)都是纳什均衡许)都是纳什均衡进入者进入者进进不进不进在位者在位者在位者在位者默许默许打击打击默许默许打击打击(40,50)(-10,0)(0,300)(0,300)例例市场进入博弈市场进入博弈v(进入),(默许,默许)是子博弈精炼纳什均衡(进入),(默许,默许)是子博弈精炼纳什均衡三、子博弈精炼纳什均衡求解方法三、子博弈精炼纳什均衡求解方法v逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。v完全信息动态博弈的每一个决策结都是一个单独的信息集,完全信息动态博弈的每一个决策结都是一个单独的信息集,每一个决策结都开始一个子博弈。这样,可以从最
17、后一个子每一个决策结都开始一个子博弈。这样,可以从最后一个子博弈开始(即从最后一个决策结开始)逆推上去,求解子博博弈开始(即从最后一个决策结开始)逆推上去,求解子博弈精炼纳什均衡。弈精炼纳什均衡。例例求解下面三阶段博弈的子博弈精炼纳什均衡求解下面三阶段博弈的子博弈精炼纳什均衡子博弈精炼纳什均衡策略组合为(子博弈精炼纳什均衡策略组合为(U,U),(),(L)。最)。最后的均衡结果是参与人后的均衡结果是参与人1在第一阶段选择结束博弈,参与人在第一阶段选择结束博弈,参与人1、2得益分别为得益分别为2、0。1(2,0)(1,2)21(3,0)(1,3)四、承诺行动与子博弈精炼纳什均衡四、承诺行动与子博
18、弈精炼纳什均衡v前面已知,有些纳什均衡之所以不是精炼均衡,是因为它们前面已知,有些纳什均衡之所以不是精炼均衡,是因为它们包含了不可信威胁。这也意味着,如果参与人能在博弈之前包含了不可信威胁。这也意味着,如果参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数,原来不可信采取某种措施改变自己的行动空间或支付函数,原来不可信的威胁就可能变得可信,博弈的均衡就会相应改变。将这些的威胁就可能变得可信,博弈的均衡就会相应改变。将这些为改变博弈结果而采取的措施称为为改变博弈结果而采取的措施称为“承诺行动承诺行动”。v在许多情况下,承诺行动对当事人是很有价值的。特别的,在许多情况下,承诺行动对当事人是
19、很有价值的。特别的,有时一个参与人通过减少自己的选择机会使自己受益,原因有时一个参与人通过减少自己的选择机会使自己受益,原因在于保证自己不选择某些行动可以改变对手的最优选择。在于保证自己不选择某些行动可以改变对手的最优选择。例例房地产开发博弈房地产开发博弈 有有两两个个房房地地产产开开发发商商A A和和B B分分别别决决定定在在同同一一地地段段上上开开发发一一栋栋写写字字楼楼。由由于于市市场场需需求求有有限限,如如果果他他们们都都开开发发,则则在在同同一一地地段段会会有有两两栋栋写写字字楼楼,超超过过了了市市场场对对写写字字楼楼的的需需求求,难难以以完完全全出出售售,空空置置房房太太多多导导致
20、各自亏损致各自亏损1 1百万。百万。当当只只有有一一家家开开发发商商在在这这个个地地段段开开发发一一栋栋写写字字楼楼时时,它它可可以以全全部部售售出出,赚赚得得利利润润1 1百百万万。假假定定A A先先决决策,策,B B在看见在看见A A的决策后再决策是否开发写字楼。的决策后再决策是否开发写字楼。房地产开发博弈房地产开发博弈A不开发不开发开发开发BB开发开发不开发不开发开发开发不开发不开发(-1,-1)(1,0)(0,1)(0,0)用用“逆逆向向归归纳纳法法”求求解解这这个个博博弈弈。在在B B进进行行决决策策的的2 2个个决决策策结结上上,B B在在左左边边的的决决策策结结上上选选择择“不不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 完全 信息 动态 博弈 PPT 课件
限制150内