不完全信息动态博弈.ppt
《不完全信息动态博弈.ppt》由会员分享,可在线阅读,更多相关《不完全信息动态博弈.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、不完全信息动态博弈不完全信息动态博弈一、精炼贝叶斯均衡n不完全信息博弈“自然”选择参与人类型,参与人自己知道,其他参与人不知道;自然选择之后,参与人开始行动,行动有先后顺序,后行动者能观察到先行动者的行动,但不能观察到先行动者类型。(先行动者行动类型依存,每个参与人行动都传递着关于自己类型的某种信息)后行动者通过观察先行动者的行动来推断其类型或修正对其类型的先验信念(概率分布),然后选择自己的行动。一、精炼贝叶斯均衡先行动者预测自己的行动将被后行动者所利用,就会设法传递对自己最有利的信息,避免传递对自己不力的信息。博弈过程不仅是选择行动的过程,也是参与人修正信念的过程。n例,张三与李四的博弈张
2、三恃强凌弱,第一次与李四见面,不知李四强弱。但对李四类型有先验概率0.8.0.2张三通过观察李四吃辣椒的数量修正李四强弱的看法(后验概率),并以此确定对李四的态度一、精炼贝叶斯均衡李四预测到这一点,即使生性懦弱,也会强迫自己吃辣椒,以传达对自己有利的信息。两种结果:懦弱李四不吃辣椒,强悍李四吃辣椒且吃的足够多,使得懦弱李四不敢模仿。张三能够区分李四类型并选择是否欺负李四。两类李四都吃同样多辣椒,张三不能从李四吃辣椒行为中推出自己的信息,维持对李四的类型的先验信念0.8,0.2 不进不进(9,0)(5,-1)进进不进不进(9,0)(5,-1)进进不进不进(9,0)(5,-1)进进不进不进(7,0
3、)(3, 1)进进不进不进(7,0)(3,1)进进不进不进(7,0)(3, 1)进进在位者在位者P=5P=4P=6进入者进入者P=5P=5P=4P=6N高高低低1-1-(2,0)(6,0)(7,0)(6,0)(9,0)(8,0)单阶段最优垄断价格古诺均衡下的价格完全信息条件下,若在位者高成本“进入”;若在位者低成本不进入假设低成本在位者不会选择P=6,结果会怎样?在位者的价格选择中包含关于其类型的信息,进入者可据此修正对在位者类型的先验信念在位者行动时必须考虑价格选择的信息效应n1/2,下列战略组合是一个贝叶斯均衡:不论在位者选择什么价格,进入者总是认为在位者高成本概率为*1/2 ,总是选择不
4、进入;高成本在位者选择p=6,低成本在位者选择p=5。n该均衡是否合理?均衡中包含不可置信的战略。n一个合理均衡应满足如下要求:给定每个参与人有关其他参与人类型的后验信念,参与人的战略组合在每个后续博弈上构成贝叶斯均衡。n后验信念:参与人根据贝叶斯法则和均衡战略修正后验概率n后续博弈:从每个信息集开始的博弈的剩余部分称为一个后续博弈。一、精炼贝叶斯均衡n引入精炼贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡,这和子博弈精炼纳什均衡强化了纳什均衡是相同的。n如果参与者的战略要成为博弈的一个精炼贝叶斯均衡,它们不仅必须是整个博弈的贝叶斯纳什均衡,而且还必须构成每一个后续博弈的
5、贝叶斯纳什均衡。如果参与者的战略要成为一个子博弈精炼纳什均衡,则它们不仅必须是整个博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。n精炼贝叶斯均衡是对贝叶斯均衡的精炼,也是子博弈思想在不完全信息博弈中的推广,它本身是纳什均衡。 二、不完美信息博弈的精炼贝叶斯均衡1(1,3)(2,1)(0,2)(0,1)LMRUBUB2(0,0)二、不完美信息博弈的精炼贝叶斯均衡1,31,32,1 0,20,00,11LM2UBR该博弈存在两个纯战略NE:(M,U);(L,B)(M,U);(L,B)同样是子博弈 精炼纳什均衡 (L,B)却又明显要依赖于一个不可信的威胁:如果轮到参与者2行动,则选择 U优于选
6、择B,1便不会由于2威胁他将在其后的行动中选择B,而去选择L 在信息完全但不完美的博弈中,尽管(L,B)是SPNE,它依赖一个不可信的空头威胁,应该从合理的预测中排除。 n 精炼贝叶斯均衡要求1:在每一信息集中,应该行动的参与者必须对博弈进行到该信息集中的哪个节有一个推断。对于非单节信息集,推断是在信息集中不同节点的一个概率分布;对于单节的信息集,参与者的推断就是到达此单一决策节的概率为l。 要求要求2: 给定参与者的推断,参与者的战略必须满足序贯理性的要求。即在各个信息集,给定该信息集上概率分布和其他参与人的后续策略,参与人的行动必须是最优的。(0,0)p1-p参与人2在自己信息集,轮到选择
7、的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”。给定该信念,2的行动必须是最优的(给定该信念,2的战略选择在后续博弈上构成贝叶斯均衡)。2选择U的期望支付为1*p+2*(1-p)=2-p2选择B的期望支付为0*p+1*(1-p)=1-p2-p 2选择U。 给定2的后续战略(1知道2选择U),1的最优选择是M1(1,3)(2,1)(0,2)(0,1)LMRUBUB22如果观察到1没有选择L,则2一定知道1选择了M,于是有p=1n要求要求3: 在处于均衡路径之上的信息集中,推断由贝叶斯法则及参与者的均衡战略给出。n定义定义 :对于一个给定的扩展式博弈中的均衡,如果博弈按照均衡战
8、略进行时将以正的概率达到某信息集,我们称此信息集处于均衡路径之上。反之,如果博弈根据均衡战略进行时,肯定不会达到某信息集,我们称之为不在均衡路径上的信息集。(其中“均衡”可以是纳什、子博弈精炼、贝叶斯以及精炼贝叶斯均衡)p1-p1(1,3)(2,1)(0,2)(0,1)LMRUBUB2均衡(M,U)中,2的推断一定是:给1的均衡战略M,参与者2知道已经到达了信息集中的哪一个节,即p=1。设想存在一个混合战略均衡,其中参与者1选择M 的概率为q1,R的概率为q2,选择R的概率为1- q1-q2 。要求3则强制性规定参与者2的推断必须为q1/(q1+q2)。精炼贝叶斯均衡为M,U;p=1精炼贝叶斯
9、均衡是均衡战略和精炼贝叶斯均衡是均衡战略和均衡信念的结合均衡信念的结合2的信息集在均衡路径上(0,0)p1-p3选择U的期望支付为p*1+(1-p)*2=2-p选择D的期望支付为 p*3+(1-p)*1=1+2p当p1/3时选择D对于2而言,R是严格劣战略,因此2选择L与3 p1/3的信念一致D3UL(0,1,1)(0,1,2)(3,3,3)(1,2,1)U1R2FBD(2,0,0)对于2而言,R是严格劣战略,因此2选择L与3 p1/3的信念一致1预测到后续博弈的均衡,因此1选择F精炼贝叶斯均衡为F,L,D;p1/3p1-pD3UL(0,1,1)(0,1,2)(3,3,3)(1,2,1)U1R
10、2FBD(2,0,0)考察战略组合(B,L,U;p=0)是否为精炼贝叶斯均衡精炼贝叶斯均衡要求:3在非均衡路径的信息集上的“判断”也必须与2的均衡战略L吻合。3的信息集不在均衡路径上。战略组合(B,L,U)是一NE,没有参与人愿意单独偏离这一结果 这一组战略及推断也满足要求l到3(要求3自动满足)。 n要求要求4: 对不在均衡路径上的信息集,推断由贝叶斯法则以及可能情况下的参与者的均衡战略决定。精炼贝叶斯均衡要求:在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;每一个参与人根据贝叶
11、斯法则和均衡战略修正后验概率。n贝叶斯选择最优战略寻求最大期望效用从观察到的信息不断更新信念n精炼剔除不可置信的承诺和威胁行动是可信的,信念是合理的n精炼贝叶斯在每一个决策点上都有一个合理信念(先验概率)时刻采取在给定信念(后验概率)下最优的行动根据观察到的行动不断更新信念(根据贝叶斯法则由先验概率形成后验概率)练习1UB23RL(3,2,0)(3,2,2)(6,5,0)(1,1,1)(4,4,4)MZYZY(2,3,1)(5,4,3)ZY2练习解答n答案l(L, Z), P(M)0.5)n均衡路径与非均衡路径l均衡路径:各个局中人选择实施的行为所构成的路径l非均衡路径:各个局中人没有选择实施
12、的行为所构成的路径l不但要给出均衡路径上的行为选择和信念,而且要给出非均衡路径上的行为选择和信念l无论在均衡路径上还是在非均衡路径上,最优行为选择都是追求最大期望效用,信念都要合理三、信号博弈n信号博弈是一种特殊的不完全信息动态博弈n信号模型已被十分广泛地应用于经济学领域。如,spence (1973)文凭信号模型n通常描绘的是二个参与人之间的两阶段不完全信息动态博弈。先行动者类型不为后行动者知道,而他只知道先行动者类型的先验概率分布。后行动者试图从他所观察到的先行动者的行动中对其类型进行概率判断(形成后验信念),并选择最优行动。先行动者预测到自己的行动中包含关于自己类型的信息,有动机告诉后行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 不完全 信息 动态 博弈
限制150内