第六章(完全但不完美信息动态博弈).ppt.ppt
《第六章(完全但不完美信息动态博弈).ppt.ppt》由会员分享,可在线阅读,更多相关《第六章(完全但不完美信息动态博弈).ppt.ppt(95页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 完全但不完美信息动态博弈完全但不完美信息动态博弈 第一节第一节 不完美信息动态博弈不完美信息动态博弈 一、概念和例子一、概念和例子 动态博弈中当后行为的博弈方不唯一地确知先行为博弈方的行为时,称为“不完美信息的动态博弈不完美信息的动态博弈”。对于这类博弈,当各博弈方对博弈结束时每个博弈方的得益是完全清楚的,称这种博弈为“完全但不完美信息动态博弈”,或简称为“不完美信息动态博弈”。不完美信息动态博弈的基本特征之一是博弈方之不完美信息动态博弈的基本特征之一是博弈方之间在信息方面的不对称性。间在信息方面的不对称性。以二手车买卖博弈问题为例,在二手车市场上买方常常会感觉合算、不合算,而买
2、新车时就没有这种感觉,为什么呢?主要原因是买方在二手车交易中信息较少,而卖方对车子的真实情况和价值比买方具有更多的了解。二手车交易可以抽象成这样一个博弈问题:先是原车主(即卖方)对车子的使用状况,决定了二手车的内在质量好、差两种情况。第二阶段是原车主决定是否要卖(卖价可以只有一种、有高低两种或更多,价格越多问题越复杂);最后是买方决定是否买,这里规定买方要么接受卖方这里规定买方要么接受卖方价格,要么不买,不能讨价还价。价格,要么不买,不能讨价还价。由于买方对第一阶段卖方的行为(车况好拿来卖还是差拿来卖)不了解,即买方具有不完美信息,这是一个不完美信息的动态博弈。从这个例子可以看出,在不完美信息
3、情况下的博在不完美信息情况下的博弈方的最优策略不仅仅依赖于其他博弈方的策略,弈方的最优策略不仅仅依赖于其他博弈方的策略,更更依赖于他对其他博弈方行为的判断。依赖于他对其他博弈方行为的判断。在对其他博弈方各种行为选择出现概率的大小做出判断,并据此计算自己各种策略的期望得益,找出其中最大期望得益对应的策略就是己方的最优策略。这实际上就是完全但不完美信息动态博弈的标准分析方法。二、不完美信息动态博弈的表示二、不完美信息动态博弈的表示 以二手车交易为例,设使用好时对买方而言该车值3千元,使用差时值 1千元,卖方要价2千元(可理解为买方想买的档次)。再假设使用差时卖方需要花费 1千元才能将车子伪装成使用
4、良好。买卖双方的博弈如图6-1所示。1差好卖不卖卖买买不买不买11(0,0)(0,0)(0,0)22(2,1)(1,-1)(-1,0)图6-1 二手车交易扩展式表示不卖 起始节点表示第一阶段卖方(即博弈方1)对如何使用汽车的选择,共有“好”和“差”两种可能的选择。第二阶段卖方若选择“不卖”,交易没有发生;如果他选择“卖”,则进行到买方选择的第三阶段,此时买方并不知道卖方的选择究竟是“好卖”还是“差卖”,用多节点信息集表示这种不完美性。第三阶段买方不能直接作出针对性的选择,他必须对这个多节点信息集中各节点出现的可能性做出判断。虽然买方在此处只有“买”和“不买”两种选择,但可能的结果却有四种:“买
5、”到好车、差车;“不买”好车、差车。前两种结果对买卖双方都有影响;而后两种结果则只对卖方有影响。即买方在第三阶段选择买方在第三阶段选择不买时,无论车况好、差,对买方的利益毫无影响;不买时,无论车况好、差,对买方的利益毫无影响;而对卖方来讲,因为当车况差时当车况差时他要先花 1千元进行伪装,卖不出去就会白白损失这笔伪装费,因此他的选择(卖或不卖)的前提条件是要对买方是否会买做出判断;车况好时车况好时卖不卖得出去都无损失,只有得益的可能,因此卖总是比不卖好。卖总是比不卖好。Exit P25Exit P25 在卖方选择卖的前提下,买方选择买既有赚的可能(车况好),也有亏的可能(车况差),选择不买当然
6、肯定不会吃亏,但也失去了获得利益的机会。因此,买方是否决定买还要对车况是好、差的概率做出判断。第二节第二节 完美贝叶斯均衡完美贝叶斯均衡 在完全且完美信息动态博弈中,子博弈完美性保证了均衡策略中没有任何不可信的威胁或承诺的。而在这里因为存在多节点信息集,包含这些多节点信息集的博弈阶段不构成真子博弈真子博弈,因此子博弈完美性要求无法满足,也就无法完全排除不可信的威胁或承诺无法保证均衡策略中所有选择的可信性,子博弈精炼纳什均衡的概念失去了意义,因此必须发展新的均衡概念。一、完美贝叶斯均衡的定义一、完美贝叶斯均衡的定义 当一个策略组合及相应的判断满足如下四个条件时,称其为“完美贝叶斯均衡”。l 条件
7、条件 1 1:在各个信息集处,轮到选择的博弈方必必须有关于博弈达到该信息集中每个节点的可能性的须有关于博弈达到该信息集中每个节点的可能性的“判断判断”。对多节点信息集,“判断”就是博弈达到该信息集各节点的概率分布各节点的概率分布;对单节点信息集,“判断”应理解为达到该节点的概率为 l。l 条条件件2 2:给定轮到选择博弈方的“判断”,他的后续策略必须是“序列理性序列理性”的。即在给定此判断和“其他博弈方后续策略”的情况下,该博弈方其后的行为选择意在使自己的期望得益最大。l 条条件件3 3:在均衡路径上的信息集处,“判断”要符合贝叶斯法则和各博弈方的均衡策略。l 条件条件4 4:在非均衡路径上的
8、信息集处,“判断”也要符合贝叶斯法则和各博弈方在此处可能有的均衡策略。当一个策略组合及相应的判断满足这四个条件时当一个策略组合及相应的判断满足这四个条件时称为称为“完美贝叶斯均衡完美贝叶斯均衡”。根据上述定义可知,子博弈完美纳什均衡是完美子博弈完美纳什均衡是完美贝叶斯均衡在完全且完美信息动态博弈中的特例,贝叶斯均衡在完全且完美信息动态博弈中的特例,即在完全且完美信息动态博弈中,子博弈完美纳什均衡就是完美贝叶斯均衡。实际上,序列理性条件要求各博弈方遵守最大利益原则作出策略选择,从而排除了博弈方策略中不可信的威胁或许诺。因此,序列理性要求对于保证完美贝叶斯均衡的真正稳定性是非常重要的。二、均衡要求
9、的初步解释二、均衡要求的初步解释 以图 6.2中的完全但不完美信息动态博弈为例,说明上述条件的重要性。先来看“条件1”。当博弈方1第一阶段的选择不是R时,博弈方2不知道博弈方1究竟是选择了L还是M。因此当轮到博弈方2选择时(博弈方1第一阶段没选R),他必须对博弈方1的选择做出判断,否则就无法在自己的U和D中做出合理的选择。1(1,3)RL(p)M(1-p)22UDUD(2,1)(0,0)(0,0)(0,1)图6-2 完全但不完美信息动态博弈 再来看“条件2”的必要性。该博弈除了原博弈之外,不存在任何其他真子博弈真子博弈(子博弈完美性要求自然满足),子博弈完美纳什均衡定义实际上就是纳什均衡。把上
10、图变成矩阵式(如下图),该博弈有两个纯策略纳什均衡(L,U)与(R,D)。而(R,D)依赖于一个不可信的威胁,即博弈方 2威胁当轮到自己选择时(博弈方1没有选R)将唯一地只选D。P 21博弈方 1 博弈方21,31,3UDRLM2,10,00,00,1 但是当博弈方当博弈方1 1选选L L的概率很大时的概率很大时(根据是博弈方1 不会选严格劣策略M,只有选L才可能获取自己的最大利益),博弈方 2选择D的期望得益小于选 U 的期望得益。实际上,当博弈方1第一阶段没有选R,博弈方2“判断”博弈方1选L的概率为p,选M的概率l-p的情况下,博弈方2选择U的期望得益为:而选D的期望得益为:当p1-p时
11、,即p1/2时,博弈方2选U的期望得益总大于选D的期望得益,根据条件2,博弈方2不会选D,只会选U。这时,博弈方1第一阶段的选择就应该是L,而非M,也非R。因此,博弈方博弈方1第一阶段选第一阶段选L,博弈方博弈方2在博弈方在博弈方1 第一阶段没有选第一阶段没有选R的情况下选择的情况下选择U,加上博弈方加上博弈方2对博对博弈方弈方1选选L、M的概率判断的概率判断p和和1-p(p1-p),构成一个构成一个满足序列理性要求的策略组合。满足序列理性要求的策略组合。满足了条件1和条件2事实上已经排除了前面提及的那个依赖于不可置信威胁从而不合理的纳什均衡策略(R,D)。由此可以看出,序列理性的意义在于要求
12、各博弈序列理性的意义在于要求各博弈方遵守最大利益原则作出行为选择,从而排除博弈方方遵守最大利益原则作出行为选择,从而排除博弈方策略中不可信的威胁或承诺。策略中不可信的威胁或承诺。对于“条件3”和“条件4”,所谓“在均衡路径上”的信息集意味着如果博弈按照均衡策略进行,则该信息集会以正正的的概概率率达到,而“不在均衡路径上”的信息集意味着博弈按均衡策略进行时,达到的概率为0。就图6-2博弈方2的信息集而言,当博弈方1第一阶段的均衡策略选择是R时,该信息集不在均衡路径上;而当博弈方1第一阶段选择不是R时,该信息集就在均衡路径上。(1,3)RL(p)M(1-P)22U D U D(2,1)(0,0)(
13、0,0)(0,1)1 1 下面还以该博弈为例,分析完美贝叶斯均衡定义中的“条件3”和“条件4”。对于“条件3”,假设均衡策略组合就是上面提到的“博弈方1在第一阶段选择L,博弈方2在第二阶段选择U”。先讨论条件 3中的贝叶斯条件。本博弈中两博弈方的选择都是为了获取最大得益的主动选择,没有非主动选择和外生不确定性,因此不需要额外信息帮助“判断”。即对博弈方2来说,“判断”是直接针对博弈方 1的上期选择的,不存在条件概率问题,贝叶斯法则自动满足,因此只要考察博弈方2 的判断是否符合各博弈方的均衡策略。即考察该“判断”是否符合博弈方 1第一阶段的选择和博弈方2自己本阶段的选择。由于博弈方1的均衡策略是
14、在第一阶段选择L,因此博弈方2只有判断“博弈方1选择L的概率p=1”才与博弈方 1的策略相符合,而且这种判断也与自己在本阶段依最大利益所作出的选择 U相符合,因此该判断的确是博弈方2决策和双方策略均衡的稳定基础。上述分析充分说明了在不完美信息博弈中,“判判断断”与均衡策略之间的相互依存关系,只有两者是一与均衡策略之间的相互依存关系,只有两者是一致、协调的,才可能是真正的均衡致、协调的,才可能是真正的均衡。这正是条件3 的真实含义。再看“条件4”。对于前面给出的均衡策略组合:“博弈方1 在第一阶段选择L,博弈方2在第二阶段选择U”来说,因为博弈方 2 的多节点信息集在均衡路径上,不存在不在均衡路
15、径上需要“判断”的信息集,因此条件4自动满足。为此,针对另一个纳什均衡策略组合(R,D),即“博弈方1第一阶段选择R,博弈方2 第二阶段选择 D”来讨论条件4的意义。在该均衡策略组合下,博弈方2 的两节点信息集是不在均衡路径上的信息集。条件4要求博弈方 2此时在这个信息集的“判断”也要满足贝叶斯法则和双方的均衡策略。同条件3,贝叶斯法则自动满足,只需要讨论博弈方2的“判断”与双方在此处可能有的均衡策略的一致性。显然,到达这个信息集表明博弈方1 在第一阶段偏离了上述均衡策略 R,按照前面的分析,博弈方2一定会“判断”博弈方1必然选择L策略。而这一判断与博弈方2 自己的均衡策略D不符合,从而与条件
16、4相悖,符合自己均衡策略D的“判断”只能是博弈方1选M的概率1-p=l,即博弈方1肯定选择M,然而这一结论又与博弈方1的序列理性相矛盾。对博弈方1来说,M 既是相对于R的下策,也是相对于L的下策(P14),即使他不愿选R,也只会选L而不会选M。因此,博弈方2的“判断”1-p=1虽然可以与自己的策略D相符合,但却无法与博弈方1在此处可能有的均衡策略L相符合,这意味着该“判断”不满足条件4。因此(R,D)策略组合不可能是该博弈具有真正稳定性的完美贝叶斯均衡。为了进一步理解完美贝叶斯均衡及其四个条件,特别是关于判断的条件3和条件4,再讨论两个例子。例一例一,以图6.1所示的二手车交易为例。轮到买方选
17、择时,他首先要对车况好、差的概率做出判断,即对p(g|s)和p(b|s)给出判断。为此,必须先确定卖在方第一阶段对车子的使用情况,即车况是好的概率p(g)和差的概率p(b)。三关于判断形成的进一步解释三关于判断形成的进一步解释(0,0)好 差卖 不卖卖 不卖买 不买 买 不买1122(0,0)(2,1)(0,0)(1,-1)(-1,0)1 这两个概率这两个概率构成了本博弈的外生不确定性,一般一般是通过经验性数据得到。是通过经验性数据得到。只有p(g)和p(b)这两个概率还不能对p(g|s)和 p(b|s)做出判断。因为卖方在车况好、差两种情况下的选择卖方在车况好、差两种情况下的选择往往是不同的
18、往往是不同的,因此只要知道卖方在好、差两种情况下选择卖的概率 p(s|g)和 p(s|b)分别是多大,就可以根据贝叶斯法则计算出买方需要的判断:由于卖方是理性的主动选择,因此上述条件概率取决于卖方自己的均衡策略。由图 6.1及前面的分析可知:当车况好时卖方一定会选择卖,因此 p(s|g)=1 成立;相反,在车况差时卖不出去就可能受到损失,卖方需要考虑买方选择买的概率的大小。假设假设买方选择买的概率是 0.5,卖方在车况差的时选择卖的期望得益为 0.510.5(1)=0,与不卖的得益相等,作为一个风险中性的博弈方作为一个风险中性的博弈方,卖方可采用(0.5,0.5)的概率分布选择卖或不卖的混合策
19、略。这时,买方判断 p(s|b)=0.5 既符合卖方的均衡策略也符合自己的均衡策略也符合自己的均衡策略。有了 p(s|g)=1和p(s|b)=0.5 这两个概率判断,再假设再假设已知总体车况好、差的概率p(g)=p(b)=0.5(即前面提到的经验数据),则根据贝叶斯法则买方在自己选择的两节点信息集处对卖方所卖车中好车所占比例的“判断”:对差车所占比例的“判”:。由于在卖方的上述策略下,买方选择的信息集有相当大的概率会达到(在前述条件下的最大概率,且满足正概率条件),因此该信息集是在均衡路径上的信息集。上述分析证明了该“判断”满足了条件 3。本例中没有不在均衡路径上的多节点信息集,因此条件4自动
20、满足。例二例二,图 6.3是一个有三个博弈方的三阶段不完美信息动态博弈。在该博弈中,博弈方3 的信息集是一个两节点信息集。如果博弈方1第一阶段选F,则博弈过程会经历多节点信息集,假设博弈方3“判断”博弈方2选L和R的概率分别是 p和1-p,最终共有四种可能的结果,各方得益如图所示。1FB2(2,0,0)L(p)R(1-p)33UUDD(1,2,1)(3,3,3)(0,1,2)(0,1,1)图6-3 三博弈方三阶段动态博弈 先考察博弈方3的选择,他选 U 的期望得益为:,选 D 的期望得益为 ,因此当 ,即pl/3 时他该选U,当 pl/3 时他该选D,P=1/3 时选U、D或者混合策略都可以。
21、先假设博弈方3“判断”p1/3,此时他的合理选择是D;再来看博弈方2的选择,因为L是他相对于R的严格上策,因此他无需考虑博弈方3在第三阶段如何选择,而唯一地只选择L。可知,博弈方3“判断”p1/3是符合博弈方2 的均衡策略的。又,既然博弈方 2只会选L,故,完全符合博弈方2均衡策略的博弈方3的“判断”应该是p=1。对于博弈方1而言,他知道从博弈方2选择开始的子博弈的均衡必然为(L,D),意味着自己选择F可以获得3单位得益,比选 B得益2要好,因此 F是他的均衡策略。均衡策略组合(F,L,D)以及与之相应的博弈方3的“判断”p=1完全符合完美贝叶斯均衡的条件13,并且由于在上述策略组合下不存在不
22、在均衡路径上需要判断的信息集,因此条件 4 自动满足,可以肯定这是一个完美贝叶斯均衡。上述结论还可以采用其他方法分析。由于在该博弈中,从博弈方2 的单节点信息集开始的子博弈实际上是一个静态博弈(由于博弈方(由于博弈方3 3对博弈方对博弈方2 2的行为具的行为具有不完美性,因此相当于他们同时做出行为选择),有不完美性,因此相当于他们同时做出行为选择),如下图所示。显然,该静态博弈有唯一的纳什均衡(L,D),故整个博弈有唯一子博弈完美纳什均衡(F,L,D)。为了说明条件 4的必要性,考察另一个策略组合(B,L,U)及博弈方3相应的“判断”p=0。博弈方3博弈方 2DULR2,13,31,21,1
23、该策略组合是一个纳什均衡,原因是不论博弈方1 选什么策略,博弈方2的最佳反应对策都是L;而当博弈方3判断 p=0 的情况下,U是他对博弈方2的最佳反应对策;对于博弈方1 来说,当其他两方的策略是(L,U)时,当然是选 B 合算,从而(B,L,U)满足相互是对对方策略的最佳反应对策。其次在博弈方3“判断”p=0时,(B,L,U)是序列理性的,且在均衡路径(B)上没有多节点信息集,条件3自动满足。即策略组合(B,L,U)和博弈方3的“判断”p=O是满足完美贝叶斯均衡的条件13的。然而,仅此就断定它是一个完美贝叶斯均衡是有问题的,因为这时各博弈方得益(2,0,O)是极不理想的。此时条件4就可以起作用
24、了。在(B,L,U)策略组合下,博弈方 3的信息集正是不在均衡路径上的信息集,但博弈方3在此处的“判断”p=0显然与博弈方2的策略L不相符合。因此上述策略组合和“判断”不能构成完美贝叶斯均衡,这就把(B,L,U)排除出了完美贝叶斯均衡的范畴,从而使得完美贝叶斯均衡是更加可靠、稳定和合理的均衡概念。第三节第三节 单一价格二手车模型单一价格二手车模型一、单一价格二手车交易博弈模型的多样性一、单一价格二手车交易博弈模型的多样性 假设:假设:二手车有好、差两种情况,对买方来讲对买方来讲价值分别为 V和W(VW);买方要买的是好车,并不想买便宜货。因此卖方要想卖出车子,不管车况好坏,只有都当作好车卖,所
25、以只有一种价格 P。这也意味着车况差时卖方必须花一定的费用进行伪装才有希望骗过买方,伪装的费用为 C。这样二手车交易可用图6.4中的扩展形表示:图 6.4 单一价格二手车交易 Exit P45 好 差 卖 不卖(0,0)(0,0)(-C,0)买 不买(P-C,W-P)买 不买(0,0)(P,V-P)11122卖 不卖 改变改变V、W、P和和C的具体数值,该模型即可代表的具体数值,该模型即可代表多种具体博弈多种具体博弈。如果如果P PC C,V VP PW W,对买方来说车况好时价值大于价格,而车况差时价值小于价格。则车况好车况好时成交对双方都有利,若未成交双方虽没损失,但也丧失了得益的机会;车
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 完全 完美 信息 动态 博弈 ppt
限制150内