不完全信息动态博弈ppt课件.pptx
《不完全信息动态博弈ppt课件.pptx》由会员分享,可在线阅读,更多相关《不完全信息动态博弈ppt课件.pptx(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 在动态博弈中,行动有先后次序;在不完全信息条件下,博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系,但是,参与人并不知道其他的参与人具体属于哪一种类型。由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。 在不完全信息动态博弈一开始,某一参与人根据其他参与人的不同类型及其所属类型的概率分布,建立自己的初步判断。当博弈开始后,该参与人就可以根据他所观察到的其他参与人的实际行动,来修正自己的初步判断。并根据这种不断变化的判断,选择自己的策略。 古玩市场 黔驴技穷
2、信号传递 1967年,海萨尼提出了年,海萨尼提出了“海萨尼转换海萨尼转换”来处理不完全信息来处理不完全信息的博弈。的博弈。 基本思路是:引入一个虚拟的参与人基本思路是:引入一个虚拟的参与人“自然自然”,“自然自然”首先行动选定参与人的某种类型,各参与人知道自己的类型,首先行动选定参与人的某种类型,各参与人知道自己的类型,但其他参与人不知道。不过,但其他参与人不知道。不过,“自然自然”以怎样的概率来选择以怎样的概率来选择各参与人的类型,此概率分布却是共同知识。各参与人的类型,此概率分布却是共同知识。 以对参与人类型的概率的分析代替对参与人确切行动的分析,以对参与人类型的概率的分析代替对参与人确切
3、行动的分析,这样的转换就是这样的转换就是“海萨尼转换海萨尼转换”。 通过海萨尼转换,博弈开始时,所有参与人有关通过海萨尼转换,博弈开始时,所有参与人有关“自然自然”的的行动有一致的信念,即都知道所有人类型的概率分布,此即行动有一致的信念,即都知道所有人类型的概率分布,此即“海萨尼公理海萨尼公理”。 海萨尼转换后的市场进入博弈海萨尼转换后的市场进入博弈NP1-P进入者进入者进入者进入者不进不进进进不进不进进进(0,300)在位者在位者打击打击打击打击在位者在位者(40,50)(-10,0)(0,400)(30,80) (-10,100)合作合作合作合作 在不完全信息开始之前,在不完全信息开始之前
4、,“自然自然”首先行动,选择各参与人首先行动,选择各参与人的类型。各参与人除了知道自己的类型以外,对的类型。各参与人除了知道自己的类型以外,对“自然自然”的的行动都有着一致的信念,称之为先验信念。之后,参与人先行动都有着一致的信念,称之为先验信念。之后,参与人先后行动,后行动者能观察到先行动者的行动,但观察不到先后行动,后行动者能观察到先行动者的行动,但观察不到先行动者的类型。但是,因为参与人的行动是依赖于其类型的,行动者的类型。但是,因为参与人的行动是依赖于其类型的,每个参与人的行动都传递着有关自己类型的某种信息,后行每个参与人的行动都传递着有关自己类型的某种信息,后行动者可以通过观察先行动
5、者的行动来修正对其各种类型判断动者可以通过观察先行动者的行动来修正对其各种类型判断的先验信念(概率分布),然后选择自己的最优行动。先行的先验信念(概率分布),然后选择自己的最优行动。先行动者预测到自己的行动将被后行动者所利用,也就会设法传动者预测到自己的行动将被后行动者所利用,也就会设法传递对自己有利的信息,避免传递对自己不利的信息。因此,递对自己有利的信息,避免传递对自己不利的信息。因此,不完全信息动态博弈不仅是参与人选择行动的过程,更是参不完全信息动态博弈不仅是参与人选择行动的过程,更是参与人不断修正信念的过程。与人不断修正信念的过程。例例 所罗门判子所罗门判子 所罗门王是古代以色列国的一
6、位以智慧著称的君所罗门王是古代以色列国的一位以智慧著称的君主。一次,两个妇人为争夺一个婴儿争扯到所罗门主。一次,两个妇人为争夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主。王殿前,她们都说婴儿是自己的,请所罗门王作主。所罗门王稍加思考后作出决定:将婴儿一刀劈为两所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半。这时,其中一位妇人立即段,两位妇人各得一半。这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成的,应完整归还给另一位妇人,千万别将婴儿劈成两半。听罢
7、这位妇人的求诉,所罗门王立即作出最两半。听罢这位妇人的求诉,所罗门王立即作出最终裁决终裁决婴儿是这位请求不杀婴儿的妇人的,应婴儿是这位请求不杀婴儿的妇人的,应归于她。归于她。例例 黔之驴黔之驴 黔无驴,有好事者船载以入。至则无可用,放之山下。黔无驴,有好事者船载以入。至则无可用,放之山下。虎见之,庞然大物也,以为神。蔽林间窥之,稍出近之,憖虎见之,庞然大物也,以为神。蔽林间窥之,稍出近之,憖憖然莫相知。憖然莫相知。 他日,驴一鸣,虎大骇,远遁,以为且噬已也,甚恐。他日,驴一鸣,虎大骇,远遁,以为且噬已也,甚恐。然往来视之,觉无异能者,益习其声,又近出前后,终不敢然往来视之,觉无异能者,益习其声
8、,又近出前后,终不敢搏。稍近,益狎,荡倚冲冒,驴不胜怒,蹄之。虎因喜,计搏。稍近,益狎,荡倚冲冒,驴不胜怒,蹄之。虎因喜,计之曰:之曰:“技止此耳!技止此耳!”因跳踉大,断其喉,尽其肉,乃去。因跳踉大,断其喉,尽其肉,乃去。 噫!形之庞也类有德,声之友也类有能,向不出其技,噫!形之庞也类有德,声之友也类有能,向不出其技,虎虽猛,疑畏卒不敢取;今若是焉,悲夫!虎虽猛,疑畏卒不敢取;今若是焉,悲夫!贝叶斯法则贝叶斯法则 概率论中贝叶斯公式概率论中贝叶斯公式 贝叶斯贝叶斯法则法则 是先验概率,是先验概率, 是类型,是类型, 是一特定行动。问题是是一特定行动。问题是假如观测到了假如观测到了 ,则属于,
9、则属于 类型的概率,即后验概类型的概率,即后验概率率 。 niBPBAPBPBAPABPnjjjiii,.2 , 1,1 KjjjhkkhhkPaPPaPaP10kPkkhahahkaP例例 对人的判断对人的判断 把所有的人划分为好人把所有的人划分为好人GP和坏人和坏人BP两类,所有的事两类,所有的事划分为好事划分为好事GT和坏事和坏事BT两类。那么一个人干好事的概两类。那么一个人干好事的概率率是多少?是多少? 如果如果观测到一个人干了件好事,那么这个人是好人的观测到一个人干了件好事,那么这个人是好人的后验概率后验概率是多少?是多少? 更具体点,假定认为这个人是好人的先验概率为更具体点,假定认
10、为这个人是好人的先验概率为1/2,那么在观测到他干了好事之后,如何修正先验概率依那么在观测到他干了好事之后,如何修正先验概率依赖于我们认为这件好事好到什么程度。赖于我们认为这件好事好到什么程度。 第一种情况,这是一件非常好的好事,好人一定干,第一种情况,这是一件非常好的好事,好人一定干,坏人绝不可能干。坏人绝不可能干。 可以可以看到,我们如何改变对一个人的看法不仅依赖于我们看到,我们如何改变对一个人的看法不仅依赖于我们认为他是好人或坏人的先验概率,而且依赖于我们如何认为他是好人或坏人的先验概率,而且依赖于我们如何“认为认为”好人干好事和坏人干好事的条件概率。不能任意地好人干好事和坏人干好事的条
11、件概率。不能任意地“认为认为”。当认为坏人干好事的概率为当认为坏人干好事的概率为 时时,那么,在给定信息,那么,在给定信息情况下,如果这个人确实是坏人,则情况下,如果这个人确实是坏人,则 是是他的最优选他的最优选择择。这。这对于理解精炼贝叶斯纳什均衡是非常重要的。对于理解精炼贝叶斯纳什均衡是非常重要的。 第二种情况,这是一件非常一般的好事,好人会干,坏人第二种情况,这是一件非常一般的好事,好人会干,坏人也会干也会干 第三种情况,好人肯定会干,坏人可能干也可能不干第三种情况,好人肯定会干,坏人可能干也可能不干BPGTP/BPGTP/ 贝叶斯法则不是一个技术性法则,而是人们修正信念的贝叶斯法则不是
12、一个技术性法则,而是人们修正信念的唯一合理方法。唯一合理方法。例例 二手车市场二手车市场 认为车子是好的先验概率为认为车子是好的先验概率为 ,认为车子是不好的先,认为车子是不好的先验概率为验概率为 。当卖。当卖(Sell)这个行动发生后,车子是)这个行动发生后,车子是好的后验概率好的后验概率是多少?是多少? GP BP精炼贝叶斯纳什均衡是精炼贝叶斯纳什均衡是 :L,U;p=11RLM(p)(1-P)22UDUD(2,1)(0,0)(0,2)(0,1)(1,3) 因此,这个博弈的唯一的精炼贝叶斯纳什均衡是因此,这个博弈的唯一的精炼贝叶斯纳什均衡是L,U;p=1 假定参与人假定参与人2认为参与人认
13、为参与人1选择选择L和和M的概率分别为的概率分别为p和(和(1-p)。给定这个信念,参与人)。给定这个信念,参与人2选择选择U的期望效用是的期望效用是p1+(1-p) 2=2-p,选择选择D的期望效用是的期望效用是p0+(1-p) 1=1-p.不论不论p为何值,参与人为何值,参与人2一定选择一定选择U。给定参与人。给定参与人1知道参与人知道参与人2将将选择选择U,参与人,参与人1的最优选择是的最优选择是L。给定。给定L是参与人是参与人1的最优战的最优战略,当参与人略,当参与人2观察到参与人观察到参与人1没有选择没有选择R时,他知道参与人时,他知道参与人1一定选择了一定选择了L,即即p=1。 第
14、一第一,在每一个信息集上,决策者必须有一,在每一个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概个定义在属于该信息集的所有决策结上的一个概率分布(信念);第二,给定该信息集上的概率率分布(信念);第二,给定该信息集上的概率分布和其他参与人的后续策略,参与人在该信息分布和其他参与人的后续策略,参与人在该信息集处的行动必须是最优的(后续策略指的是从给集处的行动必须是最优的(后续策略指的是从给定信息集开始的后续博弈上的行动规则);第三,定信息集开始的后续博弈上的行动规则);第三,每个参与人根据均衡策略和贝叶斯法则做出判断每个参与人根据均衡策略和贝叶斯法则做出判断和修正,得到后验概
15、率。和修正,得到后验概率。满足上述要求的博弈均衡就称为满足上述要求的博弈均衡就称为“精炼贝叶斯均精炼贝叶斯均衡衡”。 信号传递博弈是一类比较简单但有广泛应用意义的不完全信信号传递博弈是一类比较简单但有广泛应用意义的不完全信息动态博弈,许多博弈问题都可以归结为此类型的博弈。如息动态博弈,许多博弈问题都可以归结为此类型的博弈。如市场进入与遏制、委托市场进入与遏制、委托-代理关系、拍卖机制的设计等。代理关系、拍卖机制的设计等。 在信号传递博弈中有两个参与人,先后各行动一次;参与人在信号传递博弈中有两个参与人,先后各行动一次;参与人1有多个类型,先行动;参与人有多个类型,先行动;参与人2后行动,他不知
16、道参与人后行动,他不知道参与人1的具体类型,但可以观察到先行动一方的行动并从中获得部的具体类型,但可以观察到先行动一方的行动并从中获得部分信息。先行动的一方行动对后行动者来说好像是某种反映分信息。先行动的一方行动对后行动者来说好像是某种反映其类型信息的信号,因此该博弈被称为其类型信息的信号,因此该博弈被称为“信号传递博弈信号传递博弈”。一般称先行动的参与人一般称先行动的参与人1为信号发送者,记为为信号发送者,记为S;后行动的参;后行动的参与人与人2称为信号接收者,记为称为信号接收者,记为R。例例 垄断厂商的低价销售:信号传递博弈垄断厂商的低价销售:信号传递博弈 有有许多垄断厂商并未如人们所料想
17、的那许多垄断厂商并未如人们所料想的那样给商品定出一个很高的价格,而是以较低样给商品定出一个很高的价格,而是以较低的价格长期销售某种产品。譬如,发达国家的价格长期销售某种产品。譬如,发达国家的私营铁路、航空、海运码头等的价格都远的私营铁路、航空、海运码头等的价格都远低于按照其垄断定价方法定出的价格。这是低于按照其垄断定价方法定出的价格。这是什么原因呢?什么原因呢? 现在,我们用这个现在,我们用这个“信号传递博弈信号传递博弈”的原理,来解释的原理,来解释为何一些垄断厂商长期在低价格水平上经营。如果这个垄断为何一些垄断厂商长期在低价格水平上经营。如果这个垄断厂商是一个低生产成本的厂商,当其它较高生产
18、成本厂商也厂商是一个低生产成本的厂商,当其它较高生产成本厂商也进入这个厂商所经营的行业与之进行竞争时,原先的那个垄进入这个厂商所经营的行业与之进行竞争时,原先的那个垄断厂商可以通过降价将进入者赶出这个行业,从而继续维持断厂商可以通过降价将进入者赶出这个行业,从而继续维持垄断经营。垄断经营。 由于垄断厂商有更低的生产成本,所以,它能够将产由于垄断厂商有更低的生产成本,所以,它能够将产品价格降到比进入厂商的生产成本还要低的水平上,这就造品价格降到比进入厂商的生产成本还要低的水平上,这就造成进入者或者高价格经营导致顾客流失,或者同样也降价但成进入者或者高价格经营导致顾客流失,或者同样也降价但价格低于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 不完全 信息 动态 博弈 ppt 课件
限制150内