子博弈精炼纳什均衡+贝叶斯法则+信号博弈.doc
《子博弈精炼纳什均衡+贝叶斯法则+信号博弈.doc》由会员分享,可在线阅读,更多相关《子博弈精炼纳什均衡+贝叶斯法则+信号博弈.doc(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 . . . . 一:子博弈精炼纳什均衡 在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈这个概念。子博弈subgame:由一个单结信息集X开始的与所有该决策结的后续结包括终点结组成的,能够自成一个博弈的原博弈的一局部。即给定“历史,每一个行动选择开始至博弈完毕构成了的一个博弈,称为原动态博弈的一个“子博弈。子博弈可以作为一个独立的博弈进展分析,并且与原博弈具有一样的信息结构。为了表达方便,一般用表示博弈树中开始于决策结的子博弈。 譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a子博弈和图3.6b子博弈。 在静态博弈分析时,我们所说的战略是指
2、参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择事后机会主义,后动的局中人完全可以根据博弈进展到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。而当博弈实际进展到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设
3、,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼纳什均衡的思想,应当将其消掉。定义3.1:子博弈精炼纳什均衡SPNE: 扩展式博弈的策略组合S*=(S1*,Si*,Sn*)是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈与它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡。这也意味着原博弈的Nash均衡并不
4、一定是子博弈精炼Nash均衡,除非它还对所有子博弈构成Nash均衡。例如前文的煤电博弈,提价,承受和不提价,承受均为纳什均衡,但后者并未满足在整个动态博弈与它的所有子博弈中都构成纳什均衡这一要件,因而理性的煤炭企业一定会选择提价。博弈:一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一局部。对于扩展式博弈的策略组合S*=(S1*,Si*,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,那么它是一个子博弈精炼纳什均衡。博弈论专家常常使用“序贯理性(Sequential rationality):指不
5、论过去发生了什么,参与人应该在博弈的每个时点上最优化自己的策略。子博弈精炼纳什均衡所要求的正是参与人应该是序惯理性的。对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。因为有限完美信息博弈的每一个决策结都开始一个子博弈。求解方法:最后一个结点上的子博弈纳什均衡倒数第二个纳什均衡 初始结点上的子博弈纳什均衡。上图摘自维迎的博弈论与信息经济学P 7在此图中,我们可以看出博弈论大概分为四类,每种类别都有固定的纳什均衡。这道题中所问的“如何分辨子博弈,是求解子博弈精炼纳什均衡的根底。而“贝叶斯法那么是求解精炼贝叶斯均衡的根底。所以,如果扩展一下是属于如何求解完全信息动态博弈的子博
6、弈精炼纳什均衡,以与如何求解不完全信息动态博弈的精炼贝叶斯纳什均衡。在下面分开讨论。一、完全信息动态的子博弈精炼纳什均衡完全信息动态一般用扩展式表述。子博弈精炼纳什均衡要求1它在原博弈上是纳什均衡2它在每一个子博弈上都是纳什均衡。所以,如何分辨一个扩展式有几个子博弈,关键在于看一个扩展式表述的博弈中有几个单节信息集。同时,子博弈不能切割原博弈的信息集。通过下面几个图来解释:图 1在此博弈中,有三个参与者,分别是A、N自然、B。共有七个决策点,A有一个。N有两个,B有四个。这七个决策点分割成七个信息集,每个信息集都只包括一个决策点。表示,所有参与者在参与时准确知道自己处于哪个决策结。子博弈由每个
7、决策结与其后续结构成,所以在图一中,共有七个子博弈。注意:任何博弈本身成为其自身的一个子博弈。图 2图2与图1一样,也有三个参与者,A、N自然、B。不同的是,B在选择时并不知道N的选择,也就是说B知道A选择了开发或者不开发,但是不知道N选择了大还是小。因为B不知道自己处在N选择了大还是小的决策结上,用虚线表示。此时,B有两个信息集,但是每个信息集有两个决策点。总结来说,在图2中,A有一个信息集,只包含一个决策结;N有两个信息集,各包含一个决策结;B有两个信息集,各包含两个决策结。所以,图2共有三个单节信息集,那么也就可以判断图2有三个子博弈。图 3在同样三个参与者的图中,图3代表A决策时不知道
8、N决策的结果;B知道自然的选择,但是不知道A的选择。在图3中,根据“子博弈不能切割原博弈信息集的规那么,图3只有一个子博弈就是原博弈本身。图3的博弈还可以用另外的方式来表达,可能更容易理解。图 4图4和图3代表的完全是同一个博弈。A决策时不知道N决策的结果;B知道自然的选择,但是不知道A的选择。在这个图中,根据之前的“有几个单节信息集就有几个子博弈的判断方法,可以知道只有一个子博弈就是原博弈本身。或者说,只有一个子博弈,即N有一个信息集只包含一个决策点。二、贝叶斯法那么的理解如何理解贝叶斯法那么在博弈论中的应用,我觉得维迎博弈论与信息经济学中举的一个例子很好,我先把这局部截图放在下面。摘自维迎
9、博弈论与信息经济学 P182P183三:信号博弈与贝叶斯法那么的运用信号博弈Signaling game,是一种由一个发送者S和另一个接收者R所组成的动态博弈。一开始这个发送者有一个给定的类型t,接着发送者会观察这个没有其他人好比说接收者知道的类型,去从讯息堆 M = m1, m2, m3,., mj 中选择送出一个讯息m,接着接收者会观察这个讯息后从他可行的动作中 A = a1, a2, a3,., ak 选一个作为反响动作a,这里要注意的是接收者除了讯息之外其他都无法得知如发送者的类型t,接着根据t, m, a的组合来决定双方会获得的报酬或回报。用贝叶斯法那么求解精炼贝叶斯纳什均衡最典型的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈 精炼 均衡 贝叶斯 法则 信号
限制150内