最新完全信息动态博弈10PPT课件.ppt
《最新完全信息动态博弈10PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新完全信息动态博弈10PPT课件.ppt(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、完全信息动态博弈完全信息动态博弈1010 凶残海盗的逻辑凶残海盗的逻辑中有一个智力题海盗分金:5个海盗要分配抢来的100个金币,分配方式是第一个人提出分配方案,如果同意这种方案的达到半数,提议通过,否则提议的人扔进大海,由剩余的人再进行同样的过程。假设5个人的提议的次序已定,金币不能分割,而且海盗的本性让他们觉得,如果对自己的收益没有影响,则很乐意看到别人被扔进大海,这时理性结局应该如何?这种博弈局势和策略型博弈的不同之处在于:其中存在着局中人行动的先后次序,更多的信息意味着有可能利用这些信息形成更严格的均衡概念?对这种具有动态结构的决策形势进行研究的规范分析工具是扩展型博弈。(二)完美信息博
2、弈与完美信息的违背 1、信息集:1、1定义:实际上是参与者决策节点集合的一个子集。信息集的定义是当博弈进行到某个阶段,轮到某个参与者行动时,他不知道自己位于哪一个节点,不能加以区分的节点的集合就称为信息集。参与者之所以不能对信息集中的节点进行区分,原因在于他对前面发生的其他参与者的(有些或全部)行动未能观察到。囚徒困境的信息集囚徒困境的信息集 在图中,我们看到当博弈进行到囚徒在图中,我们看到当博弈进行到囚徒2行动时,由于囚徒行动时,由于囚徒2未未能观察到此前囚徒能观察到此前囚徒1的行动,所以囚徒的行动,所以囚徒2不能对节点不能对节点X2和和X3作出作出区分,也就是他不知道囚徒区分,也就是他不知
3、道囚徒1到底选择的是什么策略。节点到底选择的是什么策略。节点X2、X3的集合的集合X2,X3即是囚徒即是囚徒2的一个信息集,集合的一个信息集,集合X1即是囚徒即是囚徒1的信息集。习惯上,我们通常把位于同一个信息集的节点用虚的信息集。习惯上,我们通常把位于同一个信息集的节点用虚线连接起来或者用圆圈圈起来,只包含线连接起来或者用圆圈圈起来,只包含个节点的信息集就称为个节点的信息集就称为单点信息集单点信息集1、2、信息集的意义、信息集的意义 第一,使用信息集可以清楚地描绘出当参与者行动时,他所处的第一,使用信息集可以清楚地描绘出当参与者行动时,他所处的“环境环境”和所和所有可能掌握的信息,因而有可能
4、掌握的信息,因而能揭示出博弈的信息特征能揭示出博弈的信息特征。第二,信息集的使用还可以第二,信息集的使用还可以使静态博弈转化为动态博弈使静态博弈转化为动态博弈在博弈的基本式和在博弈的基本式和 扩展式之间架设了一道桥梁,博弈的扩展式成为能够描述所有博弈类型的有扩展式之间架设了一道桥梁,博弈的扩展式成为能够描述所有博弈类型的有力工具。力工具。第三,利用信息集概念,可以第三,利用信息集概念,可以表现复杂的信息结构表现复杂的信息结构,描述动态博弈局势中局,描述动态博弈局势中局中人在行动时知道的各种信息。我们还可以利用扩展型博弈表现静态博弈中人在行动时知道的各种信息。我们还可以利用扩展型博弈表现静态博弈
5、 1、3、信息集的规定:、信息集的规定:第一,在任意一个信息集中的每一个节点上,参与者一定有相同的行动集合第一,在任意一个信息集中的每一个节点上,参与者一定有相同的行动集合 原因非常简单,如果一个信息集中的两个节点包含的行动不一样,由于原因非常简单,如果一个信息集中的两个节点包含的行动不一样,由于参与者在不同的节点具有不同的行动、因而他一定能对这两个节点作出区分。参与者在不同的节点具有不同的行动、因而他一定能对这两个节点作出区分。这就与信息集的定义相矛盾。这就与信息集的定义相矛盾。第二,信息集不得违背完美回忆的假定。第二,信息集不得违背完美回忆的假定。完美回忆假定当博弈中的参与者行动时,他对过
6、去发生的一切情况都记得完美回忆假定当博弈中的参与者行动时,他对过去发生的一切情况都记得清清楚楚。显然完美回忆在现实生活中可能并不满足,因而我们把它看作一清清楚楚。显然完美回忆在现实生活中可能并不满足,因而我们把它看作一 种假定,但完美回忆在现实生活中也普遍存在,例如,打过桥牌的人就知道桥种假定,但完美回忆在现实生活中也普遍存在,例如,打过桥牌的人就知道桥牌游戏就是一个典型的完美回忆。牌游戏就是一个典型的完美回忆。(二)完美信息博弈与完美信息的违背2、完美信息:指博弈中的每一个信息集只包含惟一一个节点、完美信息:指博弈中的每一个信息集只包含惟一一个节点。3、完美信息博弈:完美信息博弈:当每一个参
7、与者行动时,他都能观察到他的当每一个参与者行动时,他都能观察到他的 对手先前所有的行动。这种博弈我们定义为完美信息博弈对手先前所有的行动。这种博弈我们定义为完美信息博弈.这类特殊的完美信息博弈,其中所有的信息集都是单点集,这类特殊的完美信息博弈,其中所有的信息集都是单点集,在完美信息博弈中,一次只有一个局中人在行动而且他在行动在完美信息博弈中,一次只有一个局中人在行动而且他在行动时知道博弈的所有以往行动历史。时知道博弈的所有以往行动历史。博弈开始时,局中人博弈开始时,局中人1在两种行动在两种行动U和和D中进行选择,如果选中进行选择,如果选择择U则博弈结束,结局为则博弈结束,结局为X1;如果选择
8、;如果选择D,则由局中人,则由局中人2在在L和和R之间进行选择如果局中人之间进行选择如果局中人2选选L则博弈结局为则博弈结局为X2,局中人,局中人2选选R则局中人则局中人3在在m相相r中进行选择。(见博弈树中进行选择。(见博弈树 图图)4、不具备完美回忆的博弈、不具备完美回忆的博弈 在经济学应用的绝大多数博弈模型中均假设博弈在经济学应用的绝大多数博弈模型中均假设博弈具有具有“完美回忆完美回忆”即没有局中人会忘记自己所知道的即没有局中人会忘记自己所知道的信息,所有局中人不记得自己以往的行动选择。信息,所有局中人不记得自己以往的行动选择。不具有完美回忆的例子如图所示,该博弈中,局中人不具有完美回忆
9、的例子如图所示,该博弈中,局中人1首先在首先在u与与R两种行动中进行选择,局中人两种行动中进行选择,局中人2随之行动,随之行动,然后局中人然后局中人1再行动,这时局中人再行动,这时局中人1忘记了自己曾经在忘记了自己曾经在u与与R中作出的选择,从而这一博弈不具有完美回忆。中作出的选择,从而这一博弈不具有完美回忆。博弈理论研究的是完全理性的个人,因此涉及的博弈博弈理论研究的是完全理性的个人,因此涉及的博弈局势应该都具有完美回忆。局势应该都具有完美回忆。不具备完美回忆的博弈 在图中,参与者2忘记了他曾经知道的参与者1如何行动的信息。如果一个博弈不满足完美回忆的要求,实际上我们就不可能对该博弈进行分析
10、,因为忘记,所以一切后果都可能出现。在博弈论中,完美回忆和博弈的结构是所有参与者的公共信息,是每一个博弈都必须满足的条件。得到扩展型博弈的表述后,就需要考察它的解。在以扩展型博弈表述的完全信息动态博弈中,纳什均衡概念同样适用,然而需要加以完善,最常用的解概念就是子博弈完美均衡。第二节 子博弈完美均衡子博弈通俗地说就是动态博弈的局部,只要是一子博弈通俗地说就是动态博弈的局部,只要是一个单点信息集,它后面的所有节点个单点信息集,它后面的所有节点(信息集和结束信息集和结束点点)连同它本身就构成了一个子博弈连同它本身就构成了一个子博弈“子博弈精练纳什均衡子博弈精练纳什均衡”,该模型的中心思想是将,该模
11、型的中心思想是将纳什均衡中包含的不可置信的威胁剔除出去,使纳什均衡中包含的不可置信的威胁剔除出去,使均衡战略不再包含不可置信的威胁。它要求参均衡战略不再包含不可置信的威胁。它要求参 与与人的决策在任何时点上都是最优的,决策者人的决策在任何时点上都是最优的,决策者“随机随机 应变应变”,而不是固守旧略。,而不是固守旧略。X0、X1、X2、X3、X4共5个子博弈一:扩展型博弈的纳什均衡一:扩展型博弈的纳什均衡(一一)策略与行为策略策略与行为策略首先需要定义扩展型博弈中的纯策略。由于首先需要定义扩展型博弈中的纯策略。由于扩展型博弈中同一个局中人可能在多种场合扩展型博弈中同一个局中人可能在多种场合行动
12、,所以局中人的全局策略应该给出在每行动,所以局中人的全局策略应该给出在每个需要决策的地方个需要决策的地方(每个信息集处每个信息集处)局中人的局中人的行动选择。行动选择。例如,假设一种博弈局势分两个阶段进行,在例如,假设一种博弈局势分两个阶段进行,在第一阶段中,局中人第一阶段中,局中人1和和2分别在分别在U和和D中同时进中同时进行选择,第一阶段的结果告诉两个局中人后,第行选择,第一阶段的结果告诉两个局中人后,第二阶段局中人同时在二阶段局中人同时在L和和R中进行选择。共有四中进行选择。共有四个结果个结果 这种穷举式策略表述方式比较罗嗦,因此常用更简单的方式这种穷举式策略表述方式比较罗嗦,因此常用更
13、简单的方式来进行表示。例如,以上策略也可表示为:来进行表示。例如,以上策略也可表示为:“第一阶段选第一阶段选U。如果对方也选。如果对方也选U,则在第二阶段选,则在第二阶段选L.否则,在其他情况下总选否则,在其他情况下总选R,简化表述需要能对应完整表述的策略简化表述需要能对应完整表述的策略.例如,俗话说的例如,俗话说的“你不仁,我不义你不仁,我不义”就是更为熟悉的日常的策就是更为熟悉的日常的策略表述方式,它表明,如果对方上次采取了对自己不利的行动,略表述方式,它表明,如果对方上次采取了对自己不利的行动,自己就在这次采取对对方不利的行动,而如果对方上次合作,那自己就在这次采取对对方不利的行动,而如
14、果对方上次合作,那自己这次也合作。我们可以把它转化为具体扩展型博弈中的完整自己这次也合作。我们可以把它转化为具体扩展型博弈中的完整策略。策略。这个例子也表现了扩展型博弈转换为策略型时的一种现这个例子也表现了扩展型博弈转换为策略型时的一种现象,完整的纯策略给出了每个信息集处局中人的选择,象,完整的纯策略给出了每个信息集处局中人的选择,但这有时是不必要的。但这有时是不必要的。在示例中,局中人在示例中,局中人1第一阶段决定选择第一阶段决定选择U,那么实际上,那么实际上第一阶段的结局不可能是第一阶段的结局不可能是(D,U)和和(D,D),只可能是,只可能是(U,U)或或U,D),所以策略中只要考虑后两
15、种结局处,所以策略中只要考虑后两种结局处自己的选择就可以了。自己的选择就可以了。(二二)扩展型博弈和策略型博弈的关系扩展型博弈和策略型博弈的关系1、扩展型博弈可用策略型博弈的形式来表现、扩展型博弈可用策略型博弈的形式来表现 在以上定义的基础上,可以建立扩展型博弈与策略型在以上定义的基础上,可以建立扩展型博弈与策略型博弈的对应关系,通过扩展型博弈的纯策略定义与相博弈的对应关系,通过扩展型博弈的纯策略定义与相应期望支付函数的建立,可以将扩展型博弈用策略型应期望支付函数的建立,可以将扩展型博弈用策略型博弈的形式来表现博弈的形式来表现 2、扩展型博弈的策略型表述、扩展型博弈的策略型表述 3、二者的关系
16、、二者的关系 扩展型博弈与对应的策略型表述具有相同的纯策略空扩展型博弈与对应的策略型表述具有相同的纯策略空间,但是行为策略与对应策略型表述的混合策略在概念上并间,但是行为策略与对应策略型表述的混合策略在概念上并不完全相同。不完全相同。行为策略中,局中人在各信息集处采用不同的行为策略中,局中人在各信息集处采用不同的随机机制在对应行动集中选择。随机机制在对应行动集中选择。对此一个常用的比喻是:一种纯策略是一本指令书,每对此一个常用的比喻是:一种纯策略是一本指令书,每一页说明在特定的信息集处如何行动,纯策略空间就是由这一页说明在特定的信息集处如何行动,纯策略空间就是由这些书组成的图书馆;混合策略是这
17、些书上的一种概率分布,些书组成的图书馆;混合策略是这些书上的一种概率分布,即根据一定机制随机地在这些书中进行选择;一种行为策略即根据一定机制随机地在这些书中进行选择;一种行为策略则是一本书其中每一页说明了对应的若干行动中的随机选则是一本书其中每一页说明了对应的若干行动中的随机选择。择。二、子完美博弈均衡二、子完美博弈均衡(一)纳什均衡的缺陷(一)纳什均衡的缺陷空洞威胁空洞威胁 策略型可以用来表述任意复杂的扩展型博弈,从而策略型可以用来表述任意复杂的扩展型博弈,从而拓展了纳什均衡概念应用的范围。但是纳什均衡有些是拓展了纳什均衡概念应用的范围。但是纳什均衡有些是不合理的不合理的(泽尔滕指出,在扩展
18、型博弈的纳什均衡中有泽尔滕指出,在扩展型博弈的纳什均衡中有些是不合理的些是不合理的).扩展型博弈中的纳什均衡的实现依赖于局中人不合扩展型博弈中的纳什均衡的实现依赖于局中人不合理的理的“空洞威胁空洞威胁”,需要加以剔除,从而形成了子博弈完,需要加以剔除,从而形成了子博弈完美均衡的概念。美均衡的概念。空洞威胁空洞威胁空洞威胁:空洞威胁:发出威胁的局中人并不会真正实施这种策略,因为发出威胁的局中人并不会真正实施这种策略,因为这种策略对他来说不是最佳策略。这种策略对他来说不是最佳策略。如果你对竞争者说:你不给我馅饼市场的一半的话如果你对竞争者说:你不给我馅饼市场的一半的话我就在今后一年中免费发放馅饼,
19、让你一个都卖不出去,我就在今后一年中免费发放馅饼,让你一个都卖不出去,对手是不会相信你的这种威胁的因为实施威胁行动对威对手是不会相信你的这种威胁的因为实施威胁行动对威胁者自己来说损失巨大,得不偿失。胁者自己来说损失巨大,得不偿失。(二)子博弈完美均衡的定义(二)子博弈完美均衡的定义 为了剔除依赖空洞威胁的纳什均衡,要求均为了剔除依赖空洞威胁的纳什均衡,要求均衡策略在每个信息集上都是对于对手策略的最佳衡策略在每个信息集上都是对于对手策略的最佳反应,这样就避免了局中人利用非最佳反应策略反应,这样就避免了局中人利用非最佳反应策略来实施空洞威胁的情况,从而得出的均衡就是子来实施空洞威胁的情况,从而得出
20、的均衡就是子博弈完美均衡。博弈完美均衡。(三)子博弈完美均衡的求解(三)子博弈完美均衡的求解(三)子博弈完美均衡的求解(三)子博弈完美均衡的求解逆向归纳法逆向归纳法逆向归纳法逆向归纳法第一步,从扩展式博弈第一步,从扩展式博弈(博弈树博弈树)的终点开始,找到每一个最后子博弈的终点开始,找到每一个最后子博弈(它不再饱含任何它不再饱含任何其他更小的子博弈其他更小的子博弈)的纳什均衡,并计算出相应的收益。的纳什均衡,并计算出相应的收益。第二步,将每一个最后子博弈的起始点变成结束点,将计算出的每一个最后子博弈在第二步,将每一个最后子博弈的起始点变成结束点,将计算出的每一个最后子博弈在纳什均衡下的收益写在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 完全 信息 动态 博弈 10 PPT 课件
限制150内