第三章-完全信息动态博弈.ppt
《第三章-完全信息动态博弈.ppt》由会员分享,可在线阅读,更多相关《第三章-完全信息动态博弈.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、“同时”是一个信息概念,而不是一个时间概念。一、一、动态博弈与静态博弈的区别动态博弈与静态博弈的区别静态博弈:静态博弈:所有局中人所有局中人同时同时行动;或行动虽有先后,但没行动;或行动虽有先后,但没有人在自己行动之前观测到别人的行动。有人在自己行动之前观测到别人的行动。动态博弈:动态博弈:局中人分先后行动;后行动者的决策依赖于先局中人分先后行动;后行动者的决策依赖于先行动者,先行动者的决策要考虑对后行动者的影响;行动者,先行动者的决策要考虑对后行动者的影响;动态博弈例子:动态博弈例子:下棋;下棋;商业大战,各商家轮流出新招;商业大战,各商家轮流出新招;商业谈判、讨价还价;商业谈判、讨价还价;
2、1动态博弈及其表示动态博弈及其表示第三章第三章完全信息动态博弈完全信息动态博弈二、二、静态博弈的静态博弈的Nash均衡的缺陷均衡的缺陷(1)可能存在多个解,如何选择?)可能存在多个解,如何选择?(2)Nash均衡,不考虑自己的选择如何影响对手的均衡,不考虑自己的选择如何影响对手的策略。但事实上,有些问题局中人行动有先后:一策略。但事实上,有些问题局中人行动有先后:一人行动在先,另一人在后,则后者会根据前者的行人行动在先,另一人在后,则后者会根据前者的行动调整自己的策略,而前者自然会理性的预期到这动调整自己的策略,而前者自然会理性的预期到这一点,故不可能不考虑自己的选择如何影响对手的一点,故不可
3、能不考虑自己的选择如何影响对手的策略。策略。(3)Nash均衡允许了不可置信威胁的存在。均衡允许了不可置信威胁的存在。例如,姑娘、小伙子谈对象,女方父亲不同意的例如,姑娘、小伙子谈对象,女方父亲不同意的“断绝父女关系断绝父女关系”的威胁。的威胁。例:市场进入阻挠例:市场进入阻挠一个垄断企业已在市场上(称为“在位者”),另一个企业虎视眈眈想进入(称为“进入者”)。若按静态博弈分析方法:1,101,10不进入不进入-2,35,5进入进入进进入入者者斗争斗争默许默许在位者在位者思考:思考:若进入者真的进入,在位者的最优行动是若进入者真的进入,在位者的最优行动是“默许默许”。所以所以“斗争斗争”是一种
4、不可置信的威胁(即使在位企业摆出是一种不可置信的威胁(即使在位企业摆出一副一副“你进入我就斗争你进入我就斗争”的架势,进入企业不应被吓到)。的架势,进入企业不应被吓到)。而静态博弈承认这种不可置信的威胁,使(不进入,斗争)而静态博弈承认这种不可置信的威胁,使(不进入,斗争)成为一个成为一个Nash均衡。均衡。动态博弈解决方案:剔除不可置信的威胁策略动态博弈解决方案:剔除不可置信的威胁策略扩展阅读:扩展阅读:不可置信的威胁策略不可置信的威胁策略引出信息经济学重要的概念引出信息经济学重要的概念承诺行动承诺行动(Commitment)。承诺行动使承诺行动使不可置信威胁不可置信威胁可信威胁,否则,当事
5、人将为可信威胁,否则,当事人将为自己的自己的“失信失信”付出成本。付出成本。例如,该例中,在位者与某第三者打赌,如果进入者进入例如,该例中,在位者与某第三者打赌,如果进入者进入后他不斗争,他就付给后者后他不斗争,他就付给后者3,这时,斗争成为可置信的,这时,斗争成为可置信的威胁。因为如果进入后,选择默许,收益更小。注意:有威胁。因为如果进入后,选择默许,收益更小。注意:有了这个赌,进入者就不敢进入了,实际上,在位者无需支了这个赌,进入者就不敢进入了,实际上,在位者无需支付赌注。付赌注。承诺行动在军事博弈中有广泛应用。例如,承诺行动在军事博弈中有广泛应用。例如,项羽的项羽的项羽的项羽的“破釜破釜
6、破釜破釜沉舟沉舟沉舟沉舟”、韩信赵国之战,韩信赵国之战,韩信赵国之战,韩信赵国之战,“置之死地而后生置之死地而后生置之死地而后生置之死地而后生”。进进入入者者在位者在位者默许默许斗争斗争进入进入不进入不进入5,5-2,31,101,10 例例 房地房地产产开开发发博弈博弈有两个房地有两个房地产产开开发发商(分商(分别为别为局中人局中人1,记记为为A和局中人和局中人2,记为记为B)在某地开)在某地开发发房地房地产产,(1)开开发发商商1先行先行动动,选择选择开开发发或不开或不开发发;(2)开开发发商商2在在 观测观测到到1的决策和市的决策和市场场的需求后的需求后,再决定开再决定开发发 或不开或不
7、开发发。三、三、动态博弈的相关概念动态博弈的相关概念(1)行动行动(actions):局中人在博弈的某个时间):局中人在博弈的某个时间点的决策变量。记为点的决策变量。记为ai。Ai=ai表示局中人表示局中人 i的行的行动动集合。集合。n个局中人的行个局中人的行动动的有序的有序组组a=ai,an称称为为行行动组动组合合。与行与行动动相关的一个重要相关的一个重要问题问题是是行行动顺动顺序序。同同样样的的局中人,同局中人,同样样的行的行动动集合,行集合,行动顺动顺序不同,博弈的序不同,博弈的结结果就不同。果就不同。三、三、动态博弈的相关概念动态博弈的相关概念(2)信息信息(information):
8、局中人有关博弈的知):局中人有关博弈的知识,特别是有关识,特别是有关“自然自然”的选择、其他局中人的特的选择、其他局中人的特征和行动的知识。征和行动的知识。信息集信息集:一个局中人无法准确知道的:一个局中人无法准确知道的变变量的全体。量的全体。例如例如,已知某市,已知某市场场自然状自然状态态有有“大大”和和“小小”两种可两种可能。如果能。如果A不知道市不知道市场场需求是大需求是大还还是小,而是小,而B知道;知道;那么,那么,A的信息集的信息集为为大,小大,小,而,而B的信息集的信息集为为大大或或小小。又如又如,上例中,如果,上例中,如果进进入者先行入者先行动动,而在位者在,而在位者在行行动动前
9、能准确知道前者的行前能准确知道前者的行动动,那么在位者的信息,那么在位者的信息集集为为 进进入入或或不不进进入入。反之,若在位者先行反之,若在位者先行动动,则则在位者的信息集在位者的信息集为为进进入,不入,不进进入入。三、三、动态博弈的相关概念动态博弈的相关概念(3)完美信息完美信息(Perfectinformation):一个局中人在行动):一个局中人在行动时,对之前博弈进程有准确了解,即每一个信息集只包含时,对之前博弈进程有准确了解,即每一个信息集只包含一个值,则称该局中人具有完美信息。一个值,则称该局中人具有完美信息。如果动态博弈的所有局中人都有完美信息,则称为如果动态博弈的所有局中人都
10、有完美信息,则称为完美信完美信息的动态博弈息的动态博弈。如果动态博弈中,存在部分局中人具有不完美信息,称为如果动态博弈中,存在部分局中人具有不完美信息,称为不完美信息的动态博弈不完美信息的动态博弈。注:若所有局中人都只有一次性行为选择,且都具有注:若所有局中人都只有一次性行为选择,且都具有不完不完美信息,则可看成静态博弈。美信息,则可看成静态博弈。完全信息完全信息(Completeinformation):各局中人都完全):各局中人都完全了解所有局中人各种情况下得益,称为了解所有局中人各种情况下得益,称为完全信息博弈完全信息博弈。否则,至少部分局中人不完全了解其他局中人得益情况,否则,至少部分
11、局中人不完全了解其他局中人得益情况,称为称为不完全信息博弈不完全信息博弈(非对称信息)。(非对称信息)。三、三、动态博弈的相关概念动态博弈的相关概念(4)策略策略(strategy):局中人在给定信息集情况下的行动:局中人在给定信息集情况下的行动规则,它规定局中人在何时选择合行动。规则,它规定局中人在何时选择合行动。房地房地产产开开发发例中,如果例中,如果A先行先行动动,B后行后行动动,则则A有两个策略有两个策略 SA=开开发发,不开,不开发发,B有四个策略有四个策略 SB=(开(开发发,开,开发发),(开(开发发,不开,不开发发),(不开(不开发发,开开发发),),(不开(不开发发,不开,不
12、开发发),其中每个策略(其中每个策略(x,y)中的中的x表示表示A选择选择“开开发发”时时,B的行的行动动;y表示表示A选择选择“不开不开发发”时时,B的行的行动动。注:注:静静态态博弈中,策略和行博弈中,策略和行动动是相同的。是相同的。动态动态博弈中,二者不同:策略是行博弈中,二者不同:策略是行动动的的规则规则,而非行,而非行动动本身。例如,房地本身。例如,房地产产开开发发中,中,“开开发发”和和“不开不开发发”是两种行是两种行动动,而策略要而策略要说说明什么明什么时时候采取什么行候采取什么行动动。再如。再如“人不犯我我不犯人不犯我我不犯人,人若犯我我必犯人人,人若犯我我必犯人”是一种策略,
13、而行是一种策略,而行动动只有只有“犯犯”和和“不犯不犯”。四、四、动态博弈的扩展式表达动态博弈的扩展式表达动态博弈的扩展式表达的动态博弈的扩展式表达的要素要素:局中人的局中人的集合集合,记为记为 i=1,2,n;行行动动的次序的次序,即即谁谁在什么在什么时时候行候行动动;局中人的行局中人的行动动空空间间,即即轮轮到某局中人行到某局中人行动时动时,他从他从该时该时刻刻的的纯纯策略空策略空间间中中选选取什么策略取什么策略;当局中人作出他当局中人作出他们们的行的行动动决策决策时时,他所他所观测观测到到 或他所了或他所了解到的信息解到的信息,即他在此即他在此时获时获得的信息得的信息 集合集合;局中人的
14、得益局中人的得益(支付或效用支付或效用),它它们们是已知行是已知行动动的函数的函数;外生事件(即自然的外生事件(即自然的选择选择)的概率分布。)的概率分布。(完全信息(完全信息条件下,无需条件下,无需该该要素。)要素。)回顾:静态博弈的回顾:静态博弈的“策略式策略式”表达,包括三个要素:表达,包括三个要素:局中人、策略集、赢得函数。局中人、策略集、赢得函数。动态博弈在此基础上,动态博弈在此基础上,需扩充行动时间点、历史信息等要素。需扩充行动时间点、历史信息等要素。动态博弈的扩展式表达动态博弈的扩展式表达博弈树博弈树博弈树的博弈树的优点优点:可描述多人对策问题(赢得矩阵只能表示二人对策)可描述多
15、人对策问题(赢得矩阵只能表示二人对策);便于描述行动的次序便于描述行动的次序;博弈树的博弈树的缺点缺点:只能描述有限策略集对策。只能描述有限策略集对策。例如:市场进入阻挠问题例如:市场进入阻挠问题ABB进入进入不进入不进入默许默许斗争斗争(5,5)(-2,3)默许默许斗争斗争进入进入不进入不进入5,5-2,31,101,10(1,10)例例房地产开发博弈房地产开发博弈 有两个房地有两个房地产产开开发发商商(分分别为别为A和和B)在某地开在某地开发发房地房地产产,(1)开开发发商商A先行先行动动,选择选择开开发发或不开或不开发发;(2)开开发发商商B在在 观测观测到到A的决策后的决策后,再决定开
16、再决定开发发或不开或不开发发。博弈。博弈树树如下如下图图。ABB开开不不开开不不开开不不(-3,-3)(1,0)(0,1)(0,0)注:所有注:所有n个局中人的一个纯策略组合决定了博弈树上的一个局中人的一个纯策略组合决定了博弈树上的一条路径。但每条路径可由不同的策略组合决定。条路径。但每条路径可由不同的策略组合决定。例如,例如,(开发(开发,(不开发不开发,开发开发))决定了)决定了A-开发开发-B-不开发不开发-(1,0)该路径还可由(开发该路径还可由(开发,(不开发不开发,不开发不开发))决定。)决定。事实上,该问题共有事实上,该问题共有4条路径,条路径,8种策略组合。种策略组合。对于动态
17、博弈,对于动态博弈,Nash均衡可能并不是一个合理的预测。均衡可能并不是一个合理的预测。如房地产博弈如房地产博弈:ABB开开不不开开不不开开不不(-3,-3)(1,0)(0,1)(0,0)的的策策略略式式表表示示为为:(开开,开开)(开开,不不)(不不,开开)(不不,不不)开开-3,-3-3,-31,01,0不不0,10,00,10,0局中人局中人B局中人局中人A2子博弈精炼纳什均衡子博弈精炼纳什均衡 由由划线法法划线法法可可得得三三个个纯纯策策略略Nash均均衡衡:ABB开开不不开开不不开开不不(-3,-3)(1,0)(0,1)(0,0)(开开,开开)(开开,不不)(不不,开开)(不不,不不
18、)开开-3,-3-3,-31,01,0不不0,10,00,10,0参参与与人人B参参与与人人A但但(不开发(不开发,(开发,开发开发,开发))是不合理的)是不合理的,这个威胁是不这个威胁是不可置可置信的信的;(开发(开发,(不开发不开发,不开发不开发))也不合理)也不合理,因为因为若若A不开发不开发,B显然应该开发显然应该开发;只有(开发只有(开发,(不开发不开发,开发开发))是一)是一个合理的均衡。个合理的均衡。有子博弈:和子博弈:ABB开开不不开开不不开开不不XXBx开开不不BX开开不不例 房 地 产 博 弈一、子一、子博博弈的定弈的定义义给定历史,从每一个行动选择开始至博弈结束又构成给定
19、历史,从每一个行动选择开始至博弈结束又构成一个博弈,称为一个博弈,称为子子博博弈。弈。二、二、子博弈精炼纳什均衡子博弈精炼纳什均衡定定义义 扩扩展式博弈的策略展式博弈的策略组组合合s*=(s1*,si*,sn*)是是一个一个 子博弈精子博弈精炼炼Nash均衡均衡,如果如果满满足足:(1)它它 是原博弈是原博弈的的Nash均衡均衡;(2)它在每一个子博弈上它在每一个子博弈上 给给出出Nash均衡。均衡。房地产开发中,房地产开发中,子博弈子博弈I和和属于单人博弈,子博弈属于单人博弈,子博弈I中,中,B的的最优选择是不开发,子博弈最优选择是不开发,子博弈中,中,B的最优选择是开发,因此:的最优选择是
20、开发,因此:(1)(不开发)(不开发,(开发,开发开发,开发))在子博弈)在子博弈I上不构成上不构成Nash均均衡;衡;(2)(开发)(开发,(不开发不开发,不开发不开发))在子博弈)在子博弈上不构成上不构成Nash均均衡;衡;(3)(开发)(开发,(不开发不开发,开发开发))在所有子博弈上都构成)在所有子博弈上都构成Nash均均衡,是衡,是子博弈精炼子博弈精炼Nash均衡。均衡。ABB开开不不开开不不开开不不(-3,-3)(1,0)(0,1)(0,0)I例例(Selten)12(2,2)(3,1)(0,0)UDLRLRU2,22,2D3,10,0该博弈有两个该博弈有两个Nash均衡:均衡:(
21、U,R)和()和(D,L)但但Nash均衡均衡(U,R)从动态博弈的观点来看是不合从动态博弈的观点来看是不合理的理的,因为它依赖于局中人因为它依赖于局中人2取取R这一这一“空头威胁空头威胁”。三、三、逆向归纳法求解子博弈精炼逆向归纳法求解子博弈精炼NashNash均衡均衡从动态博弈的最后一个阶段局中人的行为开始分析,从动态博弈的最后一个阶段局中人的行为开始分析,逐步倒推回前一个阶段相应局中人的行为选择,一直逐步倒推回前一个阶段相应局中人的行为选择,一直到第一个阶段。到第一个阶段。逆推归纳到某个阶段,可以用不包括该阶段与其后逆推归纳到某个阶段,可以用不包括该阶段与其后所有阶段博弈的等价博弈来简化
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 完全 信息 动态 博弈
限制150内