博弈论—完全信息动态博弈.pptx
《博弈论—完全信息动态博弈.pptx》由会员分享,可在线阅读,更多相关《博弈论—完全信息动态博弈.pptx(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1第三章 完全信息动态博弈1.博弈的扩展式表述2.扩展式表述博弈的纳什均衡3.子博弈精炼纳什均衡 4.子博弈精炼纳什均衡应用举例5.重复博弈与民间定理(无名氏定理)第1页/共69页2 “完全信息”是指每个参与人对所有其他参与人的特征(战略空间、支付函数等)有完全的了解;“动态”是指所有参与人分先后选择行动且可能选择多次行动;“完全信息动态博弈”就是指每个参与人对所有其他参与人的特征(战略空间、支付函数等)有完全了解的前提下,分先后选择行动的博弈.手雷博弈:第一步:Tom要求Smith负1000$给自己,否则就引爆手中的手雷;第二步:Smith决定是否要负Tom1000$(要判断Tom所说话的可
2、 信度);第三步:Tom观察Smith的决定,然后决定是否要引爆手雷.在动态博弈中都有一个问题:可信任性问题第2页/共69页3 在上一章,我们利用战略式表述研究了完全信息静态博弈,并且作为静态博弈的解的概念,重点讨论了纳什均衡(NE).手雷博弈:第一步:Tom选择是否威胁要求Smith付1000$给自己,否则就引 爆手中的手雷;第二步:Smith决定是否要付Tom1000$(要判断Tom所说话的可 信度);第三步:Tom观察Smith的决定,然后决定是否要引爆手雷.该博弈的语言描述可以转化为一种很直观的表述结构:第3页/共69页4 这种结构称为博弈树,也称为博弈的扩展式表述.这是动态博弈分析中
3、最常用的表述方法.博弈的扩展式表述包含以下要素:注意:在这里没有提到战略,战略是选择行动时的策略TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)博弈的扩展式表述第4页/共69页5TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)博弈的扩展式表述的一般结构:结(nodes):分决策结和终点结,决策结是参与人采取行动的时 点,而终点结则是对应支付向 量的点.决策结终点结每一个决策结都只有
4、一个直接前列结(初始结除外),但可能有若干个直接后续结.博弈的扩展式表述第5页/共69页6TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)(2)枝(branches):是博弈树上一个 决策结到它的直接后续结的连 线或箭头,枝实际上是参与人 的一个行动选择.枝注意终点结不存在行动集合,只有支付组合初始结没有进入的枝;终点结没有出去的枝;每个中间的决策结只有一个进入的枝,但有多个出去的枝.博弈的扩展式表述第6页/共69页7(3)信息集(information sets)开发商A开发(4,4)
5、支付:(开发商A,开发商B)不开发自然N自然N大大小小开发商BBBB开发不开发 开发不开发 开发不开发 开发不开发(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)开发商博弈的行动次序:开发商A选择行动:开发、不开发;自然选择市场的大小:大、小;开发商B选择行动:开发、不开发;如果开发商B在决策之前清楚地知道开发商A和自然的选择,即参与人在轮到他决策时知道在他之前所发生的一切,这种情形下的每一个决策结属于一个信息集,即开发商B有四个信息集.只含有一个决策结的信息集成为单结信息集.如果博弈树中的信息集都是但单结的,则称为完美信息博弈,在完美信息博弈中,参与人在决策前都知道
6、自己处于哪个决策结.信息集开发商博弈(1)博弈的扩展式表述第7页/共69页8开发商A开发(4,4)支付:(开发商A,开发商B)不开发自然N自然N大大小小开发商BBBB开发不开发 开发不开发 开发不开发 开发不开发(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)但是如果开发商B在决策之前只知道A的选择,并不清楚自然的选择,此时对于B只有两个信息集,即B在决策前只知道自己处于哪个信息集,每个信息集有两个决策结,而开发商并不知道自己处于哪个决策结.开发商博弈(2)含有两个或以上的决策结的信息集称为多结信息集,含有多结信息集的博弈称为不完美信息博弈。不完美信息博弈中要求至少有
7、一方具有不完美信息。博弈的扩展式表述第8页/共69页9开发商A开发(4,4)支付:(开发商A,开发商B)不开发自然N自然N大大小小开发商BBBB开发不开发 开发不开发 开发不开发 开发不开发(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)还有一种情形时,开发商B在决策之前知道市场需求的大小,但并不知道开发商A的选择(如A,B同时选择),此时对于B仍然只有两个信息集,即B在决策前只知道自己处于哪个信息集,并且每个信息集也有两个决策结,而B不知道自己处于哪个决策结.开发商博弈(3)博弈的扩展式表述第9页/共69页10自然N大(4,4)支付:(开发商A,开发商B)小开发商A
8、开发商A开发开发不开发不开发开发商BBBB开发不开发 开发不开发 开发不开发 开发不开发(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)开发商博弈(4)将开发商博弈的行动顺序改变:由自然首先选择市场的大小,然后由开发商A开发商A行动前不知道自然的选择(市场的大小),开发商B在行动前知道市场的大小,但不知道开发商A的选择.博弈的扩展式表述第10页/共69页11博弈的扩展式表述第11页/共69页121UD22LLRR111完美记忆和不完美记忆NUD11LLRR2211参与人2的不完美信息集参与人1将第一步自己的选择忘记了参与人2的不完美信息集参与人1将第二步自己的选择忘记
9、了忘记自己选择的博弈称为不完美记忆博弈的扩展式表述第12页/共69页13 2.1 扩展式表述博弈的战略式表述战略式表述在博弈开始之前就制定了相机行动计划,即“如果.,我将选择.扩展式表述是相机行动,要等待博弈到达自己的信息集,然后再决定选择什么行动.TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)考虑手雷博弈是否存在纳什均衡扩展式表述的博弈如何求纳什均衡?先考虑该博弈的战略式表述方法:第13页/共69页14扩展式表述博弈的纳什均衡威胁,引爆Tom 威胁,不引爆不威胁 Smith 付 不付
10、(-10000,-10000)(0,0)(1000,-1000)(-100,0)(0,0)(-10000,-10000)手雷博弈的战略式表述TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)第一步Tom有两个纯战略:威胁,不威胁第二步在Tom选择“威胁时”Smith有 两个战略为:付,不付引爆,不引爆第三步在Smith选择“付”时Tom有 两个战略为:唯一的纳什均衡(不威胁,不付)第14页/共69页15(4,4)支付:(开发商A,开发商B)开发商A开发不开发开发商BB开发不开发 开发不开发
11、(8,0)(0,8)(0,0)开发商博弈开发商A的战略有两个:开发,不开发而开发商B的战略有四个:A开发我也开发;A开发我不开发;A不开发我开发;A不开发我不开发;开发商B的四个战略表示为开发,开发;开发,不开发;不开发,开发;不开发,不开发;注意行动和战略的区别战略是行动的准则扩展式表述博弈的纳什均衡第15页/共69页16(4,4)支付:(开发商A,开发商B)开发商A开发不开发开发商BB开发不开发 开发不开发(8,0)(0,8)(0,0)开发商博弈开发商开发商B开发开发,开发开发 开发开发,不开发不开发 不开发不开发,开发开发 不开发不开发,不开发不开发开发开发开发商开发商A 不开发不开发(
12、4,4)(4,4)(8,0)(8,0)(0,8)(0,8)(0,0)(0,0)这个战略式表述的博弈中有两个纯战略的纳什均衡:(开发,开发,开发),(开发,开发,不开发)对应的行动组合只有一个:(A开发,B也开发)但均衡(开发,开发,不开发)中B的均衡战略开发,不开发是不可信的.扩展式表述博弈的纳什均衡第16页/共69页17TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)支付:(Tom,Smith)手雷博弈123再考虑第二步:Smith知道第三步Tom会选择“不引爆”,因此比较了“付”和“不付”的支付后,Smith应
13、该选择“不付”最后考虑第一步:Tom知道Smith第二步会选择“不付”,因此Tom一开始就会选择“不威胁”因此可以得到该博弈的均衡(不威胁、不付、不引爆)这种从后面往前面推导的方法称为逆向归纳法我们先考虑第三步:Tom的行动“不引爆”比“引爆”更占优,Tom应该选择“不引爆”2.2 扩展式表述博弈的纳什均衡和逆向归纳法扩展式表述博弈的纳什均衡第17页/共69页18定理(Zermelo,1913;Kuhn,1953):一个有限完美信息博弈 至少有一个纯战略纳什均衡.如果一个扩展式博弈有有限个信息集,每个信息集上参与人有有限个行动选择,并且这个博弈是完美信息的,那么一定有一个纯战略纳什均衡,即这个
14、定理可是使用逆向归纳法解释.开发商博弈:假设这是一个有限完美信息博弈.自然N大(4,4)支付:(开发商A,开发商B)小开发商A开发商A开发开发不开发不开发开发商BBBB开发不开发 开发不开发 开发不开发 开发不开发(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)有均衡的结果:(市场需求大,A开发,B开发)(市场需求小,A开发,B不开发)扩展式表述博弈的纳什均衡第18页/共69页19将这两个纳什均衡写成战略组合形式有四个:(大,开发,开发,开发)(市场需求大,A开发,B开发)(市场需求小,A开发,B不开发)(小,开发,不开发,开发)(大,开发,开发,不开发)(小,开发,
15、不开发,不开发)战略组合(大,开发,开发,不开发),(小,开发,不开发,不开发)显然不合理,B的合理战略在市场需求大时为开发,开发,而在市场需求小时应为不开发,开发那么如何将不合理的纳什均衡剔除呢?扩展式表述博弈的纳什均衡第19页/共69页20自然N大(4,4)支付:(开发商A,开发商B)小开发商A开发商A开发开发不开发不开发开发商BBBB开发不开发 开发不开发 开发不开发 开发不开发(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)开发商博弈TomSmithTom不威胁威胁付不付引爆不引爆(0,0)(1000,-1000)(-10000,-10000)(-100,0)
16、支付:(Tom,Smith)手雷博弈3.子博弈精炼纳什均衡 3.1 子博弈子博弈非子博弈图例:第20页/共69页21自然N大(4,4)支付:(开发商A,开发商B)小开发商A开发商A开发开发不开发不开发开发商BBBB开发不开发 开发不开发 开发不开发 开发不开发(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)开发商博弈 如果开发商B在行动时不知道开发商A的选择,则开发商B有两个信息集,且每个信息集有两个决策结.子博弈非子博弈图例:定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的一部分,称为原动态
17、博弈的一个“子博弈”.子博弈精炼纳什均衡第21页/共69页22 条件(1)说明,“子博弈”的初始结x必定在原博弈的一个单结信息集中,即只有当参与人在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结.如果一个信息集包含两个以上的决策结,则这些决策结都不能作为子博弈的初始结.完美信息博弈由于所有信息集都是单结的,所以每个决策结都可以开始一个子博弈.条件(2)说明,“子博弈”中的信息集必须只含有子博弈中的决策结,并且结构与原博弈一致.子博弈精炼纳什均衡第22页/共69页233.2 子博弈精炼(完美)纳什均衡(4,4)支付:(开发商A,开发商B)开发商A开发不开发开发商
18、BB开发不开发 开发不开发(8,0)(0,8)(0,0)开发商博弈开发商博弈有两个纯战略的纳什均衡:(开发,开发,开发),(开发,开发,不开发)子博弈1子博弈2子博弈1的纳什均衡是开发商B“开发”子博弈2的纳什均衡也是开发商B“开发”在扩展式表述的动态博弈中,有的纳什均衡中可能会含有不可信的战略被选择,在前面的例子中我们已经发现,虽然这些战略构成的战略组合是纳什均衡,但就这些战略本身而言不符合参与人的自身利益.子博弈精炼纳什均衡第23页/共69页24 原博弈的另一个纳什均衡(开发,开发,不开发)中B的战略为开发,不开发,即A开发则B开发,A不开发则B也不开发,与子博弈2的纳什 均衡“开发”矛盾
19、.(开发,开发,开发)是既是原博弈也是子博弈的纳什均衡 原博弈的第一个纳什均衡(开发,开发,开发)中,B的战略是开发,开发,即不管A是否开发,都选择开发,即B的战略也是子博弈1和2的纳什均衡.(开发,开发,不开发)虽然什原博弈的纳什均衡,但并不是子博弈的纳什均衡,即这是一个不合理的均衡如何将扩展式博弈中博不合理的纳什均衡去除?子博弈精炼纳什均衡第24页/共69页25 子博弈精炼纳什均衡和纳什均衡的区别就在于子博弈精炼纳什均衡可以将含有不可信战略的纳什均衡排除.在开发商博弈中,纳什均衡(开发,开发,开发)是子博弈精炼纳什均衡,但(开发,开发,不开发)不是一个子博弈精炼纳什均衡.(开发,开发,开发
20、)也是原博弈中唯一可信的纯战略的纳什均衡子博弈精炼纳什均衡第25页/共69页26自然N大(4,4)支付:(开发商A,开发商B)小开发商A开发商A开发开发不开发不开发开发商BBBB开发不开发 开发不开发 开发不开发 开发不开发(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)开发商博弈(4,4)支付:(开发商A,开发商B)开发商A开发不开发开发商BB开发不开发 开发不开发(8,0)(0,8)(0,0)开发商博弈3.3 用逆向归纳法求完美信息博弈的子博弈精炼纳什均衡子博弈1子博弈2 使用逆向归纳法可以求出完全且完美信息动态博弈的纯战略的子博弈精炼纳什均衡.(开发,开发)(大
21、,开发,开发)和(小,开发,不开发)子博弈精炼纳什均衡第26页/共69页274.1 讨价还价博弈(一)Smith和Jones分100美圆.在谈判的第一回合中由Smith提出方案,由自己留下S1 美圆,出价费用为零,Jones或者接受(此时博弈结束)或者拒绝并转入第二回合;第二回合由Jones提出方案,出价费用为10美圆,Jones提出给Smith的数量为S2 美圆,Smith选择接受(此时博弈也结束)或拒绝并转入第三回合;第三回合再次由Smith提出方案,出价费用为c美圆,Smith提出自己留下S3美圆.讨价还价谈判最多只进行三轮,如果三轮都不能达成协议,则100$将全部给Jim.如何就不同的
22、出价费用c找到均衡的结果?(1)c=0;(2)c=80;(3)c=10;第27页/共69页28讨价还价博弈Smith 提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(S3-C,100-S3-10)(-C,-10)Smith JonesJonesSmith 提出给Smith为S2提出要求S3支付:(Smith,Jo nes)(1)(2)(3)应用逆向归纳法求解:首先考虑第三回合Smith提出自己留下100美圆Jones会接受再考虑第二回合Jones只能提出自己留下0美圆而给Smith100美圆,否则Smith一定是不接受(100,-10)(
23、0,-10)(100,-10)子博弈精炼纳什均衡应用举例第28页/共69页29最后考虑第一回合Smith提出自己留下100美圆,而Jones只能选择接受,不然第二回合还要出10美圆的出价费用讨价还价博弈Smith 提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(S3-C,100-S3-10)(-C,-10)Smith JonesJonesSmith 提出给Smith为S2提出要求S3支付:(Smith,Jo nes)(1)(2)(3)(100,-10)(0,-10)(100,-10)(100,0)子博弈精炼纳什均衡应用举例第29页/共69
24、页30讨价还价博弈Smith 提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-10)(S3-C,100-S3-10)(-C,-10)Smith JonesJonesSmith 提出给Smith为S2提出要求S3支付:(Smith,Jo nes)(1)(2)(3)首先考虑第三回合Smith提出自己留下100美圆Jones会接受再考虑第二回合Jones只能提出自己留下80美圆而给Smith20美圆,否则Smith一定是不接受(20,-10)(-80,-10)(20,70)子博弈精炼纳什均衡应用举例第30页/共69页31最后考虑第一回合Smith提出自
25、己留下30美圆,而Jones只能选择接受,不然第二回合还要出10美圆的出价费用讨价还价博弈Smith 提出要求S1Jones接受不接受接受不接受接受不接受 (S1,100-S1)(S2,100-S2-10)(100,-10)(0,-10)Smith JonesJonesSmith 提出给Smith为S2提出要求S3支付:(Smith,Jo nes)(20,70)(30,70)(1)(2)(3)(20,-10)(-80,-10)子博弈精炼纳什均衡应用举例第31页/共69页32讨价还价博弈Smith 提出要求S1Jones接受不接受接受不接受接受不接受(S1,100-S1)(S2,100-S2-1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 完全 信息 动态 博弈
限制150内