博弈论完全信息动态博弈.ppt
《博弈论完全信息动态博弈.ppt》由会员分享,可在线阅读,更多相关《博弈论完全信息动态博弈.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、博 弈 论,Game Theory,江西财经大学数学与管理工程系 华长生 H 0791-3816092 江西南昌(330013),2,华长生制作,第三章 完全信息动态博弈,1. 博弈的扩展式表述 2. 扩展式表述博弈的纳什均衡 3. 子博弈精炼纳什均衡 4. 子博弈精炼纳什均衡应用举例 5. 重复博弈与民间定理(无名氏定理),3,华长生制作,“完全信息”是指每个参与人对所有其他参与人的特征 (战略空间、支付函数等)有完全的了解;,“动态”是指所有参与人分先后选择行动且可能选择多 次行动;,“完全信息动态博弈”就是指每个参与人对所有其他参 与人的特征(战略空间、支付函数等)有完全了解的前提下,
2、分先后选择行动的博弈.,手雷博弈: 第一步:Tom要求Smith负1000$给自己,否则就引爆手中的手雷; 第二步:Smith决定是否要负Tom1000$(要判断Tom所说话的可 信度); 第三步:Tom观察Smith的决定,然后决定是否要引爆手雷.,在动态博弈中都有一个问题:可信任性问题,4,华长生制作,1.博弈的扩展式表述,在上一章,我们利用战略式表述研究了完全信息静态博 弈,并且作为静态博弈的解的概念,重点讨论了纳什均衡(NE).,手雷博弈: 第一步:Tom选择是否威胁要求Smith付1000$给自己,否则就引 爆手中的手雷; 第二步:Smith决定是否要付Tom1000$(要判断Tom
3、所说话的可 信度); 第三步:Tom观察Smith的决定,然后决定是否要引爆手雷.,该博弈的语言描述可以转化为一种很直观的表述结构:,5,华长生制作,这种结构称为博弈树,也称为 博弈的扩展式表述.这是动态博弈 分析中最常用的表述方法.,博弈的扩展式表述包含以下要素:,注意:在这里没有提到战略,战略是选择行动时的策略,博弈的扩展式表述,6,华长生制作,博弈的扩展式表述的一般结构:,结(nodes): 分决策结和终点结, 决策结是参与人采取行动的时 点 , 而终点结则是对应支付向 量的点 .,每一个决策结都只有一个直接前列结(初始结除外), 但可能有若干个直接后续结.,博弈的扩展式表述,7,华长生
4、制作,(2) 枝(branches): 是博弈树上一个 决策结到它的直接后续结的连 线或箭头, 枝实际上是参与人 的一个行动选择.,注意终点结不存在行动集合,只有支付组合,初始结没有进入的枝;终点结没有出去的枝; 每个中间的决策结只有一个进入的枝,但有多个出去的枝.,博弈的扩展式表述,8,华长生制作,(3) 信息集(information sets),开发商博弈的行动次序: 开发商A选择行动: 开发、不开发; 自然选择市场的大小: 大、小; 开发商B选择行动: 开发、不开发;,如果开发商B在决策 之前清楚地知道开发商A 和自然的选择,即参与人在轮到他决策时知道在他之前所发生 的一切,这种情形下
5、的每一个决策结属于一个信息集,即开发商 B有四个信息集.只含有一个决策结的信息集成为单结信息集 . 如果博弈树中的信息集都是但单结的,则称为完美信息博弈, 在完美信息博弈中,参与人在决策前都知道自己处于哪个决 策结.,信息 集,开发商博弈(1),博弈的扩展式表述,9,华长生制作,但是如果开发商B在决 策之前只知道A的选择,并不 清楚自然的选择 , 此时对于 B只有两个信息集,即B在决 策前只知道自己处于哪个信 息集,每个信息集有两个决策 结,而开发商并不知道自己处 于哪个决策结.,开发商博弈(2),含有两个或以上的决策结的信息集称为多结信息集,含有 多结信息集的博弈称为不完美信息博弈。不完美信
6、息博弈中要 求至少有一方具有不完美信息。,博弈的扩展式表述,10,华长生制作,还有一种情形时,开发 商B在决策之前知道市场 需求的大小, 但并不知道开 发商A的选择(如A,B同时选 择), 此时对于B仍然只有两 个信息集,即B在决策前只知 道自己处于哪个信息集, 并 且每个信息集也有两个决策 结,而B不知道自己处于哪个 决策结.,开发商博弈(3),博弈的扩展式表述,11,华长生制作,开发商博弈(4),将开发商博弈的行动 顺序改变:由自然首先选 择市场的大小,然后由开 发商A选择是否开发.并且 开发商A行动前不知道自 然的选择(市场的大小), 开发商B在行动前知道市 场的大小,但不知道开发 商A
7、的选择.,博弈的扩展式表述,12,华长生制作,博弈的扩展式表述,13,华长生制作,完美记忆和不完美记忆,参与人2的 不完美信息集,参与人1将 第一步自己的选择忘记了,参与人2的 不完美信息集,参与人1将 第二步自己的选择忘记了,忘记自己 选择的博 弈称为不 完美记忆,博弈的扩展式表述,14,华长生制作,2.扩展式表述博弈的纳什均衡,2.1 扩展式表述博弈的战略式表述,战略式表述在博弈开始之前就制定 了相机行动计划 ,即“如果.,我将 选择.,扩展式表述是相机行动,要等待博 弈到达自己的信息集,然后再决定 选择什么行动 .,考虑手雷博弈是否存在纳什均衡,扩展式表述的博弈如何求纳什均衡?,先考虑该
8、博弈的战略式表述方法:,15,华长生制作,扩展式表述博弈的纳什均衡,第一步Tom有两个纯战略:,威胁,不威胁,第二步在Tom选择“威胁时”Smith有 两个战略为:,付,不付,引爆,不引爆,第三步在Smith选择“付”时Tom有 两个战略为:,唯一的纳什均衡 (不威胁,不付),16,华长生制作,开发商A的战略有两个:,开发,不开发,而开发商B的战略有四个:,A开发我也开发; A开发我不开发; A不开发我开发; A不开发我不开发;,开发商B的四个战略表示为,开发,开发;开发,不开发;不开发,开发; 不开发,不开发;,注意行动和战略的区别 战略是行动的准则,扩展式表述博弈的纳什均衡,17,华长生制
9、作,这个战略式表述的博弈中有两个 纯战略的纳什均衡:,(开发,开发,开发), (开发,开发,不开发),对应的行动组合只有一个:,(A开发,B也开发),但均衡(开发,开发,不开发)中B的均衡 战略开发,不开发是不可信的.,扩展式表述博弈的纳什均衡,18,华长生制作,再考虑第二步:,Smith知道第三步Tom会选择“不 引爆”,因此比较了“付”和“不付”的 支付后,Smith应该选择“不付”,最后考虑第一步:,Tom知道Smith第二步会选择 “不付”,因此Tom一开始就会 选择“不威胁”,因此可以得到该博弈的均衡,(不威胁、不付、不引爆),这种从后面往前面推导的 方法称为逆向归纳法,我们先考虑第
10、三步:,Tom的行动“不引爆”比“引爆”更 占优,Tom应该选择“不引爆”,2.2 扩展式表述博弈的纳什均衡和逆向归纳法,扩展式表述博弈的纳什均衡,19,华长生制作,定理 (Zermelo,1913;Kuhn,1953):一个有限完美信息博弈 至少有一个纯战略纳什均衡.,如果一个扩展式博弈有有限个信息集 , 每个信息集上参 与人有有限个行动选择,并且这个博弈是完美信息的,那么一定 有一个纯战略纳什均衡,即,这个定理可是使用逆向 归纳法解释.,开发商博弈 : 假设这是 一个有限完美信息博弈.,自然N,大,(4,4),支付:(开发商A,开发商B),小,开发商A,开发商A,开发,开发,不开发,不开发
11、,开发商B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(8,0),(0,8),(0,0),(-3,-3),(1,0),(0,1),(0,0),有均衡的结果:,(市场需求大,A开发,B开发),(市场需求小,A开发,B不开发),扩展式表述博弈的纳什均衡,20,华长生制作,将这两个纳什均衡写成战略组合形式有四个:,(大,开发,开发,开发),(市场需求大,A开发,B开发),(市场需求小,A开发,B不开发),(小,开发,不开发,开发),(大,开发,开发,不开发),(小,开发,不开发,不开发),战略组合(大,开发,开发,不开发), (小,开发,不开发,不开发) 显然不合理,B的合
12、理战略在市场需求大时为开发,开发,而在 市场需求小时应为不开发,开发,那么如何将不合理的纳什均衡剔除呢?,扩展式表述博弈的纳什均衡,21,华长生制作,3.子博弈精炼纳什均衡,3.1 子博弈,22,华长生制作,如果开发商B在行 动时不知道开发商A的 选择,则开发商B有两个 信息集 , 且每个信息集 有两个决策结.,定义 : 由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和进 行博弈所需要的全部信 息,能够自成一个博弈的 一部分,称为原动态博弈 的一个“子博弈”.,子博弈精炼纳什均衡,23,华长生制作,条件(1)说明,“子博弈”的初始结x必定在原博弈的一个 单结信息
13、集中,即只有当参与人在原博弈中确切地知道博弈 进入一个特定的决策结时,该决策结才能作为一个子博弈的 初始结 . 如果一个信息集包含两个以上的决策结, 则这些决 策结都不能作为子博弈的初始结.,完美信息博弈由于所有信息集都是单结的,所以每个决 策结都可以开始一个子博弈.,条件(2)说明,“子博弈”中的信息集必须只含有子博弈中 的决策结,并且结构与原博弈一致.,子博弈精炼纳什均衡,24,华长生制作,3.2 子博弈精炼(完美)纳什均衡,开发商博弈有两个纯战略的纳什均衡:,(开发,开发,开发), (开发,开发,不开发),子博弈1,子博弈2,子博弈1的纳什均衡是开发商B “开发”,子博弈2的纳什均衡也是
14、开发商B “开发”,在扩展式表述的动态博弈中, 有的纳什均衡中可能会含有不可 信的战略被选择,在前面的例子中 我们已经发现,虽然这些战略构成 的战略组合是纳什均衡,但就这些 战略本身而言不符合参与人的自 身利益.,子博弈精炼纳什均衡,25,华长生制作,原博弈的另一个纳什均衡(开发,开发,不开发)中B的 战略为开发,不开发,即A开发则B开发,A不开发则B也不 开发,与子博弈2的纳什 均衡“开发”矛盾.,(开发,开发,开发)是既是原博弈也是子博弈的纳什均衡,原博弈的第一个纳什均衡(开发,开发,开发)中,B的 战略是开发,开发,即不管A是否开发,都选择开发,即B的 战略也是子博弈1和2的纳什均衡.,
15、(开发,开发,不开发)虽然什原博弈的纳什均衡,但并 不是子博弈的纳什均衡,即这是一个不合理的均衡,如何将扩展式博弈中博不合理的纳什均衡去除?,子博弈精炼纳什均衡,26,华长生制作,子博弈精炼纳什均衡和纳什均衡的区别就在于子博弈 精炼纳什均衡可以将含有不可信战略的纳什均衡排除.,在开发商博弈中,纳什均衡(开发,开发,开发)是子博弈 精炼纳什均衡,但(开发,开发,不开发)不是一个子博弈精炼 纳什均衡. (开发,开发,开发)也是原博弈中唯一可信的纯战略的 纳什均衡,子博弈精炼纳什均衡,27,华长生制作,3.3 用逆向归纳法求完美信息博弈的子博弈精炼纳什均衡,子博弈1,子博弈2,使用逆向归纳法可以求出
16、完全且完美信息动态博弈的纯 战略的子博弈精炼纳什均衡.,(开发,开发),(大,开发,开发) 和(小,开发,不开发),子博弈精炼纳什均衡,28,华长生制作,4.1 讨价还价博弈(一),Smith和Jones分100美圆 . 在谈判的第一回合中由Smith 提出方案,由自己留下S1 美圆,出价费用为零,Jones或者接受 (此时博弈结束) 或者拒绝并转入第二回合;第二回合由Jones 提出方案,出价费用为10美圆, Jones提出给Smith的数量为S2 美圆, Smith选择接受(此时博弈也结束)或拒绝并转入第三回 合;第三回合再次由Smith提出方案,出价费用为c美圆, Smith 提出自己留
17、下S3美圆.讨价还价谈判最多只进行三轮,如果三 轮都不能达成协议,则100$将全部给Jim. 如何就不同的出价费用c找到均衡的结果? (1) c=0; (2) c=80; (3) c=10;,4.子博弈精炼纳什均衡应用举例,29,华长生制作,(1),(2),(3),应用逆向归纳法求解:,首先考虑第三回合,Smith提出自己留下100美圆 Jones会接受,再考虑第二回合,Jones只能提出自己留下0美圆 而给Smith100美圆,否则Smith 一定是不接受,(100,-10),(0,-10),(100,-10),子博弈精炼纳什均衡应用举例,30,华长生制作,最后考虑第一回合,Smith提出自
18、己留下100美圆, 而Jones只能选择接受,不然第 二回合还要出10美圆的出价 费用,(1),(2),(3),(100,-10),(0,-10),(100,-10),(100,0),子博弈精炼纳什均衡应用举例,31,华长生制作,(1),(2),(3),首先考虑第三回合,Smith提出自己留下100美圆 Jones会接受,再考虑第二回合,Jones只能提出自己留下80美圆 而给Smith20美圆,否则Smith 一定是不接受,(20,-10),(-80,-10),(20,70),子博弈精炼纳什均衡应用举例,32,华长生制作,最后考虑第一回合,Smith提出自己留下30美圆, 而Jones只能选
19、择接受,不然第 二回合还要出10美圆的出价 费用,(20,70),(30,70),(1),(2),(3),(20,-10),(-80,-10),子博弈精炼纳什均衡应用举例,33,华长生制作,(1),(2),(3),首先考虑第三回合,Smith提出自己留下100美圆 Jones会接受,再考虑第二回合,Jones只能提出自己留下10美圆 而给Smith90美圆,否则Smith 一定是不接受,(90,-10),(-10,-10),(90,0),子博弈精炼纳什均衡应用举例,34,华长生制作,最后考虑第一回合,Smith提出自己留下100美圆, 而Jones只能选择接受,不然第 二回合还要出0美圆的出价
20、 费用,(100,0),(90,0),(1),(2),(3),(90,-10),(-10,-10),子博弈精炼纳什均衡应用举例,35,华长生制作,思考: 1. 如果Jones是一个非常情绪化的人,博弈的结果会如何?,将4.1中的讨价还价博弈的条件改变如下:Smith和Jones 分100美圆 . 谈判的次序与讨价还价一样,出价费用都是零, 但是每一回合谈判后,总资金的价值都会降低,贴现因子为, 即 第一回合如果Jones选择拒绝,第二回合由Jones给Smith的 数量为S2 , 自己留下100- S2 , 但二人实际所得分别为S2 和 (100-S2 ) ,依此类推,此博弈得均衡结果如何?
21、(贴现),子博弈精炼纳什均衡应用举例,36,华长生制作,4.2 讨价还价博弈(二),一个公司的管理层和工会之间的关系往往比较紧张,经常 为利益的分配或薪水问题进行谈判,双方以裁员或罢工相威胁, 甚至有时会贻误商机 .,我们设想有一家拥有自然资源的公司比如一家夏季度假 酒店,每年只有101的旺季,其他时间没有客人.在旺季中每开门 营业一天酒店就赚取1000$的利润,但在旺季开始之际,管理层 与工会之间就利益分配问题发生纠纷而进行谈判.工会首先提 出自己的要求,管理层要么同意,要么不同意并且于第二天提出 反建议.酒店只能在达成协议后才能开业.,分析谈判能否达成双方都接受的协议(纳什均衡)?,我们依
22、然使用逆向归纳法.,子博弈精炼纳什均衡应用举例,37,华长生制作,1 2 3 4 5 100 101,工会 管理层 工会 管理层 工会 管理层 工会,1000 1000 0 0 1000 500 1000 500 2000 667 1000 333 2000 500 2000 500 3000 600 2000 400 50000 500 50000 500 51000 505 50000 495,子博弈精炼纳什均衡为工会每天获得505$,管理层获得495$.,工会每一次提出建议都具有一个优势, 因为它是最后一个提出建议的一方.,子博弈精炼纳什均衡应用举例,38,华长生制作,思考: 1. 如果
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 完全 完整 彻底 信息 动态 博弈
限制150内