第十一章博弈模型ppt课件.ppt
《第十一章博弈模型ppt课件.ppt》由会员分享,可在线阅读,更多相关《第十一章博弈模型ppt课件.ppt(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。第十一章第十一章 博弈模型博弈模型11.1 进攻与撤退的抉择进攻与撤退的抉择11.2 让报童订购更多的报纸让报童订购更多的报纸11.3 “一口价一口价”的战略的战略 11.4 不患寡而患不均不患寡而患不均 11.5 效益的合理分配效益的合理分配 11.6 加权投票中权力的度量加权投票中权力的度量 严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。单一决策主体单一决策主体决策变量决策变量目标函数目标函数约束条件约束条件决策主
2、体的决策决策主体的决策行为发生直接相行为发生直接相互作用互作用(相互影响相互影响)博弈模型博弈模型非合作博弈非合作博弈合作博弈合作博弈三要素三要素博弈模型博弈模型(Game Theory)多个决策主体多个决策主体优化模型优化模型(Optimization)决策问题(Decision Problem)静态、动态静态、动态信息完全、不完全信息完全、不完全军事、政治、经济、企业管理和社会科学中应用广泛军事、政治、经济、企业管理和社会科学中应用广泛严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。1944年年6月初,盟军在诺曼底登陆成功月初
3、,盟军在诺曼底登陆成功.到到8月初的形势:月初的形势:背背景景11.1 进攻与撤退的抉择进攻与撤退的抉择双方应该如何决策双方应该如何决策?强强 化化缺口缺口盟军盟军(预备队预备队)撤退撤退进攻进攻德军德军盟军盟军(加加)盟军盟军(英英)盟军盟军(美一美一)盟盟军军(美美三三)东进东进原地原地待命待命背背景景北北西西南南东东严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。模型假设模型假设 博弈参与者为两方(盟军和德军)博弈参与者为两方(盟军和德军)盟军有盟军有3种使用其预备队的行动:强化缺口,原地待种使用其预备队的行动:强化缺口,原
4、地待命,东进;德军有命,东进;德军有2种行动:向西进攻或向东撤退种行动:向西进攻或向东撤退.博弈双方博弈双方完全理性完全理性,目的都是使战斗中己方获得,目的都是使战斗中己方获得的净胜场次(胜利场次减去失败场次)尽可能多的净胜场次(胜利场次减去失败场次)尽可能多.盟盟军胜军胜1场场盟盟军败军败2场场东进东进无无战战斗斗盟盟军胜军胜2场场原地待命原地待命无无战战斗斗盟盟军胜军胜1场场强强化缺口化缺口向向东东撤退撤退向西向西进进攻攻盟盟军军德德军军完全信息完全信息静态博弈静态博弈 共同知识共同知识(以上信息双方共有以上信息双方共有)双方同时做出决策双方同时做出决策两场战斗:两场战斗:1.德军向西进攻
5、德军向西进攻盟军缺口盟军缺口2.盟军围攻盟军盟军围攻盟军严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。博弈模型博弈模型 博弈参与者集合博弈参与者集合N=1,2(1为盟军,为盟军,2为德军为德军)用用u1(a1,a2)表示对盟军产生的结果,即净胜场次,表示对盟军产生的结果,即净胜场次,称为盟军的称为盟军的效用函数效用函数.盟盟军胜军胜1场场盟盟军败军败2场场东进东进无无战战斗斗盟盟军胜军胜2场场原地待命原地待命无无战战斗斗盟盟军胜军胜1场场强强化缺口化缺口向向东东撤退撤退向西向西进进攻攻盟盟军军德德军军 盟军行动盟军行动a1 A1
6、=1,2,3(强化缺口强化缺口/原地待命原地待命/东进东进);德军行动德军行动a2 A2=1,2(进攻进攻/撤退撤退).(行动:即纯战略行动:即纯战略)支付矩阵支付矩阵(Payoff Matrix)完全竞争完全竞争:零和博弈零和博弈 (常数和博弈常数和博弈)u2(a1,a2)对应对应 M严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。博弈的解博弈的解的概念:的概念:纳什均衡纳什均衡(NE:Nash Equilibrium)John Nash:1994年获诺贝尔经济学奖2015年5月24日,约翰纳什夫妇遇车祸,在美国新泽西州逝世。严
7、格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。不存在不存在(纯纯)NE(纯战略纯战略)纳什均衡纳什均衡NE:单向改变战略不能提高自己效用,单向改变战略不能提高自己效用,即每一方的战略即每一方的战略对于他方的战略而言都是最优的对于他方的战略而言都是最优的,称为称为最优反应最优反应.(纯纯)NE:a*=(a1*,a2*)=(2,2)非常数和非常数和博弈博弈(双矩双矩阵表示阵表示)得得分分矩矩阵阵严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。混合战略(策略:混合战略(策略
8、:Strategy)盟军的盟军的混合战略混合战略集集 期望收益期望收益盟军盟军德军德军 S1=p=(p1,p2,p3)|德军的德军的混合战略混合战略集集 S2=q=(q1,q2)|完全信息静态博弈完全信息静态博弈有限博弈矩阵博弈有限博弈矩阵博弈(2人人)零和博弈零和博弈常数和博弈常数和博弈 严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。模型求解模型求解理性推理:理性推理:不管自己怎么做,另一方总是希望使自不管自己怎么做,另一方总是希望使自己得分尽量低己得分尽量低.(二人零和博弈,完全竞争)(二人零和博弈,完全竞争)盟军盟军德军德
9、军线性线性规划规划 从一个给定的战略中期望得到的赢得,总是从一个给定的战略中期望得到的赢得,总是采用该策略时他们可能得到的最坏的赢得!采用该策略时他们可能得到的最坏的赢得!盟军可以用盟军可以用min pM来衡量策略来衡量策略p的好坏的好坏 max U1(p)=min pM min U2(q)=max MqT 德军可以用德军可以用max MqT来衡量策略来衡量策略q的好坏的好坏(p*,q*):混合混合(策略策略)纳什均衡纳什均衡(Mixed NE)p2*=3/5,p3*=2/5q1*=1/5,q2*=4/5最优值均为最优值均为2/5严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及
10、时发现、制止、汇报并处理各类违纪行为或突发事件。占优占优(dominate):盟军的行动:盟军的行动2占优于占优于1 (前面的非常数和博弈(前面的非常数和博弈M类似)类似)混合策略似乎不太可行混合策略似乎不太可行!但但概率概率可作为可作为参考参考.-现实现实:盟军让预备队原地待命(行动:盟军让预备队原地待命(行动2),而德军),而德军没有选择撤退(行动没有选择撤退(行动2),结果德军大败),结果德军大败.模型评述模型评述 博弈规则博弈规则至关重要的,如参与人决策的时间顺序、至关重要的,如参与人决策的时间顺序、决策时拥有哪些信息等决策时拥有哪些信息等.多人多人(或非常数和或非常数和)博弈问题,一
11、般不能用上面的线性博弈问题,一般不能用上面的线性规划方法求解,而通过纳什均衡的定义求解规划方法求解,而通过纳什均衡的定义求解.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。小结:博弈模型的基本要素小结:博弈模型的基本要素 参与人参与人 理性假设理性假设 行动顺序(静态、动态)行动顺序(静态、动态)信息结构(完全、不完全)信息结构(完全、不完全)行动空间(及战略空间)行动空间(及战略空间)效用函数效用函数 参与者完全理性参与者完全理性(最大化效用最大化效用)其他因素其他因素纳什均衡纳什均衡单向改变战略不能提高自己效用单向改变战略不
12、能提高自己效用严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。11.2 让报童订购更多的报纸让报童订购更多的报纸 报报童童模模型型回回顾顾订购价订购价w,零售价,零售价p,处理价,处理价v(pwv0)需求量:密度函数需求量:密度函数f(x)、分布函数、分布函数F(x),F(0)=0订购订购Q份报纸,期望销售量为份报纸,期望销售量为 期望存货量期望存货量期望利润期望利润 最优订购量最优订购量Qr Qr(w)严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。问题问题假设报社
13、报纸成本价为假设报社报纸成本价为c,wcv w*完全信息动态博弈:常称完全信息动态博弈:常称Stackelberg Game(两阶段两阶段)子博弈完美均衡子博弈完美均衡:(w*,Qr(w)一般一般w*c Qr(w*)wbv)回收协议模型回收协议模型 严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。模型二模型二 回收数量协议回收数量协议 报社回收报社回收 达到协调达到协调报童回收报童回收,报童利润,报童利润,报社利润报社利润;利润任意分配都可达到利润任意分配都可达到 按批发价回收,比例为按批发价回收,比例为 报童利润报童利润回收协议
14、模型回收协议模型 严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。模型评述模型评述 协议参数的确定:协议参数的确定:不能单方决定不能单方决定双方谈判(合作博弈)双方谈判(合作博弈)还有很多其他类型的协议,也可以达到协调还有很多其他类型的协议,也可以达到协调一种更简单的协议一种更简单的协议批发价批发价w成本成本c收取一定加盟费收取一定加盟费如何评价比较协议的优缺点?如何评价比较协议的优缺点?是否能达到协调是否能达到协调是否能任意分配利润是否能任意分配利润协议执行成本有多高协议执行成本有多高严格执行突发事件上报制度、校外活动报批制度等
15、相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。11.3 “一口价一口价”的战略的战略 背景背景 为了节省为了节省“讨价还价讨价还价”时间,考虑时间,考虑“一口价一口价”模式模式.双方同时报价双方同时报价:若买价:若买价卖价,则以均价成交卖价,则以均价成交;否则不成交否则不成交.问题问题 双方应如何报价?双方应如何报价?双方总能成交吗?(效率估计)双方总能成交吗?(效率估计)“讨价还价讨价还价”很浪费买卖双方的宝贵时间很浪费买卖双方的宝贵时间.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。模型假设与建立模型假
16、设与建立 卖方知道物品对自己的价值,但买方不知道卖方知道物品对自己的价值,但买方不知道.买方知道物品对自己的价值,但卖方不知道买方知道物品对自己的价值,但卖方不知道.双方都知道(如猜出)对方价值的分布信息双方都知道(如猜出)对方价值的分布信息.卖方价值卖方价值vs,买方价值买方价值vb,均服从均服从 0,1 上的均匀分布上的均匀分布卖方报价卖方报价ps,买方报价买方报价pb,pb ps时成交价时成交价p(pb+ps)/2成交效用:卖方成交效用:卖方U1=p-vs,买方买方U2=vb p;不成交不成交:0双方完全理性双方完全理性(最大化自己的期望效用最大化自己的期望效用).以上为双方的共同知识以
17、上为双方的共同知识.严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。卖方报价卖方报价ps ps(vs)买方报价买方报价pb pb(vb)双方战略双方战略战略组合战略组合(ps(vs),pb(vb)何时构成均衡?何时构成均衡?定义在定义在0,1区间上、取值也区间上、取值也在在0,1区间上的非减函数区间上的非减函数.不完全信息静态博弈(静态贝叶斯博弈)不完全信息静态博弈(静态贝叶斯博弈)贝叶斯纳什均衡贝叶斯纳什均衡单向改变战略不能单向改变战略不能提高自己效用提高自己效用.信息非对称(不完全信息)信息非对称(不完全信息)模型假设与建立模
18、型假设与建立严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。均衡条件均衡条件具体战略具体战略(函数函数)形式不同,均衡就可能不同形式不同,均衡就可能不同.单一价格战略单一价格战略卖方:卖方:买方:买方:双方战略互为最优反应,所以构成双方战略互为最优反应,所以构成贝叶斯纳什均衡贝叶斯纳什均衡!模型假设与建立模型假设与建立严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。单一价格战略效率为单一价格战略效率为x0.5效率最大效率最大(3/4)对给定的对给定的(vs,vb),当
19、,当vsxj=1-xi时,时,i(x)xi-i(xi-xj)=i-(2i-1)xi关于关于xi的系数非正的系数非正(过分(过分“愧疚愧疚”)效用函数效用函数财富总额为财富总额为1接受提议:甲乙所得接受提议:甲乙所得x1=1-s,x2=s;否则:;否则:x1=x2=0 严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。模型求解模型求解如果不接受,则如果不接受,则x1=x2=0;U1(s)=U2(s)=0.若若s1/2,则则x2 x1乙的最优反应乙的最优反应乙的最优反应(给定乙的最优反应(给定s)如果接受,则如果接受,则x1=1-s,x
20、2=s.若若s1/2,则则x2x1U2(s)01/20 s 当当 s 接受接受;否则,不接受否则,不接受易知易知(s1/2,两者一致两者一致)严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。模型求解模型求解Case 1:甲知道乙的甲知道乙的2 若若s1/2,则则x2 x1甲的决策甲的决策s=1/2时达到最大值时达到最大值1/2甲的决策甲的决策(只需考虑乙接受情形只需考虑乙接受情形)若若s1/2,则则x2 x1但但 s 均衡均衡:(s*,接受接受)s*严格小于严格小于50%;是乙的是乙的“愤怒愤怒”系数系数2的增函数的增函数.严格执
21、行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。模型求解:甲的决策模型求解:甲的决策Case 2:甲不知道乙的甲不知道乙的2,但知道但知道2的分布的分布F(2)若若s1/2,则则x2 x1甲的决策甲的决策 若若s1/2,则则x2 x1U1(s)=1-s-1(2s-1)同前同前期望效用期望效用乙接受概率乙接受概率s*严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。模型解释模型解释 甲永远不会提出大于甲永远不会提出大于/的方案的方案s 乙拒绝过小的方案乙拒绝过小的方案s很好地解
22、释了实际中的最后通牒博弈很好地解释了实际中的最后通牒博弈.乙接受概率随乙接受概率随s增加不减增加不减参考文献参考文献严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。11.5 效益的合理分配效益的合理分配例例甲乙丙三人合作经商,若甲乙合作获利甲乙丙三人合作经商,若甲乙合作获利7元,元,甲丙合作获利甲丙合作获利5元,乙丙合作获利元,乙丙合作获利4元,元,三人合作获利三人合作获利11元元.又知每人单干获利又知每人单干获利1元元.问三人合作时如何分配获利?问三人合作时如何分配获利?记甲乙丙三人分配为记甲乙丙三人分配为解不唯一解不唯一(5,
23、3,3)(4,4,3)(5,4,2)严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。(1)Shapley合作对策合作对策 I,v n人合作对策,人合作对策,v特征函数特征函数n人从人从v(I)得到的分配,满足得到的分配,满足v(s)子集子集s的获利的获利严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。公理化方法公理化方法 s 子集子集 s中的元素数目,中的元素数目,Si 包含包含i的所有子集的所有子集由由 s 决定的决定的“贡献贡献”的权重的权重 Shapley值值
24、i 对合作对合作s 的的“贡献贡献”Shapley合作对策合作对策严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。三人三人(I=1,2,3)经商中甲的分配经商中甲的分配x1的计算的计算 1/3 1/6 1/6 1/31 1 2 1 3 I1 7 5 11 0 1 1 4 1 6 4 7 1/3 1 2/3 7/3x1=13/3类似可得类似可得 x2=23/6,x3=17/61 2 2 3严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。合作对策的应用合作对策的应用 污水
25、处理费用的合理分担污水处理费用的合理分担20km38km河流河流三城镇地理位置示意图三城镇地理位置示意图123 污水处理,排入河流污水处理,排入河流.三城镇可单独建处理厂,三城镇可单独建处理厂,或联合建厂或联合建厂(用管道将污水用管道将污水由上游城镇送往下游城镇由上游城镇送往下游城镇).Q1=5Q3=5Q2=3Q污水量,污水量,L管道长度管道长度建厂费用建厂费用P1=73Q0.712管道费用管道费用P2=0.66Q0.51L严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。污水处理的污水处理的5 种方案种方案1)单独建厂)单独建厂总
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十一 博弈 模型 ppt 课件
限制150内