姜启源等编《数学模型》第四版 课件 第十一章博弈模型复习过程.ppt





《姜启源等编《数学模型》第四版 课件 第十一章博弈模型复习过程.ppt》由会员分享,可在线阅读,更多相关《姜启源等编《数学模型》第四版 课件 第十一章博弈模型复习过程.ppt(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、姜启源等编数学模型第四版课件第十一章博弈模型 1944年年6月初,盟军在诺曼底登陆成功月初,盟军在诺曼底登陆成功.到到8月初的形势:月初的形势:背背景景11.1 进攻与撤退的抉择进攻与撤退的抉择双方应该如何决策双方应该如何决策?强强 化化缺口缺口盟军盟军(预预备备队队)撤退撤退进攻进攻德军德军盟军盟军(加加)盟军盟军(英英)盟军盟军(美一美一)盟盟军军(美美三三)东进东进原地原地待命待命模型假设模型假设 博弈参与者为两方(盟军和德军)博弈参与者为两方(盟军和德军)盟军有盟军有3种使用其预备队的行动:强化缺口,原地待种使用其预备队的行动:强化缺口,原地待命,东进;德军有命,东进;德军有2种行动:
2、向西进攻或向东撤退种行动:向西进攻或向东撤退.博弈双方博弈双方完全理性完全理性,目的都是使战斗中己方获得,目的都是使战斗中己方获得的净胜场次(胜利场次减去失败场次)尽可能多的净胜场次(胜利场次减去失败场次)尽可能多.盟盟军胜军胜1场场盟盟军败军败2场场东进东进无无战战斗斗盟盟军胜军胜2场场原地待命原地待命无无战战斗斗盟盟军胜军胜1场场强强化缺口化缺口向向东东撤退撤退向西向西进进攻攻盟盟军军德德军军完全信息完全信息静态博弈静态博弈 共同知识共同知识(以上信息双方共有以上信息双方共有)双方同时做出决策双方同时做出决策博弈模型博弈模型 博弈参与者集合博弈参与者集合N=1,2(1为盟军,为盟军,2为德
3、军为德军)用用u1(a1,a2)表示对盟军产生的结果,即净胜场次,表示对盟军产生的结果,即净胜场次,称为盟军的称为盟军的效用函数效用函数.盟盟军胜军胜1场场盟盟军败军败2场场东进东进无无战战斗斗盟盟军胜军胜2场场原地待命原地待命无无战战斗斗盟盟军胜军胜1场场强强化缺口化缺口向向东东撤退撤退向西向西进进攻攻盟盟军军德德军军 盟军行动盟军行动a1 A1=1,2,3(强化缺口强化缺口/原地待命原地待命/东进东进);德军行动德军行动a2 A2=1,2(进攻进攻/撤退撤退)。(行动:即纯战略行动:即纯战略)支付矩阵支付矩阵(Payoff Matrix)完全竞争完全竞争:零和博弈零和博弈 (常数和博弈常数
4、和博弈)u2(a1,a2)对应对应-M博弈的解博弈的解的概念:的概念:纳什均衡纳什均衡(NE:Nash Equilibrium)不存在不存在(纯纯)NE(纯战略纯战略)纳什均衡纳什均衡Nash:1994年获诺贝尔经济学奖年获诺贝尔经济学奖NE:单向改变战略不能提高自己效用,单向改变战略不能提高自己效用,即每一方的战略即每一方的战略对于他方的战略而言都是最优的对于他方的战略而言都是最优的,称为称为最优反应最优反应.(纯纯)NE:a*=(a1*,a2*)=(2,2)非常数和非常数和博弈博弈(双双矩阵表示矩阵表示)混合战略(策略:混合战略(策略:Strategy)盟军的盟军的混合战略混合战略集集 期
5、望收益期望收益盟军盟军德军德军 S1=p=(p1,p2,p3)|德军的德军的混合战略混合战略集集 S2=q=(q1,q2)|完全信息静态博弈完全信息静态博弈有限博弈矩阵博弈有限博弈矩阵博弈(2人人)零和博弈零和博弈常数和博弈常数和博弈 模型求解模型求解理性推理:理性推理:不管自己怎么做,另一方总是希望尽量不管自己怎么做,另一方总是希望尽量使自己得分尽量低使自己得分尽量低.(二人零和博弈,完全竞争)(二人零和博弈,完全竞争)盟军盟军德军德军线性线性规划规划 从一个给定的战略中期望得到的赢得,总是从一个给定的战略中期望得到的赢得,总是采用该策略时他们可能得到的最坏的赢得!采用该策略时他们可能得到的
6、最坏的赢得!盟军可以用盟军可以用min pM来衡量策略来衡量策略p的好坏的好坏 max U1(p)=min pM min U2(q)=max MqT 德军可以用德军可以用max MqT来衡量策略来衡量策略q的好坏的好坏(p*,q*):混合混合(策略策略)纳什均衡纳什均衡(Mixed NE)p2*=3/5,p3*=2/5q1*=1/5,q2*=4/5最优值均为最优值均为2/5占优占优(dominate):盟军的行动:盟军的行动2占优于占优于1 (前面的非常数和博弈(前面的非常数和博弈M类似)类似)混合策略似乎不太可行混合策略似乎不太可行!但但概率概率可作为可作为参考参考.-现实现实:盟军让预备队
7、原地待命(行动:盟军让预备队原地待命(行动2),而德军),而德军没有选择撤退(行动没有选择撤退(行动2),结果德军大败),结果德军大败.模型评述模型评述 博弈规则博弈规则至关重要的,如参与人决策的时间顺序、至关重要的,如参与人决策的时间顺序、决策时拥有哪些信息等决策时拥有哪些信息等.多人多人(或非常数和或非常数和)博弈问题,一般不能用上面的线博弈问题,一般不能用上面的线性规划方法求解,而通过纳什均衡的定义求解性规划方法求解,而通过纳什均衡的定义求解.小结:博弈模型的基本要素小结:博弈模型的基本要素 参与人参与人 理性假设理性假设 行动顺序(静态、动态)行动顺序(静态、动态)信息结构(完全、不完
8、全)信息结构(完全、不完全)行动空间(及战略空间)行动空间(及战略空间)效用函数效用函数 参与者完全理性参与者完全理性(最大化效用最大化效用)其他因素其他因素纳什均衡纳什均衡单向改变战略不能提高自己效用单向改变战略不能提高自己效用11.2 让报童订购更多的报纸让报童订购更多的报纸 报报童童模模型型回回顾顾订购价订购价w,零售价,零售价p,处理价,处理价v(pwv0)需求量:密度函数需求量:密度函数f(x)、分布函数、分布函数F(x),F(0)=0订购订购Q份报纸,期望销售量为份报纸,期望销售量为 期望存货量期望存货量期望利润期望利润 最优订购量最优订购量Qr Qr(w)11.2 让报童订购更多
9、的报纸让报童订购更多的报纸 问问题题假设报社报纸成本价为假设报社报纸成本价为c,wcv w*完全信息动态博弈:常称完全信息动态博弈:常称Stackelberg Game(两阶段两阶段)子博弈完美均衡子博弈完美均衡:(w*,Qr(w)一般一般w*c Qr(w*)wbv)回收协议模型回收协议模型 模型二模型二 回收数量协议回收数量协议 报社回收报社回收 达到协调达到协调报童回收报童回收,报童利润,报童利润,报社利润报社利润;利润任意分配都可达到利润任意分配都可达到 按批发价回收,比例为按批发价回收,比例为 报童利润报童利润回收协议模型回收协议模型 模型评述模型评述 协议参数的确定:协议参数的确定:
10、不能单方决定不能单方决定双方谈判(合作博弈)双方谈判(合作博弈)还有很多其他类型的协议,也可以达到协调还有很多其他类型的协议,也可以达到协调一种更简单的协议一种更简单的协议批发价批发价w成本成本c收取一定加盟费收取一定加盟费如何评价比较协议的优缺点?如何评价比较协议的优缺点?是否能达到协调是否能达到协调是否能任意分配利润是否能任意分配利润协议执行成本有多高协议执行成本有多高11.3 “一口价一口价”的战略的战略 背景背景 为了节省为了节省“讨价还价讨价还价”时间,考虑时间,考虑“一口价一口价”模式模式.双方同时报价双方同时报价:若买价:若买价卖价,则以均价成交卖价,则以均价成交;否则不成交否则
11、不成交.问题问题 双方应如何报价?双方应如何报价?双方总能成交吗?(效率估计)双方总能成交吗?(效率估计)“讨价还价讨价还价”很浪费买卖双方的宝贵时间很浪费买卖双方的宝贵时间.模型假设与建立模型假设与建立 卖方知道物品对自己的价值,但买方不知道卖方知道物品对自己的价值,但买方不知道.买方知道物品对自己的价值,但卖方不知道买方知道物品对自己的价值,但卖方不知道.双方都知道(如猜出)对方价值的分布信息双方都知道(如猜出)对方价值的分布信息.卖方价值卖方价值vs,买方价值买方价值vb,均服从均服从U0,1(均匀分布均匀分布)卖方报价卖方报价ps,买方报价买方报价pb,pb ps时成交价时成交价p(p
12、b+ps)/2成交效用:卖方成交效用:卖方U1=p-vs,买方买方U2=vb p;不成交不成交:0双方完全理性双方完全理性(最大化自己的期望效用最大化自己的期望效用).以上为双方的共同知识以上为双方的共同知识.卖方报价卖方报价ps ps(vs)买方报价买方报价pb pb(vb)双方战略双方战略战略组合战略组合(ps(vs),pb(vb)何时构成均何时构成均衡?衡?定义在定义在0,1区间上、取值也区间上、取值也在在0,1区间上的非减函数区间上的非减函数.不完全信息静态博弈(静态贝叶斯博弈)不完全信息静态博弈(静态贝叶斯博弈)贝叶斯纳什均衡贝叶斯纳什均衡单向改变战略不能单向改变战略不能提高自己效用
13、提高自己效用.信息非对称(不完全信息)信息非对称(不完全信息)模型假设与建立模型假设与建立均衡条件均衡条件具体战略具体战略(函数函数)形式不同,均衡就可能不同形式不同,均衡就可能不同.单一价格战略单一价格战略卖方:卖方:买方:买方:双方战略互为最优反应,所以构成双方战略互为最优反应,所以构成贝叶斯纳什均衡贝叶斯纳什均衡!模型假设与建立模型假设与建立单一价格战略效率为单一价格战略效率为x(1-x)/0.50.5x0.5效率最大效率最大(1/2)对给定的对给定的(vs,vb),当,当vsxj=1-xi时,时,i(x)xi-i(xi-xj)=i-(2i-1)xi关于关于xi的系数非正的系数非正(过分
14、(过分“愧疚愧疚”)效用函数效用函数财富总额为财富总额为1接受提议:甲乙所得接受提议:甲乙所得x1=1-s,x2=s;否则:;否则:x1=x2=0 模型求解模型求解如果不接受,则如果不接受,则x1=x2=0;U1(s)=U2(s)=0.若若s1/2,则则x2 x1乙的最优反应乙的最优反应乙的最优反应(给定乙的最优反应(给定s)如果接受,则如果接受,则x1=1-s,x2=s.若若s1/2,则则x2x1U2(s)01/20 s 当当 s 接受接受;否则,不接受否则,不接受易知易知(s1/2,两者一致两者一致)模型求解模型求解Case 1:甲知道乙的甲知道乙的2 若若s1/2,则则x2 x1甲的决策
15、甲的决策s=1/2时达到最大值时达到最大值1/2甲的决策甲的决策(只需考虑乙接受情形只需考虑乙接受情形)若若s1/2,则则x2 x1但但 s 均衡均衡:(s*,接受接受)s*严格小于严格小于50%;是乙的是乙的“愤怒愤怒”系数系数2的增函数的增函数.模型求解:甲的决策模型求解:甲的决策Case 2:甲不知道乙的甲不知道乙的2,但知道但知道2知道分布知道分布F(2)若若s1/2,则则x2 x1甲的决策甲的决策 若若s1/2,则则x2 x1U1(s)=1-s-1(2s-1)同前同前期望效用期望效用乙接受概率乙接受概率s*模型解释模型解释 甲永远不会提出大于甲永远不会提出大于/的方案的方案s 乙拒绝
16、过小的方案乙拒绝过小的方案s很好地解释了实际中的最后通牒博弈很好地解释了实际中的最后通牒博弈 乙接受概率随乙接受概率随s增加不减增加不减参考文献参考文献11.5 效益的合理分配效益的合理分配例例甲乙丙三人合作经商,若甲乙合作获利甲乙丙三人合作经商,若甲乙合作获利7元,元,甲丙合作获利甲丙合作获利5元,乙丙合作获利元,乙丙合作获利4元,元,三人合作获利三人合作获利11元元.又知每人单干获利又知每人单干获利1元元.问三人合作时如何分配获利?问三人合作时如何分配获利?记甲乙丙三人分配为记甲乙丙三人分配为解不唯一解不唯一(5,3,3)(4,4,3)(5,4,2)(1)Shapley合作对策合作对策 I
17、,v n人合作对策,人合作对策,v特征函数特征函数n人从人从v(I)得到的分配,满足得到的分配,满足v(s)子集子集s的获利的获利公理化方法公理化方法 s 子集子集 s中的元素数目,中的元素数目,Si 包含包含i的所有子集的所有子集由由 s 决定的决定的“贡献贡献”的权重的权重 Shapley值值 i 对合作对合作s 的的“贡献贡献”Shapley合作对策合作对策三人三人(I=1,2,3)经商中甲的分配经商中甲的分配x1的计的计算算 1/3 1/6 1/6 1/31 1 2 1 3 I1 7 5 11 0 1 1 4 1 6 4 7 1/3 1 2/3 7/3x1=13/3类似可得类似可得 x
18、2=23/6,x3=17/61 2 2 3合作对策的应用合作对策的应用 污水处理费用的合理分担污水处理费用的合理分担20km38km河流河流三城镇地理位置示意图三城镇地理位置示意图123 污水处理,排入河流污水处理,排入河流.三城镇可单独建处理厂,三城镇可单独建处理厂,或联合建厂或联合建厂(用管道将污水用管道将污水由上游城镇送往下游城镇由上游城镇送往下游城镇).Q1=5Q3=5Q2=3Q污水量,污水量,L管道长度管道长度建厂费用建厂费用P1=73Q0.712管道费用管道费用P2=0.66Q0.51L污水处理的污水处理的5 种方案种方案1)单独建厂)单独建厂总投资总投资2)1,2合作合作3)2,
19、3合作合作4)1,3合作合作总总投资投资总投资总投资合作不会实现合作不会实现5)三城合)三城合作总投资作总投资D5最小最小,应联合建厂应联合建厂 建厂费:建厂费:d1=73(5+3+5)0.712=453 12 管道费:管道费:d2=0.66 50.51 20=30 23 管道费:管道费:d3=0.66 (5+3)0.51 38=73D5城城3建议:建议:d1 按按 5:3:5分担分担,d2,d3由城由城1,2担负担负城城2建议:建议:d3由城由城1,2按按 5:3分担分担,d2由城由城1担负担负城城1计算:计算:城城3分担分担 d1 5/13=174C(3),城城2分担分担 d1 3/13+
20、d3 3/8=132C(1)不同意不同意!D5如何分担?如何分担?特征函数特征函数v(s)联合联合(集集s)建厂比单独建厂节约的投资建厂比单独建厂节约的投资三三城从节约投资城从节约投资v(I)中得到的分配中得到的分配 Shapley合作对策合作对策计算计算城城1从节约投资中得到的分配从节约投资中得到的分配x11 1 2 1 3 I 0 40 0 640 0 0 250 40 0 39 1 2 2 31/3 1/6 1/6 1/3 0 6.7 0 13 x1=19.7,城城1 C(1)-x1=210.4,城城2 C(2)-x2=127.8,城城3 C(3)-x3=217.8三城在总投资三城在总投
21、资556中的分担中的分担x2=32.1,x3=12.2x2最大,如何解释?最大,如何解释?优点:优点:公正、合理,有公理化基础。公正、合理,有公理化基础。如如n个单位治理污染个单位治理污染,通常知道第通常知道第i方单独治理的投资方单独治理的投资yi 和和n方共同治理的投资方共同治理的投资Y,及第及第i方不参加时其余方不参加时其余n-1方的方的投资投资zi(i=1,2,n).确定共同治理时各方分担的费确定共同治理时各方分担的费用用.其他其他v(s)均不知道均不知道,无法用无法用Shapley合作对策求解合作对策求解Shapley合作对策小结合作对策小结若定义特征函数为合作的获利若定义特征函数为合
22、作的获利(节约的投资节约的投资),则有,则有缺点:缺点:需要知道所有合作的获利,即要定义需要知道所有合作的获利,即要定义I=1,2,n的的所有子集所有子集(共共2n-1个个)的特征函数,实际上的特征函数,实际上常做不到常做不到.设只知道设只知道无无 i 参加时参加时n-1方合作的获利方合作的获利全体合作的获利全体合作的获利求解合作对策的其他方法求解合作对策的其他方法例例.甲乙丙三人合作经商,若甲乙合作获利甲乙丙三人合作经商,若甲乙合作获利7元,元,甲丙合作获利甲丙合作获利5元,乙丙合作获利元,乙丙合作获利4元,三人元,三人合作获利合作获利11元元.问三人合作时如何分配获利?问三人合作时如何分配
23、获利?(1)协商解)协商解11将剩余获利将剩余获利 平均分配平均分配 模型模型以以n-1方合作的获利为下限方合作的获利为下限求解求解 xi 的下限的下限(2)Nash解解 为现状点(谈判时的威慑点)为现状点(谈判时的威慑点)在此基础上在此基础上“均匀地均匀地”分配全体合作的获利分配全体合作的获利B模型模型平均分配获利平均分配获利B2)Nash解解 1)协商解)协商解(3)最小距离解)最小距离解模型模型 第第i 方的边际效益方的边际效益若令若令3)最小距离解)最小距离解 1)协商解)协商解(4)满意解)满意解di现状点现状点(最低点最低点)ei理想点理想点(最高点最高点)模型模型4)基于满意度的
24、解)基于满意度的解 1)协商解)协商解(5)Raiffi 解解与协商解与协商解x=(5,4,2)比较比较求解合作对策的求解合作对策的6种方法(可分为三类)种方法(可分为三类)Shapley合作对策合作对策A类类B类类协商解协商解Nash解解 最小距离解最小距离解满意解满意解di现状现状,ei理想理想B类类4种方法相同种方法相同例:有一资方例:有一资方(甲甲)和二劳方和二劳方(乙乙,丙丙),仅当资方与至仅当资方与至少一劳方合作时才获利少一劳方合作时才获利10元,应如何分配该获利?元,应如何分配该获利?Raiffi解解C类类B类:类:计算简单,便于理解,可用于各方实计算简单,便于理解,可用于各方实
25、力相差不大的情况;一般来说它偏袒强者力相差不大的情况;一般来说它偏袒强者.C类:类:考虑了分配的上下限,又吸取了考虑了分配的上下限,又吸取了Shapley的思想,在一定程度上保护弱者的思想,在一定程度上保护弱者.A类:类:公正合理;需要信息多,计算复杂公正合理;需要信息多,计算复杂.求解合作对策的三类方法小结求解合作对策的三类方法小结11.6 加权投票中权力的度量加权投票中权力的度量 背景背景“一人一票一人一票”显示投票和表决的公正显示投票和表决的公正.股份制公司每位股东投票和表决权的大小由所股份制公司每位股东投票和表决权的大小由所占有的占有的股份股份多少决定多少决定.一些国家、地区的议会、政
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学模型 姜启源等编数学模型第四版 课件 第十一章 博弈模型复习过程 姜启源 第四 第十一 博弈 模型 复习 过程

限制150内