运筹与优化-对策论.ppt
《运筹与优化-对策论.ppt》由会员分享,可在线阅读,更多相关《运筹与优化-对策论.ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、运筹与优化运筹与优化 第十四章 对策论 对 策 论n对策论的基本概念对策论的基本概念n对策论的基本定理对策论的基本定理n矩阵对策的解法矩阵对策的解法第一节第一节 对策论的基本概念对策论的基本概念 对策论亦称竞赛论或博奕论对策论亦称竞赛论或博奕论,是研究具有斗是研究具有斗争或竞争性质的数学理论和方法争或竞争性质的数学理论和方法.具有竞争或对抗性质的行为称为对策行为具有竞争或对抗性质的行为称为对策行为.对策论是研究对策行为中对策论是研究对策行为中竞竞争各方是否存在争各方是否存在最合理的行动方案最合理的行动方案,以及如何找到最合理方案的以及如何找到最合理方案的数学理论和方法数学理论和方法.具有对策行
2、为的模型称为对策模型具有对策行为的模型称为对策模型,或对策或对策.对策三要素对策三要素n局中人局中人:在一个对策行为中在一个对策行为中,有权决定自己行动有权决定自己行动方案的对策者方案的对策者.n n个局中人的集个局中人的集合合I=1,2,I=1,2,n.,n.理智的决策者理智的决策者:不存在侥幸心理者不存在侥幸心理者.n策略集策略集:可供局中人可供局中人i i选择的一个实际可行的完选择的一个实际可行的完整的行动方案称为一个策略整的行动方案称为一个策略s si i,策略集策略集S Si i.局势局势:在对策中在对策中,各局中人所选定的策略构成的各局中人所选定的策略构成的策略组策略组s=(ss=
3、(s1 1,s,s2 2,s sn n).).全体局势全体局势S=SS=S1 1S S2 2S Sn nn赢得函数赢得函数:局势局势s s的函数的函数H Hi i(s).(s).n矩阵对策矩阵对策:二人有限零和对策二人有限零和对策.第二节第二节 对策论的基本定理对策论的基本定理n局中人局中人I I的纯策略集的纯策略集 S S1 1=1 1,2 2,m m;局中人局中人的纯策略集的纯策略集S S2 2=1 1,2 2,n n;对任一纯局对任一纯局势势(i i,j j)()(共共m mn n个个),),局中局中 人人I I的赢得值为的赢得值为a aij ij ,赢得矩阵为赢得矩阵为A=(A=(a
4、aij ij)m mn n.局中人局中人的赢得矩阵为的赢得矩阵为-A.A.n矩阵对策矩阵对策记为记为 G=,G=,,S S1 1,S S2 2;AA 或或 G=SG=S1 1,S S2 2;A.A.田忌田忌齐王齐王 1 1(上中下上中下)2 2(上下中上下中)3 3(中上下中上下)4 4(中下上中下上)5 5(下中上下中上)6 6(下上中下上中)1 1(上中下上中下)2 2(上下中上下中)3 3(中上下中上下)4 4(中下上中下上)5 5(下中上下中上)6 6(下上中下上中)311-11113-11111131-1111131-11-11131-111113n 例例1.“齐王赛马齐王赛马”中,
5、齐王的赢得矩阵为中,齐王的赢得矩阵为:n最优策略最优策略:有利于自己获得最大赢得有利于自己获得最大赢得(或最少损或最少损失失)的策略的策略.n选择最优策略的原则选择最优策略的原则:牢记对方总是以最牢记对方总是以最 不利于你的行动方案来对付你不利于你的行动方案来对付你.n例例2.2.设矩阵对策设矩阵对策G=SG=S1 1,S,S2 2;A,;A,其中其中 S S1 1=1 1,2 2,3 3,4 4,S S2 2=1 1,2 2,3 3,试求双方的最优策略和赢得试求双方的最优策略和赢得.n理智行为理智行为:双方各按最不利于自己的情形双方各按最不利于自己的情形 中选择最为利己的结果作为决策的依据中
6、选择最为利己的结果作为决策的依据.n定义定义1.1.设矩阵对策设矩阵对策G=SG=S1 1,S,S2 2;A A ,若等式若等式 (1)(1)成立成立,记记 ,则称则称V VG G为对策为对策G G的值的值,称使称使(1(1)成立的纯局势成立的纯局势 为为G G在纯策略下的解在纯策略下的解(或平衡局势、双赢局势或平衡局势、双赢局势).).n定理定理1.1.矩阵对策矩阵对策G=SG=S1 1,S,S2 2;A A 在纯策略在纯策略中有解的充要条件是中有解的充要条件是:存在纯局势存在纯局势 使得使得 (2)(2)(i=1,2,i=1,2,m,j=1,2,m,j=1,2,n).,n).既是其所在既是
7、其所在行的最小元素行的最小元素,又是其所在列的最大元素又是其所在列的最大元素.n定义定义2 2.设实函数设实函数f(x,y)f(x,y)定义在定义在xA,yBxA,yB上上,若存在若存在x x*A,y*B,A,y*B,使得对使得对xA,yB,xA,yB,有有 f(x,y*)f(xf(x,y*)f(x*,y*)f(x,y*)f(x*,y)(3),y)(3)则称则称(x x*,y*),y*)为为f(x,y)f(x,y)的一个鞍点的一个鞍点.n矩阵对策矩阵对策G G在纯策略意义下有解在纯策略意义下有解,且且 的充要条件的充要条件是是:是矩阵是矩阵A A的一个鞍点的一个鞍点.n例例3.3.确定确定p
8、p和和q q的取值范围的取值范围,使矩阵使矩阵A A在在(2 2,2 2)处存在鞍点处存在鞍点.其中其中qa22p,p5,q5n例例4.4.设矩阵对策设矩阵对策G=SG=S1 1,S,S2 2;A,;A,其中其中 S S1 1=1 1,2 2,3 3,4 4,S S2 2=1 1,2 2,3 3,试求双方的最优策略和赢得试求双方的最优策略和赢得.n性质性质1(1(无差别性无差别性).).若若(k k,r r)和和 (p p,q q)是对策是对策G G的两个解的两个解,则则 a akrkr =a apqpq.事实上事实上,由由 ,有有 a apqpq a aprpr a akrkr a akqk
9、q a apqpq因此因此 a akrkr =a apqpq.n性质性质2(2(可交换性可交换性).).若若(k k,r r)和和 (p p,q q)是对策是对策G G的两个解的两个解,则则(k k,q q)和和 (p p,r r)也是对策也是对策G G的解的解.由由 a aiq iq a apqpq=a akrkr a akqkq a apqpq =a akrkr a akj kj 得得a aiq iqa akqkq a akj kj,即即a akqkq是鞍点是鞍点.故故(k k,q q)是解是解.同理,同理,(p p,r r)是解是解.n性质性质1 1、2 2表明表明,矩阵对策的值是唯一的
10、矩阵对策的值是唯一的.n例例5.5.P385P385例题例题.n定义定义3.3.设矩阵对策设矩阵对策G=SG=S1 1,S,S2 2;A,A=(;A,A=(a aij ij)m mn n.若局中若局中人人I I以概率以概率x xi i00取纯策略取纯策略 i i,局中人局中人以概率以概率y yj j00取取纯策略纯策略 j j,且且 .记记 则则S S1 1*,S,S2 2*分别称为局中人分别称为局中人I I和和的混合策略集的混合策略集.称称xSxS1 1*,ySyS2 2*为局中人为局中人I I和和的混合策略的混合策略,(,(x,y)x,y)为混合局势为混合局势,局中人局中人I I的赢得函数
11、为的赢得函数为称称G G*=S=S1 1*,S,S2 2*,E,E为对策为对策G G的混合扩充的混合扩充.n设设则有则有n定义定义4.4.设设G G*=S=S1 1*,S,S2 2*;E;E是矩阵对策是矩阵对策G=SG=S1 1,S,S2 2;A;A的混合扩充的混合扩充,若若 记其值为记其值为V VG G,则称则称V VG G为对策为对策G G*的值的值,使使(3)(3)成立成立的混合局势的混合局势(x x*,y,y*)为为G G在混合策略意义下的解在混合策略意义下的解.n定理定理2.2.矩阵对策矩阵对策G=SG=S1 1,S,S2 2;A;A 在混合策略在混合策略中有解的充要条件是中有解的充
12、要条件是:(:(x x*,y,y*)为为E(x,y)E(x,y)的的一个鞍一个鞍点点,即对一切即对一切 xSxS1 1*,yS,yS2 2*,有有 E(x,yE(x,y*)E(x)E(x*,y,y*)E(x)E(x*,y)(4),y)(4)n注意注意:G G在纯策略下解存在时在纯策略下解存在时,定义定义4 4中的中的 ;G G在混合策略意义下的解在混合策略意义下的解(x x*,y,y*)存在时存在时,V VG G=E(x=E(x*,y,y*).).n例例4.4.解矩阵对策解矩阵对策 G=SG=S1 1,S,S2 2;A;A ,其其中中n局中人局中人I I取纯策略取纯策略 i i时时,其赢得函数
13、为其赢得函数为 E(i,y)=E(i,y)=a aij ijy yj j ,局中人局中人取纯策略取纯策略 j j时时,其赢得函数为其赢得函数为 E(x,j)=E(x,j)=a aij ijx xi i .由上两式得由上两式得 E(x,y)=E(i,y)E(x,y)=E(i,y)x xi i (5)(5)E(x,y)=E(x,j)E(x,y)=E(x,j)y yj j .(6).(6)n定理定理3.3.设设xSxS1 1*,yS,yS2 2*,则则(x x*,y,y*)是是G G的解的充要条的解的充要条件是件是:对任意对任意i=1,2,i=1,2,m,m 和和 j=1,2,j=1,2,n,n,有
14、有 E(i,yE(i,y*)E)E(x(x*,y,y*)E(x)E(x*,j)(7),j)(7)n定理定理3.3.设设xSxS1 1*,yS,yS2 2*,则则(x x*,y,y*)是是G G的解的充要条的解的充要条件是件是:对任意对任意i=1,2,i=1,2,m,m 和和 j=1,2,j=1,2,n,n,有有 E(i,yE(i,y*)E)E(x(x*,y,y*)E(x)E(x*,j)(7),j)(7)证明证明:设设(x x*,y,y*)是是G G的解的解,则由定理则由定理2,2,有有 E(x,yE(x,y*)E(x)E(x*,y,y*)E(x)E(x*,y),y)(4)(4)由于纯策略是混合
15、策略的特例由于纯策略是混合策略的特例,故故(7)(7)式成立式成立.反之反之,设设(7)(7)式成立式成立,由由(5)(5)、(6)(6)有有 E(x,yE(x,y*)=E(i,y)=E(i,y*)x xi iE(xE(x*,y,y*)x)xi i=E(x=E(x*,y,y*)E(x E(x*,y)=E(x,y)=E(x*,j),j)y yj jE(xE(x*,y,y*)y yj j=E(x=E(x*,y,y*)可知可知(4)(4)式式成立,故成立,故(x x*,y,y*)是是G G的解的解n定理定理4.4.设设x x*SS1 1*,y,y*SS2 2*,则则(x x*,y,y*)是是G G的
16、解的解的充要条件是的充要条件是:存在数存在数v,v,使得使得x x*,y,y*分别是不等分别是不等式组式组 (8)(8)(9)(9)的解的解,且且v=Vv=VG G.n定理定理4.4.证明证明:“”因因G G有解有解,(7),(7)式成立式成立.取取v=E(xv=E(x*,y,y*)就有就有(8),(9).(8),(9).“”因对任意因对任意 xSxS1 1*,yS,yS2 2*,有有 E(x,yE(x,y*)=E(i,y)=E(i,y*)x xi ivxvxi i=v=v E(x E(x*,y)=E(x,y)=E(x*,j),j)y yj jvyvyj j=v=v于是于是 E(x,yE(x,
17、y*)v E(x)v E(x*,y).,y).特别有特别有 E(xE(x*,y,y*)v E(x)v E(x*,y,y*).).故故 v=E(xv=E(x*,y,y*)=V)=VG G.n定理定理5.5.任意矩阵对策任意矩阵对策G=SG=S1 1,S,S2 2;A;A一定存在混一定存在混合策略意义下的解合策略意义下的解.证明证明:由定理由定理4,4,只要证明存在数只要证明存在数v v*和和x x*SS1 1*,y y*SS2 2*,使得使得 (10)(10)为此为此,考虑下列两个线性规划问题考虑下列两个线性规划问题:易知易知(P)P)和和(D)D)互为对偶互为对偶,x=(1,0,x=(1,0,
18、0),0)T TEEm m,w=minw=min a a1j 1j 是是(P)P)的可行解的可行解,y=(1,0,y=(1,0,0),0)T TEEn n,v=maxav=maxai1 i1 是是(D)D)的可行解的可行解.因此因此(P)P)和和(D)D)皆存在最优解皆存在最优解x x*SS1 1*,y,y*SS2 2*,且最优值且最优值 v v*=w=w*.故故(10)(10)式成立式成立.n定理定理6.6.设设(x x*,y,y*)是矩阵对策是矩阵对策G G的解的解,v=Vv=VG G,那么那么 (1).(1).若若x xi i*0,0,则则 ;(2).(2).若若y yj j*0,0,则
19、则 ;(3).(3).若若 ,则则 x xi i*=0;=0;(4).(4).若若 ,则则 y yj j*=0.=0.证明证明:由定义有由定义有 v=v=maxEmaxE(x,y(x,y*),xSxS1 1*,故故 又因又因 所以所以,当当 x xi i*00,必有必有 ;当当 ,必有必有 x xi i*=0.=0.故故(1),(3)(1),(3)得证得证.同理同理可证可证(2),(4).(2),(4).n定理定理7.7.设矩阵对策设矩阵对策G G1 1=S=S1 1,S,S2 2;A;A1 1 的解集的解集T(GT(G1 1),),G G2 2=S=S1 1,S,S2 2;A;A2 2 的解
20、集为的解集为T(GT(G2 2).).其中其中A A1 1=(=(a aij ij),),A A2 2=(=(a aij ij+p),pR.+p),pR.则则 (1).(1).V VG2G2=V=VG1G1+p;(2).T(G+p;(2).T(G1 1)=T(G)=T(G2 2).).n定理定理8.8.设矩阵对策设矩阵对策G G1 1=S=S1 1,S,S2 2;A;A的解集为的解集为T(GT(G1 1),G G2 2=S=S1 1,S,S2 2;A;A(RR+)的解集的解集 为为T(GT(G2 2).).则则 (1).(1).V VG2G2=V=VG1G1;(2).T(G;(2).T(G1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹 优化 策论
限制150内