《运筹学教材课件(第九章-对策论).pptx》由会员分享,可在线阅读,更多相关《运筹学教材课件(第九章-对策论).pptx(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、运筹学教材课件(第九章运筹学教材课件(第九章 对策论)对策论)n 绪论n 第1章 线性规划n 第2章 线性规划的对偶理论n 第3章 特殊线性规划n 第4章 动态规划n 第5章 图与网络分析n 第6章 排队论n 第7章 库存论n 第8章 决策论n 第第9 9章章 对策论对策论n 9.1 对策论的一般概念n 9.2 矩阵对策的基本定理n 9.3 矩阵对策的解法n 9.4 非零和对策n 9.5 动态对策微分对策n 9.6 应用举例 第9章 对策论郭鹏制作郭鹏制作 9.1.1 对策论对策论的三个基本要素的三个基本要素(1 1) 局中人(局中人(playersplayers) 在在一场竞争或斗争中(或一
2、局对策)都有这样的参加者,一场竞争或斗争中(或一局对策)都有这样的参加者,他们为了在一局对策中力争好的结局,必须制定对付对手们他们为了在一局对策中力争好的结局,必须制定对付对手们的行动方案,把这样有决策权的参加者称为局中人。的行动方案,把这样有决策权的参加者称为局中人。(2 2) 策略(策略(strategiesstrategies) 一一局对策中,每个局中人都有供他选择的实际可行的完整的行局对策中,每个局中人都有供他选择的实际可行的完整的行动方案,此方案是一个可行的自始至终通盘筹划的行动方案,称为动方案,此方案是一个可行的自始至终通盘筹划的行动方案,称为局中人的一个策略,而把局中人的策略全体
3、,称为局中人的策略集局中人的一个策略,而把局中人的策略全体,称为局中人的策略集合。合。 9.1 对策论的一般概念(3) 赢得函数(支付函数)(赢得函数(支付函数)(payoff function) 一一局对策中,把从每个局中人的策略集中各取一个策略局对策中,把从每个局中人的策略集中各取一个策略所组成的策略组称作所组成的策略组称作“局势局势”。当局势出现后,对策的结果。当局势出现后,对策的结果也就确定了,每个局中人都有所得或所失,显然局中人的得也就确定了,每个局中人都有所得或所失,显然局中人的得失是局势的函数,把这个函数称作赢得函数。失是局势的函数,把这个函数称作赢得函数。例例91 A、B两人各
4、有一角、两人各有一角、5分和分和1分的硬币各一枚,在双分的硬币各一枚,在双方互不知道情况下各出一枚硬币,并规定当和为奇数时,方互不知道情况下各出一枚硬币,并规定当和为奇数时,A赢得赢得B所出硬币;当和为偶数时,所出硬币;当和为偶数时,B赢得赢得A所出硬币,试根据所出硬币,试根据此列出对策模型。此列出对策模型。9 9.1.1.1 1 库存库存系统基本策略系统基本策略分析:分析: 根据根据题可知此对策的局中人为题可知此对策的局中人为A、B两人,每个局中人两人,每个局中人的策略集为的策略集为1角(角(10分),分),5分,分,1分分,那么局中人,那么局中人A的赢得的赢得函数表如下函数表如下:局中人局
5、中人B的赢得函数表如下:的赢得函数表如下:9.1.1 9.1.1 库存系统基本策略库存系统基本策略9.1.2 9.1.2 对策对策的分类的分类9.2.1 最优纯策略和最优纯策略和鞍点鞍点定义定义91 设矩阵对策设矩阵对策 ,其中其中 , 如果如果存在纯存在纯局势局势 ,使得使得 , (91)则则称称 是是对策对策G的的纯策略解纯策略解或或最优局势最优局势, 分别分别是局是局中人中人,的最优纯策略(的最优纯策略(optimal pure strategy),称称 是是对策对策G的值,记的值,记为为 9.2 9.2 矩阵对策的基本定理矩阵对策的基本定理12 ,; Gs sA112,ms 212,n
6、s ()m nijAa*(,)ij* *iji ji jaaa=1,2,mi;j=1,2,n*(,)ij*,ij* *i jaGV 引理引理9 91 1 任何任何矩阵对策矩阵对策 , ,总有总有 (9-29-2) )定义定义9 92 2 设矩阵对策设矩阵对策 ,如果,如果 (9-39-3)则则称称 是是对策对策G G的的鞍点鞍点(saddle pointsaddle point)。定理定理9 91 1 矩阵对策矩阵对策G G有纯策略解的充分必要条件是有纯策略解的充分必要条件是G G有鞍点。有鞍点。9.2.1 最优纯策略和鞍点12 ,; Gs sAmaxminminmaxijijjjiiaa12
7、 ,; Gs sA* *maxmin=minmax=ijiji jjjiiaaa*(,)ij 证明:必要性证明:必要性 设设 是是G G的纯策略解,由定义的纯策略解,由定义1 1有有故故又又因为因为所以所以 (9 94 4)另一方面由引理另一方面由引理1 1得得: (9 95 5)由式(由式(9 94 4)和式()和式(9 95 5)得)得:由此知由此知G G有鞍点有鞍点9.2.1 最优纯策略和鞍点*(,)ij* *iji ji jaaa=1,2,mi;j=1,2,n* *maxminiji ji jjiaaa*minmaxmax;minmaxminijijiji jjjjiiiaaaa* *
8、minmaxmaxminijiji jjjiiaaamaxminminmaxijijjjiiaa* *maxminminmaxijiji jjjiiaaa*(,)ij 充分性充分性 假设对策假设对策G G有鞍点有鞍点 ,由定义,由定义有有则则有有而而 因此因此 (9 96 6)同理同理有有 因此因此 (9 97 7)由式(由式(9 96 6)和式()和式(9 97 7)得得证证得得 是是G G的纯策略解。的纯策略解。9.2.1 最优纯策略和鞍点*(,)ij* *maxminminmaxijiji jjjiiaaa* *mini ji jjaa*mini ji jjaa* *i ji jaa*m
9、axiji jiaa* *i jijaa* *iji ji jaaa=1,2,mi;j=1,2,n*(,)ij 例例9 93 3 已知矩阵对策已知矩阵对策G G的赢得矩阵的赢得矩阵为为试判断此对策是否有纯策略解,若有,纯策略解的对策值是试判断此对策是否有纯策略解,若有,纯策略解的对策值是什么什么?分析:分析:根据定理根据定理1 1可知,只需判断对策是否有鞍点,计算如表可知,只需判断对策是否有鞍点,计算如表9 93 3所所示示9.2.1 最优纯策略和鞍点2325262438140153A 都是都是G G的鞍点,因而它们也都是最优纯策略的鞍点,因而它们也都是最优纯策略解,对策值解,对策值 ,的最优
10、纯策略解是的最优纯策略解是 ,的最优纯策略解的最优纯策略解是是 。9.2.1 最优纯策略和鞍点11132123(,),(,),(,),(,) 2GV 12, 13, 纯策略解有下述两条性质纯策略解有下述两条性质:(1 1)无差别性)无差别性 若若 是是对策对策G G的两的两个纯策略解,则个纯策略解,则 . .(2 2)可交换性)可交换性 若若 是是对策对策G G的两个纯策略解,则的两个纯策略解,则 也也是对策是对策G G得纯策略解。得纯策略解。9.2.1 最优纯策略和鞍点1122(,),(,)ijij1 12 2i ji jaa1122(,),(,)ijij1122(,),(,)ijij 定义
11、定义9 93 3 设矩阵对策设矩阵对策 ,集合集合称作局中人称作局中人和和的混合策略集,的混合策略集,xXxX和和yYyY分别称为局中分别称为局中人人和和的混合策略(的混合策略(mixed strategymixed strategy)简称策略,)简称策略, 是是对对策策G G的一个混合局势,简称局势,而的一个混合局势,简称局势,而称称 为为给给定定局势局势 时时,局中人,局中人的赢得亦为局中人的赢得亦为局中人的付出。的付出。9.2.2 混合策略与混合扩充12 ,; Gs sA112,ms 212,ns ()m nijAa121( ,)|10,1,2, mmiiiXx xxxxim且121(,
12、)|10,1,2, nniiiYy yyyyjn且( , )x y11( , )=mnijijijE x ya x y( , )x y 定义定义9 94 4 设设 是矩阵对策是矩阵对策 的的混和扩充,混和扩充,如果如果存在混合局势存在混合局势 使得使得对所有对所有xX,yYxX,yY,有有 (9 91010)则则称称 是是对策对策G G的混合策略解,简称对策的混合策略解,简称对策G G的解,或称最优的解,或称最优混合局势,简称混合局势,简称最优局势最优局势。称。称 分别分别是局中人是局中人和和的的最最优混合策略优混合策略(optimal mixed strategyoptimal mixed
13、strategy)简称)简称最优策略最优策略,而而 称作称作对策的值,仍记做对策的值,仍记做 。9.2.2 混合策略与混合扩充*, ; ,GX Y E12 ,; Gs sA*(,)xy*( ,)(,)(, )E x yE xyE xy*(,)xy*,xy*(,)E xyGV 引理引理9 92 2 设设 是矩阵对策是矩阵对策 的的混合扩充,混合扩充,总总有有定理定理9 92 2 矩阵对策矩阵对策G G有混合策略有混合策略解解 的的充分必要条件充分必要条件是是还可证明,矩阵对策还可证明,矩阵对策G G的混合策略解也具有下述性质的混合策略解也具有下述性质:(1 1)无差别性)无差别性 若若 是是G
14、G的两个混合策略解,的两个混合策略解,则则 。(2 2)可交换性)可交换性 若若 是是G G的两个混合策略解,的两个混合策略解,则则 也也是是G G的混合策略解。的混合策略解。9.2.2 混合策略与混合扩充12 ,; Gs sA*, ; ,GX Y Emaxmin( , )minmax( , )y Yy Yx Xx XE x yE x y*(,)xymaxmin( , )=minmax( , )y Yy Yx Xx XE x yE x y1122( ,),(,)x yxy1122( ,)(,)E x yE xy1122( ,),(,)x yxy1122( ,),(,)x yxy 定理定理9 9
15、3 3 设矩阵对策设矩阵对策G G, 是是G G的解的充分必要条件是:的解的充分必要条件是:对任意对任意i i1 1,2 2,m m;和;和j j1 1,2 2,n n有有, (9 91111)定理定理9 94 4 设设矩阵对策矩阵对策G G, 是是G G的解的充分必要条件是:的解的充分必要条件是:存在数存在数V V,使得使得 和和 成立。成立。 (9 91212) (9 91313)9.2.3 矩阵对策基本定理*(,)xy*(,)ijjijijia yE xya x*(,)xy*1,2,101,2,ijjjjjja yVimyyjn*1,2,101,2,ijiiiiia xVjnxxim 定
16、理定理9 95 5 (解的存在性定理)(解的存在性定理) 任何一个矩阵对策都存在混任何一个矩阵对策都存在混合策略解(简称解)。合策略解(简称解)。定理定理9 96 6 设设 是是矩阵对策矩阵对策G G的最优混合局势,记对策的最优混合局势,记对策值值 ,那么:,那么:(1 1)若)若 ,则则(2 2)若若 ,则,则(3 3)若)若 ,则则(4 4)若若 ,则,则9.2.3 矩阵对策基本定理*(,)xy*(,)GVVE xy*0ix *1nijjja yV*0jy *1mijiia xV*1mijiia xV*0jy 定理定理9 97 7 设有设有两个矩阵对策两个矩阵对策 ,其,其中中 ,如果,如
17、果 ,d d为常数,则为常数,则 和和 有有相同的混合策略解,相同的混合策略解,且且 , 和和 分别分别是是 和和 的的对策值对策值。定理定理9 98 8 设有两个设有两个矩阵对策矩阵对策 ,其其中中 ,则则 和和 有有相同的混合策略解,且相同的混合策略解,且9.2.3 矩阵对策基本定理112212 ,; , ,; GS SA GS S B,()()ijm nijm nAaBb(1,2,;1,2, )ijijbad im jn1G2G21GGVVd1GV2GV1G2G112212 ,; , ,;GS SA GS S aA0a1G2G2GGVaV9.3.1 等式试等式试算法算法问题转化为求解下面
18、两个方程组的问题转化为求解下面两个方程组的问题:问题: (914) (915)9.3 9.3 矩阵对策的解法矩阵对策的解法111mijiimia xVx12jn, , ,111nijjjnjja yVy1,2,im例例 95 求矩阵对策齐王赛马的解求矩阵对策齐王赛马的解分析:分析: 齐王赛马的赢得矩阵为齐王赛马的赢得矩阵为A没有鞍点,设齐王和田忌的最优混合策略没有鞍点,设齐王和田忌的最优混合策略为为和和 ,且假设,且假设9.3.1 9.3.1 等式试算法等式试算法311111131111113111111311111131111113A*123456( ,)xx x x x x xNoImag
19、e*0,0, ,1,2,6ijxyi j 求解求解线性方程组线性方程组 ( (9-16) (9-17)9-16) (9-17)解得:解得:9.3.1 9.3.1 等式试算法等式试算法1234561234561234561234561234561234561234563333331xxxxxxVxxxxxxVxxxxxxVxxxxxxVxxxxxxVxxxxxxVxxxxxx123456123456123456123456123456123456123456333333yyyyyyVyyyyyyVyyyyyyVyyyyyyVyyyyyyVyyyyyyVyyyyyyV*12345616xxxxxx
20、*12345616yyyyyy 例例9 96 6 已知矩阵对策的赢得已知矩阵对策的赢得矩阵矩阵 求求对策的解及对策值对策的解及对策值。分析分析:此此矩阵对策没有鞍点,设局中人矩阵对策没有鞍点,设局中人的的混合策略为混合策略为局中人局中人最优的混合策略及对策值是下列线性规划的解。最优的混合策略及对策值是下列线性规划的解。 将将 代入约束条件代入约束条件 ,将其化为:将其化为:9.3.2 29.3.2 2n n和和m m2 2矩阵对策的解法矩阵对策的解法25134132A(2,4)n n12( ,)x xmax1212121212122453. .321,0 xxxxxxstxxxxx x211x
21、x 111114214342501xxxxx 由定理由定理9 96 6知知 ,又又由由 有:有:于是有于是有 解得解得 解得解得 ,局中人,局中人的最优的最优混合策略混合策略 局中人局中人最优策略最优策略9.3.2 29.3.2 2n n和和m m2 2矩阵对策的解法矩阵对策的解法79GV *5 4( , )9 9x *5 4(0,0, )9 9y *120yy*120,0 xx*1234*12342537/94327/9yyyyyyyy*34*34*3437/9327/91yyyyyy*3454,99yy 例例9 97 7 求解求解矩阵对策矩阵对策 其中其中9.3.2 29.3.2 2n n
22、和和m m2 2矩阵对策的解法矩阵对策的解法12 ; GS SA42102()262,64135Amm 分析分析:此矩阵对策没有鞍点,设局此矩阵对策没有鞍点,设局中人中人的的混合策略为混合策略为局中人局中人最最优的混合策略及对策值是下列线性规划的解优的混合策略及对策值是下列线性规划的解。 把把 代入约束条件代入约束条件 ,解得:,解得: 9.3.2 29.3.2 2n n和和m m2 2矩阵对策的解法矩阵对策的解法12(,)y yminu1212121212124210226. .643,0yyyyyystyyyyy y21y1y *1211412,1333GVyyy 由方程组由方程组代入代入
23、 ,解得解得综综上,局中人上,局中人和局中人和局中人的最优混合策略分别为:的最优混合策略分别为: 和和9.3.2 29.3.2 2n n和和m m2 2矩阵对策的解法矩阵对策的解法*1250 xxx*12345*12345144102631xxxxxxxxxx*125,x x x*3412,33xx*1 2(0,0, ,0)3 3x *1 214( , ),3 33GyV定义定义95 设矩阵对策设矩阵对策 ,其中其中 ,如果如果 ,则称,则称策略策略 优优超于策略超于策略 。类似的,类似的,如果如果 ,则称策略,则称策略 优优超于超于策略策略 。 例例98 求解矩阵对策求解矩阵对策 ,其中,其
24、中9.3.3 9.3.3 优超优超12 ; GS SA112s,.m 212,s,.n ,()ijm nAa(1,2,., )ijkjaajnki(1,2,.,)ilijimlj12 ; GS SA23456213405910368364A分析:分析:此矩阵对策没有鞍点。由于根据定义此矩阵对策没有鞍点。由于根据定义95知知 优优超于超于 ,可以删去可以删去A的第的第2行行,得,得关于关于 , 优优超超于于 , 优超于优超于 ,可,可删去删去A的第的第2列和第列和第5列,列,得得9.3.3 9.3.3 优超优超12234565910368364123A12345*20 x 1A1235 关于关于
25、 , 优超优超于于 可删去可删去 的第的第2行,得行,得关于关于 , 优超于优超于 可删去可删去 的的第第3列,得列,得9.3.3 9.3.3 优超优超1234245510636A1342A432A*250,0yy134245636A134*30 x 3A143A 利用公式(利用公式(918)解得解得综上知局中人综上知局中人的最优策略的最优策略为为局中人局中人的最优策略的最优策略为为9.3.3 9.3.3 优超优超1442463A13*40y *14133.6,0.6,0.4,0.2,0.8GVxxyy*(0.6,0,0,0.4)x *(0.2,0,0.8,0)y 3.6GV 任任一一矩阵对策
26、矩阵对策 的的求解均等价于一对互为对偶求解均等价于一对互为对偶的线性规划问题。的线性规划问题。 () 和(和()9.3.4 9.3.4 线性规划线性规划解法解法 12 ; GS SA,1,2,.,10,1,2,.ijiiiiia xw jnxximmaxwmin,1,2,.,10,1,2,.ijijjjja yimyyjn令令 ,(,()问题的约束条件变成)问题的约束条件变成问题问题变成变成 (919) 9.3.4 9.3.4 线性规划线性规划解法解法 1,2,iixxwim ()1,1,2,.,10,1,2,.ijiiiiia xjnxwximmin1,1,2,.,0,1,2,.iiijii
27、ixa xjnxim同理令同理令 ,问题问题()变成)变成 (920) 求求出问题的解后再利用出问题的解后再利用变换变换即即可求出原对策问题的解及对策值。可求出原对策问题的解及对策值。 9.3.4 9.3.4 线性规划线性规划解法解法 1,2,()iijyynmax1,1,2,.,0,1,2,.jjijjjjya yimyjn*11(),minmaxGGGijijVxVx yVyxy或例例99 已知已知矩阵对策的赢得矩阵矩阵对策的赢得矩阵 ,求其策略解求其策略解。分析:分析:此矩阵对策无鞍点,用线性规划法求混合策略解。此矩阵对策无鞍点,用线性规划法求混合策略解。 () 和(和() 9.3.4
28、9.3.4 线性规划线性规划解法解法 133421322A123123123123min()43132213210,1,2,3ixxxxxxxxxxxxxi123123123123max()33142132210,1,2,3jyyyyyyyyyyyyyj用单纯性法解(用单纯性法解(),经过计算最后得到表经过计算最后得到表94,其中其中是是松弛变量。松弛变量。 最优策略为最优策略为9.3.4 9.3.4 线性规划线性规划解法解法 123,Z ZZ*121 1 17( ,0, ),( , , ),333 3 33GxyV例例910 (核裁军问题)假定只有两个国家拥有核武器。目核裁军问题)假定只有两
29、个国家拥有核武器。目前他们拥有的核力量相当,因而受到核袭击的可能性都是前他们拥有的核力量相当,因而受到核袭击的可能性都是0.5。如他们裁减核武器,则它们受到对方核袭击的可能性减小到如他们裁减核武器,则它们受到对方核袭击的可能性减小到0.2;如果一国裁减核武器,而另一国不裁减,则裁减核武器;如果一国裁减核武器,而另一国不裁减,则裁减核武器的国家受核袭击的可能性增加到的国家受核袭击的可能性增加到0.9,不裁减的国家受到核袭,不裁减的国家受到核袭击的可能性为击的可能性为0.1。试给出这个问题的对策模型。试给出这个问题的对策模型。 9.4 9.4 非零和对策非零和对策分析:分析:A的赢得函数如表的赢得
30、函数如表95所示所示: B的的赢得函数如表赢得函数如表96所所示:示: 表表95 表表96这是一个有限非零和对策。这是一个有限非零和对策。9.4 9.4 非零和对策非零和对策A B 0.50.10.90.21212A B 0.50.90.10.21212例例911 甲乙两家面包店在市场竞争中,各自都在考虑是否甲乙两家面包店在市场竞争中,各自都在考虑是否要降价,如果两家都降价,则各家可得要降价,如果两家都降价,则各家可得300元的利润;如果都元的利润;如果都不降价,则各家可得利润不降价,则各家可得利润500元;如果一家降价,另一家不降元;如果一家降价,另一家不降价,降价的一家可得利润价,降价的一
31、家可得利润600元,不降价的一家由于剩余等原元,不降价的一家由于剩余等原因而亏损因而亏损400元,问双方如何选择行动较为合理?元,问双方如何选择行动较为合理? 9.4 9.4 非零和对策非零和对策分析:分析:依据题意把上述数据整理成表(见表依据题意把上述数据整理成表(见表97):两人有限非零和对策的数学模型两人有限非零和对策的数学模型可用可用 表示,表示,9.4 9.4 非零和对策非零和对策12 ,;( , )GS SA B3645A3465B例例912 设想一个垄断企业已占领市场(称为设想一个垄断企业已占领市场(称为“在位者在位者”),),另一个企业很想进入市场(称为另一个企业很想进入市场(
32、称为“进入者进入者”),在位者想保),在位者想保持其垄断地位,就要阻挠进入者进入。假定进入者进入前,持其垄断地位,就要阻挠进入者进入。假定进入者进入前,在位者的垄断利润为在位者的垄断利润为300,进入后两者的利润和为,进入后两者的利润和为100(各得(各得50),进入成本为),进入成本为10。两者各种策略组合下的赢得矩阵如表。两者各种策略组合下的赢得矩阵如表98所示:所示: 9.4 9.4 非零和对策非零和对策9.5.1 动态对策的基本动态对策的基本概念概念定义定义96 在二人零和微分对策中,若局中人甲选用上在二人零和微分对策中,若局中人甲选用上策策 略略 ,局中人乙选用下局中人乙选用下策略策
33、略 ,按(按(921)式进行对局,)式进行对局,支付由(支付由(922)式确定,则称该对策为上)式确定,则称该对策为上策略,记策略,记作作 。记记 ,则,则称称 为对策为对策 的上的上值。值。 ( 921 ) (922) 9.5 9.5 动态对策动态对策微分对策微分对策1111inf supinf sup ,nnnnvJv1111111111( ,),2,3,( ,),1,2,jjjjjjjjvvv uvujnuv uvujn11(,),nnJ uvJJ例例913 平面拦截对策。飞机平面拦截对策。飞机A与与B在同一水平面上做拦截对在同一水平面上做拦截对策。两飞机相向飞行,前向速度分别为常量策。
34、两飞机相向飞行,前向速度分别为常量v1和和v2,横向速,横向速度分别为度分别为u(t)和和v(t),横向位置分别为,横向位置分别为x1(t)和和x2(t),并设,并设t=0时,时,A,B的横向位置分别为的横向位置分别为 ,两飞机之间的前向距离为两飞机之间的前向距离为L。飞机运动的状态方程组为飞机运动的状态方程组为 9.5.2 9.5.2 动态对策的数学模型动态对策的数学模型0012,xx12001122(0),(0)xuxvxxxx若若记记 ,则上述方程组可以则上述方程组可以化为化为采用下面的支付函数来衡量拦截效果,即采用下面的支付函数来衡量拦截效果,即 其中其中 是是拦截时间拦截时间, 是是
35、与飞机性能相关的参数。与飞机性能相关的参数。 9.5.2 9.5.2 动态对策的数学模型动态对策的数学模型0012012( )( )( ),x tx tx txxx0(0)xuvxx02220011( , )()( )( ),22TJ u vx Tu tv t dt012()LTvv,0 二人零和微分对策的一般二人零和微分对策的一般形式:形式: (923) (924)其中其中t(u,v)满足终端满足终端约束约束 (925) 这里这里 是是关于关于t和和x的连续函数。的连续函数。9.5.2 9.5.2 动态对策的数学模型动态对策的数学模型0( , , , )(0)xf t x u vxx( ,
36、)0( , )( ( , ), ( ( , )( , ( ), ( ), ( )t u vJ u vg t u v x t u vh t x t u t v t dt ( ( , ), ( ( , )0t u v x t u v( , )t x例例914(二指莫拉问题)甲、乙二人游戏,每人出一个或两(二指莫拉问题)甲、乙二人游戏,每人出一个或两个手指,同时又把猜测对方说出的指数叫出来。如果只有一个手指,同时又把猜测对方说出的指数叫出来。如果只有一个人猜测正确,则他所应得的数目为二人所出数字之和,否个人猜测正确,则他所应得的数目为二人所出数字之和,否则重新开始。写出该对策中各局中人的策略集合及甲
37、的赢得则重新开始。写出该对策中各局中人的策略集合及甲的赢得矩阵。矩阵。9.6 9.6 应用应用举例举例分析:分析:甲甲的赢得函数如表的赢得函数如表99所所示示甲的赢得矩阵为甲的赢得矩阵为9.6 9.6 应用应用举例举例0230200330040340A例例915 (证券投资)某人计划将证券投资)某人计划将50万元投资于三种不同的万元投资于三种不同的债券债券A、B、C,投资期为一年,到期收益视当时债券市场状,投资期为一年,到期收益视当时债券市场状况而定,不同市场状况赢得矩阵预测如表况而定,不同市场状况赢得矩阵预测如表910所示,问最合所示,问最合理的投资策略。理的投资策略。9.6 9.6 应用应
38、用举例举例分析:分析:我们我们将三种债券将三种债券A、B、C看作局中人看作局中人的三个策略,市的三个策略,市场状况看作局中人场状况看作局中人的三个策略,这样就可以将此问题看作的三个策略,这样就可以将此问题看作一个矩阵对策问题。一个矩阵对策问题。由于由于 ,所以所以有纯策略解,即投资于债券有纯策略解,即投资于债券C比较合理。比较合理。9.6 9.6 应用应用举例举例4max minmin maxaaijijjjii 例例916 (医药方面)一个病人的症状说明它可能患有三种医药方面)一个病人的症状说明它可能患有三种疾病的一种,这时可以开的药有两种,两种药对不同疾病治疾病的一种,这时可以开的药有两种
39、,两种药对不同疾病治愈的概率见表愈的概率见表911。分析分析:这个:这个问题可以看成一个对策问题,把医生当作局中人问题可以看成一个对策问题,把医生当作局中人,病人病人看作局中人看作局中人。由于由于 ,则对则对策有纯策略解(策有纯策略解(M,B),所以医生最稳妥的策略是给病人药所以医生最稳妥的策略是给病人药M,这个想法与我们常识上的想法一致。这个想法与我们常识上的想法一致。9.6 9.6 应用应用举例举例0.4max minmin maxaaijijjjii例例917(兵力分配问题,许多文献中称它为兵力分配问题,许多文献中称它为Blotto上校对策)。设上校对策)。设红、蓝两军各有指挥官统帅相当
40、数量的军队,他们为争夺某地区的红、蓝两军各有指挥官统帅相当数量的军队,他们为争夺某地区的几个阵地而部署必要的兵力。为具体起见,不妨设共有两个阵地几个阵地而部署必要的兵力。为具体起见,不妨设共有两个阵地A、B,红军有四个营的兵力,蓝军有三个营的兵力,设,红军有四个营的兵力,蓝军有三个营的兵力,设x表示用于争表示用于争夺阵地夺阵地A的兵力数(单位:营),的兵力数(单位:营),y表示用于争夺阵地表示用于争夺阵地B的兵力数,的兵力数,那么(那么(x,y)便可以表示红方指挥官的一种兵力分配策略,因而红)便可以表示红方指挥官的一种兵力分配策略,因而红方的五种策略为(方的五种策略为(4,0),(),(0,4
41、),(),(3,1),(),(1,3),(),(2,2),类似地,蓝方指挥官的四个策略为(),类似地,蓝方指挥官的四个策略为(3,0),(),(0,3),(),(2,1),(),(1,2)。若支付矩阵的元素代表战斗效果评分,规则为:)。若支付矩阵的元素代表战斗效果评分,规则为:消灭对方一营记一分,占领阵地一个记一分,双方得失相当记消灭对方一营记一分,占领阵地一个记一分,双方得失相当记0分,分,一方得分另一方失分,试着写出红军的支付矩阵并求解。一方得分另一方失分,试着写出红军的支付矩阵并求解。9.6 9.6 应用应用举例举例分析:分析:考虑两个线性规划考虑两个线性规划问题问题 (926) (92
42、7)9.6 9.6 应用应用举例举例12345min xxxxx12341234123451234562312631. . 4352413425410,1,2,3,4,5ixxxxxxxxstxxxxxxxxxxxi1234max yyyy12341234123412343462431263413521. .32514410,1,2,3,4jyyyyyyyyyyyystyyyyyyyj用单纯形法求解用单纯形法求解(927),并用对偶理论,并用对偶理论得得那么那么则则根据定理根据定理97知知则红方采用策略则红方采用策略4,0,0,4,2,2的概率为的概率为0.45,0.45,0.1,而不采用策略
43、而不采用策略3,1和和1,3至少赢得战斗效果至少赢得战斗效果1.6分。分。9.6 9.6 应用应用举例举例1234512340.125,0.125,0,0,0.0310.0310.022,0.009,0.1,0.150 xxxxxyyyy13.60.281GV *112345*12340.45,0.45,0,0,0.10.08,0.03,0.36,0.53GxxVxxxxyyyy21.6GV 例例918(体育方面)有甲、乙两支游泳队举行包括三个项目(体育方面)有甲、乙两支游泳队举行包括三个项目的对抗赛,这两支游泳队各有一名健将级运动员(甲队为赵,的对抗赛,这两支游泳队各有一名健将级运动员(甲队
44、为赵,乙队为张),在三个项目中成绩都突出,但规则准许他们每乙队为张),在三个项目中成绩都突出,但规则准许他们每人只能参加两项比赛,每队的其他两名运动员可参加全部三人只能参加两项比赛,每队的其他两名运动员可参加全部三项比赛。已知各运动员平时成绩见表项比赛。已知各运动员平时成绩见表912。假定各运动员在。假定各运动员在比赛中都发挥正常水平,又比赛第一名得比赛中都发挥正常水平,又比赛第一名得5分,第二名得分,第二名得3分,分,第三名得第三名得1分。问教练员应决定让自己队健将参加哪两项比赛分。问教练员应决定让自己队健将参加哪两项比赛使本队得分最多。使本队得分最多。9.6 9.6 应用应用举例举例分析:
45、分析:先求甲乙两队健将不参加某项比赛时甲乙两队的得分先求甲乙两队健将不参加某项比赛时甲乙两队的得分表,见表表,见表913和和914 表表913 表表914 9.6 9.6 应用应用举例举例将将甲队得分表中各元素分别减去乙队得分表中对应元素得甲甲队得分表中各元素分别减去乙队得分表中对应元素得甲队赢得队赢得矩阵矩阵由于由于 ,所以此对策无纯策略解,所以此对策无纯策略解,需求混合策略。由于矩阵第需求混合策略。由于矩阵第1列元素均大于第列元素均大于第2列元素,划去列元素,划去第第1列元素得列元素得9.6 9.6 应用应用举例举例113133331A maxmin31minmaxijijjjiiaa 1
46、33331A 而而 第第1行元素均大于第行元素均大于第2行元素,划去第二行行元素,划去第二行得得用用公式法公式法得得所以所以,甲队赵健将应参加仰泳比赛,并以,甲队赵健将应参加仰泳比赛,并以1/2概率参加蝶泳和概率参加蝶泳和蛙泳比赛,乙队王健将应参加蝶泳,并以蛙泳比赛,乙队王健将应参加蝶泳,并以1/2概率参加仰泳和概率参加仰泳和蛙泳,这样甲队最多失蛙泳,这样甲队最多失2分,而乙队最少得分,而乙队最少得2分。分。9.6 9.6 应用应用举例举例A1331A*12311;0;22xxx*123110;22yyy*123( 1)332GVxxx 本章小结与展望本章介绍了对策论一些基本概念,着重讨论了矩
47、阵对策的有关概念、本章介绍了对策论一些基本概念,着重讨论了矩阵对策的有关概念、性质、定理以及求解方法。同时给出了矩阵对策的基本定理性质、定理以及求解方法。同时给出了矩阵对策的基本定理任何矩阵任何矩阵对策都有混合策略解,进而介绍了几种求矩阵对策混合策略解的方法。最对策都有混合策略解,进而介绍了几种求矩阵对策混合策略解的方法。最后对非零和对策以及动态对策理论作了简要地介绍。后对非零和对策以及动态对策理论作了简要地介绍。本章主要介绍的是两人有限零和对策,但实际对策过程中各局人的本章主要介绍的是两人有限零和对策,但实际对策过程中各局人的赢得往往是非零和的。例如许多现实经济活动过程都是创造新价值的,所赢得往往是非零和的。例如许多现实经济活动过程都是创造新价值的,所以在经济过程中的对策模型一般都是非零和的,因此对于非零和对策的研以在经济过程中的对策模型一般都是非零和的,因此对于非零和对策的研究就显得十分重要。另外对策论与其他学科充分融合,产生了一些新的研究就显得十分重要。另外对策论与其他学科充分融合,产生了一些新的研究领域,例如统计判决函数的研究使对策论应用于统计学,某些经济学理究领域,例如统计判决函数的研究使对策论应用于统计学,某些经济学理论的研究引起了人们对多人合作对策的兴趣等。论的研究引起了人们对多人合作对策的兴趣等。
限制150内