第15章对策论精.ppt
《第15章对策论精.ppt》由会员分享,可在线阅读,更多相关《第15章对策论精.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第15章对策论1第1页,本讲稿共39页第十五章 对策论 由“齐王赛马”引入2第2页,本讲稿共39页1 1 对策论的基本概念对策模型的三个基本要素:对策模型的三个基本要素:1.1.局中人局中人:参与对抗的各方;:参与对抗的各方;2.2.策略集:局中人选择对付其它局中人的行动方案称为策略集:局中人选择对付其它局中人的行动方案称为策略策略;某局中人的所有可能策略全体称为某局中人的所有可能策略全体称为策略集策略集;3.3.一局势对策的益损值:局中人各自使用一个对策就一局势对策的益损值:局中人各自使用一个对策就形成了形成了一个局势一个局势,一个局势决定了各局中人的对策结,一个局势决定了各局中人的对策结果
2、(量化)称为该局势对策的果(量化)称为该局势对策的益损值益损值。3第3页,本讲稿共39页“齐王赛马齐王赛马”齐王在各局势中的益损值表(单位:千金)齐王在各局势中的益损值表(单位:千金)1 1 对策论的基本概念4第4页,本讲稿共39页其中:齐王的策略集其中:齐王的策略集:S1=1,2,3,4,5,6,田忌的策略集:田忌的策略集:S2=1,2,3,4,5,6。下面矩阵称齐王的下面矩阵称齐王的赢得矩阵赢得矩阵:3 1 1 1 -1 1 1 3 1 1 1 -1 A=1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3 1 1 对策论的基本概念5第5页
3、,本讲稿共39页二人有限零和对策二人有限零和对策(又称(又称矩阵对策矩阵对策):):局中人为局中人为2 2;每个局中人的策略集的策略数目都是有;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一限的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。局势的两个局中人的益损值之和为零。通常将矩阵对策记为通常将矩阵对策记为:G=S1,S2,A S1:甲的策略集;:甲的策略集;S2:乙的策略集;:乙的策略集;A:甲的赢得矩阵。甲的赢得矩阵。“齐王赛马齐王赛马”是一个矩阵策略。是一个矩阵策略。1 1 对策论的基本概念6第6页,本讲稿共39页在甲
4、方的赢得矩阵中:在甲方的赢得矩阵中:A=aijmni 行代表甲方策略行代表甲方策略 i=1,2,m;j 行代表乙方策略行代表乙方策略 j=1,2,n;aij 代表甲方取策略代表甲方取策略 i,乙方取策略乙方取策略 j,这一局势下甲方的益损值。此时乙这一局势下甲方的益损值。此时乙方的益损值为方的益损值为-aij(零和性质)。(零和性质)。在考虑各方采用的策略时,必须注意一个前提,就是双方都是理在考虑各方采用的策略时,必须注意一个前提,就是双方都是理智的,即双方都是从各自可能出现的最不利的情形选择一种最为有利智的,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。的情况作
5、为决策的依据。2 2 矩阵对策的最优纯策略矩阵对策的最优纯策略2 2 矩阵对策的最优纯策略矩阵对策的最优纯策略7第7页,本讲稿共39页 例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方各选都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方各选一种策略参赛。比赛共赛三局,规定每局胜者得一种策略参赛。比赛共赛三局,规定每局胜者得1 1分,输者得分,输者得-1-1分,可分,可知三赛三胜得知三赛三胜得3 3分,三赛二胜得分,三赛二胜得1 1分,三赛一胜得分,三赛一胜得-1-1分
6、,三赛三负得分,三赛三负得-3-3分。甲队的策略集为分。甲队的策略集为S S1 1=1 1,2 2,3 3,乙队的策略集为,乙队的策略集为S S2 2=1 1,2 2,3 3。根据以往比赛的资料,有甲队的赢得矩阵为根据以往比赛的资料,有甲队的赢得矩阵为A A,如下所示,如下所示,请问这次比赛各队采用哪种阵容上场最为稳妥请问这次比赛各队采用哪种阵容上场最为稳妥?2 2 矩阵对策的最优纯策略矩阵对策的最优纯策略8第8页,本讲稿共39页矩阵矩阵A A中每行的最小元素分别为中每行的最小元素分别为1 1,-3-3,-1-1。在这些最少赢得中最好的结果是在这些最少赢得中最好的结果是1 1,故甲队会采取策略
7、,故甲队会采取策略 1 1,无论对手采取何策,无论对手采取何策略,甲队至少得略,甲队至少得1 1分。对于乙队,分。对于乙队,1 1,2 2,3 3 可能带来的最少赢得,即可能带来的最少赢得,即A A中每列的中每列的最大元素,分别为最大元素,分别为3 3,1 1,3 3。乙队会采取。乙队会采取 2 2策略,确保甲队不会超过策略,确保甲队不会超过1 1分。分。1 1和和 2 2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这一种策分别称为局中人甲队、乙队的最优策略。由于双方必然选择这一种策略,所以,这种策略又称为最优纯策略。略,所以,这种策略又称为最优纯策略。这种最优纯策略只有当赢得矩阵这种
8、最优纯策略只有当赢得矩阵A=A=(a aijij)中等式)中等式 成立时,双方才有最优纯策略,并把(成立时,双方才有最优纯策略,并把(1 1,2 2)称为对策)称为对策G G在纯策略下的解,又称在纯策略下的解,又称(1 1,2 2)为对策)为对策G G的鞍点。把其值的鞍点。把其值V V称之为对策称之为对策G=SG=S1 1,S S2 2,AA的值。的值。2 2 矩阵对策的最优纯策略矩阵对策的最优纯策略9第9页,本讲稿共39页 例例 某单位采购员在秋天决定冬季取暖用煤的储量问题,已知在某单位采购员在秋天决定冬季取暖用煤的储量问题,已知在正常的冬季气温条件下要消耗正常的冬季气温条件下要消耗1515
9、吨煤,在较暖和较冷的天气下要消耗吨煤,在较暖和较冷的天气下要消耗1010吨和吨和2020吨。假定冬天的煤价随天气寒冷程度而有所变化,在较暖和、吨。假定冬天的煤价随天气寒冷程度而有所变化,在较暖和、正常、较冷的气候条件下每吨煤价分别为正常、较冷的气候条件下每吨煤价分别为1010元、元、1515元、元、2020元。又设冬元。又设冬季时煤炭价格为每吨季时煤炭价格为每吨1010元。在没有关于当年冬季准确的气象预报的条元。在没有关于当年冬季准确的气象预报的条件下,秋天储煤多少吨能使得单位的支出最少?件下,秋天储煤多少吨能使得单位的支出最少?解:局中人解:局中人I I为采购员,局中人为采购员,局中人III
10、I为大自然,采购员有三个策略,买为大自然,采购员有三个策略,买1010吨、吨、1515吨、吨、2020吨。分别记为吨。分别记为 1 1,2 2,3 3。大自然也有三个策略:暖、正常、冷,。大自然也有三个策略:暖、正常、冷,分别记为分别记为 1 1,2 2,3 3。2 2 矩阵对策的最优纯策略矩阵对策的最优纯策略10第10页,本讲稿共39页赢得矩阵如下:赢得矩阵如下:在此表上计算,有在此表上计算,有 得得故(故(3 3,3 3)为对策)为对策G G的解,的解,V VG G=-200=-200。1231(10吨)-100-175-3002(15吨)-150-150-2503(20吨)-200-20
11、0-200123min1(10吨)-100-175-300-3002(15吨)-150-150-250-2503(20吨)-200-200-200-200*max-100-150-200*2 2 矩阵对策的最优纯策略矩阵对策的最优纯策略11第11页,本讲稿共39页 设矩阵对策设矩阵对策 G=S1,S2,A。当当 max min aij min max aij i j j i时,不存在最优纯策略。时,不存在最优纯策略。例:设一个赢得矩阵如下例:设一个赢得矩阵如下:min min 5 9 5 5 9 5 A=max 6 =max 6 策略策略 2 8 6 6 8 6 6 i i max 8 9 m
12、ax 8 9 min 8 min 8 策略策略 1 j j3 3 矩阵对策的混合策略矩阵对策的混合策略12第12页,本讲稿共39页 当甲取当甲取策略策略 2 2,乙取,乙取策略策略 1 1时,甲实际赢得时,甲实际赢得8比预期的多比预期的多2 2,乙当然,乙当然不满意。考虑到甲可能取不满意。考虑到甲可能取策略策略 2 2这一点,乙采取策略这一点,乙采取策略 2 2。若甲也分析到。若甲也分析到乙可乙可能采取策略能采取策略 2 2这一点,取策略这一点,取策略 1 1,则赢得更多为则赢得更多为9 9 。此时,对两个局中。此时,对两个局中人甲、乙来说,没有一个双方均可接受的平衡局势,其主要原因是甲人甲、
13、乙来说,没有一个双方均可接受的平衡局势,其主要原因是甲和乙没有执行上述原则的共同基础,即和乙没有执行上述原则的共同基础,即 max min aij min max aij。i j j i 一个自然的想法:对甲(乙)给出一个选取不同策略的概率分布,以一个自然的想法:对甲(乙)给出一个选取不同策略的概率分布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少)使甲(乙)在各种情况下的平均赢得(损失)最多(最少)-即混合即混合策略。策略。3 3 矩阵对策的混合策略矩阵对策的混合策略13第13页,本讲稿共39页 求解求解混合策略的混合策略的问题有问题有图解法、迭代法、线性方程法和线性规划法图解法、迭
14、代法、线性方程法和线性规划法等,我们这里只介绍等,我们这里只介绍线性规划法线性规划法,其他方法略。,其他方法略。例:设甲使用策略例:设甲使用策略 1 1的概率为的概率为X1 1,使用策略,使用策略 2 2的概率为的概率为X2 ,并设,并设在最坏的情况下,甲赢得的平均值为在最坏的情况下,甲赢得的平均值为V(未知)。(未知)。5 9 A=STEP 1 8 6 1)1)X1+X2=1 X1,X2 0 3 3 矩阵对策的混合策略矩阵对策的混合策略14第14页,本讲稿共39页2)2)无论乙取何策略,甲的平均赢得应不少于无论乙取何策略,甲的平均赢得应不少于V:V:对乙取对乙取 1 1:5X 5X1 1+8
15、X+8X2 2 V V对乙取对乙取 2 2:9X 9X1 1+6X+6X2 2 V V注意注意 V0,V0,因为因为A A各元素为正。各元素为正。STEP 2 STEP 2 作变换:作变换:X X1 1=X=X1 1/V;X/V;X2 2=X=X2 2/V/V得到上述关系式变为:得到上述关系式变为:X X1 1+X+X2 2=1/V (V=1/V (V愈大愈好)待定愈大愈好)待定 5X 5X1 1+8X+8X2 2 1 1 9X 9X1 1+6X+6X2 2 1 1 X X1 1,X,X2 2 0 03 3 矩阵对策的混合策略矩阵对策的混合策略15第15页,本讲稿共39页建立线性模型:建立线性
16、模型:min X min X1 1+X+X2 2 s.t.5Xs.t.5X1 1+8X+8X2 2 1 1 X X1 1=1/21=1/21 9 9X X1 1+6X+6X2 2 1 1 X X2 2=2/21=2/21 X X1 1,X,X2 2 0 1/V=0 1/V=X X1 1+X+X2 2=1/7=1/7 所以,所以,V=7 V=7 返回原问题:返回原问题:X X1 1=X X1 1V=1/3V=1/3 X X2 2=X X2 2V=2/3V=2/3于是甲的最优混合策略为:于是甲的最优混合策略为:以以1/31/3的概率选的概率选 1 1,以以2/32/3的概率选的概率选 2 2,最优
17、值,最优值V=7V=7。3 3 矩阵对策的混合策略矩阵对策的混合策略16第16页,本讲稿共39页 同样可求乙的最优混合策略:同样可求乙的最优混合策略:设乙使用策略设乙使用策略 1 1的概率为的概率为Y Y1 1 Y Y1 1+Y+Y2 2=1=1设乙使用策略设乙使用策略 2 2的概率为的概率为Y Y2 2 Y Y1 1,Y,Y2 2 0 0 设在最坏的情况下,甲赢得的平均值为设在最坏的情况下,甲赢得的平均值为V V。这也是乙损失的平均值,越小越好。这也是乙损失的平均值,越小越好。作变换:作变换:Y Y1 1=Y=Y1 1/V/V,Y Y2 2=Y=Y2 2/V/V 建立线性模型:建立线性模型:
18、max Y max Y1 1+Y+Y2 2 s.t.5Ys.t.5Y1 1+9Y+9Y2 2 1 1 Y Y1 1=1/14=1/14 8 8Y Y1 1+6Y+6Y2 2 1 1 Y Y2 2=1/14=1/14 Y Y1 1,Y,Y2 2 0 1/V=0 1/V=Y Y1 1+Y+Y2 2=1/7=1/7 所以,所以,V=7 V=7 3 3 矩阵对策的混合策略矩阵对策的混合策略17第17页,本讲稿共39页返回原问题:返回原问题:Y1=Y1V=1/2 Y2=Y2V=1/2于是乙的最优混合策略为:于是乙的最优混合策略为:以以 的概率选的概率选 1 1;以以 的概率选的概率选 2 2,最优值,最
19、优值 V=7。当赢得矩阵中有非正元素时,当赢得矩阵中有非正元素时,V 0 的条件不一定成立,可以作下列变换:的条件不一定成立,可以作下列变换:选一正数选一正数 k,令矩阵中每一元素加上,令矩阵中每一元素加上 k 得到新的正矩阵得到新的正矩阵A A,其对应的矩阵,其对应的矩阵对策对策G G=S=S1 1,S,S2 2,A,A 与与 G=S G=S1 1,S,S2 2,A,A 解相同,但解相同,但VG=VG k。3 3 矩阵对策的混合策略矩阵对策的混合策略18第18页,本讲稿共39页例例:求解:求解“齐王赛马齐王赛马”问题。问题。已知齐王的赢得矩阵已知齐王的赢得矩阵A A求得求得故不存在纯策略问题
20、下的解,可求其混合策略。故不存在纯策略问题下的解,可求其混合策略。A A中有负元素,可以取中有负元素,可以取k=2,k=2,在在A A的每个元素上加的每个元素上加2 2得到得到A A如下:如下:3 3 矩阵对策的混合策略矩阵对策的混合策略19第19页,本讲稿共39页 建立对建立对G G=S=S1 1,S S2 2,A A 中求甲方最佳策略的线性规划如下:中求甲方最佳策略的线性规划如下:Min x Min x1 1+x+x2 2+x+x3 3+x+x4 4+x+x5 5+x+x6 6 约束条件:约束条件:5x 5x1 1+3x+3x2 2+3x+3x3 3+x+x4 4+3x+3x5 5+3x+
21、3x6 6 11 3x 3x1 1+5x+5x2 2+x+x3 3+3x+3x4 4+3x+3x5 5+3x+3x6 6 11 3x 3x1 1+3x+3x2 2+5x+5x3 3+3x+3x4 4+3x+3x5 5+x+x6 6 11 3x 3x1 1+3x+3x2 2+3x+3x3 3+5x+5x4 4+x+x5 5+3x+3x6 6 11 x x1 1+3x+3x2 2+3x+3x3 3+3x+3x4 4+5x+5x5 5+3x+3x6 6 11 3x 3x1 1+x+x2 2+3x+3x3 3+3x+3x4 4+3x+3x5 5+5x+5x6 6 11 x xi i 0,i=1,2,0
22、,i=1,2,6,6 可解得解为:可解得解为:x x1 1=x=x4 4=x=x5 5=0,x=0,x2 2=x=x3 3=x=x6 6=0.111,v=0.111,v=3,x=3,x1 1=x=x4 4=x=x5 5=0=0,x x2 2=x=x3 3=x=x6 6=1/3,=1/3,即即X X*=(0,1/3,1/3,0,0,1/3)=(0,1/3,1/3,0,0,1/3)T T,所以甲的最优策略为作出策略,所以甲的最优策略为作出策略 2 2、3 3、6 6的概率的概率都为都为0.333,0.333,而作出而作出 1 1、4 4、5 5 的概率为的概率为0 0,此时,此时V VG G=V=
23、V=3=3。3 3 矩阵对策的混合策略矩阵对策的混合策略20第20页,本讲稿共39页 同样可以建立对策同样可以建立对策G G=S=S1 1,S S2 2,A A 中求乙方最佳策略的线性规划如下:中求乙方最佳策略的线性规划如下:Min y Min y1 1+y+y2 2+y+y3 3+y+y4 4+y+y5 5+y+y6 6 约束条件:约束条件:5y 5y1 1+3y+3y2 2+3y+3y3 3+3y+3y4 4+y+y5 5+3y+3y6 6 11 3y 3y1 1+5y+5y2 2+3y+3y3 3+3y+3y4 4+3y+3y5 5+y+y6 6 11 3y 3y1 1+y+y2 2+5
24、y+5y3 3+3y+3y4 4+3y+3y5 5+3y+3y6 6 11 y y1 1+3y+3y2 2+3y+3y3 3+5y+5y4 4+3y+3y5 5+3y+3y6 6 11 3y 3y1 1+3y+3y2 2+3y+3y3 3+y+y4 4+5y+5y5 5+3y+3y6 6 11 3y 3y1 1+3y+3y2 2+y+y3 3+3y+3y4 4+3y+3y5 5+5y+5y6 6 11 y yi i0,i=1,2,0,i=1,2,6,6 可解得解为:可解得解为:y y1 1=y=y4 4=y=y5 5=0.111,y=0.111,y2 2=y=y3 3=y=y6 6=0,v=0
25、,v=3,y=3,y1 1=y=y4 4=y=y5 5=1/3=1/3,y y2 2=y=y3 3=y=y6 6=0=0,即,即Y Y*=(1/3,0,0,1/3,1/3,0)=(1/3,0,0,1/3,1/3,0)T T。所以田忌的最优混合策略为作出策略所以田忌的最优混合策略为作出策略 1 1、4 4、5 5的概率都为的概率都为1/3,1/3,而作出而作出 2 2,3 3,6 6的概率为的概率为0 0,此,此时时V VG G=V=VG G-k=1-k=1。3 3 矩阵对策的混合策略矩阵对策的混合策略21第21页,本讲稿共39页 齐王赛马问题的对策最优解可简记为齐王赛马问题的对策最优解可简记为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 15 策论
限制150内