运筹学对策论.ppt
《运筹学对策论.ppt》由会员分享,可在线阅读,更多相关《运筹学对策论.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、运筹学对策论现在学习的是第1页,共78页2 在日常生活中,我们经常看到一些相互之间的竞争、比在日常生活中,我们经常看到一些相互之间的竞争、比赛性质的现象,如下棋、打扑克、体育竞赛等赛性质的现象,如下棋、打扑克、体育竞赛等。在经济领域,各国之间的贸易谈判,各公司、企在经济领域,各国之间的贸易谈判,各公司、企业之间的市场争夺,各公司、企业之间的加工、订货、业之间的市场争夺,各公司、企业之间的加工、订货、合作谈判等等,都是竞争现象。合作谈判等等,都是竞争现象。在政治方面,国际上政府间的各种外交谈判,各方在政治方面,国际上政府间的各种外交谈判,各方都想在谈判中处于有利地位,争取到对自己有利的结果。都想
2、在谈判中处于有利地位,争取到对自己有利的结果。各国之间或国内各集团之间的战争,是一种你死我活的各国之间或国内各集团之间的战争,是一种你死我活的斗争,双方都千方百计要战胜对方。斗争,双方都千方百计要战胜对方。现在学习的是第2页,共78页3 例:例:两个儿童玩的两个儿童玩的“石头石头剪子剪子布布”游戏和我游戏和我国古代的国古代的“齐王赛马齐王赛马”就是典型的对策论研究的例子。就是典型的对策论研究的例子。在这类行为中,参加斗争或竞争的各方各自具有不在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益,为了达到各自的目标和利益各方必须考同的目标和利益,为了达到各自的目标和利益各方必须考虑对手的各
3、种可能的行动方案,并力图选取对自己最为有虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案,对策论就是研究对策行为中斗争各利或最为合理的方案,对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。的行动方案的数学理论和方法。现在学习的是第3页,共78页4二、二、对策问题的三个基本要素对策问题的三个基本要素 (1 1)局中人局中人:在一场竞赛或斗争中,每一个有决策权在一场竞赛或斗争中,每一个有决策权的参与者的参与者(个人或集团个人或集团)称为一个局中人。只有两个局中称为一个局
4、中人。只有两个局中人的对策现象称为人的对策现象称为“两人对策两人对策”,而多于两个局中人的对,而多于两个局中人的对策称为策称为“多人对策多人对策”。(2)策略策略:一个对策中,每个局中人都有供他选:一个对策中,每个局中人都有供他选择的实际可行的完整的行动方案,我们把一个局中人择的实际可行的完整的行动方案,我们把一个局中人一个可行的自始至终通盘筹划的行动方案,称为这个一个可行的自始至终通盘筹划的行动方案,称为这个局中人的一个局中人的一个策略策略。如果在一个对策中,每个局中人都。如果在一个对策中,每个局中人都只有有限个策略,则称为只有有限个策略,则称为“有限对策问题有限对策问题”,否则称,否则称为
5、为“无限对策问题无限对策问题”。现在学习的是第4页,共78页5 (3)赢得函数(支付函数)赢得函数(支付函数):一局对策结束时的结:一局对策结束时的结果(如收入或支出)称为果(如收入或支出)称为得失得失。每个局中人在一局对策结。每个局中人在一局对策结束时的得失,不仅与该局中人自身所选择的策略有关,束时的得失,不仅与该局中人自身所选择的策略有关,而且与全体局中人所取定的一组策略有关。所以,一局而且与全体局中人所取定的一组策略有关。所以,一局对策结束时每个局中人的对策结束时每个局中人的“得失得失”是全体局中人所取定是全体局中人所取定的一组策略的函数,通常称作的一组策略的函数,通常称作赢得函数赢得函
6、数(支付函数)(支付函数)。把每个局中人各自所取的一个策略所组成的策略组称为把每个局中人各自所取的一个策略所组成的策略组称为“局势局势”,于是,于是“得失得失”是是“局势局势”的函数。的函数。现在学习的是第5页,共78页6第二节第二节 矩阵对策的基本定理矩阵对策的基本定理 特点特点:局中人只有局中人只有两人两人,分别用分别用局中人局中人和和局中人局中人表示,表示,双方都只有有限个策略可供选择,双方都只有有限个策略可供选择,局中人的局中人的“得失得失”相加等于零,这种对策称为相加等于零,这种对策称为“零零和对策和对策”。在两人有限零和对策中,。在两人有限零和对策中,局中人局中人的所获等于的所获等
7、于局局中人中人的所失。假定在局势的所失。假定在局势(i,j)下下(即即局中人局中人取策略取策略i,局中人局中人取策略取策略j 时所形成的局势时所形成的局势),局中人局中人的收入或赢的收入或赢得是得是ai j(“aij”是负数时,表示是负数时,表示局中人局中人是支出)。是支出)。的策略集为:的策略集为:的策略集为:的策略集为:一、矩阵对策的数学模型一、矩阵对策的数学模型现在学习的是第6页,共78页7 用矩阵表示为用矩阵表示为(称为称为局中人局中人的的赢得矩阵赢得矩阵或局或局中人中人的的支付矩阵支付矩阵):我我们们称称两两人人有有限限零零和和对对策策为为矩矩阵阵对对策策,记记为为:G G,;S S
8、1 1,S,S2 2;AA 或或 G GSS1 1,S S2 2;AA。现在学习的是第7页,共78页8例例1:设有设有矩阵对策矩阵对策,局中人,局中人的支付矩阵如下:的支付矩阵如下:如果各局中人都不想冒险,必须考虑对方会选如果各局中人都不想冒险,必须考虑对方会选择策略使他得到最差的收入。因此各局中人都选择择策略使他得到最差的收入。因此各局中人都选择理智的决策行为。理智的决策行为。解:解:3 3 1 4 3现在学习的是第8页,共78页9 局中人局中人的各种策略的最差收入是支付阵中各种的各种策略的最差收入是支付阵中各种策略所对应行的最小数。如果不存侥幸心理,他对每策略所对应行的最小数。如果不存侥幸
9、心理,他对每个策略只能期望得到最差的收入。即:个策略只能期望得到最差的收入。即:那么为了得到尽可能好的结局,只能从这些最小数之那么为了得到尽可能好的结局,只能从这些最小数之中的找最大者(中的找最大者(最大的最小者最大的最小者),即选择能在最差的可能),即选择能在最差的可能结果中得到最好结果的策略。即:结果中得到最好结果的策略。即:8,2,9,3即选择策略即选择策略2。现在学习的是第9页,共78页10 同样,局中人同样,局中人的各种策略的最差收入(最大支的各种策略的最差收入(最大支出)是支付矩阵中各列的最大数,即:出)是支付矩阵中各列的最大数,即:局中人局中人选择这些最大数中的最小者。即:选择这
10、些最大数中的最小者。即:16,2,5即选择策略即选择策略2。的最优策略为的最优策略为2,的最优策略为的最优策略为2。现在学习的是第10页,共78页11 定义定义:设设G GSS1 1,S S2 2;AA为矩阵对策为矩阵对策,其中其中S S1 11 1,2 2,m m,S S2 21 1,2 2,n n。A=A=(aij)mnmn,若满,若满足等式足等式:则称纯局势则称纯局势(i*i*,j*j*)为为G G在纯策略下的解(或在纯策略下的解(或平衡局势)。记平衡局势)。记V VG Gai*j*i*j*,称,称V VG G为对策为对策G G的值的值,i*i*,j*j*分别称为局中人分别称为局中人I
11、I、IIII的最优纯策略。的最优纯策略。例例1的对策的对策G G的解为的解为(2 2,2 2),),2 2,2 2分别是分别是局中人局中人I I和和IIII的最优纯策略,的最优纯策略,V VG G=2=2。从从例例1 1中中可可以以看看出出,矩矩阵阵的的元元素素a2222既既是是所所在在行行的的最最小小元素,又是所在列的最大元素,即:元素,又是所在列的最大元素,即:现在学习的是第11页,共78页12 定理定理1:矩阵对策矩阵对策A =(aij)mnmn有解的充分必要条件有解的充分必要条件是:是:存在存在纯局势纯局势(i*i*,j*j*),使得对一切使得对一切 i=1,2,i=1,2,m,j=1
12、,2,m,j=1,2,n,n均有均有:i=1,2,3,4;j=1,2,3 将将这这一事一事实实推广到一般矩推广到一般矩阵对阵对策,可得如下定理:策,可得如下定理:证明:证明:先证充分性,由于对任意先证充分性,由于对任意i,j均有:均有:故:故:现在学习的是第12页,共78页13另一方面,对任意另一方面,对任意i,j均有:均有:所以:所以:于是:于是:所以:所以:现在学习的是第13页,共78页14再证必要性,若再证必要性,若G有解。有解。而对于所有的而对于所有的 i 而言,必存在一个而言,必存在一个i*使:使:对于所有的对于所有的 j 而言,必存在一个而言,必存在一个j*使:使:因为:因为:于是
13、:于是:现在学习的是第14页,共78页15称满足条件称满足条件 的的(i*,j*)为矩阵对策为矩阵对策G的一个的一个鞍点鞍点。但:但:于是有:于是有:故对一切的故对一切的 i,j 都有:都有:意义:意义:如果如果局中人局中人I I选择策略选择策略i*,局中人局中人IIII不选择不选择策略策略 j*,而选择策略,而选择策略j,则,则局中人局中人IIII的支付只会增多。的支付只会增多。也就是说:策略也就是说:策略j*是是IIII的最优策略。的最优策略。现在学习的是第15页,共78页16 注意:注意:一个矩阵对策一个矩阵对策G如果存在鞍点,鞍点可能不如果存在鞍点,鞍点可能不止一个。但是在不同的鞍点处
14、,支付值相等,都等于止一个。但是在不同的鞍点处,支付值相等,都等于对策的值。(对策的值。(无差异性无差异性)如果如果(i,j)以及以及(k,l l)都是对策都是对策G的鞍点,则的鞍点,则(k,j)与与(i,l l)也是该问题的鞍点。(也是该问题的鞍点。(可交换性可交换性)同样,如果同样,如果局中人局中人IIII选择策略选择策略j*,局中人局中人I I不不选择策略选择策略 i*,而选择策略,而选择策略 i,则,则局中人局中人I I的所获只的所获只会减少。也就是说:策略会减少。也就是说:策略i*是是局中人局中人I I的最优策略。的最优策略。现在学习的是第16页,共78页17G有四个鞍点:有四个鞍点
15、:对策的值为对策的值为V VG G 5。例例2:给定矩阵对策给定矩阵对策G GSS1 1,S S2 2;AA,其中:,其中:现在学习的是第17页,共78页18二、二、矩阵对策的混合策略矩阵对策的混合策略 矩阵对策矩阵对策G有鞍点时,就存在最优解有鞍点时,就存在最优解(最优纯策略最优纯策略),但,但是否一切矩阵对策问题中,各局中人都有上述意义的是否一切矩阵对策问题中,各局中人都有上述意义的最优纯策略呢最优纯策略呢?答案是否定的。答案是否定的。例例1:石头、剪刀、布石头、剪刀、布不存在上述纯策略意义下的解。不存在上述纯策略意义下的解。现在学习的是第18页,共78页19 对于该例而言,直观的看:双方
16、采用三个纯策略的对于该例而言,直观的看:双方采用三个纯策略的频率均应为频率均应为 13 :13 :13。由于每个局中人。由于每个局中人在一局对策中必取某个纯策略,因此采取任何一个在一局对策中必取某个纯策略,因此采取任何一个纯策略的概率都应是纯策略的概率都应是13。一般地,设局中人一般地,设局中人I I以概率以概率x1,x2,,xm来分别选来分别选取他的纯策略取他的纯策略1 1,2 2,m m;而局中人;而局中人IIII以概率以概率y1,y2,,yn来选用自己的纯策略来选用自己的纯策略1 1,2 2,n n。于是:。于是:令令x=(x1,x2,,xm)T ,y=(y1,y2,,yn)T 则称这样
17、的则称这样的x和和y为为局中人局中人I I、IIII的的混合策略混合策略。现在学习的是第19页,共78页20记:记:此时,当局中人此时,当局中人I I以概率以概率 xi采用采用i 时,局中人时,局中人IIII以概以概率率 yj 采用采用 j 时时,支付,支付 ai j 出现的概率为出现的概率为xi yj。于是局中人于是局中人I I收入(赢得)的期望值为:收入(赢得)的期望值为:则称则称 G GSS1 1,S S2 2;EE为为 G GSS1 1,S S2 2;AA的混合的混合扩充。扩充。现在学习的是第20页,共78页21混合策略对策矩阵可表示如下:混合策略对策矩阵可表示如下:混合策略问题的解也
18、是以混合策略问题的解也是以最大最小最大最小化化和和最小最大最小最大化化标准为根据的。标准为根据的。现在学习的是第21页,共78页22 当局中人当局中人I I选择某个混合策略选择某个混合策略 x 时,对于局中人时,对于局中人IIII的任的任意选择意选择 y,I I的期望所获至少是:的期望所获至少是:于是局中人于是局中人I I希望选择希望选择x,使上式最大,保证局中人,使上式最大,保证局中人I I的期望所获不小于:的期望所获不小于:这就是局中人这就是局中人I I的的最大最小化标准最大最小化标准。同理:当局中人同理:当局中人IIII选择某个混合策略选择某个混合策略 y 时,对于时,对于I I的的任意
19、选择任意选择 x,IIII的期望支付至多是:的期望支付至多是:于是局中人于是局中人IIII希望选择希望选择 y,使上式最小,保证局中,使上式最小,保证局中人人IIII的期望支付不多于:的期望支付不多于:这就是局中人这就是局中人IIII的的最小最大化标准最小最大化标准。现在学习的是第22页,共78页23例例1:求解矩阵对策求解矩阵对策G GSS1 1,S S2 2;AA,其中:,其中:如果令:如果令:则得问题的最优解。则得问题的最优解。解:解:设设 X=(x,1x)T,Y=(y,1y)T 且对策的值为:且对策的值为:现在学习的是第23页,共78页24另解另解:(用微分求极值的方法)(用微分求极值
20、的方法)且对策的值为:且对策的值为:现在学习的是第24页,共78页25 定义定义:G GSS1 1,S,S2 2;EE为为矩阵对策矩阵对策G GSS1 1,S,S2 2;AA的混的混合扩充合扩充,若存在,若存在(x*,y,y*)满足等式满足等式:则称则称(x*,y,y*)为为G G在混合策略下的解。称在混合策略下的解。称V VG GE(x*,y,y*)为对为对策策G G的值的值,x*,y,y*分别称为分别称为I I、IIII的最优混合策略。的最优混合策略。定理定理2:混合策略混合策略 x*和和 y*是是G的解的充分必要条件是:的解的充分必要条件是:对一切混合策略对一切混合策略 x,y有:有:称
21、称(x*,y*)是对策问题在混合策略意义下的鞍点。是对策问题在混合策略意义下的鞍点。现在学习的是第25页,共78页26当局中人当局中人I I 取纯策略取纯策略i时,记其赢得函数为时,记其赢得函数为于是于是三、矩阵对策的基本定理三、矩阵对策的基本定理当局中人当局中人IIII取纯策略取纯策略j时,记其赢得函数为时,记其赢得函数为于是于是现在学习的是第26页,共78页27则有:则有:定理定理3:混合策略混合策略 x*和和 y*是是G的解的充分必要条件是:的解的充分必要条件是:对任意的对任意的i,j有:有:现在学习的是第27页,共78页28则则证明:证明:必要性显然,只需证充分性,若对任意必要性显然,
22、只需证充分性,若对任意i,j均有:均有:即:即:所以所以x*和和 y*是是G的解。的解。现在学习的是第28页,共78页29注意到:注意到:可以写成:可以写成:于是于是定理定理3可以改述为:可以改述为:定理定理4:矩阵对策矩阵对策GS1,S2;A有解的充要条件是存在数有解的充要条件是存在数v,使得,使得 x,y 分别是下述两个不等式组的解:分别是下述两个不等式组的解:现在学习的是第29页,共78页30 定理定理5:(对策基本定理对策基本定理)任何矩阵对策)任何矩阵对策G G在混合策略下在混合策略下一定有解。一定有解。证明:证明:由由定理定理3,只需证明存在混合策略,只需证明存在混合策略 x*和和
23、 y*,使得,使得(3)式成立,为此考虑如下两个线性规划:)式成立,为此考虑如下两个线性规划:现在学习的是第30页,共78页31容易验证(容易验证(P)和()和(D)是互为对偶规划,而且)是互为对偶规划,而且 是(是(P)的一个可行解,)的一个可行解,是是(D)的一个可行解,由线性规划对偶理论可知,的一个可行解,由线性规划对偶理论可知,(P)和和(D)是都存在最优解是都存在最优解(x*,w*)和和(y*,v*),且最优值,且最优值w*=v*,即,即:i=1i=1,2,2,m,j=1,m,j=1,2,2,n.,n.现在学习的是第31页,共78页32又由:又由:可得:可得:定理定理5的证明是构造性
24、的证明,同时给出了求解方法。的证明是构造性的证明,同时给出了求解方法。现在学习的是第32页,共78页33 定理定理6:设(设(x*,y*)是矩阵对策)是矩阵对策G G解,解,v=V=VG G,则,则现在学习的是第33页,共78页34矩阵对策矩阵对策G GSS1 1,S S2 2;AA。(1)若)若(即(即A中第中第k行的每个元素行的每个元素 A中第中第 l 行的每个元素)行的每个元素)称局中人称局中人I I的策略的策略k优超于策略优超于策略 l;则可在;则可在A中中去掉第去掉第 l 行行,矩阵对策矩阵对策G G的解不变。的解不变。(2)如果:)如果:(即(即A中第中第k列的每个元素列的每个元素
25、 A中第中第l列的每个元素)列的每个元素)称局中人称局中人IIII的策略的策略k 优超于策略优超于策略l。则可在。则可在A中中去掉第第去掉第第 l 列列,矩阵对策矩阵对策G G的解不变。的解不变。优超定理:优超定理:现在学习的是第34页,共78页35第三节第三节 矩阵矩阵对策的求解对策的求解一、一、22对策的方程法对策的方程法则称则称G G为为22222222对策。对策。对策。对策。若若G没有纯没有纯策略下的解,策略下的解,则则G的的最优混合策略最优混合策略x*=(x1,x2)T,y y*=(y1,y2)T 满足下列方程组:满足下列方程组:且其中且其中v=V=VG G .现在学习的是第35页,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 策论
限制150内