第7章:对策论.ppt
《第7章:对策论.ppt》由会员分享,可在线阅读,更多相关《第7章:对策论.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 1 章:对策论章:对策论1.1 1.1 基本概念基本概念一、竞争现象一、竞争现象 各种比赛:体育、棋类等比赛。各种比赛:体育、棋类等比赛。政治方面:外交谈判。政治方面:外交谈判。经济方面:贸易谈判,争夺市场,各种经营竞争等。经济方面:贸易谈判,争夺市场,各种经营竞争等。工业生产方面:多创价值。工业生产方面:多创价值。例例1-1.1-1.齐王与田忌赛马:他们各有上等、中等、下等马各一匹,且同级马,齐王比田忌强些。双方齐王与田忌赛马:他们各有上等、中等、下等马各一匹,且同级马,齐王比田忌强些。双方 约定:每局比赛三场,每负一场者应付约定:每局比赛三场,每负一场者应付1 1千金,且每匹马都应参
2、加比赛。结果田忌以千金,且每匹马都应参加比赛。结果田忌以 O O:3 3 输了后请教孙膑,则采用如下策略反败为胜,结果田忌二胜一负,实得输了后请教孙膑,则采用如下策略反败为胜,结果田忌二胜一负,实得1 1千金。千金。齐王齐王田忌田忌上等马上等马上等马上等马中等马中等马中等马中等马下等马下等马下等马下等马败败胜胜胜胜1例例1-2.1-2.两小孩玩石头、剪刀、布的游戏:甲、乙两小孩出的手势都有可能是石头、剪刀、布,两小孩玩石头、剪刀、布的游戏:甲、乙两小孩出的手势都有可能是石头、剪刀、布,若他们三次出的手势如下图,则乙小孩二胜一负。若他们三次出的手势如下图,则乙小孩二胜一负。甲小孩甲小孩乙小孩乙小
3、孩石头石头石头石头剪刀剪刀剪刀剪刀布布布布败败胜胜胜胜二、竞争现象的特点二、竞争现象的特点 双方均有理智:为击败对手,可随机应变改变策略双方均有理智:为击败对手,可随机应变改变策略(多为保密多为保密)。实力强者:稳扎稳打以优势取胜。实力强者:稳扎稳打以优势取胜。实力弱者:避开对方优势锋芒,打击对方弱点取胜。实力弱者:避开对方优势锋芒,打击对方弱点取胜。在经济管理对策中:把非理智的客观世界设想为在经济管理对策中:把非理智的客观世界设想为“理智人理智人”,并与之斗争。,并与之斗争。三、对策论的概念三、对策论的概念 研究竞争现象的一种定量分析理论。研究竞争现象的一种定量分析理论。三、对策论的起源三、
4、对策论的起源 1 1 我国古代围棋比赛和我国古代围棋比赛和1717世纪欧洲国际象棋比赛世纪欧洲国际象棋比赛 形成模拟模型。形成模拟模型。2 19122 1912年,数学家翟墨罗发表论文年,数学家翟墨罗发表论文“把集合论应用于象棋的博奕理论把集合论应用于象棋的博奕理论”,把对策从模拟模型把对策从模拟模型抽象为抽象为数学模型。数学模型。3 3 第一次世界大战期间,产生了军事对策第一次世界大战期间,产生了军事对策(战役、战略、军事装备等战役、战略、军事装备等)。4 19444 1944年,冯年,冯诺意曼与经济学家摩根斯特恩合写诺意曼与经济学家摩根斯特恩合写“对策论与经济行为对策论与经济行为”,把对策
5、论把对策论应用于应用于经济管经济管理。理。5 5 我国公元前六世纪我国公元前六世纪(春秋春秋)“)“孙子兵法孙子兵法”1313篇。篇。2四、对策四、对策 参加竞争的各方为了取胜,而研究出一组对付对方的策略。参加竞争的各方为了取胜,而研究出一组对付对方的策略。五、对策的三要素五、对策的三要素 1 1 局中人:参加竞争,并有决策权的各方局中人:参加竞争,并有决策权的各方(二人或多人二人或多人)。如:齐王和田忌。如:齐王和田忌。2 2 策略:策略:在一局竞争中,每一局中人均有供他选择的实际可行的完整行动方案。在一局竞争中,每一局中人均有供他选择的实际可行的完整行动方案。如例如例1-11-1,齐王有,
6、齐王有6 6个策略:个策略:(上中下上中下),(上下中上下中),(),(中上下中上下),(),(中下上中下上),(),(下上中下上中),(),(下中上下中上)田忌有田忌有6 6个策略:个策略:(上中下上中下),(上下中上下中),(),(中上下中上下),(),(中下上中下上),(),(下上中下上中),(),(下中上下中上)如例如例1-21-2,甲小孩有,甲小孩有3 3个策略:个策略:石头,剪刀,布石头,剪刀,布 乙小孩有乙小孩有3 3个策略:个策略:石头,剪刀,布石头,剪刀,布 3 3 一局对策的得失:局中人的得失。叫支付函数,对有限策略集,叫支付一局对策的得失:局中人的得失。叫支付函数,对有限
7、策略集,叫支付矩阵矩阵。如:齐王出策略如:齐王出策略(上中下上中下),田忌出策略田忌出策略(中上下中上下),则齐王二胜一负,赢得则齐王二胜一负,赢得1 1千金;千金;田忌损失田忌损失1 1千金。千金。六、局势六、局势 每个局中人从各自的策略集合中选取一个策略参加对策,形成的一个处于竞争的策略组。每个局中人从各自的策略集合中选取一个策略参加对策,形成的一个处于竞争的策略组。如:齐王选策略如:齐王选策略(上中下上中下),田忌选策略田忌选策略(中上下中上下),构成一个局势,构成一个局势(上中下上中下),(中上下中上下)。局势的得失总和为局势的得失总和为0 0。七、对策的分类七、对策的分类3对对策策动
8、动态态对对 策策静静态态对对 策策结结盟盟对对 策策不不结结盟盟对对 策策微分对策微分对策联合对策联合对策合作对策合作对策有有限限无无限限二人二人多人多人二人二人多人多人零和零和非零和非零和零和零和非零和非零和零和零和非零和非零和零和零和非零和非零和41.2 1.2 支付矩阵有鞍点的支付矩阵有鞍点的二人有限零和对策二人有限零和对策一、特点一、特点 1 1 策略公开。策略公开。2 2 得失确定且总和为零:一方所得必为另一方所失,局中人利益冲突得失确定且总和为零:一方所得必为另一方所失,局中人利益冲突(对抗对策对抗对策)。3 3 单局竞争决定胜负。单局竞争决定胜负。二、建模二、建模:建立支付函数,
9、这里是支付矩阵建立支付函数,这里是支付矩阵(也叫矩阵对策问题也叫矩阵对策问题)设局中人甲有设局中人甲有m m个纯策略个纯策略 S S甲甲=1 1,2 2,m m,局中人局中人乙乙有有n n个纯策略个纯策略 S S乙乙=1 1,2 2,n n。纯局势纯局势(i i,j j)得失为得失为a aijij:当:当a aijij0 0时,时,甲甲赢得赢得a aijij,乙损失乙损失a aijij;当当a aijij0 0时,时,甲损失甲损失-a aijij,乙乙赢得赢得-a aijij。构成支付矩阵构成支付矩阵 A A:对策可写成对策可写成 G=G=甲,乙,甲,乙,S S甲甲,S S乙乙,AA。5 如例
10、如例1-1.1-1.齐王与田忌赛马:齐王与田忌赛马:1 1(上中下上中下)2 2(上下中上下中)3 3(中上下中上下)4 4(中下上中下上)5 5(下上中下上中)6 6(下中上下中上)1 1(上中下上中下)3 31 11 11 11 1-1-1 2 2(上下中上下中)1 13 31 11 1-1-11 1 3 3(中上下中上下)1 1-1-13 31 11 11 1 4 4(中下上中下上)-1-11 11 13 31 11 1 5 5(下上中下上中)1 11 1-1-11 13 31 1 6 6(下中上下中上)1 11 11 1-1-11 13 3齐王齐王田忌田忌a aijij则支付矩阵为:则
11、支付矩阵为:6 如例如例1-2.1-2.两小孩玩游戏:两小孩玩游戏:1 1(石头石头)2 2(剪刀剪刀)3 3(布布)1 1(石头石头)0 01 1-1-1 2 2(剪刀剪刀)-1-10 01 1 3 3(布布)1 1-1-10 0甲甲乙乙a aijij则支付矩阵为:则支付矩阵为:7例例1-3.1-3.某单位秋季要决定冬季取暖用煤的贮量。冬季用煤贮量在较暖、正常和较冷情况下分为某单位秋季要决定冬季取暖用煤的贮量。冬季用煤贮量在较暖、正常和较冷情况下分为 1010、1515和和2020吨。设冬季煤价也随寒冷程度而变,在上述三种情况下分别为吨。设冬季煤价也随寒冷程度而变,在上述三种情况下分别为34
12、0340、420420和和500500元元/吨,吨,已知秋季煤价为已知秋季煤价为340340元元/吨,冬季气象未能予知,问秋季合理贮煤量为多少?吨,冬季气象未能予知,问秋季合理贮煤量为多少?解:建模,设局中人甲为:贮煤量决策者;解:建模,设局中人甲为:贮煤量决策者;局中人乙为:未来冬季气候。局中人乙为:未来冬季气候。费用总和费用总和=秋季贮煤量费用秋季贮煤量费用+冬季补购煤量费用冬季补购煤量费用 1 1(较暖较暖)2 2(正常正常)3 3(较冷较冷)1 1(10(10 吨吨)-(10340)=-3400-(10340)=-3400-(10340+5420)=-5500-(10340+5420)
13、=-5500-(10340+10500)=-8400-(10340+10500)=-8400 2 2(15 15 吨吨)-(15340)=-5100-(15340)=-5100-(15340)=-5100-(15340)=-5100-(15340+5500)=-7600-(15340+5500)=-7600 3 3(20 20 吨吨)-(20340)=-6800-(20340)=-6800-(20340)=-6800-(20340)=-6800-(20340)=-6800-(20340)=-6800甲甲乙乙a aijij则支付矩阵为:则支付矩阵为:8二、求解二、求解 1 1 稳妥性原则稳妥性原
14、则 局中人在公开对策的前提下,都从最坏处着想,在最坏的环境中争取最好的结果。局中人在公开对策的前提下,都从最坏处着想,在最坏的环境中争取最好的结果。例例1-4 1-4 某企业决定由职工代表大会选举行政负责人,经提名产生候选人甲和乙。他们根据企业的某企业决定由职工代表大会选举行政负责人,经提名产生候选人甲和乙。他们根据企业的 发展战略和群众关心的事业各自提出了企业改革的方案。甲提出了四种:发展战略和群众关心的事业各自提出了企业改革的方案。甲提出了四种:1 1,2 2,3 3,4 4;乙提出了三种:乙提出了三种:1 1,2 2,3 3。他们的参谋人员为使竞争对本方有利,予先作了个民意抽样。他们的参
15、谋人员为使竞争对本方有利,予先作了个民意抽样 测验。因各方提供的不同策略对选票吸引力不同。测验选票经比较后差额如下表测验。因各方提供的不同策略对选票吸引力不同。测验选票经比较后差额如下表 (单位单位:十张十张):1 1 2 2 3 3 1 1-4-40 0-6-6 2 23 32 24 4 3 316161 1-9-9 4 4-1-11 17 7甲甲乙乙a aijij问:甲和乙在竞选中应采用何种策略?问:甲和乙在竞选中应采用何种策略?解:对策时,双方均理智,且发挥主动性。解:对策时,双方均理智,且发挥主动性。最后,甲用最后,甲用 2 2竞选,领先竞选,领先2O2O票优势;票优势;乙只能用乙只能
16、用 2 2竞选,缩短票数差距。竞选,缩短票数差距。双方均认为只能如此,为双方妥协结果。双方均认为只能如此,为双方妥协结果。支付矩阵中:支付矩阵中:每行选最小值,这些最小值中选最大值每行选最小值,这些最小值中选最大值V V1 1;-6-62 2-9-9-1-1每列选最大值,这些最大值中选最小值每列选最大值,这些最大值中选最小值V V2 2;16162 27 7若若 V V1 1=V=V2 2,则得最优解。则得最优解。9 2 2 稳妥性原则数学表达:稳妥性原则数学表达:对甲而言是最小最大原则:从支付矩阵每行元素中取最小数,再从这些最小数中取最大数,得对甲而言是最小最大原则:从支付矩阵每行元素中取最
17、小数,再从这些最小数中取最大数,得 对乙而言是最大最小原则:从支付矩阵每列元素中取最大数,再从这些最大数中取最小数,得对乙而言是最大最小原则:从支付矩阵每列元素中取最大数,再从这些最大数中取最小数,得 若若V V1 1=V=V2 2=V=VG G,则稳妥原则实现,则稳妥原则实现,V VG G为支付矩阵的稳定值为支付矩阵的稳定值即鞍点值,对应的纯策略即鞍点值,对应的纯策略 i i*,j j*为为 甲甲、乙的最优纯策略乙的最优纯策略,局势局势(i i*,j j*)为对策的最优解,即:为对策的最优解,即:鞍点鞍点 行元素行元素变化趋势变化趋势列元素列元素变化趋势变化趋势如例如例1-3.1-3.-84
18、00-8400-7600-7600-6800-6800-3400-3400-5100-5100-6800-6800 甲用策略甲用策略 3 3,乙,乙用策略用策略 3 3,即即 秋季购进煤秋季购进煤2O2O吨,总费用最低为吨,总费用最低为68OO68OO元。元。10例例1-5 1-5 某厂工程师设计了三个矿石冶炼某厂工程师设计了三个矿石冶炼(或选矿或选矿)流程,考虑到它们的所用设备和工艺环节等因素,流程,考虑到它们的所用设备和工艺环节等因素,若付诸实施可会遇上生产正常和生产不正常两种情况若付诸实施可会遇上生产正常和生产不正常两种情况,这两种情况的出现及其概率未能予知,这两种情况的出现及其概率未能
19、予知,但三个流程在这两种情况下的单位支付费用已算出,如下表,问:选用哪个流程较好但三个流程在这两种情况下的单位支付费用已算出,如下表,问:选用哪个流程较好?1 1(生产正常生产正常)2 2(生产不正常生产不正常)1 1(流程流程1)1)-1.5-1.5-1.7-1.7 2 2(流程流程2)2)-1.4-1.4-1.8-1.8 3 3(流程流程3)3)-1.4-1.4-1.7-1.7甲甲乙乙a aijij解:有二个鞍点局势解:有二个鞍点局势(1 1,2 2)和和(3 3,2 2)甲用甲用 1 1,乙用,乙用 2 2;甲用甲用 3 3,乙用,乙用 2 2 最小支付费用为:最小支付费用为:1.7(1
20、.7(百元百元/吨吨)。所以应选所以应选“流程流程1 1”或或“流程流程3”3”。-1.7-1.7-1.8-1.8-1.7-1.7-1.4-1.4-1.7-1.7三、鞍点对策问题两个性质三、鞍点对策问题两个性质 1 1 解的稳定性解的稳定性 对策的最终结局可在支付矩阵中得到双方均认可的妥协,对策的最终结局可在支付矩阵中得到双方均认可的妥协,双方均认识到在原有策略中存在最优策略。双方均认识到在原有策略中存在最优策略。2 2 对策的公开性对策的公开性 双方均明确并可公开申明参加对策的最优策略,最优局势是双方妥协的结果,双方均明确并可公开申明参加对策的最优策略,最优局势是双方妥协的结果,反映双方策略
21、的实力。反映双方策略的实力。111.3 1.3 支付矩阵无鞍点的支付矩阵无鞍点的二人有限零和对策二人有限零和对策一、特点一、特点 1 1 策略保密性:图谋出奇制胜。策略保密性:图谋出奇制胜。2 2 得失随机性:某局竞争的胜败难于予料,强者可败,弱者可胜。得失随机性:某局竞争的胜败难于予料,强者可败,弱者可胜。3 3 多局竞争性:多局竞争后决定胜负。多局竞争性:多局竞争后决定胜负。二、建模二、建模:建立得失期望值函数建立得失期望值函数 1 1 混合策略混合策略 设局中人甲有设局中人甲有m m个纯策略个纯策略 S S甲甲=1 1,2 2,m m,局中人乙有局中人乙有n n个纯策略个纯策略 S S乙
22、乙=1 1,2 2,n n。纯局势纯局势(i i,j j)得失为得失为a aijij,构成的支付矩阵构成的支付矩阵A A无鞍点无鞍点。G=G=甲,乙,甲,乙,S S甲甲,S S乙乙,AA。设甲以设甲以 x x1 1,x,x2 2,x xm m 的的概率取纯策略概率取纯策略 1 1,2 2,m m,则称概率向量则称概率向量 X X =(=(x x1 1,x,x2 2,x xm m)为甲的一个混合策略为甲的一个混合策略,x xi i00,x x1 1+x+x2 2+x xm m=1=1,甲的混合策略集记为甲的混合策略集记为 S S(m)(m);设乙以设乙以 y y1 1,y,y2 2,y yn n
23、 的概率取纯策略的概率取纯策略 1 1,2 2,n n,则称概率向量则称概率向量 Y Y =(=(y y1 1,y,y2 2,y yn n )为乙的一个混合策略,为乙的一个混合策略,y yi i00,y y1 1+y+y2 2+y yn n=1=1,乙的混合策略集记为乙的混合策略集记为 T T(n)(n)。2 2 混合局势混合局势 (X,Y)(X,Y)称为称为混合局势混合局势。3 3 得失期望值得失期望值12 如例如例1-2.1-2.两小孩共玩了两小孩共玩了1010局游戏对策,最后总计谁胜谁负,设这局游戏对策,最后总计谁胜谁负,设这1010次游戏中:次游戏中:甲随机出了甲随机出了 3 3次石头
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 策论
限制150内