矩阵对策的最优纯策略 .pdf
《矩阵对策的最优纯策略 .pdf》由会员分享,可在线阅读,更多相关《矩阵对策的最优纯策略 .pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、授课时间授课地点实到人数授课题目矩阵对策的求解授课专业班级教学目的与教学要求了解矩阵对策问题及其求解方法,以期对大家的工作、科研、学习和生活提供帮助主要内容一、 矩阵对策的数学模型二、 矩阵对策的最优纯策略三、 矩阵对策的最优混合策略重点与难点?有鞍点的矩阵对策问题及求解?没有鞍点的矩阵对策问题及求解教学方法手段(教具)案例教学参考资料韩伯棠 管理运筹学高等教育出版社胡运权 运筹学高等教育出版社刁在筠、刘桂真运筹学高教出版社课后作业与思考题教学后记没有鞍点的矩阵对策的概念及求解的理解是一个难点,每个局中人采用每种策略的概率有何实际意义,用生活中的小故事引入使得学生更容易理解和认可。名师资料总结
2、 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 9 页 - - - - - - - - - 教学过程时间分配矩阵对策的求解在众 多的对策模型中 ,占有重 要地位的 是 二人有 限零和对策(finite two-person zero-sum game ) ,又称矩阵对策。 这类对策是到目前为止在理论研究和求解方法方面都比较完善的一个对策分支。矩阵对策可以说是一类最简单的对策模型,其研究思想和方法十分具有代表性,体现了对策论的一般思想和方法,且矩阵对策的基本结果也是研究其他对策模型的基
3、础。(一)矩阵对策的数学模型矩阵对策即为二人有限零和对策。 “二人”是指参加对策的局中人有两个;“有限”是指每个局中人的策略集均为有限集;“零和”是指在任一局势下,两个局中人的赢得之和总等于零,即一个局中人的所得值恰好等于另一局中人的所失值,双方的利益是完全对抗的。 “齐王赛马”就是一个矩阵对策的例子,齐王和田忌各有 6 个策略,一局对策后,齐王的所得必为田忌的所失。一般, 用和分别表示两个局中人, 并设局中人有 m个纯策略1,m,局 中 人 有n 个 纯 策 略1,n; 则 局 中 人 和 的 策 略 集 分 别 为11,mS和21,nS。当局中人选定纯策略i和局中人选定纯策略j后,就形成了
4、一个纯局势,ij,这样的纯局势共有m n个。对任一纯局势,ij,记局中人的赢得值为ija ,称111212122212nnmmmnaaaaaaAaaa为局中人的赢得矩阵。局中人的赢得矩阵就是A。当局中人,的策略集12,S S 及局中人的赢得矩阵A确定后,一个矩阵对策也就给定了,记为12,GS SA 。在齐王赛马的例子中,齐王的赢得矩阵为:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 9 页 - - - - - - - - - 3111111311111131111113
5、11111131111113A(二)矩阵对策的最优纯策略当矩阵对策模型给定后,各局中人面临的问题便是:如何选择对自己最有利的纯策略以取得最大的赢得(或最少的损失)?例 1、甲乙乒乓球队进行团体对抗赛,每队由三名球员组成, 双方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方各选一种策略参赛。比赛共赛三局,规定每局胜者得1 分,输者得 -1 分,可知三赛三胜得3 分,三赛二胜得 1分, 三赛一胜得 -1分, 三赛三负得 -3 分。 甲队的策略集为1123,S,乙队的策略集为2123,S。 根据以往比赛的资料, 有甲队的赢得矩阵为A,111113313A请问这次比赛各队采用哪种阵容上场最为
6、稳妥? 解:由A可看出,局中人甲队的最大赢得为3,要得到这个赢得,他就应该选择策略3。由于局中人乙队的理智,他考虑到甲队打算出3的心理,于是准备用2来对付甲队,这样使得甲队反而失掉1 分, 双方都考虑到对方为使自己尽可能的少得分而所做的努力,所以双方都不存在侥幸心理,而是从各自可能出现的最不利的情形中选择一种最为有利的情况作为决策的依据,这就是所谓的“理智行为”,也就是对策双方实际上都能接受的一种稳妥方法。甲队在各纯策略下可能得到的最少赢得,即矩阵A 中每行的最小元素分别为:1,-3,-1,其中最好的结果是1,即甲队应采取策略1,无论对手采用何种策略,甲队都能保证他得赢得不会少于1,而出其他策
7、略,都有可能使甲队的赢得少于1甚至输给对方。同理,对于乙队来说,各纯策略可能带来最不利的结果,即矩阵中没列的最大元素分别为: 3,1,3,其中最好的也是1,即乙队应采取策略2,无论对手采用何种策略,乙队名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 9 页 - - - - - - - - - 都能保证他得所失值不会超过1,而选择其他策略, 都有可能是自己的所失超过1. 上述分析表明,甲队和乙队的理智行为分别是选择纯策略1和2,这时,甲队的赢得值和乙队的所失值的绝对值相等,
8、甲队得到了其预期的最少赢得1,而乙队也不会给甲队带来比1 更多的所得,相互的竞争使对策出现了一个最稳妥的结果。因此,1和2应分别为甲队和乙队的最优纯策略。定 义1 : 设12,GS S A为 一 矩 阵 对 策 , 其 中11,mS,21,nS,ijm nAa。若max minmin maxijijjjiiaa(1)成立,记其值为GV ,则称GV 为对策的值,称使( 1)成立的纯局势,ij为 G 在纯策略意义下的解(或鞍点) ,称ij和分别为局中人和的最优纯策略。定理 1: 矩阵对策12,GS SA 在纯策略意义下有解的充要条件是:存在纯局势,ij,使得对任意 ij和 ,有iji ji jaa
9、a(2)证明:先证充分性,由( 2)有maxminiji ji jjiaaa而min maxmaxminmaxminijijjiiiji jjjiaaaa所以min maxmax minijiji jjjiiaaa(3)另一方面,对任意 ij和 ,有minmaxijijijjiaaa所以max minmin maxijijjjiiaa(4)由(3) (4)可知,名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 9 页 - - - - - - - - - max minmin
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 矩阵对策的最优纯策略 2022 矩阵 对策 最优 策略
限制150内