MBA课程管理运筹学课件博弈论.ppt
《MBA课程管理运筹学课件博弈论.ppt》由会员分享,可在线阅读,更多相关《MBA课程管理运筹学课件博弈论.ppt(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、职称/职务:教授,兰州交通大学研究生学院副院长,硕士生导师2005年; 天津大学 管理科学与工程 博士2007年: 天津大学 控制科学与工程 博士后项目;主持国家社科基金项目1项、参与国家社科基金项目、国家自然科学基金项目各1项;主持、参与其它项目若干中国注册会计师协会会员、中国计算机协会会员、中国信息经济协会会员联系方式:13893449568(M);0931-4956163(O);行政楼609 Email: QQ:27934907个人情况介绍1、对策论概述2、完全信息静态博弈3、完全信息动态博弈4、不完全信息博弈管理运筹学 第六章 对策论1 1、对策论概述、对策论概述管理运筹学 第六章 对
2、策论Game Theory 也可译为博弈论,是研究决策主体的行为发生直接竞争、对抗、冲突等相互作用时的决策以及这种决策的均衡问题的学科。 1994 年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔腾、海萨尼。博弈论已经成为当代经济学的基石。 2005年度诺贝尔经济学奖再度颁发给研究博弈论的两位经济学家,以色列希伯莱大学的罗伯特奥曼和美国马里兰大学的托马斯谢林博弈论博大精深,它不仅在经济学领域得到广泛应用,在军事、政治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响,工程学中如控制论工程也少不了它。管理运筹学 第六章 对策论管理运筹学 第六章 对策论约翰.海萨尼美贝叶斯纳什均衡
3、约翰.纳什美纳什均衡莱因哈德.泽尔腾德子精炼纳什均衡罗伯特.奥曼以,美决策制定理论 托马斯.谢林美冲突的战略1 1、对策论的产生、对策论的产生 1944 年,冯诺依曼与摩根斯坦恩发表了题为博弈论和经济行为。二次大战前后,由于军事需要,抽象成数学模型。50年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的“核”的概念。同时,非合作对策也开始创立。纳什于1950 和1951 年发表了两篇关于非合作对策的文章,图克于1950年定义了“囚徒困境”问题。60年代,泽尔腾(1965)引入动态分析,提出“精练纳什均衡”概念。海萨尼(1967-1968)则把不完全信息引入对策论的研究。谢
4、林从经济学的角度,指出许多人们所熟知的社会交互作用可以从非合作博弈的角度来加以理解;奥曼从数学的角度也发现一些长期的社会交互作用可以利用正式的非合作博弈理论来进行深入分析。管理运筹学 第六章 对策论2 2、对策模型的组成、对策模型的组成局中人(参加者):对策的参加者。如齐王赛马例中局中人为齐王和田忌。策略:局中人在对策中对付对手的一个完整的方案。 策略集:局中人在一局对策中所有策略的全体。记为S(分为有限和无限) 局势:在对策中,每个局中人在自己的策略集中选定一策略进行对策,所组成的策略组称为局势。管理运筹学 第六章 对策论赢得函数:局势给定后,局中人的得失(是局势的函数)。 非零和:各局中人
5、的得失之和为非零 零和:各局中人的得失之和为零信息(information)与共同知识(common knowledge) 在博弈中信息信息是参与人有关博弈的知识,包括博弈相关背景的知识。完全信完全信息息是指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性;即博弈的所有信息被所有的局中人知道或者了解 共同知识共同知识是指“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道”的知识。这是关于理性人的一个很强的假定。管理运筹学 第六章 对策论3 3、对策论模型的分类、对策论模型的分类 对策分为结盟(cooperative gam
6、e)与不结盟两种(non-cooperative game); 对策按局中人数分,有两人对策和多人对策; 以结局分,有零和对策与非零和对策; 以策略分,有纯策略对策、混合策略对策、有限策略对策以及无限策略对策; 按照赢得函数的结构分,可有矩阵对策和非矩阵对策; 按照局中人对信息与共同知识的了解程度可分为完全信息博弈与不完全信息博弈; 按照局中人行动的先后顺序进行分类,博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈是指在博弈中,参与人同时选择或者虽然没有同时选择但后行动者并不知道先行动者采取了什么具体行动。动态博弈是指在博弈中,参与人的行动有先后
7、顺序,且后行动者能够观察到先行动者所选择的行动。管理运筹学 第六章 对策论管理运筹学 第六章 对策论2 2、完全信息静态博弈、完全信息静态博弈管理运筹学 第六章 对策论 完全信息静态博弈是一种最简单的博弈,“完全信息”指博弈的所有信息被所有的局中人知道或者了解;“静态”指的是所有参与人同时选择行动且只选择一次。在这里,只要每个参与人在选择自己的行动时不知道其他参与人的选择,就相当于他们在同时行动。 完全信息静态博弈分析的目的是预测博弈的均衡结果,在给定理性人假设,并且理性人是一种共同知识的前提下,每个参与人的最优战略是什么?参与人的最优战略组合是什么? 完全信息静态博弈解的一般概念是纳什均衡,
8、纳什均衡也是其他类型博弈解的基本要求。纳什均衡是著名博弈论专家纳什(John Nash)对博弈论的重要贡献之一。 纳什在1950年到1951年的两篇重要论文中,在一般意义上给定了非合作博弈及其均衡解,并证明了解的存在性。正是纳什的这一贡献奠定了非合作博弈论的理论基础。理解纳什均衡,首先从以下几个概念入手。 管理运筹学 第六章 对策论1 1、占优战略均衡、占优战略均衡 占优战(策)略是指在一些特殊的博弈中,一个参与人的最优战略可能并不依赖于其他参与人的战略选择,就是说,不论其他参与人选择什么战略,他的最优战略是唯一的。 管理运筹学 第六章 对策论例1 囚徒困境博弈论里最经典的例子之一。讲的是两个
9、嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是”坦白从宽,抗拒从严”,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判l 0年;如果都不坦白则因证据不足各判1年。用上述方法求解此对策问题。管理运筹学 第六章 对策论A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(
10、坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。原因在于: 理性的人是自私的,只关心自己减少刑期,并不在乎对方被判多少年。 反映人性的真实面:理性,相互防范背叛与彼此的不信任管理运筹学 第六章 对策论把囚徒困境放入群体中,结果会怎样呢?待宰的猴子: 一群猴子被关在笼子里,主人每天抓一只出来杀掉。每天,主人来的时候猴子都很紧张,不敢有任何举动,怕引起主人注意而被选中。当主人选定一只猴子后,其他猴子就很高兴,被选中
11、的就拼命反抗,其余的猴子幸灾乐祸。日复一日,所有猴子全部被杀。问题的困境: 如果全体猴子群起而攻之,可能全部能逃掉; 但每只猴子都不知道其余的猴子会不会和它一起反抗,如果其它的不反抗,则自己的反抗反而引起主人注意而被杀掉。管理运筹学 第六章 对策论囚徒困境的几个事例:囚徒困境的几个事例: 价格大战 两个寡头企业选择产量 公共产品的供给 军备竞赛 做广告 围观时踮脚尖 应试教育 污染。 贸易自由与壁垒,地方保护主义管理运筹学 第六章 对策论2、重复剔除的占优战略均衡、重复剔除的占优战略均衡例2 智猪博弈 猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有
12、10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。管理运筹学 第六章 对策论在这个博弈中,大猪没有占优战略,因此这个博弈不存在占优战略均衡。但小猪有一个劣战略“按”,即无论大猪作何选择,小猪选择“等待”都比选择“按”获得的支付更高。当大猪选择按时,小猪等待的支付为4,大于小猪按的支付1;当大猪选择等待时,小猪选择等待的支付0大于选择按的支付-1。所以,小猪会剔除“按”这个劣战略,而选择“等待”;大猪知道小猪会选择“等待
13、”,从而自己选择“按”,所以,可以预料博弈的结果是(按,等待)。这称为“重复剔除劣战略的占优战略均衡”,其中小猪的战略“等待”占优于战略“按”,而给定小猪剔除了劣战略“按”后,大猪的战略“按”又占优于战略“等待”。 在经济生活中,有许多“智猪博弈”的例子,人们通常把这种现象形象地称为“搭便车”。比如在股票市场上,大户是大猪,他们要进行技术分析,收集信息、预测股价走势,但大量散户就是小猪。他们不会花成本去进行技术分析,而是跟着大户的投资战略进行股票买卖,即所谓“散户跟大户”的现象。比如在工作中忙的忙死、闲得闲死。管理运筹学 第六章 对策论重复剔除严格劣战略的思路:首先,假定某个参与人存在劣战略,
14、找出这个劣战略并将其剔除,然后构造一个不包含这个劣战略的新的博弈;然后再剔除这个新的博弈中某个参与人的劣战略,构造一个新的战略;继续重复这个过程,一直到剩下一个唯一的战略组合为止。这个唯一剩下的战略组合就是这个博弈的均衡解,称为“重复剔除占优均衡” 所谓“劣战略”是指在博弈中,某一参与人可能采取的战略中,相对于其他可选择的战略,对自己不利的战略。管理运筹学 第六章 对策论例3 求解以下完全信息静态博弈模型管理运筹学 第六章 对策论管理运筹学 第六章 对策论3、纳什均衡、纳什均衡 每一个占优战略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优均衡。许多
15、不存在占优战略均衡或重复剔除的占优战略均衡的博弈,却存在纳什均衡 纳什均衡是指在均衡中,每个博弈参与人都确信,在给定其他参与人选择的战略的情况下,该参与人选择了最优战略以回应对手的战略。纳什均衡是完全信息静态博弈解的一般概念。也就是说。没有一种战略严格优于纳什均衡战略(注意:其逆定理不一定成立),即没有人有积极性偏离纳什均衡。管理运筹学 第六章 对策论例4 性别战假定谈恋爱的男女通常更愿意共度周末而不是分开活动,但是,对于周末参加什么活动,男女双方往往各自有着自己的偏好。在某个周末,有场足球赛和一场音乐会,男方喜欢看足球,而女方喜欢听音乐。现在假定:如果男方和女方分开活动,男女双方的效用都为0
16、;如果男方和女方一起去看足球赛,则男方的效用为3,而女方的效用为1;如果男方和女方一起去听音乐会,则男方的效用为1,女方的效用为3。这个博弈的收益矩阵如表所示。管理运筹学 第六章 对策论在这个博弈中,不存在占优战略均衡,也不存在重复剔除的占优战略均衡。它有两个均衡解(看足球,看足球)与(听音乐会,听音乐会)。至于最终会出现哪个结果,需要进一步的信息,比如双方的优先选择权,心理因素或其他客观条件。这个均衡是纳什均衡。管理运筹学 第六章 对策论例5 承诺行动 欧共体为了打破美国波音公司对全球民航业的垄断,曾放弃欧洲传统的自由竞争精神而对与波音公司进行竞争的空中客车公司进行战略性补贴,如表所示。 未
17、补贴时的博弈在这个博弈中,如果波音和空中客车同时进行新项目的开发时,在给定的市场需求条件下,二者的支付各为-10,因此这个博弈有两个纳什均衡(开发,不开发)或者(不开发,开发)。也就是说,一方开发,另一方不开发。这个博弈与斗鸡博弈有相似之处,如果一方进,另一方的最优战略就是退;如果一方退,另一方的最优战略就是进,都退或都进不是纳什均衡。管理运筹学 第六章 对策论下面考虑欧共体对空中客车进行补贴20个单位的情况。此时,当两家都开发时,空中客车仍然盈利10单位而不是亏损这时,不开发是空中客车的劣战略,无论波音公司开发还是不开发,空中客车的最好选择都是开发,波音公司知道空中客车无论如何将选择开发,因
18、此它最好的战略就是不开发,因此这个博弈只有一个纳什均衡(不开发,开发)。在这里,欧共体对空中客车的补贴就是使空中客车一定要开发(无论波音是否开发)的威胁变得可置信的一种“承诺行动”。管理运筹学 第六章 对策论纳什均衡具体求解步骤:第一步:在双矩阵对策(A,B)表中,对于矩阵A的每列,分别找出赢得最大的数字。并在其下划一横线;第二步:在双矩阵对策(A,B)表中,对于矩阵B的每行,分别找出赢得最大的数字,并在其下划一横线;第三步:如果表中某格的两个数字下面都被划有横线,则此格对应于两个局中人相应策略的组合就是一个(纯策略下的)纳什均衡。否则。该对策不存在纯策略下的纳什均衡试用以上方法求解上述各例题
19、管理运筹学 第六章 对策论4 4、纯策略、纯策略例6:管理运筹学 第六章 对策论例7:有交易双方公司甲和乙,甲有三个策略1,2,3;乙有三个策略1,2,3,根据获利情况建立甲方的益损值赢得矩阵。 10 -1 3 A= 12 10 -5 6 8 5问:甲公司应采取什么策略比较适合?管理运筹学 第六章 对策论相关概念相关概念 设某二人有限零和对策的策略集为S1=1,2, m,S2=1,2, n,如果等式成立 则称此公共值为对策的值,称使等式成立的纯局势( , )为对策在纯策略下的解(或均衡局势), 和 分别称为局中人I和的最优纯策略 不难看出纯策略下有解的矩阵对策,其对策的值是所在行的最小值,同时
20、也是所在列的最大值,称其为鞍点 *maxminminmaxjiijijijjiaaa*i*i*j*j管理运筹学 第六章 对策论强调、解释均衡局势的意义:强调、解释均衡局势的意义: 矩阵对策在纯策略意义下有解的充分必要条件是存在纯局势(ai* ,bj* )使得对任意局势有 aij* ai*j* ai*j 一个平衡局势(i*, j*)应具有这样的性质:当局中人I选取了纯策略i*后,局中人II为了使其所失最少,只有选择纯策略j*,否则就可能失得更多;反之,当局中人II选取了纯策略j* 后,局中人I为了得到最大的赢得也只能选取纯策略i*,否则就会赢得更少。双方的竞争在局势(i*, j*)下达到一个平衡
21、状态。管理运筹学 第六章 对策论5 5、混合策略、混合策略例例8 8 社会福利博弈社会福利博弈管理运筹学 第六章 对策论流浪汉找工作游荡政府救济3,2-1,3不救济-1,10,0混合策略相关概念混合策略相关概念(1)局中人,。(2) (3)X为的混合策略,Y为的混合策略,选定X和Y,则称(X,Y)为一个混合局势(4)对一个混合局势(X,Y) ,用E(X,Y) = XTAY 表示局中人的收益期望值(5)混合扩充的解与值 若 ,则(X*,Y*)也称在混合策略意义下的解,E(X*,Y*)为对策在混合策略下的值,X*和Y*分别称为局中人I和II的最优混合策略;管理运筹学 第六章 对策论最优混合策略的意
22、义最优混合策略的意义 直观意义是,无论局中人I或,谁不采用最优策略,谁就有可能受到不应有的损失。事实上,局中人I希望自己期望赢得E(X,Y)越大越好,而局中人则希望自己的期望付出E(X,Y)越小越好。如果局中人I不采用最优策略X*,而采用其他策略X,则只要局中人坚持采用最优策略Y*,局中人I的期望赢得不会超过他采用最优策略时的期望值。同样,如果局中人不采用最优策略Y*,而采用其他策略Y,则他的期望付出可能会更多如果一个策略(X*,Y*)同时具有以上性质,则它就是对策的解。管理运筹学 第六章 对策论混合策略的求解方法混合策略的求解方法 求解混合策略的问题有图解法、迭代法、线性方程法和线性规划法等
23、,例9 求解下列对策论模型023210101A管理运筹学 第六章 对策论最终结果为:V=1/w=6/5管理运筹学 第六章 对策论例10 两个局中人进行对策,规则是两人互相独立的各自从1、2、3这三个数字中任意选写一个数字。如果两人所写的数字之和为偶数,则局中人乙支付给局中人甲以数量为此和数的报酬;如果两人所写数字之和为奇数,则局中人甲付给局中人乙以数量为此和数的报酬。试求出其最优策略。管理运筹学 第六章 对策论即此对策的解为X* =(0.25,0.50,0.25)T,Y* =(0.25,0.50,0.25)T。VG=0。管理运筹学 第六章 对策论例11 已知赢得矩阵如下,求解此对策 注意:当某
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MBA 课程 管理 运筹学 课件 博弈论
限制150内