运筹学对策论精.ppt
《运筹学对策论精.ppt》由会员分享,可在线阅读,更多相关《运筹学对策论精.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、运筹学对策论第1页,本讲稿共74页11.1引言引言Introduction第2页,本讲稿共74页对策论(对策论(gametheory)亦称博弈论,是研究具有对抗或竞争性质现象的)亦称博弈论,是研究具有对抗或竞争性质现象的数学理论和方法,它既是数学的一个分支,也是运筹学的一个重要学科。数学理论和方法,它既是数学的一个分支,也是运筹学的一个重要学科。对策论中有一个重要的概念即对策行为,对策行为是指具有竞争或对抗性对策论中有一个重要的概念即对策行为,对策行为是指具有竞争或对抗性质的行为,在这类行为中,参加斗争或竞争的各方各自具有不同的利益和质的行为,在这类行为中,参加斗争或竞争的各方各自具有不同的利
2、益和目标,各方需考虑对手的各种可能的行动方案目标,各方需考虑对手的各种可能的行动方案,并力图选择对自己最为有并力图选择对自己最为有利或最为合理的方案利或最为合理的方案 许多游戏具有特征:许多游戏具有特征:(1)有一定的规则)有一定的规则(2)有一个结果)有一个结果(3)有可供选择的策略)有可供选择的策略(4)策略与利益相互依存)策略与利益相互依存12.1.1对策论概述对策论概述12.1引言引言第3页,本讲稿共74页对策论,不同于日常游戏,它具有理论性,应用的范围也不局限于对策论,不同于日常游戏,它具有理论性,应用的范围也不局限于游戏。游戏。对策是一些个人、对组或其它组织,面对一定的环境条件,在
3、一定的规则下,对策是一些个人、对组或其它组织,面对一定的环境条件,在一定的规则下,同时或先后从各自允许的行为或策略中进行选择并加以实施,各自取得相应同时或先后从各自允许的行为或策略中进行选择并加以实施,各自取得相应结果的过程。结果的过程。这些规则应用到经济、军事、政治等领域也有类似的特征。这些规则应用到经济、军事、政治等领域也有类似的特征。例如,市场竞争、经营决策、投资分析、价格制定、费用分摊、财政转移例如,市场竞争、经营决策、投资分析、价格制定、费用分摊、财政转移支付、投标与拍卖、对抗与追踪、资源利用、谈判、竞选、战争支付、投标与拍卖、对抗与追踪、资源利用、谈判、竞选、战争例如,战国时代的田
4、忌赛马、三国时代的曹不兴溅墨画蝇、曹例如,战国时代的田忌赛马、三国时代的曹不兴溅墨画蝇、曹操兵败华容道、北宋时期的丁渭挖河修皇宫等都是对策论成功应操兵败华容道、北宋时期的丁渭挖河修皇宫等都是对策论成功应用的例子。用的例子。12.1引言引言第4页,本讲稿共74页 著名法国经济学家泰勒尔(著名法国经济学家泰勒尔(Jean Tirole Jean Tirole)说:)说:“正如理性预期正如理性预期使宏观经济学发生革命一样,对策论广泛而深远地改变了经济学家使宏观经济学发生革命一样,对策论广泛而深远地改变了经济学家的思维方式的思维方式”。是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡是研究
5、决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。即它是研究聪明而又理智的决策者在冲突或合作中的策略选择理问题。即它是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。它论。它将成为当代经济管理学科的前沿领城。将成为当代经济管理学科的前沿领城。对策论就是研究对策行为中斗争各方是否存在着最合理的行动方对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理方案的数学理论和方法。案,以及如何找到这个合理方案的数学理论和方法。12.1引言引言第5页,本讲稿共74页一个对策需要一个对策需要3个基本要素:个基本要素:(1)局中人局中人(players)(2)策略集策
6、略集(strategies)(3)得益函数(得益函数(payoffs)12.1.2对策三要素对策三要素是一个局势是一个局势策略组策略组全体局势的集合全体局势的集合S可用各局中人的策略集的迪卡尔集表示可用各局中人的策略集的迪卡尔集表示12.1引言引言第6页,本讲稿共74页12.1.3对策的结构和分类对策的结构和分类12.1引言引言第7页,本讲稿共74页【例【例12.1】1943年年2月,日本统帅山本五十六大将计划由南太平洋新月,日本统帅山本五十六大将计划由南太平洋新不列颠群岛的拉包尔出发,不列颠群岛的拉包尔出发,3天穿过俾斯麦海,开往新几内亚的莱城,天穿过俾斯麦海,开往新几内亚的莱城,支援困守的
7、日军。有两条路线:北线和南线。支援困守的日军。有两条路线:北线和南线。盟军统帅麦克阿瑟命令他麾下的太平洋战区空军司令肯尼将军组织空中打盟军统帅麦克阿瑟命令他麾下的太平洋战区空军司令肯尼将军组织空中打击。侦察机重点搜索有两个方案:北线和南线。击。侦察机重点搜索有两个方案:北线和南线。当时未来当时未来3天中:北线阴雨,能见度差;南线晴天,能见度佳。日美双方各天中:北线阴雨,能见度差;南线晴天,能见度佳。日美双方各自应采用哪种方案自应采用哪种方案12.1引言引言第8页,本讲稿共74页北线北线南线南线第9页,本讲稿共74页日军日军盟军盟军北线北线()南线南线()北线(北线()22南线(南线()13【解
8、】【解】局中人:盟军、日军;双方策略:北线、南线,记为局中人:盟军、日军;双方策略:北线、南线,记为:盟军的赢得矩阵如下:盟军的赢得矩阵如下:最优策略是:最优策略是:,即都选择北线。日军舰队即都选择北线。日军舰队受到重创,但未全歼。受到重创,但未全歼。双方选择的策略是:在双方选择的策略是:在最不利中选择最有利的最不利中选择最有利的策略。策略。12.1引言引言第10页,本讲稿共74页囚徒的困境(二人非零和对策)囚徒的困境(二人非零和对策)5,50,1010,01,1囚囚徒徒1囚徒囚徒2坦坦白白不坦白不坦白坦白坦白不坦白不坦白双方如何采取对策使结果对自己最有利?双方如何采取对策使结果对自己最有利?
9、12.1引言引言第11页,本讲稿共74页【例【例12.2】双寡头削价竞争(两个厂商)双寡头削价竞争(两个厂商)100,10020,150150,2070,70亚亚贸贸中南中南高高价价低低价价高价高价低价低价类似地,广告投资、采用新技术等方面,厂商之间常常耗资巨大,但类似地,广告投资、采用新技术等方面,厂商之间常常耗资巨大,但不一定有利可图的争夺战;对公共资源的掠夺式使用等问题。不一定有利可图的争夺战;对公共资源的掠夺式使用等问题。我们的目的是如何利用这种困境达到有利于社会,合理利用和开发我们的目的是如何利用这种困境达到有利于社会,合理利用和开发公共资源,保护环境。公共资源,保护环境。12.1引
10、言引言第12页,本讲稿共74页多寡头削价竞争(多寡头削价竞争(3个厂商个厂商:亚贸亚贸,中南,中北中南,中北))100,100,10020,150,20150,20,20130,130,20亚亚贸贸中南中南高高价价低低价价高价高价低价低价20,20,15020,130,130130,20,13070,70,70亚亚贸贸中南中南高高价价低低价价高价高价低价低价中北采用高价中北采用高价中北采用低价中北采用低价12.1引言引言第13页,本讲稿共74页【例【例12.3】动态对策:甲向乙借一万元钱经营,甲许诺经营成功后分给乙总利动态对策:甲向乙借一万元钱经营,甲许诺经营成功后分给乙总利润(润(4万)的一
11、半,乙是否借给甲?万)的一半,乙是否借给甲?乙乙甲甲借借不借不借乙乙分分不分不分(2,2)(1,0)打打乙乙不打不打(0,4)(1,0)(1,0)有法律保障有法律保障法律保障不足法律保障不足12.1引言引言第14页,本讲稿共74页下一节:纳什均衡下一节:纳什均衡12.1引言引言第15页,本讲稿共74页12.2纳什均衡纳什均衡NashEquilibrium第16页,本讲稿共74页12.2纳什均衡纳什均衡Nash对对策论的贡献有:(对对策论的贡献有:(1)合作对策中的讨价还价模型,称为)合作对策中的讨价还价模型,称为Nash讨价讨价还价解;(还价解;(2)非合作对策的均衡分析。)非合作对策的均衡分
12、析。纳什均衡纳什均衡(NashEquilibrium)假定有假定有n个博弈方参加博弈,在给定其他博弈方策个博弈方参加博弈,在给定其他博弈方策略的条件下,每个人选择自己的最优策略(个人最优策略可能依赖也可能不依赖略的条件下,每个人选择自己的最优策略(个人最优策略可能依赖也可能不依赖他人策略),一起构成一个策略组合(他人策略),一起构成一个策略组合(Strategy Profile),而),而Nash均衡是这样均衡是这样一种策略组合,由所有参与人的最优策略组成,给定别人策略的条件下,没有任一种策略组合,由所有参与人的最优策略组成,给定别人策略的条件下,没有任何单个参与人有积极性选择其他策略,从而没
13、有任何人有积极性打破这种均衡,何单个参与人有积极性选择其他策略,从而没有任何人有积极性打破这种均衡,Nash均衡是一种均衡是一种“僵局僵局”:给定别人不动的情况下,没有人有兴趣动。:给定别人不动的情况下,没有人有兴趣动。约翰约翰纳什纳什(JohnF.Nash)1928年生于美国年生于美国,1994年获得诺贝尔经济学奖年获得诺贝尔经济学奖在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响和经济学产生了重大影响12.2.1纳什均衡定义纳什均衡定义第17页,本讲稿共74页另一种解释:另一种解释:假定所有博弈方事先
14、达成一项协议,规定每个人的行为规则,假定所有博弈方事先达成一项协议,规定每个人的行为规则,在没有外在的强制力约束时,当事人会自觉遵守这个协议,等于说这个协在没有外在的强制力约束时,当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡:假定别人遵守协议的情况下,没有人有积极性偏离议构成一个纳什均衡:假定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。换句话说,如果一个协议不构成纳什均衡,协议规定的自己的行为规则。换句话说,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背此协议,不满足它就不可能自动实施,因为至少有一个参与人会违背此协议,不满足Nas
15、h均衡要求的协议是没有意义的。均衡要求的协议是没有意义的。12.2纳什均衡纳什均衡第18页,本讲稿共74页用用G表示一个对策,若一个对策中有表示一个对策,若一个对策中有n个局中人,则每个局中人可个局中人,则每个局中人可选策略的集合称为策略集,分别用选策略的集合称为策略集,分别用S1,S2,Sn表示;表示;Sij表示局中人表示局中人i的第的第j个策略,其中个策略,其中j可取有限个值(有限策略对策)可取有限个值(有限策略对策),也可取无限个值(无限策略对策);对策方,也可取无限个值(无限策略对策);对策方i的得益则用的得益则用hi表示;表示;hi是各是各对策方策略的多元函数,对策方策略的多元函数,
16、n个局中人的对策个局中人的对策G常写成:常写成:【定义【定义12.1】在对策在对策G=S1,S2,Sn;h1,h2hn中,如果由各个对策中,如果由各个对策方的各选取一个策略组成的某个策略组合(方的各选取一个策略组成的某个策略组合(S1*,S2*,Sn*)中,任一)中,任一对策方对策方i的策略的策略Si*,都是对其余策略方策略的组合(,都是对其余策略方策略的组合(S1*,S*i-1,S*i+1,Sn*)的最佳策略,即)的最佳策略,即hi(S1*,S*i-1,Si*,S*i+1Sn*)hi(S1*,S*i-1,Sij,S*i+1,Sn*)对任意)对任意SijSi都成立,则称(都成立,则称(S1*,
17、Sn*)为)为G的一个纯策略的一个纯策略“纳什均衡纳什均衡”(NashEquilibrium)G=S1,Sn;h1,hn12.2纳什均衡纳什均衡第19页,本讲稿共74页各选取一个策略组成的某个策略组合构成一个各选取一个策略组成的某个策略组合构成一个局势局势,其最优局势称为纯,其最优局势称为纯策略意义下的策略意义下的最优局势最优局势【例【例12.4】假设有三个厂商在同一市场上生产销售完全相同的产品,假设有三个厂商在同一市场上生产销售完全相同的产品,它们各自的产量分别用它们各自的产量分别用m1、m2和和m3表示,再假设表示,再假设m1、m2和和m3只能取只能取1、2、3等正整数值市场出清价格一定是
18、市场总产量等正整数值市场出清价格一定是市场总产量Q=m1+m2+m3的的函数,假设该函数为:函数,假设该函数为:不妨先假设三个厂商开始时分别生产不妨先假设三个厂商开始时分别生产3单位,单位,9单位和单位和6单位产量,单位产量,这时三厂商是否满意各自的产量,要从利润进行分析这时三厂商是否满意各自的产量,要从利润进行分析由于产量不能超过由于产量不能超过20,则第,则第i个厂商的利润函数为个厂商的利润函数为12.2纳什均衡纳什均衡第20页,本讲稿共74页可算出在产量组合为(可算出在产量组合为(3,9,6)时,市场价格为)时,市场价格为2,三厂商的利润分,三厂商的利润分8,16和和12,再作其它产量组
19、合时亦会有不同的结果,如表,再作其它产量组合时亦会有不同的结果,如表12.2表表12.2三厂商离散产量结合对应价格和利润三厂商离散产量结合对应价格和利润m1m2m3p1233962618123863924185564202024555525252533311333333633848242412.2纳什均衡纳什均衡第21页,本讲稿共74页【定义【定义12.2】在对策在对策G=S1,Sn;h1,hn中,局中人中,局中人i的策略集的策略集为为Si=Si1,Sik,则他以概率分布,则他以概率分布pi=(pi1,pik)随机在其)随机在其k个可个可选策略中选择的选策略中选择的“策略策略”称为一个混合策略
20、,其中称为一个混合策略,其中0pij1对对j1,k都成立,且都成立,且pi1+pik=112.2.2混合策略纳什均衡混合策略纳什均衡12.2纳什均衡纳什均衡第22页,本讲稿共74页【定义【定义12.3】如果一个策略如果一个策略G=S1,Sn,h1,hn中,参予者中,参予者i的的策略集为策略集为Si=Si1,Sik,如果由各个对策方的策略组成策略集合,如果由各个对策方的策略组成策略集合G*=S1*,S2*,Sn*,其中,其中都是对其余对策方策略组合的最佳策略,即都是对其余对策方策略组合的最佳策略,即i(S1*,S2*,,Si-1*,Si*,Sn*)i(S1*,S2*,,Si-1*,Si*,Sn*
21、)对任意对任意SijSi都成立,则称(都成立,则称(S1*,,Sn*)为)为G的一个混合策略纳什均的一个混合策略纳什均衡衡12.2纳什均衡纳什均衡第23页,本讲稿共74页下一节:反应函数法下一节:反应函数法作业:教材作业:教材P293T1012.2纳什均衡纳什均衡第24页,本讲稿共74页12.3反应函数法反应函数法第25页,本讲稿共74页12.3反应函数法反应函数法当得益是对策的多元连续函数时,求出每个对策方的反应函数,而各当得益是对策的多元连续函数时,求出每个对策方的反应函数,而各个反应函数的交点就是纳什均衡个反应函数的交点就是纳什均衡【例【例12.5】设】设A,B两厂家生产同样产品,厂商两
22、厂家生产同样产品,厂商A产量为产量为q1,B产量为产量为q2,市场总产量为市场总产量为Q=q1+q2,市场出清价格是市场总产量的函数,市场出清价格是市场总产量的函数P6Q。设产。设产品产量的边际成本相等,品产量的边际成本相等,C1=C2=2。求解两厂商的纳什均(假设产量连续可分)。求解两厂商的纳什均(假设产量连续可分)。分析:这是一个连续产量的古诺模型,不难看出,该对策中两厂商各自分析:这是一个连续产量的古诺模型,不难看出,该对策中两厂商各自的利润分别为各自的销售收益减去各自成本,即:的利润分别为各自的销售收益减去各自成本,即:第26页,本讲稿共74页12.3反应函数法反应函数法作反应函数:作
23、反应函数:(0,4)(0,2)(2,0)(4,0)(4/3,4/3)纳什均衡:纳什均衡:(4/3,4/3)第27页,本讲稿共74页12.3反应函数法反应函数法【例【例12.6】考虑上述模型的另一种情况即各厂商所选择的是价格而不是产考虑上述模型的另一种情况即各厂商所选择的是价格而不是产量,假设产量与价格的函数关系为:量,假设产量与价格的函数关系为:其它条件不变,边际成本为其它条件不变,边际成本为C1、C2,试求解其纳什均衡。,试求解其纳什均衡。各自的策略空间为各自的策略空间为两方的得益就是各自的利润两方的得益就是各自的利润第28页,本讲稿共74页12.3反应函数法反应函数法利用得益函数在偏导数为
24、利用得益函数在偏导数为0时有最大值,各自的反应函数分别为:时有最大值,各自的反应函数分别为:为该对策唯一的纳什均衡为该对策唯一的纳什均衡第29页,本讲稿共74页12.3反应函数法反应函数法【例【例12.7】设有】设有3个农户一起放牧羊群,现有一可供大家自由放牧的个农户一起放牧羊群,现有一可供大家自由放牧的草地,由于草地面积有限,只能供有限只羊群吃饱,否则就会影响草地,由于草地面积有限,只能供有限只羊群吃饱,否则就会影响到羊群的产出,假设每只羊的产出函数为到羊群的产出,假设每只羊的产出函数为成本成本C=8,且每个农户在决定自己放牧羊群数的时候并不知道其它农,且每个农户在决定自己放牧羊群数的时候并
25、不知道其它农户的决策,试求出该决策问题的纳什均衡。户的决策,试求出该决策问题的纳什均衡。【解】各农户的得益函数分别为【解】各农户的得益函数分别为第30页,本讲稿共74页12.3反应函数法反应函数法反应函数 因此该对策的纳什均衡为(因此该对策的纳什均衡为(18,18,18)下一节:有限二人零和对策下一节:有限二人零和对策 作业:教材作业:教材P293T9第31页,本讲稿共74页12.4有限二人零和对策有限二人零和对策第32页,本讲稿共74页矩阵对策就是二人有限零和对策。矩阵对策就是二人有限零和对策。通常矩阵用来表示局中人通常矩阵用来表示局中人1的赢得,局中人的赢得,局中人2的支付。的支付。12.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 策论
限制150内