运筹学对策论ppt课件.ppt
《运筹学对策论ppt课件.ppt》由会员分享,可在线阅读,更多相关《运筹学对策论ppt课件.ppt(73页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、11.1 引言引言Introduction对策论(对策论(game theory)亦称博弈论,是研究具有对抗或竞争)亦称博弈论,是研究具有对抗或竞争性质现象的数学理论和方法,它既是数学的一个分支,也是性质现象的数学理论和方法,它既是数学的一个分支,也是运筹学的一个重要学科。对策论中有一个重要的概念即对策运筹学的一个重要学科。对策论中有一个重要的概念即对策行为,对策行为是指具有竞争或对抗性质的行为,在这类行行为,对策行为是指具有竞争或对抗性质的行为,在这类行为中,参加斗争或竞争的各方各自具有不同的利益和目标,为中,参加斗争或竞争的各方各自具有不同的利益和目标,各方需考虑对手的各种可能的行动方案各
2、方需考虑对手的各种可能的行动方案,并力图选择对自己最并力图选择对自己最为有利或最为合理的方案为有利或最为合理的方案 许多游戏具有特征:许多游戏具有特征:(1)有一定的规则)有一定的规则(2)有一个结果)有一个结果(3)有可供选择的策略)有可供选择的策略(4)策略与利益相互依存)策略与利益相互依存12.1.1对策论概述对策论概述12.1 引言引言对策论,不同于日常游戏,它具有理论性,应用的范围也不局对策论,不同于日常游戏,它具有理论性,应用的范围也不局限于游戏。限于游戏。对策是一些个人、对组或其它组织,面对一定的环境条件,在对策是一些个人、对组或其它组织,面对一定的环境条件,在一定的规则下,同时
3、或先后从各自允许的行为或策略中进行选一定的规则下,同时或先后从各自允许的行为或策略中进行选择并加以实施,各自取得相应结果的过程。择并加以实施,各自取得相应结果的过程。这些规则应用到经济、军事、政治等领域也有类似的特征。这些规则应用到经济、军事、政治等领域也有类似的特征。例如,市场竞争、经营决策、投资分析、价格制定、费用分摊、例如,市场竞争、经营决策、投资分析、价格制定、费用分摊、财政转移支付、投标与拍卖、对抗与追踪、资源利用、谈判、财政转移支付、投标与拍卖、对抗与追踪、资源利用、谈判、竞选、战争竞选、战争 例如,战国时代的田忌赛马、三国时代的曹不兴溅墨画蝇、例如,战国时代的田忌赛马、三国时代的
4、曹不兴溅墨画蝇、曹操兵败华容道、北宋时期的丁渭挖河修皇宫等都是对策论曹操兵败华容道、北宋时期的丁渭挖河修皇宫等都是对策论成功应用的例子。成功应用的例子。12.1 引言引言 著名法国经济学家泰勒尔(著名法国经济学家泰勒尔(Jean Tirole Jean Tirole )说:)说:“正如理正如理性预期使宏观经济学发生革命一样,对策论广泛而深远地改性预期使宏观经济学发生革命一样,对策论广泛而深远地改变了经济学家的思维方式变了经济学家的思维方式”。 是研究决策主体的行为发生直接相互作用时的决策及这种决是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。即它是研究聪明而又理智的决策者在冲
5、突或合策的均衡问题。即它是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。它作中的策略选择理论。它将成为当代经济管理学科的前沿领城。将成为当代经济管理学科的前沿领城。 对策论就是研究对策行为中斗争各方是否存在着最合理的行对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理方案的数学理论和方法。动方案,以及如何找到这个合理方案的数学理论和方法。 12.1 引言引言一个对策需要一个对策需要3个基本要素:个基本要素: (1)局中人局中人(players) (2)策略集策略集(strategies) (3)得益函数(得益函数(payoffs) 12.1.2 对策三要素
6、对策三要素),(21nssss是一个局势是一个局势 策略组策略组全体局势的集合全体局势的集合S可用各局中人的策略集的迪卡尔集表示可用各局中人的策略集的迪卡尔集表示 nSSSS2112.1 引言引言不完全信息动态对策完全信息动态对策动态对策不完全信息静态对策完全信息静态对策静态对策按对策状态多人对策二人非零和对策二人零和对策二人对策按对策人数合作对策有限理性完全理性非合作对策按对策方式对策分类12.1.3 对策的结构和分类对策的结构和分类12.1 引言引言【例【例12.1】1943年年2月,日本统帅山本五十六大将计划由南太平洋月,日本统帅山本五十六大将计划由南太平洋新不列颠群岛的拉包尔出发,新不
7、列颠群岛的拉包尔出发,3天穿过俾斯麦海,开往新几内亚的天穿过俾斯麦海,开往新几内亚的莱城,支援困守的日军。有两条路线:北线和南线。莱城,支援困守的日军。有两条路线:北线和南线。盟军统帅麦克阿瑟命令他麾下的太平洋战区空军司令肯尼将军组盟军统帅麦克阿瑟命令他麾下的太平洋战区空军司令肯尼将军组织空中打击。侦察机重点搜索有两个方案:北线和南线。织空中打击。侦察机重点搜索有两个方案:北线和南线。当时未来当时未来3天中:北线阴雨,能见度差;南线晴天,能见度佳。天中:北线阴雨,能见度差;南线晴天,能见度佳。日美双方各自应采用哪种方案日美双方各自应采用哪种方案 12.1 引言引言北线北线南线南线 日军日军盟军
8、盟军北线北线( )南线南线 ( )北线(北线( )22南线(南线( )13【解】【解】局中人:盟军、日军;双方策略:北线、南线,记为局中人:盟军、日军;双方策略:北线、南线,记为:盟军的赢得矩阵如下:盟军的赢得矩阵如下:212211,;,SS12122min32max122maxmin3122*最优策略是:最优策略是: ,即都选择北线。日军舰队即都选择北线。日军舰队受到重创,但未全歼。受到重创,但未全歼。 *1*1,双方选择的策略是:在双方选择的策略是:在最不利中选择最有利的最不利中选择最有利的策略。策略。12.1 引言引言囚徒的困境(二人非零和对策)囚徒的困境(二人非零和对策)5,50,10
9、10,01,1囚徒囚徒1囚徒囚徒2坦坦 白白 不坦白不坦白坦白坦白不坦白不坦白双方如何采取对策使结果对自己最有利?双方如何采取对策使结果对自己最有利?12.1 引言引言【例【例12.2】双寡头削价竞争(两个厂商)双寡头削价竞争(两个厂商)100,10020,150150,2070,70亚贸亚贸中南中南高高 价价 低低 价价高价高价低价低价类似地,广告投资、采用新技术等方面,厂商之间常常耗资类似地,广告投资、采用新技术等方面,厂商之间常常耗资巨大,但不一定有利可图的争夺战;对公共资源的掠夺式使巨大,但不一定有利可图的争夺战;对公共资源的掠夺式使用等问题。用等问题。我们的目的是如何利用这种困境达到
10、有利于社会,合理利我们的目的是如何利用这种困境达到有利于社会,合理利用和开发公共资源,保护环境。用和开发公共资源,保护环境。12.1 引言引言多寡头削价竞争(多寡头削价竞争(3个厂商个厂商:亚贸亚贸,中南,中北中南,中北) )100,100,10020,150,20150,20,20130,130,20亚亚 贸贸中南中南高高 价价 低低 价价高价高价低价低价20,20,15020,130,130130,20,13070,70,70亚亚 贸贸中南中南高高 价价 低低 价价高价高价低价低价中北采用高价中北采用高价中北采用低价中北采用低价12.1 引言引言【例【例12.3】动态对策:甲向乙借一万元钱
11、经营,甲许诺经营成功动态对策:甲向乙借一万元钱经营,甲许诺经营成功后分给乙总利润(后分给乙总利润(4万)的一半,乙是否借给甲?万)的一半,乙是否借给甲?乙乙甲甲借借不借不借乙乙分分不分不分(2,2)(1,0)打打乙乙不打不打(0,4)(1,0)(1,0)有法律保障有法律保障法律保障不足法律保障不足12.1 引言引言下一节:纳什均衡下一节:纳什均衡12.1 引言引言12.2 纳什均衡纳什均衡Nash Equilibrium12.2 纳什均衡纳什均衡Nash对对策论的贡献有:(对对策论的贡献有:(1)合作对策中的讨价还价模型,称)合作对策中的讨价还价模型,称为为Nash讨价还价解;(讨价还价解;(
12、2)非合作对策的均衡分析。)非合作对策的均衡分析。纳什均衡纳什均衡(Nash Equilibrium) 假定有假定有n个博弈方参加博弈,在给定其个博弈方参加博弈,在给定其他博弈方策略的条件下,每个人选择自己的最优策略(个人最优策略他博弈方策略的条件下,每个人选择自己的最优策略(个人最优策略可能依赖也可能不依赖他人策略),一起构成一个策略组合(可能依赖也可能不依赖他人策略),一起构成一个策略组合(Strategy Profile),而),而Nash均衡是这样一种策略组合,由所有参与人均衡是这样一种策略组合,由所有参与人的最优策略组成,给定别人策略的条件下,没有任何单个参与人有积的最优策略组成,给
13、定别人策略的条件下,没有任何单个参与人有积极性选择其他策略,从而没有任何人有积极性打破这种均衡,极性选择其他策略,从而没有任何人有积极性打破这种均衡,Nash均均衡是一种衡是一种“ 僵局僵局”:给定别人不动的情况下,没有人有兴趣动。:给定别人不动的情况下,没有人有兴趣动。约翰约翰纳什纳什(John F. Nash )1928年生于美国年生于美国,1994年获得诺贝尔经济学奖年获得诺贝尔经济学奖在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响弈论和经济学产生了重大影响 12.2.1 纳什均衡定义纳什均衡定义另一
14、种解释:另一种解释:假定所有博弈方事先达成一项协议,规定每个人的行假定所有博弈方事先达成一项协议,规定每个人的行为规则,在没有外在的强制力约束时,当事人会自觉遵守这个协议,为规则,在没有外在的强制力约束时,当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡:假定别人遵守协议的情况下,等于说这个协议构成一个纳什均衡:假定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。换句话说,如果没有人有积极性偏离协议规定的自己的行为规则。换句话说,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背此协议,
15、不满足参与人会违背此协议,不满足Nash均衡要求的协议是没有意义的。均衡要求的协议是没有意义的。12.2 纳什均衡纳什均衡用用G表示一个对策,若一个对策中有表示一个对策,若一个对策中有n个局中人,则每个局中人个局中人,则每个局中人可选策略的集合称为策略集,分别用可选策略的集合称为策略集,分别用 S1,S2,Sn表示;表示;Sij表示局中人表示局中人i的第的第j个策略,其中个策略,其中j可取有限个值(有限策可取有限个值(有限策略对策),也可取无限个值(无限策略对策);对策方略对策),也可取无限个值(无限策略对策);对策方i的得益的得益则用则用hi表示;表示;hi是各对策方策略的多元函数,是各对策
16、方策略的多元函数,n个局中人的对策个局中人的对策G常写成:常写成:【定义【定义12.1】 在对策在对策G=S1,S2,Sn;h1,h2hn中,如果由中,如果由各个对策方的各选取一个策略组成的某个策略组合(各个对策方的各选取一个策略组成的某个策略组合(S1*,S2*,Sn*)中,任一对策方)中,任一对策方i的策略的策略Si*,都是对其余策略方策略的组合,都是对其余策略方策略的组合(S1*,S*i-1,S*i+1,Sn*)的最佳策略,即)的最佳策略,即h i(S1*,S*i-1,Si*,S*i+1Sn*)hi(S1*,S*i-1,Sij,S*i+1,Sn*)对)对任意任意SijSi都成立,则称(都
17、成立,则称(S1*,Sn*)为)为G的一个纯策略的一个纯策略“纳什均衡纳什均衡”(Nash Equilibrium) G=S1,Sn;h1,hn12.2 纳什均衡纳什均衡各选取一个策略组成的某个策略组合构成一个各选取一个策略组成的某个策略组合构成一个局势局势,其最优局,其最优局势称为纯策略意义下的势称为纯策略意义下的最优局势最优局势【例【例12.4】 假设有三个厂商在同一市场上生产销售完全相同的假设有三个厂商在同一市场上生产销售完全相同的产品,它们各自的产量分别用产品,它们各自的产量分别用m1、m2和和m3表示,再假设表示,再假设m1、m2和和m3只能取只能取1、2、3等正整数值市场出清价格一
18、定是市场等正整数值市场出清价格一定是市场总产量总产量Q=m1+m2+m3的函数,假设该函数为:的函数,假设该函数为: 12320 (),20( ) 200,20m mQP PQQQ 不妨先假设三个厂商开始时分别生产不妨先假设三个厂商开始时分别生产3单位,单位,9单位和单位和6单位产量,单位产量,这时三厂商是否满意各自的产量,要从利润进行分析这时三厂商是否满意各自的产量,要从利润进行分析由于产量不能超过由于产量不能超过20,则第,则第i个厂商的利润函数为个厂商的利润函数为 12.2 纳什均衡纳什均衡可算出在产量组合为(可算出在产量组合为(3,9,6)时,市场价格为)时,市场价格为2,三厂商的,三
19、厂商的利润分利润分8,16和和12,再作其它产量组合时亦会有不同的结果,如,再作其它产量组合时亦会有不同的结果,如表表12.2 表表12.2 三厂商离散产量结合对应价格和利润三厂商离散产量结合对应价格和利润 m1m2m3p1233962618123863924185564202024555525252533311333333633848242412320()iiipmmmmm12.2 纳什均衡纳什均衡【定义【定义12.2】 在对策在对策G=S1,Sn;h1,hn中,局中人中,局中人i的策略集为的策略集为Si=Si1,Sik,则他以概率分布,则他以概率分布pi=(pi1,pik)随机在其随机在其
20、k个可选策略中选择的个可选策略中选择的“策略策略”称为一个混合策略,其称为一个混合策略,其中中0pij1对对j1,k都成立,且都成立,且pi1+pik=1 12.2.2混合策略纳什均衡混合策略纳什均衡12.2 纳什均衡纳什均衡【定义【定义12.3】 如果一个策略如果一个策略G=S1,Sn,h1,hn中,参中,参予者予者i的策略集为的策略集为Si=Si1,Sik,如果由各个对策方的策略组,如果由各个对策方的策略组成策略集合成策略集合G*=S1*,S2*,Sn*,其中,其中1, 2 , 1, 0|1*iimiiiimiixmixExS都是对其余对策方策略组合的最佳策略,即都是对其余对策方策略组合的
21、最佳策略,即i(S1*,S2*,,Si-1*,Si*,Sn*)i(S1*,S2*,,Si-1*,Si*,Sn*)对任意对任意SijSi都成立,则称(都成立,则称(S1*,,Sn*)为)为G的一个混合策略的一个混合策略纳什均衡纳什均衡12.2 纳什均衡纳什均衡下一节:反应函数法下一节:反应函数法作业:教材作业:教材P293 T1012.2 纳什均衡纳什均衡12.3 反应函数法反应函数法12.3 反应函数法反应函数法当得益是对策的多元连续函数时,求出每个对策方的反应函数,当得益是对策的多元连续函数时,求出每个对策方的反应函数,而各个反应函数的交点就是纳什均衡而各个反应函数的交点就是纳什均衡 【例【
22、例12.5】设】设A,B两厂家生产同样产品,厂商两厂家生产同样产品,厂商A产量为产量为q1,B产量产量为为q2,市场总产量为,市场总产量为Q=q1+q2,市场出清价格是市场总产量的函数,市场出清价格是市场总产量的函数P6Q。设产品产量的边际成本相等,。设产品产量的边际成本相等,C1=C2=2。求解两厂商的。求解两厂商的纳什均(假设产量连续可分)。纳什均(假设产量连续可分)。分析:这是一个连续产量的古诺模型,不难看出,该对策中两厂分析:这是一个连续产量的古诺模型,不难看出,该对策中两厂商各自的利润分别为各自的销售收益减去各自成本,即:商各自的利润分别为各自的销售收益减去各自成本,即:212111
23、211111142(6)(qqqqqqqqqCQpq222122212222242(6)(qqqqqqqqqCQpq212111)4(maxmax11qqqqqq)4(212*1qq)4(211*2qq12.3 反应函数法反应函数法)4(21)(221qqR)4(21)(112qqR作反应函数:作反应函数:(0,4)(0,2)(2,0)(4,0)(4/3,4/3)纳什均衡:纳什均衡:(4/3,4/3)12.3 反应函数法反应函数法【例【例12.6】 考虑上述模型的另一种情况即各厂商所选择的是价格考虑上述模型的另一种情况即各厂商所选择的是价格而不是产量,假设产量与价格的函数关系为:而不是产量,假
24、设产量与价格的函数关系为:2111121)(pdpbapq1222212)(pdpbapq其它条件不变,边际成本为其它条件不变,边际成本为C1、C2,试求解其纳什均衡。,试求解其纳什均衡。各自的策略空间为各自的策略空间为 max22max11, 0, 0PSPS两方的得益就是各自的利润两方的得益就是各自的利润 1121 11 11111111112(,)()()()h p pp qc qpc qpcab pd p2122 22 22222222222( ,)()()()h p pp qc qpc qpcab pd p12.3 反应函数法反应函数法利用得益函数在偏导数为利用得益函数在偏导数为0时
25、有最大值,各自的反应函数分别为:时有最大值,各自的反应函数分别为:)(21)(211111211pdcbabpRP)(21)(122222122pdcbabpRP)(21)(21*122222*2*211111*1pdcbabppdcbabp)(42)(41112121222221211*1cbaddbbbcbaddbbdP)(42)(42222121111121212*2cbaddbbbcbaddbbdP),(*2*1PP为该对策唯一的纳什均衡为该对策唯一的纳什均衡 12.3 反应函数法反应函数法【例【例12.7】设有】设有3个农户一起放牧羊群,现有一可供大家自由放个农户一起放牧羊群,现有一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 策论 ppt 课件
限制150内