博弈论的理论与方法讲稿.ppt
《博弈论的理论与方法讲稿.ppt》由会员分享,可在线阅读,更多相关《博弈论的理论与方法讲稿.ppt(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、博弈论的理论与方法博弈论的理论与方法第一页,讲稿共四十六页哦1 1 博弈论的理论与发展博弈论的理论与发展 1.1.定义与问题定义与问题 n博弈论(博弈论(Game Theory),亦译),亦译“对策论对策论”、“赛局理论赛局理论”,从英文字面直译也可做,从英文字面直译也可做“游戏游戏”(Game)的理论理解。)的理论理解。n简明定义:简明定义:博弈论是关于策略相互作用的理论,研究社会活动博弈论是关于策略相互作用的理论,研究社会活动中人与人之间中人与人之间“斗智斗智”的方式和结果。的方式和结果。第二页,讲稿共四十六页哦n 从经济活动角度看:从经济活动角度看:博弈论研究的是经济主体行为方式之间的相
2、互依存,博弈论研究的是经济主体行为方式之间的相互依存,相互影响,相互作用及其所产生的各种相应的结果。相互影响,相互作用及其所产生的各种相应的结果。传统传统Micro研究效用(函数)最大化,生产(函数)研究效用(函数)最大化,生产(函数)最大化,主要涉及人与物(商品、生产要素)的最大化,主要涉及人与物(商品、生产要素)的关系,较少涉及人与人的关系。关系,较少涉及人与人的关系。当经济研究涉及人与人(企业与企业)的关系时,当经济研究涉及人与人(企业与企业)的关系时,例如厂商的价格战,博弈论就成了一个有用的分例如厂商的价格战,博弈论就成了一个有用的分析工具。析工具。第三页,讲稿共四十六页哦2.2.博弈
3、论的发展博弈论的发展博弈论产生于博弈论产生于30-50年代年代A A、19441944年,冯年,冯诺依曼、摩根斯坦恩合作发表诺依曼、摩根斯坦恩合作发表博弈博弈论与经济行为论与经济行为,将博弈论引入关于经济不确,将博弈论引入关于经济不确定性分析(预期效用概念),是博弈论正式诞定性分析(预期效用概念),是博弈论正式诞生的标志;生的标志;B B、19501950年代初,普林斯顿大学数学系在塔克教授年代初,普林斯顿大学数学系在塔克教授指导下,形成了一个博弈论研究的博士生小组,指导下,形成了一个博弈论研究的博士生小组,从从“囚徒困境囚徒困境”分析中创立了分析中创立了“纳什均衡纳什均衡”,奠,奠定了现代博
4、弈论基础。定了现代博弈论基础。第四页,讲稿共四十六页哦博弈论在博弈论在60-8060-80年代迅速发展,年代迅速发展,9090年代形成一年代形成一个大的高潮。个大的高潮。博弈论本身迅速发展,大规模进入经济分析领域,又进入博弈论本身迅速发展,大规模进入经济分析领域,又进入社会、政治、军事、国际关系研究领域,显示出极强的社会、政治、军事、国际关系研究领域,显示出极强的解释力,应用领域急剧扩张。解释力,应用领域急剧扩张。1994年,博弈论主要代表人物纳什(年,博弈论主要代表人物纳什(Nash)、豪尔)、豪尔绍尼绍尼(Harsanyi)、泽尔滕、泽尔滕(Selten)获诺奖。获诺奖。2005年,奥曼(
5、年,奥曼(RJAumann)和谢林)和谢林(TCSchelling)获诺奖。)获诺奖。第五页,讲稿共四十六页哦博弈分类及对应的均衡概念博弈分类及对应的均衡概念 行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡(NE)完全信息动态博弈子博弈精炼NE不完全信息不完全信息静态博弈贝叶斯NE不完全信息动态博弈精炼贝叶斯NE3.3.博弈的不同类型博弈的不同类型第六页,讲稿共四十六页哦乙乙Y YN N甲:5乙:5甲:10乙:0.5甲:0.5乙:10甲:2乙:2Y NY N甲甲 :局中人:局中人-博弈的参与者;博弈的参与者;:策略:策略-行动方案行动方案 :支付:支付-收益或效用;收益或效用;:信息结构
6、:信息结构-参与参与 者对者对、的了解的了解4.4.博弈模型的基本要素博弈模型的基本要素 第七页,讲稿共四十六页哦 利利用用博博弈弈论论来来分分析析寡寡头头垄垄断断厂厂商商行行为为的的基基本本方方法法是是先先构构造造出出一一个个支支付付表表或或者者支支付付矩矩阵阵,以以表表明明寡寡头头垄垄断断厂厂商商可可能能采采用用的的各各种种不不同同的的策策略略以以及及这这些些策策略略的的组组合合和和相相应应的的结结果果。假假设设A A和和B B为为两两家家寡寡头头垄垄断断的的厂厂商商,它它们们各各自自的的总总收收益益不不仅仅是是自自己己的的产产品品价价格格的的函函数数,同同样样也也是是对方的产品价格的函数
7、。对方的产品价格的函数。2 2 两人常数和博弈模型(两人常数和博弈模型(Two-person Constant-sum Game)第八页,讲稿共四十六页哦 由由于于两两家家寡寡头头垄垄断断厂厂商商共共同同面面临临着着一一个个需需求求的的价价格格弹弹性性为为一一()的的市市场场需需求求,因因此此,无无论论它它们们各各自自采采取取何何种种价价格格策策略略,两两家家寡寡头头垄垄断断厂商的总收益均等于一个常数,即:厂商的总收益均等于一个常数,即:根根据据上上述述假假定定的的条条件件建建立立起起来来的的寡寡头头垄垄断断厂厂商商的的博弈论模型,称之为博弈论模型,称之为“两人常数和博弈模型两人常数和博弈模型
8、”。第九页,讲稿共四十六页哦 现现假假定定厂厂商商A A和和厂厂商商B B都都有有两两个个可可供供选选择择的的价价格格策策略略,分分别别记记作作A A1 1、A A2 2和和B B1 1、B B2 2。据据此此,厂厂商商A A和和厂厂商商B B所所选选择择的的各各种种价价格格策策略略组组合合及及其其各各自自的的总总收收益益如如以以下下支支付表所示。付表所示。厂商厂商A A的支付表的支付表 B A B1 B2A1 a11=50 a12=100A2 a21=80 a22=120第十页,讲稿共四十六页哦 厂商厂商B B的支付表的支付表 B A B1 B2A1 b11=50 b12=0A2 b21=2
9、0 b22=-20第十一页,讲稿共四十六页哦上述支付表也可以改写为下列支付矩阵的形式:上述支付表也可以改写为下列支付矩阵的形式:第十二页,讲稿共四十六页哦 第十三页,讲稿共四十六页哦 以以上上的的矩矩阵阵运运算算表表明明,只只要要我我们们知知道道其其中中一一个个厂厂商商的的支支付付矩矩阵阵和和常常数数和和,就就可可以以通通过过运运算算得得知知另另一一个个厂厂商商的的支支付付矩矩阵阵。同同时时,只只要要从从任任一一支支付付矩矩阵阵或或厂厂商商的的总总收收益益之之和和中中减减去去常常数数和和,就就可可以以将将常常数数和和支支付付矩矩阵阵转转变变为为零零和和矩矩阵阵,即:即:第十四页,讲稿共四十六页
10、哦第十五页,讲稿共四十六页哦 两两人人零零和和博博弈弈中中的的零零和和矩矩阵阵表表明明,两两家家厂厂商商的的总总收收益益之之和和为为常常数数时时,无无论论寡寡头头垄垄断断厂厂商商采采用用何何种种价价格格策策略略,一一家家寡寡头头垄垄断断厂厂商商的的得得益益,相应地也就是另一家寡头垄断厂商的损失。相应地也就是另一家寡头垄断厂商的损失。第十六页,讲稿共四十六页哦 面面临临上上述述支支付付矩矩阵阵,如如果果寡寡头头垄垄断断厂厂商商A A是是一一个个在在决决策策时时非非常常谨谨慎慎的的风风险险回回避避者者,就就会会注注意意到到对对于于自自己己的的两两种种可可能能选选择择的的价价格格策策略略中中的的任任
11、一一种种策策略略的的采采用用,都都将将可可能能出出现现的的最最糟糟糕糕的的结结局局(即即收收益益最最小小的的结结局局)。也也就就是是说说,如如果果寡寡头头垄垄断断厂厂商商A A采采用用A A1 1,当当B B采采用用B B1 1价价格格策策略略时时,此此时时A A所所能能获获得得的的最最小小收收益益是是TRTRA A=a=a1111=50=50;如如果果A A采采用用A A2 2,B B仍仍采采 用用 B B1 1价价 格格 策策 略略 时时,A A所所 能能 获获 得得 的的 最最 小小 收收 益益 为为8080(TRTRA A=a=a2121=80=80)。因因而而,厂厂商商A A在在采采
12、用用A A1 1和和A A2 2这这两两种种价价格格策策略略所所产产生生的的最最糟糟糕糕的的结结果果中中,相相比比较较而而言言,较较好好的的结结果果还还是是TRTRA A=a=a2121=80=80,厂厂商商A A将将会会把把价价格格策策略略A A2 2作作为为自自己己的的最最优优选择。选择。第十七页,讲稿共四十六页哦 这这种种厂厂商商的的策策略略选选择择行行为为,在在博博弈弈论论中中称称为为“从从最最小小收收益益中中选选择择最最大大收收益益(Maximize Maximize the the Minimun PayoffsMinimun Payoffs)”,其数学表达式形式为:其数学表达式形
13、式为:min a1j1j=a1111=50 jmin a2j2j=a2121=80 jmax min aijij=a2121=80 i j第十八页,讲稿共四十六页哦 同同样样,对对于于寡寡头头垄垄断断厂厂商商B B来来说说,如如果果它它也也是是一一个个在在决决策策中中非非常常谨谨慎慎的的风风险险回回避避者者,也也会会在在自自己己所所选选择择的的价价格格策策略略可可能能产产生生的的最最糟糟糕糕的的结结果果中中,选择相对而言能产生较好结果的价格策略,即:选择相对而言能产生较好结果的价格策略,即:min bi1i1=b2121=20 imin bi2i2=b2222=-20 imax min bij
14、ij=b2121=20 j i第十九页,讲稿共四十六页哦 由由于于在在常常数数和和博博弈弈模模型型中中,厂厂商商A A的的得得益益即即为为厂厂商商B B的的损损失失,所所所所以以以以,也也也也可可可可以以以以直直直直接接接接利利利利用用用用厂厂厂厂商商商商A A A A的的的的支支支支付付付付矩矩矩矩阵阵阵阵来来来来分分分分析析析析厂厂厂厂商商商商B B B B的的的的选选选选择择择择行行行行为为为为。因因此此,如如果果厂厂商商B B采采用用价价格格策策略略B B1 1,厂厂商商B B的的最最大大损损失失为为8080(也也即即厂厂商商A A的的最最大大收收益益为为8080);若若厂厂商商B B
15、采采用用B B2 2这这种种价价格格策策略略,此此时时厂厂商商B B的的最最大大损损失失将将为为120120(即即厂厂商商A A的的最最大大收收益益为为120120)。为为了了从从可可以以选选择择的的策策略略所所可可能能产产生生的的最最大大损损失失中中选选择择最最小小的的损损失失,厂商厂商B B将会选择价格策略将会选择价格策略B B1 1。第二十页,讲稿共四十六页哦 这这种种“从从最最大大损损失失中中选选择择最最小小损损失失”的的厂厂商商博弈行为,用数学形式表达为:博弈行为,用数学形式表达为:max ai1i1=a2121=80 imax ai2i2=a2222=120 imin max ai
16、jij=a2121=80 j i第二十一页,讲稿共四十六页哦 将将上上述述厂厂商商A A的的“从从最最小小收收益益中中选选择择最最大大收收益益”的的行行为为和和厂厂商商B B“从从最最大大损损失失中中选选择择最最小小损损失失”的行为结合起来加以分析,则有:的行为结合起来加以分析,则有:max min amax min aijijijij=min max a=min max aijijijij=a=a21212121=80=80 i j j i i j j i 这这一一博博弈弈论论模模型型的的分分析析结结论论表表明明,厂厂商商A A和和厂厂商商B B都都一一致致地地选选择择了了它它们们各各自自的
17、的价价格格策策略略的的组组合合a a2121(或或者者b b2121),结结果果产产生生了了一一个个稳稳定定的的博博弈弈解解或或者者均衡解。均衡解。第二十二页,讲稿共四十六页哦 因因为为,此此时时a a2121=80=80,既既不不是是厂厂商商A A的的最最大大收收益益(或或者者厂厂商商B B的的最最大大损损失失),也也不不是是厂厂商商A A的的最最小小收收益益(或或者者厂厂商商B B的的最最小小损损失失)。在在博博弈弈论论中中,这这一一博博弈弈的的均均衡衡解解被被称称为为“纳纳什什均均衡衡”(Nash Nash EguilibriumEguilibrium)或或被被称称为为“鞍鞍点点”(Sa
18、ddle Saddle PointPoint)。所所谓谓“鞍鞍点点”,就就是是博博弈弈所所具具有有的的确确定定的的解解。存存在在“鞍鞍点点”的的博博弈弈,也也被被称称为为严严格格确确定定的的博博弈弈(Strictly Strictly Determined Determined GameGame)。相相应应地地,求求解解“鞍鞍点点”的的方方法法在在博博弈弈论论模模型型中中被被称称为为“极小极小极大定理极大定理”(MinMinMax TheoremMax Theorem)。)。第二十三页,讲稿共四十六页哦 最最优优混混合合策策略略的的博博弈弈模模型型中中,单单纯纯策策略略的的选选择择结结果果,支
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 理论 方法 讲稿
限制150内