博弈论专题幻灯片课件.ppt





《博弈论专题幻灯片课件.ppt》由会员分享,可在线阅读,更多相关《博弈论专题幻灯片课件.ppt(93页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、博弈论专题博弈论专题一、现代博弈论的简单发展史一、现代博弈论的简单发展史 博弈论与诺贝尔经济学奖博弈论与诺贝尔经济学奖 二、博弈论与主流经济学的发展二、博弈论与主流经济学的发展 博弈论对经济学的影响博弈论对经济学的影响三、非合作博弈理论三、非合作博弈理论 非合作博弈的非技术性简要概述非合作博弈的非技术性简要概述 一、现代博弈论简单发展史一、现代博弈论简单发展史19441944年数学家冯诺伊曼(年数学家冯诺伊曼(VonNeumann)与经济)与经济学家摩根斯坦学家摩根斯坦(Morgenstein)合著的合著的博弈论与经博弈论与经济行为济行为19501950年,年,Tucker最先提出并研究了最先
2、提出并研究了“囚徒困境囚徒困境”19501950年,年,Nash发表了发表了“n n人博弈中的均衡点人博弈中的均衡点”-奠奠基性论文基性论文二、二、博弈论与主流经济学的发展博弈论与主流经济学的发展传统微观经济学与博弈论的比较传统微观经济学与博弈论的比较传统微观经济学传统微观经济学的个人决策是在给定一个价格参数和收入的个人决策是在给定一个价格参数和收入的条件下最大化自己的效用,个人的效用与其他人无关,的条件下最大化自己的效用,个人的效用与其他人无关,所有其他人的行为都被总结在所有其他人的行为都被总结在“价格价格”参数之中参数之中博弈论博弈论中,个人效用不仅依赖于自己的选择,还以来于他中,个人效用
3、不仅依赖于自己的选择,还以来于他人的选择,研究在存在外部经济条件下的个人选择问题人的选择,研究在存在外部经济条件下的个人选择问题行为主体的数量通常不多,相互之间存在明显影响行为主体的数量通常不多,相互之间存在明显影响二、二、博弈论与主流经济学的发展博弈论与主流经济学的发展国外经济学教科书改写,加入大量博弈论内容国外经济学教科书改写,加入大量博弈论内容博弈论进入主流经济学,其研究对象:博弈论进入主流经济学,其研究对象:转向个体放弃了某些没有微观基础的假设转向个体放弃了某些没有微观基础的假设转向人与人之间行为的相互影响和作用转向人与人之间行为的相互影响和作用重视对信息的研究重视对信息的研究传统微观
4、经济学的工具是数学传统微观经济学的工具是数学(微积分、线性代微积分、线性代数、统计学数、统计学),而博弈论是一种新的分析工具。,而博弈论是一种新的分析工具。二、二、博弈论与主流经济学的发展博弈论与主流经济学的发展博弈论研究对象博弈论研究对象:当成果无法由个体完全掌握,而结局须视群体共同决策当成果无法由个体完全掌握,而结局须视群体共同决策而定时,个人为了取胜,应该采取什么策略而定时,个人为了取胜,应该采取什么策略方法论:方法论:经济学、政治学、管理、军事、外交、国际关系、经济学、政治学、管理、军事、外交、国际关系、公共选择、犯罪学公共选择、犯罪学“深蓝深蓝”和和“更深的蓝更深的蓝”使用动态博弈理
5、论使用动态博弈理论编写程序,后来战胜了无敌的卡斯帕罗夫编写程序,后来战胜了无敌的卡斯帕罗夫企业、政府与商业环境博弈论与竞争策略 “要想在现代社会做一个有文化的人,你必要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解须对博弈论有一个大致了解”保罗保罗萨缪尔森萨缪尔森Paul.Samuelson曾经戏说:你甚至可以使一只鹦曾经戏说:你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是习的只有两个词,那就是“供给供给”和和“需求需求”博弈论学者博弈论学者Kandori俏皮地作了引申:现在这只俏皮地作了引申:现在这只鹦
6、鹉需要再学习一个词,那就是鹦鹉需要再学习一个词,那就是“纳什均衡纳什均衡”博弈论在现代经济学中的重要地位、作用和影响博弈论在现代经济学中的重要地位、作用和影响三、三、非合作博弈理论非合作博弈理论著名案例著名案例囚徒困境(囚徒困境(prisonersdilemma)个人理性最终导致集体理性的缺失个人理性最终导致集体理性的缺失三、三、非合作博弈理论非合作博弈理论博弈:博弈:决策主体在互相对抗中,对抗双方决策主体在互相对抗中,对抗双方(或多方或多方)互互相依存的一系列策略和行动的过程集合相依存的一系列策略和行动的过程集合参与人的利益有冲突参与人的利益有冲突博弈是一个过程集合博弈是一个过程集合(参与人
7、、策略、行动、参与人、策略、行动、信息等信息等)。思维从具体到抽象思维从具体到抽象本质特征是策略的相互依存性本质特征是策略的相互依存性博弈论:博弈论:专门研究博弈如何出现均衡的规律的专门研究博弈如何出现均衡的规律的学问学问三、三、非合作博弈理论非合作博弈理论博弈论的基本要素博弈论的基本要素:参与人、行动参与人、行动、信息、战略、支付函数、信息、战略、支付函数、结果结果、均、均衡衡博弈有不同的种类博弈有不同的种类:从行动顺序角度:从行动顺序角度:静态博弈静态博弈动态博弈动态博弈从拥有信息角度:从拥有信息角度:完全信息博弈完全信息博弈不完全信息博弈不完全信息博弈博弈的关键三要素博弈的关键三要素:参
8、与人、策略空间、收益函数(支付函数)参与人、策略空间、收益函数(支付函数)博弈信息博弈信息:影响最后博弈结局的所有参与人的情报影响最后博弈结局的所有参与人的情报“完美信息完美信息”-确定的结果确定的结果“不完美信息不完美信息”-概率期望概率期望依据支付结果依据支付结果分为零和博弈、常和博弈以及变和分为零和博弈、常和博弈以及变和博弈博弈非合作博弈理论非合作博弈理论静态静态动态动态完全信息完全信息完全信息静态博弈完全信息静态博弈纳什均衡纳什均衡纳什(纳什(19501950,19511951)完全信息动态博弈完全信息动态博弈子博弈精炼纳什均衡子博弈精炼纳什均衡泽尔腾(泽尔腾(19651965)不完全
9、信息不完全信息不完全信息静态博弈不完全信息静态博弈贝叶斯纳什均衡贝叶斯纳什均衡海萨尼海萨尼(1967196719681968)不完全信息动态博弈不完全信息动态博弈精炼贝叶斯纳什均衡精炼贝叶斯纳什均衡泽尔腾(泽尔腾(19751975)KrepsKreps和和WilsonWilson(19821982)FudenbergFudenberg和和Tirole Tirole(19911991)非合作博弈理论非合作博弈理论(一)完全信息静(一)完全信息静态态博弈:博弈:纳纳什均衡什均衡NashEquilibriumANashequilibrium,namedafterJohnNash,isasetofst
10、rategies,oneforeachplayer,suchthatnoplayerhasincentivetounilaterallychangeheraction.Playersareinequilibriumifachangeinstrategiesbyanyoneofthemwouldleadthatplayertoearnlessthanifsheremainedwithhercurrentstrategy.Forgamesinwhichplayersrandomize(mixedstrategies),theexpectedoraveragepayoffmustbeatleasta
11、slargeasthatobtainablebyanyotherstrategy.纳什均衡,纳什均衡,一个策略集合,其中每个参与人没有动机一个策略集合,其中每个参与人没有动机去单方面改变自己的行动。任何一个人改变策略都会获去单方面改变自己的行动。任何一个人改变策略都会获得更少,这就是纳什均衡。对于随机化的参与人,期望得更少,这就是纳什均衡。对于随机化的参与人,期望或平均支付至少与其他任何策略一样大或平均支付至少与其他任何策略一样大(一)(一)完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡纳什均衡的重要性:纳什均衡的重要性:任何任何“合理合理”结果都要满足的条件结果都要满足的条件当某一参与
12、人发现他单方面改变战略可以获当某一参与人发现他单方面改变战略可以获取更多时,他会毫不犹豫地改变自己的战略,博弈取更多时,他会毫不犹豫地改变自己的战略,博弈自然就没有达到均衡自然就没有达到均衡一种制度安排要发生效力,必须是纳什均衡,否则,一种制度安排要发生效力,必须是纳什均衡,否则,这种制度安排就没有效力这种制度安排就没有效力(一)(一)完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡囚徒困境的几个事例:囚徒困境的几个事例:价格大战价格大战两个寡头企业选择产量两个寡头企业选择产量公共产品的供给公共产品的供给军备竞赛军备竞赛做广告做广告围观时踮脚尖围观时踮脚尖应试教育应试教育污染。污染。196
13、8年,格雷特年,格雷特哈丁成功地将哈丁成功地将“囚徒困境囚徒困境”与资源耗竭结合起来与资源耗竭结合起来,揭示了生态环境问题与囚徒困揭示了生态环境问题与囚徒困境的相似之处。境的相似之处。贸易自由与壁垒,地方保护主义贸易自由与壁垒,地方保护主义(一)(一)完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡个人理性与集体理性的冲突个人理性与集体理性的冲突各人追求利己行为而导致的最终结局是一个各人追求利己行为而导致的最终结局是一个“纳什均纳什均衡衡”,也是对所有人都不利的结局,也是对所有人都不利的结局从利己目的出发,结果损人不利己从利己目的出发,结果损人不利己合作是有利的合作是有利的“利己策略利己策
14、略”,但它必须符合以下黄金,但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是按同样方式行事才行。也就是“己所不欲勿施于人己所不欲勿施于人”。占优战略均衡:占优战略均衡:(dominant-strategyequilibrium)反映了所有人的绝对偏好,因此十分稳定。但这种情况较少见。又称为上策均衡。重复剔除的占优战略均衡重复剔除的占优战略均衡混合战略纳什均衡混合战略纳什均衡(一一)完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡基本分析思路和方法例例2:智猪博弈:智猪博弈(boxedpigs)
15、(一)(一)完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡小猪小猪按按等待等待大猪大猪按按等待等待5,14,49,-10,0猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位例例3 3:性别战:性别战(battleofsexes)女女足球足球芭蕾芭蕾男男足球足球芭蕾芭蕾2,10,00,01,2先动优势所形成的“解”形成的机会(一)(一)完
16、全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡例例4:斗鸡博弈:斗鸡博弈(chickengame)(胆小鬼博弈胆小鬼博弈)B进进退退A进进退退-3,-32,00,20,0(一)(一)完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡例例5:进入阻挠:进入阻挠(entrydeterrance)(一)(一)完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡在位者在位者默许默许斗争斗争进入者进入者进入进入不进入不进入40,50-10,00,3000,300(一)(一)完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡-混合战略纳什均衡混合战略纳什均衡有些博弈不存在有些博弈不存在(纯策略的纯
17、策略的)纳什均衡纳什均衡社会福利博弈之例:不存在纳什均衡社会福利博弈之例:不存在纳什均衡猜谜游戏之例:不存在纳什均衡猜谜游戏之例:不存在纳什均衡B正面正面反面反面A正面正面反面反面-1,11,-11,-1-1,1流浪汉流浪汉找工作找工作游荡游荡政政府府救济救济不救济不救济3,2-1,3-1,10,0(一)(一)完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡-混合战略纳什均衡混合战略纳什均衡纯战略:纯战略:参与人在每一个给定信息的情况下只选择一个特定的行动参与人在每一个给定信息的情况下只选择一个特定的行动混合战略:混合战略:参与人在每一个给定信息的情况下以某种概率分布随机地选参与人在每一个
18、给定信息的情况下以某种概率分布随机地选择不同的行动择不同的行动“流浪汉流浪汉”的纳什均衡:政府以的纳什均衡:政府以0.50.5救济,流浪汉以救济,流浪汉以0.20.2找工找工作作一个参与人使用混合策略的好处是给对方造成不确定性一个参与人使用混合策略的好处是给对方造成不确定性海萨尼对混合战略的解释:混合战略等价于不完全信息下的海萨尼对混合战略的解释:混合战略等价于不完全信息下的纯战略纯战略1.纳什均衡的存在性纳什均衡的存在性2.纳什均衡的多重性纳什均衡的多重性促成纳什均衡的方法促成纳什均衡的方法Cheap talk 重复博弈重复博弈但并不保证必然出现纳什均衡但并不保证必然出现纳什均衡(一)(一)
19、完全信息静态博弈:纳什均衡完全信息静态博弈:纳什均衡可能存在多个纳什均衡,如果某种情况不可能出可能存在多个纳什均衡,如果某种情况不可能出现现(如,不可信的威胁如,不可信的威胁),则可剔除之。精炼,缩,则可剔除之。精炼,缩小了小了“解解”的个数的个数如果是动态博弈,从每一个行动选择开始到博弈如果是动态博弈,从每一个行动选择开始到博弈结束又构成一个博弈,即结束又构成一个博弈,即“子博弈子博弈”子博弈精炼纳什均衡:子博弈精炼纳什均衡:当只当参与人的战略在当只当参与人的战略在每一个子博弈中都构成纳什均衡每一个子博弈中都构成纳什均衡承诺行动:承诺行动:当事人使自己的威胁变得可信的行当事人使自己的威胁变得
20、可信的行动动(二)(二)完全信息动态博弈:完全信息动态博弈:子博弈精炼纳什均衡子博弈精炼纳什均衡扩展式表述博弈的纳什均衡博弈树:房地产开发博弈IA开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4信息集:房地产博弈IIA开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)N1N2B1B2B3B4信息集:房地产博弈IIIA开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,
21、8)(0,0)(0,1)(0,0)N1N2B1B2B3B4信息集:房地产博弈IVN大小开不开开不开开发不开发开不开开不开开不开(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)B1B2A1A2A3A4逆向归纳法开不开开不开开不开(-3,-3)(1,0)(0,1)(0,0)ABB子博弈精炼纳什均衡子博弈精炼纳什均衡扩展式博弈的战略组合扩展式博弈的战略组合s*=(s1*,si*,sn*)是一个是一个子博弈精炼纳什均衡,如果:子博弈精炼纳什均衡,如果:(1)它是原博弈的纳什均衡;它是原博弈的纳什均衡;(2)它在每个子博弈上给出纳什均衡它在每个子博弈上给出纳什均衡一个
22、战略组合是一个战略组合是子博弈精炼纳什均衡,当只当它在子博弈精炼纳什均衡,当只当它在每个子博弈上都构成纳什均衡每个子博弈上都构成纳什均衡子博弈精炼纳什均衡子博弈精炼纳什均衡均衡路径均衡路径构成子博弈精炼纳什均衡的战略不仅在均衡路径构成子博弈精炼纳什均衡的战略不仅在均衡路径上是最优的,而且在非均衡路径上也是最优的。上是最优的,而且在非均衡路径上也是最优的。这是纳什均衡与子博弈精炼纳什均衡的实质区别这是纳什均衡与子博弈精炼纳什均衡的实质区别只有当一个战略规定的行动规则在所有可能的情只有当一个战略规定的行动规则在所有可能的情况下都是最优的时,它才是一个合理的、可置信况下都是最优的时,它才是一个合理的
23、、可置信的战略的战略序贯理性:序贯理性:不论过去发生了什么,参与人应该在博弈的每一不论过去发生了什么,参与人应该在博弈的每一个时点上最优化自己的决策个时点上最优化自己的决策有同时选择的两阶段动态博弈有同时选择的两阶段动态博弈假设有两个阶段,在每个阶段有两个参与人同时选择(静态博弈)。(两个子博弈)银行挤兑(1)王则柯王则柯“银行挤兑的成因和预防银行挤兑的成因和预防”银行挤兑(2)日期日期1客户客户2客户客户1抽回抽回不抽回不抽回抽回抽回70,70100,40不抽回不抽回40,100下一日期下一日期日期日期2客户客户2客户客户1抽回抽回不抽回不抽回抽回抽回140,140180,100不抽回不抽回
24、100,180140,140银行挤兑(3)日期1客户2客户1抽回不抽回抽回70,70100,40不抽回40,100140,140重复博弈和无名氏定理重复博弈和无名氏定理序贯博弈:序贯博弈:不同阶段的博弈结构不同不同阶段的博弈结构不同重复博弈:重复博弈:同样结构的博弈重复多次,其中每同样结构的博弈重复多次,其中每次博弈称为次博弈称为“阶段博弈阶段博弈”当博弈重复无限次时当博弈重复无限次时,存在着完全不同于一次,存在着完全不同于一次博弈的子博弈精炼纳什均衡博弈的子博弈精炼纳什均衡无名氏定理:无名氏定理:有一个一次博弈有一个一次博弈G可作为某无穷可作为某无穷博弈的一个阶段,博弈的一个阶段,G有纳什均
25、衡,对于无限博有纳什均衡,对于无限博弈,一定存在一个贴现因子,使无限博弈的结弈,一定存在一个贴现因子,使无限博弈的结果不劣果不劣(弱优弱优)于于G的纳什均衡结果的纳什均衡结果不确定环境下的重复博弈不确定环境下的重复博弈寡头市场上,低需求时容易使他们都选择寡头市场上,低需求时容易使他们都选择“合作合作”,但在高需求时,利润的诱惑使他们都选择,但在高需求时,利润的诱惑使他们都选择“背叛背叛”。这种情况可以重复。这种情况可以重复能同甘却不能共苦,似乎有道德谴责的意味,但能同甘却不能共苦,似乎有道德谴责的意味,但这一现象总是发生,发生的逻辑是什么?博弈论这一现象总是发生,发生的逻辑是什么?博弈论可以解
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 专题 幻灯片 课件

限制150内