《博弈论通讲》PPT课件.ppt
《《博弈论通讲》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《博弈论通讲》PPT课件.ppt(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 目目 录录第一章 博弈论概述n第一篇第一篇 非合作博弈理论非合作博弈理论第二章 完全信息静态信息博弈-纳什均衡第三章 完全信息动态搏弈-子博弈精炼纳什均衡第四章 不完全信息静态博弈-贝叶斯纳什均衡第五章 不完全信息动态博弈-精练贝叶斯纳什均衡第一章第一章 博弈论概述博弈论概述-人生处处皆博弈人生处处皆博弈博弈论(博弈论(game theorygame theory,又译为对策论,游戏,又译为对策论,游戏论)论)定义:研究决策主体的行为在直接定义:研究决策主体的行为在直接相互作用相互作用时,人时,人们如何进行决策、以及这种决策如何达到均衡。们如何进行决策、以及这种决策如何达到均衡。开始于开始于
2、-冯冯.诺曼(诺曼(Von Neumann)Von Neumann)与摩根斯坦与摩根斯坦(Morgenstern)(Morgenstern)在在19441944年合作的博弈论与经济行年合作的博弈论与经济行为(为(The Theory of Games and Economic The Theory of Games and Economic Behaciour)Behaciour)19941994年年纳什,纳什,泽尔腾,海萨尼因研究博弈论而获得泽尔腾,海萨尼因研究博弈论而获得当年的诺贝尔经济学奖当年的诺贝尔经济学奖博弈论由此而被大家所熟知博弈论由此而被大家所熟知1994,1996,2001,2
3、005年博弈论四摘诺贝尔经济学奖年博弈论四摘诺贝尔经济学奖1.博弈论多学科交叉领域n博弈论研究的是:当成果无法由个体完博弈论研究的是:当成果无法由个体完全掌握,而结局须视群体共同决策而定全掌握,而结局须视群体共同决策而定时,个人为了取胜,应该采取什么策略时,个人为了取胜,应该采取什么策略n博弈论成为通用方法论,经济学、政治博弈论成为通用方法论,经济学、政治学、管理、军事、外交、国际关系、公学、管理、军事、外交、国际关系、公共选择、犯罪学共选择、犯罪学n“深蓝深蓝”和和“更深的蓝更深的蓝”使用动态博弈使用动态博弈理论编写程序,后来战胜了无敌的卡斯理论编写程序,后来战胜了无敌的卡斯帕罗夫帕罗夫2.
4、为什么会有博弈?n博弈:决策主体在互相对抗中,对抗双博弈:决策主体在互相对抗中,对抗双方方(或多方或多方)互相依存的一系列策略和行互相依存的一系列策略和行动的过程集合动的过程集合n参与人的利益有冲突参与人的利益有冲突n博弈是一个过程集合博弈是一个过程集合(参与人、策略、行动、参与人、策略、行动、信息等信息等)。把博弈视为集合是思维从具体到。把博弈视为集合是思维从具体到抽象的重要一步抽象的重要一步n博弈的一个本质特征是策略的相互依存性博弈的一个本质特征是策略的相互依存性n博弈论:专门研究博弈如何出现均衡的博弈论:专门研究博弈如何出现均衡的规律的学问规律的学问3.博弈论概念因素n博弈论分为合作博弈
5、和非合作博弈博弈论分为合作博弈和非合作博弈n合作博弈是指当事人达成了彼此合作协议合作博弈是指当事人达成了彼此合作协议n非非合作博弈合作博弈是指一种参与者不可能达成具是指一种参与者不可能达成具有约束力的协议的博弈类型,这是一种具有约束力的协议的博弈类型,这是一种具有互不相容的情形。非合作博弈研究人们有互不相容的情形。非合作博弈研究人们在利益相互影响的局势中如何选决策使自在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题己的收益最大,即策略选择问题。n博弈论的基本概念包括:参与人、行动、博弈论的基本概念包括:参与人、行动、信息、战略、支付函数、结果、均衡信息、战略、支付函数、结果、均
6、衡4.博弈论的要素n参与人参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。n行动行动是指参与人的决策变量。n战略战略是指参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。这里,“犯”与“不犯”是两种不同的行动。战略规定了什么时候选择“犯”,什么时候选择“不犯”。n信息信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。由于博弈是由不同特征和行为知识的人来进行的,所以博弈中要研究的主要内容是对手人。如打麻将,要判断对手有什么牌,并根据其特征判断其可能会编排什么和
7、,以决定自己的战略对策。如果只根据自己的牌来编排怎样去和,而不考虑对手可能有什么大和正在编排之中,不做相宜的应对,则必将失去利益(必输)。4.博弈论的要素n支付函数支付函数是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数,是每个参与人真正关心的东西。n结果结果是指博弈者感兴趣的要素的集合。n均衡均衡是所有参与人的最优战略或行动的组合博弈分析目的是使用博弈规则(参,行,结)决定均衡。5.5.博弈论的条件博弈论的条件1 1、博弈论是两个或两个以上参与者之间的对策论、博弈论是两个或两个以上参与者之间的对策论2 2、参与人具有理性人假设、参与人具有理性人假设理性人是指一个很好定义的偏好,
8、在面临定的约束理性人是指一个很好定义的偏好,在面临定的约束条件下最大化自己的偏好。条件下最大化自己的偏好。博弈论说起来有些绕嘴,但理解起来很好理解,博弈论说起来有些绕嘴,但理解起来很好理解,那就是每个对弈者在决定采取哪种行动时,不但要那就是每个对弈者在决定采取哪种行动时,不但要根据自身的利益的利益和目的行事,而且要考虑到根据自身的利益的利益和目的行事,而且要考虑到他的决策行为对其他人可能的影响,通过选择最佳他的决策行为对其他人可能的影响,通过选择最佳行动计划,来寻求收益或效用的最大化。行动计划,来寻求收益或效用的最大化。6.博弈的数学表述(标准式)例如:在两个寡头产量博弈里,企业是参与人,产量
9、q是战略空间,利润u是支付。战略式表述博弈为:G=q10,q20;u1(q1,q2),u2(q1,q2)7.博弈论的种类n博弈有不同的种类:博弈有不同的种类:n从行动顺序角度:从行动顺序角度:n静态博弈静态博弈。参与人同时选择行动参与人同时选择行动非同时行动但非同时行动但后行动者并不知道前行动者采取了什么具体行后行动者并不知道前行动者采取了什么具体行动动;n动态博弈。参与人的行动有先后顺序动态博弈。参与人的行动有先后顺序且后行动且后行动者能够观察先行动者选择的行动。者能够观察先行动者选择的行动。n从拥有信息角度:从拥有信息角度:n完全信息博弈。每个参与人对所有其他参与人完全信息博弈。每个参与人
10、对所有其他参与人的特征、战略空间、支付函数有准确的知识的特征、战略空间、支付函数有准确的知识n不完全信息博弈。不完全信息博弈。n8.博弈的划分:行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950,1951)完全信息动态博弈子博弈精练纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈精练贝叶斯纳什均衡泽尔腾(1965)Kreps 和Wilson(1982)Fudenberg 和Tirole(1991)第二章完全信息静态信息博弈-纳什均衡n一.博弈的基本模型n二.占优战略均衡,重复剔除的占优均衡,混合战略纳什均衡n三.
11、纳什均衡应用举例案例1-囚徒困境-纳什均衡 n囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑1年;如果两人都坦白,各判8年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判10年。于是,每个囚徒都面临两种选择:坦白或抵赖。案例1-囚徒困境-纳什均衡设定条件:(1)每个局中人都知道博弈规则和博弈结果的支付矩阵;(2)每个局中人都是理性的(个人理性和个人最优决策);(3)不能“串通”案例1-囚徒困境-纳什均衡n有限博弈1、参与人的个数是有限的;2、每个参与人可选的战略是有限的。n两个人
12、有限博弈的战略表述可以用矩阵形式表述:案例1-囚徒困境-纳什均衡-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵赖坦白抵赖-8大于-100大于-1对于两个囚徒总体而言,他们设想的最好的策略可能是都对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时,都要冒不交代。但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,很大的风险,代价很大代价很大(坦白,坦白)是纳什均衡(坦白,坦白)是纳什均衡囚徒困境的性质:囚徒困境的性质:个人理性和集体理性的矛盾;个人的个人理性和集体理性的矛盾;个人的“最优策略最优策略”使整个使整个“系统系统”处于不利的状态。
13、处于不利的状态。从从“纳什均衡纳什均衡”引出引出“看不见的手看不见的手”(国富论)的(国富论)的一个悖论:从利己目的出发,结果损人不利己。一个悖论:从利己目的出发,结果损人不利己。“纳什均衡纳什均衡”提出的悖论动摇了经济学的基石。提出的悖论动摇了经济学的基石。从从“纳什均衡纳什均衡”还可以悟出:合作是有利的还可以悟出:合作是有利的“利己利己策略策略”,但它必须符合以下黄金律:按照你愿意别,但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是行事才行。也就是“己所不欲勿施于人己所不欲勿施于人”。完全信息静态博
14、弈:纳什均衡n囚徒困境的几个事例:囚徒困境的几个事例:n价格大战(电视机)价格大战(电视机)n两个寡头企业选择产量两个寡头企业选择产量n公共产品的供给公共产品的供给n军备竞赛军备竞赛n做广告做广告n围观时踮脚尖围观时踮脚尖n应试教育应试教育n污染。污染。1968年,格雷特年,格雷特哈丁成功地将哈丁成功地将“囚徒的困囚徒的困境境”与资源耗竭结合起来与资源耗竭结合起来,揭示了生态环境问题与揭示了生态环境问题与囚徒困境的相似之处。囚徒困境的相似之处。n贸易自由与壁垒,地方保护主义贸易自由与壁垒,地方保护主义案例2:智猪博弈n假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应
15、的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的分别是9个单位和1个单位;大猪小猪同时到槽边,吃到的食物分别是7个单位和3个单位;小猪先到槽边,则大猪吃6个单位小猪吃4个单位。5,14,49,-10,0等待小猪小猪大猪大猪按等待按案例2-智猪博弈4大于10大于-1智猪博弈的例子n股市大户和小户(小户跟大户)n大企业与小企业(创新研发模仿)n公共产品供给(富户修路,穷户不修)n划线法划线法:横向,如果“列”选中一个策略,在我的最佳策略下划线;纵向,如果“行”选中一个策略,在我的最佳策略下划线。某个策略组合中的两个支付之下都有横线
16、,此即较为可能的解。如果这种解只有一组,此即上策均衡。完全信息静态博弈:纳什均衡基本分析思路和方法四纳什均衡n寻找纳什均衡0,44,05,34,00,45,33,53,56,6C2R1R2C1C3R3参与人B参与人A(R3,C3)是纳什均衡)是纳什均衡n例例3 3:性别战:性别战(battleofsexes)女女足球足球 芭蕾芭蕾男男足球足球芭蕾芭蕾2,10,00,01,2案例3.性别站条件:两个人都不愿意分开两个纳什均衡 先动优势所形成的“解”形成的机会案例四案例四 斗鸡博弈斗鸡博弈(chickengame)(胆小鬼博弈胆小鬼博弈)n有两人狭路相逢,每人有两个行动选择:一是退下来,一是进攻。
17、如果一方退下来,而对方没有退下来,对方获得胜利,这人就很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两人都前进,那么则两败俱伤。因此,对每个人来说,最好的结果是,对方退下来,而自己不退n例例4:斗鸡博弈:斗鸡博弈(chickengame)(胆小鬼胆小鬼博弈博弈)案例四斗鸡博弈B进进 退退A进进退退-3,-32,00,20,0斗鸡博弈的例子n公共产品供给:富人修路修与不修(公共产品供给可能是囚徒困境也有可能是智猪博弈更有可能是斗鸡博弈,根据现实情况)n冷战期间美苏抢地盘n警察与游行队伍n夫妻吵架案例五案例五:进入阻挠进入阻挠(entryd
18、eterrance)n这是产业组织经济学中的一个例子设想有一个垄断企业已在市场上(称为在位者),另一个企业虎视眈眈想进入(进入者)在位者想保持自己的垄断地位,所以就要阻挠进入者进入n在这个博弈中,进入者有两种战略可以选择:进入还是不进入;在位者也有两种战略:默许或斗争假定进入之前垄断利润为,进入之后寡头利润合为(各得),进入成本为各种战略组合下的支付矩阵亦可列表n例:进入阻挠例:进入阻挠(entrydeterrance)案例五进入阻碍在位者在位者默许默许 斗争斗争进入者进入者进入进入不进入不进入40,50-10,00,3000,300n这个博弈中有两个纳什均衡,即(进入,默许),(不进入,斗争
19、)为什么(进入,默许)是纳什均衡?因为给定进入者进入,在位者选择默许时得单位利润,选择斗争时得不到利润,所以,最优战略是默许。类似的,给定在位者选择默许,进入者的最优战略就是进入尽管在进入者选择不进入时,默许和斗争对在位者是一个意思,只有当在位者选择斗争时,不进入才是进入者的最优选择,所以,(不进入,斗争)是一个纳什均衡,而(不进入,默许)不是一个纳什均衡。n纳什均衡是完全信息静态博弈的一般概念,纳什均衡是完全信息静态博弈的一般概念,也是也是所有所有其他类型博弈的基本要求其他类型博弈的基本要求n占优战略均衡占优战略均衡n占优战略均衡就是指所有结果中只有一个占优战略均衡就是指所有结果中只有一个最
20、优解最优解n如果所有参与人都有占优战略存在,则占如果所有参与人都有占优战略存在,则占优战略均衡是可以预测到的惟一的均衡囚优战略均衡是可以预测到的惟一的均衡囚徒困境中,坦白坦白就是占优战略徒困境中,坦白坦白就是占优战略n占优战略只要求自己理性,不要求自己知占优战略只要求自己理性,不要求自己知道对方是不是理性道对方是不是理性1.2纳什均衡n占优战略均衡占优战略均衡:不论其他人采取什么策略,A之某策略的结果结果总是最高,即为“占优战略”(dominant-strategy)。如果一个博弈的某个策略组合中的所有策略都是各方的上策,那么这个策略组合将是所有人都愿意选择的,必然是比较稳定的结果,这是“占优
21、战略均衡”(dominant-strategyequilibrium)。反映了所有人的绝对偏好,因此十分稳定。占优战略均衡(Dominant-Strategy)n占优战略均衡n定义:在博弈的战略表达式中,如果对于所有的i,Si*是i的占优战略,下列战略组合称为占优战略均衡:占优战略均衡(Dominant-Strategy)40004000,4000400080008000,0 00 0,800080000 0,0 0不开发开发商A开发不开发开发-3000-3000,-3000-300010001000,0 00 0,100010000 0,0 0不开发开发商B开发商A开发不开发开发开发商B需求
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论通讲 博弈论 PPT 课件
限制150内