博弈论与决策行为讲义.pptx
《博弈论与决策行为讲义.pptx》由会员分享,可在线阅读,更多相关《博弈论与决策行为讲义.pptx(107页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第2章 博弈论与决策行为你可以使鹦鹉成为训练有素的经济学你可以使鹦鹉成为训练有素的经济学家,所以它必须要学的两个词:家,所以它必须要学的两个词:“供供给给”和和“需求需求”现在它们或许可换现在它们或许可换成成“博弈博弈”和和“均衡均衡”。(萨缪尔森引)短谚(萨缪尔森引)短谚 学习目标 n博弈论概述博弈论概述n完全信息静态博弈完全信息静态博弈n完全信息动态博弈完全信息动态博弈n不完全信息静态博弈不完全信息静态博弈n不完全信息动态博弈不完全信息动态博弈 2.1 博弈论概述n什么是博弈论什么是博弈论n博弈论的基本概念博弈论的基本概念n博弈的分类博弈的分类n博弈论的发展简述博弈论的发展简述n博弈论与
2、信息经济学的关系博弈论与信息经济学的关系 1 1 什么是博弈论什么是博弈论n博弈论(博弈论(game theory):是研究决策主):是研究决策主体的行动发生直接相互作用时候的决策以及体的行动发生直接相互作用时候的决策以及这种决策的均衡问题。是专门研究博弈如何这种决策的均衡问题。是专门研究博弈如何出现均衡的规律的学科。出现均衡的规律的学科。n换句话说,博弈论研究当某一经济主体的决换句话说,博弈论研究当某一经济主体的决策既受其他经济主体的影响,而且该经济主策既受其他经济主体的影响,而且该经济主体的相应决策又反过来影响到其他经济主体体的相应决策又反过来影响到其他经济主体的决策问题和均衡问题。的决策
3、问题和均衡问题。n博弈论又称博弈论又称“对策论对策论”。在传统经济学中,谈到个人决策,就是在给在传统经济学中,谈到个人决策,就是在给定一个价格参数和收入的条件下,最大化自定一个价格参数和收入的条件下,最大化自己的效用。个人效用函数只依赖于自己的选己的效用。个人效用函数只依赖于自己的选择,而不依赖于其他人的选择。虽然经济作择,而不依赖于其他人的选择。虽然经济作为一个整体,人与人之间的选择是相互作用为一个整体,人与人之间的选择是相互作用的,但对于个体或厂商来说,所有其他人的的,但对于个体或厂商来说,所有其他人的行为都被包括在一个参数里,即价格。所以,行为都被包括在一个参数里,即价格。所以,经济主体
4、决策时,面临的似乎是一个非人格经济主体决策时,面临的似乎是一个非人格化的东西,其选择既不考虑自己的选择对他化的东西,其选择既不考虑自己的选择对他人的影响,也不考虑他人选择对自己的影响人的影响,也不考虑他人选择对自己的影响。n 而在博弈论中,个人的效用函数不仅依而在博弈论中,个人的效用函数不仅依赖于自己的选择,而且依赖于他人的选赖于自己的选择,而且依赖于他人的选择,个人的最优选择是其他人选择的函择,个人的最优选择是其他人选择的函数。数。n从这个意义上,博弈论研究的是,在存在相互从这个意义上,博弈论研究的是,在存在相互作用外部经济条件下的个人选择问题。作用外部经济条件下的个人选择问题。n人们之间决
5、策行为相互影响,广泛存在于社会人们之间决策行为相互影响,广泛存在于社会经济活动中。如,国家与国家之间的关系;中经济活动中。如,国家与国家之间的关系;中央与地方政府之间;还有家庭中的夫妻,他们央与地方政府之间;还有家庭中的夫妻,他们之间的行为也是一种博弈。之间的行为也是一种博弈。n博弈论的应用是非常广泛的。博弈论的应用是非常广泛的。2 博弈论的基本概念n博弈论的基本概念包括:博弈论的基本概念包括:1.参与人参与人2.行动行动3.战略战略4.得益(支付函数)得益(支付函数)5.信息信息6.结果结果7.均衡均衡 1.参与人n 参与人(参与人(playerplayer)指的指的是博弈中选择行动以最是博
6、弈中选择行动以最大化自己效用的决策主体。参与人可以是大化自己效用的决策主体。参与人可以是个个人,人,也可以是也可以是团体,如国家、团体,如国家、企业企业等。等。除一般意义上的参与人外,博弈论中还有除一般意义上的参与人外,博弈论中还有“虚拟参与人虚拟参与人”(pseudo playerpseudo player)自然自然(naturenature),),“自然自然”是指不以博弈参与人意是指不以博弈参与人意志为转移的外生事件,志为转移的外生事件,“自然自然”选择的是外生选择的是外生事件的各种可能现象,并用概率分布来描述事件的各种可能现象,并用概率分布来描述“自然自然”的选择机理。也可以说,自然就是
7、决定的选择机理。也可以说,自然就是决定外生的随机变量的概率分布的机制外生的随机变量的概率分布的机制.n根据参与人的数量将博弈分为:根据参与人的数量将博弈分为:“单人博弈单人博弈”、“双人博弈双人博弈”和和“多人博弈多人博弈”。n单人博弈,实质上是个体决策的最优化问题,参与单人博弈,实质上是个体决策的最优化问题,参与人拥有的信息越多,即决策的环境了解得越多,决人拥有的信息越多,即决策的环境了解得越多,决策的准确性就越高,得益也就越好。策的准确性就越高,得益也就越好。n两人博弈就是两个各自独立决策,但策略和得益具两人博弈就是两个各自独立决策,但策略和得益具有相互依存关系的博弈方的决策问题。两人博弈
8、是有相互依存关系的博弈方的决策问题。两人博弈是博弈问题中最常见,也是研究的最多的博弈类型。博弈问题中最常见,也是研究的最多的博弈类型。n三人以上的,即多人博弈。多人博弈中策略和利益三人以上的,即多人博弈。多人博弈中策略和利益的相互依存关系更为复杂。的相互依存关系更为复杂。2.行动n行动(行动(action or move)是参与人在博弈)是参与人在博弈的某个时点的某个时点上上的决策变量。的决策变量。n比如,在房地产开发博弈中,每个参与人只比如,在房地产开发博弈中,每个参与人只有两种行动可供选择,即开发,不开放。有两种行动可供选择,即开发,不开放。如果在这个博弈中,有如果在这个博弈中,有A、B两
9、人,如果两人,如果A选择不开发,选择不开发,B选择开发,那么(不开发,选择开发,那么(不开发,开发)就是一个行动组合。事实上,这个开发)就是一个行动组合。事实上,这个例子中共有四个行动组合,其他三个为:例子中共有四个行动组合,其他三个为:(开发,开发)、(开发,不开发)、(开发,开发)、(开发,不开发)、(不开发,不开发)。(不开发,不开发)。3.战略n“战略战略”(strategy),是是参与人参与人在给定信息集的情况下在给定信息集的情况下的的行动规则行动规则。它规定参与人在什么它规定参与人在什么时候时候选择什么行动。选择什么行动。如,如,“人不犯我,我不犯人;人若犯我,我必犯人人不犯我,我
10、不犯人;人若犯我,我必犯人”是一种战略,这里是一种战略,这里“犯犯”与与“不犯不犯”是两种不同的行是两种不同的行动,战略规定了什么时候选择动,战略规定了什么时候选择“犯犯”,什么时候选择,什么时候选择“不犯不犯”。n各参与人可以选择的全部战略或战略选择的范围称为各参与人可以选择的全部战略或战略选择的范围称为“战略空间战略空间”。n如果一个博弈中每个参与人的战略数都是有限的,则如果一个博弈中每个参与人的战略数都是有限的,则称为称为“有限博弈有限博弈”(finite game),如果一个博弈中至少,如果一个博弈中至少有某些参与人的战略有无限多个,则称为有某些参与人的战略有无限多个,则称为“无限博弈
11、无限博弈”(infinite game)。4.4.得益得益/支付(支付函数)支付(支付函数)n得益得益(payoff)是指在一个特定的战略组是指在一个特定的战略组合下合下,参与人从博弈中所获得的利益参与人从博弈中所获得的利益(效用水平)(效用水平),是参与人追求的根本目,是参与人追求的根本目标,也是他们行为和判断的主要依据。标,也是他们行为和判断的主要依据。n博弈的一个基本特征是参与人的得益不博弈的一个基本特征是参与人的得益不仅取决于自己的战略选择,而且取决于仅取决于自己的战略选择,而且取决于所有参与人的战略选择,因此参与人的所有参与人的战略选择,因此参与人的得益是所有参与人战略组合的函数。得
12、益是所有参与人战略组合的函数。5.信息n信息信息:指的是参与人在博弈过程中能够指的是参与人在博弈过程中能够了解和观察到的知识,了解和观察到的知识,特别是有关特别是有关其他其他参与人参与人(对手)(对手)的特征和行动的特征和行动的知识的知识。n得益的信息得益的信息n行为过程的信息行为过程的信息 6.结果n结果(结果(outcome)是指博弈分析者所感)是指博弈分析者所感兴趣的要素的集合。如均衡战略组合、兴趣的要素的集合。如均衡战略组合、均衡行动组合、均衡得益组合等。均衡行动组合、均衡得益组合等。n在房地产开发博弈中,一个可能的结果是在房地产开发博弈中,一个可能的结果是(高需求,开发、开发),即自
13、然(市(高需求,开发、开发),即自然(市场)选择了高需求,场)选择了高需求,A和和B同时行动都选同时行动都选择了开发,都得到利润。另一个可能的择了开发,都得到利润。另一个可能的结果(低需求,开发、不开发),即自结果(低需求,开发、不开发),即自然选择了低需求,然选择了低需求,A选择了开发,得到利选择了开发,得到利润,润,B选择不开发,没得利。选择不开发,没得利。7.均衡n均衡是所有参与人的最优战略或行动均衡是所有参与人的最优战略或行动组合。组合。n上述概念中,参与人、行动、结果统上述概念中,参与人、行动、结果统称为博弈规则,博弈分析的目的是使称为博弈规则,博弈分析的目的是使博弈规则决定均衡。博
14、弈规则决定均衡。3 博弈的分类n 博弈论可以划分为:博弈论可以划分为:合作博弈合作博弈(cooperative games)与非合作博弈与非合作博弈(non-cooperative games)。n二者二者的区别主要在于的区别主要在于:人们的行为相互作用时,:人们的行为相互作用时,当事人之间能否达成一个当事人之间能否达成一个具具有约束力的协议。如有约束力的协议。如果有,就是合作博弈;反之,就是非合作博弈。果有,就是合作博弈;反之,就是非合作博弈。n合作博弈假设了参与人之间的合作协议是可强制执合作博弈假设了参与人之间的合作协议是可强制执行的,战略选择问题就不再重要,核心问题是利益行的,战略选择问
15、题就不再重要,核心问题是利益分配;强调的是团体理性、效率、公正、公平。分配;强调的是团体理性、效率、公正、公平。n非合作博弈中,决策主体根据自己的利益来决定自非合作博弈中,决策主体根据自己的利益来决定自己的选择,核心问题是战略选择,强调的是:个人己的选择,核心问题是战略选择,强调的是:个人理性和个人最优决策。理性和个人最优决策。n当前,非合作博弈是博弈论研究的主流领域。当前,非合作博弈是博弈论研究的主流领域。1.非合作博弈的划分非合作博弈的分类可以从两个角度:非合作博弈的分类可以从两个角度:按参与人行动的先后顺序划分按参与人行动的先后顺序划分按参与人对有关其他参与人的特征、按参与人对有关其他参
16、与人的特征、战略空间及支付函数的知识划分战略空间及支付函数的知识划分可得到四种不同类型的博弈可得到四种不同类型的博弈 1)静态博弈和动态博弈n按参与人行动的先后顺序划分。博弈可按参与人行动的先后顺序划分。博弈可以划分为:静态博弈和动态博弈。以划分为:静态博弈和动态博弈。静态博弈:指的是博弈中的参与人同时静态博弈:指的是博弈中的参与人同时选择行动,或虽非同时但后行动者不知道选择行动,或虽非同时但后行动者不知道先行动者采取了什么具体行动。先行动者采取了什么具体行动。动态博弈:指的是参与人的行动有先后动态博弈:指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者所顺序,且后行动者能够观察到先行
17、动者所选择的行动。行动顺序对于博弈的结果非选择的行动。行动顺序对于博弈的结果非常重要。常重要。2)完全信息博弈和不完全信息博弈n 按参与人对有关其他参与人的特征、战略按参与人对有关其他参与人的特征、战略空间及支付函数的知识划分。博弈可以划空间及支付函数的知识划分。博弈可以划分为:完全信息博弈和不完全信息博弈分为:完全信息博弈和不完全信息博弈n完全信息博弈:指的是每一个参与人对完全信息博弈:指的是每一个参与人对所有其他参与人(对手)的特征、战略所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识。空间及支付函数有准确的知识。n否则,就是不完全信息博弈。否则,就是不完全信息博弈。2.非合作
18、博弈的四种类型 将上述两个角度的划分结合起来,将上述两个角度的划分结合起来,就得到四种不同类型的博弈:就得到四种不同类型的博弈:完全信息静态博弈完全信息静态博弈完全信息动态博弈完全信息动态博弈不完全信息静态博弈不完全信息静态博弈不完全信息动态博弈不完全信息动态博弈 3.四种类型对应的四个均衡概念n上述四种博弈相对应的四个均衡概念,上述四种博弈相对应的四个均衡概念,即:即:n纳什均衡(纳什,纳什均衡(纳什,1950,1951)n子博弈精炼纳什均衡(泽尔腾,子博弈精炼纳什均衡(泽尔腾,1965)n贝叶斯纳什均衡(海萨尼,贝叶斯纳什均衡(海萨尼,1967-1968)n精炼贝叶斯纳什均衡(泽尔腾,精炼
19、贝叶斯纳什均衡(泽尔腾,1975)博弈的分类及其对应的均衡概念信息4 博弈论的发展简述n上溯到上溯到1818世纪初世纪初n1919世纪,世纪,古诺:产量决策的古诺模型(古诺:产量决策的古诺模型(18381838););伯特兰德:价格决策的伯特兰德模型(伯特兰德:价格决策的伯特兰德模型(18831883)。)。经典的博弈模型经典的博弈模型n2020世纪博弈论的发展世纪博弈论的发展n19441944年,冯年,冯诺依曼和摩根斯坦:博弈论和经济行为诺依曼和摩根斯坦:博弈论和经济行为n5050年代合作博弈发展到鼎盛时期:纳什(年代合作博弈发展到鼎盛时期:纳什(19501950)、夏普)、夏普里(里(19
20、531953)提出的)提出的“讨价还价模型讨价还价模型”同时非合作博弈论创立。塔克(同时非合作博弈论创立。塔克(19501950)定义)定义“囚徒囚徒困境困境”。纳什和塔克的著作基本奠定了现代非合作博弈。纳什和塔克的著作基本奠定了现代非合作博弈论的基石。论的基石。n60年代后又出现了一些重要人物。泽尔年代后又出现了一些重要人物。泽尔腾将纳什均衡的概念引入动态分析,提腾将纳什均衡的概念引入动态分析,提出出“精炼纳什均衡精炼纳什均衡”的概念(的概念(1965););海萨尼把不完全信息引入博弈论海萨尼把不完全信息引入博弈论(1967-1968)。)。n80年代出现了几个比较有影响的人物,年代出现了几
21、个比较有影响的人物,如克瑞普斯、威尔逊等。如克瑞普斯、威尔逊等。5 博弈论与信息经济学的关系n1 1)经济学是研究说明什么的?)经济学是研究说明什么的?n传统认识:稀缺资源的有效配置传统认识:稀缺资源的有效配置n现代观点:人的行为现代观点:人的行为假定人是理性的,假定人是理性的,在给定的约束条件下最大化自己的偏好,在给定的约束条件下最大化自己的偏好,需要相互合作,合作中有冲突,发明制度需要相互合作,合作中有冲突,发明制度规范人们的行为,如价格制度(市场制度)。规范人们的行为,如价格制度(市场制度)。n在现实市场中,市场参加者之间的信息不在现实市场中,市场参加者之间的信息不对称,解决的制度(办法
22、)对称,解决的制度(办法)-激励机制。激励机制。2 2)博弈论研究的问题是:人们)博弈论研究的问题是:人们之间的行为之间的行为即一个人在决策时,即一个人在决策时,必须考虑对方的反应。必须考虑对方的反应。博弈论作为研究对策双方博弈论作为研究对策双方行为的一种方法,逐渐应用到经行为的一种方法,逐渐应用到经济学领域。济学领域。n3 3)1994年诺贝尔经济学奖授给纳什、泽尔腾、年诺贝尔经济学奖授给纳什、泽尔腾、海萨尼三位博弈论专家的原因:海萨尼三位博弈论专家的原因:(1)博弈论在经济学中的应用最广泛、最成功。)博弈论在经济学中的应用最广泛、最成功。博弈论的许多成果也是借助于经济学的例子来发博弈论的许
23、多成果也是借助于经济学的例子来发展的,特别是在应用领域。展的,特别是在应用领域。(2)经济学家对博弈论的贡献也越来越大,特)经济学家对博弈论的贡献也越来越大,特别是在动态分析和不完全信息引入博弈论之后。别是在动态分析和不完全信息引入博弈论之后。(3)最带根本性意义的原因是经济学和博弈论)最带根本性意义的原因是经济学和博弈论的研究模式是一样的,即强调个人理性,也就是的研究模式是一样的,即强调个人理性,也就是在给定的约束条件下追求效用最大化。在这一点在给定的约束条件下追求效用最大化。在这一点上,博弈论和经济学是完全一样的。上,博弈论和经济学是完全一样的。n博弈论真正成为主流经济学的一部分,是博弈论
24、真正成为主流经济学的一部分,是20世纪世纪70、80年代的事。年代的事。n70年代中期以后,经济学家开始转向强调个人理性,特年代中期以后,经济学家开始转向强调个人理性,特别是强调对个人的最基础的效用函数的研究之后,发现信别是强调对个人的最基础的效用函数的研究之后,发现信息是一个非常重要的问题。同时,在研究个人行为时,个息是一个非常重要的问题。同时,在研究个人行为时,个人决策有一个时间顺序。时序问题在经济学中就变得非常人决策有一个时间顺序。时序问题在经济学中就变得非常重要。博弈论发展到这一阶段正好为这两方面(信息,时重要。博弈论发展到这一阶段正好为这两方面(信息,时序)提供了有力的研究工具。序)
25、提供了有力的研究工具。n博弈论的模型博弈论的模型70年代中期在经济学中应用,年代中期在经济学中应用,80年代开始,年代开始,博弈论逐渐主流经济学的一部分。甚至可以说成为微观经博弈论逐渐主流经济学的一部分。甚至可以说成为微观经济学的基础。济学的基础。n博弈论的发展和经济学的发展,可以说是你中有我,博弈论的发展和经济学的发展,可以说是你中有我,我中有你。我中有你。n博弈论成为主流经济学的一部分,正是伴随博弈论成为主流经济学的一部分,正是伴随经济学对信息问题的重视而来的。从某种经济学对信息问题的重视而来的。从某种意义上,信息经济学是博弈论应用的一部意义上,信息经济学是博弈论应用的一部分,或者说信息经
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 决策 行为 讲义
限制150内