欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    博弈论与决策行为讲义.pptx

    • 资源ID:85117303       资源大小:277.32KB        全文页数:107页
    • 资源格式: PPTX        下载积分:80金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要80金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    博弈论与决策行为讲义.pptx

    第2章 博弈论与决策行为你可以使鹦鹉成为训练有素的经济学你可以使鹦鹉成为训练有素的经济学家,所以它必须要学的两个词:家,所以它必须要学的两个词:“供供给给”和和“需求需求”现在它们或许可换现在它们或许可换成成“博弈博弈”和和“均衡均衡”。(萨缪尔森引)短谚(萨缪尔森引)短谚 学习目标 n博弈论概述博弈论概述n完全信息静态博弈完全信息静态博弈n完全信息动态博弈完全信息动态博弈n不完全信息静态博弈不完全信息静态博弈n不完全信息动态博弈不完全信息动态博弈 2.1 博弈论概述n什么是博弈论什么是博弈论n博弈论的基本概念博弈论的基本概念n博弈的分类博弈的分类n博弈论的发展简述博弈论的发展简述n博弈论与信息经济学的关系博弈论与信息经济学的关系 1 1 什么是博弈论什么是博弈论n博弈论(博弈论(game theory):是研究决策主):是研究决策主体的行动发生直接相互作用时候的决策以及体的行动发生直接相互作用时候的决策以及这种决策的均衡问题。是专门研究博弈如何这种决策的均衡问题。是专门研究博弈如何出现均衡的规律的学科。出现均衡的规律的学科。n换句话说,博弈论研究当某一经济主体的决换句话说,博弈论研究当某一经济主体的决策既受其他经济主体的影响,而且该经济主策既受其他经济主体的影响,而且该经济主体的相应决策又反过来影响到其他经济主体体的相应决策又反过来影响到其他经济主体的决策问题和均衡问题。的决策问题和均衡问题。n博弈论又称博弈论又称“对策论对策论”。在传统经济学中,谈到个人决策,就是在给在传统经济学中,谈到个人决策,就是在给定一个价格参数和收入的条件下,最大化自定一个价格参数和收入的条件下,最大化自己的效用。个人效用函数只依赖于自己的选己的效用。个人效用函数只依赖于自己的选择,而不依赖于其他人的选择。虽然经济作择,而不依赖于其他人的选择。虽然经济作为一个整体,人与人之间的选择是相互作用为一个整体,人与人之间的选择是相互作用的,但对于个体或厂商来说,所有其他人的的,但对于个体或厂商来说,所有其他人的行为都被包括在一个参数里,即价格。所以,行为都被包括在一个参数里,即价格。所以,经济主体决策时,面临的似乎是一个非人格经济主体决策时,面临的似乎是一个非人格化的东西,其选择既不考虑自己的选择对他化的东西,其选择既不考虑自己的选择对他人的影响,也不考虑他人选择对自己的影响人的影响,也不考虑他人选择对自己的影响。n 而在博弈论中,个人的效用函数不仅依而在博弈论中,个人的效用函数不仅依赖于自己的选择,而且依赖于他人的选赖于自己的选择,而且依赖于他人的选择,个人的最优选择是其他人选择的函择,个人的最优选择是其他人选择的函数。数。n从这个意义上,博弈论研究的是,在存在相互从这个意义上,博弈论研究的是,在存在相互作用外部经济条件下的个人选择问题。作用外部经济条件下的个人选择问题。n人们之间决策行为相互影响,广泛存在于社会人们之间决策行为相互影响,广泛存在于社会经济活动中。如,国家与国家之间的关系;中经济活动中。如,国家与国家之间的关系;中央与地方政府之间;还有家庭中的夫妻,他们央与地方政府之间;还有家庭中的夫妻,他们之间的行为也是一种博弈。之间的行为也是一种博弈。n博弈论的应用是非常广泛的。博弈论的应用是非常广泛的。2 博弈论的基本概念n博弈论的基本概念包括:博弈论的基本概念包括:1.参与人参与人2.行动行动3.战略战略4.得益(支付函数)得益(支付函数)5.信息信息6.结果结果7.均衡均衡 1.参与人n 参与人(参与人(playerplayer)指的指的是博弈中选择行动以最是博弈中选择行动以最大化自己效用的决策主体。参与人可以是大化自己效用的决策主体。参与人可以是个个人,人,也可以是也可以是团体,如国家、团体,如国家、企业企业等。等。除一般意义上的参与人外,博弈论中还有除一般意义上的参与人外,博弈论中还有“虚拟参与人虚拟参与人”(pseudo playerpseudo player)自然自然(naturenature),),“自然自然”是指不以博弈参与人意是指不以博弈参与人意志为转移的外生事件,志为转移的外生事件,“自然自然”选择的是外生选择的是外生事件的各种可能现象,并用概率分布来描述事件的各种可能现象,并用概率分布来描述“自然自然”的选择机理。也可以说,自然就是决定的选择机理。也可以说,自然就是决定外生的随机变量的概率分布的机制外生的随机变量的概率分布的机制.n根据参与人的数量将博弈分为:根据参与人的数量将博弈分为:“单人博弈单人博弈”、“双人博弈双人博弈”和和“多人博弈多人博弈”。n单人博弈,实质上是个体决策的最优化问题,参与单人博弈,实质上是个体决策的最优化问题,参与人拥有的信息越多,即决策的环境了解得越多,决人拥有的信息越多,即决策的环境了解得越多,决策的准确性就越高,得益也就越好。策的准确性就越高,得益也就越好。n两人博弈就是两个各自独立决策,但策略和得益具两人博弈就是两个各自独立决策,但策略和得益具有相互依存关系的博弈方的决策问题。两人博弈是有相互依存关系的博弈方的决策问题。两人博弈是博弈问题中最常见,也是研究的最多的博弈类型。博弈问题中最常见,也是研究的最多的博弈类型。n三人以上的,即多人博弈。多人博弈中策略和利益三人以上的,即多人博弈。多人博弈中策略和利益的相互依存关系更为复杂。的相互依存关系更为复杂。2.行动n行动(行动(action or move)是参与人在博弈)是参与人在博弈的某个时点的某个时点上上的决策变量。的决策变量。n比如,在房地产开发博弈中,每个参与人只比如,在房地产开发博弈中,每个参与人只有两种行动可供选择,即开发,不开放。有两种行动可供选择,即开发,不开放。如果在这个博弈中,有如果在这个博弈中,有A、B两人,如果两人,如果A选择不开发,选择不开发,B选择开发,那么(不开发,选择开发,那么(不开发,开发)就是一个行动组合。事实上,这个开发)就是一个行动组合。事实上,这个例子中共有四个行动组合,其他三个为:例子中共有四个行动组合,其他三个为:(开发,开发)、(开发,不开发)、(开发,开发)、(开发,不开发)、(不开发,不开发)。(不开发,不开发)。3.战略n“战略战略”(strategy),是是参与人参与人在给定信息集的情况下在给定信息集的情况下的的行动规则行动规则。它规定参与人在什么它规定参与人在什么时候时候选择什么行动。选择什么行动。如,如,“人不犯我,我不犯人;人若犯我,我必犯人人不犯我,我不犯人;人若犯我,我必犯人”是一种战略,这里是一种战略,这里“犯犯”与与“不犯不犯”是两种不同的行是两种不同的行动,战略规定了什么时候选择动,战略规定了什么时候选择“犯犯”,什么时候选择,什么时候选择“不犯不犯”。n各参与人可以选择的全部战略或战略选择的范围称为各参与人可以选择的全部战略或战略选择的范围称为“战略空间战略空间”。n如果一个博弈中每个参与人的战略数都是有限的,则如果一个博弈中每个参与人的战略数都是有限的,则称为称为“有限博弈有限博弈”(finite game),如果一个博弈中至少,如果一个博弈中至少有某些参与人的战略有无限多个,则称为有某些参与人的战略有无限多个,则称为“无限博弈无限博弈”(infinite game)。4.4.得益得益/支付(支付函数)支付(支付函数)n得益得益(payoff)是指在一个特定的战略组是指在一个特定的战略组合下合下,参与人从博弈中所获得的利益参与人从博弈中所获得的利益(效用水平)(效用水平),是参与人追求的根本目,是参与人追求的根本目标,也是他们行为和判断的主要依据。标,也是他们行为和判断的主要依据。n博弈的一个基本特征是参与人的得益不博弈的一个基本特征是参与人的得益不仅取决于自己的战略选择,而且取决于仅取决于自己的战略选择,而且取决于所有参与人的战略选择,因此参与人的所有参与人的战略选择,因此参与人的得益是所有参与人战略组合的函数。得益是所有参与人战略组合的函数。5.信息n信息信息:指的是参与人在博弈过程中能够指的是参与人在博弈过程中能够了解和观察到的知识,了解和观察到的知识,特别是有关特别是有关其他其他参与人参与人(对手)(对手)的特征和行动的特征和行动的知识的知识。n得益的信息得益的信息n行为过程的信息行为过程的信息 6.结果n结果(结果(outcome)是指博弈分析者所感)是指博弈分析者所感兴趣的要素的集合。如均衡战略组合、兴趣的要素的集合。如均衡战略组合、均衡行动组合、均衡得益组合等。均衡行动组合、均衡得益组合等。n在房地产开发博弈中,一个可能的结果是在房地产开发博弈中,一个可能的结果是(高需求,开发、开发),即自然(市(高需求,开发、开发),即自然(市场)选择了高需求,场)选择了高需求,A和和B同时行动都选同时行动都选择了开发,都得到利润。另一个可能的择了开发,都得到利润。另一个可能的结果(低需求,开发、不开发),即自结果(低需求,开发、不开发),即自然选择了低需求,然选择了低需求,A选择了开发,得到利选择了开发,得到利润,润,B选择不开发,没得利。选择不开发,没得利。7.均衡n均衡是所有参与人的最优战略或行动均衡是所有参与人的最优战略或行动组合。组合。n上述概念中,参与人、行动、结果统上述概念中,参与人、行动、结果统称为博弈规则,博弈分析的目的是使称为博弈规则,博弈分析的目的是使博弈规则决定均衡。博弈规则决定均衡。3 博弈的分类n 博弈论可以划分为:博弈论可以划分为:合作博弈合作博弈(cooperative games)与非合作博弈与非合作博弈(non-cooperative games)。n二者二者的区别主要在于的区别主要在于:人们的行为相互作用时,:人们的行为相互作用时,当事人之间能否达成一个当事人之间能否达成一个具具有约束力的协议。如有约束力的协议。如果有,就是合作博弈;反之,就是非合作博弈。果有,就是合作博弈;反之,就是非合作博弈。n合作博弈假设了参与人之间的合作协议是可强制执合作博弈假设了参与人之间的合作协议是可强制执行的,战略选择问题就不再重要,核心问题是利益行的,战略选择问题就不再重要,核心问题是利益分配;强调的是团体理性、效率、公正、公平。分配;强调的是团体理性、效率、公正、公平。n非合作博弈中,决策主体根据自己的利益来决定自非合作博弈中,决策主体根据自己的利益来决定自己的选择,核心问题是战略选择,强调的是:个人己的选择,核心问题是战略选择,强调的是:个人理性和个人最优决策。理性和个人最优决策。n当前,非合作博弈是博弈论研究的主流领域。当前,非合作博弈是博弈论研究的主流领域。1.非合作博弈的划分非合作博弈的分类可以从两个角度:非合作博弈的分类可以从两个角度:按参与人行动的先后顺序划分按参与人行动的先后顺序划分按参与人对有关其他参与人的特征、按参与人对有关其他参与人的特征、战略空间及支付函数的知识划分战略空间及支付函数的知识划分可得到四种不同类型的博弈可得到四种不同类型的博弈 1)静态博弈和动态博弈n按参与人行动的先后顺序划分。博弈可按参与人行动的先后顺序划分。博弈可以划分为:静态博弈和动态博弈。以划分为:静态博弈和动态博弈。静态博弈:指的是博弈中的参与人同时静态博弈:指的是博弈中的参与人同时选择行动,或虽非同时但后行动者不知道选择行动,或虽非同时但后行动者不知道先行动者采取了什么具体行动。先行动者采取了什么具体行动。动态博弈:指的是参与人的行动有先后动态博弈:指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者所顺序,且后行动者能够观察到先行动者所选择的行动。行动顺序对于博弈的结果非选择的行动。行动顺序对于博弈的结果非常重要。常重要。2)完全信息博弈和不完全信息博弈n 按参与人对有关其他参与人的特征、战略按参与人对有关其他参与人的特征、战略空间及支付函数的知识划分。博弈可以划空间及支付函数的知识划分。博弈可以划分为:完全信息博弈和不完全信息博弈分为:完全信息博弈和不完全信息博弈n完全信息博弈:指的是每一个参与人对完全信息博弈:指的是每一个参与人对所有其他参与人(对手)的特征、战略所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识。空间及支付函数有准确的知识。n否则,就是不完全信息博弈。否则,就是不完全信息博弈。2.非合作博弈的四种类型 将上述两个角度的划分结合起来,将上述两个角度的划分结合起来,就得到四种不同类型的博弈:就得到四种不同类型的博弈:完全信息静态博弈完全信息静态博弈完全信息动态博弈完全信息动态博弈不完全信息静态博弈不完全信息静态博弈不完全信息动态博弈不完全信息动态博弈 3.四种类型对应的四个均衡概念n上述四种博弈相对应的四个均衡概念,上述四种博弈相对应的四个均衡概念,即:即:n纳什均衡(纳什,纳什均衡(纳什,1950,1951)n子博弈精炼纳什均衡(泽尔腾,子博弈精炼纳什均衡(泽尔腾,1965)n贝叶斯纳什均衡(海萨尼,贝叶斯纳什均衡(海萨尼,1967-1968)n精炼贝叶斯纳什均衡(泽尔腾,精炼贝叶斯纳什均衡(泽尔腾,1975)博弈的分类及其对应的均衡概念信息4 博弈论的发展简述n上溯到上溯到1818世纪初世纪初n1919世纪,世纪,古诺:产量决策的古诺模型(古诺:产量决策的古诺模型(18381838););伯特兰德:价格决策的伯特兰德模型(伯特兰德:价格决策的伯特兰德模型(18831883)。)。经典的博弈模型经典的博弈模型n2020世纪博弈论的发展世纪博弈论的发展n19441944年,冯年,冯诺依曼和摩根斯坦:博弈论和经济行为诺依曼和摩根斯坦:博弈论和经济行为n5050年代合作博弈发展到鼎盛时期:纳什(年代合作博弈发展到鼎盛时期:纳什(19501950)、夏普)、夏普里(里(19531953)提出的)提出的“讨价还价模型讨价还价模型”同时非合作博弈论创立。塔克(同时非合作博弈论创立。塔克(19501950)定义)定义“囚徒囚徒困境困境”。纳什和塔克的著作基本奠定了现代非合作博弈。纳什和塔克的著作基本奠定了现代非合作博弈论的基石。论的基石。n60年代后又出现了一些重要人物。泽尔年代后又出现了一些重要人物。泽尔腾将纳什均衡的概念引入动态分析,提腾将纳什均衡的概念引入动态分析,提出出“精炼纳什均衡精炼纳什均衡”的概念(的概念(1965););海萨尼把不完全信息引入博弈论海萨尼把不完全信息引入博弈论(1967-1968)。)。n80年代出现了几个比较有影响的人物,年代出现了几个比较有影响的人物,如克瑞普斯、威尔逊等。如克瑞普斯、威尔逊等。5 博弈论与信息经济学的关系n1 1)经济学是研究说明什么的?)经济学是研究说明什么的?n传统认识:稀缺资源的有效配置传统认识:稀缺资源的有效配置n现代观点:人的行为现代观点:人的行为假定人是理性的,假定人是理性的,在给定的约束条件下最大化自己的偏好,在给定的约束条件下最大化自己的偏好,需要相互合作,合作中有冲突,发明制度需要相互合作,合作中有冲突,发明制度规范人们的行为,如价格制度(市场制度)。规范人们的行为,如价格制度(市场制度)。n在现实市场中,市场参加者之间的信息不在现实市场中,市场参加者之间的信息不对称,解决的制度(办法)对称,解决的制度(办法)-激励机制。激励机制。2 2)博弈论研究的问题是:人们)博弈论研究的问题是:人们之间的行为之间的行为即一个人在决策时,即一个人在决策时,必须考虑对方的反应。必须考虑对方的反应。博弈论作为研究对策双方博弈论作为研究对策双方行为的一种方法,逐渐应用到经行为的一种方法,逐渐应用到经济学领域。济学领域。n3 3)1994年诺贝尔经济学奖授给纳什、泽尔腾、年诺贝尔经济学奖授给纳什、泽尔腾、海萨尼三位博弈论专家的原因:海萨尼三位博弈论专家的原因:(1)博弈论在经济学中的应用最广泛、最成功。)博弈论在经济学中的应用最广泛、最成功。博弈论的许多成果也是借助于经济学的例子来发博弈论的许多成果也是借助于经济学的例子来发展的,特别是在应用领域。展的,特别是在应用领域。(2)经济学家对博弈论的贡献也越来越大,特)经济学家对博弈论的贡献也越来越大,特别是在动态分析和不完全信息引入博弈论之后。别是在动态分析和不完全信息引入博弈论之后。(3)最带根本性意义的原因是经济学和博弈论)最带根本性意义的原因是经济学和博弈论的研究模式是一样的,即强调个人理性,也就是的研究模式是一样的,即强调个人理性,也就是在给定的约束条件下追求效用最大化。在这一点在给定的约束条件下追求效用最大化。在这一点上,博弈论和经济学是完全一样的。上,博弈论和经济学是完全一样的。n博弈论真正成为主流经济学的一部分,是博弈论真正成为主流经济学的一部分,是20世纪世纪70、80年代的事。年代的事。n70年代中期以后,经济学家开始转向强调个人理性,特年代中期以后,经济学家开始转向强调个人理性,特别是强调对个人的最基础的效用函数的研究之后,发现信别是强调对个人的最基础的效用函数的研究之后,发现信息是一个非常重要的问题。同时,在研究个人行为时,个息是一个非常重要的问题。同时,在研究个人行为时,个人决策有一个时间顺序。时序问题在经济学中就变得非常人决策有一个时间顺序。时序问题在经济学中就变得非常重要。博弈论发展到这一阶段正好为这两方面(信息,时重要。博弈论发展到这一阶段正好为这两方面(信息,时序)提供了有力的研究工具。序)提供了有力的研究工具。n博弈论的模型博弈论的模型70年代中期在经济学中应用,年代中期在经济学中应用,80年代开始,年代开始,博弈论逐渐主流经济学的一部分。甚至可以说成为微观经博弈论逐渐主流经济学的一部分。甚至可以说成为微观经济学的基础。济学的基础。n博弈论的发展和经济学的发展,可以说是你中有我,博弈论的发展和经济学的发展,可以说是你中有我,我中有你。我中有你。n博弈论成为主流经济学的一部分,正是伴随博弈论成为主流经济学的一部分,正是伴随经济学对信息问题的重视而来的。从某种经济学对信息问题的重视而来的。从某种意义上,信息经济学是博弈论应用的一部意义上,信息经济学是博弈论应用的一部分,或者说信息经济学是非对称信息博弈分,或者说信息经济学是非对称信息博弈论。论。n二者的关系可概括为:二者的关系可概括为:n(1)二者的研究模式是一样的,都强调个人理)二者的研究模式是一样的,都强调个人理性性个人效用最大化;个人效用最大化;n(2)博弈论为经济学的信息问题和时序问题,)博弈论为经济学的信息问题和时序问题,提供了研究工具;提供了研究工具;n(3)二者相互促进,共同发展。)二者相互促进,共同发展。n 3.2 完全信息静态博弈n“完全信息完全信息”,指的是每个参与人对其他参与,指的是每个参与人对其他参与人特征(包括战略空间、支付函数等)有完全人特征(包括战略空间、支付函数等)有完全的了解。的了解。n“静态静态”,指的是所有参与人同时选择行动,指的是所有参与人同时选择行动,且只选择一次。且只选择一次。n完全信息静态博弈是一种最简单的博弈。完全信息静态博弈是一种最简单的博弈。n完全信息静态博弈理论是非合作博弈理论的基完全信息静态博弈理论是非合作博弈理论的基础。础。n博弈分析的两个最基本的问题:一是如何表述博弈分析的两个最基本的问题:一是如何表述一个博弈局势;二是如何求这个博弈局势的解。一个博弈局势;二是如何求这个博弈局势的解。1 博弈的标准式表述和求解n在博弈论里,一个博弈可以用两种不同的方式来表述:在博弈论里,一个博弈可以用两种不同的方式来表述:一种是战略式表述,又称标准式表述;另一种是扩展一种是战略式表述,又称标准式表述;另一种是扩展式表述,或展开式表述。式表述,或展开式表述。n从理论上讲,二者几乎是完全等价的,但从方便的角从理论上讲,二者几乎是完全等价的,但从方便的角度,前者更适合静态博弈,后者更适合动态博弈。度,前者更适合静态博弈,后者更适合动态博弈。n博弈标准式表述含有以下三个要素:博弈标准式表述含有以下三个要素:n(1 1)参与人集合)参与人集合;n(2 2)每一个参与人可供选择的战略集)每一个参与人可供选择的战略集合(即战略空间);合(即战略空间);n(3 3)针对所有参与人可能选择的战略组合,每一个参与人获)针对所有参与人可能选择的战略组合,每一个参与人获得的收益。得的收益。n如果一个博弈被称为有限博弈,第一,如果一个博弈被称为有限博弈,第一,参与人的个数是有限的;第二,每个参与人的个数是有限的;第二,每个参与人可选择的战略是有限的。参与人可选择的战略是有限的。n两人有限博弈的标准式表述可以用矩两人有限博弈的标准式表述可以用矩阵直接给出。阵直接给出。例如:房地产开发博弈例如:房地产开发博弈 (1)(1)高需求高需求开发商开发商B开发商开发商A开开发发不开发不开发开发开发 不开发不开发(2)(2)低需求低需求开开发发不开发不开发开发商开发商B开发开发 不开发不开发开发商开发商A 2 求解:纳什均衡n纳什均衡是完全信息静态博弈的一般概纳什均衡是完全信息静态博弈的一般概念,也是所有其他类型博弈解的基本要念,也是所有其他类型博弈解的基本要求。求。n纳什均衡,是博弈论学者纳什创建的。纳什均衡,是博弈论学者纳什创建的。纳什对博弈论的贡献有两个方面:纳什对博弈论的贡献有两个方面:合合作博弈理论中的讨价还价模型,称纳什作博弈理论中的讨价还价模型,称纳什讨价还价解;讨价还价解;非合作博弈论的纳什均非合作博弈论的纳什均衡。衡。1)什么是纳什均衡n设想在博弈论预测的博弈结果中,给定每个参设想在博弈论预测的博弈结果中,给定每个参与人选定各自的战略,为使该预测是正确的,与人选定各自的战略,为使该预测是正确的,必须使参与人自愿选择理论给他推必须使参与人自愿选择理论给他推导导出的战略。出的战略。n这样,每个参与人要选择的战略必须是针对其这样,每个参与人要选择的战略必须是针对其他参与人选择战略的最优反应,他参与人选择战略的最优反应,所有参与人选所有参与人选择的战略一起构成一个战略组合。择的战略一起构成一个战略组合。这种理论推这种理论推测结果可以叫做测结果可以叫做“战略稳定战略稳定”或或“自动实施自动实施”的,的,因为没有参与人愿意独自离弃他所选定的战略,因为没有参与人愿意独自离弃他所选定的战略,我们把这一状态就称为纳什均衡。我们把这一状态就称为纳什均衡。n纳什均衡是完全信息静态博弈的一般概念,构纳什均衡是完全信息静态博弈的一般概念,构成纳什均衡的战略一定是重复剔除严格劣战略成纳什均衡的战略一定是重复剔除严格劣战略过程中不能被剔除的战略。过程中不能被剔除的战略。n而重复剔除劣战略后所留战略却不一定满足纳而重复剔除劣战略后所留战略却不一定满足纳什均衡战略的条件,因此纳什均衡是一个比重什均衡战略的条件,因此纳什均衡是一个比重复剔除严格劣战略要强的复剔除严格劣战略要强的均衡均衡解的概念。解的概念。n是所有参与人的最优战略组合。是所有参与人的最优战略组合。2)求解方法:划线法n在两人有限博弈中,求解纳什均衡有一种简单在两人有限博弈中,求解纳什均衡有一种简单的方法:划线法。的方法:划线法。n以抽象博弈为例。首先考察参与人以抽象博弈为例。首先考察参与人1的最优战的最优战略,对于参与人略,对于参与人2的一个给定战略,也就是在的一个给定战略,也就是在双变量矩阵的每一列中,找出参与人双变量矩阵的每一列中,找出参与人1的最优的最优战略,并在相应的收益值下面划一条横线。然战略,并在相应的收益值下面划一条横线。然后,用类似的方法找出参与人后,用类似的方法找出参与人2的最有战略。的最有战略。最后,如果双变量中某个单元的两个收益值下最后,如果双变量中某个单元的两个收益值下面都被划了横线,那么这个单元对应的战略组面都被划了横线,那么这个单元对应的战略组合就是一个纳什均衡(见下面的合就是一个纳什均衡(见下面的“性别博弈性别博弈”例子)。例子)。3)举例说明n博弈论中著名的例子:博弈论中著名的例子:1.占优战略均衡:囚徒困境占优战略均衡:囚徒困境2.重复剔除的占优战略均衡:智猪博弈重复剔除的占优战略均衡:智猪博弈3.纯战略纳什均衡:性别博弈纯战略纳什均衡:性别博弈4.混合战略纳什均衡:斗鸡博弈混合战略纳什均衡:斗鸡博弈 1.1.占优战略均衡占优战略均衡n一般来说,每个参与人的最优战略选择依赖于一般来说,每个参与人的最优战略选择依赖于其他参与人的战略选择,但在一些特殊的博弈其他参与人的战略选择,但在一些特殊的博弈中,一个参与人的最优战略可能并不依赖于其中,一个参与人的最优战略可能并不依赖于其他参与人的战略选择,就是说,不论其他参与他参与人的战略选择,就是说,不论其他参与人选择什么战略,他的最优战略是唯一的。这人选择什么战略,他的最优战略是唯一的。这样的最优战略被称为样的最优战略被称为“占优战略占优战略”。n在博弈中,如果所有的参与人都有占优战略存在博弈中,如果所有的参与人都有占优战略存在,因而博弈将在所有参与人的占优战略的基在,因而博弈将在所有参与人的占优战略的基础上达到均衡,这种均衡称为占优战略均衡础上达到均衡,这种均衡称为占优战略均衡。例一:囚徒困境例一:囚徒困境n两个嫌疑犯作案后被警察抓住,分别关在不同的房间审讯。警察告诉每一个人:如果都坦白,各判8年;如果其中一人坦白,另一人抵赖,坦白的放出去,抵赖的判10年;如果两人都抵赖(不供认警方不知道的犯罪事实)各判1年。n给出囚徒困境的战略式表述:囚徒困境(囚徒困境(Prisoners ilemma):):囚徒囚徒B坦白抵赖囚徒囚徒A 坦白 抵赖n这里,每个囚徒都有两种可供选择的战略:坦这里,每个囚徒都有两种可供选择的战略:坦白或抵赖。表中每一格的两个数字代表对应战白或抵赖。表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中,第略组合下两个囚徒的支付(效用),其中,第一个数字是一个数字是A的支付,第二个数字为的支付,第二个数字为B的支付。的支付。n在这个例子里,不论同伙选择什么战略,每个在这个例子里,不论同伙选择什么战略,每个人的最优战略是坦白。人的最优战略是坦白。n在一个博弈里,如果所有参与人都有占优战略在一个博弈里,如果所有参与人都有占优战略存在,占有战略是可以预测到的唯一的均衡。存在,占有战略是可以预测到的唯一的均衡。n在这个例子里,(坦白,坦白)就是占有战略在这个例子里,(坦白,坦白)就是占有战略均衡。均衡。n占优战略均衡只要求每个参与人是理性占优战略均衡只要求每个参与人是理性的,而并不要求每个参与人知道其他参的,而并不要求每个参与人知道其他参与人是理性的。这是因为,不论其他参与人是理性的。这是因为,不论其他参与人是否理性,占优战略总是一个理性与人是否理性,占优战略总是一个理性参与人的最优选择。参与人的最优选择。n现实社会经济活动中的许多问题都可以现实社会经济活动中的许多问题都可以用囚徒困境的分析方法去解释,如:用囚徒困境的分析方法去解释,如:n公共产品的供给问题公共产品的供给问题n军备竞赛军备竞赛n交通拥挤交通拥挤n中小学生中小学生“减负减负”与各学校的加班补习与各学校的加班补习n市场竞争中的价格战市场竞争中的价格战n团队工作中的偷懒等团队工作中的偷懒等 囚徒困境:囚徒困境:个人理性与团体理性的冲突个人理性与团体理性的冲突 2.重复剔除的占优战略均衡n在绝大多数博弈中,占优战略均衡是不存在的。在绝大多数博弈中,占优战略均衡是不存在的。我们可以通过逐步剔除劣势我们可以通过逐步剔除劣势战战略找出博弈的均略找出博弈的均衡。衡。n劣战略劣战略(dominated strategies):是指在其他博是指在其他博弈参与人战略为既定的条件下,某一参与人可弈参与人战略为既定的条件下,某一参与人可能采取的战略中,对自己相对不利的战略。能采取的战略中,对自己相对不利的战略。n严格劣战略严格劣战略(strictly dominated strategies)则是则是指:无论其他博弈参与人采取什么战略,某一指:无论其他博弈参与人采取什么战略,某一参与人可能采取的战略中,对自己相对不利的参与人可能采取的战略中,对自己相对不利的战略。战略。n首先找出某一博弈参与人的严格劣战略,首先找出某一博弈参与人的严格劣战略,将它剔除掉,重新构造一个不包括已剔将它剔除掉,重新构造一个不包括已剔除战略的新的博弈;然后继续剔除这个除战略的新的博弈;然后继续剔除这个新的博弈中某一参与人的严格劣战略;新的博弈中某一参与人的严格劣战略;重复进行这一过程,直到剩下唯一的参重复进行这一过程,直到剩下唯一的参与人战略组合为止。与人战略组合为止。n这个唯一剩下的参与人战略组合,就是这个唯一剩下的参与人战略组合,就是这个博弈的均衡解,称为这个博弈的均衡解,称为“重复剔除的占重复剔除的占优战略均衡优战略均衡”(iterated dominance equilibrium).例二:智猪博弈n猪圈里有两头猪:一头大猪,一头小猪。猪圈的一头有一猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮,将有10个单位的猪食进槽。但按按钮需要支付2个单位的成本(包括时间),若大猪先到,大猪吃到9各单位,小猪只能吃到1个单位;若小猪先到,大猪吃到6个单位,小猪吃到4个单位;若同时到,大猪吃到7个单位,小猪吃到3个单位。n下表列出的数字是对应不同战略组合下每头猪所吃到猪食量减去按按钮的成本之后的净收益。智猪博弈:智猪博弈:小小 猪猪 按 等待按等待大大 猪猪n这个博弈没有占优战略均衡。这个博弈没有占优战略均衡。n无论大猪选择什么战略,小猪的占优战略是无论大猪选择什么战略,小猪的占优战略是“等待等待”。而大猪的最有战略依赖于小猪的选择。而大猪的最有战略依赖于小猪的选择。n假定小猪是理性的,再假定大猪知道小猪是理性的,那假定小猪是理性的,再假定大猪知道小猪是理性的,那么大猪会正确地预测到小猪会选择么大猪会正确地预测到小猪会选择“等待等待”。给定这个。给定这个预测,大猪的最优选择只能是预测,大猪的最优选择只能是“按按”。这样,。这样,“按,等按,等待待”是这个博弈的唯一战略均衡。是这个博弈的唯一战略均衡。n在智猪博弈的均衡求解中,首先剔除小猪的劣战略在智猪博弈的均衡求解中,首先剔除小猪的劣战略“按按”。在剔除掉小猪的劣战略后的新的博弈中,小猪只有。在剔除掉小猪的劣战略后的新的博弈中,小猪只有一个战略一个战略“等待等待”,大猪仍有两个战略,但此时,大猪仍有两个战略,但此时,“等等待待”已成为大猪的劣战略,再剔除这个劣战略,剩下的已成为大猪的劣战略,再剔除这个劣战略,剩下的唯一战略组合是(按,等待)。唯一战略组合是(按,等待)。与占优战略均衡相比,重复剔除劣势战略均与占优战略均衡相比,重复剔除劣势战略均衡,不仅要求博弈的所有参与人都是理性的,衡,不仅要求博弈的所有参与人都是理性的,而且要求每个参与人都了解所有的其他参与而且要求每个参与人都了解所有的其他参与人都是理性的。人都是理性的。理性是参与人的共同知识,没有一个理性的理性是参与人的共同知识,没有一个理性的参与人会选择劣战略。参与人会选择劣战略。在上例中,如果大猪不能排除小猪按按钮的在上例中,如果大猪不能排除小猪按按钮的可能性,按按钮就不一定是大猪的最优选择。可能性,按按钮就不一定是大猪的最优选择。智猪博弈:多劳不多得,少劳不少得n现实社会经济活动中也有许多智猪博弈现实社会经济活动中也有许多智猪博弈的例子。的例子。n股票市场上炒股,股票市场上炒股,“小户小户”跟跟“大户大户”。n大企业与小企业的博弈,大企业研发,大企业与小企业的博弈,大企业研发,小企业模仿。小企业模仿。n公共产品的搭便车现象。公共产品的搭便车现象。例子:市场进入阻挠博弈n产业经济学中的例子。有一个垄断企业已在市场上(称在位者),另一个企业想进入(称进入者)。在位者想保持自己的垄断地位,所以就要阻挠进入者进入。n这个博弈中,进入者有两种战略可以选择:进入或不进入;在位者也有两种战略选择:默许或斗争。假定进入之前垄断利润为300,进入之后寡头利润合为100(各得50),进入成本10,两种战略组合下的支付矩阵如下:市场进入阻挠博弈:市场进入阻挠博弈:进入者进入者进入进入不进入不进入在位者在位者 默许默许 斗争斗争n这个博弈有两个纳什均衡:(进入,默许)和这个博弈有两个纳什均衡:(进入,默许)和(不进入,斗争)。其中,前者是强纳什均衡,(不进入,斗争)。其中,前者是强纳什均衡,后者是弱纳什均衡。后者是弱纳什均衡。n给定进入者进入,在位者选择默许时得给定进入者进入,在位者选择默许时得50单位单位利润,选择斗争得不到利润。所以,最优战略利润,选择斗争得不到利润。所以,最优战略是默许。同样,给定在位者选择默许,进入者是默许。同样,给定在位者选择默许,进入者的最优战略就是进入。的最优战略就是进入。n尽管在进入者选择不进入时,默许和斗争对在尽管在进入者选择不进入时,默许和斗争对在位者无差别,但只有当在位者选择斗争时,不位者无差别,但只有当在位者选择斗争时,不进入才是进入者的最优选择。所以,(不进入,进入才是进入者的最优选择。所以,(不进入,斗争)是一个纳什均衡。斗争)是一个纳什均衡。n如果想用重复剔除弱劣战略的方法找到博弈如果想用重复剔除弱劣战略的方法找到博弈的解,斗争是在位者的弱劣战略,因而被剔的解,斗争是在位者的弱劣战略,因而被剔除。(进入,默许)是唯一剩下的没有被剔除。(进入,默许)是唯一剩下的没有被剔除的战略组合,是重复剔除的占优均衡。纳除的战略组合,是重复剔除的占优均衡。纳什均衡(不进入,斗争)将被剔除掉了。什均衡(不进入,斗争)将被剔除掉了。n这个例子也说明,纳什均衡允许弱劣战略的这个例子也说明,纳什均衡允许弱劣战略的存在。存在。n注意:如果重复剔除后剩下的战略组合不是注意:如果重复剔除后剩下的战略组合不是唯一,该博弈不是重复剔除占优可解的。相唯一,该博弈不是重复剔除占优可解的。相当多的博弈是无法使用重复剔除劣战略的方当多的博弈是无法使用重复剔除劣战略的方法找到均衡解的。法找到均衡解的。3.纯战略纳什均衡:性别博弈n这个例子讲的是谈恋爱的男女,有些业余活动要安排,或者看足球,或者看歌剧。男的偏好足球,女的则偏好歌剧。但他们不愿意分开活动。下表给出双方的收益。例三:性别博弈男男歌剧歌剧 足球足球女女歌剧歌剧足球足球n在这个博弈中,先站在女方的立场上选择最优在这个博弈中,先站在女方的立场上选择最优战略,如果男方选择看歌剧,女方选择看歌剧战略,如果男方选择看歌剧,女方选择看歌剧的得益是的得益是2,选择足球的得益是,选择足球的得益是0,因此,女方,因此,女方的最优选择是看歌剧;如果男方选择看足球,的最优选择是看歌剧;如果男方选择看足球,女方选择看歌剧的收益是女方选择看歌剧的收益是0,选择看足球的收,选择看足球的收益是益是1,因此女方的最优选择是看足球。同样,因此女方的最优选择是看足球。同样,站在男方的立场上,女方选择看歌剧,男方的站在男方的立场上,女方选择看歌剧,男方的最优选择是看歌剧,女方选择看足球,男方最最优选择是看歌剧,女方选择看足球,男方最优选择看足球。优选择看足球。n这个博弈存在两个纳什均衡这个博弈存在两个纳什均衡“(歌剧,歌剧)、(歌剧,歌剧)、(足球、足球)。就是说,双方或者一起看歌(足球、足球)。就是说,双方或者一起看歌剧,或者一起看足球。剧,或者一起看足球。n事实上,这个博弈还有一个混合战略纳事实上,这个博弈还有一个混合战略纳什均衡,就是女方以什均衡,就是女方以2/3的概率选择歌的概率选择歌剧,剧,1/3的概率选择足球;男方以的概率选择足球;男方以2/3的的概率选择足球,概率选择足球,1/3的概率选择歌剧。的概率选择歌剧。n一般来说,如果一个博弈有两个纯战略一般来说,如果一个博弈有两个纯战略纳什均衡,那么,一定存在第三个混合纳什均衡,那么,一定存在第三个混合战略纳什均衡。战略纳什均衡。4.混合战略纳什均衡n混合战略指的是,参与人以一定的概率选择某种混合战略指的是,参与人以一定的概率选择某种战略,当博弈重复多次时,应当研究各个战略选战略,当博弈重复多次时,应当研究各个战略选择应赋予多大的概率,能获取最大的期望效益。择应赋予多大的概率,能获取最大的期望效益。n与此

    注意事项

    本文(博弈论与决策行为讲义.pptx)为本站会员(修****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开