2022年博弈论练习题2答案 .pdf

上传人：Che****ry

文档编号：33672550

上传时间：2022-08-12

格式：PDF

页数：6

大小：93.05KB

( 4.5 )

《2022年博弈论练习题2答案 .pdf》由会员分享，可在线阅读，更多相关《2022年博弈论练习题2答案 .pdf（6页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、1 111111111111111111 博弈论练习题（四）一、什么是子博弈精炼纳什均衡？答：将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁，在许多情况下，精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说，组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大？为什么？答：正确，博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“ 自我 ”个体理性，这是静态博弈的范畴。除此之外，还要求相关的

2、参与者具有层次较高的“ 交互理性” ，要求不同个体之间在理性和行为方面具有一种“ 默契 ” 。即，人们的自身利益的最大化不仅取决于自己的选择，还取决于与之相关的其他人的选择与行为，那么为了实现自己的最大利益，个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础，交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“ 知识 ” 是所有博弈参与者之间的“ 共同知识 ” 。也就是，每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略，还需知晓各种情况下自己最终的收益或其概率分布，并且每个博弈参与者都知道各个参与者掌握这些信息

3、；更为重要的是，每个博弈参与者都知道所有参与者都是理性的，都知道其他博弈参与者知道所有参与者都是理性的，都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的- 。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设，是实现交互理性和理性主义的纳什均衡的基本前提，这些，都是动态博弈的范畴。因此说，参与者理性问题对动态博弈的分析影响更大。三、纳什均衡和精炼纳什均衡存在哪些问题？答：纳什均衡存在的问题：(1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡，它是通过概率来计算纳什均衡，在这种均衡下，给定其他参与人的策略选择概率，每个参与人都可以为自己

4、确定选择每一种策略的最优概率。(2)在论及纳什均衡时，我们假设参与人是完全理性的，而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。精炼纳什均衡存在的问题：有限重复博弈的子博弈精炼纳什均衡有如下定理令G 是阶段博弈， G（ T）是重复 T 次的重复博弈。那么，如果G 有唯一的纳什均衡，重复博弈G（T）的唯一子博弈精炼纳什均衡结果是阶段博弈G 的纳什均衡重复T 次。这个定理成立的条件是单阶段纳什均衡的“ 唯一性 ” ，若纳什均衡不是唯一的，上述定理的结论就不一定成立。四、有限次重复博弈和无限次重复博弈有什么区别？这些区别对我们有什么启发？答：有限次重复博弈与无限次重复博

5、弈都属于动态博弈，对于有限次博弈，收益是每次收益的简单相加，可以采取子博弈纳什均衡的方法求解，即逆推法；但无限次博弈却不能采取；此外，有限次博弈中博弈的双方都还是关注的是自己短期的利益，而无限次博弈中博弈的双方可能针对某项事情达成协议，达到共谋，为共同的利益而选择自己的行动，达到整体的最优，供应链契约即类似。五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡？答：精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页，共 6 页2 博弈重复次数有限，意味着存在所有参与人都可以预测到的“最后一次”。在最后的阶段博弈中，

6、如果某一参与人选择了自己的占优战略，给其他参与人造成损失，则其他参与人不可能报复。所有的参与人都明白这一点，因而在最后一次阶段博弈中都会选择占优战略，换句话说，在给定最后阶段所有参与人都会选择占优战略的前提下，所有的参与人在倒数第二阶段的博弈中也都会选择占优战略。由此从最后的阶段开始，逐个阶段进行推理，可以得出以下结论：在阶段博弈有唯一的纳什均衡时，有限次重复博弈的唯一子博弈精炼纳什均衡结果，是阶段博弈的纳什均衡重复。这就是说，每个阶段博弈出现的都是一次性博弈的均衡结果。六、无限次重复博弈均衡解的得益一定会优于原博弈均衡解的得益吗？答：不一定。例如：无限次重复博弈的古诺博弈，此博弈是相同博

7、弈重复无限次，当冷酷战略是整个博弈的纳什均衡时，当然也就是每个阶段的纳什均衡。此时，无限次重复古诺博弈的冷酷战略已意味着是两厂商在两种战略间进行选择的囚徒困境博弈，一是选择生产垄断产量的一半 Q/2，另一是选择生产背叛产量时，冷酷战略是无限次重复古诺博弈的一个子博弈精炼纳什均衡。贴现因子较大说明未来的利益较大，对两厂商都有较大的吸引力，一般情况下，两厂商不会为了短期利益而背叛对方而失去较大的长远利益，即两厂商都有坚持冷酷战略的积极性。而当时，意味着冷酷战略不再是一个子博弈精炼纳什均衡。贴现因子较小说明未来的利益对两厂商都不具有吸引力，选择背叛才是两厂商的最优选择。这种条件下，博弈无限

8、次重复也不能提高一次性博弈的得益。七、触发战略所构成的均衡都是子博弈精炼纳什均衡吗？答： “ 触发战略 ” 是这样一种战略首先试探合作，如果对方合作，则给予奖励；如果对方不合作，则给以惩罚。在原博弈有多个纳什均衡的条件下，在重复博弈时，通过触发战略提高了双方的收益。首先，在第二次博弈时意味着该博弈结束，而均衡结果是原博弈的纳什均衡，双方都没有偏离的意愿；其次，第一次选的策略虽不是原博弈的纳什均衡，如果某一方偏离会增加收益，但这样会遭到对方第二次选另外的策略的惩罚而损失收益，使总得益减少。预见到这一点，只顾眼前不顾长远的偏离是得不偿失的事，因此双方会坚持选使总收益最大的策略。所以，

9、触发战略构成的均衡都是子博弈精炼纳什均衡。八、什么是冷酷战略？什么是针锋相对战略？什么是最小最大战略？答：冷酷战略也称为触发战略，这种战略做法是1、参与人在博弈开始时均选择合作；2、只要对方一直选择合作，则继续合作下去，但当某一时刻对方选择了不合作，则一直永远选择不合作来惩罚对方的背叛行为。针锋相对战略：参与人在博弈开始时选择合作；在时期t 选择对方在时期t-1 期所采用的战略，即如果对方在t-1 期背叛（不合作），则自己在t 期也选择背叛。最小最大战略：最小最大战略是指当违规者不采取合作行为而对他进行惩罚时，违规者可能得到的最严厉的制裁的战略（相应的，违规者为了减少惩罚对自己的影响，而

10、使自己得益最大的战略。练习题（五）一、若你正在考虑收购一家公司的一万股股票，卖方的开价是2 元/股。根据经营情况的好坏，该公司股票的价值对你来说有1 元/股和 5 元/股两种可能，但只有卖方知道经营的精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页，共 6 页3 真实情况，你只知经营好、坏的概率各为0.5。如果公司经营不好时，卖方做到使你无法识别真实情况的“包装”费为5 万元，你是否会按卖方的价格买下这些股票？如果“包装”费仅为0.5 万元，你会如何选择？答：当卖方使买房无法识别真实情况的包装费为5 万元时，买方的股票价值期望值为E=0.5

11、 1-5+0 .5 5=0.5 元/股在这种情况下，无法接受卖方给出的价格当卖方的包装费为0.5 万元时，买方的股票价值期望值为E=0.5 1-0.5+0 .5 5=2.75 元/股在这种情况下，接受卖方给出的价格二、现实生活中常常是既有部分卖假冒伪劣产品的厂商会打出“质量三包”、 “假一罚十”等旗号，也有一些卖假冒伪劣产品的厂商声明“售出商品概不退换”。问这两类厂商有什么不同，他们各自战略的根据是什么？答：第一类厂商实行战略的根据是：“最大最小战略” ，根据无限次重复博弈中的子博弈精炼纳什均衡实际上是参与人相互合作的结果，要使合作成功，其战略中必须要有惩罚措施。所谓最小最大战略是指当违规者

12、不采取合作行为而对他进行惩罚时，违规者可能得到的最严厉的制裁的战略。第二类厂商采取战略的根据是：“冷酷战略” ，任何为了短期利益的背叛行为的所得对长期利益而言都是微不足道的，且会遭到对方一直背叛的冷酷打击，故参与人有积极性为自己建立一个乐于合作的声誉，同时也有积极性惩罚对方的背叛行为。三、在有两个投标者的暗标拍卖中，投标者的估价独立分布于0，1且两人的估价相同，则贝叶斯纳什均衡是什么？博弈的结果是什么？如果两投标者知道他们的估价是相同的，结果会发生什么变化？解：两个人投标人为i，j,投标者 i 的支付如下：最终解得，拍卖的对称贝叶斯均衡战略为同理可得，对投标人j 也可得到相同的结论即，在只有两

13、个投标人时，这个博弈的贝叶斯均衡是，每个投标人的出价是其实际价值的一半。如果两个投标者知道他们的估价相同，即信息是完全的，买者之间的竞争将使卖者得到买者价值的全部。四、 “说实话”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。答： “ 说实话的直接机制” 。即如果所设计的直接机制能使得各投标人讲真话，也就是声明自己的真实类型（如对商品的真实价值）是贝叶斯纳什均衡，则称这样的直接机制为jijiiijiiiijiissssssssssu, 0, 2/ )(),(；2/*iis2/*jjs精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第

14、3 页，共 6 页4 “ 说实话的直接机制” 。也称为 “ 激励相容 ” 或“ 鼓励响应 ” 机制。如果代理人从讲真话中得到稍高的效用，则讲真话变为强均衡。事实上，如果讲真话的效用足够强，则代理问题以及与之相联系的成本将会消失，能保证博弈方都按他们的真实类型行为并获得理想的结果。五、静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型设定行为选择，是因为能够迷惑其他博弈方，从而可以获得对自己更有利的均衡。答：正确。不完全信息静态博弈的静态贝叶斯纳什均衡实际上是这样一种类型依从型战略组合给定自己的类型和别人类型的概率分布情况下，每个参与人最大化自己的期望效用。博弈方需要针对自己的所有可能类

15、型设定行为选择，是因为能够迷惑其他博弈方，从而可以获得对自己更有利的均衡六、什么是贝叶斯纳什均衡？答： n 人不完全信息静态博弈：的纯战战略贝叶斯纳什均衡是一个类型依存战略组合，其中每个参与人i 在给定自己的类型和其他参与人类型依存战略，的情况下最大化自己的期望效用函数，换言之，战略组合是一个贝叶斯纳什均衡，如果对于所有的i，有，贝叶斯纳什均衡实际上是这样一种类型依从型战略组合给定自己的类型和别人类型的概率分布情况下，每个参与人最大化自己的期望效用。七、拍卖（招标）有哪几种常用的方式？答：（1）最高价格密封出价拍卖（一级密封价格拍卖）（2）次高价格密封出价拍卖（维克瑞拍卖）（3）双方叫价拍卖

16、（4）最高价格公开出价拍卖（英国式拍卖）（5）降价式拍卖（荷兰式拍卖）八、机制设计的基本原理是什么？什么是“直接机制”与“显示原理”？答：机制设计的基本原理是：选择一个博弈规则，最大化自己的期望效用函数。直接机制：所谓直接机制，就是指代理人（这里的买者）的战略空间（拍卖中买者的报价）等同于类型空间（拍卖中买者的价值）。其意义是只要代理人声明他们对拍卖商品的价值，并不需要他们报出标价，委托人（卖方）会根据预先确定的运作机制（包括一个随机选择过程）来确定中标者和中标价格。显示原理：显示原理对每个导致可能说谎（即的机制，其代理人的得益为（），存在着一个机制，代理人的得益为（）使其对于每个（讲真话）

17、的代理人得到相同的结果，这时，代理人将没有说谎话的积极性。练习题（六）一、假如某商品的确切价值是100，这只有卖方知道，你作为买方只知道该商品的价值标准分布于 80，110上。假设因为是积压品或需要回茏资金，因此卖方对该商品的主观价,;,;,;,1111nnnnuuppAAGi)(*iiaiu)(,),(*1*1*nnaaa),(iiiAa,);(,)(maxarg)(*iiiiiiiiiaiiaaupai)iiSiuiqis*iuiqisi精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页，共 6 页5 值评价是在客观价值上打7 折，这一点你

18、也知道。如果交易价格由卖方提出，你只能选择是否接受，问该博弈中卖方和买方（你）的合理战略是什么？答：二、假如在一个经济案件中，原告清楚上法庭自己是否会赢，而且这是原被告的共同知识，而被告不清楚谁会赢，只知道原告赢的可能性是1/3。再假设原告赢时的净利益为3，被告的净利益为-4；原告败诉时的净利益为-1，被告的净利益为0。如果原告在起诉之前可以先要求被告赔偿M=1 或 M=2 和解，被告接受就不上法庭，拒绝则上法庭。用扩展形表示该博弈，并找出该博弈的均衡。答：三、什么是精炼贝叶斯均衡？答：精炼贝叶斯均衡是所有参与人战略和信念的一种结合。它满足如下条件：第一，在给定每个参与人有关其他参与人类型的

19、信念的条件下，该参与人的战略选择是最优的。第二，每个参与人关于其他参与人所属类型的信念，但是使用贝叶斯法则从所观察到的行为中获得的。四、什么是混同均衡与分离均衡？有什么作用？答：混同均衡：是指在这种均衡中，不同类型的参与人i 选择相同的行动，这时，其他参与人无法从观察到的行动中得到的信息来识别参与人i的类型，也就无法对先验概率进行修正。分离均衡：就是指在这种均衡中，不同类型的参与人i 以概率 1 选择不同的行动，也就是说，没有不同类型的选择同一种行动。行动的信息准确地反映其类型，这样，其他参与人就可以从观察到的行动中得到的信息来识别参与人i 的类型，也就可以据此信息对先验概率进行修正。五

20、、精炼贝叶斯均衡再精炼的方法有哪些？答：用于精炼贝叶斯均衡的再精炼方法有：（1）泽尔滕在1975 年提出的 “ 颤抖手均衡 ”(2) 克瑞普斯（ Kreps）和威尔逊（Wilson ）在 1982 年提出的 “ 序贯均衡 ”(3) 梅耶森（ Myerson）在 1978 年提出的 “ 恰当均衡 ”(4) 考尔伯格（ Kohlberg）和默顿（ Merten）在 1986 年提出的 “ 稳定均衡 ”六、假设你是一家证券公司的人事经理，需要为公司招聘10 名操盘手。若用博弈论和信息经济学的思想和原理考虑，你的招聘计划中应包括哪些要点？答：招聘博弈模型：局中人：招聘方与应聘者。策略选择：应聘者有

21、两种策略，欺骗或不欺骗；招聘方也有两种策略，相信或不相信应聘者。：要从两方面采取措施，防范和规避招聘风险：精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页，共 6 页6 1、设法使应聘者采取诚信的态度。（1）降低应聘者欺骗成功的概率，使其不再有侥幸心理。比如采用申请表、笔试、绩效模拟和测验、工作抽样、面谈、专门的测评中心、履历调查、体格检查等多种手段进行甄选。（2）增大应聘者欺骗行为的成本。例如，可以建立行业人才库，输入求职方的诚信档案，凡是行骗的求职方便会有相应的档案记录，增大其以后再求职的难度；在签订的劳动协议中注明，凡是有欺骗行为，均要赔偿招聘方的损失。2、建立规范科学的招聘系统针对应聘者和招聘方的博弈情况，自行设计了企业的招聘系统，以不断的完善企业的招聘工作，使其更加科学化规范化。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页，共 6 页

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

4.3 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 2022年博弈论练习题2答案 2022 博弈论练习题答案

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：2022年博弈论练习题2答案 .pdf
链接地址：https://www.taowenge.com/p-33672550.html