2022年博弈论知识点总结 .pdf
《2022年博弈论知识点总结 .pdf》由会员分享,可在线阅读,更多相关《2022年博弈论知识点总结 .pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、名师整理精华知识点博弈论知识总结博弈论概述 :1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设:1、 决策主体是理性的,最大化自己的收益。2、 完全理性是共同知识3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。行动:参与人的决策选择战略: 参与人的行动规则, 即事件与决策主体行动之间的映射,也是参与人行动的规则。信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。完全信息:每个参与人对其他参与
2、人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲, 博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别:3、博弈论与传统决策的区别:1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入
3、。2、 其他消费者对个人的综合影响表示为一个参数市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈 :是博弈问题的一种规范性描述,有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型, 因此, 从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。1、参与人集合:2、每位参与人非空的战略集Si3、 每位参与人定义在战略组合上的效用函数Ui(s1,s
4、2,sn). 扩展式博弈 :是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素:1、 参与人集合 1 , 2,.,n 1 , 2,.,n11(,.,.,)niinissss精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 1 页,共 12 页 - - - - - - - - - - 名师整理精华知识点2、 参与人的行动顺序,即每个参与人在何时行动;3、 序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的
5、行动方案、所了解的信息;4、 参与人的支付函数。比较 :1、战略式博弈从本质上来讲是一种静态模型。2、扩展式博弈从本质上来讲是一种动态模型。5、博弈论分类:按决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议可分为:1、合作博弈(强调团体理性、团体最优决策、效率)2、非合作博弈(强调个人理性,个人最优决策)按参与人行动先后顺序可分为:1、 静态博弈:博弈中参与人同时行动,或者虽然不是同时行动,但是在行动前不知道其他参与人所选择的行动。2、 动态博弈:参与人的行动有先后顺序,后行动者获得先行动者的行动信息。按参与人对信息的掌握程度可分为:1、 完全信息:每个参与人对其他所有参与人的特征
6、、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素。2、 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。按决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为: 完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。静态动态完全信息完全信息静态博弈均衡:纳什均衡完全信息动态博弈均衡:子博弈精炼纳什均衡不完全信息不完全信息静态博弈均衡:贝叶斯纳什均衡不完全信息动态博弈均衡:精炼贝叶斯纳什均衡6、根据所学这四种博弈的特点对这四种博弈做一个对比分析:类型信息和行动特点均衡均衡类型特别均衡求解方法学过
7、的例子性质完全信息静态博弈每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解, 博弈开始时不存在不确定性因素, 参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。纳什均衡纯 战略 纳什均衡(PNE) 占优战略纳什均衡(DSE )箭头法划线法Hotelling 价格竞争库诺特价格竞争多重性和存在性重复剔除的占 有 均 衡(IFDE) 不断剔除劣战略(弱劣战略的剔除顺序会影响均衡结果一般一个博弈中存在参与者有多个行动时可以先考虑能否剔除弱战略简化博弈混 合战 略纳 什均 衡(MNE) 聚点均衡支付最大化法支付等值法社会福利博弈小偷守卫博弈精品资料 -
8、- - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 2 页,共 12 页 - - - - - - - - - - 名师整理精华知识点完全信息动态博弈在 博弈 开始之 前参 与人 之间的 信息 不存 在不确 定性,但是参与人行动存在先后顺序。在 完全 信息动 态博弈中, 为了表示参 与人 之间的 信息掌握关系, 引入了信息及的概念。子博弈精炼纳什均衡子 博弈 精炼 纳什 均衡有限次重复博弈均衡与纳什均衡的唯一性有关连锁店悖论1、 均 衡 结果 是 原博 弈 的Nash 均衡;2、 同 时 在每 一 个子 博 弈上 构 成Na
9、sh 均衡无限次重复博 弈 均 衡(无名氏定理)与贴现因子有关囚徒困境(冷酷战略)无限期轮流讨价还价模型一般博弈逆向归纳法求解斯坦科尔伯格寡头竞争雇主与公会之间的竞争不完全信息静态博弈在 博弈 开始之 前参 与人 之间的 信息存在不确定性,但 是参 与人同 时行 动或 者不是 同时 行动 但是后 行动 者不 知道行 动者的行动信息。不 确定 是参与 人的 了性 的不确 定性贝叶斯纳什均衡贝 叶斯 纳什均衡混 合 战 略(不完全信息情况下纯战略均衡的极限)对原混合战略加入少许不确定性因素, 求极限。性别战1、 均衡存在性2、 不确定性体现为类型的不确定性一般贝叶斯均衡Harsanyi 转换机制设
10、计不完全信息动态博弈在博弈开始前参与人之间的信息存在不确定性, 同时参与人行动存在先后顺序。 不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。精炼贝叶斯纳什均衡信 号传 递博弈分离均衡根据所得信息修正判断概率,根据收益最大化决策信号传递博弈不完全信息重复博弈与声誉Milgrom-Roberts垄断限价模型不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。混同均衡准分离均衡二、四种博弈类型具体分述1、完全信息静态博弈1.1完全信息静态博弈特点:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性
11、因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。1.2 完全信静态博弈相关概念:以新产品开发博弈举例说明:精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 3 页,共 12 页 - - - - - - - - - - 名师整理精华知识点参与人 :参与人 1 和 2。参与人的集合卡表示为:=1,2, n.表示所有参与人的集合,在新产品开发博弈中为:=1,2 行动 :开发、不开发。Ai 表示参与人行动的集合。新产品开发博弈中参与人的行动集合为A1=A2=a,b,其中 a为
12、开发, b 为不开发。a=a1,a2 an表示参与人的行动组合。新产品开发博弈中为:A=( a,a),(a,b),(b,a),(b,b) 战略 :参与人的行动规则。在博弈中的战略可以定义为从观测集到行动集的映射关系,即:Si:XiAi。用Si=si表示参与人所有战略的集合。在 n 人博弈中,用S=(s1,s2,s3 ,sn)表示n 个参与人的战略组合,它表示博弈中每个参与人采取战略si 的一种博弈情形。在完全信息静态博弈中,由于不存在决策时序上的差异,所有参与人在同一决策时点即博弈开始的那一时刻决策,因此,所有参与人面临的决策情形都只有一种,所以, 参与人的战略集与行动集相同。支付 :是指参与
13、人在博弈中的所得。一般情况下也是用效用函数来表示参与人在博弈中的所得。 因此,参与人的支付就可表示为一种特定博弈情形下参与人得到的确定效用水平或期望效用水平。 支付一般用ui(1,2, ,n)表示参与人i的支付 (效用水平 ), 支付组合 u=(u1,u2, un)表示参与人在特定博弈情形下所得到的支付,其中为参与人i 的支付。因此,参与人i=(i=1,2, ,n)的支付就可表示为:ui=ui(si,s-i). 信息 :是参与人所具有的有关博弈的所有知识,如有关其它参与人行动或战略的知识、有关参与人支付的知识等等。在“新产品开发博弈”中,如果两个企业都知道市场需求,那么这样的博弈情形就是我们前
14、面所提到的完全信息假设;如果两个企业中至少有一个不知道市场需求,那么这样的博弈情形就是我们前面所提到的不完全信息假设。1.3 纯战略纳什均衡纯战略 :参与人在给定信息下只选择一种特定(或确定性)的战略混合战略: 混合战略解释了一个参与人对其他参与人所采取的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。纯战略纳什均衡中包括:占有均衡、重复剔除劣战略均衡、一般纯战略纳什均衡等。1、占优均衡占优战略: 参与人的最优战略si *与其他参与人的选择s-i无关。无论其他参与人选择什么战略,参与人的最优战略总是唯一的,这样的最优战略称之为“占优战略” 。在 n 人博弈中
15、,如果对于所有的其他参与人的选择s-i,si * 都是参与人i 的最优选择则称 si *为参与人的占优战略。在 n 人博弈中, 如果对所有参与人都存在占优战略si *, 则占优战略组合si*= (s1 * si2*, , sn *)称为占优战略均衡。如果所有参与人都有占优战略存在,那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈结果。2、重复剔除劣战略如果在一个博弈中,参与人不存在占优战略,但是参与人i 存在两个战略,其中一个战略叫另一个战略的所得效用要大,则理性的参与人绝对不会选择战略。严格劣战略 :*(,)( ,)iiiiiiu s su s s(,)(,)iiiiiiu ssu
16、ss(,)(,)iiiiiiussuss(,)(,)iiiiiu ssuss精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第 4 页,共 12 页 - - - - - - - - - - 名师整理精华知识点弱劣战略 :若重复剔除过程一直可持续到只剩下唯一的战略组合,则该战略组合即为重复剔除的占优均衡,此时该博弈是重复剔除战略可解。要点:再重复剔除过程中,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱劣战略,均衡结果可能与剔除顺序有关。3、一般 Nash均衡Nash均衡是完全信息静态博弈的
17、解的概念,在完全信息静态博弈中,构成 Nash均衡的战略是不可剔除的,即不存在任何一个战略严格优于Nash 均衡战略。求解纳什均衡的方法划线法、箭头法。划线法 :1、考察参与人1 的最优战略2、用上述方法找出参与人2 的最优战略3、找出最优战略组合箭头法:1、 对于每个战略组合,检查是否有参与人会偏离这个战略组合2、 直至找出没有参与人会偏离的战略组合纯战略均衡反映函数:各博弈方选择的纯策略对其他博弈方纯策略的反应。1.4 混合战略纳什均衡混合战略:在博弈中,对任一参与人i,设 Si=Si1, ,Sik, 则参与人i的一个混合战略为定义在战略集Si上的一个概率分布i= i1, , ik, 其中
18、 ij(j=1, ,k )表示参与人i选择战略表示参与人i选择战略Sij 的概率的概率,即ij满足 0 ij 1,其中概率之和为1。支付:混合战略的支付为各种概率下收益的加权平均。混合战略纳什均衡:在博弈中,混合战略组合 i= 1*, , n* 为一个 Nash均衡。当且仅当。混合战略 Nash均衡的求解:1.支付最大化法;2.支付等值法;混合战略均衡反映函数:在混合策略的范畴内,博弈方的决策是选择概率分布,因此,反应函数就是一方对另一方选择的概率分布的反应。聚点均衡:在现实生活中, 参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点”均衡。这些信息可能与社会文化习惯、参与人过去博弈的历
19、史有关。不同均衡概念之间的关系:占优均衡 重复剔除劣战略均衡纯战略纳什均衡混合战略纳什均衡1.5 纳什均衡的多重性与存在性存在性:每个有限战略式博弈(参与人与相应的战略集均为有限)必存在纳什均衡,这个均衡可能是纯战略纳什均衡,也可能是混合战略纳什均衡。多重性: 一个博弈可能有多个均衡,博弈论并没有一个一般的理论证明,哪一个纳什均衡结果一定能出现。11 ;,.,;,.,nnGSS uu11 ;,.,;,.,nnGSS uu*,(,)(,)iiiiiiiiivv有精品资料 - - - 欢迎下载 - - - - - - - - - - - 欢迎下载 名师归纳 - - - - - - - - - -第
20、 5 页,共 12 页 - - - - - - - - - - 名师整理精华知识点2、完全信息动态博弈2.1 完全信息动态博弈特点:在博弈开始之前参与人之间的信息不存在不确定性,但是参与人行动存在先后顺序。在完全信息动态博弈中,为了表示参与人之间的信息掌握关系,引入了信息及的概念。2.2 完全信息动态博弈有关概念:信息集 :信息集Ii是参与人i决策结的一个集合,它满足以下两个条件: 1 、 Ii中的每个决策结都是参与人i 的决策结;2、当博弈到达Ii时,参与人i 知道自己处在该信息集中的某个决策结,但不知道是哪一个。在博弈树中,属于同一信息集的决策结一般用虚线连接起来。结 :包括决策结和终点结
21、两类。决策结是参与人采取行动的点时点,终点结是博弈行动路径的终点。一个信息集可能只包含一个决策结,也可能包含多个决策结。如果只包含一个决策结的信息集就是但单结信息集。如果博弈中所有信息集都是单结的则成为完美信息博弈。子博弈 :是原博弈的一部分,它始于原博弈中一个单结信息集中的决策结x,并由决策结x及其后续结共同组成。1、 子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构;2、 原博弈可以作为自身的一个子博弈;2.3 不完全信息静态博弈均衡子博弈精炼Nash 均衡:解决 Nash均衡多重性问题的一种主要方法就是精炼的方法,即在Nash均衡的基础上,通过定义更加合理的博弈解并剔
22、除不合理的均衡。子博弈精炼纳什均衡的引入就是将那些包含不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈结果的一个合理预测。即子博弈精炼纳什均衡要求均衡战略的行为规则在每个信息集上都是最优的。扩展式博弈的战略组合,是一个子博弈精炼Nash 均衡,当且仅当满足以下条件:1、是原博弈的Nash均衡2、在每一个子博弈上构成Nash均衡一个战略组合是子博弈精炼Nash 均衡当且仅当它对所有的子博弈( 包括原博弈) 构成Nash 均衡,同时也意味着原博弈的Nash 均衡并不一定是子博弈精炼Nash 均衡,除非它还对所有子博弈构成Nash均衡。2.4 不完全信息静态博弈均衡求解逆推归纳法逆推归纳法是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年博弈论知识点总结 2022 博弈论 知识点 总结
限制150内