博弈论知识点总结复习资料重点.docx
《博弈论知识点总结复习资料重点.docx》由会员分享,可在线阅读,更多相关《博弈论知识点总结复习资料重点.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问 题。博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的 规则。信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全 信息)等的信息。完全信息:每个参与人对其他参与人的支付函数有准确的了
2、解;完美信息:在博 弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否 则为不完美信息。不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信 息,即存在着有关其他参与人的不确定性因素。支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着 区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自 己效用,研究工具是无差异曲线。可表示为:maxU(PJ),其中P为市场价格, I为消费者可支配收入。2、其他消费者对个
3、人的综合影响表示为一个参数一一市场价格,所以在市场价格既 定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但 是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行 选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于 描述不需要考虑博弈进程的完全信息静态博弈问题。1、参与人集合 r = 1,2,.,722、每位参与人非空的战略集S “3、每位参与人定义在战略组合 力* =($斗,
4、.s“)上的效用函数Ui(sl,s2,,sn). 扩展式博弈:是博弈问题的一种 规疝性描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程4、不完全信息动态博弈4.1 不完全信息动态博弈特点:在博弈开始之前参与人之间的信息存在不确定性,同时 参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。4.2 不完全信息动态博弈的有关概念类型:是指参与者的类型。在不完全信息动态博弈中自然首先选择参与人的类型。动态博弈:行动有先有后。所以后行动者可以观察到先行动者的行动信息,从而可 以修正自己对于参与人的类型的信息的判断。类型
5、相依:参与者的行动传递着有关自己的类型的信息,对方可通过参与人的行动来 推断自己的最优行动。先行动者预测到自己的行动被后行动者利用,就会设法传递对 自己最有利的信息。4.3 不完全信息动态博弈的纳什均衡一一精炼贝叶斯均衡对应于不完全信息动态博弈的纳什均衡称为精炼贝叶斯均衡;精练贝叶斯均衡是 泽尔腾不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯 均衡的结合。1、不完全信息动态博弈均衡求解的基本思路:不完全信息动态博弈将子博弈精炼Nash均衡中“均衡精炼”的思想应用到不完全信息 扩展式博弈中,但是有提前条件:1、对每个参与人i,在其信息集上给出关于自己位于该信息集中哪一个决策
6、结的信念 (或推断)。2、对参与人i的每个信息集,在给定参与人/在该信息集上的信念(或推断)情况下, 参与人的战略是对其他参与人战略的一个最优反应。与静态博弈不同的是:在观测到先行动者第一阶段选择后,后行动者可以修正对 先行动者类型的先验概率,因为先行动者的行动可能包含其类型的信息,即行动就是 类型的反映,不同的行动反映不同的类型信息。参与人最初对于对手类型信息概率的判断成为先验概率,对于根据行动反映出得信息 修正后的概率成为后验概率。先验概率(prior probability):修正之前的判断;后验概率(posterior probability):修正之后的判断先验概率和后验概率的转化是
7、根据贝叶斯法则计算:Pr(AB)=雷幕 UAB) Pr(/1)在不完全信息动态博弈博弈均衡解的求解过程中,如果不可置信的威胁,均衡就 是不合理的,所以要对均衡结果精炼,剔除那些不可置信的威胁。从而引入子博弈 精练纳什均衡的概念,但是,在不完全信息动态博弈中,只有一个子博弈,不能 将上述方法直接用于求不完全信息动态博弈的均衡解。合理的均衡应该是满足:给定每一个参与人有关其他参与人类型的后验信念,参与人 的战略组合在每一个后续博弈上构成贝叶斯均衡,我们将通过这种方式得到的纳什均衡称 为精炼贝叶斯纳什均衡。精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼纳什均衡和贝叶斯推断的结合,精炼贝叶 斯均衡要求:1、
8、在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念)2、每一个参与人根据贝叶斯法则和均衡战略修正后验概率3、 给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的。3、精炼贝叶斯纳什均衡:满足条件:1、对于所有的参与人i,在每一个信息集力上,存在$; (j 应)e arg max ,d)2、万“小/)是使用贝叶斯法则从先验就率,Pi/。、观测到的a和最优战略 S-i*(.)得到的。精炼贝叶斯纳什均衡是均衡战略和均衡信念的结合,给定信念P=5l*,-,Pn*), 战略S*=(S1* , Sv*,Sn*)是最优的, 给定战略s*=(S1* ,
9、S2*,S0*),信念p*= (P.*,,P0*)是使用贝叶斯法则从均衡战略和所观测到的行动得到的。4、均衡类型:以信号传递博弈为例:信号博弈顺序:1、“自然”首先选择1的类型参与人1知道自己的类型,但参与人2不知道,只 知道1属于。的先验概率P=P(8)2、1在观测到类型0后选择发出信号mcI,M=E,,mJ是信号空间3、2观测到m(而非0)使用贝叶斯法则从先验概率p推断后验概率p=p(0| m),然后选择 战略s;4、支付函数分别为5(m, s,。),u2(m, s, 0) o信号传递博弈的均衡是战略组合(m*(0),s*(m)和后验概率所p(0| m)的结合,他满足1、s*(m)极大化Z
10、 p( 0 | m) U2(m, s, 9)2、m*(8)极大化 ui(m, s*(m), 8)3、是参与人2使用贝叶斯法则从先验概率p=p(0).观测到的信号m和参与人1的最优战略m* (8)得到的。在信号博弈模型中存在3种均衡解,分别为:分离均衡(separating oquilibrium ):不同类型的发送者以1的概率选择不同的信号,或 者说,不同类型的人选择的信号互不相同。在分离均衡下,信号准确地揭示出类型。混同均衡(pooling equilibrium ):不同类型的发送者选择相同的信号,或者说,不 同类型的人选择相同的信号,因此,接收者不修正先验概率。准分离均衡(semi-se
11、parating equilibrium): 一些类型的发送者随机地选择信号,另 一些类型的发送者选择特定的信号。以上这些是根据最先列出的表格分别对每种类型的博弈进行了分析。我局的博弈论 这门课程最有吸引力的地方就是博弈论分析问题的方法。通过信息这个变量,从而可以引 入各种因素去分析工而且博弈论考虑的是决策主体之间的博弈关系,由于现实的生活中 这样的博弈无处不在,所以博弈论这门课程更多的来说是现实生活中竞争关系的一个缩影 版。博弈论的学习使得我自己对于分析问题的角度和思路都有了拓展,而且分析问题有 了框架和依据确实让我受益匪浅。中遇到决策问题时序列结构的分析。包含要素:1、参与人集合= 1,2
12、,.,2、参与人的行动顺序,即每个参与人在何时行动;3、序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择 的行动方案、所了解的信息;4、参与人的支付函数。比较:1、战略式博弈从本质上来讲是一种静态模型。2、扩展式博弈从本质上来讲是一种动态模型。5、博弈论分类:按决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议可分为:1、合作博弈(强调团体理性、团体最优决策、效率)2、非合作博弈(强调个人理性,个人最优决策)按参与人行动先后顺序可分为:1、静态博弈:博弈中参与人同时行动,或者虽然不是同时行动,但是在行动前不 知道其他参与人所选择的行动。2、动态博弈:参与人的行动有先
13、后顺序,后行动者获得先行动者的行动信息。按参与人对信息的掌握程度可分为:1、完全信息:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的 了解,博弈开始时不存在不确定性因素。2、不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。按决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为:完全信息静态博 弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。静态动态完全信息完全信息静态博弈 均衡:纳什均衡完全信息动态博弈均衡:子博弈精炼纳什均衡不完全信息不完全信息静态博弈 均衡:贝叶斯纳什均衡不完全信息动态博弈均衡:精
14、炼贝叶斯纳什均衡6、根据所学这四种博弈的特点对这四种博弈做一个对比分析:类型信息和行动特点均衡均衡类型特别均衡求解方法学过的例子性质完全信 息静态 博弈每个参与人对其 他所有参与人的 特征、战略空间及 支付函数有精确 的了解,博弈开 始时不存在不确 定性因素,参与 人同时行动或者纳什均 衡纯战略纳 什均衡 (PNE)占优战略纳 什均衡 (DSE)箭头法 划线法Hotelling价格竞争库诺特价格竞争多重性和存 在性重复剔除的 占有均衡 (IFDE)不断剔除劣 战略(弱劣 战略的剔除 顺序会影 响均衡结果一般一个博弈中 存在参与者有多 个行动时可以先 考虑能否剔除弱 战略简化博弈二、四种博弈类型
15、具体分述不是同时行动但 是后行动者不知 道行动者的行动 信息。战略和行 动相同。混合战略 纳什均衡 (MNE)聚点均衡支付最大化 法支付等值法社会福利博弈 小偷一守卫博弈完全信 息动态 博弈在博弈开始之前 参与人之间的信 息不存在不确定 性,但是参与人 行动存在先后顺 序。在完全信息动态 博弈中,为了表 示参与人之间的 信息掌握关系, 引入了信息及的 概念。子博弈 精炼纳 什均衡子博弈精 炼纳什均 衡有限次重复 博弈均衡与纳什均衡 的唯一性有 关连锁店悖论1、均衡结 果是原 博弈的 Nash 均2、同时在 每一个 子博弈 上构成Nash 均 衡无限次重复 博弈均衡 (无名氏定理)与贴现因子有关
16、囚徒困境(冷酷 战略)无限期轮流讨 价还价模型一般博弈逆向归纳法 求解斯坦科尔伯格寡 头竞争雇主与公会之间 的竞争不完全 信息静 态博弈在博弈开始之前 参与人之间的信 息存在不确定性, 但是参与人同时 行动或者不是同 时行动但是后行 动者不知道行动 者的行动信息。不确定是参与人 的了性的不确定 性贝叶斯 纳什均 衡贝叶斯纳 什均衡混合战略 (不完全信 息情况下纯 战略均衡的 极限)对原混合战 略加入少许 不确定性因 素,求极 限。性别战1、均衡存在 性2、不确定性 体现为类型 的不确定性一般贝叶斯均衡Harsanyi 转 换机制设计不完全 信息动 态博弈在博弈开始前参 与人之间的信息 存在不确
17、定性, 同时参与人行动 存在先后顺序。 不完全信息动态 博弈过程不仅是 参与人选择行动 的过程,而且是 参与人不断修正 信念的过程。精炼贝 叶斯纳 什均衡信号传递 博弈分离均衡根据所得信 息修正判断 概率,根据 收益最大化 决策信号传递博弈 不完全信息重复 博弈与声誉 Milgrom-Roberts 垄断限价模型不完全信息 动态博弈子 博弈精炼纳 什均衡与海 萨尼不完全 信息静态博 弈贝叶斯均 衡的结合。混同均衡准分离均衡1、完全信息静态博弈1.1 完全信息静态博弈特点:每个参与人对其他所有参与人的特征、战略空间及支付 函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时
18、 行动但是后行动者不知道行动者的行动信息。战略和行动相同。1.2 完全信静态博弈相关概念:以新产品开发博弈举例说明:参与人:参与人1和2。参与人的集合卡表示为:=1,2, .n.表示所有参与人的集合,在新产品开发博弈中 为:=1,2行动:开发、不开发。Ai表示参与人行动的集合。新产品开发博弈中参与人的行动集合为Al=A2=a,b,其中a 为开发,b为不开发。a=al,a2.an表示参与人的行动组合。新产品开发博弈中为:A= (a,a) ,(a,b),(b,a),(b,b) 战略:参与人的行动规则。在博弈中的战略可以定义为从观测集到行动集的映射关系,即:S上Xi-Ai。用Si=si 表示参与人所
19、有战略的集合。在n人博弈中,用S=(Si,S2,S3.,Sn)表示n个参与人的战略组合,它表示博弈中每个参 与人采取战略si的一种博弈情形。在完全信息静态博弈中,由于不存在决策时序上的差异,所有参与人在同一决策时点 即博弈开始的那一时刻决策,因此,所有参与人面临的决策情形都只有一种,所以,参 与人的战略集与行动集相同。支付:是指参与人在博弈中的所得。一般情况下也是用效用函数来表示参与人在博弈 中的所得。因此,参与人的支付就可表示为一种特定博弈情形下参与人得到的确定效用 水平或期望效用水平。支付一般用ui(l,2,.,n)表示参与人/的支付(效用水平),支付组合 u=(ul,u2,.un)表示参
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 知识点 总结 复习资料 重点
限制150内