高级微观经济学博弈论ppt课件.ppt
《高级微观经济学博弈论ppt课件.ppt》由会员分享,可在线阅读,更多相关《高级微观经济学博弈论ppt课件.ppt(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。第第1313讲讲 博弈论博弈论到目前为止,我们对经济活动的考察没有考虑人们之间行为的相互影响。其实,现实中一个人的行为总是受到其他人行为的影响和制约,人们在追逐自己利益的过程中难免要与他人发生利益冲突或矛盾。如何克服和解决人们之间的利益冲突?如何才能实现一种既能让每个人都实现自己的利益,又能让每个人都不妨碍和伤害他人利益的互利互惠的和谐局面?博弈论(game theory)为解决这些问题提供了一种有力的科学分析框架。自20世纪80年代以来,博弈论在经济学中得到了广泛应用,在揭示人们经
2、济行为的相互影响和相互制约方面取得了重大进展。大部分经济活动都可以用博弈论加以解释,甚至连市场调节与宏观调控这样的重大问题都可以看成是特殊的博弈现象,纳入到博弈论的范围加以研究。博弈论的思想方法博大精深,已经成为经济学的一个必不可少的组成部分。博弈的标准形式与分类博弈的标准形式与分类l博弈的基本要素博弈的基本要素:局中人(玩家)、策略、收益。l局中人的目标局中人的目标:收益最大化。l策略博弈策略博弈(game of strategies):局中人以策略定胜负。l博弈的标准形式博弈的标准形式(normal form of a game):G=(Xi,fi)n,其中 n 为局中人总数,Xi 为局中
3、人 i 的策略集合策略集合,S =X1 X2 Xn 为 G 的局势集合局势集合,fi:S R 为局中人 i 的收益函数收益函数。l局势局势:由各局中人的策略组成的n元组(x1,x2,xn)(其中xiXi)。l博弈的分博弈的分类类:一般按照博弈的基本要素进行分类。按局中人数分:二人博弈二人博弈、多人博弈多人博弈按策略集合分:有限博弈有限博弈、无限博弈无限博弈按收益函数分:常和常和(零和零和)博弈博弈、变和博弈变和博弈按博弈性质分:非合作博弈非合作博弈、合作博弈合作博弈按行动次序分:同时移动博弈同时移动博弈、先后先后移动博弈移动博弈(序贯博弈序贯博弈)以上分类可以结合起来,形成更仔细的分类。比如,
4、二二人零和有限博弈人零和有限博弈(矩阵博弈矩阵博弈)、多人非合作无限多人非合作无限博弈博弈等等。严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。一、矩阵博弈一、矩阵博弈 博弈是一种普遍的日常现象。当人们工作的时候,总是会有意识或潜意识地运用博弈论思维。比如,企业在经营决策中总是要考虑竞争对手的反应,个人与政府之间又存在着“上有政策,下有对策”的博弈迹象,金融监管与金融创新则犹如“猫鼠博弈”。在人们休闲时,博弈又作为消遣性的游戏让人们从中取得快乐,甚至获得智慧,例如下棋、玩牌、打麻将等。一般来讲,博弈的特征表现为两个或两个以上具有利
5、益冲突的当事人处于一种不相容状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。当所有当事人都拿定主意作出决策时,博弈的局势便得以确定。博弈论正是要研究人们之间的这种不相容的行为,它推广了标准的一人决策理论。博弈论关注的问题是:在每个当事人的收益都依赖于其他当事人的选择的情况下,追求个人收益最大化的当事人应该如何采取行动。我们先以最简单的矩阵博弈矩阵博弈为重点来讨论这个问题,建立博弈论的基本思路和分析框架。严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。(一一)矩阵博弈的标准形式矩阵博弈的标准形式 因此,
6、甲和乙的二人零和有限博弈G=(X,f;Y,g)可表示为G=(X,Y,f)。特别是当策略集合 X 和 Y 既定时,可直接用甲的收益矩阵 表示这个博弈G,并称作“矩矩阵阵博弈博弈 f”。严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。例例1 1便士匹配便士匹配 甲和乙在玩一种游戏,每人手中都有一枚硬币,每人都有两种选择:出示硬币正面、出示硬币反面。游游戏规则戏规则:甲和乙各自独立决定是出示正面还是出示反面。如果都出示正面或都出示反面,那么甲赢元,乙输元;如果一人出示正面,而另一人出示反面,那么甲输元,乙赢元。这个游戏就是通常所说的便士
7、匹配博弈便士匹配博弈(Matching Pennies),它类似于小孩子玩的“手心手背”游戏。其标准形式如下:乙乙甲甲出示正面出示反面出示正面1(甲)1(乙)1(甲)1(乙)出示反面1(甲)1(乙)1(甲)1(乙)便士匹配博弈收益表便士匹配博弈收益表严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。(二二)古诺均衡古诺均衡l局中人的目局中人的目标标:选择合适的策略以使自己的收益(对方的损失)达到最大,也就是要让对方的收益(自己的损失)达到最小。我们来分析局中人的博弈过程以揭示博弈的最优解。l假定假定:甲和乙都彼此了解对方的收益矩阵,
8、即双方都清楚自己的收益就是对方的损失利益冲突。l博弈博弈过过程程:既然每个局中人都要根据对方的行动来调整和确定自己的行动,那么博弈过程必然是这样的策略调整与选择过程:每个人都要不断地在对方选定了策略的情况下来调整自己的策略以使自己的收益达到最大。l博弈结局博弈结局:当策略调整达到了这样的局势(xh,yk)使得 xh 是甲在乙选定yk的情况下的收益最大策略,同时yk是乙甲在选定xh的情况下的收益最大策略的时候,局中人双方的策略调整得以结束,博弈的解得以确定,这个解即所谓的古诺均衡古诺均衡。即严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发
9、事件。1.1.最小最大原理最小最大原理l鞍点鞍点定理定理(最小最大原理最小最大原理)是矩阵 的鞍点(即博弈局势(xh,yk)是矩阵博弈 f 的古诺均衡)当且仅当当且仅当下述等式成立:鞍点定理表明,要找到矩阵博弈的古诺均衡(即最优解),只需按照如下步骤进行:第一,从矩阵各行的最小元中找出最大元,称为最大最小元最大最小元;第二,从矩阵各列的最大元中找出最小元,称为最最小最大元小最大元;第三,如果最大最小元最大最小元与与最小最大元最小最大元一致一致,那么该元素就是矩阵的鞍点,代表矩阵博弈的古古诺诺均衡均衡。乙乙甲甲作广告不作广告作广告3030不作广告2020例例2.2.广告广告竞竞争的古争的古诺诺均
10、衡均衡单位:万元单位:万元严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。2.2.稳妥策略与不稳定性稳妥策略与不稳定性 最小最大原理指出,只有在收益矩阵的最大最小元与最小最大元一致的情况下,矩阵博弈才有最优解。注意,最大最小元和最小最大元总是存在的,但最大最小元与最小最大元未必总是一致。这样一来,矩阵博弈就可能没有最优解。比如,便士匹配博弈就没有最便士匹配博弈就没有最优优解解:该博弈的收益矩阵的最大最小元为 和 ,最小最大元为 和 ,结果最大最小元与最小最大元不一致,从而便士匹配博弈没有最优解。s矩阵博弈可能没有最优解的真正原因是
11、什么?矩阵博弈可能没有最优解的真正原因是什么?为了分析这个问题,我们把收益矩阵的最大最小元叫做甲的甲的稳稳妥策略妥策略;把收益矩阵的最小最大元叫做乙的乙的稳稳妥策略妥策略。矩阵博弈可能没有最优解的原因是稳妥策略可能不稳定稳妥策略可能不稳定:未必未必能使策略调整过程结束能使策略调整过程结束。因此,即使甲和乙都选择稳定策略,也未必能保证博弈达到古诺均衡。严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。(三三)混合均衡混合均衡 古诺均衡未必存在,这不是我们的期望。另外,实际中,局中人常常希望行动隐秘而不被对手觉察。为了解决这两个问题,人
12、们提出了混合策略混合策略,即设计一种连自己都不知道会采取哪种策略的随机策略,对手就更不得而知,从而使得局中人的行动变得诡秘。l 混合策略混合策略(mixed strategies)考虑二人有限博弈G=(X,f;Y,g)。X=x1,x2,xm可叫做甲的纯策略集合纯策略集合,Y=y1,y2,yn可叫做乙的纯策略集合纯策略集合,S=X Y 便为博弈 G 的纯局势集合纯局势集合。甲可采取随机选择:以概率 pi 选择纯策略 xi(i=1,2,m),从而可用概率分布 p=(p1,p2,pm)来表示甲的这一选择。这种以概率分布表示的策略叫做混合策略混合策略,集合 叫做甲的混合策略集合混合策略集合。同样,可给
13、出乙的混合策略集合混合策略集合 。集合 就叫做博弈G的混合局势集合混合局势集合。严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。1.1.混合扩充混合扩充 甲和乙的收益矩阵分别为:。博弈G的混混合扩充合扩充为博弈 :l定理定理 博弈G=(X,f;Y,g)为常和博弈当且仅当当且仅当G 的混合扩充 为常和博弈。当G 是常和博弈时,G 与 具有相同的收入常和。G的混合扩充 的古诺均衡(最优解)叫做G的混合均衡混合均衡(混合最混合最优解优解)。换句话说,G的混合局势(p*,q*)叫做的混合均衡混合均衡(混合最优混合最优解解),是指(p*,q
14、*)满足如下条件:l定理定理(混合均衡的存在性混合均衡的存在性)任何矩阵博弈都有混合均衡。严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。例例3 3便士匹配的混合最优解便士匹配的混合最优解 便士匹配博弈中,甲的收益矩阵为 f。寻找便士匹配博弈的混合最优解,就是去找出 使得 。严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。2.2.混合均衡集的特点混合均衡集的特点 矩阵博弈混合均衡的存在性以及鞍点定理保证了博弈值V(G)是一个良好定义的数,并且当(p*,q*)是的混合最
15、优解时,必有V(G)=Ef(p*,q*)。博弈值在解释最优解的性质以及求解混合最优解方面相当有用,还可以通过博弈值来证明矩阵博弈G的混合均衡集(混合最优解集)具有下述定理所述的特点。博弈值 l定理定理 对于甲和乙的矩阵博弈G=(X,Y,f)来说,T=T1T2 且混合均衡集 T 是空间 的非空有界闭凸子集,从而甲的混合最优策略集T1是 的非空有界闭凸子集,乙的混合最优策略集T2 是 的非空有界闭凸子集。严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。二、二人博弈二、二人博弈 矩阵博弈仅仅是一类简单又典型的二人常和博弈,经济学中遇到的
16、博弈往往都是变和博弈。矩阵博弈理论之所以重要,是因为它为研究变和博弈提供了很好的分析思路和框架。现在,我们来在矩阵博弈理论的基础上建立一般的二人博弈理论。l 二人有限博弈l 二人无限博弈l 二人博弈的重复严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。(一一)二人有限博弈二人有限博弈例例4.4.囚徒囚徒难题难题博弈博弈乙乙甲甲合作背叛合作3000300004000背叛4000010001000囚徒囚徒难题难题博弈收益表博弈收益表古古诺诺均衡均衡(纳什均衡)严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止
17、、汇报并处理各类违纪行为或突发事件。1.1.最小最小最大原理失效最大原理失效乙乙甲甲y1y2x15532x24366博弈博弈GA:古:古诺诺均衡与最大最小元不一致均衡与最大最小元不一致乙乙甲甲y1y2x15637x24554博弈博弈GB:不存在均衡,但存在最大最小元:不存在均衡,但存在最大最小元严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。2.2.混合策略混合策略l角谷不角谷不动动点定理点定理(Kakutanis fixed point theorem)设 T 是有限维欧氏空间的非空有界闭凸子集,F:T T 是集值映射。如果 F
18、 上半连续且对任何xT,F(x)都是非空闭凸集,那么F 必有不动点,即存在xT使得xF(x)。例例5.5.性性别别之之战战:性别差异导致效用收益差异l定理定理(混合均衡的存在性混合均衡的存在性)任何二人有限博弈都有混合均衡。卡夫卡夫茹达茹达话剧足球话剧2100足球0012混合均衡:茹达和卡夫的预期收益都为2/3。意味着“男女平等”。严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。(二二)二人无限博弈二人无限博弈现在考虑二人无限博弈G=(X,f;Y,g),其中X 和Y 分别任意集合,局势集合 S=X Y 是无限集合。显然,二人有限博
19、弈的混合扩充就是二人无限博弈。二人无限博弈的混合扩充依然是二人无限博弈。因此,在无限博弈的情形,无需专门讨论混合扩充。二人博弈的古诺均衡古诺均衡是满足如下条件的局势(x*,y*):XYRf(x*,y*)(x*,y*)x*y*古诺均衡古诺均衡严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。1.1.古诺均衡存在性古诺均衡存在性n假设G1 甲的策略集合X 是某个拓扑向量空间V1的非空紧凸子集,乙的策略集合Y 也是某个拓扑向量空间V2的非空紧凸子集,从而局势集合 S 是拓扑向量空间V1 V2 的非空紧凸子集。n假设G2 甲的收益函数 f(
20、x,y)连续且关于策略变元 x 弱拟凹;乙的收益函数连续 g(x,y)且关于策略变元 y 弱拟凹。l范范格格不不动动点点定定理理 设T是拓扑向量空间的非空紧凸子集,F:TT是集值映射。如果F上半连续且对任何xT,F(x)都是非空闭凸集,则F 有不动点,即(tT)(tF(t)。l定定理理(古诺均衡的存在性)任任何何满满足足假假设设G1和和G2的的二二人人无无限限博博弈弈都有古诺均衡都有古诺均衡。严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。2.2.反应函数反应函数 当乙采取策略 y 时,甲对乙的这一行动的反应是要确定甲的相应对策x
21、以使收益 f(x,y)在乙选择y的情况下达到最大:f(x,y)=max f(x,y):xX。这就确定了一个映射 x=(y),叫做甲对乙的甲对乙的反应函数反应函数。同样,可以确定乙对甲的反应函数乙对甲的反应函数 y=(x):g(x,y)=max g(x,y):yY。由“x*=(y*)&y*=(x*)”确定的局势(x*,y*)的就是博弈G的均衡。二人无限博弈的一种特殊情况二人无限博弈的一种特殊情况:甲和乙的策略集合 X 和 Y 都是实数区间,收益函数 f:XR和 g:YR可微。则反应函数由下述方程确定:比如,严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各
22、类违纪行为或突发事件。(三三)重复博弈重复博弈 虽然我们已经对二人博弈的最优解作了研究,但让局中人找到最优解却不是一个容易的过程,需要反复实践和锻炼,就好像棋手下棋一样,需要反复不断地下,才能月来月达到最优解。可见,博弈是可以重复进行的。但到目前为止,我们所研究的博弈都是一次性博弈。因此,有必要研究博弈的重复。事实上,当博弈可以重复进行的时候,其最优结局可能会与一次性博弈的均衡有所差异。下面以囚徒难题博弈囚徒难题博弈为例来说明这个问题,分两种情况讨论:l 博弈重复有限次博弈重复有限次l 博弈重复无限次博弈重复无限次严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇
23、报并处理各类违纪行为或突发事件。1.1.有限次重复博弈有限次重复博弈 每个局中人都知道博弈将重复一个固定的次数。考虑最后一次博弈中局中人的推理:每个人都认为他们此时是在进行一次性博弈,这是最后一次行动,因而古诺均衡的标准逻辑推理得以应用,其结果是局中人双方选择“背叛”。再考虑到数第二次博弈,这里似乎每个局中人都重视合作,可以向对方发出“善意”的合作信号,以便能在下一次博弈中继续合作。但局中人作为理性人,他清楚地知道最后一次博弈中对方必然背叛,因此他在倒数第二次博弈中采取合作就没有优势可言,故要选择背叛。同样,在倒数第三次博弈中,局中人的推理与倒数第二轮博弈中的推理一样,结果在倒数第三轮博弈中,
24、局中人依然采取背叛。采用这种从后往前的“逆向归纳法(backward induction)”,便可知道每次博弈中,局中人双方都要选择“背叛”策略。可见,在有限次重复博弈中,最优的局势依然是古诺均衡,也就是说,古诺均衡是局中人双方的短期利益所在古诺均衡是局中人双方的短期利益所在。严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。2.2.无限次重复博弈无限次重复博弈每个局中人都知道博弈要无限重复进行下去。此时,每个局中人的策略都是一个函数序列,它表明每个人在每个阶段是策略选择都是此阶段之前的博弈历史的函数。这样,局中人的收益是各阶段收益
25、的贴现值之和(向时刻0贴现):。R:局中人永不背叛的收益;RT:局中人第T次背叛的收益。只要贴现率r 2,那么 RT ti 对一切 iA 成立,那么 A中的局中人就会结盟一致反对收入分配 t以达到提高收入的目的,这个联盟 A 就叫做收入分配 t 的反对者联盟反对者联盟。一种收入分配只有不存在反对者联盟的时候,才能被所有局中人接受。这种收入分配就是合作博弈的最优解核心最优解核心最优解。由所有核心最优解构成的集合,叫做博弈G的核心核心(core),记作C(G)。如上涉及到一个概念占优分配占优分配:对于收入分配 r 和 t,r A t(在联盟在联盟 A 中中 r 比比 t 占优占优)是指V(A)iA
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 微观经济学 博弈论 ppt 课件
限制150内