2021-2022年收藏的精品资料研究领域微观经济学行为经济学.doc
《2021-2022年收藏的精品资料研究领域微观经济学行为经济学.doc》由会员分享,可在线阅读,更多相关《2021-2022年收藏的精品资料研究领域微观经济学行为经济学.doc(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、研究领域:微观经济学/行为经济学有限理性下的均衡分析范式:随机最优反应均衡*本文受到教育部人文社会科学规划项目(项目批准号02JA790034)、南开大学文科创新基金研究项目(NKC04012)的基金支持。那艺那艺,男,1979年生,南开大学经济研究所研究生。 贺京同贺京同,男,1961年生,南开大学经济研究所教授、博士生导师。南开大学经济研究所 天津 3000712005年7月23日有限理性下的均衡分析范式:随机最优反应均衡内容提要:博弈论所研究的一个重要问题是博弈中的均衡问题。纳什均衡作为传统博弈论的核心概念,所基于的理性假定过于严格,因此是一个十分脆弱的均衡,在实际中极易遭到违背。随机最
2、优反应均衡是行为博弈论的核心概念之一,是通过修正参与者的行为方式而发展起来的基于有限理性的均衡范式,是对经济学均衡分析思想的发展。本文系统描述了随机最优反应均衡的分析框架,以及它更为精确的预测功能。为了展示该均衡比传统均衡更优越的分析能力,本文根据该均衡的基本思想重新研究了寡头竞争市场,并对现实中为何存在追求产量而不追求利润最大化的厂商、以及行业中为何可能产生垄断做出了新的解释。本文最后指出,未来的经济学分析将越来越多地置于“有限理性均衡”框架之下。关键词:随机最优反应均衡;行为博弈论;有限理性;学习一、引言经济学所涉及的一个重要问题是对均衡的分析,即通过证明和寻找均衡来对经济现象进行解释和预
3、测,这种思想最早可追溯到亚当斯密(1776)。在18世纪的欧洲,由牛顿所奠定的经典力学体系日趋完善,该体系中对物理状态的均衡分析给斯密留下了深刻印象,这促使他试图在经济学中也发展出一套均衡分析方法。在经典力学体系中,导致均衡产生的一个基本因素是“重力”的存在。相似地,斯密认为,经济学的均衡分析也应建立在一个基本因素之上,他称之为人类的“自利”。斯密相信,正是由于这种“自利”,使得经济秩序服从一种内在的逻辑,从而使人们在一只“看不见的手”的指引下去达到某种确定的目标状态,这就是所谓的均衡。其后,约翰穆勒通过对斯密的思想进行形式化处理,正式地提出了理性经济人的假说。而在边际革命之后,这种假说被更为
4、抽象化与极端化,即假定经济人能根据自身处境和自身利益而做出近乎正确的判断, 并经过精密计算和仔细权衡,来使自己所追求的利益尽可能最大化。在这个假说基础上,演绎出了整个西方主流经济学的均衡分析体系,而该假说也逐渐成为经济学的基本假定和理论基石。上世纪40年代发展起来的博弈论为经济学分析提供了一套更为严谨的逻辑方法。该理论不但继承了对行为人的理性假定,即认为每个决策个体都能经过精密计算和仔细权衡来最大化其效用;而且还继承了经济学的均衡分析传统,即认为找到了均衡也就意味着预测出了参与者在博弈中的策略选择。因此博弈论中绝大多数的理论都是研究博弈中的均衡问题,并且在理性的假定前提下,运用严密的逻辑方法演
5、绎出了著名的纳什均衡。纳什均衡的出现使得博弈论中对均衡的讨论比传统经济学更进了一步。在传统经济学中,行为人的决策就是在给定价格和收入的条件下最大化其效用,他的效用函数只依赖自己的选择,而不依赖其他人的选择。而博弈论所研究的则是决策个体之间的互动行为,即个人的选择要受到其他人选择的影响,个人的最优选择是其他人选择的函数。因此说,纳什均衡比传统经济学的均衡概念包含了更多信息。纳什均衡的意义在于说明,在有限博弈中,存在一种可以自我强化的均衡点,在该点上每个参与者的策略选择都是对其他参与者策略选择的最优反应,或者说是对其他所有参与者策略选择组合的最优反应,并且任何参与者都没有偏离该点的动机(Nash,
6、 1950)。然而所产生的一个问题就是,参与者是否真地会在博弈中选择纳什均衡?对这个问题的传统回答是肯定的,因为纳什均衡被认为是在博弈的规则、参与者的理性及其支付函数都是共同知识的前提下,由参与者的分析和自省而得出的结果。然而随着实验经济学的研究手段日趋成熟,人们在实施了大量的实验后却发现,参与者在博弈中的实际选择总是偏离纳什均衡,并且这种偏离是系统性的(Crawford, 1997)。我们可以先看一下图1。该图显示了在若干次实验中,由纳什均衡所推断的各策略选择概率(横轴)与每次实验中实际选择各策略的相对频率(纵轴)之间的对应关系。我们发现,在实际选择与纳什均衡之间有显著的偏离,并且还存在这样
7、一个轻微的趋势,即纳什均衡中本应以较低概率被选择的策略却被选择得更多(或是说,那些永不应该被选择的策略实际上有5%的机会被选择),而本应以较高概率被选择的策略却没有得到足够的选择。纳什均衡推测图1 由纳什均衡所推断的各策略选择概率与实际选择的频率。资料来源:Behavioral Game Theory, Camerer(2003)。 针对这个现象,许多学者开始对纳什均衡提出质疑并认为,传统博弈论采用了一种建立在完全理性和贝叶斯决策原则之上的模式,这种模式过于僵化和脱离实际,因此所演绎出的纳什均衡在实际中也极易遭到违背,从而成为一种脆弱的均衡。为了修正传统博弈论在解释与预测方面的局限性,在西方经
8、济学界逐渐形成了一个新的研究领域行为博弈论(Behavioral Game Theory)。行为博弈论可以视为行为经济学的重要理论组成部分,它将行为和实验经济学与传统博弈论相融合,并通过大量的博弈实验,来考察理论推断与实际结果之间的差异;它通过加入行为因素来改进传统博弈论的基本假定,以使理论和实际的不一致得到修正,其最终目的是更准确地解读人类的决策行为(Camerer, 2003)。在对理性假定的探讨上,行为博弈论吸收了西蒙的有限理性学说(Simon,1955),认为行为人在进行决策时,获取信息和处理信息的认知能力是有限的,因此他无法像传统理性假定的那样最大化其目标函数,而是不得不在现实中采取
9、其他一些规则来选择自己满意的或是自己认为的最优策略,但他追求理性的努力并不会停止。西蒙对有限理性理论的定义是“研究如何以有限的认知能力在无限复杂的世界中生存的理论 ”,但是西蒙本人并未指出人们究竟是如何在“有限”与“无限”之间折衷的。行为博弈论的研究在一定程度上填补了这个空白,并使西蒙的有限理性思想更富有现实意义。对于如何理解实际选择与纳什均衡之间的偏离,行为博弈论认为,纳什均衡的推导立足于严格的理性假定,这对于一般的参与者来说是一个过高的要求。更现实的情形是,参与者在内心深处具有追求理性的动机,但有限理性的约束使他们难以做到传统假定下的最优化选择,因此对纳什均衡的追求“心有余而力不足”,故他
10、们只是处于向纳什均衡收敛的过程之中,他们的选择很难达到、或者说至少在短期内很难达到纳什均衡(Fudenberg and Levine,1998)。既然参与者只是处于向纳什均衡收敛的过程之中,那么一个自然的问题就是,参与者究竟是如何收敛的?研究这个问题有助于人们更深刻地理解纳什均衡产生的过程。在传统博弈论中,纳什均衡产生的过程就是参与者经过严密的逻辑运算而得到一个最优化的结果。而在行为博弈论中,参与者由于受到有限理性的约束,因此在现实中很难按传统方法求得纳什均衡,但是他们追求理性的努力并不会停止,而是会用其他一些未知的、甚至是非逻辑的方法来不断提高自己的理性程度,从而逐渐摸索出纳什均衡。这个追求
11、理性的过程实际上是一种认知或学习过程,纳什均衡是慢慢“学”出来的,因此具有长期性。为了研究参与者的具体学习过程,在行为博弈论中又派生出了系列的博弈学习理论。这些理论并没有否定纳什均衡的意义,但却为均衡产生的方式提出了新的思索,并具有比传统理论更为优良的解释与预测能力。然而遗憾的是,绝大多数的博弈学习理论都是把纳什均衡作为基准均衡并与新理论相比较,但并未提出比纳什均衡更强的均衡概念,也就是说,如何使经济学的均衡分析从完全理性向更符合实际的有限理性转变是一个问题。 本文所要介绍的随机最优反应均衡(Quantal Response Equilibrium,以下采用其英文简写形式QRE)填补了这方面的
12、空白。QRE是在博弈学习理论体系下发展起来的一个新的均衡概念,由Mckelvey 和 Palfrey(1995)首先在博弈实验分析中使用。由于行为博弈论在国内的研究尚未深入开展,因此QRE作为其核心概念,在国内也未有深入的介绍和探讨,只是在若干有关实验经济学的著述上略有提及。 Mckelvey 和 Palfrey(1995)在他们的文章中提到,这个新的均衡概念是由生物学、药理学等学科中广泛应用的一种统计学模型发展而来,因此国内有学者把它译成“可数性反应均衡”。 QRE是在纳什均衡的基础上,对均衡概念所做的进一步发展。该理论的基本思想同样可以纳入有限理性的范畴,认为参与者在“信念中”是追求理性的
13、,但是在计算每个策略的预期效用时会不可避免地出错,这是由人天生的有限认知能力所决定的,因而在实际情形中,纳什意义下的最优选择并不以概率1出现。然而,参与者尽管是有限理性的,但他们仍能将自身的选择落在一个类似纳什均衡的均衡之上。这个均衡点与纳什均衡处于不同的位置,但是却具有与纳什均衡相似的基本特征,即每个参与者的策略选择都是对其他参与者策略选择的“最优反应”。但需要指出的是,这只是他自己认为的“最优反应”,在后文中将看到,这里的“最优”不是纳什意义下的最优,而是在受到随机误差的干扰后所达到的一种“最优”,故我们将该均衡的中文名称译为“随机最优反应均衡”,以期与读者商榷。实际上,相对于纳什均衡来说
14、,QRE只是一种“较优”的均衡。 他会不断考虑和修正自己的看法,因此当引入时间变量,比如在进行重复博弈时,这个均衡点在每阶段将发生变动,并不断向纳什均衡收敛,而促发这种变动的力量就是参与者内生的学习能力:只有通过学习才能使参与者不断提高他们的认知能力,进而调整他们业已达到的均衡点。只有当参与者的学习停滞时,QRE才可能不再变动,但参与者追求理性的努力使之不可能停止学习,因此从这个意义上说,QRE在长期下发生变动几乎是必然的。 故该理论所提出的一个重要观点就是,参与者的实际选择与纳什均衡之间的偏离关系,不是非均衡选择与均衡选择的关系,而是其他均衡与纳什均衡的关系,同时这种偏离关系不是一成不变的,
15、在长期下有减少偏离的趋势。故我们认为,QRE是一个具有内生变动性的均衡。该理论进一步推断,参与者通过学习,可以使QRE不断逼近纳什均衡,纳什均衡是QRE的极限状态。从这个意义上说,QRE是参与者所选择的一种“不精确”的“纳什均衡”,而纳什均衡则成为参与者“信念中的均衡”。QRE理论的意义在于,它是学者们在对人类决策时所受到的内生影响因素进行重新思考后,通过修正参与者的行为方式而发展出的一个并非基于完全理性的均衡范式。QRE理论使得经济学的均衡分析法又向前推进了一步。它并不是像传统经济学那样把完全理性假定作为推导均衡的立论基础,而是更注重对有限理性思想的继承,并在此基础上演绎均衡。 近二十年来,
16、行为经济学逐渐淡化了它早期浓厚的心理学色彩,并逐步通过有限理性建模而进入主流经济学的前沿。行为博弈论作为行为经济学的组成部分,也在试图通过有限理性思想修正传统的博弈理论(Camerer,2003),并在此基础上推动对传统均衡分析的发展。 这个均衡比纳什均衡具有更丰富的内涵:它能够反映出人们随时间推移在长期下摸索最优化结果的过程,因此它具有某种内生的变动性,是一个富含动态信息的均衡。由于其优良的解释和预测能力,QRE已逐渐成为行为博弈论的核心概念之一,同时它的基本模型简洁易用,因此越来越受到经济学家的青睐。本文的剩余部分分工如下:第二节是对QRE均衡分析框架的回顾;第三节通过一种参数化的形式来展
17、示了QRE的具体求解过程,以及它在解释实际数据中的应用;第四节是对有限理性如何改进传统均衡分析法的展示,我们重新研究了寡头竞争市场,并提出一个新的均衡概念“古诺QRE”,对现实中为何存在只追求产量而不追求利润最大化的厂商、以及行业中为何可能产生垄断提出了新的解释;第五节是结论与启示。二、QRE的均衡分析框架本节将回顾QRE理论的一般分析框架,以及它作为有限理性范畴下的均衡所具有的一些特点。QRE是由纳什均衡发展而来,纳什的均衡思想在QRE中仍有体现,但是纳什均衡是建立在参与者相互理性基础上的均衡,其中博弈的规则、每个参与者的理性以及支付函数都是共同知识,并且各参与者具有无限的计算和认知能力,因
18、此纳什均衡是一种“理性均衡”。对实际选择偏离纳什均衡的研究至少可追溯到Selten(1975)的颤抖手完美理论,其中考虑了参与者在博弈中可能犯的错误。但是该理论却认为,随着参与者的错误趋于无穷小,颤抖手完美最终会归至纳什均衡。而实验数据却显示,参与者的选择与纳什均衡的偏离在统计学意义上始终是显著的。其后,在这个问题上进行研究的代表人物有:Van Damme(1987),他在其著述中开始考虑,如果参与者所犯的错误不能趋于无穷小,那么将会出现什么结果;Rosenthal(1989)则在研究中假定参与者选择某策略的概率是该策略预期效用的线性递增函数;而Beja(1992)认为,参与者会事先设定一个目
19、标策略,但是他的选择最终却无法完全达到既定的目标。Mckelvey 和 Palfrey在前人理论的基础上,首先在其研究中提出和使用了QRE的基本概念。为了解答纳什均衡与实际选择之间的不一致,QRE理论中假定,参与者根据博弈中各策略的相对预期效用来进行选择,但在有限认知能力的约束下,他无法正确评估各策略的预期效用,而是受到某种随机误差的干扰。QRE理论还假定,每个参与者都知道自己的选择会受到误差的干扰,并且知道其他参与者的选择也是在误差干扰下进行的,但参与者仍能达到一个他们认为的彼此“最优反应”点。这是一种“有限理性均衡”。现在我们来正式给出QRE概念的定义。我们考虑一个n人标准式博弈,在本文中
20、我们只考虑标准式博弈。一个自然而然的问题是,在扩展式博弈中是否存在类似QRE的均衡?有关这方面的更多细节参见Mckelvey 和 Palfrey(1998)的论文。 n个人组成集合N=1, n,其中对参与者而言,他的策略集为,其中有Ji个纯策略,并定义为所有参与者策略集的集合。定义参与者i对策略的选择概率为pij ,则参与者i的混合策略选择可表示为,且,。令为各种可行的集合,即。同时进一步定义,表示各参与者可行混合策略集合的空间。又定义表示参与者i以概率1选择纯策略,而其他参与者的选择为。现在,我们可以定义参与者i的支付函数为: (1)则对于所有的以及,如果有,那么向量是一个纳什均衡。进一步地
21、,假定参与者在评估每个策略的预期效用时会犯错误,亦即他对每个策略所计算出的预期效用是正确的预期效用加上一个噪声干扰项,这个噪声干扰是由有限认知能力造成的。正式地,对每个参与者i,以及i的每个策略,定义: (2)其中表示参与者i对策略实际计算出的预期效用,表示参与者i如果不犯错误而对策略计算出的预期效用,而为参与者i的误差向量,其中各分量表示在计算各策略预期效用时的噪声干扰,它们是独立同分布的。假定这些分量共同服从于一个联合分布密度函数,其中每个分量的边际分布均存在,并且。做出这样一系列的假定和定义之后,现在可以给出每个参与者的行为规则,为:当且仅当 时,参与者i才会选择策略。这个假定符合人们的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2021 2022 收藏 精品 资料 研究 领域 微观经济学 行为 经济学
限制150内