非参数估计方法在长江和珠江三角洲地区城镇居民消费支.pdf
《非参数估计方法在长江和珠江三角洲地区城镇居民消费支.pdf》由会员分享,可在线阅读,更多相关《非参数估计方法在长江和珠江三角洲地区城镇居民消费支.pdf(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第7卷第4期2008年7月经 济 学(季 刊)China Economic QuarterlyVol17,No14July,2008非参数估计方法在长江和珠江三角洲地区城镇居民消费支出分析中的应用周先波 田凤平3摘 要 本文给出商品消费支出份额Working2Leser非均匀面板数据固定效应和随机效应模型的非参数局部线性估计方法,并用之估计和比较珠三角和长三角两地区城镇居民各类商品消费支出结构。利用支出弹性分析方法,分析和比较两地区城镇居民的消费结构差异。关键词 消费支出,Working2Leser模型,面板数据,非参数局部线性估计3中山大学岭南学院。通信作者及地址:周先波,中山大学岭南学院,
2、510275;电话:13672446896,(020)84110618;E2mail:zhouxb 。作者感谢匿名审稿人和姚洋对本文提出的修改意见,感谢第七届中国青年经济学者论坛(09/2007,浙江大学)区域经济单元有关学者对本文提出的评论及意见;同时,感谢国家自然科学基金项目(项目批准号70703037)的支持。本文疏漏之处均由作者负责。一、引 言关于居民消费结构,早在19世纪中叶,德国统计学家恩格尔在研究英、法、德和比利时等国家不同阶层的家庭调查资料时发现:随着家庭、居民可支配收入的不断增加,每个家庭用在食品方面支出的比率将会逐步下降;用在衣服方面的支出比率保持稳中有降;用在住房、汽车方
3、面的消费逐步上升;用在文化、教育、娱乐、旅游等方面的支出会快速增长。从而,人们用恩格尔曲线描述在价格固定情况下消费者对于某商品的消费支出随其总资源(如收入或消费总支出)变化的情况。在文献中,恩格尔曲线常被表示成商品的消费份额关于总消费支出对数的函数关系(见Gorman,1981;Lewbel,2006)。Working(1943)和Leser(1963)根据经验研究发现,线性的恩格尔曲线函数形式对许多经济和时间序列数据拟合得比较好。后期文献将这一形式称为Working2Leser模型。Deaton and Muellbauer(1980)在将价格因素引入模型创建几乎理想需求系统(AIDS)时说
4、明,Working2Leser的经验模型是AIDS在价格给定情形下的一个特例。Working2Leser模型中恩格尔曲线线性的设定以及微观基础中对变量系数1460经 济 学(季 刊)第7卷(参数)的约束条件限制了该模型的应用范围。人们不断寻求在新的微观基础下商品消费支出份额与总消费支出之间更为一般的关系模型,如Muellbauer(1976)的PIGLOG系统,Jorgenon,Lau and Stoker(1982)的Translog模型,Banks,Blundell and Lewbel(1997)的 二 次 几 乎 理 想 需 求 系 统(QUAIDS)等。这些模型本质上给出了对真正需求
5、消费模型的某种逼近,反映了商品消费支出份额与总消费支出之间存在着更为一般的非线性函数关系;不过,这些都是参数模型,其中参数要满足一定约束条件,如齐次性、对称性等。消费理论本身并没有确定支出份额与总消费支出之间存在着具有参数约束的函数关系,所以,线性或非线性参数模型的错误设定将会导致非一致的和无效的参数估计,由此所作的假设检验是欠可靠的。在较近期的非参数估计应用领域中,人们事先不设定商品消费支出份额与总消费支出之间这种线性或可线性化的非线性函数关系,而是在非常一般的条件下(如未知回归函数满足一定正则性条件),利用非参数估计方法得到这种未知关系的较为稳健的估计。例如,Bierens and Pot
6、t2Buter(1990)从等价规模(equivalencescale)角度、Lewbel(1991)从需求系统秩(rank)方面分别对这种函数关系进行传统的非参数核估计。上述模型大多是横截面或时间数据模型,难以容许模型中含有个体或时间的异质性。如果把可以允许个体或时间异质性的面板数据模型和具有灵活(flexible)函数形式的非参数模型结合起来,建立非参数面板数据模型及其非参数估计方法,并应用于恩格尔曲线模型的估计中,则是一个较好的想法。Ullah and Roy(1998)给出的面板数据模型非参数局部线性估计方法可有效解决这一问题。11Ullah and Roy(1998)应用面板数据模型
7、非参数局部线性估计方法,考察发展中国家营养与收入之间的非参数函数关系。本文设定面板数据Working2Leser模型的非参数形式,利用非参数局部线性估计方法,分别考察珠三角和长三角城镇居民近年来八大类商品(食品、衣着、家庭设备、医疗保健、交通通信、娱乐文化教育、居住以及其他)的消费支出份额与总消费支出之间的非参数函数关系,对两地区城镇居民消费行为作一分析和比较。我们希望,在没有任何关于参数的限制条件下,利用非参数方法,估计Working2Leser模型中的独立变量对依赖变量的影响,以其估算支出弹性,对居民消费进行弹性分析。国内学者在居民消费结构非传统估计(相对于参数方法)方面作了一些有价值的研
8、究。例如,黄四明和梁华(1994)认为影响消费结构的因素与消费结构的关系未必是线性的,从而使用半参数估计方法研究居民消费结构;张守一、葛新权和王斌(1997)较早地将非参数估计方法引入城镇居民消费第4期周先波、田凤平:消费的非参数估计方法1461结构的研究中,利用时间序列数据,应用传统的非参数核估计方法,估计居民消费与总收入的非参数函数关系。在非经典数据类型方面,国内学者使用面板数据模型也进行了一些研究。例如,赵卫亚(2003)利用各年按收入等级分组的抽样调查数据,建立变系数和变截距面板数据参数模型,估计我国不同收入层次城镇居民的边际消费倾向。本文所用的非参数模型及其估计方法与国内学者上述文献
9、所用的方法有一定区别。我们应用Ullah and Roy(1998)的非参数局部线性估计方法,将两地区非均匀面板数据固定效应和随机效应模型中的未知回归函数在固定点邻近进行一次逼近,估计回归函数的一阶导函数,得到独立变量对依赖变量影响的非参数估计。以此为基础,比较两地区居民消费的平均和逐点支出弹性。同时,我们还对参数估计和非参数估计进行适当比较,以强调非参数估计可以为我们带来更多的信息。22参数模型和非参数模型的优劣问题是一个争论的问题,超出了本文范围,有兴趣读者请见H?rdle(1990,p.5)对Fisher和Pearson对这两种方法看法的比较。文章其余内容安排如下:第二部分简述非均匀面板
10、数据Working2Leser参数模型,并用两三角洲地区面板数据对模型估计进行初步探讨;第三部分建立非均匀面板数据的非参数模型,给出Ullah2Roy非参数局部线性估计方法;第四部分估计面板数据参数模型和非参数模型,并进行比较和分析;第五部分是两地区各类商品消费模型非参数估计的支出弹性分析;最后是总结。二、居民消费支出份额的面板数据参数模型对商品消费支出和收入之间关系(或恩格尔曲线)的研究一直是应用微观经济学中福利分析的中心问题。为对消费行为进行全面描述,理论上,人们需要设定与效用最大化理论一致的恩格尔曲线(见Bankset al.,1997)。Working(1943)和Leser(1963
11、)的实证研究表明,消费支出份额关于总支出的线性参数恩格尔曲线模型(Working2Leser模型)wk=k+klogM(1)可以较好地拟合其实际样本数据,其中wk是商品类k的消费支出mk占总消费支出M的比例,k是与价格有关的常数,log指以e为底的对数(下同)。Muellbauer(1976)将Working2Leser恩格尔曲线的设定置于可积消费理论的框架下讨论。Deaton and Muellbauer(1980)的几乎理想需求系统(AlmostIdeal Demand System)理论可以用来导出Working2Leser模型的微观基础。在引言中已指出,和其他需求模型一样,Workin
12、g2Leser模型大多被用于横截面数据或时间序列数据中。为与非参数Working2Leser模型的估计进行比较,1462经 济 学(季 刊)第7卷本节设定这种线性参数形式。本文分别利用珠三角3地区9个城镇19932004年期间、长三角地区16个城镇19942004年期间城镇居民对八大类商品的消费支出数据和总消费支出数据分别建立两地区非均匀面板数据Working2Leser模型。数据来源于长江和珠江三角洲及港澳特别行政区统计年鉴以及广东省各城市相关年份的统计年鉴。因数据可得性的年份限制,我们收集的数据是非均匀面板数据。根据上述统计年鉴的划分,八大类商品是:食品、衣着、家庭设备用品及服务、医疗保健
13、、交通通信、娱乐文化教育用品、住房和其他。3依据 长江和珠江三角洲及港澳特别行政区统计年鉴 上对珠三角区域和长三角区域的划分,珠江三角洲经济区(简称珠三角)指广东省珠江流域的14个市、县、区组成的区域,包括广州、深圳、珠海、佛山、江门、东莞、中山等7市,以及惠州市区和惠阳、惠东、博罗三县,肇庆市区和高要、四会两市。受可得数据的限制,本篇文章中指的珠三角仅包括上述定义中的广州、深圳、佛山、江门、东莞、中山、惠州和肇庆市等9个市。长三角区域包括上海、南京、苏州、无锡、常州、镇江、南通、扬州、泰州、杭州、宁波、嘉兴、湖州、绍兴、舟山和台州等16个城市。两地区的城镇均用i来表示,对珠三角来说,i=1,
14、9,长三角的i=1,16。每个城镇数据的时间跨度用Ti表示。商品种类用k表示,k=1,8。珠三角地区面板数据Working2Leser模型的参数形式为wk,it=k,i+klogMit+k,it,(2)其中i=1,9;对每个i,t=1,2,Ti;k,i为商品类k关于城镇i的固定效应或随机效应。扰动项组内不相关而组间异方差,即满足条件Cov(k,it,k,it)=2i,Cov(k,it,k,js)=0(ij,ts)。由面板数据固定效应和随机效应模型的标准估计方法可以得到斜率系数k的估计k(k=1,8),见Hsiao(2003)。长三角地区的相应模型可类似给出。通过Working2Leser模型,
15、我们可以进行居民消费的支出弹性分析。由模型(1),对商品类k,有k=9wk9logM=9wk9MM=9(mk/M)9MM=9mk9M-mkM。两边同乘M/mk,整理可得商品类k的支出弹性为ek=1+k/wk.(3)在线性参数模型设定下,因k为常数,支出弹性ek是支出份额wk的双曲函数形式。城镇i居民对商品类k的逐点支出弹性(作为x函数)可估计为1+k/(k,i+kx),其中x=logM。如取(3)式中的wk为居民对商品类k的消费份额的样本均值,则居民对消费品k的平均支出弹性可表示为?ek=1+k/?wk.(4)如上所述,Working2Leser参数模型设定总消费支出的对数和各类商品消费份额之
16、间的关系是线性的。较强线性性的约束使其不一定能对数据有一个第4期周先波、田凤平:消费的非参数估计方法1463较好的描绘。数据散点图可以使我们对拟合情况有一个直观印象。图1给出珠三角和长三角部分商品的消费支出比例(或称份额)和总消费支出对数的关系图(将数据垒叠),其中直线图是上述Working2Leser模型所描述的关系,曲线图为由传统非参数核估计所作的图形(两者都没有考虑固定效应和随机效应),两者对数据的拟合都不错,但非参数估计方法拟合的图形比参数估计拟合的图形较好地反映了两变量(数据)之间的变化趋势及特征。图1 珠三角和长三角部分商品的消费支出比例和总消费支出的关系图除引言中我们已指出的模型
17、设定偏误外,参数估计值并不能反映不同总支出水平对支出份额的影响。而非参数模型除了对回归函数形式的设定限制很少、减小模型设定偏误的可能性外,还能给出自变量在不同水平上对依赖变量的边际影响的估计,可以让研究者了解这种影响随自变量变化的趋势。1464经 济 学(季 刊)第7卷所以,在进行参数估计的同时,讨论面板数据Working2Leser模型中变量间关系的非参数估计具有实际意义。三、消费支出份额面板数据模型的非参数估计方法如引言中指出,商品消费支出份额和收入(总支出)之间关系的设定形式对于微观经济分析极为重要,而且,越来越多的实证研究表明,对许多商品来说,Working2Leser线性参数模型的设
18、定已不能精确刻画消费者的消费行为。为下文实证估计之需,相应于Working2Leser模型中独立变量和依赖变量之间的关系,本节设定非参数面板数据模型形式,并给出其非参数局部线性估计。城镇i在时期t对各商品类k的消费份额与其消费总支出之间的关系设定为wit=i+m(xit)+it,(5)其中m()为未知的回归函数,xit=logMit(为方便起见,省略下标k,与前面参数模型部分比较,各变量在省略下标k时的意义是明确的);i为城镇固定效应或随机效应;it为随机扰动项,满足Eit|xit=0及E2it|xit=2,t=1,Ti;i=1,n。如果i为固定效应,则在模型(5)中,未知函数m(x)与固定效
19、应不可识别,所以,本文考虑m(x)的导数(x)及其平均导数=E(x)的估计,其中(x)是消费总支出的对数对消费份额的边际影响。我们将Ullah and Roy(1998)的非参数局部线性估计方法(Mundra(2004)给出这种非参数估计大样本性质的证明)推广到非均匀面板数据固定效应模型。将(5)中的回归函数在某固定点x邻近进行Taylor展开,得到wit=i+m(x)+(xit-x)(x)+uit,其中uit包括Taylor展开的余项和it。对每一个i,有?wi=i+m(x)+(?xi-x)(x)+?ui,其中?wi=1/Ti6Tit=1wit,?xi和?ui可同样定义。从而wit-?wi=
20、(xit-?xi)(x)+uit-?ui。由此,导数(x)的估计是使该方程的加权残差平方和6ni=16Tit=1(wit-?wi-(xit-?xi)(x)2Kxit-xh最小化的(x),其中K()是核函数,h是窗宽,即导数(x)的估计量是FE(x)=6ni=16Tit=1Kxit-xh(wit-?wi)(xit-?xi)6ni=16Tt=1Kxit-xh(xit-?xi)2.(6)第4期周先波、田凤平:消费的非参数估计方法1465根据Ullah and Roy(1998)最佳窗宽的选取,h6ni=1Ti-1/7。与参数估计不同的是,非参数估计FE(x)为自变量x的函数。FE(x)的方差估计类似
21、于Ullah and Roy(1998,p1589)。如果i为城镇随机效应,与固定效应情形一样,将m(xit)在点x处进行一阶Taylor展开,则模型(5)由以下模型来近似:wit=m(x)+(xit-x)(x)+i+uit=z(xit)(x)+i+uit,其中(x)=(m(x),(x),z(xit)=(1,xit-x),而(x)是m(x)的导数。以下我们将Ullah and Roy(1998)的方法(Herderson and Ullah(2005)给出其估计量大样本性质的证明)推广到非均匀随机效应模型中m(x)和(x)的估计。对wit和xit进行如下变换:w3it=wit-(1-1/2i)
22、?wi,z3it=zit-(1-1/2i)?zi,其中i=2u/(2u+Ti2),2u=6ni=16Tit=1(wit-?wi-(xit-?xi)FE(x)26ni=1Ti-n-1和2=1n6ni=1(?wi-?m(x)-(?xi-x)?(x)2-1n6ni=11Ti2u,这里?m(x)和?(x)是回归模型?wi=m(x)+(?xi-x)(x)+?ui中m(x)和(x)的OLS估计。则(x)的可行估计量为RE(x)=6ni=16Tit=1z3itw3itK(xit-x)/h)6ni=16Tit=1z3itz3itK(xit-x)/h).(7)从而,m(x)及其导数(x)的估计分别为 m(x)=
23、(1,0)(x)和RE(x)=(0,1)(x)。RE(x)的方差矩阵的估计可由Ullah and Roy(1998,p1592)的方法类似得到。上述估计是支出弹性非参数估计的基础。同上面参数估计中平均支出弹性(4)的计算,非参数情形下平均逐点支出弹性可计算为?ek(x)=1+k(x)/?wk,(8)其中k(x)是固定效应模型估计量k,FE(x)或随机效应模型估计量k,RE(x),下同。公式(8)给出各地区居民对商品类k消费的平均支出弹性随总支出变化的关系。我们还可以利用k(x)对各地区消费品类k的平均导数进行估计,有两种方法:一是计算k(x)在自变量的整体样本均值?x处的取值k(?x),其中?
24、x=6ni=16Tit=1xit6ni=1Ti,1466经 济 学(季 刊)第7卷二是计算k(x)在各xit处取值的整体均值6ni=16Tit=1(xit)6ni=1Ti。本文使用前一种方法给出平均导数的估计,进而计算居民对消费品k的平均支出弹性,即e(?x)=1+k(?x)/?wk。四、模型估计结果、实证分析和比较本节利用珠三角地区9个城镇19932004年期间、长三角地区16个城镇19942004年期间城镇居民对八大类商品人均消费支出数据和总消费支出数据(数据来源见第二部分),分别估计各地区总消费支出(的对数)对各类商品消费支出份额的边际影响。为比较起见,在进行非参数估计之前,列出参数估计
25、结果。另外,因为本文所选样本为珠三角和长三角地区的部分城镇,样本选择可能带有一定的随机性,所以,在非参数估计中,我们将比较地给出固定效应和随机效应非参数模型的估计结果。(一)参数估计表1 两地区各类消费品面板数据参数模型的估计和检验结果消费品珠三角地区长三角地区固定效应模型随机效应模型k?ekk?ekHausman统计量适用模型固定效应模型随机效应模型k?ekk?ekHausman统计量适用模型食品-0.182(-14.38)0.546-0.180(-15.35)0.5520.509随机-0.140(-13.05)0.658-0.150(-13.10)0.6336.267固定衣着-0.022(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数估计 方法 长江 珠江三角洲 地区 城镇居民 消费
限制150内