近年居民消费结构统计分析的研究综述_关于因子分析和聚.pdf
《近年居民消费结构统计分析的研究综述_关于因子分析和聚.pdf》由会员分享,可在线阅读,更多相关《近年居民消费结构统计分析的研究综述_关于因子分析和聚.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、收稿日期:2006年03月24日 文章编号:1002-1566(2007)05-0776-06近年居民消费结构统计分析的研究综述 关于因子分析和聚类分析的应用吴 栋 李乐夫 李阳子(清华大学经济与管理学院,北京,100084)摘要:本文对近年有关居民消费结构的实证分析进行研究,简述了数据选取、实证方法的变革与演进;回顾了模型分析的过程与结论;并且进行了相应的评述、提出了建议,以期为今后统计实证手段的应用及后续研究提供相应参考。关键词:消费结构;因子分析;聚类分析中图分类号:O212,F126.1文献标识码:AThe Review of Empirical Studies on Consumpt
2、ion StructureWU Dong,L ILe2fu,L I Yang2zi(School of Economics&Management,Tsinghua University,Beijing,100084)Abstract:This article examines the empirical studieson consumption structure published in recent years,reviews themethods used in data collection,the transition of empiricalmethods,and the pro
3、cesses and conclusions of the modelanalysis.The author also provides some comments and suggestions which can be taken as references for the futurestudy on applying empiricalmethods.Key words:Consumption Structure;FactorAnalysis;ClusterAnalysis近年来随着我国经济的快速平稳发展,消费需求不足日益突出,对于消费问题的关注成为转型期经济研究的重点之一。消费总量和
4、消费结构是研究消费问题的两个基础,而对于消费结构的研究难度更大,因为其变量较多、机理复杂、数据量很大,所以各种较新的数理实证方法在此领域中应用逐渐受到广大学者的重视。近年来运用因子分析、聚类分析等实证手段研究消费结构的方法在学术界日渐得到广泛应用,有必要梳理分析的过程、回顾其分析结果,以期为今后统计实证手段的应用提出一定的建议。1 数据选取和实证方法综述在近年来对于农村居民消费结构的研究中,实证分析手段日趋多样化。传统的实证分析一般停留在简单地对各类指标进行年均增减等比对分析,从而发现问题或佐证观点。但是随着统计方法日趋完善,各类年鉴中统计指标逐渐细化,且有充足统计数据的时间段逐渐延长,对于同
5、一指标的描述也从原来的单变量变为了多维变量,数据量大大增加,而刻画描述的细化程度也越来越有利于我们对实际情况进行分析。可以说,单从各类数据角度出发,对类似于农民消费结构这样的重大经济问题,我们已经有了摆脱简单实证分析的数据基础。从数据选取来看,针对农村居民的消费结构问题在中国统计年鉴 中,其指标体系共有2007年 9月第26卷 第5期 数理统计与管理Application of Statistics andManagementSep1,2007Vol126No15九项,在“各地区农村居民家庭平均每人生活消费现金支出”(或者“消费总支出”表中)将消费细分为“总量”与“食品”、“衣着”、“家庭设备
6、及服务”、“医疗保健”、“交通和通讯”、“文教娱乐用品及服务”、“其他商品及服务”等八项指标。而消费结构的实证分析主要以这些数据为准,多数研究者都是采取了某一年份31个省、市、自治区(以下简称省份)的截面数据,也有个别学者以9年时间序列为准,不用分区数据,仅用全国的总合分析八项指标的在9年间的变动情况。从方法上看,针对31个省份,八项指标在9年来所形成的大量数据,无论是仅做消费的单独实证分析,还是要进一步回归分析,讨论消费与收入、GDP等指标的关系,都离不开因子分析和聚类分析的方法。这两种分析方法都可以把多维变量根据数据自身的变动规律,通过矩阵运算等方式有效地降维和归类。在已有的文献中不难发现
7、因子分析比聚类分析的应用更为广泛,可以在论文中单独使用,也常常配合别的统计方法,其中主成分析方法最为常见。学者们对因子分析过程的描述较之聚类方法也更为详细。大概包括以下几个过程:首先确定该数据是否适合进行因子分析。因子分析的前提是该数据具有多维性和强相关关系,针对此点一般软件中都会有专门的统计量加以刻画,学者们经常应用的是“取样适当性数”即“K MO”(Kaiser-Meyer-Olkin)检验,而现有文献中更为普遍的方法直接列出相关系数阵或协方差阵,通过粗略观测其数值大小来分析该数据是否适合进行因子分析。第二,从相关系数矩阵中捉取特征向量,通过转轴方式确定各个变量在各个因子中的方差贡献率,以
8、确定因子数目和归为同一因子的变量。一般学者均采取“最大变异数法”(VER I MAX,或称为“方差最大旋转方法”)进行转轴。多数学者在此步骤会比较详细,表述清晰向量模型,以及各个因子提取后的方差累计贡献率,同时对于各个因子含义进行简要分析。第三,给各个地区在不同因子上打分,然后进行排序以及相关解释或者后续分析。多数学者不会列出因子与原始数据关系的模型,而孙艳玲此步骤前以综合模型的方式列出各因子前的系数,直观反映了其贡献率的权重。在后续分析中,可以是单独因子的排名讨论,也可以利用因子得分再进行聚类或者画图分析。具体见后文。聚类分析在消费结构研究中很少单独出现,一般都是配合因子分析出现的,在聚类方
9、法上的说明均比较简略,所采用的具体方法也较为统一,一般都采用欧氏距离平方的距离测试,选择最小方差聚类方法进行分析,聚类的对象可以为八项消费,也可以为31个省份,具体将在下文分章列出。一般31个省份的聚类结果由于比较复杂,在文章中经常省略,仅保留聚类过程说明结果。在软件方面,研究者使用SPSS软件的居多,尤其对于需要输出聚类图谱的文章基本上都是应用SPSS,其在作图和输出方面比较易于操作。也有部分学者使用SAS数据分析系统,二者在普通分析上差别不大。2 模型结论综述综合近年来的论文,可以发现因子分析和聚类分析的同时使用是近年来对于消费结构分析的发展趋势,本文选取的几篇论文基本上都采用了两种实证方
10、法,或者在这两种方法的数据基础上再进行回归分析,具有一定的代表性。具体而言,可以先聚类,利用聚类的结果来分区域进行因子分析,最后对比不同地区在八项消费上所体现的特点,进而分析得出结论。柯健2利用2002年的城镇居民消费数据,对于消费和地区互相做了聚类。其先用31个777吴栋,李乐夫等:近年居民消费结构统计分析的研究综述省份作为八项消费的属性,对于消费结构进行聚类,又将图标进行转置,即把八项消费作为31个省份的属性,对31个省份再进行聚类,将其分为四个层次。具体结果见后表。应该说,我国幅员辽阔,地区间的自然禀赋、文化基础迥异,这样的分析思路虽然在理论上符合实事求是、具体问题具体分析的要求,但在研
11、究农村消费结构上的应用较少。极少有学者把农村分消费进行分区域比对,而在研究城市消费结构时则较多使用,具体原因是农村地区的消费结构差异没有在城市间体现得显著。殷玲3分别就发达地区城市和农村的消费结构和不发达地区城市和农村的消费结构分别做了因子分析,并且进行了对比,应该指出其划分发达与不发达的标准并非是先聚类的结果,而是根据GDP进行排名。因子结果是城市的发达与不发达在消费结构上体现明显,发达城市的医疗与教育在因子一中,而不发达地区的食品、交通和其他商品消费在第一因子中,两地区毫不重合,明显可以看出其生活质量的差别,而发达地区的农村和不发达农村在消费结构上的差异很小,仅是交通消费在发达地区属于因子
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 近年 居民消费 结构 统计分析 研究 综述 关于 因子分析
限制150内