聚类分析报告(共7页).docx
《聚类分析报告(共7页).docx》由会员分享,可在线阅读,更多相关《聚类分析报告(共7页).docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上基于层次聚类分析的我国居民收入状况地区比较分析摘 要:在国家统计局关于居民收入的统计指标基础上,采用层次聚类分析对我国各地区居民收入的状况进行了比较分析,并得出各主要聚类群。在此基础上认为目前我国居民还是以工薪收入为主,各地区其他收入方面均有不同情况。关键词:层次聚类分析 居民收入 地区比较一、引言目前,深化收入分配制度改革,增加城乡居民收入是我国综合实力发展所要解决的一个非常重要的问题。党的十七大报告中明确指出:“逐步提高居民收入在国民收入分配中的比重,提高劳动报酬在初次分配中的比重。着力提高低收入者收入,逐步提高扶贫标准和最低工资标准,建立企业职工工资正常增长机制
2、和支付保障机制。创造条件让更多群众拥有财产性收入。保护合法收入,调节过高收入,取缔非法收入。扩大转移支付,强化税收调节,打破经营垄断,创造机会公平,整顿分配秩序,逐步扭转收入分配差距扩大趋势。”为此,我们非常有必要按照居民收入的不同种类将收入状况趋同的地区进行分类,以找到解决当前面临的增加居民收入的突破口。二、模型选择层次聚类分析是一种多元数理统计方法。它并没有事先设定样本分类的标准,而是通过对样本和变量数据的不同特征指标值进行差异程度计算,根据变量或样本间不同的差异程度大小重新结合分类,产生一个更有效的分类。其优点在于可以对分类变量进行聚类,提供的距离测量方法和结果表示方法也非常丰富。它的实
3、现过程如下:1.由于本文所选用数据存在极大的量纲,所以必须进行无量纲化处理。2.将各组数据作为独立的一类(设为n类),按照所定义的距离计算各数据点之间的距离,形成一个距离阵。3.将距离最近的两组数据并为一类,从而形成n-1个类别,计算新产生的类别与其他各个类别之间的距离或者相似度,形成新的距离阵。这种方法的思想来自于方差分析,使用该方法的目的是使得各个类别间的样本量尽可能接近。4.按照与第二步相同的原则,再将距离最接近的两个类别合并,一直重复该步骤直到所有数据被合并为一个类别为止。三、实证分析1.数据来源及说明。按照国家统计口径的划分,将居民收入划分为四类:工薪收入、经营性收入、财产性收入、转
4、移性收入。工资性收入指居民受雇于单位或个人,靠出卖劳动而获得的收入;经营收入指居民以家庭为生产经营单位进行生产筹划和管理而获得的收入;财产性收入指金融资产或有形非生产性资产的所有者向其他机构单位提供资金或将有形非生产性资产供其支配,作为回报而从中获得的收入;转移性收入指居民无须付出任何对应物而获得的货物、服务、资金或资产所有权等,不包括无偿提供的用于固定资本形成的资金。一般情况下,是指居民在二次分配中的所有收入。以上所有指标数据,均来自中国统计年鉴原始数据或换算得到。2.结果解释。根据模型实现过程,通过多次聚类可以得出谱系图(Dendrogram)。由于篇幅限制,在此就不再逐步进行了,只给出最
5、后结果。在谱系图中,聚类的全过程可以直观的表现出来,它把类间的最大距离算做相对距离为25,其余的距离均换算成与之相比的相对距离大小。3.结果的验证和进一步说明。以上是层次聚类分析产生的结果,但是我们发现通过上述分析还是很难确定如何将这31个省市分类。为了确定分类的个数,我们需要对聚类结果进行进一步分析。我们在确定分类过程中,总是希望能够进行“等分”,所以从表1中可以直观的看到,将31个省份分为四类相对合适,这个时候最大的类别和特点突出的类别都划分较为明确,适合进一步的分析。在确定各类别说之后,我们要进一步检验各个类别是否存在显著差异,以及各个类别具有怎么样的特征。表2中可以看出,各个类别之间在
6、各变量上都是有显著差异的,且这种差异具有统计意义。原始数据地区工薪收入经营性收入财产性收入转移性收入北京13666.34213.7190.445462.85天津8174.64665.53148.154574.99河北6346.53643.84117.462508.96山西7103.45350.96136.381947.77内蒙古6669.48857.63161.251876.78辽宁6103.41486.0365.63152.17吉林5905.86712.8680.72423.57黑龙江5478.03858.6872.972312.8上海14280.65798.07292.175232江苏83
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 聚类分析 报告
限制150内