2022年多元统计分析案例教学范文 .pdf
《2022年多元统计分析案例教学范文 .pdf》由会员分享,可在线阅读,更多相关《2022年多元统计分析案例教学范文 .pdf(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、正文名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 28 页 -浙江工商大学统计与数学学院本科毕业论文正文I-1 浙江省十一城市综合实力统计分析:基于2008 年经济数据摘要:本文根据中国城市经济发展研究中心提出的城市综合经济实力和区域的概念,并利用经济学原理以及2008 年各城市社会经济发展状况的截面数据,就浙江省 11 市的经济数据进行分析。首先建立了评价的指标体系,其次,分别采用加权平均法、主成分分析法、因子分析法和聚类分析法对浙江省根据行政区域划分的 11 个市的综合经济实力进行了全面的评价和比较,并在此基础上提出了促进浙江各市经济协调发展、共同进步的相关措施。关键词:城
2、市经济加权平均主成分分析因子分析聚类分析名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 28 页 -浙江工商大学统计与数学学院本科毕业论文正文I-2 Analysis of Comprehensive Economic Strength of Eleven Cities of Zhejiang Province:Based on Economic Data in 2008Abstract:This paper focuses on the economic data analysis of 11 cities of Zhejiang Province based on the c
3、oncept of comprehensive economic strength,urban areas economic by City Economic Development Center in China,principles of economics and the economic development sectional data of various cities in 2008.An index system of the evaluation is established at first;then using the methods of Weighted avera
4、ge,Principal Component Analysis,Factor Analysis and Cluster Analysis,the comprehensive economic strength of the 11 cities divided by the regional administration in Zhejiang Province are evaluated and compared.And finally,some measure,which may potentially promote coordinated economic development and
5、 common progress are proposed.Keywords:Urban economy;Weighted average;Principal Component Analysis;Factor Analysis;Cluster Analysis 名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 28 页 -浙江工商大学统计与数学学院本科毕业论文正文I-3 正文目录一 引言.I-4 二 经济实力分析评价方法.I-5(一)多元统计分析的涵义.I-5(二)主成分分析法.I-6 1 主成分分析法的原理及优点.I-6 2 主成分分析法的算法步骤.I-7(1)原始数据的标准化
6、.I-7(2)求指标数据的相关矩阵.I-8(3)求相关矩阵R的特征根向量,确定主成分.I-8(4)求方差贡献率,确定主成分个数.I-8(5)对k个主成分进行综合评价.I-8 3 因子分析模型的建立及分析.I-9 4 聚类分析.I-10(1)聚类分析的概念.I-10(2)聚类分析的相关理论.I-10(3)聚类分析的主要步骤.I-11(4)数据的标准化.I-11(5)相似性测度.I-11 三 浙江省各地区的经济实力分析.I-12(一)加权算术平均法.I-13(二)主成分分析法.I-14(三)因子分析法.I-16(四)聚类分析.I-18 四 模型分析和结果讨论.I-22 五 结束语.I-24 六 致
7、谢.I-25 七 参考文献.I-26 名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 28 页 -浙江工商大学统计与数学学院本科毕业论文正文I-4 一、引言以区域的概念来讨论经济发展是一种很有效的方法。区域是指根据一定的目的和原则而划定的地球表面的一定空间范围,是自然、经济和社会等方面的内聚力而历史奠定,并具有相对完整的结构,能够独立发挥功能的有机整体。而区域经济就是一种综合性的经济发展的地理概念。我国区域经济学发展在过去的三十年间,经历了起步、发展和壮大三个阶段;在区域发展、区际关系、区域政策方面做了大量的研究工作。从区域划分来分析经济情况,已经取得很显著的成果。以对浙江省的研
8、究为例,葛莹、姚士谋、冯学智、蒲英霞、卓勇良在浙江省区域块状经济和城市化的关系(2007)中,针对浙江省城市化进程是否与高速发展的区域块状经济适应的问题,用空间自相关的方法,从区域块状经济类型(城市化和本地化集聚经济)着手进行解答。结果表明,浙江省1998 年和 2001 年批发零售贸易和餐饮业拥有城市化和本地化集聚经济,且后者比前者的程度更高。随着时间的推移,两者都有不同程度的减弱。其次,同期制造业仅有本地化集聚经济,且水平随时间而增加。王发明在浙江省区域经济集聚与生态环境协调发展的对策研究(2008)一文里,试图从资源短缺、环境污染等这种令人担忧的生态环境中探求区域经济发展对生态环境的影响
9、,针对浙江区域经济可持续发展中存在的主要问题进行原因剖析,提出了相应的治理对策及措施,以达到环境、经济与社会三者协调发展的目的 7。叶华、陈修颖在近 16 年来浙江省区域经济发展差异分析(2008)中,以浙江省 11个地级市为基本单元,根据 1993年浙江省计经委国土办课题组的研究报告,将全省分为浙东北、温台和金衢丽三大区域,并且从GDP、人均 GDP、产业结构、就业结构、人民生活水平、城市化水平和对外贸易等方面入手,分析了近 16 年来浙江省区域经济差异的演变特征和成因,并提出相应的对策建议。类似的从区域方面研究经济、浙江省经济的文献还很多。改革开放以来,浙江在发展社会主义市场经济的过程中走
10、出了一条具有浙江特色、符合浙江实际的发展路子。全省经济发展迅速,主要经济指标在全国保持领先地位,并成为全国经济增长速度最快和最具活力的省份之一。20 世纪 90年代以来,浙江的经济得到了突飞猛进的发展。2003 年,当时全国人均 GDP 为 9057 元,浙江省的人均GDP 是 20147元,是全国水平的2.24 倍;2003年全国城市化水平是40.5%,浙江省为 53%;2005 年,浙江省以占全国 1.06%名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 28 页 -浙江工商大学统计与数学学院本科毕业论文正文I-5 的国土面积,创造了占全国 7.13%的地区生产总值和7.16
11、%的外贸进出口总额。这些指标说明,浙江省在总体经济水平上要超过全国水平10 年以上。截止到 04年的数据显示,从人均GDP、城市化水平等指标可以看出浙江的发展水平大约比全国超前 10 年。同时浙江的发展势头仍然强劲,从多方面因素判断,今后十到二十年其经济增长率仍将高于全国平均水平。在区域经济发展中,城市处于核心和龙头的地位,提高城镇化水平、加快城市化进程是解决当前和未来一系列问题的关键。浙江经济发展显示出不平衡的态势,浙西南的 GDP 几乎只有浙东北的一半。很显然,浙江省各市的城市化水平也存在显著差异,杭州、宁波、温州等的城市化水平始终走在全省的前列,丽水和衢州则相对落后。随着长江三角洲经济一
12、体化进程的加快以及WTO 过渡期结束后,浙江作为沿海省份需要进一步融入国际经济面临的机遇与挑战,清楚的看到发展差异并找出差异形成的原因,通过核心城市的优先发展带动区域经济和社会的快速发展,是现实提出的急需解决的问题。为此,本文在参阅相关文献的基础上,根据中国城市经济发展研究中心提出的城市综合经济实力以及区域的概念,根据区域的行政划分,从浙江省11 个市出发,利用经济学原理以及2008 年各城市社会经济发展状况的截面数据,首先建立了评价的指标体系,其次,分别采用加权平均法、主成分分析法、因子分析法和聚类分析法对浙江省11 个市的综合经济实力进行了综合的评价和排位,并在此基础上提出了促进浙江各市经
13、济协调发展、共同进步的相关措施。面对区域差距带来的影响,浙江省应该继续加大固定资产投资的力度,在制定区域发展策略时应该加强区域间的交流和合作,促进各地区优势互补,共同发展。同时,也要积极鼓励引进外资和开拓国际市场,加快与国际经济的接轨和融合。另外,还要继续扩大中心城市的规模,在积极建设环杭州湾产业带的同时,不断加强温台和金衢丽产业带的建设,提高中心城市的综合竞争力,扩大其对周围地区的辐射和带动作用,最终逐步缩小区域差距,促进各地区和谐发展、共同繁荣。二、经济实力分析评价方法(一)多元统计分析的涵义多元统计分析是运用数理统计的方法来研究多变量问题的理论和方法,它是一元统计学的推广。在实际问题中很
14、多随机现象涉及到的变量不是一个,而经常是多个变量,并且这些变量间又存在一定的联系。要有效地提取信息和用数据科学地进行推断,就会用到多元统计理论。名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 28 页 -浙江工商大学统计与数学学院本科毕业论文正文I-6 多元统计分析的一个主要研究内容就是简化数据结构(降维问题),简化数据结构即是将某些较复杂的数据结构通过变量变换等方法使相互依赖的变量变成互不相关的,或把高维空间的数据投影到低维空问,使问题得到简化而损失的信息又不太多。主成分分析及因子分析就是这样一种方法。(二)主成分分析法近年来,随着多元统计分析方法的普及与应用,主成分分析法成为
15、构造综合评价指数的常用方法之一。因此,它在综合评价领域得到了广泛的应用。目前看来,综合评价方法的研究焦点,仍然是如何科学、客观地将一个多目标问题综合成一个单一指数的形式,即进行降维处理。目前己产生了许多这样的降维方法,比如层次分析法,模糊综合评价法等。但这些方法的一个共同点是都需要专家评价或评分,所不同的只是组织调查的内容和过程的难易和繁简不一,以及对专家评估信息处理的技巧各异。这就不可避免地带有人为主观性,而主成分分析法则采用了一种完全不同的思路,避免了主观评分。在社会和经济领域中,常常碰到多指标的统计分析,比如学生成绩的评价、企业经济效益的分析、服装定型等等。指标个数较多,各指标之问往往又
16、相互影响、相互牵连,关系相当复杂,给统计分析工作带来很大困难。因此,希望能用较少的几个新的综合指标,来代替原有的较多的指标,使问题简化。主成分分析法是将多个指标化为少数综合性指标的一种多元统计分析方法。这些综合指标是原始指标的线性组合,且彼此之间互不相关,它可以在力保原始数据信息损失最小的情况下,对高维变量空间进行降维处理,是一种最新的综合评价方法。主成分分析是由英国生物统计学家Kart Pearson 于1901年首次对非随机变量引入的,尔后,又由 Hotelling将其推广至随机变量。这一方法在处理解决多指标的统计分析中得到广泛应用,是一种很常用的、行之有效的多元统计方法。1 主成分分析法
17、的原理及优点主成分分析法是通过恰当的数学变换,使新变量主成分成为原变量的线性组合,并选取少数几个在变差总信息量中比例较大的主成分来分析事物的一种方法。主成分在变差信息量中的比例越大,它在综合评价中的作用就越大。以两个指标来衡量n个样本的简单情况为例。n个样本之间的变量信息用离差平方和表示,则综合评价时的总变差为:22112211()()(1)nniiiixxxx名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 28 页 -浙江工商大学统计与数学学院本科毕业论文正文I-7 如果2111()niixx与2221()niixx两个数值差不多,说明两个指标在变量总信息量重比重相当,综合评价
18、时两个指标都要保留,如果二者比例为4:1的关系则说明第 1 个指标反映的信息量很大,占到 80%,综合评价时仅用第1 个就可以了,第 2 个可以舍弃。数学上已证明,实施变换前后的总方差(与离差平方和一样说明变差信息量)是相等的,这说明原指标代表的变差信息已由主成分来表示。数学上还证明,相关矩阵R的特征根g即是主成分分析中第g个主成分的方差,g对应的特征向量gL即是第g个主成分gF中各指标变量的系数。在主成分分析中各主成分是按方差大小依次排列的,这说明第一主成分代表的变差信息量最多,其余依次次之。由此在分析实际问题时,可只取前k个主成分来代表原变量的变差信息,以减少工作量。用主成分分析法确定权数
19、有以下优点3:A、可消除评价指标之间的相关影响。因为主成分分析在对原指标变量进行变换后形成了彼此相互独立的主成分,而且实践证明指标间相关程度越低,主成分分析效果越好。B、可减少指标选择的工作量,对于其它评价方法,由于难以消除评价指标间的相关影响,所以选择指标时要花费不少精力,而主成分分析由于可以消除这种相关影响,所以在指标选择上相对容易些。C、主成分分析中各主成分是按方差大小依次排列顺序的,在分析问题时,可以舍弃一部分主成分,只取前后方差较大的几个主成分来代表原变量,从而减少了计算工作量。2 主成分分析法的算法步骤(1)原始数据的标准化设有n个样本,p项指标,可得数据矩阵niXXpnij,2,
20、1,)(表示n个样本,pj,2,1表示p个指标,ijx表示第i个样本的第j项指标值。用Zscore法对数据进行标准化变换23:()(2)ijjijjxxZS式中pjninxxSnxxnijijjniijj,2,1,2,1)1()()(1221名师资料总结-精品资料欢迎下载-名师精心整理-第 8 页,共 28 页 -浙江工商大学统计与数学学院本科毕业论文正文I-8(2)求指标数据的相关矩阵)3(,2,1,2,1)(pkpjrRppjk其中:jkr为指标j与指标k的相关系数221()1()1nijjikkjkjkixxxxrSsn即111njkijjkirZ Zn有1,iijkkjrrr,1,2,
21、1,2,1,2,injpkp(3)求相关矩阵R的特征根特征向量,确定主成分由特征方程式0RIp,可求得p个特征根),2,1(pgg,将其按大小顺序排列为021p,它是主成分的方差,它的大小描述了各个主成分在描述被评价对象上所起作用的大小。由特征方程式,每一个特征根对应一个特征向量12(,)1,2,gggggpLLlllgp将标准化后的指标变量转换为主成分:1122(1,2,)(4)ggggppylZlZlZgp1y称为第一主成分,2y称为第二主成分,py称为第p主成分。(4)求方差贡献率,确定主成分个数一般主成分个数等于原始指标个数,如果原始指标个数比较多,进行综合评价时就比较麻烦。主成分分析
22、法就是选取尽量少的k个主成分()kp来进行综合 评 价,同 时 还 要 使 损 失 的 信 息 量 尽 可 能 少。k值 由 方 差 贡 献 率1kgg1(8 5%)kgg决定。3 因子分析模型的建立及分析将原始数据进行标准化处理,即将统一变量减去其均值再除以标准差,以消除量纲的影响20,记为pnijXX)(;(1)计算相关系数据矩阵XXnR11;名师资料总结-精品资料欢迎下载-名师精心整理-第 9 页,共 28 页 -浙江工商大学统计与数学学院本科毕业论文正文I-9(2)求相关系数矩阵R的特征向量ppijuU)(和特征值021p;(3)确定公共因子的个数,设为k个,按累计贡献率%8511ki
23、ip来确定;(4)求解初始因子载荷矩阵kpijkpijuaA)()(或pmppmmaaaaaaaaaA212222111211(5)建立因子模型piFaXkiiiiji,2,11或者用下式表达:1111122112211222221122mmmmPppPMmpXaFa FaFXaFaFaFXaFaFaF(6)对初始因子载荷矩阵进行正交旋转变换,得到比较理想的新的因子载荷矩阵kpijaA)(1;(7)将因子变为变量的线性组合kiXbFpjijiji,2,11,其中回归系数b可通过最小二乘解得到,进而得到因子得分XRAF1。(8)对各因子得分以其因子信息贡献率作为加重权数,计算各样本的综合得分。根
24、据综合得分的高低,可以对样本进行综合评定。因子分析具有系统的综合评定的特点,把它用于城市经济数据的分析,就能较好地反映出城市的总体经济状况,使各城市的综合经济实力具有定量的可比性。4、聚类分析(1)聚类分析的概念聚类分析(Cluster Analysis)是根据研究对象的特征对其进行分类的多元分析技术的总称。分类问题是各个学科领域都普遍存在的问题,如人口学中研究人口生育分类模式、人口死亡分类模式;医学中对各种精神病特征的分析;市场营销学中进行市场分层、确定市场目标等等,这些都需要对研究对象进行分类。聚类分析是应用最广泛的技术,它把性质相近的个体归为一类,使得同一类中的个体具有高度的同质性,不同
25、类之间的个体具有高度的异质性。名师资料总结-精品资料欢迎下载-名师精心整理-第 10 页,共 28 页 -浙江工商大学统计与数学学院本科毕业论文正文I-10 聚类分析的大部分应用都属于探测性研究,最终结果是产生研究对象的分类,通过对数据的分类研究还能产生假设。聚类分析也能用于证实性目的,对于通过其他方法确定的数据分类,可以应用聚类分析进行检验。(2)聚类分析的相关理论聚类分析可以用来对案例进行分类(Q型聚类),也可以用来对变量进行分类(R型聚类),Q 型聚类应用较多。聚类分析的过程 28 是:首先对要进行聚类的个体定义一种能反映各个体之间亲疏程度的量,即对样本之间可以定义各种距离,对变量之间可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年多元统计分析案例教学范文 2022 多元 统计分析 案例 教学 范文
限制150内