欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    数据分析课程设计策画.docx

    • 资源ID:26646145       资源大小:15KB        全文页数:10页
    • 资源格式: DOCX        下载积分:30金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要30金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据分析课程设计策画.docx

    数据分析课程设计策画 全国区域经济发展水平的聚类分析 摘要 继20世纪80年代沿海发展战略、90年代末西部大开发战略之后,目前新的区域发展格局正成形成,即实施西部大开发,振兴东北地区等老工业基地,鼓励东部地区加快发展,实行东西互动,带动中部,促进区域经济协调发展。 设计区域经济发展的指标体系,包括人均GDP、人均第一产值、人均第二产值、人均第三产值、居民消费水平、人均财政收入、人均邮电总量、人均进出口总额。本文用系统聚类分析方法将全国31个省市(区域)的经济发展状况进行归类分析,得出全国区域经济发展水平的分类情况。 关键词:区域经济发展水平聚类分析 目录 一、背景介绍-3 二、指标体系的设计-3 (一)指标体系的整体性-3 (二)指标的可比性-4 (三)指标的代表性-4 (四)指标的可得性-4 三、聚类分析-5 (一)样本间的相似度测量标准-6 (二)聚类方法-7 四、聚类结果-8 五、聚类结果与区域经济发展差异评价-12 参考文献-14 附录-15 一、背景介绍 1978年改革开放以来,中国经济保持着持续的快速增长, 19781998年GDP的年均增长率高达9. 7% , 19992022年GDP增长率均高于% ,国民经济总体保持了良好的发展态势。2022 年GDP 高达103553. 6 亿元, 人均GDP则到达8184元。但我们还应看到,区域发展差距进一步拉大,根据调查数据得到表1。 缩小各区域经济发展差距,实现区域间的协调发展,不仅具有重要的政治、经济、社会意义,而且也是我国整体经济步入新的台阶的客观需要。本文试图运用多元统计分析方法中的聚类分析方法,分析我国31个区域的经济发展状况和差异类别,从中找出一些有用的信息,为我国经济如何协调快速发展提供有益的启示。 二、指标体系的设计 (一)指标体系的整体性 指标体系的设计既要反映出各地区经济发展水平,又要能反映地 区发展的潜力,也即是地区的可持续发展水平。 (二)指标的可比性 由于地域间存在空间大小、人口多少差别,在研究地区发展水平时,总量指标存在不可比性,故所采用指标应为具有可比性的平均指标。(三)指标的代表性 由于反映一个地区的经济发展状况的指标很多,而分析时只能考 虑有限个指标对经济发展的影响情况,因此所选的指标不仅要有明确的社会和经济意义,而且能比较显著地反映地区经济发展水平。 (四)指标的可得性 有些指标虽然在评价地区经济发展水平时具有重要作用,但是由 于一些原因使得指标数值不可得,因此,我们在指标选择时要么放弃, 要么用近似的指标进行代替。基于上面4个方面考虑,根据中国统计年鉴的统计数据,选用中国统计年鉴中较能反映一个区域经济发展总体水平的综合部分,财政、金融和保险部分,人民生活部分,运输、邮电部分,对外经济与旅游等5 部分中的人均GDP、人均第一产值、人均第二产值、人均第三产值、居民消费水平、人均财政收入、人均邮电业务总量、人均进出口总额等8项指标构建为本文分析区域经济发展水平的指标体系。 X1 :人均GDP,用其反映区域经济发展的一般水平。 X2 :人均第一产业产值,用其反映区域农业发展水平。 X3 :人均第二产业产值,用其反映区域工业化水平。 X4 :人均第三产业产值,用其反映区域服务业和城镇 化水平。 X5 :居民消费水平,用其反映区域内居民的生活水平 和购买能力。 X6 :人均财政收入,用其反映区域经济实力与公益设 施建设能力。 X7 :人均邮电业务总量,用其反映区域内信息产业和 高新产业发展水平。 X8 :人均进出口总额,用其反映区域对外贸易的发展 水平与商业竞争能力。 本文认为以上8个经济指标基本能反映区域经济发展状况,由中国统计年鉴(2022) 可得到2022年全国31个省市以上8个指标数值,见附录。 三、聚类分析 聚类分析方法的思想是在不知研究的一批样本应该分为几类,也不知每个样本究竟取自哪一类的情况下,依据各样本自身的特点,通过定量测算各样本之间的相似程度和亲疏关系,将性质比较相似、综合差异比较小的样本分别聚合成类,而将性质相似性比较小、综合差异比较大的样本区分为不同的类,从而将整个研究对象聚合成若干类。聚类分析的优点在于它确定的类别是基于对样本的观察指标的分析, 分类的结果能客观地显示样本间的本质判别与联系,尤其是内在结构关系,而且分类结果直观。 聚类谱系图可以很清楚地表示根据数值分类的结果,对客观分析和合理评价区域间经济发展水平的差异是有利的。 以下应用SPSS统计软件对表1中31个样本的8个观察指标进行系统聚类分析。 (一)样本间的相似度测量标准 聚类分析测度个体之间的相似性的方法主要有相关测度、距离测度和关联测度。其中,关联测度适用于类测度等级的数据,相关测度利用相关系数的大小来判断两个样本之间的相似性,距离测度是利用两个样本之间的距离大小来判断其相似性。本文采用距离测度来衡量全国区域经济发展水平的相似性。常见的距离测度有平方欧氏距离、欧氏距离、绝对值距离、明科夫斯基距离等。本文采用平方欧氏距离测度全国区域经济发展水平的相似度。 平方欧氏距离的定义为: Dij = 81(Xik - Xjk ) 2 ( i, j = 1, 2, 3, ?31; k = 1, 2, 3?8) 其中Dij表示样本i与样本j之间的距离, Xik表示第i个样本在第k个指标上的值, Xjk表示第j个样本在第k个 指标上的值。 (二)聚类方法 聚类的方法有很多种,其中系统聚类法和迭代聚类法应用比较广泛,本文采用系统聚类法对全国区域经济发展水平进行分析。系统聚类法中计算类与类之间距离的方法有多种,主要有最短距离法、最长距离法、中间距离法、类间平均法、重心法、离差平方和法六种方法。为了确保分类结果的准确性,本文用两种聚类方法。 1. 类平均法:合并两类的结果使所有的两两类别之间的平均距离最小。 D2 (p, q) = iGp iGq d2ij /np nq 其中,D (p, q)表示类Gp 与类Gq 的距离, np、nq 表示Gp、Gq 两类 的样本数。 2. 离差平方和法:同一类样本的离差平方和应该最小,不同类之间样本的离差平方和应该较大。 D2kr = ( nk + np ) / ( nr + nk ) D2kp + ( nk + nq ) / ( nr +nk ) D2kq- nk / ( nr + nk ) D2pq 其中,Dkr表示类Gk 与类Gr 的距离, nk、np、nr、nk 表示Gk、Gp、Gr、Gk 类的样本数, Dkp、Dkq、Dpq分别表示类Gk 与类Gp 的距离、类Gk 与类Gq 的距离、类Gp 与类Gq 的距离。 四、聚类结果 系统聚类的结果 Case Processing Summary(a) (数据信息汇总表) 该表说明了此次数据选取较为成功,数据有效率为100%,并且没有缺失值的存在。 Agglomeration Schedule(聚类的凝聚过程表) 在此表中,显示的是聚类共进行了30步,分布进行类间合并,最终合成一类,则过程结束。 Cluster Membership(聚类解表) 表中显示的是将样品分为四类和五类是的聚类结果。其聚类结果的树状图示为; * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 江西14 四川23 安徽12 陕西27 宁夏30 广西20 云南25 湖南18 重庆22 青海29 山西 4 河南16 西藏26 贵州24 甘肃28 吉林7 湖北17 新疆31 河北 3 内蒙古 5 海南21 浙江11 广东19 黑龙江8 山东15 辽宁 6 福建13 江苏10 北京 1 天津 2 上海9 按类平均法分成四类:上海,天津、北京,浙江、广东、黑龙江、山东、辽宁、福建、江苏,其余21个省市。

    注意事项

    本文(数据分析课程设计策画.docx)为本站会员(h****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开