欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    03第三篇 多元统计分析作业题.doc

    • 资源ID:79327294       资源大小:254KB        全文页数:6页
    • 资源格式: DOC        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    03第三篇 多元统计分析作业题.doc

    研究生地理数学方法 第三篇 多元统计分析第三篇 多元统计分析作业题1 证明题1)已知,这里用到关系。以二变量为例证明: 。式中X为标准化原始变量矩阵,A为载荷矩阵,Z为非标准化主成分得分,Z*为标准化的因子得分,E为单位化特征向量构成的矩阵即正交矩阵,为特征根的平方根的倒数构成的对角阵,为特征根构成的对角阵,对于二变量有, .2)对于二变量因子模型,我们有.试以x1为例证明,这里。2 计算题1)现有一组古生物腕足动物贝壳标本的两个变量:长度x1和宽度x2。所测数据如下(表2.1)。要求: 利用Excel对数据进行主成分分析。 借助SPSS对该数据进行主成分分析,并计算结果与Excel的计算结果进行对比,理解各个表格所给参数的含义。 用本例数据验证证明题的推导结果。表2.1 古生物腕足动物贝壳标本数据样品编号长度x1宽度x2样品编号长度x1宽度x2132141210241015121136516136468171314561018131567219131777132014788921151399522171310982317171191424181912107252020131112数据来源:张超,杨秉庚计量地理学基础2)借助SPSS对我国1995年社会经济发展的8项指标进行主成分分析,可以给出标准化主成分得分。数据见下表(表2.2)。要求开展如下工作。: 利用算术平均值和样本方差对原始数据标准化。 借助SPSS求出全部8个主成分的标准化得分。 将因子得分之间两两进行一元线性回归,至少给出6个回归结果,并对其中一个进行解释(回归结果主要包括模型、测定系数或相关系数)。 将标准化原始变量与因子得分之间进行一元线性回归,至少给出6个回归结果,并解释其中一个相关系数和回归系数。 分别以标准化的GDP、居民消费水平等8个变量为因变量(y),以8个主成分为自变量(用得分表征),进行多元线性回归,将回归结果表示成主成分模型(8个),然后将回归系数列成表格,并解释其数学含义。如果以8个标准化的原始变量为自变量,以某个因子为因变量,多元回归结果又说明什么? 计算相关矩阵的对应的特征向量矩阵,并给出其逆矩阵(Excel求逆矩阵的命令是minverse)。 将SPSS给出的相关系数矩阵的8个特征根连乘,公式记为,然后将相关系数矩阵R拷贝到Excel,利用Excel计算R的行列式det(R),比较det(I)与det(R)的数值关系,并解释其数学含义(附:Excel连乘的命令为product,求矩阵行列式的命令为mdeterm)。 将标准化主成分得分与因子载荷矩阵相乘,指出其结果的数学意义。 将标准化原始数据与因子载荷矩阵的逆矩阵相乘,指出其结果的数学意义。 将标准化主成分得分矩阵转置与标准化原始数据矩阵相乘然后除以样品数减1即n-1,观察结果并指出其数学意义。表2.2 中国30个省市的8项经济指标地区国内生产总值工业总产值固定资产投资货物周转量职工平均工资居民消费水平消费价格指数商品零售价格指数亿元亿元亿元亿吨公里元元94年10094年100北京 1394.89 1908.62 519.01 373.9 81442505117.3 112.6 天津 920.11 2094.01 345.46 342.8 65012720115.3 110.6 河北 2849.52 3995.72 704.87 2033.3 48391258115.2 115.8 山西 1092.48 1753.58 290.90 717.3 47211250116.9 115.6 内蒙 832.88 781.73 250.23 781.7 41341387117.5 116.8 辽宁 2793.37 4974.90 887.99 1371.1 49112397116.1 114.0 吉林 1129.20 1428.96 320.45 497.4 44301872115.2 114.2 黑龙江 2014.53 2203.78 435.73 824.8 41452334116.1 114.3 上海 2462.57 5128.97 996.48 207.4 92795343118.7 113.0 江苏 5155.25 11812.86 1434.95 1025.5 59431926115.8 114.3 浙江 3524.79 8087.75 1006.39 754.4 66192249116.6 113.5 安徽 2003.58 3155.88 474.00 908.3 46091254114.8 112.7 福建 2160.52 2800.68 553.97 609.3 58572320115.2 114.4 江西 1205.11 1291.37 282.84 411.7 42111182116.9 115.9 山东 5002.34 8456.32 1229.55 1196.6 51451527117.6 114.2 河南 3002.74 4715.11 670.35 1574.4 43441034116.5 114.9 湖北 2391.42 4102.58 571.68 849.0 46851527120.0 116.6 湖南 2195.70 2451.47 422.61 1011.8 47971408119.0 115.5 广东 5381.72 9535.42 1639.83 656.5 82502699114.0 111.6 广西 1606.15 1666.10 382.59 556.0 51051314118.4 116.4 海南 364.17 193.26 198.35 232.1 53401814113.5 111.3 四川 3534.00 4426.37 822.54 902.3 46451261118.5 117.0 贵州 630.07 557.14 150.84 301.1 4475942121.4 117.2 云南 1206.68 1206.55 334.00 310.4 51491261121.3 118.1 西藏 55.98 8.99 17.87 4.2 73821110陕西 1000.03 1182.72 300.27 500.9 43961208119.0 117.0 甘肃 553.35 824.73 114.81 507.0 54931007119.8 116.5 青海 165.31 148.64 47.76 61.6 57531445118.0 116.3 宁夏 169.75 197.50 61.98 121.8 50791355117.1 115.3 新疆 834.57 802.02 376.95 339.0 53481649119.7 116.7 资料来源:1996年中国统计年鉴,见3)已知2004年中国主要城市空间质量的指标,变量和样品与课本中的例子完全相同。要求借助SPSS开展因子分析,并回答如下问题。 分析的结论与课本中给出的2003年的情况有何异同? 对比2003年和2004年的因子分析结果,能否发现性质不太稳定的变量?如果要你采取两个变量建立空气质量的分析模型,最好采用什么变量?为什么? 在数据表中缺失一个数据,有什么解决办法?如果要求你利用因子分析结果对全国31个城市排序(必须包括乌鲁木齐),你在SPSS中的有关选项中应该如何选择(参见实习部分)?表2.3 中国主要城市空气质量指标(2004)单位:毫克/立方米,天城市可吸入颗粒物(PM10)二氧化硫(SO2)二氧化氮(NO2)空气质量好于二级的天数(天)北京0.1490.0550.071229天津0.1110.0730.052299石家庄0.1230.0870.042279太原0.1750.0870.022224呼和浩特0.0800.0450.038311沈阳0.1370.0520.035301长春0.0850.0130.032345哈尔滨0.1130.0420.060298上海0.0990.0550.062311南京0.1210.0450.055295杭州0.1100.0490.055292合肥0.1100.0130.017313福州0.0740.0100.041358南昌0.0990.0570.029330济南0.1490.0450.038210郑州0.1110.0570.037298武汉0.1300.0480.054247长沙0.1400.0840.033219广州0.0990.0770.073304南宁0.0780.0610.034348海口 0.0330.0070.013366重庆0.1420.1130.067243成都0.1150.0670.048309贵阳0.0830.0940.024337昆明0.0850.0690.040351拉萨0.0520.0030.020358西安0.1420.0490.033260兰州0.1720.0710.045204西宁0.1270.0240.027280银川0.1220.0540.040323乌鲁木齐0.1140.102258资料来源:2005年中国统计年鉴,见:4)载荷矩阵是主成分分析(PCA)和因子分析(FA)的关键,必须熟悉其来龙去脉。借助任一一个实例、任意一个软件开展主成分分析和因子分析,通过实例回答如下问题。 正交矩阵是怎么来的,它是如何变成载荷矩阵的? SPSS不会给出正交矩阵,有没有办法通过载荷矩阵和方差共献将其计算出来? 载荷矩阵有是如何变成成分得分系数矩阵的? 成分得分系数矩阵如何与原始数据相乘成变成因子得分的? 标准化原始数据矩阵转置后与因子得分矩阵相乘,除以自由度(n-1),是否就是载荷矩阵?5)已知郑州、洛阳二城市某年份的三个指标如下表(表2.4)。要求:试用Excel计算如下距离测度。如果有哪一种距离不能计算,请说明原因。 欧式距离及欧式距离平方。 明氏(Minkowski)距离(取q=1)。 B模距离中的精度加权距离。 马氏(Mahalanobis)距离。 兰氏(Canberra)距离。 自己定义一种距离。 夹角余弦。 相似系数。表2.4 郑州洛阳两城市的三个变量城市非农业人口(万)工业总产值(亿元)建成区面积(平方公里)城市甲(A)169.2491.19142城市乙(B)104.3298.08108资料来源:2002年河南城市统计年鉴。6)为将日本的福冈甜桔引种中国,需要选择一个生态条件合适的城市辖区,分析指标和候选对象见课文。为实现上述目标,可用聚类分析进行判断,最先与福冈聚为一类的生态条件可能最接近,但距离和方法必须选择得当。要求如下。 请用Excel和Word完成基于欧式距离的最长距离法聚类过程。 然后借助SPSS,采用其它的距离,选择另外的一些方法聚类,直到结果与基于模糊数学分析的“相似优先比”给出的结果接近为止。3 分析题列表总结各种距离和聚类方法的优点和缺点。4 应用题下表是山东省16个主要城市的交通里程构成的距离矩阵。要求开展如下分析: 假如要在这16个城市之间建设某种网络系统,请问如何连接才可以使得材料最省? 写出大致的分析过程,并将分析结果表示在地图上。济南聊城德州东营淄博潍坊烟台威海青岛日照临沂济宁泰安莱芜滨州菏泽济南011312020610621249858639338130718689142138243聊城1130130319219325611699506414345156127180251146德州1201300288226332618706513501427273209262220276东营2063192880949438046825526333635623217968449淄博1062192269401063924802872752502621388577349潍坊212325332941060286374181169242368244191136455烟台498611618380392286088240369528654530477422741威海586699706468480374880328457616742618565510829青岛3935065132552871812403280189287549425372317636日照3814145012632751693694571890102303287234307434临沂3073454273362502425286162871020201218165327332济宁1861562733562623686547425493032010124177339131泰安89127209232138244530618425287218124053215255莱芜14218026217985191477565372234165177530162308滨州13825122068771364225103173073273392151620381菏泽2431462764493494557418296364343321312553083810资料来源:有关交通地图册提供的数据,缺枣庄。6

    注意事项

    本文(03第三篇 多元统计分析作业题.doc)为本站会员(asd****56)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开