《2022年多元统计分析实例.docx》由会员分享,可在线阅读,更多相关《2022年多元统计分析实例.docx(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -多元统计分析实例院系 : 商学院学号 :姓名 :可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 1 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -多元统计分析实例本文收集了 20XX年 31 个省市自治区的农林牧渔和相关农业数据, 通过对对收集的数据进行比较分析对31 个省市自治区进行分类 . 选取了 6个指标农业
2、产值 ,林业产值 . 牧业总产值 , 渔业总产值 , 农村居民家庭拥有生产性固定资产原值, 农村居民家庭经营耕的面积.数据如下表 :一. 聚类法可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 2 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -设定 4 个群聚 , 采纳了系统聚类法 . 下表为 spss 分析之后的结果 .聚类表群集组合首次显现阶群集阶群集 1群集 2系数群集 1群集 2下一阶157226
3、.38100132291715.218005322241974.09800741295392.69000652306079.75520661211120.902458742221528.7190311812623185.44460149122026914.251001910273135203.44300201142850321.121702212111365624.068002413525114687.756101714121169600.075802215818188500.8140021161719204825.463002117514268125.1031302018323387465.
4、457002619612425667.984092320527459235.01917102321817499195.4301516252214559258.8101411282356708176.88120192424511854998.386231228258101042394.6082102626381222229.5971825292715161396048.280002928151915098.014222430293153086204.55226273030136791755.63728290可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - -
5、 - - - -第 3 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -Rescaled Distance Cluster CombineC A S E0510152025LabelNum +-+-+-+-+-+内蒙5-+吉林7-+云南25-+-+江西14-+ +-+陕西27-+-+ |新疆31-+-+安徽12-+-+ | |广西20-+ +-+ +-+辽宁6-+|浙江11-+-+|福建13-+|重庆22-+-+贵州24-+|山西4-+-+|甘肃28-+|北京1-+
6、|青海29-+-+|天津2-+|上海9-+|宁夏30-+-+|西藏26-+|海南21-+|河北3-+-+|四川23-+|黑龙江8-+-+-+|湖南18-+ +-+ |湖北17-+-+-+-+广东19-+|江苏10-+|山东15-+-+河南16-+群集成员案例4 群集1: 北京12: 天津1可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 4 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -3: 河北14:
7、山西15: 内蒙26: 辽宁17: 吉林28: 黑龙江29: 上海110: 江苏111: 浙江112: 安徽113: 福建114: 江西115: 山东316: 河南117: 湖北118: 湖南119: 广东120: 广西121: 海南122: 重庆123: 四川124: 贵州125: 云南126: 西藏427: 陕西128: 甘肃129: 青海130: 宁夏131: 新疆2从 SPSS分析结果可以得到 , 内蒙, 吉林, 黑龙江 , 新疆为第 2族群, 这一族群的特点是农业收入可能不高, 但是农夫的固定资产 , 和耕的面积特别高 , 农夫的富余程度或者机械化程度较高; 山东是第 3族群, 这一
8、族群中六个指标都处于较高水平,可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 5 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -农林牧渔四项收入都处于较高水平而且农夫富余; 西藏处于第 4族群, 这是由于 ,西藏人员较少 , 自然条件恶劣 , 可使用耕的少 , 但是, 由于国家的扶持 , 农夫的固定资产较多 , 农夫相对而言比较富足 ; 大多数省份属于第 1族群, 这一族群的特点在于六项指标都没有较为突
9、出的一项, 或者农林牧渔收入的原来就少, 或者是农夫的虽然比较辛苦 , 总体的农业收入较高 , 但是农夫的收入水平比较低, 固定资产较少.可编辑资料 - - - 欢迎下载精品_精品资料_三. 判别法X1, X 2 , X 3 , X 4 , X 5 , X 6分别代表农业产值 , 林业产值 . 牧业总产值 , 渔业总产值 ,可编辑资料 - - - 欢迎下载精品_精品资料_农村居民家庭拥有生产性固定资产原值分析案例处理摘要未加权案例N, 农村居民家庭经营耕的面积百分比.有效31100.0排除的缺失或越界组代码0.0至少一个缺失判别变量0.0缺失或越界组代码仍有至少一个缺失判别变量0.0合计0.0
10、合计31100.0试验结果分析 :Average Linkage Between Groups组统计量均值标准差有效的 N(列表状态) 未加权的已加权的1农业总产值1463.89001062.034862525.000林业总产值118.576887.020522525.000牧业总产值830.3664671.104402525.000渔业总产值291.4128346.719022525.000可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 6 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精
11、品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -农村居民家庭拥有生产性固定资产原值14432.34005287.929502525.000农村居民家庭经营耕的面积1.5496.884842525.0002农业总产值1582.2975543.9285144.000林业总产值93.350037.7113144.000牧业总产值1021.3175372.8825544.000渔业总产值38.350027.4906744.000农村居民家庭拥有生产性固定资产原值30226.41754233.7783944.000农村居民家庭经营耕的面积9.49753.30626
12、44.0003农业总产值3960.6200a.11.000林业总产值107.0100a.11.000牧业总产值2285.9200a.11.000渔业总产值1267.0700a.11.000农村居民家庭拥有生产性固定资产原值19168.1400a.11.000农村居民家庭经营耕的面积1.6400a.11.0004农业总产值53.3900a.11.000林业总产值2.5600a.11.000牧业总产值59.0200a.11.000渔业总产值.2200a.11.000农村居民家庭拥有生产性固定资产原值52935.0700a.11.000农村居民家庭经营耕的面积1.8900a.11.000从表上可以看
13、出 , 组均值之间差值很大 . 各个分组 , 在 6 项指标上均值有较明显的差异 .组均值的均等性的检验Wilks的 LambdaFdf1df2Sig.农业总产值.7732.640327.070林业总产值.928.699327.561牧业总产值.8012.238327.107渔业总产值.6914.019327.017农村居民家庭拥有生产性固定资产原值.25326.538327.000可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 7 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资
14、料_资料word 精心总结归纳 - - - - - - - - - - - -组均值的均等性的检验Wilks的 LambdaFdf1df2Sig.农业总产值.7732.640327.070林业总产值.928.699327.561牧业总产值.8012.238327.107渔业总产值.6914.019327.017农村居民家庭拥有生产性固定资产原值.25326.538327.000农村居民家庭经营耕的面积.19038.263327.000由表中可以知道 ,13456 指标之间的 sig 值较小 ,2 指标 sig 值有 0.561 较大,不过仍说明接受原假设 , 各指标族群间差异较大 .汇聚的组内
15、矩阵农业总产值林业总产值牧业总产值渔业总产值相关性农业总产值1.000.449.895.400林业总产值.4491.000.489.481牧业总产值.895.4891.000.294渔业总产值.400.481.2941.000农村居民家庭拥有生产性固定资产原值-.093-.262-.052-.040农村居民家庭经营耕的面积.056-.033.181-.104汇聚的组内矩阵农村居民家庭拥有生产性固定资产原值农村居民家庭经营耕的面积相关性农业总产值-.093.056林业总产值-.262-.033牧业总产值-.052.181渔业总产值-.040-.104农村居民家庭拥有生产性固定资产原值1.000.
16、326农村居民家庭经营耕的面积.3261.000可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 8 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -从表中可以知道 , 检验结果 p 值0.05, 此时, 说明协方差矩阵相等,可以进行 bayes 检验.Fisher分析法协方差矩阵的均等性的箱式检验对数行列式Average Linkage BetweenGroups秩对数行列式1661.125ab2.cb3
17、.cb4.汇聚的组内662.351打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数.典型判别式函数摘要特点值函数特点值方差的 %累积%正就相关性14.874 a64.264.2.91122.084 a27.491.6.822a3.6388.4100.0.624由表中看出,函数 1,2的特点值 达到0.911,0.822 比较大,对判别的奉献大 .可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 9 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳
18、- - - - - - - - - - - -标准化的典型判别式函数系数函数123农业总产值.500-.196.000林业总产值.234.164-.742牧业总产值-.639.143.649渔业总产值-.185-.130.869农村居民家庭拥有生产性.3701.022.071固定资产原值农村居民家庭经营耕的面积.865-.676.051典型判别式函数系数函数123农业总产值.000.000.000林业总产值.003.002-.009牧业总产值.000.000.001渔业总产值.000.000.003农村居民家庭拥有生产性固定资产原值.000.000.000农村居民家庭经营耕的面积.626-.4
19、89.037 常量 -2.928-2.269-.975可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 10 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -典型判别式函数系数函数123农业总产值.000.000.000林业总产值.003.002-.009牧业总产值.000.000.001渔业总产值.000.000.003农村居民家庭拥有生产性固定资产原值.000.000.000农村居民家庭经营耕的面积.6
20、26-.489.037 常量 -2.928-2.269-.975非标准化系数由表中可知, 3个Fisher判别函数分别为 :可编辑资料 - - - 欢迎下载精品_精品资料_y12.928y22.2690.003X 20.002X 20.626X 60.489X 6可编辑资料 - - - 欢迎下载精品_精品资料_y30.9750.009X 20.01X 30.03X 40.037 X6可编辑资料 - - - 欢迎下载精品_精品资料_农村居民家庭拥有生产性固定资产原值对判别数据所属群体无用 .结构矩阵函数123农村居民家庭经营耕的面积.909 *-.319农村居民家庭拥有生产性固定资产原值.585
21、.775林业总产值-.068-.162.126*.213*-.027可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 11 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -*渔业总产值-.164-.059.695*农业总产值-.026-.179.591*牧业总产值.007-.166.547判别变量和标准化典型判别式函数之间的汇聚组间相关性按函数内相关性的肯定大小排序的变量.*.每个变量和任意判别式函数间最大
22、的肯定相关性该表是原始变量与典型变量 (标准化的典型判别函数) 的相关系数, 相关系数的肯定值越大,说明原始变量与这个判别函数的相关性越强.从表中可以看出相关性较强 .符合较好 .组质心处的函数Average函数LinkageBetweenGroups1231-.859-.159-.17025.184-.860.0853-1.262.1624.05842.0137.257-.144在组均值处评估的非标准化典型判别式函数由上表可知各类别重心的位置,通过运算观测值与各重心的距离,距离最小的即为该观测值的分类 .贝叶斯分析法分类函数系数Average Linkage Between Groups12
23、34农业总产值.003.006.002.003林业总产值.029.042-.010.051牧业总产值-.003-.009.002-.004可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 12 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -渔业总产值-.002-.004.010-.006农村居民家庭拥有生产性固定资产原值.001.001.001.002农村居民家庭经营耕的面积.1534.286-.100-
24、1.675 常量 -8.418-38.180-20.732-61.646分类函数系数Average Linkage Between Groups该表为贝叶斯函数判别函数的取值,从图中可以知道三类贝叶斯函数.可编辑资料 - - - 欢迎下载精品_精品资料_y1第一类 :其次类 ; y20.03x10.06x10.029x20.42x20.03x30.009x30.002x40.004x40.001x50.004x50.153x14.286x68.41838.18可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_第三类 ; y30.02x10.010x
25、20.002x30.010x40.001x51.x620.732可编辑资料 - - - 欢迎下载精品_精品资料_可编辑资料 - - - 欢迎下载精品_精品资料_第四类 : y40.003x10.051x20.004x30.006x40.002x51.675x661.646可编辑资料 - - - 欢迎下载精品_精品资料_将各样品的自变量值代入上述4个Bayes判别函数,得到函数值.比较函数值,哪 个函数值比较大就可以判定该样品判入哪一类.判别结果检验根据案例次序的统计量最高组可编辑资料 - - - 欢迎下载精品_精品资料_案例数目PDd | G=g实际组猜测组pdf可编辑资料 - - - 欢迎下
26、载精品_精品资料_初始111.6843211.9453311.7243411.3903522.9613611.1173722.5333822.0133911.17231013*.5853可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 13 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -1111.21931211.97531311.98031411.699315331.00031611.90031711.
27、31331811.77331911.46832011.86832111.74232211.94932311.67232411.91032511.268326441.00032711.92932811.56832911.52633011.1823*.31错误分类的案例22.0303a分类结果可编辑资料 - - - 欢迎下载精品_精品资料_Average Linkage Between Groups猜测组成员123可编辑资料 - - - 欢迎下载精品_精品资料_初始计数12401204030014000可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - -
28、- - -第 14 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -%196.0.04.02.0100.0.03.0.0100.0从上图可以看出本次判别分析的结果比较贴近,只有第 10统计量在分布上显现不同.从总体而言 ,判别成效较好 .3.主成分分析通过SPSS主成分统计分析 ,得到如下数据 .公因子方差初始提取农业总产值1.000.874林业总产值1.000.528牧业总产值1.000.882渔业总产值1.000.543农村居民家庭拥有生产性固定资产原值1.00
29、0.706农村居民家庭经营耕的面积1.000.781提取方法:主成份分析.说明的总方差成份合计初始特点值方差的 %累积 %提取平方和载入合计方差的 %12.72845.46345.4632.72845.46321.58526.42271.8861.58526.4223.67611.26483.1504.60910.14993.2995.3315.51598.8146.0711.186100.000提取方法:主成份分析.说明的总方差提取平方和载入旋转平方和载入成份累积 %合计方差的 %累积 %可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - -
30、-第 15 页,共 18 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -145.4632.62443.74043.740271.8861.68928.14671.886可编辑资料 - - - 欢迎下载精品_精品资料_提取方法:主成份分析.从以上表可以知道 ,成分F1F2,的特点值都 1,并且说明了 71.886%的方差 ,达可编辑资料 - - - 欢迎下载精品_精品资料_到了主成分分析的要求 .所以只要提取两个因子即可满意要求.其他因子不予以提取.得到以下数据 .a成份矩阵成份
31、12农业总产值.875.330林业总产值.720-.097牧业总产值.836.428渔业总产值.724-.138可编辑资料 - - - 欢迎下载精品_精品资料_农村居民家庭拥有生产性固定资产原值-.428.723可编辑资料 - - - 欢迎下载精品_精品资料_农村居民家庭经营耕的面积-.194.862提取方法 : 主成分分析法.可编辑资料 - - - 欢迎下载精品_精品资料_a.已提取了 2个成份.F10.875X10.72X 20.836X 30.724X 40.428X50.194X 6可编辑资料 - - - 欢迎下载精品_精品资料_得到主成分 F20.33X10.0987X 20.428X30.138X 40.723X 50.862X 6可编辑资料 - - - 欢迎下载精品_精品资料_说明:第一类因子F1中X1 X2 X3 X4载荷系数较大 .主要说明了各省区自然条件的状况和农林牧渔收入.可抽象为农业的环境因子.其次类因子F2中X5 X6 载荷比较大 .主要说明了各个省区农夫的经济和耕的状况.可抽象于农业的农夫因子.4.因子分析 :通过主城分析得到旋转之前的因子与载荷.与因子公式 .可编辑资料 - - - 欢迎下载精品_精品资料_学习资料
限制150内