《2013实验报告-主成分分析.doc》由会员分享,可在线阅读,更多相关《2013实验报告-主成分分析.doc(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、黑龙江八一农垦大学多元统计分析实验报告实验项目 主成分分析 专 业 信息与计算科学专业 年 级 2011级 姓 名 学 号 黑龙江八一农垦大学文理学院数学实验室学生实验守则1、参加实验的学生必须按时到实验室上实验课,按指定的席位操作,不得迟到早退。迟到10分钟,禁止实验。2、遵守实验室的一切规章制度,不喧哗,不吸烟,保持室内安静、整洁。3、学生实验前要认真预习实验内容,接受指导教师的提问和检查。4、严格遵守操作规程。5、应认真记录原始数据,填写实验报告,及时送交实验报告。6、不准动用与本实验无关的仪器设备和室内的其它设施。7、实验中发生事故时,要保持镇静,并立即采取抢救措施,及时向指导教师报告
2、。8、损坏实验设备应主动向指导教师报告,由指导教师根据情况进行处理,需要赔偿的应写出书面报告,填写赔偿单。9、实验结束,将实验结果交实验教师检查,合格后,经指导教师同意后,方可离开实验室。10、实验完毕后,应按时写出实验报告,及时交指导教师审阅,不交者,该实验无成绩。实 验 报 告实验项目名称主成分分析实验日期2013.4.25理论内容主成分分析实验地点理学203实验目的及要求:掌握主成分分析的基本理论,熟练掌握利用SPSS软件系统进行主成分分析的步骤,会找出合理的主成分,建立主成分模型和综合评价模型,进行主成分得分排序。实验内容:1、熟悉掌握SPSS软件进行主成分分析的基本操作;2、掌握主成
3、分分析的基本原理;3、根据下列某地区11年数据X1(总产值)X2(存储量)X3(总消费)y(进口额)1234567891011149.3161.2171.5175.5180.8190.7202.1212.4226.1231.9239.04.24.13.13.11.12.22.15.65.05.10.7108.1114.8123.2126.9132.1137.7146.0154.1162.3164.3167.615.916.419.019.118.820.422.726.528.127.626.3(1) 计算地区总产值、存储量和总消费的相关系数矩阵;(2)求特征根及其对应的特征向量;(3)求出主
4、成分及每个主成分的方差贡献率;(4)利用主成分方法建立y与x1,x2,x3的回归方程(取两个主成分)。主成分分析基本原理:设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。 操作步骤及运行结果:(1)先进行如下步骤:分析降维因子分析.然后,把X1,X2,X3移入变量列表。接下来,点击“描述”,在描述统计框中的相关矩阵框中勾选系数。即出如下结果: 相关矩阵X1(总产值)X2(存储量)X3(总消费)相关X1(总产值)1.000.026.997X2(存
5、储量).0261.000.036X3(总消费).997.0361.000(2) 解释的总方差表中的合计栏即为特征根,主成分中的系数即为特征向量。所以,首先得出解释的总方差和成分矩阵如下:解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %11.99966.63866.6381.99966.63866.6382.99833.27299.910.99833.27299.9103.003.090100.000.003.090100.000提取方法:主成份分析。所以特征根为:1=1.999 2=0.998 3=0.003成份矩阵a成份123X1(总产值).999-.03
6、6.037X2(存储量).062.998.000X3(总消费).999-.026-.037提取方法 :主成份。a. 已提取了 3 个成份。由主成分系数计算公式:成分矩阵中主成分对应的数值/,得特征根1、2、3对应特征向量为:(0.707 0.044 0.707)(-0.036 0.999 -0.026)(0.676 0.000 -0.676) (3)先进行如下步骤:分析降维因子分析.然后,把X1,X2,X3移入变量列表。接下来,点击“描述”,在选择描述中统计量栏的原始分析结果前打勾。即出如下结果:解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %11.9996
7、6.63866.6381.99966.63866.6382.99833.27299.910.99833.27299.9103.003.090100.000提取方法:主成份分析。从上表我们可知,主成分主要是第一,第二主成分。两者累积贡献率达99.910%。第一主成分方差贡献率为66.638%,第二主成分方差贡献率为33.272%。分析降维因子分析.然后,把X1,X2,X3移入变量列表。通过做成分矩阵,出如下结果:成份矩阵a成份12X1(总产值).999-.036X2(存储量).062.998X3(总消费).999-.026提取方法 :主成份。a. 已提取了 2 个成份。由主成分系数计算公式:成分
8、矩阵中主成分对应的数值/,得出主成分一的系数(0.707 0.044 0.707)主成分二的系数(-0.036 0.999 -0.026)。所以,主成分一得分公式:F1=0.707*X1+0.044*X2+ 0.707*X3主成分二得分公式:F2=(-0.036)*X1+0.998*X2+(-0.026)*X3(4) 分析降维因子分析.然后,把X1,X2,X3移入变量列表。接下来,点击“得分”,在得分栏中勾选保存为变量。然后以主成分得分FAC1_1,FAC2_1为自变量,y为因变量,在回归下做逐步线性回归方程。如下表:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)21.8
9、91.31769.011.000REGR factor score 1 for analysis 14.433.333.97613.324.0002(常量)21.891.166132.006.000REGR factor score 1 for analysis 14.433.174.97625.486.000REGR factor score 2 for analysis 1.868.174.1914.993.001a. 因变量: y(进口额)由上表得回归方程:y=21.891+4.433*F1+0.868*F2把主成分F1、F2的表达式代入得y=21.891+4.433(0.707*X1+0.044*X2+0.707*X3)+0.868(-0.036)*X1+0.998*X2+(-0.026)*X3=21.891+3.103X1+1.061X2+3.112X3即y=21.891+3.103X1+1.061X2+3.112X3结果分析与讨论:通过主成分分析,将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计,得到所需要的回归方程。实验报告评分标准评分项目满分得分评分项目满分得分基本原理3操作步骤与运行结果7结果分析与讨论5合 计15授课教师田宏批阅日期
限制150内