因子分析主成分分析精选PPT.ppt
《因子分析主成分分析精选PPT.ppt》由会员分享,可在线阅读,更多相关《因子分析主成分分析精选PPT.ppt(89页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于因子分析主成分分析第1页,讲稿共89张,创作于星期日问题的提出问题的提出假定你现在掌握了一个区域内假定你现在掌握了一个区域内评价自然评价自然资源的多个指标资源的多个指标。这些指标从不同的侧面。这些指标从不同的侧面反映所评价自然资源特征反映所评价自然资源特征 如果让你分析该区域的自然资源情况,如果让你分析该区域的自然资源情况,能不能找到能不能找到综合变量综合变量来对该区域内的发展来对该区域内的发展水平排序呢?水平排序呢?第2页,讲稿共89张,创作于星期日方法的选择方法的选择l常用方法:常用方法:l主成分分析主成分分析找出主要影响因素(主成分)找出主要影响因素(主成分)l因子分析因子分析找出公
2、共因子,该公共因子找出公共因子,该公共因子可以概括其所包含的可以概括其所包含的变量变量第3页,讲稿共89张,创作于星期日方法的选择方法的选择l主成分分析主成分分析找出主要影响因素(主成分)找出主要影响因素(主成分)l减少需要考虑的变量减少需要考虑的变量综合排序综合排序l优先考虑第一主成分优先考虑第一主成分各变量对整个样本的影响程度各变量对整个样本的影响程度第4页,讲稿共89张,创作于星期日方法的选择方法的选择l因子分析因子分析找出公共因子找出公共因子综合排序综合排序l综合考虑各公共因子综合考虑各公共因子各变量对整个样本的影响程度各变量对整个样本的影响程度第5页,讲稿共89张,创作于星期日方法的
3、选择方法的选择l主成分分析与因子分析的区别主成分分析与因子分析的区别对原始对原始数据数据的要求的要求l因子分析要求各变量互不相关因子分析要求各变量互不相关l主成分分析要考虑各变量的物理意义(即是否有些变主成分分析要考虑各变量的物理意义(即是否有些变量可以不考虑)量可以不考虑)计算计算方法方法l因子分析:要对系数矩阵做旋转因子分析:要对系数矩阵做旋转l主成分分析:不需要对系数矩阵旋转主成分分析:不需要对系数矩阵旋转第6页,讲稿共89张,创作于星期日方法的选择方法的选择l主成分分析与因子分析的主成分分析与因子分析的优缺点比较优缺点比较对原始变量的保留对原始变量的保留l因子分析:不对原始变量进行取舍
4、,只是因子分析:不对原始变量进行取舍,只是重新组合重新组合l主成分分析:主成分分析:舍弃小部分舍弃小部分原始变量原始变量对实际工作量的影响对实际工作量的影响l因子分析:对工作量减少的影响有限(因综合考虑各变量)因子分析:对工作量减少的影响有限(因综合考虑各变量)l主成分分析:大幅减少工作量(因只考虑主成分,实际工作中可以舍弃非主成分)主成分分析:大幅减少工作量(因只考虑主成分,实际工作中可以舍弃非主成分)综合排序的准确性(理论上)综合排序的准确性(理论上)l因子分析大于主成分分析因子分析大于主成分分析第7页,讲稿共89张,创作于星期日方法的选择方法的选择l分析建立在大样本的基础之上有人认为样本
5、容量要大于50个有人认为样本容量要是变量个数的10倍以上有人认为如果数据均匀,则不需要大样本有人认为第8页,讲稿共89张,创作于星期日方法的选择方法的选择l本实验适合做因子分析,不适合做主成分分本实验适合做因子分析,不适合做主成分分析析l本实验首先本实验首先详细介绍因子分析详细介绍因子分析l然后用本实验的数据,介绍然后用本实验的数据,介绍SPSS中主成分中主成分分析的方法分析的方法第9页,讲稿共89张,创作于星期日方法的选择方法的选择l因子分析试图因子分析试图:在力保数据在力保数据信息丢失最少信息丢失最少原则下原则下研究指标体系的少数几个线性组合研究指标体系的少数几个线性组合几个线性组合所构成
6、的几个线性组合所构成的综合指标综合指标能尽可能多地保能尽可能多地保留原来指标的信息留原来指标的信息这些综合指标就称这些综合指标就称公共因子公共因子。第10页,讲稿共89张,创作于星期日方法的选择方法的选择l选择几个公共因子?选择几个公共因子?因子分析的目的是因子分析的目的是简化变量简化变量,公共因子的个数应,公共因子的个数应该小于原始变量个数该小于原始变量个数保留几个公共因子?应该权衡公共因子个数和保留几个公共因子?应该权衡公共因子个数和保留的信息的程度,一般要保留的信息的程度,一般要保留原始信息的保留原始信息的85%以上。以上。第11页,讲稿共89张,创作于星期日方法的选择方法的选择lSPS
7、S适用于统计初学者或非统计学专业人适用于统计初学者或非统计学专业人员员l数据转换功能较强数据转换功能较强Spss(*.sav)Excel(*.xls)Text(*.txt)dBase(*.dbf).第12页,讲稿共89张,创作于星期日实验步骤实验步骤l1.1.数据的准备操作数据的准备操作打开打开保存数据保存数据l2.2.数据描述分析(数据描述分析(DescriptiveDescriptive)l3.3.因子分析因子分析l4.4.输出结果分析输出结果分析第13页,讲稿共89张,创作于星期日一、数据准备一、数据准备l1)首先在)首先在Excel中打开中打开“水样元素成分水样元素成分分析数据分析数据
8、”,删除表名,删除表名“水样元素成分水样元素成分分析数据分析数据”,保存数据。保存数据。l2)在)在 SPSS中打开保存好的中打开保存好的Excel数据数据第14页,讲稿共89张,创作于星期日一、数据准备一、数据准备在在Excel中删除中删除在在SPSS中自动转为列标题中自动转为列标题第15页,讲稿共89张,创作于星期日数据准备数据准备l启动启动SPSS双击双击SPSS15.0图标图标l在开始菜单中找到在开始菜单中找到SPSS 15.0 for Windows,点击。,点击。第16页,讲稿共89张,创作于星期日选择文件l选择选择 Open an existing data sourcel双击双
9、击More File第17页,讲稿共89张,创作于星期日选择文件l在文件类在文件类型中选择型中选择Excel第18页,讲稿共89张,创作于星期日选择文件l“Worksheet”表示的是Excel表格中的行范围第19页,讲稿共89张,创作于星期日数据编辑窗口数据编辑窗口lSPSS中的列名为Excel中第一行第20页,讲稿共89张,创作于星期日数据编辑窗口l左下角的两个选项卡,DataView和VariableViewl默认状态下是DataViewl切换到VariableView第21页,讲稿共89张,创作于星期日变量格式设置窗口l在VariableView中可以设置变更的名称、类型等参数名称类型
10、小数显示位数输出结果中变量的显示名称输出结果中变量内容的显示名称第22页,讲稿共89张,创作于星期日VariableViewlName更改变量名称lType选择变量类型(如numeric、string)lDecimals设定小数显示的位数lLabel分析输出结果中变量的显示名称lValues 分析输出结果中变量内容的显示名称第23页,讲稿共89张,创作于星期日结果输出窗口lOutput为结果输出窗口,可以显示我们对文件的操作信息以及对数据的分析结果第24页,讲稿共89张,创作于星期日数据格式转换l将将Excel数据转换成为数据转换成为SPSS数据数据,第25页,讲稿共89张,创作于星期日保存文
11、件l点击File菜单下的SaveAs选项第26页,讲稿共89张,创作于星期日保存文件l保存时类型为SPSS(*.sav)第27页,讲稿共89张,创作于星期日保存结果输出文件lOutput结果输出窗口点击File菜单下的SaveAs选项第28页,讲稿共89张,创作于星期日保存结果输出文件l保存时类型为SPSS(*.spo)第29页,讲稿共89张,创作于星期日因子分析的步骤:l1.判断是否需要进行因子分析判断是否需要进行因子分析判断方法:对变量进行线性回归分析(spss中的Descriptive命令可以实现)通常各变量的线性回归系数没有明显差别,为了使各变量的线性回归系数向0或1两极分化,要进行旋
12、转依据变量的相关性进行判断,采用Bartlett球检验法或KMO检验法,确定是否有进行因子分析的必要l2.如果有因子分析的必要,则进行因子分析如果有因子分析的必要,则进行因子分析第30页,讲稿共89张,创作于星期日二、数据特征描述操作:l命令命令Descriptive l该命令可完成多种该命令可完成多种统计指标统计指标:均值、中位数、众数、和均值、中位数、众数、和标准差、方差(标准差的平方)标准差、方差(标准差的平方)极大值、极小值、全距极大值、极小值、全距均值的标准误差均值的标准误差偏度、峰度。偏度、峰度。第31页,讲稿共89张,创作于星期日Descriptives过程l点击Analyze下
13、的DescriptiveStatistics(描述统计)选项,选择该选项下的Descriptives第32页,讲稿共89张,创作于星期日Descriptivesl选中待处理的变量(左侧的As.Hg等);l点击使变量As.Hg移至Variable(s)中;l选中Savestandrdizedvaluesasvariables(保存标准化值作为变量);l点击Options(选项)12第33页,讲稿共89张,创作于星期日Descriptives过程l选择所要的特征值:lMean(均数)lStd.deviation(标准差)lMinimum(最小值)lMaximum(最大值)l升序排列(Ascendi
14、ngmeans)l点击Continue第34页,讲稿共89张,创作于星期日Descriptives过程l原始数据标准化原始数据标准化将原始数据转换成标准将原始数据转换成标准Z分值并存入数据库分值并存入数据库根据原始数据与均值的大小根据原始数据与均值的大小,大于均值的为正值,大于均值的为正值,小于均值的为负值,相等的为零小于均值的为负值,相等的为零 l输出原始数据特征的描述参数,如均值、方输出原始数据特征的描述参数,如均值、方差等差等第35页,讲稿共89张,创作于星期日数据标准化l标准化过程就是将数据进行处理后,新数据具有均值为0、标准差为1的特征第36页,讲稿共89张,创作于星期日因子分析法因
15、子分析法(数据标准化数据标准化)对于具有不同级或不同单位的数据进行处理,使资料在更平等的条件下进行分析。假设为原观测值,为数据均值,S为标准差,则标准化后的观测值(标准正态变换)为第37页,讲稿共89张,创作于星期日Descriptives过程l点击OK第38页,讲稿共89张,创作于星期日Descriptives过程l标准化处理后的数据第39页,讲稿共89张,创作于星期日Descriptives过程样品数量样品数量最小值最小值最大值最大值均数均数标准差标准差第40页,讲稿共89张,创作于星期日三、因子分析l点击Analyze下的DataReduction(数据降维)选项,选择该选项下的Fact
16、or(因子分析)过程第41页,讲稿共89张,创作于星期日因子分析l1、选中待处理的变量,移至Variables第42页,讲稿共89张,创作于星期日因子分析l2、点击Descriptivesl判断是否有进行因子分析的必要Coefficients(计算相关系数矩阵)Significancelevels(显著水平)KMOandBartlettstestofsphericity(对相关系数矩阵进行统计学检验)第43页,讲稿共89张,创作于星期日因子分析l判断是否有进行因子分析的必要Inverse(倒数模式):求出相关矩阵的反矩阵(因子分析用不到)Reproduced(重制的):显示重制相关矩阵(因子分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 成分 分析 精选 PPT
限制150内