因子分析主成分分析PPT课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《因子分析主成分分析PPT课件.ppt》由会员分享,可在线阅读,更多相关《因子分析主成分分析PPT课件.ppt(89页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于因子分析主成分分析第一张,PPT共八十九页,创作于2022年6月问题的提出问题的提出假定你现在掌握了一个区域内假定你现在掌握了一个区域内评价自然评价自然资源的多个指标资源的多个指标。这些指标从不同的侧面。这些指标从不同的侧面反映所评价自然资源特征反映所评价自然资源特征 如果让你分析该区域的自然资源情况,如果让你分析该区域的自然资源情况,能不能找到能不能找到综合变量综合变量来对该区域内的发展来对该区域内的发展水平排序呢?水平排序呢?第二张,PPT共八十九页,创作于2022年6月方法的选择方法的选择l常用方法:常用方法:l主成分分析主成分分析找出主要影响因素(主成分)找出主要影响因素(主成分)
2、l因子分析因子分析找出公共因子,该公共因子找出公共因子,该公共因子可以概括其所包含的可以概括其所包含的变量变量第三张,PPT共八十九页,创作于2022年6月方法的选择方法的选择l主成分分析主成分分析找出主要影响因素(主成分)找出主要影响因素(主成分)l减少需要考虑的变量减少需要考虑的变量综合排序综合排序l优先考虑第一主成分优先考虑第一主成分各变量对整个样本的影响程度各变量对整个样本的影响程度第四张,PPT共八十九页,创作于2022年6月方法的选择方法的选择l因子分析因子分析找出公共因子找出公共因子综合排序综合排序l综合考虑各公共因子综合考虑各公共因子各变量对整个样本的影响程度各变量对整个样本的
3、影响程度第五张,PPT共八十九页,创作于2022年6月方法的选择方法的选择l主成分分析与因子分析的区别主成分分析与因子分析的区别对原始对原始数据数据的要求的要求l因子分析要求各变量互不相关因子分析要求各变量互不相关l主成分分析要考虑各变量的物理意义(即是否有些变主成分分析要考虑各变量的物理意义(即是否有些变量可以不考虑)量可以不考虑)计算计算方法方法l因子分析:要对系数矩阵做旋转因子分析:要对系数矩阵做旋转l主成分分析:不需要对系数矩阵旋转主成分分析:不需要对系数矩阵旋转第六张,PPT共八十九页,创作于2022年6月方法的选择方法的选择l主成分分析与因子分析的主成分分析与因子分析的优缺点比较优
4、缺点比较对原始变量的保留对原始变量的保留l因子分析:不对原始变量进行取舍,只是因子分析:不对原始变量进行取舍,只是重新组合重新组合l主成分分析:主成分分析:舍弃小部分舍弃小部分原始变量原始变量对实际工作量的影响对实际工作量的影响l因子分析:对工作量减少的影响有限(因综合考虑各变量)因子分析:对工作量减少的影响有限(因综合考虑各变量)l主成分分析:大幅减少工作量(因只考虑主成分,实际工作中可以舍弃非主成分)主成分分析:大幅减少工作量(因只考虑主成分,实际工作中可以舍弃非主成分)综合排序的准确性(理论上)综合排序的准确性(理论上)l因子分析大于主成分分析因子分析大于主成分分析第七张,PPT共八十九
5、页,创作于2022年6月方法的选择方法的选择l分析建立在大样本的基础之上有人认为样本容量要大于50个有人认为样本容量要是变量个数的10倍以上有人认为如果数据均匀,则不需要大样本有人认为第八张,PPT共八十九页,创作于2022年6月方法的选择方法的选择l本实验适合做因子分析,不适合做主成分本实验适合做因子分析,不适合做主成分分析分析l本实验首先本实验首先详细介绍因子分析详细介绍因子分析l然后用本实验的数据,介绍然后用本实验的数据,介绍SPSS中主成分中主成分分析的方法分析的方法第九张,PPT共八十九页,创作于2022年6月方法的选择方法的选择l因子分析试图因子分析试图:在力保数据在力保数据信息丢
6、失最少信息丢失最少原则下原则下研究指标体系的少数几个线性组合研究指标体系的少数几个线性组合几个线性组合所构成的几个线性组合所构成的综合指标综合指标能尽可能多地保能尽可能多地保留原来指标的信息留原来指标的信息这些综合指标就称这些综合指标就称公共因子公共因子。第十张,PPT共八十九页,创作于2022年6月方法的选择方法的选择l选择几个公共因子?选择几个公共因子?因子分析的目的是因子分析的目的是简化变量简化变量,公共因子的个数应,公共因子的个数应该小于原始变量个数该小于原始变量个数保留几个公共因子?应该权衡公共因子个数和保留几个公共因子?应该权衡公共因子个数和保留的信息的程度,一般要保留的信息的程度
7、,一般要保留原始信息的保留原始信息的85%以上。以上。第十一张,PPT共八十九页,创作于2022年6月方法的选择方法的选择lSPSS适用于统计初学者或非统计学专业人适用于统计初学者或非统计学专业人员员l数据转换功能较强数据转换功能较强Spss(*.sav)Excel(*.xls)Text(*.txt)dBase(*.dbf).第十二张,PPT共八十九页,创作于2022年6月实验步骤实验步骤l1.1.数据的准备操作数据的准备操作打开打开保存数据保存数据l2.2.数据描述分析(数据描述分析(DescriptiveDescriptive)l3.3.因子分析因子分析l4.4.输出结果分析输出结果分析第
8、十三张,PPT共八十九页,创作于2022年6月一、数据准备一、数据准备l1)首先在)首先在Excel中打开中打开“水样元素成分分水样元素成分分析数据析数据”,删除表名,删除表名“水样元素成分分析水样元素成分分析数据数据”,保存数据。保存数据。l2)在)在 SPSS中打开保存好的中打开保存好的Excel数据数据第十四张,PPT共八十九页,创作于2022年6月一、数据准备一、数据准备在在Excel中删除中删除在在SPSS中自动转为列标题中自动转为列标题第十五张,PPT共八十九页,创作于2022年6月数据准备数据准备l启动启动SPSS双击双击SPSS15.0图标图标l在开始菜单中找到在开始菜单中找到
9、SPSS 15.0 for Windows,点击。,点击。第十六张,PPT共八十九页,创作于2022年6月选择文件l选择选择 Open an existing data sourcel双击双击More File第十七张,PPT共八十九页,创作于2022年6月选择文件l在文件类在文件类型中选择型中选择Excel第十八张,PPT共八十九页,创作于2022年6月选择文件l“Worksheet”表示的是Excel表格中的行范围第十九张,PPT共八十九页,创作于2022年6月数据编辑窗口数据编辑窗口lSPSS中的列名为Excel中第一行第二十张,PPT共八十九页,创作于2022年6月数据编辑窗口l左下角
10、的两个选项卡,DataView和VariableViewl默认状态下是DataViewl切换到VariableView第二十一张,PPT共八十九页,创作于2022年6月变量格式设置窗口l在VariableView中可以设置变更的名称、类型等参数名称类型小数显示位数输出结果中变量的显示名称输出结果中变量内容的显示名称第二十二张,PPT共八十九页,创作于2022年6月VariableViewlName更改变量名称lType选择变量类型(如numeric、string)lDecimals设定小数显示的位数lLabel分析输出结果中变量的显示名称lValues 分析输出结果中变量内容的显示名称第二十三
11、张,PPT共八十九页,创作于2022年6月结果输出窗口lOutput为结果输出窗口,可以显示我们对文件的操作信息以及对数据的分析结果第二十四张,PPT共八十九页,创作于2022年6月数据格式转换l将将Excel数据转换成为数据转换成为SPSS数据数据,第二十五张,PPT共八十九页,创作于2022年6月保存文件l点击File菜单下的SaveAs选项第二十六张,PPT共八十九页,创作于2022年6月保存文件l保存时类型为SPSS(*.sav)第二十七张,PPT共八十九页,创作于2022年6月保存结果输出文件lOutput结果输出窗口点击File菜单下的SaveAs选项第二十八张,PPT共八十九页,
12、创作于2022年6月保存结果输出文件l保存时类型为SPSS(*.spo)第二十九张,PPT共八十九页,创作于2022年6月因子分析的步骤:l1.判断是否需要进行因子分析判断是否需要进行因子分析判断方法:对变量进行线性回归分析(spss中的Descriptive命令可以实现)通常各变量的线性回归系数没有明显差别,为了使各变量的线性回归系数向0或1两极分化,要进行旋转依据变量的相关性进行判断,采用Bartlett球检验法或KMO检验法,确定是否有进行因子分析的必要l2.如果有因子分析的必要,则进行因子分析如果有因子分析的必要,则进行因子分析第三十张,PPT共八十九页,创作于2022年6月二、数据特
13、征描述操作:l命令命令Descriptive l该命令可完成多种该命令可完成多种统计指标统计指标:均值、中位数、众数、和均值、中位数、众数、和标准差、方差(标准差的平方)标准差、方差(标准差的平方)极大值、极小值、全距极大值、极小值、全距均值的标准误差均值的标准误差偏度、峰度。偏度、峰度。第三十一张,PPT共八十九页,创作于2022年6月Descriptives过程l点击Analyze下的DescriptiveStatistics(描述统计)选项,选择该选项下的Descriptives第三十二张,PPT共八十九页,创作于2022年6月Descriptivesl选中待处理的变量(左侧的As.Hg
14、等);l点击使变量As.Hg移至Variable(s)中;l选中Savestandrdizedvaluesasvariables(保存标准化值作为变量);l点击Options(选项)12第三十三张,PPT共八十九页,创作于2022年6月Descriptives过程l选择所要的特征值:lMean(均数)lStd.deviation(标准差)lMinimum(最小值)lMaximum(最大值)l升序排列(Ascendingmeans)l点击Continue第三十四张,PPT共八十九页,创作于2022年6月Descriptives过程l原始数据标准化原始数据标准化将原始数据转换成标准将原始数据转换成
15、标准Z分值并存入数据库分值并存入数据库根据原始数据与均值的大小根据原始数据与均值的大小,大于均值的为正值,大于均值的为正值,小于均值的为负值,相等的为零小于均值的为负值,相等的为零 l输出原始数据特征的描述参数,如均值、输出原始数据特征的描述参数,如均值、方差等方差等第三十五张,PPT共八十九页,创作于2022年6月数据标准化l标准化过程就是将数据进行处理后,新数据具有均值为0、标准差为1的特征第三十六张,PPT共八十九页,创作于2022年6月因子分析法因子分析法(数据标准化数据标准化)对于具有不同级或不同单位的数据进行处理,使资料在更平等的条件下进行分析。假设为原观测值,为数据均值,S为标准
16、差,则标准化后的观测值(标准正态变换)为第三十七张,PPT共八十九页,创作于2022年6月Descriptives过程l点击OK第三十八张,PPT共八十九页,创作于2022年6月Descriptives过程l标准化处理后的数据第三十九张,PPT共八十九页,创作于2022年6月Descriptives过程样品数量样品数量最小值最小值最大值最大值均数均数标准差标准差第四十张,PPT共八十九页,创作于2022年6月三、因子分析l点击Analyze下的DataReduction(数据降维)选项,选择该选项下的Factor(因子分析)过程第四十一张,PPT共八十九页,创作于2022年6月因子分析l1、选
17、中待处理的变量,移至Variables第四十二张,PPT共八十九页,创作于2022年6月因子分析l2、点击Descriptivesl判断是否有进行因子分析的必要Coefficients(计算相关系数矩阵)Significancelevels(显著水平)KMOandBartlettstestofsphericity(对相关系数矩阵进行统计学检验)第四十三张,PPT共八十九页,创作于2022年6月因子分析l判断是否有进行因子分析的必要Inverse(倒数模式):求出相关矩阵的反矩阵(因子分析用不到)Reproduced(重制的):显示重制相关矩阵(因子分析用不到)Determinant(行列式):
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 成分 分析 PPT 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内