《第八章 因子分析.ppt》由会员分享,可在线阅读,更多相关《第八章 因子分析.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章 因子分析v8.1 引言 v8.2 正交因子模型 v8.3 参数估计 v8.4 因子旋转 v8.5 因子得分 8.1 引言 v主成分分析的成功需满足如下两点:(1)前(少数)几个主成分具有较高的累计贡献率;(通常较易得到满足)(2)对主成分给出符合实际背景和意义的解释。(往往正是主成分分析的困难之处)v因子分析的用途与主成分分析类似,它也是一种降维方法。由于因子往往比主成分更易得到解释,故因子分析比主成分分析更容易成功,从而有更广泛的应用。v从方法上来说,因子分析比主成分分析更为精细,自然理论上也就更为复杂。主成分分析只涉及一般的线性变换,不涉及模型,仅需假定二阶矩存在。而因子分析需建立
2、一个数学模型,并作一定的假定。v因子分析起源于20世纪初,K.皮尔逊(Pearson)和C.斯皮尔曼(Spearman)等学者为定义和测定智力所作的努力,主要是由对心理测量学有兴趣的科学家们培育和发展了因子分析。v因子分析的目的是为了降维,降维的方式是试图用少数几个潜在的、不可观测的随机变量来描述原始变量间的协方差关系。例8.1.1v林登(Linden)根据他收集的来自139名运动员的比赛数据,对第二次世界大战以来奥林匹克十项全能比赛的得分作了因子分析研究。这十个全能项目为:100米跑(),跳远(),铅球(),跳高(),400米跑(),110米跨栏(),铁饼(),撑杆跳高(),标枪(),150
3、0米跑()。经标准化后所作的因子分析表明,十项得分基本上可归结于他们的短跑速度、爆发性臂力、爆发性腿力和耐力这四个方面,每一方面都称为一个因子。十项得分与这四个因子之间的关系可以描述为如下的因子模型:其中 表示四个因子,称为公共因子,称为 在因子 上的载荷,是 的均值,是 不能被四个公共因子解释的部分,称之为特殊因子。例8.1.3v公司老板对48名应聘者进行面试,并给出他们在15个方面所得的分数,这15个方面是:申请书的形式(),外貌(),专业能力(),讨人喜欢(),自信心(),精明(),诚实(),推销能力(),经验(),积极性(),抱负(),理解能力(),潜力(),交际能力(),适应性()。
4、通过因子分析,这15个方面可以归结为应聘者的外露能力、经验、讨人喜欢的程度、专业能力和外貌这五个因子。8.2 正交因子模型v一、数学模型 v二、正交因子模型的性质v三、因子载荷矩阵的统计意义一、数学模型v设有 维可观测的随机向量 ,其均值为 ,协差阵为 。因子分析的一般模型为v其中 为公共因子,为特殊因子,它们都是不可观测的随机变量。公共因子出现在每一个原始变量的表达式中,可理解为原始变量v共同具有的公共因素;每个公共因子 一般至少对两个原始变量有作用,否则它将归入特殊因子。每个特殊因子 仅仅出现在与之相应的第 个原始变量 的表达式中,它只对这个原始变量有作用。上式可用矩阵表示为v式中 为公共
5、因子向量,为特殊因子向量,称为因子载荷矩阵。通常假定v该假定和上述关系式构成了正交因子模型。由上述假定可以看出,公共因子彼此不相关且具有单位方差,特殊因子也彼此不相关且和公共因子也不相关。二、正交因子模型的性质v1.的协差阵 的分解 故得 如果 为各分量已标准化了的随机向量,则 就是相关阵 ,即有v若取 ,则有分解式 此时 ,没有达到降维目的,故所作的因子分析没有意义。v出于降维的需要,我们常常希望m要比p小得多,这样分解式(8.2.4)通常只能近似成立,即有 近似程度越好,表明因子模型拟合得越佳。一般来说,m选取得越小,上述近似效果就越差,即因子模型拟合得越不理想。拟合得太差的因子模型是没有什么实际意义的。8.3 参数估计v一、主成分法v二、主因子法v三、极大似然法一、主成分法8.4 因子旋转8.5 因子得分 v一、加权最小二乘法v二、回归法一、加权最小二乘法 v采用类似于回归分析中加权最小二乘估计的想法将 估计为 在实际应用中,用估计值 、和 分别代替上述公式中的 、和 ,并将每个样品的数据代入,便可得到相应的因子得分二、回归法v在因子模型(8.2.2)中,假设 服从 元正态 分布,用回归预测方法可将 估计为 在实际应用中,可用 、和 分别代替上述公式中的 、和 来得到因子得分。样品 的因子得分
限制150内