因子分析与聚类分析含.pptx
《因子分析与聚类分析含.pptx》由会员分享,可在线阅读,更多相关《因子分析与聚类分析含.pptx(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1因子分析与聚类分析含因子分析与聚类分析含本章内容本章内容本章内容本章内容n n第一节第一节 因子分析因子分析n n第二节第二节 聚类分析聚类分析第1页/共55页第一节第一节第一节第一节 因子分析因子分析因子分析因子分析n n一、因子分析的概念和特点一、因子分析的概念和特点一、因子分析的概念和特点一、因子分析的概念和特点n n(一)因子分析的概念(一)因子分析的概念(一)因子分析的概念(一)因子分析的概念n n 因子分析(因子分析(因子分析(因子分析(factor analysisfactor analysis)是利用降维的思)是利用降维的思)是利用降维的思)是利用降维的思想,由研究原始
2、变量相关矩阵内部的依赖关系想,由研究原始变量相关矩阵内部的依赖关系想,由研究原始变量相关矩阵内部的依赖关系想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为出发,把一些具有错综复杂关系的变量归结为出发,把一些具有错综复杂关系的变量归结为出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。少数几个综合因子的一种多变量统计分析方法。少数几个综合因子的一种多变量统计分析方法。少数几个综合因子的一种多变量统计分析方法。n n 在会计实证研究中,因子分析发挥着重要的在会计实证研究中,因子分析发挥着重要的在会计实证研究中,因子分析发挥着重要的在会
3、计实证研究中,因子分析发挥着重要的作用,如变量构造、变量筛选和综合评价等。作用,如变量构造、变量筛选和综合评价等。作用,如变量构造、变量筛选和综合评价等。作用,如变量构造、变量筛选和综合评价等。第2页/共55页n n(二)因子分析的特点(二)因子分析的特点(二)因子分析的特点(二)因子分析的特点n n 1 1、因子变量的数量远少于原有指标变量的、因子变量的数量远少于原有指标变量的、因子变量的数量远少于原有指标变量的、因子变量的数量远少于原有指标变量的数量。数量。数量。数量。n n 2 2、因子变量并不是原有变量的简单取舍,、因子变量并不是原有变量的简单取舍,、因子变量并不是原有变量的简单取舍,
4、、因子变量并不是原有变量的简单取舍,而是对原有变量的重新组构。而是对原有变量的重新组构。而是对原有变量的重新组构。而是对原有变量的重新组构。n n 3 3、因子之间线性关系不显著。、因子之间线性关系不显著。、因子之间线性关系不显著。、因子之间线性关系不显著。n n 4 4、因子变量具有命名解释性。、因子变量具有命名解释性。、因子变量具有命名解释性。、因子变量具有命名解释性。第3页/共55页n n二、因子分析的数学模型和相关概念二、因子分析的数学模型和相关概念二、因子分析的数学模型和相关概念二、因子分析的数学模型和相关概念n n(一)因子分析的数学模型(一)因子分析的数学模型(一)因子分析的数学
5、模型(一)因子分析的数学模型n n 因子分析的数学模型为:因子分析的数学模型为:因子分析的数学模型为:因子分析的数学模型为:n n (8.18.1)n n 写成矩阵形式为写成矩阵形式为写成矩阵形式为写成矩阵形式为 ,其中,其中,其中,其中 为原始变量向量,为原始变量向量,为原始变量向量,为原始变量向量,为公因子载荷矩阵,为公因子载荷矩阵,为公因子载荷矩阵,为公因子载荷矩阵,为公共因子,为公共因子,为公共因子,为公共因子,为特殊因子。为特殊因子。为特殊因子。为特殊因子。第4页/共55页n n(二)因子分析中的基本概念(二)因子分析中的基本概念(二)因子分析中的基本概念(二)因子分析中的基本概念n
6、 n1 1、因子的含义、因子的含义、因子的含义、因子的含义n n 因子分析法中提到两种因子:公共因子和特殊因子。因子分析法中提到两种因子:公共因子和特殊因子。因子分析法中提到两种因子:公共因子和特殊因子。因子分析法中提到两种因子:公共因子和特殊因子。n n 公共因子是每个原有变量的线性表达式中都共同出现的公共因子是每个原有变量的线性表达式中都共同出现的公共因子是每个原有变量的线性表达式中都共同出现的公共因子是每个原有变量的线性表达式中都共同出现的因子,各公因子都是均值为因子,各公因子都是均值为因子,各公因子都是均值为因子,各公因子都是均值为0 0,方差为,方差为,方差为,方差为1 1的独立正态
7、随机变的独立正态随机变的独立正态随机变的独立正态随机变量。其协方差矩阵为单位矩阵。量。其协方差矩阵为单位矩阵。量。其协方差矩阵为单位矩阵。量。其协方差矩阵为单位矩阵。n n 特殊因子表示原有变量不能被公共因子解释的部分,其特殊因子表示原有变量不能被公共因子解释的部分,其特殊因子表示原有变量不能被公共因子解释的部分,其特殊因子表示原有变量不能被公共因子解释的部分,其均值为均值为均值为均值为0 0。n n 各特殊因子之间以及特殊因子与所有公共因子之间都是各特殊因子之间以及特殊因子与所有公共因子之间都是各特殊因子之间以及特殊因子与所有公共因子之间都是各特殊因子之间以及特殊因子与所有公共因子之间都是互
8、相独立的。互相独立的。互相独立的。互相独立的。n n2 2、因子载荷、因子载荷、因子载荷、因子载荷 n n 模型中各公共因子的系数模型中各公共因子的系数模型中各公共因子的系数模型中各公共因子的系数 称为因子载荷,反映了第称为因子载荷,反映了第称为因子载荷,反映了第称为因子载荷,反映了第 个变量在第个变量在第个变量在第个变量在第 个公共因子上的相对重要性,个公共因子上的相对重要性,个公共因子上的相对重要性,个公共因子上的相对重要性,的绝的绝的绝的绝对值越大,表明对值越大,表明对值越大,表明对值越大,表明 与与与与 的相依程度越大。的相依程度越大。的相依程度越大。的相依程度越大。第5页/共55页n
9、 n3 3、变量共同度、变量共同度、变量共同度、变量共同度 n n 因子载荷矩阵中第因子载荷矩阵中第因子载荷矩阵中第因子载荷矩阵中第 行元素的平方和,称为变量行元素的平方和,称为变量行元素的平方和,称为变量行元素的平方和,称为变量 的共的共的共的共同度,即变量方差。此值越接近同度,即变量方差。此值越接近同度,即变量方差。此值越接近同度,即变量方差。此值越接近1 1,表明该变量的几乎全部,表明该变量的几乎全部,表明该变量的几乎全部,表明该变量的几乎全部原始信息都被所选择的公共因子说明了。此值接近于原始信息都被所选择的公共因子说明了。此值接近于原始信息都被所选择的公共因子说明了。此值接近于原始信息
10、都被所选择的公共因子说明了。此值接近于0 0,说,说,说,说明公共因子对明公共因子对明公共因子对明公共因子对 的影响很小,主要由特殊因子来描述。的影响很小,主要由特殊因子来描述。的影响很小,主要由特殊因子来描述。的影响很小,主要由特殊因子来描述。n n4 4、因子的方差贡献、因子的方差贡献、因子的方差贡献、因子的方差贡献 n n 因子因子因子因子 的方差贡献是因子载荷矩阵的方差贡献是因子载荷矩阵的方差贡献是因子载荷矩阵的方差贡献是因子载荷矩阵 中第中第中第中第 列元素的平列元素的平列元素的平列元素的平方和,反映了因子方和,反映了因子方和,反映了因子方和,反映了因子 对原有变量总方差的解释能力,
11、是衡对原有变量总方差的解释能力,是衡对原有变量总方差的解释能力,是衡对原有变量总方差的解释能力,是衡量公共因子相对重要性的指标。此值越大,表明相应因子量公共因子相对重要性的指标。此值越大,表明相应因子量公共因子相对重要性的指标。此值越大,表明相应因子量公共因子相对重要性的指标。此值越大,表明相应因子的重要性越高。计算出所有的指标,按其大小排序,就可的重要性越高。计算出所有的指标,按其大小排序,就可的重要性越高。计算出所有的指标,按其大小排序,就可的重要性越高。计算出所有的指标,按其大小排序,就可以提炼出最有影响的公共因子。以提炼出最有影响的公共因子。以提炼出最有影响的公共因子。以提炼出最有影响
12、的公共因子。第6页/共55页n n三、因子分析的步骤三、因子分析的步骤三、因子分析的步骤三、因子分析的步骤n n(一)因子分析的适合性检验(一)因子分析的适合性检验(一)因子分析的适合性检验(一)因子分析的适合性检验n n 1 1、相关矩阵和反映像相关矩阵、相关矩阵和反映像相关矩阵、相关矩阵和反映像相关矩阵、相关矩阵和反映像相关矩阵n n 相关矩阵中大部分相关系数都小于相关矩阵中大部分相关系数都小于相关矩阵中大部分相关系数都小于相关矩阵中大部分相关系数都小于0.30.3,那么原则上这,那么原则上这,那么原则上这,那么原则上这些数据不适合做因子分析。另外,如果反映像相关矩阵中些数据不适合做因子分
13、析。另外,如果反映像相关矩阵中些数据不适合做因子分析。另外,如果反映像相关矩阵中些数据不适合做因子分析。另外,如果反映像相关矩阵中除对角元素外,其他大多数元素的绝对值均较小,对角线除对角元素外,其他大多数元素的绝对值均较小,对角线除对角元素外,其他大多数元素的绝对值均较小,对角线除对角元素外,其他大多数元素的绝对值均较小,对角线上元素的值较接近上元素的值较接近上元素的值较接近上元素的值较接近1 1,则适合进行因子分析。,则适合进行因子分析。,则适合进行因子分析。,则适合进行因子分析。n n2 2、检验检验检验检验n n 检验统计量是用于比较变量间简单相关系数和偏检验统计量是用于比较变量间简单相
14、关系数和偏检验统计量是用于比较变量间简单相关系数和偏检验统计量是用于比较变量间简单相关系数和偏相关系数的指标,取值在相关系数的指标,取值在相关系数的指标,取值在相关系数的指标,取值在0 0和和和和1 1之间。值越接近于之间。值越接近于之间。值越接近于之间。值越接近于1 1,意味,意味,意味,意味着变量间的相关性越强,原有变量越适合做因子分析。着变量间的相关性越强,原有变量越适合做因子分析。着变量间的相关性越强,原有变量越适合做因子分析。着变量间的相关性越强,原有变量越适合做因子分析。第7页/共55页n n 3 3、巴特利特球度检验(巴特利特球度检验(巴特利特球度检验(巴特利特球度检验(Bart
15、lett test of Bartlett test of sphericity sphericity)n n 巴特利特球度检验以原有变量的相关系数矩阵为巴特利特球度检验以原有变量的相关系数矩阵为巴特利特球度检验以原有变量的相关系数矩阵为巴特利特球度检验以原有变量的相关系数矩阵为出发点,其出发点,其出发点,其出发点,其零假设是:相关矩阵为单位阵,即相关零假设是:相关矩阵为单位阵,即相关零假设是:相关矩阵为单位阵,即相关零假设是:相关矩阵为单位阵,即相关系数矩阵为对角矩阵系数矩阵为对角矩阵系数矩阵为对角矩阵系数矩阵为对角矩阵。巴特利特球度检验的检验统。巴特利特球度检验的检验统。巴特利特球度检验的
16、检验统。巴特利特球度检验的检验统计量是根据相关系数矩阵的行列式计算得到,且近计量是根据相关系数矩阵的行列式计算得到,且近计量是根据相关系数矩阵的行列式计算得到,且近计量是根据相关系数矩阵的行列式计算得到,且近似服从卡方分布。如果该统计量的观察值比较大且似服从卡方分布。如果该统计量的观察值比较大且似服从卡方分布。如果该统计量的观察值比较大且似服从卡方分布。如果该统计量的观察值比较大且相伴概率相伴概率相伴概率相伴概率 值小于或等于给定的显著性水平,则应值小于或等于给定的显著性水平,则应值小于或等于给定的显著性水平,则应值小于或等于给定的显著性水平,则应拒绝原假设;反之,如果该统计量的观察值比较小拒
17、绝原假设;反之,如果该统计量的观察值比较小拒绝原假设;反之,如果该统计量的观察值比较小拒绝原假设;反之,如果该统计量的观察值比较小且相伴概率值大于给定的显著性水平,则不应拒绝且相伴概率值大于给定的显著性水平,则不应拒绝且相伴概率值大于给定的显著性水平,则不应拒绝且相伴概率值大于给定的显著性水平,则不应拒绝原假设。原假设。原假设。原假设。第8页/共55页n n(二)因子提取和因子载荷矩阵的求解(二)因子提取和因子载荷矩阵的求解(二)因子提取和因子载荷矩阵的求解(二)因子提取和因子载荷矩阵的求解n n 因子分析的关键是根据样本数据求解因子载荷矩阵,因子分析的关键是根据样本数据求解因子载荷矩阵,因子
18、分析的关键是根据样本数据求解因子载荷矩阵,因子分析的关键是根据样本数据求解因子载荷矩阵,SPSSSPSS提供了提供了提供了提供了7 7种提取因子的方法,其中占主要地位且使用种提取因子的方法,其中占主要地位且使用种提取因子的方法,其中占主要地位且使用种提取因子的方法,其中占主要地位且使用最为广泛的是主成分分析法。最为广泛的是主成分分析法。最为广泛的是主成分分析法。最为广泛的是主成分分析法。n n 因子提取通常有以下三种方法:(因子提取通常有以下三种方法:(因子提取通常有以下三种方法:(因子提取通常有以下三种方法:(1 1)特征值准则,即取)特征值准则,即取)特征值准则,即取)特征值准则,即取特征
19、值大于等于特征值大于等于特征值大于等于特征值大于等于1 1的主成分作为初始因子,放弃特征值小于的主成分作为初始因子,放弃特征值小于的主成分作为初始因子,放弃特征值小于的主成分作为初始因子,放弃特征值小于1 1的主成分。(的主成分。(的主成分。(的主成分。(2 2)累积方差贡献率,因子累积解释的方差)累积方差贡献率,因子累积解释的方差)累积方差贡献率,因子累积解释的方差)累积方差贡献率,因子累积解释的方差比例也是确定因子个数时可以参考的指标,一般应达到比例也是确定因子个数时可以参考的指标,一般应达到比例也是确定因子个数时可以参考的指标,一般应达到比例也是确定因子个数时可以参考的指标,一般应达到7
20、0%-85%70%-85%或以上。(或以上。(或以上。(或以上。(3 3)碎石检验准则,按照因子被提取的)碎石检验准则,按照因子被提取的)碎石检验准则,按照因子被提取的)碎石检验准则,按照因子被提取的顺序,画出因子的特征值随因子个数变化的散点图,图形顺序,画出因子的特征值随因子个数变化的散点图,图形顺序,画出因子的特征值随因子个数变化的散点图,图形顺序,画出因子的特征值随因子个数变化的散点图,图形由陡变平,曲线开始变平的前一个点被认为是提取的最大由陡变平,曲线开始变平的前一个点被认为是提取的最大由陡变平,曲线开始变平的前一个点被认为是提取的最大由陡变平,曲线开始变平的前一个点被认为是提取的最大
21、因子数。因子数。因子数。因子数。第9页/共55页n n(三)因子命名(三)因子命名(三)因子命名(三)因子命名n n 在因子分析模型中,公共因子与因子载荷阵的解不是唯在因子分析模型中,公共因子与因子载荷阵的解不是唯在因子分析模型中,公共因子与因子载荷阵的解不是唯在因子分析模型中,公共因子与因子载荷阵的解不是唯一的。因子分析的目的不仅是找出主因子,更重要的是知一的。因子分析的目的不仅是找出主因子,更重要的是知一的。因子分析的目的不仅是找出主因子,更重要的是知一的。因子分析的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以利于对公共因子命名和解释结果,道每个主因子的意义,以利于对公共因子命
22、名和解释结果,道每个主因子的意义,以利于对公共因子命名和解释结果,道每个主因子的意义,以利于对公共因子命名和解释结果,便于进一步的分析。若每个公共因子的涵义不清,难以找便于进一步的分析。若每个公共因子的涵义不清,难以找便于进一步的分析。若每个公共因子的涵义不清,难以找便于进一步的分析。若每个公共因子的涵义不清,难以找到合理的解释,可对因子载荷矩阵实行旋转,使每个变量到合理的解释,可对因子载荷矩阵实行旋转,使每个变量到合理的解释,可对因子载荷矩阵实行旋转,使每个变量到合理的解释,可对因子载荷矩阵实行旋转,使每个变量仅在一个公共因子上有较大的载荷,而在其他公共因子上仅在一个公共因子上有较大的载荷,
23、而在其他公共因子上仅在一个公共因子上有较大的载荷,而在其他公共因子上仅在一个公共因子上有较大的载荷,而在其他公共因子上的载荷较小。的载荷较小。的载荷较小。的载荷较小。n n SPSSSPSS中有中有中有中有5 5种因子旋转的方式可供选择:种因子旋转的方式可供选择:种因子旋转的方式可供选择:种因子旋转的方式可供选择:VarimaxVarimax选项,选项,选项,选项,方差最大旋转;方差最大旋转;方差最大旋转;方差最大旋转;Direct Oblimin Direct Oblimin 选项,直接斜交旋转;选项,直接斜交旋转;选项,直接斜交旋转;选项,直接斜交旋转;Quartimax Quartima
24、x 选项,四次最大正交旋转;选项,四次最大正交旋转;选项,四次最大正交旋转;选项,四次最大正交旋转;Equamax Equamax 选项,平选项,平选项,平选项,平均正交旋转;均正交旋转;均正交旋转;均正交旋转;Promax Promax 选项,斜交旋转方法。选项,斜交旋转方法。选项,斜交旋转方法。选项,斜交旋转方法。第10页/共55页n n(四)计算因子得分,然后将它们用于各种进一步的分析(四)计算因子得分,然后将它们用于各种进一步的分析(四)计算因子得分,然后将它们用于各种进一步的分析(四)计算因子得分,然后将它们用于各种进一步的分析中中中中n n 当因子确定以后,便可以计算各因子在每个样
25、本上的具当因子确定以后,便可以计算各因子在每个样本上的具当因子确定以后,便可以计算各因子在每个样本上的具当因子确定以后,便可以计算各因子在每个样本上的具体数值,这些数值称为因子得分,形成的变量称为因子变体数值,这些数值称为因子得分,形成的变量称为因子变体数值,这些数值称为因子得分,形成的变量称为因子变体数值,这些数值称为因子得分,形成的变量称为因子变量。于是在以后的分析中就可以因子变量代替原有变量进量。于是在以后的分析中就可以因子变量代替原有变量进量。于是在以后的分析中就可以因子变量代替原有变量进量。于是在以后的分析中就可以因子变量代替原有变量进行数据建模,或者利用因子变量对样本进行分类或评价
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 聚类分析
限制150内