多元统计的应用主成分分析.ppt
《多元统计的应用主成分分析.ppt》由会员分享,可在线阅读,更多相关《多元统计的应用主成分分析.ppt(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元统计的应用主成分分析现在学习的是第1页,共23页 多元统计分析中由于变量较多,增加了分析多元统计分析中由于变量较多,增加了分析问题的复杂性。实际问题中,变量之间可能存在一定的问题的复杂性。实际问题中,变量之间可能存在一定的相关性,因此,多变量中可能存在信息的重叠。人们希相关性,因此,多变量中可能存在信息的重叠。人们希望通过克服相关性、重叠性,用较少的变量来代替原来望通过克服相关性、重叠性,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部较多的变量,而这种代替可以反映原来多个变量的大部分信息,这实际上是一种分信息,这实际上是一种“降维降维”的思想。的思想。一般说来,在主
2、成分分析适用的场合,用较少的一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;因此,通过主成量,就得到一个更低维的随机向量;因此,通过主成分既可以降低数据分既可以降低数据“维数维数”又保留了原数据的大部分又保留了原数据的大部分信息。信息。现在学习的是第2页,共23页 主成分分析也称主分量分析,由主成分分析也称主分量分析,由Hotelling(1933)首先提出。由于多个变量之间往往存在着一首先提出。由于多个变量之间往往存在着一定程度的相关性,希望通过线性组合的方式,从大定程度的相
3、关性,希望通过线性组合的方式,从大量指标中尽可能快地提取信息。当第一个线性组合量指标中尽可能快地提取信息。当第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个快速提取的过程,继续这个快速提取的过程,直到所提取的信息,直到所提取的信息与原指标相差不多时为止。与原指标相差不多时为止。主成分分析的数学模型是,设主成分分析的数学模型是,设p个变量个变量构成的构成的p维随机向量为维随机向量为X=(X1,Xp)。对。对X作正交作正交变换,令变换,令Y=TX,其中,其中T为正交阵,要求为正交阵,要求Y的各分量不相的各分量不相关,并且关,并且Y的第一
4、个分量的方差是最大的,第二个分量的的第一个分量的方差是最大的,第二个分量的方差次之,方差次之,为了保持信息不丢失,为了保持信息不丢失,Y的各分量方的各分量方差和与差和与X的各分量方差和相等。的各分量方差和相等。现在学习的是第3页,共23页主成分的数学推导主成分的数学推导现在学习的是第4页,共23页现在学习的是第5页,共23页现在学习的是第6页,共23页现在学习的是第7页,共23页现在学习的是第8页,共23页现在学习的是第9页,共23页现在学习的是第10页,共23页 主成分的一般性质 现在学习的是第11页,共23页现在学习的是第12页,共23页现在学习的是第13页,共23页现在学习的是第14页,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计 应用 成分 分析
限制150内