(精品)数学建模:主成分分析.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《(精品)数学建模:主成分分析.ppt》由会员分享,可在线阅读,更多相关《(精品)数学建模:主成分分析.ppt(76页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、主成分分析主成分分析Principal component analysis主成分分析的基本思想主成分分析的基本思想主成分数学模型与几何解释主成分数学模型与几何解释主成分的推导主成分的推导主成分分析的应用主成分分析的应用主成分回归主成分回归主成分分析,是一种通过主成分分析,是一种通过降维降维来简化数据结构的方法:来简化数据结构的方法:把把多个多个变量化为变量化为少数少数几个综合变量(综合指标)几个综合变量(综合指标),而而这这几几个个综综合合变变量量可可以以反反映映原原来来多多个个变变量量的的大大部部分分信信息息,(85%85%以以上上),所所含含的的信信息息又又互互不不重重叠叠,即即各各个个
2、指指标它们之间要相互标它们之间要相互独立独立,互不相关互不相关。主成分分析主要起着主成分分析主要起着降维降维和和简化数据结构简化数据结构的作用。的作用。这些综合变量就叫这些综合变量就叫因子因子或或主成分主成分,它是不可观测的,它是不可观测的,即它不是具体的变量即它不是具体的变量,只是几个指标的只是几个指标的综合综合。1 基本思想例:小学各科成绩的例:小学各科成绩的评估评估可以用下面的可以用下面的综合综合成绩来成绩来体现:体现:a1a1语文语文a2a2数学数学a3a3自然自然a4a4社会科学社会科学 确定权重系数的过程就可以看作是确定权重系数的过程就可以看作是主成分主成分分分析的过程,得到的加权
3、成绩总和就相对于析的过程,得到的加权成绩总和就相对于新的综新的综合变量合变量主成分主成分 主成分分析法是一种常用的基于变量主成分分析法是一种常用的基于变量协方差矩阵协方差矩阵对信息进行处理、压缩和抽提的有效方法。对信息进行处理、压缩和抽提的有效方法。为什么要根据方差确定主成分?为什么要根据方差确定主成分?情形情形II II下总分的方差为下总分的方差为0 0,显然不能反映三个学生各,显然不能反映三个学生各科成绩各有所长的实际情形,而科成绩各有所长的实际情形,而红色红色标记的变量对应标记的变量对应的方差最大,可反映原始数据的大部分信息的方差最大,可反映原始数据的大部分信息对对主成分的要求主成分的要
4、求 上例可见,用上例可见,用总分总分 有时可以反映原分数表的情况,保留原有信息;有时可以反映原分数表的情况,保留原有信息;有时则把信息丢尽,不能反映原理的情况和差异。有时则把信息丢尽,不能反映原理的情况和差异。根据总分所对应的根据总分所对应的方差方差可以确定其代表了多大可以确定其代表了多大 比例的原始数据(分数)信息。比例的原始数据(分数)信息。一般来说,我们希望能用一个或少数几个综合指一般来说,我们希望能用一个或少数几个综合指标(分数)来标(分数)来代替代替原来分数表做统计分析,而且希原来分数表做统计分析,而且希望新的综合指标能够尽可能地保留原有信息,并具望新的综合指标能够尽可能地保留原有信
5、息,并具有有最大的方差。最大的方差。2 2 数学模型与几何解释数学模型与几何解释 假设我们所讨论的实际问题中,有假设我们所讨论的实际问题中,有p p个指标,个指标,我们把这我们把这p p个指标看作个指标看作p p个随机变量,记为个随机变量,记为X1,X2,Xp,主成分分析就是要把这主成分分析就是要把这p p个指标的问题,转变为讨论个指标的问题,转变为讨论 m m 个新个新的指标的指标F1,F2,Fm (m|t|Intercept x1X2x31111-10.12799-0.051400.586950.286851.212160.070280.094620.10221-8.36-0.73 6.2
6、02.810.0001 0.48830.00040.0263Parameter EstimatesDependent Mean 21.89091R-Square0.9919Root MSE 0.48887Adj R-Sq0.9884Summary of FitF1F2F3x1X2x30.70630.04350.7065-0.03570.9990-0.02580.70700.0070-0.7072EigenvectorsEigenvalueDifference ProportionCumulativePCR1PCR2PCR31.9992 0.99820.00261.00100.99550.666
7、4 0.3327 0.00090.6664 0.99911.0000Eigenvalues of the Correlation MatrixF1=0.7063x1+0.0435x2+0.7065x3F2=-0.0357x1+0.9990 x2-0.0258x3 Obs x1 x2 x3 y*F1 F2 F3 1 -1.50972 0.54571 -1.53319 -1.31852 -2.12589 0.63866 0.020722 2 -1.11305 0.48507 -1.20848 -1.20848 -1.61893 0.55554 0.071113 3 -0.76971 -0.1212
8、7 -0.80140 -0.63625 -1.11517 -0.07298 0.021730 4 -0.63637 -0.12127 -0.62209 -0.61424 -0.89430 -0.08237 -0.010813 5 -0.45970 -1.33395 -0.37008 -0.68027 -0.64421 -1.30669 -0.072582 6 -0.12970 -0.66697 -0.09869 -0.32813 -0.19035 -0.65915 -0.026553 7 0.25031 -0.72761 0.30355 0.17807 0.35962 -0.74367 -0.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精品 数学 建模 成分 分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内