2022年SAS主成分分析实例 .pdf





《2022年SAS主成分分析实例 .pdf》由会员分享,可在线阅读,更多相关《2022年SAS主成分分析实例 .pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、王笑(孝)权安徽省五河县临北乡石家村卫生室233316 主成分分析又称主分量、主轴分析, 实质就是对较多的变量在尽量保存原信息的情况下加以线性概括。在此过程前,为消除变量量纲不同造成的影响,首先要对各原始指标进行标准化处理。迄今为止,所见教材的 “ 主成分分析 ” 实质都是用求得主成分再对原始变量的回归分析。教材的通病都是未详细说明最后的回归过程,往往令初学者感觉到莫名其妙。目前,由网上的一些所谓的“ 主成分分析 ” 可知,或者其资料不适用主成分分析,还有根本就不是主成分分析。有鉴于此,现利用网上获得的数据,进行主成分分析的探讨。1 资料与方法1.1 资料来源资料来源于中华人民共和国卫生部网站
2、1 ,我国 “ 2006年工业部门职业病发病及死亡情况 ” ,剔除其中的第1、2、14 号无意义指标,以及末尾的观测“ 其它 ” ,剩余 11 个指标,观测值有缺失则用 0 补齐。程序分别赋这些指标为x1-x11, 其名称标签见附件1;余详见数据1。数据 1 2006 年工业部门职业病发病及死亡情况相关数据name x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 煤炭4567 212 41 0 34 0 13 0 1 57 0 石油2 4 1 0 14 0 0 1 0 14 0 电力110 1 1 0 28 1 0 1 1 16 1 核工业0 0 0 0 0 0 0 0
3、0 3 0 冶金494 65 40 2 159 0 0 3 5 24 11 有色金属1193 120 38 4 190 11 0 7 2 38 1 333 13 34 1 84 5 0 29 33 50 1 电子7 0 14 3 120 0 0 51 13 3 0 兵器7 0 4 0 22 0 0 0 113 6 0 船舶18 0 1 0 1 1 0 0 0 2 0 化工103 2 105 3 62 2 0 89 170 24 4 医药5 0 8 0 15 0 1 19 8 1 0 铁道64 6 2 0 2 1 0 1 0 4 1 交通61 1 6 0 14 3 0 6 6 8 0 建材698
4、 17 6 0 5 1 0 10 3 20 0 建设126 1 23 8 1 3 0 5 2 3 1 地质矿产253 3 1 0 4 0 0 1 0 0 0 水利2 17 0 0 0 0 0 0 0 0 0 农业23 0 2 0 0 22 5 0 1 0 0 森林工业2 0 1 0 0 0 1 1 1 0 0 轻工189 16 101 3 294 10 12 32 4 21 3 纺织20 2 12 0 12 1 1 4 2 36 1 航空航天1 0 0 0 1 0 0 5 0 4 0 商业11 0 2 0 0 3 1 2 0 2 0 邮电2 0 1 1 0 0 0 0 0 0 0 石化工业9
5、1 5 0 6 0 0 1 1 2 0 回收加工业0 0 2 2 0 0 0 0 0 0 0 1.2 方法 将数据 1 倒入 SAS9.1逻辑库 sasuser 后调用,程序默认对原始数据标准化后进行主成分分析。根据观察的需要对初步运行后的输出数据编程带入,以了解更多内容(见附件1) 。2 结果输出结果表明:各个主成分贡献率没有出奇的大,本资料适用于主成分分析;且前4 个主成分累计贡名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 4 页 - - - - - - - - -
6、 献率达到0.8112 ,每个的特征值都1,符合一般主成分个数选取标准,可以选取4 个主成分,见输出 1。输出 1 相关矩阵的前5 个特征值、贡献率Eigenvalues of the Correlation Matrix Eigenvalue Difference Proportion Cumulative 1 4.06190493 1.52600842 0.3693 0.3693 2 2.53589652 1.22097809 0.2305 0.5998 3 1.31491843 0.30397616 0.1195 0.7193 4 1.01094226 0.29815144 0.0919
7、 0.8112 3 讨论各主成分与标准化变量的相关系数说明了主成分被这些指标影响的强度,由rz1x可见:各标准化指标与 z1 均成正相关,由于主成分1 受 x2-x5 、x7、x10 支配可以理解z1 是产生急性、严重职业病的综合指标,可能是毒性强, 、浓度高的有害物质迅速导致工作人员发病、呼吸道损害、中毒乃至死亡;z2 其实与 z1 是对立性综合指标,反映低浓度生产、生活环境下的慢性损害,x1 支配 rz2x 表明随着环境有毒物质浓度降低,呼吸道损害下降,但是这种相对较好一点的有毒环境仍然避免不掉会损害人的皮肤、眼睛等防护薄弱地方;x6 与 x7 各自单独支配主成分z3 (见 rz3x) 、
8、z4 (见 rz4x) ,它们表达的是与 z1、z2 完全不同的信息,z3 不是环境毒害物质造成的,实际是长期暴露在某种场合,防护不当的后果; z4 是环境有害因素慢性长期作用人体,损害人体的免疫系统、导致免疫监视混乱,丧失杀死、清除机体内的异变细胞功能。标准化变量与主成分的详细关系见输出2。输出 2 主成分与准化指标的相关系数name rz1x rz2x rz3x rz4x x1 0.59571 -0.71288 -0.28574 0.03795 x2 0.66688 -0.65136 -0.16550 -0.13085 x3 0.88486 0.38006 -0.01818 0.09209
9、 x4 0.44039 0.40563 0.29572 -0.25224 x5 0.76708 0.21593 0.36782 -0.19094 x6 0.31194 0.00883 0.72194 0.43830 x7 0.64136 -0.46250 0.21209 0.33249 x8 0.50534 0.68292 -0.25476 0.28210 x9 0.30490 0.60786 -0.53243 0.33055 x10 0.75893 -0.29938 -0.26026 -0.04144 x11 0.51384 0.32915 0.02268 -0.62498 在实际工作中,要
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年SAS主成分分析实例 2022 SAS 成分 分析 实例

限制150内