最新多元分析SAS上机实验修改PPT课件.ppt
进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。记想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。记忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着“怎么这么热怎么这么热”,于是三,于是三五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到“强子,别跑强子,别跑了,快来我给你扇扇了,快来我给你扇扇”。孩子们才不听这一套,跑个没完,直到累气喘吁吁,。孩子们才不听这一套,跑个没完,直到累气喘吁吁,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,“你你看热的,跑什么?看热的,跑什么?”此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲的味道!蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材的味道!蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧道,袅道,袅2022-8-102Y0102030405060708090100110120130140150X0102030405060702022-8-109多元线性回归多元线性回归上机实验上机实验2. 例例1.2 P25data lreg07;input x1 x2 y ;cards;1.37 9.08 4.93 11.34 1.89 1.86 9.673.06 2.33 0.76 10.2 5.78 17.67 0.050.06 15.91 0.73 0.43 15.74 1.03 0.875.41 6.25 3.86 5.4 6.3 .;symbol i=rl v=star;/*(symbol 为绘图设置语句为绘图设置语句*/* i=rl 要求画回归直线要求画回归直线*/*v=star 要求用星号表示点)要求用星号表示点)*/2022-8-1010proc gplot;plot y*x1;/*(要求画回归直线及点(要求画回归直线及点x1,y)*/proc reg;model y=x1/xpx i;run;/*(要求建立一元线性回归方程并作检验)(要求建立一元线性回归方程并作检验)*/ proc gplot;plot y*x2;proc reg;model y=x2;run;proc reg; model y=x1 x2/alpha=0.01 cli;run;/*(要求建立二元线性回归方程(要求建立二元线性回归方程 并作检验及回报与预报)并作检验及回报与预报)*/2022-8-1011Y0123456X1024681012141618Y0123456X2012345678910 112022-8-1012Y=5.621170 - 0.319113*X1;F=494.064;ProbF为为0.0001;R-square=0.9880;Y=0.363778 + 0.532975*X2;F=279.602; ProbF为为0.0001;R-square=0.9790;Y=3.610506 - 0.198281*X1 + 0.206755*X2;F=392.516; ProbF为为0.0001;R-square=0.9937;2022-8-1013Model Crossproducts XX XY YYXX INTERCEP X1 X2 YINTERCEP 8 77.87 32.29 20.12X1 77.87 1066.9317 33.7369 97.2483X2 32.29 133.7369 40.0809 139.7036Y 20.12 97.2483 139.7036 82.4468 XX Inverse, Parameter Estimates, and SSE INTERCEP X1 X2 YINTERCEP 22.8232 -1.3771 2.3025 3.6105X1 -1.3771 0.0841 0.1384 -0.1983X2 -2.3025 0.1384 0.2368 0.2068Y 3.6105 -0.1983 0.2068 0.20152022-8-1014 Analysis of Variance Sum of MeanSource DF Squares Square F Value Prob FModel 2 31.64346 15.82173 392.516 0.0001Error 5 0.20154 0.04031C Total 7 31.84500Root MSE 0.20077 R-square 0.9937Dep Mean 2.51500 Adj R-sq 0.9911C.V. 7.98289 1)1(*:222 pnRpRRqsRjdA2022-8-1015 Dep Var Predict Std Err Lower95% Upper95%Obs Y Value Predict Predict Predict Residual 1 4.9300 5.2162 0.120 4.6150 5.8174 -0.2862 2 1.8600 1.7528 0.139 1.1252 2.3803 0.1072 3 2.3300 2.3258 0.122 1.7221 2.9295 0.00420 4 5.7800 5.5687 0.154 4.9188 6.2186 0.2113 5 0.0600 0.1172 0.132 -0.4998 0.7343 -0.0572 6 0.4300 0.6068 0.104 0.0251 1.1884 -0.1768 7 0.8700 0.7025 0.110 0.1137 1.2914 0.1675 8 3.8600 3.8300 0.092 3.2626 4.3974 0.0300 9 . 3.8423 0.090 3.2763 4.4084 . 观测值观测值 预测值预测值 标准误标准误 95%置信下限与上限置信下限与上限 残差(剩余)残差(剩余)2022-8-1016例例1.4 逐步回归逐步回归data ex; input x1-x4 y ;cards;9.2 2.73 1.47 1.14 1.16 9.1 3.73 1.82 0.83 1.15 8.6 4.88 1.83 2.13 1.84 10.23 3.97 1.59 1.35 1.36 5.6 3.73 1.84 1.82 0.86 5.37 4.24 1.87 1.35 0.9 6.13 3.15 1.99 1.65 0.12 8.2 4.65 1.62 4.57 0.9 8.8 4.38 1.54 2.07 1.93 7.6 3.86 1.6 2.42 1.1 9.7 4.38 1.69 1.52 1.4 8.37 5.1 1.81 2.28 1.76 12.17 4.9 1.73 1.58 1.64 10.27 3.73 1.61 1.2 1.47 8.9 4.47 1.88 0.8 0.92 8.23 5.28 1.7 3.07 1.5;proc reg;model y=x1-x4/selection=rsquare b;model y=x1-x4/selection=rsquare adjrsq cp AIC MSE SSE collinoint;run;proc reg;model y=x1-x4/selection=stepwise sle=0.3 sls=0.2; run; / * sls is the level spcified by user*/SLS=0.2定义剔除时的概率水平为0.2,SLE=0.3定义选入时的概率水平为0.32022-8-1017例例1.4 共线性诊断共线性诊断data ex; input x1-x4 y ; x5=int(x2+x3+x4)*90)/90;cards;9.2 2.73 1.47 1.14 1.16 9.1 3.73 1.82 0.83 1.15 8.6 4.88 1.83 2.13 1.84 10.23 3.97 1.59 1.35 1.36 5.6 3.73 1.84 1.82 0.86 5.37 4.24 1.87 1.35 0.9 6.13 3.15 1.99 1.65 0.12 8.2 4.65 1.62 4.57 0.9 8.8 4.38 1.54 2.07 1.93 7.6 3.86 1.6 2.42 1.1 9.7 4.38 1.69 1.52 1.4 8.37 5.1 1.81 2.28 1.76 12.17 4.9 1.73 1.58 1.64 10.27 3.73 1.61 1.2 1.47 8.9 4.47 1.88 0.8 0.92 8.23 5.28 1.7 3.07 1.5;proc reg data=ex;model y=x1-x5/vif collinoint;run;2022-8-1018Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr F Model 5 2.55497 0.51099 8.03 0.0028 Error 10 0.63672 0.06367 Corrected Total 15 3.19169 Root MSE 0.25233 R-Square 0.8005 Dependent Mean 1.25063 Adj R-Sq 0.7008 Coeff Var 20.17663Parameter Estimates Parameter Standard Variance Variable DF Estimate Error t Value Pr |t| Inflation Intercept 1 2.82510 1.33994 2.11 0.0612 0 x1 1 0.02693 0.06221 0.43 0.6743 2.85303 x2 1 -27.00023 25.70336 -1.05 0.3182 76421 x3 1 -29.73236 25.68616 -1.16 0.2740 3263.98863 x4 1 -27.81537 25.68282 -1.08 0.3042 137920 x5 1 27.58457 25.69586 1.07 0.3083 3083662022-8-1019Collinearity Diagnostics (intercept adjusted) Condition Number Eigenvalue Index 1 2.45588 1.00000 2 1.48451 1.28621 3 0.89498 1.65652 4 0.16462 3.86241 5 0.00000190 1136.53374 Collinearity Diagnostics (intercept adjusted) -Proportion of Variation- Number x1 x2 x3 x4 x5 1 0.00003290 0.00000152 5.048667E-9 9.142109E-7 5.357538E-7 2 0.12042 2.478475E-8 0.00010018 2.93515E-10 3.689766E-9 3 0.08670 0.00000409 0.00009168 0.00000187 1.28582E-10 4 0.57141 0.00002290 0.00044762 0.00000866 1.232986E-7 5 0.22144 0.99997 0.99936 0.99999 1.000002022-8-1020从方差膨胀因子分析可知:x2-x5有很严重共线性;从特征值看,第5个特征值接近于0,且条件指数也非常大,所以,有非常严重的共线性从方差比值看,x2-x5之间有非常大的共线性关系习题:完成书上的练习习题:完成书上的练习1,22022-8-1021为为方方阵阵另另外外numberconditiononBounds为为最最大大的的的的界界线线的的条条件件数数11, pkXX 可可度度量量条条件件数数为为最最小小的的特特征征根根特特征征根根kp, 用用来来判判断断复复共共线线性性的的特特征征根根的的散散布布程程度度 ,XX 标标准准是是度度是是否否存存在在以以及及严严重重的的程程,32.4)1016(03997102.041267647.04 元元方方程程为为;,1000认认为为无无复复共共线线性性 k;,1000100认认为为有有较较强强的的复复共共线线性性 k认认为为有有严严重重的的复复共共线线性性,1000 k22 结束语结束语