实验四 回归分析SAS过程(1).doc
《实验四 回归分析SAS过程(1).doc》由会员分享,可在线阅读,更多相关《实验四 回归分析SAS过程(1).doc(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流实验四 回归分析SAS过程(1).精品文档.课时授课计划课次序号: 10 一、课题:实验四 回归分析SAS过程(1)统计推断与预测二、课型:上机实验三、目的要求:1. 掌握利用SAS建立多元回归方程的方法;2. 能检验所建立回归方程的显著性与方程系数的显著性,能根据实际问题作预测与控制.四、教学重点:会对实际数据建立有效的多元回归模型;能对回归模型进行运用,对实际问题进行预测或控制.教学难点:多元回归模型的建立.五、教学方法及手段:传统教学与上机实验相结合六、参考资料:应用多元统计分析,高惠璇编,北京大学出版社,2005;使用统计方法与SAS
2、系统,高惠璇编,北京大学出版社,2001;多元统计分析(二版),何晓群编,中国人民大学出版社,2008;应用回归分析(二版),何晓群编,中国人民大学出版社,2007;统计建模与R软件,薛毅编著,清华大学出版社,2007.七、作业:2.3(单) 2.4 八、授课记录:授课日期班次九、授课效果分析:实验四 回归分析SAS过程(1)2学时一、实验目的和要求掌握利用SAS建立多元回归方程的方法,掌握PROC REG过程,并能检验所建立回归方程的显著性与方程系数的显著性,能根据实际问题作预测与控制二、实验内容1. PROC REG过程一般格式:PROC REG ;MODEL 因变量=回归变量/ ;其它选
3、择语句 ;OUTPUT OUT=SAS数据集名 关键字名=输出数据集中的变量名;RUN;(1)PROC REG语句此语句是PROC REG过程的必需语句,指出要进行分析的数据集省略此项,SAS系统对最新建立的数据集进行分析(2)MODEL语句中的选项部分该语句定义建模用的因变量、回归变量(自变量)、模型的选择及拟合结果输出的选择在关键词“Model”之后,应指明因变量,等号后依次列出回归变量,每个变量间用空格分开此语句的选项部分提供了最优模型的选择方法和其他拟合结果的输出选项,其中包括:1) 选择合适的建立模型方法:SELECTION=name其中“name”可以是FORWARD(或F)、BA
4、CKWARD(或B)、STEPWISE、RSQUARE、ADJRSQ、CP等之一l SELECTION=FORWARD SLENTRY=显著性水平向前选择最优模型法(FORWARD):从仅含常数项的回归模型开始,逐个加入自变量,对每一个尚不在方程内的自变量按一定显著性水平,根据其一旦进入模型后对模型的贡献大小逐步引入方程,直至再没有对模型有显著贡献的自变量“SLENTRY=显著性水平”为自变量进入模型的控制水平,写在选择方法语句之后若省去此句,则SAS系统默认的水平为SLENTRY=0.05l SELECTION=BACKWARD SLSTAY=显著性水平向后删除法(BACKWARD):先建立
5、包含全部自变量的线性回归模型,然后按一定的显著性水平从模型中逐步剔除变量缺省SLSTAY =0.1l SELECTION=STEPWISE SLENTRY =入选水平 SLSTAY=剔除水平逐步回归法(STEPWISE):按向前选择法(前进法)进入变量,再对模型内所有变量检验,看是否有因新变量引入而对模型的贡献变得不显著,若有就剔除,若无则保留,直至方程内所有变量均显著逐步法有两个控制水平,即选入水平(SLENTRY=入选水平)和剔除水平(SLSTAY=剔除水平),而且剔除水平应低于选入水平缺省SLENTRY =0.15 SLSTAY =0.15l SELECTION=RSQUARE在所有可能
6、的回归方程中用 准则选择最优模型的方法在每一个给定的自变量个数的水平上,打印出使达到最大的那个回归模型的拟合结果l SELECTION=ADJRSQ:修订的准则选择最优模型法l SELECTION=CP:准则选择最优模型法注意:以上方法只可在选项部分写出其中一种,不可并用2)对模型选取细节的选项l DETAILS:对模型选取方法FORWARD、BACKWARD、STEPWISE,若打印出每一步引入和删除自变量及相关信息选用此项如一个自变量选入模型时的偏F值、模型的值和一个自变量被剔除时模型值及有关参数估计的信息l NOINT:取消回归模型的常数项,即拟合过原点的回归方程3)对估计细节内容的选择
7、:在选项部分,还可以选择一个或多个(中间用空格分开)参数估计和拟合残差等相关内容,常用的有:l CORRB:输出参数估计的相关系数矩阵,第行第列为与相关系数估计l COVB:输出估计参数的协方差矩阵,即MSE(XTX)-1l P:输出因变量拟合值、观测值、拟合残差若已选CLI、CLM、R,无需该选项l R:输出有关残差及用于影响性分析的各量,包括拟合值的标准差、残差、学生化残差(残差除以标准差)及Cook距离(度量了当删除某观测值后,参数估计的总变化量)l I:输出矩阵输出形式为注意:以上选择内容可以和最优模型选择方法并用于Model语句的“选项部分”对BACKWARD、FORWARD、STE
8、PWISE的模型选择方法,以上估计细节内容只是最终选择模型的相应结果;对RSQUARE准则,只给出全模型的相应结果;对于ADJRSQ和CP方法,给出具有最大和值的模型的相应结果(3)OUTPUT语句建立SAS的输出结果数据集此语句建立一个与估计内容有关的SAS数据集语句格式为:OUTPUT OUT=SAS数据集名 关键字名=输出数据集中的变量名;l 关键字名为需要的统计量名,它们有PREDICTED(或P)=name:因变量拟合值,指定名称为name;RESIDUAL(或R)=name:残差及指定的名称;STUDENT=name:标准化(或学生化)残差;L95M=name:因变量期望值的95%
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验四 回归分析SAS过程1 实验 回归 分析 SAS 过程
限制150内