SAS推断分析程序.doc
《SAS推断分析程序.doc》由会员分享,可在线阅读,更多相关《SAS推断分析程序.doc(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、如有侵权,请联系网站删除,仅供学习与交流SAS推断分析程序【精品文档】第 12 页SAS/多元推断分析过程 一、多元相关分析基本语句Proc corr option;VAR 变量名;WITH变量名;PARTIAL变量名;WEIGHT变量名;BY变量名; Proc corr是分析相关系数的基本命令。Option选项如下:DATA=SAS数据集,指定分析的数据集。PEARSON,分析皮尔逊相关系数。SPEARMAN,分析斯皮尔曼相关系数。NOSIMPLE,不输出各变量的描述统计量。NOPROB,不输出相关系数检验的P值。COV,输出协方差矩阵。OUTP= SAS数据集,把皮尔逊相关系数储存到SAS
2、数据集。OUTS =SAS数据集,把斯皮尔曼相关系数储存到SAS数据集。VAR变量名,指定分析相关系数的变量。WITH变量名,计算PARTIAL变量名,计算PARTIAL指定的变量固定不变时,WITH指定的变量与VAR指定的变量之间的偏相关系数。WEIGHT变量名,计算加权相关系数,把权数定义为行变量。BY变量名,以BY指定的变量为基准,计算VAR指定的变量之间的相关系数。例 为了研究四川经济增长的影响因素,欲建立四川省经济增长模型。主要经济指标采用国内生产总值增长率(x1),投资指标资本形成总额增长率(X2),人口指标用自然增长率(X3),就业指标失业率(X4)和就业率(X6)和消费指标居民
3、消费水平增长率(X5)。分析指标之间的关系。data a;input x1-x6;cards;数据行省略proc corr nosimpl cov;var x1;with x2 x3 x5;partial x4;run;The CORR Procedure(相关分析过程) 1 Partial Variables: x4 3 With Variables: x2 x3 x5 1 Variables: x1 Partial Covariance Matrix, DF = 19 x1 x2 57.84155774 x3 4.50195351 x5 53.16274206 Pearson Partia
4、l Correlation Coefficients, N = 21 Prob |r| under H0: Partial Rho=0 x1 x2 0.88628 .0001 x3 0.26475 0.2593 x5 0.96317 F Wilks Lambda 0.54561620 6.87 4 33 0.0004 Pillais Trace 0.45438380 6.87 4 33 0.0004 Hotelling-Lawley Trace 0.83279015 6.87 4 33 0.0004 Roys Greatest Root 0.83279015 6.87 4 33 0.00042
5、、成对总体均值检验我们在现实中经常遇到两个总体是相关的测量结果的比较,比如,考察同一组人在参加一年的长跑锻炼前后的心率有无显著差异。这时,每个人一年前的心率和一年后的心率是相关的,心率本来较快的人锻炼后仍相对于其它人较快。所以,检验这样的成对总体的均值不能使用两样本t检验的方法,因为独立性条件不再满足。这时,我们可以检验两个变量间的差值的均值是否为零,这等价于检验两组测量值的平均水平有无显著差异。在SAS/STAT8.0以上的版本,成对样本均值差异性的检验,不需要做两成对样本的观测值之差,直接可以得到结果。基本语句:proc ttest 选项;class 变量名;var 变量名;paired
6、样本1的变量名*样本2的变量名;run;例 对电器组装车间研究引入新的组装方法后,单位时间内工人的组装数量是否有显著性提高。于是从组装线上随机抽调了15个工人,进行了一个月的培训,研究该成对样本的数据是否有显著性差异。data a;input worker x1 x2 ;cards;1 34 33 2 28 36 3 29 50 4 45 41 5 26 37 6 27 417 24 39 8 15 21 9 15 20 10 27 37 11 23 21 12 31 1813 20 29 14 35 38 15 20 27proc ttest;paired x1*x2;run; The TT
7、EST Procedure Statistics Lower CL Upper CL Lower CL Upper CL Difference N Mean Mean Mean Std Dev Std Dev Std Dev Std Err Minimum Maximum x1 - x2 15 -10.63 -5.933 -1.232 6.2152 8.4892 13.388 2.1919 -21 13 T-Tests Difference DF t Value Pr |t| x1 - x2 14 -2.71 0.01703、总体均值分量间结构关系的检验 该检验在SAS程序上如何完成,我暂时无
8、法给出,只能用EXCEL来完成该检验。例1 设,时取自该总体的样本。检验至少存在一对令则与上面的原假设等价的假设为 。注:矩阵不是唯一的,例2假定人类的体形有这样一个一般规律的身高、胸围和上臂围平均尺寸比例为。检验比例是否符合这一规律。检验:至少有两个不等则上面的假设可以表达为为了检验 ,可以用统计量当为真时,对给定的显著性水平,检验的规则当时,拒绝原假设;当时,接受原假设。三、单因素方差分析ANOVA过程方差分析把指标的方差分解为由因素的不同取值能够解释的部分,和剩余的不能解释的部分,然后比较两部分,当能用因素解释的部分明显大于剩余的部分时认为因素是显著的。方差分析假定观测是彼此独立的,观测
9、为正态分布的样本,由因素各水平分成的各组的方差相等。在这些假定满足时,就可以用ANOVA过程来进行方差分析。其一般写法为PROC ANOVA DATA数据集;CLASS 因素;MODEL 指标因素; MEANS T/ALPHA LSD SCHEFFE;RUN;PROC ANOVA,运行方差分析程序的命令。 CLASS 因素,表示因子,在模型中作为自变量使用。MODEL 指标因素; 运行以指标为因变量,因素为自变量的单因素方差分析,指标可以是多变量的。manova h=因素,进行多变量的方差分析。MEANS T/ALPHA=P LSD SCHEFFE BON REGWQ,利用给的显著性水平,进行
10、LSD、SCHEFFE、BON和REGWQ多重检验。注(多重检验):方差分析只检验各组是否没有任何两两之间的差异,但不检验到底是哪两组之间有显著差异,即。在三个或多个组之间进行两个或多个比较的检验叫做多重比较。多重比较在统计学中没有一个公认的解决方法,而是提供了若干种检验方法。因为多重比较要进行不只一次的比较,所以在多重比较的检验水平有两种:总错误率(experimentwise error rate)和单次比较错误率。总错误率是指所有比较(比如,五个组两两之间比较有10次)的总第一类错误概率,单次比较错误率是指每一次比较的第一类错误概率。显然,总错误率要比单次比较错误率高.有10种比较法:(
11、1) Bonferroni(简称Bon):要求对全部主效应的平均值的差异进行最小差异显著性水平T检验。(2)Tukeys HSDD(简称TLUKEY):对所有主效应的平均值,进行TUKEY的学生化范围检验(Studentized range test)。(3)Duncans multiple-range test(DUNCAN):对所有主效应的平均值进行Duncan如多重范围检验(Multiple-range test)。(4) Dunnetts t-test:Dunnett的T检验。(5) Fishers LSD:费歇尔LSD检验。(6) Gabriel multipie-compariso
12、n procedure(GABRIEL):对所有主效应的均值进行Gabriel的多重比较 (Multiple comparison)。 (7) Student-Newman-Keuls multiple-range test(SNK):对所有主效应平均值进行比Keuls的多重范围检验。 (8) wallerDuncan K-ratio t-test(WALLER):对所有主效应的平均值,进行Waller-Duncan K率的t检验。 (9) Scheffes multiplecomparison procedure (SCHEFFE):对所有主效应的均值进行 scheffe多重比较。 (10)
13、 Ryan-Einot-Gabriel-Welsch multiple-range test(REGWF):对所有主效应的均值进行Ryan-Einot-Gabriel-welsch的多重F检验。如果采用命令法,则还有以下的选项:在SAS/ANOVA过程中使用MEANS语句进行多重比较。格式如下:MEANS T/ALPHA=P LSD SCHEFFE BON REGWQ;如果不使用选项,则只对因素的各水平计算指标的平均值和标准差。要进行两两比较,有多种方法,可以在MEANS语句的选项中指定检验方法。例:为了研究某年全国各地农民家庭收支的分布情况,对全国28个地区进行了抽样调查。食品,衣着,燃料,
14、住房,生活用品及其他和文化服务支出。进行多元方差分析。data a;input type x1-x6;cards;1 135.20 36.40 10.47 44.16 36.49 3.94 1 146.68 32.83 17.79 27.29 39.09 3.471 159.37 33.38 18.37 11.81 25.29 5.22 1 144.98 29.12 11.67 42.60 27.30 5.741 169.92 32.75 12.72 47.12 34.35 5.00 1 115.84 30.76 12.20 33.61 33.77 3.852 116.22 29.57 12.
15、24 13.76 21.75 6.04 2 153.11 23.09 15.62 23.54 18.18 6.392 144.92 21.26 16.96 19.52 21.75 6.73 2 140.54 21.59 17.64 19.19 15.97 4.942 140.64 28.26 12.35 18.53 20.95 6.23 2 164.02 24.74 13.63 22.20 18.06 6.042 139.08 18.47 14.63 13.41 20.66 3.85 2 137.80 20.74 11.70 17.74 16.49 4.392 121.67 21.53 12.
16、58 14.49 12.18 4.57 2 123.24 38.00 13.72 4.64 17.77 5.753 95.21 22.83 9.30 22.44 22.81 2.80 3 104.78 25.11 6.46 9.89 18.17 3.253 128.41 27.63 8.94 12.58 23.99 3.27 3 101.18 23.26 8.46 20.20 20.50 4.303 124.27 19.81 8.89 14.22 15.53 3.03 3 106.02 20.56 10.94 10.11 18.00 3.293 95.65 16.82 5.70 6.03 12
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 推断 分析 程序
限制150内