SAS软件的统计分析系统.pptx
《SAS软件的统计分析系统.pptx》由会员分享,可在线阅读,更多相关《SAS软件的统计分析系统.pptx(123页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、tatistical nalysis ystem公共卫生学院信息数据处理教学实验室 标题栏、菜单栏、工具栏标题栏、菜单栏、工具栏vPROGRAM EDITOR 程序编辑窗口vLOG 运行过程日志窗口vOUTPUT 结果输出窗口 SAS常用功能键常用功能键例:一组体检资料,包括姓名、性别、年龄、身高、体重,要例:一组体检资料,包括姓名、性别、年龄、身高、体重,要求分性别计算身高、体重的均数、标准差、最大值、最小值。求分性别计算身高、体重的均数、标准差、最大值、最小值。 姓名姓名 性别性别 年龄年龄 身高身高 体重体重 ZHANGLIN F 47 156.3 47.1 ZHAOHUA M 38 1
2、72.4 61.5 WANGQANG M 41 169.2 64.5 LIULI F 52 158.2 53.6 SHIDONG F 39 160.1 48.0 KONGYING M 29 174.1 64.6 LILING F 37 152.3 42.2 GUANFEN M 32 166.2 60.2 MIAOQING M 26 180.3 74.3 NIUHUA M 31 178.2 80.2 TANGJIE F 35 169.2 60.8 GAOJUN M 24 176.0 73.3 SUNHONG F 27 158.3 49.9 DATA AA1; INPUT NAME$ SEX AG
3、E HEIGHT WEIGHT; CARDS; ZHANGLIN 2 47 156.3 47.1 ZHAOHUA 1 38 172.4 61.5 WANGQANG 1 41 169.2 64.5 LIULI 2 52 158.2 53.6 SHIDONG 2 39 160.1 48.0 KONGYING 1 29 174.1 64.6 LILING 2 37 152.3 42.2 GUANFEN 1 32 166.2 60.2 MIAOQING 1 26 180.3 74.3 NIUHUA 1 31 178.2 80.2 TANGJIE 2 35 169.2 60.8 GAOJUN 2 24
4、176.0 73.3 SUNHONG 2 27 158.3 49.9 ;PROC MEANS; CLASS SEX; VAR HEIGHT WEIGHT;RUN;v DATA STEP(数据步数据步)v PROCEDURE STEP(过程步过程步)v RUN (结束结束)1. 必须在必须在PGM窗口。窗口。SAS语句书写格式自语句书写格式自由,每个语句以由,每个语句以“;”结束,结束,可以在一行中写几个语句或一个语句写在几行中,不区分字母大小写。 2. 运行运行SAS程序程序v工具栏执行按钮v功能键“F8”( Submit )v菜单栏 Locals Submit v命令框键入“Submit”命
5、令自动激活OUTPUT窗口,出现程序运行结果3. 调试调试SAS程序程序 没出现结果窗口,或结果不理想时。v激活LOG窗口(F6) 查看运行过程及出错信息黑色文字:源程序及运行情况蓝色文字:程序运行情况说明信息红色文字:出错信息绿色文字:警告信息v激活PGM窗口(F5)v调回SAS程序 (F4)修改错误后重新发送4. 保存保存SAS程序或其他窗口内容程序或其他窗口内容 激活相应窗口激活相应窗口v常用工具栏 存盘按钮v菜单栏 File Save(或Save as)v命令框输入File命令可以分别保存程序、运行结果、日志5. 打开已保存的程序、结果等打开已保存的程序、结果等 只能在只能在PGM窗口
6、窗口v常用工具栏 打开按钮v菜单栏 File Openv命令框输入Include命令可打开以前保存的程序、运行结果、日志等文件及其他文本格式的文件。选择项有:OUT=新数据集名(缺省按DATA n自动命名)PREFIX=新变量名前缀(缺省按Col n自动命名)NAME=为原变量名列命名(缺省自动命名为_Name_)DATA AA2; INPUT X F; CARDS;2.5 5 2.7 10 2.9 12 3.1 23 3.3 24 3.5 22 3.7 17 3.9 7 4.1 3 ; PROC MEANS N MEAN STD STDERR CLM ;VAR X;FREQ F;RUN;数据
7、步中:X 是组中值,F是频数DATA AA3; INPUT X F; Y=LOG10(X); CARDS;4 1 8 5 16 6 32 2 64 7 128 10 256 4 512 5 ;PROC MEANS; VAR Y; FREQ F;OUTPUT OUT=C MEAN=M; &DATA B2; SET C ; G=10*M; #PROC PRINT DATA=B2; VAR G;*RUN;&输出临时数据集C,变量M=均数,#新建数据集B2,取自C,求反对数G=10M*输出过程步,输出几何均数 G2_)(xx 频数 构成比行构成比列构成比DATA BB; INPUT N1 X1 S1
8、N2 X2 S2; SE=SQRT(S1*S1/N1+S2*S2/N2); U=ABS(X1-X2)/SE; P1=1-PROBNORM(U); P=2*P1; U=ROUND(U,0.001); P=ROUND(P,0.00001); IF P F变异来源 自由度 SS MS F PModel模型 2 2384.02550505 1192.01275253 5.85 0.0077Error误差 27 5497.83616162 203.62356154Total总 29 7881.86166667 R-Square R2 C.V. Root MSE Sy.x X Mean 0.302470
9、12.93519 14.26967279 110.31666667Source DF Anova SS Mean Square F Value Pr F变异来源 自由度 SS MS F P G组间 2 2384.02550505 1192.01275253 5.85 0.0077 P0.01,拒绝拒绝H0,接受接受H1,可以认为三组人群载脂蛋白不同。可以认为三组人群载脂蛋白不同。_xStudent-Newman-Keuls test for variable: X均数间两两比较均数间两两比较q检验(检验(SNK法)法)Means with the same letter are not sig
10、nificantly different.相同字母表示的均数无显著性差别 SNK Grouping Mean N G A 122.800 10 3 B 105.455 11 1 B B 102.389 9 2第三组高于前两组,即健康人的载脂蛋白高于两组病人。单因素方差分析时,如只有各组的均数、标准差,而无原始数据时,无法直接调用SAS软件中的某个过程进行分析,只能在数据步中按照计算公式编写程序完成。例:研究不同季节人体肾上腺皮质3-HSD活性变化DATA AA; INPUT K XX; DO I=1 TO K; INPUT N X S; OUTPUT; SS1+(XX-X)*(XX-X)*N;
11、 SS2+S*S*(N-1);NN+N; END; SS1=SS1/(K-1); SS2=SS2/(NN-K); F=SS1/SS2; P=1-PROBF(F,K-1,NN-K); F=ROUND(F,0.001); P=ROUND(p,0.00001); IF P FModel模型 9 2521.29375 280.14375 11.52 0.0001Error误差 14 340.54250 24.32446Total总 23 2861.83625 R-Square C.V. Root MSE X Mean 0.881006 8.860514 4.93198381 55.6625Source
12、 DF Anova SS Mean Square F Value Pr F I 处理间 2 144.9175 72.45875 2.98 0.0836 J 区组间 7 2376.37625 339.48232 13.96 0.0001处理间处理间P0.05,不拒绝不拒绝H0,尚不能认为三种营养素喂养小鼠增重有尚不能认为三种营养素喂养小鼠增重有差别;区组间差别;区组间P FModel 9 6396.5625 710.7292 4.02 0.0521Error 6 1059.8750 176.6458Total 15 7456.4375 R-Square C.V. Root MSE X Mean
13、0.857858 25.46743 13.29081763 52.1875Source DF Anova SS Mean Square F Value Pr FCX 3 773.1875 257.7292 1.46 0.3167DW 3 270.68750 90.2292 0.51 0.6894YW 3 5352.68750 1784.2292 10.10 0.0092四种药物之间PB、C。而动物之间和用药次序均无影响。DATA AA12; DO A=1 TO 2; DO B=1 TO 2; DO I=1 TO 4; INPUT X ; OUTPUT; END; END; END; CARDS
14、; 52 48 44 44 84 88 90 88 52 44 40 26 47 64 52 45;PROC ANOVA; CLASS A B; MODEL X=A B A*B;RUN;Dependent Variable: XSource DF Sum of Squares Mean Square F Value Pr FModel 3 5309.00 1769.67 33.39 0.0001Error 12 636.00 53.00 Total 15 5945.00 R-Square C.V. Root MSE X Mean 0.893019 12.82839 7.28 56.75Sour
15、ce DF Anova SS Mean Square F Value Pr F A 1 1764.00 1764.00 33.28 0.0001 B 1 2704.00 2704.00 51.02 0.0001A*B 1 841.00 841.00 15.87 0.0018不同方法、不同化合物间均有差别,且交互作用也有统计学意义。新法高于旧法,乙物高于甲物,以新法+乙物为最佳组合。DATA AA13; DO CX=1 TO 2; DO DW=1 TO 6; INPUT YW$ X ; OUTPUT; END; END;CARDS; Y 15 D 31 Y 17 D 30 D 25 Y 5 D
16、27 Y 25 D 28 Y 14 Y 18 D 26 ;PROC ANOVA; CLASS CX DW YW; MODEL X=CX DW YW;RUN;Dependent Variable: XSource DF Sum of Squares Mean Square F Value Pr FModel 7 621.5833 88.7976 5.85 0.0535Error 4 60.6667 15.1667Total 11 682.2500 R-Square C.V. Root MSE X Mean 0.911079 17.90547 3.8944 21.75Source DF Anova
17、 SS Mean Square F Value Pr FCX 1 18.75 18.75 1.24 0.3285DW 5 158.75 31.75 2.09 0.2470YW 1 444.08 444.08 29.28 0.0057药物间P0.05,不拒绝H0,尚不能认为VC有增效作用DATA BB; DO I=1 TO 2; DO J=1 TO 2; INPUT F;OUTPUT; END; END;CARDS;54 8 44 20 ;PROC FREQ; TABLES I*J/CHISQ; WEIGHT F; RUN;WEIGHT 语句指明变量 F 是频数加选项 EXACT可以对22表作F
18、isher确切概率EXPECTED可以显示每个格子的理论值CMH可以计算队列研究和病例对照研究的RR值NOROW、NOCUL、NOPERCENT 不显示相应百分数NOPRINT 不显示表格,只显示计算的统计量STATISTICS FOR TABLE OF I BY J Statistic 统计量 DF Value ProbChi-Square 2 1 6.133 0.013Likelihood Ratio Chi-Square 似然比似然比2 1 6.304 0.012Continuity Adj. Chi-Square 校正校正2 1 5.118 0.024Mantel-Haenszel C
19、hi-Square MH 2 1 6.084 0.014Fishers Exact Test 确切概率确切概率 (Left) 0.997 (Right) 0.011 (2-Tail) 0.018 Phi Coefficient (Phi系数系数) 0.221 Contingency Coefficient (列联系数列联系数) 0.215 Cramers V (克莱姆系数克莱姆系数) 0.221 Sample Size = 126由原始数据计算:由原始数据计算:如258人资料,三个定性变量A文化程度(1=文盲2=初中以下3=高中4=大学)B工作强度(1=轻 2=中 3=重)C月收入 (1=30
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 软件 统计分析 系统
限制150内