SAS统计分析系统操作手册idl.pptx
《SAS统计分析系统操作手册idl.pptx》由会员分享,可在线阅读,更多相关《SAS统计分析系统操作手册idl.pptx(124页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SAS 统计分析系统统计分析系统Statistical Analysis System公共卫生学院信息数据处理教学实验室SAS软件简介软件简介1966年美国年美国North Carolina大学的两位大学的两位生物统计学研究生开始研制生物统计学研究生开始研制SAS系统,直系统,直至至1976年成立了年成立了SAS软件研究所,正式推软件研究所,正式推出了出了SAS软件,软件,1985年推出微机版年推出微机版SAS。SAS是用于决策支持的大型集成信息系是用于决策支持的大型集成信息系统,软件系统最早的功能限于统计分析,统,软件系统最早的功能限于统计分析,现在统计分析功能也仍是它的重要组成部现在统计分
2、析功能也仍是它的重要组成部分和核心功能。分和核心功能。SAS现在的最新版本为现在的最新版本为9.0版,大小约为版,大小约为1GB。在数据处理和统计分析领域,在数据处理和统计分析领域,SAS系系统被誉为国际上的标准软件系统,并在统被誉为国际上的标准软件系统,并在9697年度被评选为建立数据库的首选年度被评选为建立数据库的首选产品,堪称统计软件界的巨无霸。产品,堪称统计软件界的巨无霸。经过多年的发展,经过多年的发展,SAS已经被全世界已经被全世界120多个国家和地区的近三万家机构所采多个国家和地区的近三万家机构所采用,直接用户超过三百万人,遍及金融、用,直接用户超过三百万人,遍及金融、医药卫生、生
3、产、运输、通讯、政府和医药卫生、生产、运输、通讯、政府和教育科研等领域。教育科研等领域。由于由于SAS系统是从大型机上的系统发展系统是从大型机上的系统发展而来,在设计上也是完全针对专业用户进行而来,在设计上也是完全针对专业用户进行设计,因此操作以设计,因此操作以SAS语言编程为主,另外语言编程为主,另外也有非编程方式的菜单系统,但人机对话的也有非编程方式的菜单系统,但人机对话的界面不太友好。界面不太友好。学习学习SAS软件时,需要用户有基本的统软件时,需要用户有基本的统计学知识,对所选用的统计方法有较清楚的计学知识,对所选用的统计方法有较清楚的了解,没有统计学基础知识要掌握了解,没有统计学基础
4、知识要掌握SAS软件软件较为困难。较为困难。第一节第一节 SAS软件的使用基础软件的使用基础一、一、SAS的启动和退出的启动和退出 vv启动SASvv双击桌面SAS图标vv开始菜单 程序 The Sas System The Sas System for Windows V*.*vv直接双击SAS应用程序vv退出SASvv标题栏关闭按钮vv菜单栏 File Exitvv在命令框键入“Bye”或“Endsas”标题栏、菜单栏、工具栏标题栏、菜单栏、工具栏vPROGRAM EDITOR 程序编辑窗口vLOG 运行过程日志窗口vOUTPUT 结果输出窗口 SAS常用功能键常用功能键三个窗口间切换三个
5、窗口间切换F4 F4 RECALL (RECALL (调回程序调回程序)F5F5 PGM (PGM (程序程序)F8F8 SUBMIT (SUBMIT (发送程序发送程序)F6F6 LOG (LOG (日志日志)F1F1 HELP (HELP (帮助帮助)F7F7 OUTPUT (OUTPUT (结果结果)F9F9 KEYS (KEYS (功能键列表功能键列表)二、二、SAS的工作窗口的工作窗口例:一组体检资料,包括姓名、性别、年龄、身高、体重,要例:一组体检资料,包括姓名、性别、年龄、身高、体重,要求分性别计算身高、体重的均数、标准差、最大值、最小值。求分性别计算身高、体重的均数、标准差、最
6、大值、最小值。姓名姓名 性别性别 年龄年龄 身高身高 体重体重 ZHANGLIN F 47 156.3 47.1 ZHAOHUA M 38 172.4 61.5 WANGQANG M 41 169.2 64.5 LIULI F 52 158.2 53.6 SHIDONG F 39 160.1 48.0 KONGYING M 29 174.1 64.6 LILING F 37 152.3 42.2 GUANFEN M 32 166.2 60.2 MIAOQING M 26 180.3 74.3 NIUHUA M 31 178.2 80.2 TANGJIE F 35 169.2 60.8 GAOJ
7、UN M 24 176.0 73.3 SUNHONG F 27 158.3 49.9 三、三、SAS程序构成程序构成DATA AA1;INPUT NAME$SEX AGE HEIGHT WEIGHT;CARDS;ZHANGLIN 2 47 156.3 47.1 ZHAOHUA 1 38 172.4 61.5 WANGQANG 1 41 169.2 64.5 LIULI 2 52 158.2 53.6 SHIDONG 2 39 160.1 48.0 KONGYING 1 29 174.1 64.6 LILING 2 37 152.3 42.2 GUANFEN 1 32 166.2 60.2 MI
8、AOQING 1 26 180.3 74.3 NIUHUA 1 31 178.2 80.2 TANGJIE 2 35 169.2 60.8 GAOJUN 2 24 176.0 73.3 SUNHONG 2 27 158.3 49.9 ;PROC MEANS;CLASS SEX;VAR HEIGHT WEIGHT;RUN;数据步数据步数据步数据步过程步过程步过程步过程步v DATA STEP(数据步数据步)以以DATA语句开始语句开始将数据读入将数据读入SAS系统,建立系统,建立SAS数据集数据集v PROCEDURE STEP(过程步过程步)以以PROC语句语句开始开始调用各种已编好的调用各种
9、已编好的过程过程处理和分析数据处理和分析数据v RUN(结束结束)整个程序的最后必须要有整个程序的最后必须要有RUN语句结束,语句结束,表示要执行以上全部任务。表示要执行以上全部任务。1.必须在必须在PGM窗口。窗口。SAS语句书写格式自由,语句书写格式自由,每个语句以每个语句以“;”结束,结束,可以在一行中写几个语句或一个语句写在几行中,不区分字母大小写。2.运行运行SAS程序程序v工具栏执行按钮v功能键“F8”(Submit)v菜单栏 Locals Submit v命令框键入“Submit”命令自动激活OUTPUT窗口,出现程序运行结果四、四、SAS程序编写、运行、调试、保存程序编写、运行
10、、调试、保存3.调试调试SAS程序程序 没出现结果窗口,或结果不理想时。v激活LOG窗口(F6)查看运行过程及出错信息黑色文字:源程序及运行情况蓝色文字:程序运行情况说明信息红色文字:出错信息绿色文字:警告信息v激活PGM窗口(F5)v调回SAS程序(F4)修改错误后重新发送4.保存保存SAS程序或其他窗口内容程序或其他窗口内容 激活相应窗口激活相应窗口v常用工具栏 存盘按钮v菜单栏 File Save(或Save as)v命令框输入File命令可以分别保存程序、运行结果、日志5.打开已保存的程序、结果等打开已保存的程序、结果等 只能在只能在PGM窗口窗口v常用工具栏 打开按钮v菜单栏 Fil
11、e Openv命令框输入Include命令可打开以前保存的程序、运行结果、日志等文件及其他文本格式的文件。第二节第二节 SAS数据集数据集SAS数据集数据集(SAS Dataset)数据值被安排在一个矩阵式的表格结构中数据值被安排在一个矩阵式的表格结构中 每一行数据表示一个每一行数据表示一个观测观测(Observation)每一列数据表示一个每一列数据表示一个变量变量(Variable)变量命名:变量命名:18个字符,第个字符,第1个字符必须是字个字符必须是字母,后面母,后面 可以是字母、数字和下划线可以是字母、数字和下划线 变量类型:数值型、字符型和日期时间型变量类型:数值型、字符型和日期时
12、间型 字符型变量名后加字符型变量名后加“$”表示,表示,日期型日期型:16OCT9816OCT98 D,时间型,时间型:9:25:30 T 变量缺失值:用变量缺失值:用“”表示表示 一、一、SAS数据集的种类数据集的种类v临时SAS数据集不保存,一旦退出SAS就消失。数据集名称为1个单词,如DATA AA;v永久SAS数据集保存在用户指定的文件夹里。数据集名称为2个单词,中间用“.”分开,也称二级名,如DATA NEW.AA;LIBNAME NEW D:MY DATA;DATA NEW.AA;在数据集的二级名称 NEW.AA中;n n第1个词NEW是库标记,代表用户指定的保存SAS数据文件的位
13、置,前面要用LIBNAME语句指定它代表的文件夹和位置。n n第2个词AA是保存的SAS数据集的文件名。执行这个过程的结果将会在D:MY DATA文件夹中产生1个永久SAS数据文件 AA.SD2 SD2是自动产生的SAS数据文件默认扩展名二、创建二、创建SAS数据集数据集 1.在在PGM窗口创建数据集窗口创建数据集 DATA AA;命名将要创建的数据集名命名将要创建的数据集名 INPUT X1-X4;描述数据集中的变量名描述数据集中的变量名 CARDS;以下开始是数据以下开始是数据 2 47 156.3 47.1 1 38 172.4 61.5 ;数据结束数据结束 INPUT X YINPUT
14、 X Y;连续读数据不换行;连续读数据不换行 INPUT NAME$AGE;INPUT NAME$AGE;字符型变量名加字符型变量名加2.在在VIEWTABLE窗口创建数据集窗口创建数据集菜单栏Globals Manage Open tables打开VIEWTABLE窗口直接输入数据保存数据:File Save(或Save as)在Tables右边框中输入数据集名称在Path右边框中n n选默认位置*:sassaswork 建立临时数据集n n用户指定位置可以建立永久数据集3.用分析员模块创建数据集用分析员模块创建数据集 菜单栏 Globals Analyze Sta-tistical Ana
15、lysis打开Analyze(分析员)窗口直接输入数据保存数据:File Save Library:库标记名(代表要保存文件的 位置,选Work可以建临时数据集)Table Name:数据集文件名 Description:可以对文件进行描述4.由其它类型数据文件转换成由其它类型数据文件转换成SAS数据集数据集 菜单栏菜单栏 File importSAS可以直接与下列格式文件互相转换l ldBASE/FoxBASE File(*.dbf)l lExcel 4.0/5.0 File(*.xls)l lLotus 1/3/4 File(*.wk1/3/4)l lDelimited File(*.*)
16、空格分隔l lTab Delimited File(*.txt)制表符分隔l lComma Separated Velues(*.csv)逗号分隔 注意:注意:n nVisual Foxpro的数据表(*.dbf)在VFP系统中通过菜单栏 文件 导出 类型选 dBASE、FoxBASE、Excel 5.0、Delimited File 均可以n nExcel 97/2000/2002的文件(*.xls)在Excel系统中通过菜单栏 文件 另存为 保存类型选 Excel5.0/4.0(*.xls)或逗号分隔(*.csv)制表符分隔(*.txt)均可以n nExcel文件中要求第1行是变量名另外:
17、在写字板、记事簿、Word 或 Excel 中的数据也可以直接采用复制、粘贴的方式,通过PGM窗口创建SAS数据集。通过 菜单栏菜单栏 File Export也可以把SAS数据集转换成相应的其它类型数据文件 5.从已有的从已有的SAS数据集中创建新数据集数据集中创建新数据集 DATA A1(子集);SET AA(原数据集);(1)选择部分变量(列)选择部分变量(列)l l保留部分变量保留部分变量:KEEP DATA A1;SET AA;KEEP X1 X2;去掉部分变量去掉部分变量:DROP DATA A1;SET AA;DROP X3 X4;赋值新的变量赋值新的变量 Y=X3+X4;LY=L
18、OG(Y);常用常用SAS函数:函数:LOG(x)以e为底的自然对数LOG10(x)以10为底的常用对数EXP(x)以e为底的反对数SQRT(x)平方根ABS(x)绝对值 INT(x)取整数(不四舍五入)MOD(x,y)取x/y的余数SIN(x)正弦COS(x)余弦 三角函数(x是弧度)TAN(x)正切(2)选择部分观测(行)选择部分观测(行)建子集语句:建子集语句:IF DATA A1;SET AA;IF SEX=1;DATA A1;SET AA;IF AGE40;IF X1=3 (不等于不等于)IF SEX=1 AND AGE60 IF AGE20 AND AGE=40 IF AGE40(
19、3)数据集连接数据集连接n n纵向连接 A1 DATA AA;SET A1 A2;A2 要求 A1和 A2中的变量相同 A1中有10行,A2中有15行,则AA有25行。n n横向合并 A1 A2 DATA AA;MERGE A1 A2;BY Num;匹配合并时,要求 A1和 A2中必须有1个相同的变量,且排列顺序也相同,作为标识变量用 BY 语句指定。(4)数据集转置(行列互换)数据集转置(行列互换)PROC TRANSPOSE;BY G;VAR X1-X4;OBS X1 X2 X3OBS X1 X2 X31 1 1 2 3 1 2 32 2 4 5 6 4 5 63 3 7 8 9 7 8
20、9OBS _Name_ Col1 Col2 Col3OBS _Name_ Col1 Col2 Col31 1X1 1 4 7X1 1 4 72 2X2 2 5 8X2 2 5 83 3X3 3 6 9X3 3 6 9选择项有:OUT=新数据集名(缺省按DATA n自动命名)PREFIX=新变量名前缀(缺省按Col n自动命名)NAME=为原变量名列命名(缺省自动命名为_Name_)第三节第三节 统计描述统计描述一、定量资料的统计描述一、定量资料的统计描述n n简单描述:MEANS过程 输出样本含量、均数、标准差、最小值、最大值输出样本含量、均数、标准差、最小值、最大值 (N (N、MeanMe
21、an、Std DevStd Dev、MinimumMinimum、Maximum)Maximum)l l详细描述:UNIVARIATE过程输出更多指标:样本含量、均数、标准差、最小输出更多指标:样本含量、均数、标准差、最小值、最大值、方差、标准误值、最大值、方差、标准误 、中位数、四分位数、中位数、四分位数间距、常用百分位数、众数、平方和、离均差平间距、常用百分位数、众数、平方和、离均差平方和等,可以作正态性检验方和等,可以作正态性检验另外还显示原数据中的部分极端值另外还显示原数据中的部分极端值PROC MEANS;CLASS SEX;VAR HEIGHT WEIGHT;RUN;CLASSCL
22、ASS 指定分组变量(可以不写)指定分组变量(可以不写)指定分组变量(可以不写)指定分组变量(可以不写)VAR VAR 指定需要分析的变量指定需要分析的变量指定需要分析的变量指定需要分析的变量(不写即分析全部变量)不写即分析全部变量)不写即分析全部变量)不写即分析全部变量)MAXDEC=nMAXDEC=n 指定计算结果保留小数位数指定计算结果保留小数位数指定计算结果保留小数位数指定计算结果保留小数位数(默认默认默认默认2 2位位位位)可加的选项有:标准误可加的选项有:标准误(StdErr)(StdErr)、方差、方差(Var)(Var)、总和、总和(Sum)(Sum)、平方和、平方和(USS)
23、(USS)、离均差平方和、离均差平方和(CSS)(CSS)、全距、全距(Range)(Range)、变异系数、变异系数(CV)(CV)、偏度系数、偏度系数(Skewness)(Skewness)、峰度、峰度系数系数(Kurtosis)(Kurtosis)、可信区间、可信区间(CLM)(CLM)等等还可以计算总体均数还可以计算总体均数=0=0的的 t t 检验检验(T(T、Prt)Prt)不加任何选项时,自动输出不加任何选项时,自动输出5 5项结果:项结果:N N、MeanMean、Std DevStd Dev、MinimumMinimum、MaximumMaximumMEANS过程过程频数表资
24、料:频数表资料:X-X-f f2.4-2.4-5 52.6-2.6-10102.8-2.8-12123.0-3.0-23233.2-3.2-24243.4-3.4-22223.6-3.6-17173.8-3.8-7 74.0-4.0-3 3DATA AA2;INPUT X F;CARDS;2.5 5 2.7 10 2.9 12 3.1 23 3.3 24 3.5 22 3.7 17 3.9 7 4.1 3 ;PROC MEANS N MEAN STD STDERR CLM;VAR X;FREQ F;RUN;数据步中:X 是组中值,F是频数过程步中:过程步中:VAR XVAR X;指定分析变量是
25、;指定分析变量是 X X FREQ F FREQ F;指定;指定 F F 是频数是频数计算几何均数计算几何均数滴度滴度人数人数1:41:4 1 11:81:8 5 51:161:16 6 61:321:32 2 21:641:64 7 71:1281:12810101:2561:256 4 41:5121:512 5 5合计合计4040DATA AA3;INPUT X F;Y=LOG10(X);CARDS;4 1 8 5 16 6 32 2 64 7 128 10 256 4 512 5 ;PROC MEANS;VAR Y;FREQ F;OUTPUT OUT=C MEAN=M;&DATA B2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 统计分析 系统 操作手册 idl
限制150内