SAS统计分析软件应用.ppt
《SAS统计分析软件应用.ppt》由会员分享,可在线阅读,更多相关《SAS统计分析软件应用.ppt(128页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1SAS SAS 统计分析系统统计分析系统Statistical Analysis System宁夏医科大学公共卫生学院宁夏医科大学公共卫生学院流行病与卫生统计学系流行病与卫生统计学系李吴萍李吴萍 2011.52第一节第一节 SASSAS软件简介软件简介1966年美国年美国North Carolina州立大学的两位生物州立大学的两位生物统计学研究生开始研制统计学研究生开始研制SAS系统,直至系统,直至1976年成立了年成立了SAS软件研究所,正式推出了软件研究所,正式推出了SAS软件,软件,1985年推出年推出微机版微机版SAS。SAS是用于决策支持的大型集成信息系统,软件是用于决策支持的大型
2、集成信息系统,软件系统最早的功能限于统计分析,逐渐成为一个用来管理系统最早的功能限于统计分析,逐渐成为一个用来管理、分析数据和编写报告的大型集成应用软件系统,具有、分析数据和编写报告的大型集成应用软件系统,具有完备的数据访问、管理、分析、呈现及应用开发等功能完备的数据访问、管理、分析、呈现及应用开发等功能,完全超出了单纯统计应用的功能。属于世界领先,使,完全超出了单纯统计应用的功能。属于世界领先,使用最为广泛的统计软件之一。用最为广泛的统计软件之一。3由于由于SAS系统是从大型机上的系统发展系统是从大型机上的系统发展而来,在设计上也是完全针对专业用户进行而来,在设计上也是完全针对专业用户进行设
3、计,因此操作以设计,因此操作以SAS语言编程为主,另外语言编程为主,另外也有非编程方式的菜单系统,但人机对话的也有非编程方式的菜单系统,但人机对话的界面不太友好。界面不太友好。学习学习SAS软件时,需要用户有基本的统软件时,需要用户有基本的统计学知识,对所选用的统计方法有较清楚的计学知识,对所选用的统计方法有较清楚的了解,没有统计学基础知识要掌握了解,没有统计学基础知识要掌握SAS软件软件较为困难。较为困难。4SAS系统是一个模块化的组合软件系统,它系统是一个模块化的组合软件系统,它提供了约提供了约20多个模块,各个模块之间既相互独立又多个模块,各个模块之间既相互独立又相互交融补充。本课程用得
4、最多的是相互交融补充。本课程用得最多的是Base SAS模模块和块和SAS/STAT模块。模块。Base SAS是是SAS系统的基础。系统的基础。它既可以单独它既可以单独使用,也可以与其他模块组成一个用户化的使用,也可以与其他模块组成一个用户化的SAS系系统,但是其他模块必须与之结合起来才能使用。统,但是其他模块必须与之结合起来才能使用。Base SAS主要承担着数据及用户使用环境的管理、主要承担着数据及用户使用环境的管理、SAS语言程序的处理,并具有基本的数据分析和报语言程序的处理,并具有基本的数据分析和报告等统计功能。告等统计功能。5SAS/STAT提供了当今流行的主要统计提供了当今流行的
5、主要统计分析方法分析方法,是国际上统计分析领域的标准权,是国际上统计分析领域的标准权威软件。它具有回归分析、方差分析、属性威软件。它具有回归分析、方差分析、属性数据分析、多元分析、聚类分析、判别分析、数据分析、多元分析、聚类分析、判别分析、非参数分析、生存分析和心理测量分析等统非参数分析、生存分析和心理测量分析等统计功能。计功能。6第二节第二节 SASSAS软件的使用基础软件的使用基础一、一、SAS的启动和退出的启动和退出 v启动启动SASv双击桌面SAS图标v开始菜单 程序 The Sas System The Sas System for Windows V*.*v直接双击SAS应用程序v
6、退出退出SASv标题栏关闭按钮v菜单栏 File Exit7 标题栏、菜单栏、工具栏标题栏、菜单栏、工具栏vEditor 程序编辑器窗口vLOG 运行过程日志窗口vOutput 结果输出窗口vExplorer 资源管理器窗口vResults 结果索引窗口三个窗口间切换F4 Recall (调回程序)F5 Editor (程序)F8 Submit (发送程序)F6 LOG (日志)F1 Help (帮助)F7 Output (结果)F9 Keys (功能键列表)二、二、SAS的工作窗口的工作窗口SAS常用功能键常用功能键8第二节第二节 SASSAS软件的使用基础软件的使用基础9vEditor窗口
7、窗口 主要用于打开SAS程序文件(*.sas)、编辑和修改SAS程序、并提交全部或部分SAS程序。vLOG窗口窗口 显示有关的SAS会话和提交SAS程序的信息,包括程序的出错信息等(*.log)vOutput窗口窗口 主要显示提交SAS程序后的运行结果(*.lst)vExplorer窗口窗口 主要用于查看和管理所有SAS文件,而且可以对非SAS文件创建快捷方式。vResults 窗口窗口 主要用于操作和管理提交SAS程序后的输出结果。他的内容与Output窗口的内容一一对应,可以看成是Output窗口内容的名称。二、二、SAS的工作窗口的工作窗口10第三节第三节 SASSAS语言的语句和程序语
8、言的语句和程序一、一、SAS 语句语句 一个SAS语句就是要求SAS系统执行某种操作或给SAS系统提供一些信息的命令。SAS语句通常由语句通常由SAS关键字、关键字、SAS名称、运算符及特名称、运算符及特殊字符组成殊字符组成。规则:(1)以;结尾(2)以SAS关键字开始。如:data,proc,input,cards,model,class,if,keep,set,run11第三节第三节 SASSAS语言的语句和程序语言的语句和程序一、一、SAS 语句语句(3)注释语句可以用*开始,或者用/*/表示中间内容是注释语句。例1.1Data sas1_1;/*sas1_1是数据集名*/Input i
9、d name$height weight;Bmi=weight/height*2;Cards;/*数据流开始*/1 judy 1.56 45 2 lucy 1.67 53 3 lili 1.58 50;/*数据流结束*/Proc print data=sas1_1;Run;12第三节第三节 SASSAS语言的语句和程序语言的语句和程序一、一、SAS 语句语句 1.SAS关键字关键字 几乎所有的SAS语句都是由SAS关键字开始的,说明SAS语句的类型。data语句,input语句,proc语句,run语句2.SAS数据集名和变量名数据集名和变量名 (1)32个字符之内,(2)第一个字母必须为字母
10、或_;第二个以后可以为字母或数字。(3)字母不区分大小写。(4)不能使用空格和%¥#$等特殊字符13第三节第三节 SASSAS语言的语句和程序语言的语句和程序一、一、SAS 语句语句 3.SAS运算符运算符 包括比较运算、算术运算、逻辑运算(1)算数运算符 +-*/*(2)比较运算符 =2 and y3 or/|逻辑或 x2 or y3Not/逻辑非 最大 35;结果为55;结果为3|连接 A=my name is;B=SAS;C=A|B;那么C=“my name is SAS”14第三节第三节 SASSAS语言的语句和程序语言的语句和程序一、一、SAS 语句语句 4.SAS函数函数 函数的一
11、般形式:函数的一般形式:函数名(自变量,自变量,函数名(自变量,自变量,)(1)SAS常用的概率和密度函数常用的概率和密度函数标准正态分布密度函数:标准正态分布密度函数:probnorm(x)如:如:y=probnorm(-1.96);结果为结果为0.025t分布密度函数:分布密度函数:probt(x,df)如:如:y1=probt(0.95,100);结果为结果为0.82780F分布密度函数:分布密度函数:probF(x,df1,df2)2分布密度函数:分布密度函数:probCHI(x,df)二项分布概率函数:二项分布概率函数:probBNML(p,n,m)泊松分布概率函数:泊松分布概率函数
12、:poisson(m,n)15第三节第三节 SASSAS语言的语句和程序语言的语句和程序正态分布分位数函数:正态分布分位数函数:probit(p)0p1 如:如:y=probit(0.025),结果为结果为-1.96t分布分位数函数:分布分位数函数:TINV(p,df)F分布分位数函数:分布分位数函数:FINV(p,df1,df2)2分布分位数函数:分布分位数函数:CINV(p,df)其它常用函数其它常用函数ABS(x)-取取X的绝对值的绝对值SQRT(x)-计算计算X的平方根的平方根MOD(x,y)-求求x/y的余数的余数16第三节第三节 SASSAS语言的语句和程序语言的语句和程序EXP(
13、x)-计算计算e的的x次幂次幂LOG(x)-对自变量对自变量x求以求以e为底的自然对数为底的自然对数LOG10(x)-对自变量对自变量x求以求以10为底的对数为底的对数CEIL(x)-取取自变量自变量x的最小整数。的最小整数。如如CEIL(5.7)=6FLOOR(x)-取取自变量自变量x的最大整数。的最大整数。如如CEIL(5.7)=5INT(x)-取取X的整数部分的整数部分ROUND(x,n)-X按按n的精度取舍入值的精度取舍入值17第三节第三节 SASSAS语言的语句和程序语言的语句和程序data sas1_2;y1=probnorm(-1.96);/*标准正态分布密度函数标准正态分布密度
14、函数*/y2=probt(0.95,100);/*t分布密度函数分布密度函数*/y3=probit(0.025);/*正态分布分位数函数正态分布分位数函数*/x1=log10(100);/*对自变量对自变量x求以求以10为底的对数为底的对数*/x2=exp(2);/*计算计算e的的x次幂次幂*/x3=CEIL(5.7);/*取取自变量自变量x的最小整数的最小整数*/x4=ABS(-8);/*取取X的绝对值的绝对值*/x5=SQRT(36);/*计算计算X的平方根的平方根*/x6=MOD(10,3);/*求求x/y的余数的余数*/x7=FLOOR(5.7);/*取取自变量自变量x的最大整数的最大
15、整数*/x8=INT(5.6874);/*取取X的整数部分的整数部分*/x9=ROUND(5.4874,0.001);/*X按按n的精度取舍入值的精度取舍入值*/A=my name is;B=SAS;C=A|B;proc print data=sas1_2;run;18第三节第三节 SASSAS语言的语句和程序语言的语句和程序二、二、SAS 程序程序 将一系列将一系列SAS语句按逻辑顺序排列起来,构成语句按逻辑顺序排列起来,构成SAS程程序。通常包括数据步和过程步两部分。序。通常包括数据步和过程步两部分。数据步数据步以以data语句开头,以语句开头,以run语句结束。主要作用是语句结束。主要作
16、用是建立数据集。建立数据集。过程步过程步以以proc开头,以开头,以run语句结束。主要作用是激活语句结束。主要作用是激活SAS过程对数据进行处理和分析。过程对数据进行处理和分析。提交提交SAS程序:(程序:(1)工具栏提交图标,)工具栏提交图标,(2)run/submit,(3)使用)使用F3功能键功能键19第三节第三节 SASSAS语言的语句和程序语言的语句和程序二、二、SAS 程序程序 程序的储存:(程序的储存:(1)键入)键入“file 路径路径+文件名文件名.扩展名扩展名”如:如:file d:usersas1-1.sas;(2)“文件文件”菜单菜单“保存保存”程序的调用:(程序的调
17、用:(1)键入)键入infile路径路径+文件名文件名+扩展名扩展名 如:如:infile d:usersas1-1.sas;(2)“文件文件”菜单菜单“打开打开”20第三节第三节 SASSAS语言的语句和程序语言的语句和程序例例1.3 SAS程序举例程序举例data sas1_3;/*创建名为sas1_3的SAS数据集*/Input id nam$height weight;bmi=weight/height*2;cards;1 Judy 1.56 45 /*数据流中每个数据值之间最少有1各空格*/2 Lucy 1.67 53;run;/*数据步结束*/proc print data=sas
18、1_3;/*显示输出sas1_3数据集到output窗口*/run;/*过程步结束*/21第二章第二章 建立建立SASSAS数据集数据集第一节第一节 SAS数据集概述数据集概述一、一、SAS数据集基本格式数据集基本格式SAS数据集可以看做由若干行和若干列组成的表格,数据集可以看做由若干行和若干列组成的表格,一个数据集等价于关系型数据库中的一个表。一个数据集等价于关系型数据库中的一个表。idnameheightweight1Judy156452Lucy167533Susan156554tony17870变量观观测测变量有两种类型:变量有两种类型:数值型变量数值型变量 字符型变量字符型变量22第二
19、章第二章 建立建立SASSAS数据集数据集第一节第一节 SAS数据集概述数据集概述一、一、SAS数据集基本格式数据集基本格式例例2_1 缺失值的例子缺失值的例子Data sas2_1;Input id name$height weight;If name=999 then name=.;If weight=999 then weight=.;Cards;1 Judy 156 999 2 Lucy 167 58 3 999 165 55 4 Tomy 178 62;Proc print data=sas2_1;run;23第二章第二章 建立建立SASSAS数据集数据集二、临时二、临时SAS数据集
20、和永久数据集和永久SAS数据集数据集临时数据集临时数据集只能在只能在SAS会话过程中创建使用,一旦退会话过程中创建使用,一旦退出出SAS,数据集就不存在了。,数据集就不存在了。在在Explorer窗口中可以看到一个名为窗口中可以看到一个名为work的的SAS数据数据库,主要存放库,主要存放SAS临时数据集。创建时可以用两水平临时数据集。创建时可以用两水平命名方式:如命名方式:如work.数据集名数据集名,也可以用,也可以用一水平的命一水平的命名方式名方式:如:如数据集名。数据集名。24二、临时二、临时SAS数据集和永久数据集和永久SAS数据集数据集永久性数据集永久性数据集储存在硬盘里,因此,在
21、以后的每一次储存在硬盘里,因此,在以后的每一次SAS会话中都可以在打开。在创建和使用会话中都可以在打开。在创建和使用SAS永久性永久性数据集之前,需要先建立一个数据集之前,需要先建立一个SAS数据库来制定永久数据库来制定永久数据集存放的路径。一个数据集存放的路径。一个SAS数据库相当于硬盘上的数据库相当于硬盘上的一个文件夹,可以将一个文件夹,可以将SAS数据集写入或读出。数据集写入或读出。命名永久性数据集时必须用命名永久性数据集时必须用两水平的命名方式两水平的命名方式,即,即数数据库名据库名.数据集名数据集名,数据库名实际是一个,数据库名实际是一个SAS数据库的数据库的逻辑名。逻辑名。第二章第
22、二章 建立建立SASSAS数据集数据集25例例2_2 SAS程序举例程序举例libname tj d:user;/*创建名为tj的sas数据库*/data tj.sas2_2;/*创建永久性数据集sas2_2,保存在d:user下*/Input id name$height weight;bmi=weight/height*2;cards;1 Judy 1.56 45 2 Lucy 1.67 53;run;proc print data=tj.sas2_2;/*将保存在d:user的数据集sas2_2显示输出到output窗口*/run;第二章第二章 建立建立SASSAS数据集数据集26第二章
23、第二章 建立建立SASSAS数据集数据集第二节第二节 SAS数据集的建立数据集的建立一、用数据步创建一、用数据步创建SAS数据集数据集创建创建SAS数据集最主要的方式是使用数据集最主要的方式是使用Base SAS中的数据步。中的数据步。一个一个SAS数据步由数据步由data语句开始,后面接着其他程序语句,语句开始,后面接着其他程序语句,通过从原始数据文件中读入数据或对已存在的通过从原始数据文件中读入数据或对已存在的SAS数据集进数据集进行操作来建立新的行操作来建立新的SAS数据集。在数据集。在SAS程序中,用户可以使程序中,用户可以使用不同的来源输入数据。常用的数据输入来源包括用不同的来源输入
24、数据。常用的数据输入来源包括:(1)原始数据以数据流的方式;)原始数据以数据流的方式;(2)原始数据以外部文件的方式;)原始数据以外部文件的方式;(3)已经存在的)已经存在的SAS数据集;数据集;(4)通过程序语句来建立数据集。)通过程序语句来建立数据集。271、从数据流中读入数据、从数据流中读入数据在在SAS程序中,用程序中,用cards语句定义数据流的开始。语句定义数据流的开始。Input语句用于从数据流中读入数据。语句用于从数据流中读入数据。28例例2.3 从数据流读入数据建立数据集从数据流读入数据建立数据集data sas2_3;/*创建名为sas2_3的SAS数据集*/Input i
25、d name$height weight;/*从数据流中读入数据*/cards;1 Judy 156 45 2 Lucy 167 53 3 Susan 165 55 4 tony 178 70;run;/*数据步结束*/proc print data=sas2_3;/*显示输出sas2_3数据集到output窗口*/run;/*过程步结束*/292、从外部文件中读入数据、从外部文件中读入数据Infile语句用来指定外部文件,通常外部文件并不是语句用来指定外部文件,通常外部文件并不是SAS文件。用文件。用input语句将外部文件中的数据读入语句将外部文件中的数据读入SAS中建立中建立SAS数据集
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 统计分析 软件 应用
限制150内