SAS基础教程.ppt
《SAS基础教程.ppt》由会员分享,可在线阅读,更多相关《SAS基础教程.ppt(153页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、目 录SAS系统简介和基础操作 SAS系统的工作环境;SAS系统对数据文件的管理;用编程读入数据建立SAS数据集;数据加工;数据汇总与报表制作;制作图形展现数据SAS宏入门 SAS系统概述和基础操作 SAS SAS 系统SAS系统是用于建立数据仓库并进行数据分析与决策支持的大型集成式模块化软件系统。(其早期的名称为 Statistical Analysis System)被誉为数据处理和统计分析领域的国际标准软件SAS SAS 系统软件构成 SAS系统是一个可由几个到二、三十个专用模块及面向行业的子系统组成的大型集成式软件包,其模块按功能大体上分为四类:数据库部分:Base SAS,FSP,A
2、CCESS,.分析核心:QC,INSIGHT,STAT,ETS,.开发呈现工具:AF,EIS,GRAPH,.分布处理与数据仓库:CONNECT,WA,.SAS SAS 系统介绍 SAS系统是一个模块化、集成化的应用软件系统,使用SAS系统可以实现对数据的完全控制和充分利用。SAS系统主要完成以数据为中心的四大任务:数据访问.数据管理.数据呈现.数据分析.(所有的工作在一个平台内完成)信息交付信息交付 SAS的核心任务(从数据到信息)数据采集 管理 组织 利用 信息知识输出SAS SAS 系统的组件SAS系统的核心:Base SAS模块,用于管理并呈现数据,包含有一套编程语言以及一系列过程,是其
3、它模块的基础:SAS数据的存储:关系型数据存储:data set,data view;完全支持SQL标准的数据结 构和数据处理.多维数据存储:MDDB/Cube;没有结构性冗余的有效存储.数据挖掘库:DMDB;针对数据挖掘特点的数据存储.并行处理数据引擎:智能数据切分功能,优化的索引结构.SAS SAS 系统的组件数据访问:通过SAS/ACCESS模块,可读取各种数据源,包括:u Informix,UDB,Sybase,Oracle,SQL Server;u cobol;u 对ODBC,OLE DB支持的数据源;u Windows下的文件:.DBF,.Excel;u 文本格式的文件;u htm
4、l格式的文件.u SAS SAS 系统的组件数据统计分析:SAS/STAT 覆盖了当今世界上所有的实用数理统计分析方法,可 以适应各种不同模型和不同特点数据的需要;SAS/ETS 提供了丰富的计量经济学和时间序列分析方法;SAS/INSIGHT 一个功能强大的可视化的数据探索与分析的工具;SAS/OR 用于进行运筹运算;SAS/QC 功能强大的质量控制软件。SAS SAS 系统的组件SAS数据仓库-SAS/WA:SAS的数据仓库技术集成地实现了数据访问和数据管理的任务,不仅能访问存在于不同地点地任何形式地数据,而且将之进行分类、合并、归纳、整理及深层分析后得到有用的信息,这些支持决策地信息具有
5、开放性,能被其它应用系统访问。SAS/WA:是非常优秀地可视化数据仓库管理工具,涉及数据仓库建立 工程中地各个环节。OLAP系列:SAS/MDDB,Open OLAP Server,SAS/EISSAS SAS 系统的组件表现工具:前端开发工具:SAS/AF 图形表现工具:SAS/GRAPH,可制作出各种二维和三维图形,如柱 状图,散点图,饼图等等;地理信息表现工具:SAS/GISWeb产品:SAS/Intrnet:SAS/StoredProcess SAS/WebEIS:SAS/Portal SAS/Web Report Studio SAS/WebAF SAS系统的基本运行环境SAS系统的
6、工作环境SAS系统可以有多种方式在各种操作系统中运行,常用的有:交互方式:直接在SAS操作环境下进行操作,SAS系统执行任务并返回结果,可不断地根据返回的结果继续操作。批作业方式:操作者向操作系统提交启动SAS作业的要求和全部要运行的SAS程序,再由操作系统安排这一作业运行,操作者可在事后获得SAS程序运行的全部结果。SAS系统的交互工作环境启动 SAS(1)在Windows桌面系统下双击SAS图标;(2)运行 SAS 系统目录下(例C:SAS8)的可执行程序 sas.exe;(3)从“运行”打开或从“资料管理器”双击某个已有的 SAS程序,也可启动SAS系统并调入该程序.SAS提供的基本运行
7、环境SAS提供了强有力的交互式用户界面:显示管理系统。基本窗口及窗口条:Editor窗口:用于编写、编辑和执行SAS程序语句;Log窗口:显示当前会话程序运行的信息;Output窗口:显示程序的输出;Result窗口:管理输出结果;Explorer窗口:管理SAS系统中的文件;下拉菜单或弹出菜单:命令框、工具拦、信息窗:基本窗口基本窗口 基本窗口基本窗口显示管理系统运行一个简单的SAS程序:1、在Editor窗口中输入程序:procproc printprint data=sasuser.class;/*simple1.sas*/var name sex age;where age gt 13
8、;runrun;2、通过菜单、命令框、工具栏或功能键等都可提交程序;3、在Log中查看程序的运行信息,在Output窗口中查看运行结果。4、若需要重新找回程序,可通过功能键或菜单进行。显示管理系统其它一些窗口:KEYS窗口:查看及改变功能键的设置;OPTIONS窗口:查看及改变SAS的系统设置;LIBNAME窗口:查看已存在的SAS数据库;DIR窗口:查看某个SAS数据库的内容;VAR窗口:查看SAS数据集的有关信息;显示管理系统l每个窗口都有自己相应的菜单选项;l可通过点击窗口条或在查看菜单打开不同的窗口;l在工具菜单可以调用一些实用的工具以及定制系统的属性;如:可以通过选择菜单进行:表编辑
9、、报表编辑、图形编辑以及文本编辑等等;l在选项子菜单下可以查看及定制系统的一些属性;如:在参数菜单中可以把过程的输出定制为HTML文件,保存在某个目录中,默认为临时库的目录。l在解决方案菜单中包含了部分SAS模块的菜单操作环境;SAS系统对数据文件的管理SAS文件类型有多种不同的SAS文件类型,其中包括有:SAS data set/view(SAS数据集/视图)SAS对数据的分析与呈现都是面对SAS数据集进行的,得到它们主要有三个途径:1)直接在SAS系统中输入数据;2)用SAS数据步(Data Step)将外部数据文件转换为SAS 数据集;3)通过SAS/ACCESS软件访问其它的数据库管理
10、系统。SAS Catalog是保存有多种不同类型信息的SAS文件 SAS数据对象SAS数据集通常分为两个部分:描述部分:包含数据的属性信息;数据部分:包含数值。数据集的列称为变量(Variable),类似于域或字段,变量名最长为32个字符,以字母或下划线开始,可包含字母、数字和下划线;数据集的行称为观测(Observation),相当于记录,观测数不受限制。SAS数据视图只有描述部分,没有数据部分:但描述部分包含了足够的信息以找到保存在其他文件中的数据;数据视图减少了维护费用,源数据一旦改变,数据视图将随着改变,可由SQL、ACCESS和DATA Step产生。SAS数据集描述部分包含的信息包
11、括有:变量的名字;变量的属性;数据集中的观测数;数据集创建或修改的时间等SAS数据对象在编程环境下查看数据对象的描述部分可用以下过程:浏览数据集的数据部分:发命令:VT(或FSV)数据集名提交程序:SAS数据库SAS 数据集存储在SAS逻辑库中;SAS 逻辑库还存储有其它的 SAS 专用文件(由SAS 创建和管理的文件);SAS 逻辑库只是一个逻辑概念,指向了某个存储目录;SAS文件用两级命名方式命名:libname.SAS-filename(库标记.文件名)库标记指的是逻辑库的名字(最长8个字符,以字母或下划线开始,可包含字母、数字和下划线)。SAS数据库SAS逻辑库分为永久库和临时库:永久
12、库:SASUSER、SASHELP、自定义的库;临时库:WORK (关闭会话,内容将丢失)。自定义的库若不指定,关闭SAS后,库标记将失效,但内容被保存下来。每次启动,SAS都自动产生两个SAS逻辑库:WORK(引用WORK库中的文件可省略库标记)SASUSERSAS数据库的设定不同的主操作系统下逻辑库以不同的方式与主操作系统下的文件组织相联系;在Windows下每个SAS逻辑库与某个子目录相连系,即SAS逻辑库包含指定子目录内的所有SAS文件(不含更下一级子目录内容);例:SASUSER:C:documents and settings.V8 BASE DATA:C:base dataSAS
13、数据库的设定设定一个SAS逻辑库就是与操作系统的某个物理位置建立一个联系,让SAS系统可以对该位置上的SAS文件进行管理;解除一个SAS逻辑库只是解除上述联系,并不删除该物理位置上的SAS文件。多个SAS逻辑库可与同一个物理位置相连接一个SAS逻辑库也可与多个物理位置相连接SAS数据库的设定标记一个SAS逻辑库有两种方法:通过菜单进行;libname 库标记 引擎 数据源 选项;engine(引擎)是一种访问架构,SAS的逻辑库都有一个引擎,这个引擎决定了SAS可以访问和写入的SAS文件格式。它可以是V9,V8等不同的SAS版本,也可以是Oracle,DB2等表示外部数据格式文件,还有SPSS
14、,DMBP等为一些其它软件格式文件使用的数据。不同引擎的库连接可构成混合引擎的库,实现同时看到库内不同引擎的文件。SAS数据库的设定lSAS9可以读出V8的SAS文件,可以修改和写入V8的Data Set和catalog;lV8数据集转为SAS9:Proc Migration,Proc Copy,Proc datasets的copy语句;lV8 Catalog转为SAS9:Proc Migration。SAS数据库用菜单设定1.按工具条上图标(新建逻辑库新建逻辑库)可进入设定新的逻辑库的新新 建逻辑库建逻辑库窗口;2.浏览器窗口击活时,在下拉菜单中选:文件=新建=逻辑库 可进入设定SAS逻辑库
15、的窗口。3.在SAS环境处右击鼠标,在弹出的菜单中选新建.,也可进入新建逻辑库新建逻辑库窗口。注意启动时使用选项的使用。利用SAS/CONNECT建立连接 利用SAS/CONNECT建立连接 SAS/CONNECT软件提供了SAS应用的协同环境,提供了运行在不同平台上的SAS之间的通讯连接。利用SAS/CONNECT,一个在本地运行的SAS程序可以与一个或多个远端SAS进程建立连接,在建立连接的基础上,还可以通过本地SAS访问到远端的数据,也可以递交程序给远端SAS进程来执行,并将结果返回到本地。在登录到远端系统之前,必须制定下列内容:通讯方法;需要连接的远程机器的IP地址;合适的脚本文件。利
16、用SAS/CONNECT建立连接 范例(与UNIX主机(S85)连接):%let ser_name=190.2.200.45;options remote=ser_name comamid=tcp;filename rlink!SASROOTtcpunix.scr;signon;当与远端建立连接后,可在本地SAS通过运行libname建立库标记,访问远端数据.libname 库标记名 “文件所在路径”server=ser_name;利用窗口菜单操作和创建SAS数据集SAS数据集的变量lSAS数据集的列称为变量(Variable),变量的类型:l字符型变量(Character Variable)
17、:可包含任何值,包括字母、数字和特殊字符,长度为1 至32,767个字节;l数值型变量(Numerical Variable):通常只包含数字,包括科学计数法和十六进制表示法 中的数字,保存为8个字节的浮点数;SAS数据集的缺失值处理许多数据集中都会有缺失值,SAS对此作以下处理:对于数值型变量,这个值显示为一个点.;对于字符型变量,这个值显示为空格。例子:data tmp;length var1$8.;length var2$8.;length var3 8.;length var4 8.;var2=abc;var4=123;run;输入格式和输出格式SAS数据集数据的格式:输入格式(Inf
18、ormat):指示SAS系统如何读入数据。输出格式(Format):指示SAS系统如何输出数据。使得数据表或报表中看到的数据的值并不一定就是数据的实际存储值;使得SAS系统不同于其他的分析系统,只具有两种类型的变量就能进行广泛的数据处理和分析。输入格式和输出格式它们的一般形式如下:informat-name.format-name.$代表变量是字符型Informat-name 输入格式名Format-name 输出格式名W 输入或输出的总宽度(包括$和,).必须的分隔符d 小数部分的长度,默认为0注意:所有输入输出格式必须包含一个点.作为名字的一部分输入格式和输出格式SAS系统提供的几种常用输
19、入输出格式:w.d 标准的数字型格式$w.标准的字符型格式commaw.d 数字中加入逗号dollarw.d 数字中加入逗号,数字前加入$datew.日期格式bestw.SAS选择最佳表示法此外,用户还可以自定义格式。输入格式和输出格式根据输入格式来读入数据,不同的格式读入为不同的存储数值:输入格式和输出格式根据需要使用输出格式,使存储数值输出为所需要的数值,但并没有改变实际的存储值:SAS对日期时间值的处理SAS日期值、日期时间值在SAS内部都是以数值型变量存储:如1962年3月3日被存储为792:即366+365+31+28+2=792.SAS对日期时间值的处理SAS存储时间值为从午夜开始
20、到此刻的秒数:如9:54存储为35640(9*60*60+54*60=35640)一个日期时间值存储为从1960年1月1日午夜到这个日期时间之间的秒数:如1985年4月27日17点49分45秒被存储为799091385将一个日期时间表示为一个常数:将日期或时间加上引号,后面加上d,如01JAN86d SAS对日期时间值的处理SAS通过输入格式和输出格式将日期值与其他较易阅读的日期形式联系起来:如1992年10月16日可表示为:MMDDYYw.101692(MMDDYY6.)或者 10/16/92(MMDDYY8.)DDMMYYw.161092(DDMMYY6.)或者 16/10/92(DDMM
21、YY8.)DATEw.16OCT92(DATE7.)或者 16OCT1992(DATE9.)使用Viewtable浏览SAS数据集Viewtable提供一个显示数据集的窗口,它具有对数据集的浏览、编辑和创建的功能:如何进入Viewtable窗口:(1)在SAS逻辑库对话框中双击数据集图标 (2)在命令栏键入命令:VT 数据集名 例如:VT SASHELP.CLASS使用Viewtable浏览SAS数据集通过Viewtable窗口打开的数据集有两种模式:浏览模式:只能浏览,不能进行修改;(默认模式)编辑模式:改为该模式后,可对数据进行一系列操作,包括:设置条件取子集;改变表和变量的属性;排序、另
22、存为其它格式文件;根据数据作图、作报表等等.使用Viewtable新建SAS数据集用Viewtable打开一个空白表:在命令栏输入:vt在相应的逻辑库点击鼠标右键,选新建,再选表设定变量属性:在相应的列右击鼠标,输入变量名、标签、长度、输入输出格式等内容;输入数据:在相应的单元格中输入相应的内容。SAS导入和导出数据Import/Export 工具使你能够:导入 指的是从外部数据源读入数据,并把它保存为SAS数据集;导出 指的是把一个SAS数据集保存为一个外部文件。外部数据源包括有:Microsoft Excel 4,5,7,97 or 2000 电子表格;Microsoft Access 9
23、7 or 2000 表dBASELotus 1,3,or 4 电子表格delimited files 分隔文件导出数据流程导出数据流程 导出数据流程导出数据流程 开始:单击【File】菜单中的【Export Data】:导出数据流程导出数据流程 选择源数据集从LIBRARY下拉列表中选择数据库,从MEMBER下拉列表中选择数据集,单击NEXT按钮,得到下图:导出数据流程导出数据流程 选择目标数据集类型,单击NEXT按钮,得下图:导出数据流程导出数据流程 命名、定位目标数据集 在窗口键入保存位置,单击FINISH按钮完成,或单击NEXT按钮,得下图:导出数据流程导出数据流程 命名、定位导出程序
24、在窗口键入程序名及其保存位置,单击FINISH按钮完成。语法:PROC EXPORT DATA=sashelp.class OUTFILE=“C:contact.xls”DBMS=EXCEL2000 REPLACE;RUN;注释:.DATA=sashelp.class:定义源数据集.OUTFILE=“C:contact.xls”:定义目标数据文件.DBMS=EXCEL2000:定义目标数据类型,.REPLACE:“替换”选项,表明目标数据集以替换方式更新。导入数据流程导入数据流程 导入数据流程导入数据流程 开始:单击【File】菜单中的【Import Data】:导入数据流程导入数据流程 选择
25、源数据集,单击NEXT按钮,得到下图:导入数据流程导入数据流程 选择目标数据集(SAS数据集),单击NEXT按钮,得下图:导入数据流程导入数据流程 命名、定位目标数据集 从Library下拉列表中选择数据库名,从Member下拉列表中选择(或输入)数据集名,单击Finish完成,或Next按钮,得到下图:导入数据流程导入数据流程 命名、定位导出程序 在窗口键入程序名及其保存位置,单击FINISH按钮完成。语法:PROC IMPORT OUT=WORK.contact DATAFILE=c:contact.xls DBMS=EXCEL2000 REPLACE;GETNAMES=YES;RUN;注
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 基础教程
限制150内