《SAS系统和数据分析》教学文案.doc
Good is good, but better carries it.精益求精,善益求善。SAS系统和数据分析-第一课 SAS系统简介一. SAS系统1 什么是SAS系统SAS系统是一个模块化的集成软件系统。所谓软件系统就是一组在一起作业的计算机程序。SAS系统是一种组合软件系统。基本部分是BaseSAS软件2 SAS系统的功能SAS系统是大型集成应用软件系统,具有完备的以下四大功能:l 数据访问l 数据管理l 数据分析l 数据显示3 它是美国软件研究所(SASInstituteInc.)经多年的研制于1976年推出。目前已被许多国家和地区的机构所采用。SAS系统广泛应用于金融、医疗卫生、生产、运输、通信、政府、科研和教育等领域。它运用统计分析、时间序列分析、运筹决策等科学方法进行质量管理、财务管理、生产优化、风险管理、市场调查和预测等等业务,并可将各种数据以灵活多样的各种报表、图形和三维透视的形式直观地表现出来。在数据处理和统计分析领域,SAS系统一直被誉为国际上的标准软件系统。SAS系统的主要模块SAS系统包含了众多的不同的模块,可完成不同的任务,主要模块有:l SAS/BASE(基础)初步的统计分析l SAS/STAT(统计)广泛的统计分析l SAS/QC(质量控制)质量管理方面的专门分析计算l SAS/OR(规划)运筹决策方面的专门分析计算l SAS/ETS(预测)计量经济的时间序列方面的专门分析计算l SAS/IML(距阵运算)提供了交互矩阵语言l SAS/GRAPH(图形)提供了许多产生图形的过程并支持众多的图形设备l SAS/ACCESS(外部数据库接口)提供了与大多数流行数据库管理系统的方便接口并自身也能进行数据管理l SAS/ASSIST(面向任务的通用菜单驱动界面)方便用户以菜单方式进行操作l SAS/FSP(数据处理交互式菜单系统)l SAS/AF(面向对象编程的应用开发工具)另外SAS系统还将许多常用的统计方法分别集成为两个模块LAB和INSIGHT,供用户利用图形界面和菜单直接对数据进行统计分析4 SAS系统的特点最大特点是把数据管理和数据分析融为一体,主要特点为:1. 使用灵活方便,功能齐全SAS的宗旨是为所有需要进行数据处理,数据分析的非计算机专业人员提供一种易学易用,完整可靠的软件系统。使用简单方便:用户把要解决的问题,用SAS语言表达出来,组成SAS程序,提交给SAS系统就可以解决提出的问题。执行的情况和输出结果都在屏幕上显示出来。用户操作是在很友好的界面下进行的。功能齐全:从SAS系统的模块结构,用户根据需要可灵活地选择使用。SAS系统提供的20多个模块可完成各方面的实际问题,功能非常齐全。SAS语言是编程能力强且简洁易学的非过程语言。SAS语言是SAS系统的基础,是用户与系统对话的语言。SAS语言是功能强大的程序设计语言,2. SAS语言是非过程语言,不必告诉SAS怎样做,只需告诉它你要“做什么”。SAS系统把数据处理与统计分析融为一体。SAS程序的结构由两个基本步骤任意组合而成。DATA步用于对数据的加工处理;PROC步用于分析数据和编写报告。5 SAS系统的支持技术在当今的信息时代中,如何有效地利用业务高度自动化所产生的巨量宝贵数据,挖掘出对预测和决策有用的信息,就成为掌握竞争主导权的关键因素。因此,SAS系统始终致力于应用先进的信息技术和计算机技术对业务和历史数据进行更深层次的加工。经过二十多年的发展,SAS系统现在是以下三种技术的主要提供者:l 数据仓库技术l 数据挖掘技术l 决策支持技术二. WINDOWS运行环境下SAS系统的安装1 Novel局域网上共享SAS系统操作步骤:(1). 以UserWindows98进入操作系统登录Novel312-Serverl 双击网上邻居l 双击233l 登录对话框:用户名键入Guest,口令1111(2). 将服务器上的SYS目录映射到网络驱动器I:l 右键SYS出现快显菜单,选择映射到网络驱动器I:l 将登录时重新连接选项选定(3). 将SAS以快捷方式复制到桌面l 找到SAS目录下的SAS.EXE运行文件l 右键SAS.EXE出现快显菜单,选择发送到桌面快捷方式(4). 在本地工作站硬盘的E目录下建立SAS目录l 打开资源管理器,单击选中E目录l 文件/新建/新文件夹/键入SAS(5). 修改机器的系统日期为2000年9月l 双击我的电脑l 双击控制面板l 双击日期时间l 修改日期三. 启动SAS系统WINDOWS环境下启动SAS系统四. 双击“TheSASSystem”图标显示管理系统窗口1 显示管理系统(DisplayManager)三个主要窗口:l PROGRAMEDITOR窗口:编写SAS源程序,存储或调入文件,提交SAS程序和SAS系统执行的场所,l LOG窗口:显示SAS系统的信息和SAS程序运行的信息l OUTPUT窗口:存放和显示SAS程序运算结果的输出2 显示管理系统的常用窗口l KEYS查看及改变功能键的设置l LIBNAME查看已经存在的SAS数据库l DIR查看某个SAS数据库的内容l VAR查看SAS数据集的有关信息l OPTIONS查看及改变SAS的系统设置假设我们准备自定义F12功能键为OPTIONS命令,打开KEYS窗口后在F12的右边的空白区键入OPTIONS,完毕之后在命令框中键入END命令退出KEYS窗口五. 显示管理系统命令1 显示管理系统命令的发布有四种命令的发布方式都可达到相同结果。l 在命令框中直接键入命令l 按功能键l 使用下拉式菜单l 使用工具栏例如我们要增加一个OUTPUT窗口,相应地四种操作如下:l 命令框中直接键入OUTPUT和Enterl 功能键F7l Globals/Outputl tools/customize(options/edittools)Add按钮选择Tool,新增了一个空白按钮Command命令框中输入:OUTPUT;HelpText命令框中输入:AddnewbuttoncreatebyDZX;TipText命令框中输入:Output。再单击Browse命令挑选一个合适的按钮。单击MoveDn按钮将OUTPUT按钮移动到最后Help按钮之后单击Add按钮选择Separator,使Help按钮和新增OUTPUT命令按钮之间有一个空白的分组间隙。单击Save按钮2 文本编辑行命令文本编辑行命令的主要作用是为在PROGRAMEDITOR窗口方便和高效地输入和修改SAS程序提供一组编辑命令。文本编辑行命令可归两个子类:l 命令行命令在命令框中输入NUMS命令l 行命令在行号上键入执行指定功能的字母来完成编辑功能例如,我们在PROGRAMEDITOR窗口中的第一行到第三行输入假设的数据和程序:“Dataandprogramlineone”,“Dataandprogramlinetwo”,“Dataandprogramlinethree”。若想在第1行与第2行之间插入空行:l 在第1行的行号前键入i(或I,或i1、I1)若想保存和调入程序:l 在命令框中键入:FILE"D:SASABC02.SAS"l 先光标定位到指定某行,再在命令框中键入:INCLUDE"D:SASABC02.SAS"六. SAS系统的几组重要命令1 向SAS系统寻求帮助命令l F1键和F2键提供信息相当于简明的SAS使用手册2 显示管理系统命令框常用命令类型命令描述显示管理命令BYE退出SASCLEARwindow-name清除指定的窗口中的内容END退出当前窗口FILE"filename"存储到指定文件HELP帮助INCLUDE"filename"引入指定文件KEYS进入KEYS窗口LIBNAME确认SAS数据库的内容LOG进入LOG窗口NUMS打开和关闭文本编辑器的数字区OPTIONS进入OPTIONS窗口OUTPUT进入OUTPUT窗口PROGRAM进入PROGRAMEDITOR窗口RECALL调出上次执行的程序SUBMIT提交一段程序3 文本编辑行命令本组命令很多,这里仅给出其中几个最常用的:类型命令描述文本编辑行命令DN删除自当前行起的N行,D或D1都只表示删除当前行IN在当前行之后插入N个空行 >N使当前行内容右移N个字符<N使当前行内容左移N个字符CN把自当前行起的N行内容拷贝到由A、B命令指定位置MN把自当前行起的N行内容移动到由A、B命令指定位置其中一部分可单独使用,另一部分需与操作定位命令A、B(A指after,B指before)配合起来使用。例如,我们要将第一行和第二行的内容移到第三行的后面:l 第一行行号前键入M2l 第三行行号前键入A命令,然后按Enter键七. 运行SAS程序的步骤1 在PROGRAMEDITOR窗口中键入程序见图1Error! No sequence specified.所示图2Error! No sequence specified.一个典型的SAS程序实例2 提交这段程序有四种方法可以提交这段程序:l 在命令框中直接键入命令SUBMITl 用鼠标选择菜单命令Locals/Submitl 按功能键F3l 用鼠标点击标准工具栏的第一个按钮另外,还可以用菜单命令Locals/Submittopline来提交PROGRAMEDITOR程序窗口中的某一条SAS语句,常用来测试这条语句的执行结果。3 查看LOG窗口的信息4 重新调出刚才提交的程序l 命令框中发布RECALL命令5 在OUTPUT窗口查看运行结果如果我们需要修改和增加运行结果报告的标题,操作如下:l 选择Globals/Options/Titles命令。l 出现TITLES窗口,删除原第一大标题的内容“TheSASsystem”。l 在第一行和第二行分别输入所需要的大小标题的内容,见图1Error! No sequence specified.所示。l 选择Options/Savesettingsnow命令,保存我们刚才的修改。6 存储程序l 再发布RECALL命令重新调出刚才提交的程序,l 然后可用File/Saveas菜单命令把程序存储到外部文件中(也可发布FILE命令达到相同的目的)。l 如果今后要重新运行这个程序,用File/Open菜单命令把这个外部程序重新调入到SAS系统的PROGRAMEDITOR窗口中。l 如果今后要将这个程序插入到正在PROGRAMEDITOR窗口编辑的某程序的某处,可发布INCLUDE命令把外部这个程序导入到某程序中SAS程序文件的后缀为.SAS实例:dataclass;inputname$test1test2test3;cards;Xiaoer908688Zhangsan1009889Lisi797670Wangwu687164zhaoliu1008999;run;例子:假定某公司生产两类机器:小型机器和计算机。这些机器由公司的职员负责在四个地区销售。下表给出的数据包括销售人员的名字(NAME),销售的地区(REGION),机器的类型(TYPE),和年销售量(SALES)。利用这些资料,想知道每个地区的年销售总量是多少,每种类型的机器卖了多少,及每类机器的人均销售量是多少。datasale;inputname$salesregion$type$;cards;stafer9664eastsmyoung22969eastsmstride27253eastsmtopin86432eastcspeak99210eastcvetter38928westccurci21531westsmmarco79345westcGreco18523westsmryan32915westsmtomas42109westsmthaiman94320southcmoore25718southsmallen64700southcstelam27634southsmfarlow32719northsmsmith38712northsmWilson97214northcrun;procprint;run;procfreq;tablestype*region;run;procsort;bytype;run;procmeans;title'meansoftwokindsofsalesdata'bytype;run;-