《系统和数据分析计算机数据挖掘与模式识别_计算机-数据挖掘与模式识别.pdf》由会员分享,可在线阅读,更多相关《系统和数据分析计算机数据挖掘与模式识别_计算机-数据挖掘与模式识别.pdf(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一课 SAS 系统简介.SAS 系 统 1 什么是 SAS 系统 SAS 系统是一个模块化的集成软件系统。所谓软件系统就是一组在一起作业的计算机程 序。SAS系统是一种组合软件系统。基本部分是 Base SAS软件 2 SAS 系统的功能 SAS 系统是大型 集成 应用软件系统,具有完备的以下四大功能:数据访问 数据管理 数据分析 数据显示 它是美国软件研究所(SAS Institute Inc.)经多年的研制于 1976 年推出。目前已被许多国 家和地区的机构所采用。SAS 系统广泛应用于金融、医疗卫生、生产、运输、通信、政府、科研和教育等领域。它运用统计分析、时间序列分析、运筹决策等科学
2、方法进行质量管理、财务管理、生产优化、风险管理、市场调查和预测等等业务,并可将各种数据以灵活多样的 各种报表、图形和三维透视的形式直观地表现出来。在数据处理和统计分析领域,SAS 系统 一直被誉为国际上的标准软件系统。3 SAS 系统的主要模块 SAS 系统包含了众多的不同的模块,可完成不同的任务,主要模块有:SAS/BASE(基础)初步的统计分析 SAS/STAT(统计)广泛的统计分析 SAS/QC(质量控制)质量管理方面的专门分析计算 SAS/OR(规划)运筹决策方面的专门分析计算 SAS/ETS(预测)计量经济的时间序列方面的专门分析计算 SAS/IML(距阵运算)提供了交互矩阵语言 S
3、AS/GRAPH(图形)提供了许多产生图形的过程并支持众多的图形设备 SAS/ACCESS(外部数据库接口)提供了与大多数流行数据库管理系统的方便接 口并自身也能进行数据管理 SAS/ASSIST(面向任务的通用菜单驱动界面)方便用户以菜单方式进行操作 SAS/FSP(数据处理交互式菜单系统)SAS/AF(面向对象编程的应用开发工具)另外 SAS 系统还将许多常用的统计方法分别集成为两个模块 LAB 和 INSIGHT,供用户 利用图形界面和菜单直接对数据进行统计分析 4 SAS 系统的特点 最大特点是把数据管理和数据分析融为一体,主要特点为:1.使用灵活方便,功能齐全 SAS的宗旨是为所有需
4、要进行数据处理,数据分析的非计算机专业人员提供一种易学易用,完整可靠的软件系统。使用简单方便:用户把要解决的问题,用 SAS语言表达出来,组成 SAS程序,提交给SAS系 统就可以解决提出的问题。执行的情况和输出结果都在屏幕上显示出来。用户操作是在很友 好的界面下进行的。功能齐全:从SAS系统的模块结构,用户根据需要可灵活地选择使用。SAS系统提供的20多 个模块可完成各方面的实际问题,功能非常齐全。2.SAS语言是编程能力强且简洁易学的非过程语言。SAS语言是SAS系统的基础,是用户与系统对话的语言。SAS语言是功能强大的程序设计语言,SAS语言是非过程语言,不必告诉 SAS怎样做,只需告诉
5、它你要“做什么”。3.SAS系统把数据处理与统计分析融为一体。SAS程序的结构由两个基本步骤任意组合而成。DATA步用于对数据的加工处理;PROC步 用于分析数据和编写报告。5 SAS 系统的支持技术 在当今的信息时代中,如何有效地利用业务高度自动化所产生的巨量宝贵数据,挖掘出 对预测和决策有用的信息,就成为掌握竞争主导权的关键因素。因此,SAS 系统始终致力于 应用先进的信息技术和计算机技术对业务和历史数据进行更深层次的加工。经过二十多年的发展,SAS 系统现在是以下三种技术的主要提供者:数据仓库技术 数据挖掘技术 决策支持技术 二.WINDOWS 运行环境下 SAS 系统的安装 1 Nov
6、el 局域网上共享 SAS 系统 操作步骤:序系统是一种组合软件系统基本部分是软件系统的功能系统是大型集成应用软件系统具有完备的以下四大功能数据访问数据管理数据分析数据显示它是美国软件研究所经多年的研制于年推出目前已被许多国家和地区的机构所采用系法进行质量管理财务管理生产优化风险管理场调查和预测等等业务并可将各种数据以灵活多样的各种报表图形和三维透视的形式直观地表现出来在数据处理和统计分析领域一直被誉为国际上的标准软件系统系统的主要模块系统系统理方面的专门分析计算规划运筹决策方面的专门分析计算预测计量经济的时间序列方面的专门分析计算距阵运算提供了交互矩阵语言图形提供了许多产生图形的过程并支持众
7、多的图形设备外部数据库接口提供了与大多数流行数据库(1).以 User Windows98 进入操作系统 2).登录 Novel312-Server 双击网上邻居 双击 233 登录对话框:用户名键入 Guest,口令 1111 3).将服务器上的 SYS 目录映射到网络驱动器 I:右键 SYS 出现快显菜单,选择映射到网络驱动器 I:将登录时重新连接选项选定 4).将 SAS 以快捷方式复制到桌面 找到 SAS 目录下的 SAS.EXE 运行文件 右键 SAS.EXE 出现快显菜单,选择发送到桌面快捷方式 5).在本地工作站硬盘的 E 目录下建立 SAS 目录 打开资源管理器,单击选中 E
8、目录 文件/新建/新文件夹/键入 SAS 6).修改机器的系统日期为 2000年 9月 双击我的电脑 双击控制面板 双击日期时间 修改日期.启 动 SAS 系 统 WINDOWS 环境下启动 SAS 系统 双击“The SAS System”图标 四.显示管理系统窗口 1 显示管理系统(Display Manager)三个主要窗口 PROGRAM EDITOR 窗口:编写 SAS 源程序,存储或调入文件,提交 SAS 程序和 SAS 系统执行的场所,LOG 窗口:显示 SAS 系统的信息和 SAS 程序运行的信息 OUTPUT 窗口:存放和显示 SAS 程序运算结果的输出 序系统是一种组合软件
9、系统基本部分是软件系统的功能系统是大型集成应用软件系统具有完备的以下四大功能数据访问数据管理数据分析数据显示它是美国软件研究所经多年的研制于年推出目前已被许多国家和地区的机构所采用系法进行质量管理财务管理生产优化风险管理场调查和预测等等业务并可将各种数据以灵活多样的各种报表图形和三维透视的形式直观地表现出来在数据处理和统计分析领域一直被誉为国际上的标准软件系统系统的主要模块系统系统理方面的专门分析计算规划运筹决策方面的专门分析计算预测计量经济的时间序列方面的专门分析计算距阵运算提供了交互矩阵语言图形提供了许多产生图形的过程并支持众多的图形设备外部数据库接口提供了与大多数流行数据库2 显示管理系
10、统的常用窗口 查看及改变功能键的设置 查看已经存在的 SAS 数据库 查看某个 SAS 数据库的内容 查看 SAS 数据集的有关信息 查看及改变 SAS 的系统设置 假设我们准备自定义 F12 功能键为 OPTIONS 命令,打开 KEYS 窗口后在 F12 的右边的 空白区键入 OPTIONS,完毕之后在命令框中键入 END 命令退出 KEYS 窗口 五.显示管理系统命令 1 显示管理系统命令的发布 有四种命令的发布方式都可达到相同结果。在命令框中直接键入命令 按功能键 使用下拉式菜单 使用工具栏 例如我们要增加一个 OUTPUT 窗口,相应地四种操作如下:命令框中直接键入 OUTPUT 和
11、 Enter 功能键 F7 Globals/Output tools/customize(options/edit tools)Add按钮选择Tool,新增了一个空白按钮 Comma nd命令框中输入:OUTPUT;Help Text命令框中输入:Add new button create by DZX;Tip Text 命令框中输入:Output。再单击 Browse 命令挑选一个合适的按钮。单击 Move Dn 按钮将 OUTPUT 按钮移动到最后 Help 按钮之后 单击 Add 按钮选择 Separator,使 Help 按钮和新增 OUTPUT 命令按钮 之间有一个空白的分组间隙。单
12、击 Save 按钮 2 文本编辑行命令 文本编辑行命令的主要作用是为在 PROGRAM EDITOR 窗口方便和高效地输入和修改 SAS 程序提供一组编辑命令。文本编辑行命令可归两个子类:命令行命令在命令框中输入 NUMS 命令 行命令在行号上键入执行指定功能的字母来完成编辑功能 例如,我们在 PROGRAM EDITOR窗口中的第一行到第三行输入假设的数据和程序:Data and program line one”,“Data and program line two”,“Data and program line three”。若想在第1行与第2行之间插入空行:在第1行的行号前键入i(或I
13、,或i1、11)若想保存和调入程序:在命令框中键入:FILE D:SASABC02.SAS KEYS LIBNAME DIR VAR OPTIONS 序系统是一种组合软件系统基本部分是软件系统的功能系统是大型集成应用软件系统具有完备的以下四大功能数据访问数据管理数据分析数据显示它是美国软件研究所经多年的研制于年推出目前已被许多国家和地区的机构所采用系法进行质量管理财务管理生产优化风险管理场调查和预测等等业务并可将各种数据以灵活多样的各种报表图形和三维透视的形式直观地表现出来在数据处理和统计分析领域一直被誉为国际上的标准软件系统系统的主要模块系统系统理方面的专门分析计算规划运筹决策方面的专门分析
14、计算预测计量经济的时间序列方面的专门分析计算距阵运算提供了交互矩阵语言图形提供了许多产生图形的过程并支持众多的图形设备外部数据库接口提供了与大多数流行数据库先光标定位到指定某行,再在命令框中键入:INCLUDE D:SASABC02.SAS 六.SAS 系统的几组重要命令 1 向 SAS 系统寻求帮助命令 F1键和F2键提供信息相当于简明的 SAS使用手册 2 显示管理系统命令框常用命令 类型 命令 描述 显示管理 命令 BYE 退出SAS CLEAR wi ndow-name 清除指定的窗口中的内容 END 退出当前窗口 FILE file name 存储到指定文件 HELP 帮助 INCL
15、UDE file name 引入指定文件 KEYS 进入KEYS窗口 LIBNAME 确认SAS数据库的内容 LOG 进入LOG窗口 NUMS 打开和关闭文本编辑器的数字区 OPTIONS 进入OPTIONS窗口 OUTPUT 进入OUTPUT窗口 PROGRAM 进入 PROGRAM EDITOR 窗口 RECALL 调出上次执行的程序 SUBMIT 提交一段程序 3 文本编辑行命令 本组命令很多,这里仅给出其中几个最常用的:类型 命令 描述 文本编辑行命令 DN 删除自当前行起的 N行,D或D1都只表示删除当前行 IN 在当前行之后插入 N个空行 N 使当前行内容右移 N个字符 N 使当前
16、行内容左移 N个字符 CN 把自当前行起的N行内容拷贝到由A、B命令指定位置 MN 把自当前行起的N行内容移动到由A、B命令指定位置 其中一部分可单独使用,另一部分需与操作定位命令 A、B(A指after,B指before)配合 起来使用。序系统是一种组合软件系统基本部分是软件系统的功能系统是大型集成应用软件系统具有完备的以下四大功能数据访问数据管理数据分析数据显示它是美国软件研究所经多年的研制于年推出目前已被许多国家和地区的机构所采用系法进行质量管理财务管理生产优化风险管理场调查和预测等等业务并可将各种数据以灵活多样的各种报表图形和三维透视的形式直观地表现出来在数据处理和统计分析领域一直被誉
17、为国际上的标准软件系统系统的主要模块系统系统理方面的专门分析计算规划运筹决策方面的专门分析计算预测计量经济的时间序列方面的专门分析计算距阵运算提供了交互矩阵语言图形提供了许多产生图形的过程并支持众多的图形设备外部数据库接口提供了与大多数流行数据库例如,我们要将第一行和第二行的内容移到第三行的后面:第一行行号前键入 M2 第三行行号前键入 A命令,然后按Enter键 七.运行 SAS 程序的步骤 1 在 PROGRAM EDITOR 窗口中键入程序序系统是一种组合软件系统基本部分是软件系统的功能系统是大型集成应用软件系统具有完备的以下四大功能数据访问数据管理数据分析数据显示它是美国软件研究所经多
18、年的研制于年推出目前已被许多国家和地区的机构所采用系法进行质量管理财务管理生产优化风险管理场调查和预测等等业务并可将各种数据以灵活多样的各种报表图形和三维透视的形式直观地表现出来在数据处理和统计分析领域一直被誉为国际上的标准软件系统系统的主要模块系统系统理方面的专门分析计算规划运筹决策方面的专门分析计算预测计量经济的时间序列方面的专门分析计算距阵运算提供了交互矩阵语言图形提供了许多产生图形的过程并支持众多的图形设备外部数据库接口提供了与大多数流行数据库见图1-1所示 2 提交这段程序 有四种方法可以提交这段程序:在命令框中直接键入命令 SUBMIT 用鼠标选择菜单命令 Locals/Submi
19、t 按功能键F3 用鼠标点击标准工具栏的第一个按钮 另外,还可以用菜单命令 Locals/Submit top line来提交PROGRAM EDITOR 程序窗口中-In|x|耳土 口|圉列圖反|為血魄-D|x|-I 冈 的某一条SAS语句,常用来测试这条语句的执行结果。00001 00002 00003 00004 0000&OOOOG 0000?4000B:00009 00010 40011 00012 00013 data c 1 ass:;input name testl cards;X i aoer 90 Zhbartgsan 1 00 Lisi 73 Uanuu 69 i u 1
20、09 PROGRAM EDITOR-kBC03.m姿 File 星五 t Vi ew Locals Glob al E Opti onz WLILJOW s G8G19 8 9 f r 8 riMl;prpc dta=Ql ss run:图 2 1 一个典型的 SAS 程序实例 序系统是一种组合软件系统基本部分是软件系统的功能系统是大型集成应用软件系统具有完备的以下四大功能数据访问数据管理数据分析数据显示它是美国软件研究所经多年的研制于年推出目前已被许多国家和地区的机构所采用系法进行质量管理财务管理生产优化风险管理场调查和预测等等业务并可将各种数据以灵活多样的各种报表图形和三维透视的形式直观地
21、表现出来在数据处理和统计分析领域一直被誉为国际上的标准软件系统系统的主要模块系统系统理方面的专门分析计算规划运筹决策方面的专门分析计算预测计量经济的时间序列方面的专门分析计算距阵运算提供了交互矩阵语言图形提供了许多产生图形的过程并支持众多的图形设备外部数据库接口提供了与大多数流行数据库3 查看 LOG 窗口的信息 4 重新调出刚才提交的程序 命令框中发布 RECALL命令 5 在 OUTPUT 窗口查看运行结果 如果我们需要修改和增加运行结果报告的标题,操作如下:选择 Globals/Options/Titles 命令。出现TITLES窗口,删除原第一大标题的内容“The SAS system
22、。在第一行和第二行分别输入所需要的大小标题的内容,见图 1-2所示。选择Options/Save settings now 命令,保存我们刚才的修改。6 存储程序 再发布RECALL命令重新调出刚才提交的程序,然后可用File/Save as菜单命令把程序存储到外部文件中(也可发布 FILE命令达到 相同的目的)。如果今后要重新运行这个程序,用File/Open菜单命令把这个外部程序重新调入到 SAS 系统的PROGRAM EDITOR 窗口中。如果今后要将这个程序插入到正在 PROGRAM EDITOR窗口编辑的某程序的某处,可发布INCLUDE命令把外部这个程序导入到某程序中 SAS程序文
23、件的后缀为.SAS 实例:data class;in put n ame$test1 test2 test3;cards;Xiaoer 90 86 88 Zha ngsan 100 98 89|Lisi 79 76 70 Wan gwu 68 71 64|zhaoliu 100 89 99 run;例子:假定某公司生产两类机器:小型机器和计算机。这些机器由公司的职员负 责在四个地区销售。下表给出的数据包括销售人员的名字(NAME),销售的地区(REGION),机器的类型(TYPE),和年销售量(SALES)。利用这些资料,想知道 每个地区的年销售总量是多少,每种类型的机器卖了多少,及每类机器的
24、人均销 售量是多少。序系统是一种组合软件系统基本部分是软件系统的功能系统是大型集成应用软件系统具有完备的以下四大功能数据访问数据管理数据分析数据显示它是美国软件研究所经多年的研制于年推出目前已被许多国家和地区的机构所采用系法进行质量管理财务管理生产优化风险管理场调查和预测等等业务并可将各种数据以灵活多样的各种报表图形和三维透视的形式直观地表现出来在数据处理和统计分析领域一直被誉为国际上的标准软件系统系统的主要模块系统系统理方面的专门分析计算规划运筹决策方面的专门分析计算预测计量经济的时间序列方面的专门分析计算距阵运算提供了交互矩阵语言图形提供了许多产生图形的过程并支持众多的图形设备外部数据库接
25、口提供了与大多数流行数据库data sale;in put n ame$sales regi on$type$;cards;stafer 9664 east sm 序系统是一种组合软件系统基本部分是软件系统的功能系统是大型集成应用软件系统具有完备的以下四大功能数据访问数据管理数据分析数据显示它是美国软件研究所经多年的研制于年推出目前已被许多国家和地区的机构所采用系法进行质量管理财务管理生产优化风险管理场调查和预测等等业务并可将各种数据以灵活多样的各种报表图形和三维透视的形式直观地表现出来在数据处理和统计分析领域一直被誉为国际上的标准软件系统系统的主要模块系统系统理方面的专门分析计算规划运筹决策
26、方面的专门分析计算预测计量经济的时间序列方面的专门分析计算距阵运算提供了交互矩阵语言图形提供了许多产生图形的过程并支持众多的图形设备外部数据库接口提供了与大多数流行数据库young 22969 east sm stride 27253 east sm topin 86432 east c speak 99210 east c vetter 38928 west c curci 21531 west sm marco 79345 west c Greco 18523 west sm ryan 32915 west sm tomas 42109 west sm thaiman 94320 sout
27、h c moore 25718 south sm allen 64700 south c stelam 27634 south sm farlow 32719 north sm smith 38712 north sm Wilson 97214 north c run;proc print;run;proc freq;tables type*region;run;proc sort;by type;run;proc means;title means of two kinds of sales data;by type;run;序系统是一种组合软件系统基本部分是软件系统的功能系统是大型集成应用软件系统具有完备的以下四大功能数据访问数据管理数据分析数据显示它是美国软件研究所经多年的研制于年推出目前已被许多国家和地区的机构所采用系法进行质量管理财务管理生产优化风险管理场调查和预测等等业务并可将各种数据以灵活多样的各种报表图形和三维透视的形式直观地表现出来在数据处理和统计分析领域一直被誉为国际上的标准软件系统系统的主要模块系统系统理方面的专门分析计算规划运筹决策方面的专门分析计算预测计量经济的时间序列方面的专门分析计算距阵运算提供了交互矩阵语言图形提供了许多产生图形的过程并支持众多的图形设备外部数据库接口提供了与大多数流行数据库
限制150内