统计分析系统sas--03.ppt
《统计分析系统sas--03.ppt》由会员分享,可在线阅读,更多相关《统计分析系统sas--03.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第3讲数据步语句讲数据步语句SAS过程初步过程初步计算中心计算中心 何宁何宁计算中心计算中心数据步语句数据步语句v选择语句选择语句SELECT(选择表达式);WHEN(值列表)语句;WHEN(值列表)语句;OTHERWISE 语句;END;计算中心计算中心数据步语句数据步语句v其中其中“选择表达式选择表达式”是一个取数值、字符型值的是一个取数值、字符型值的变量或表达式,变量或表达式,“值列表值列表”为一项或者若干项为一项或者若干项,多多项之间逗号分开项之间逗号分开,每项可以是一个与选择表达式相每项可以是一个与选择表达式相同取值类型的表达式。同取值类型的表达式。v“语句语句”可以是单个语句或复
2、合语句。执行可以是单个语句或复合语句。执行SELECT结构时结构时,先计算出选择表达式和值列表中先计算出选择表达式和值列表中的所有值的所有值,然后把选择表达式值由前向后与值列表然后把选择表达式值由前向后与值列表中的值相比中的值相比,发现相等值则执行对应的语句,然后发现相等值则执行对应的语句,然后退出退出SELECT结构(不再查看后面的值列表)结构(不再查看后面的值列表).v如果选择表达式的值不等于任何值列表中的值则如果选择表达式的值不等于任何值列表中的值则执行执行OTHERWISE对应的语句,这种情况下没对应的语句,这种情况下没有有OTHERWISE语句会出错。语句会出错。计算中心计算中心数据
3、步语句数据步语句v选择语句的另一种形式选择语句的另一种形式 SELECT;WHEN(条件)语句;WHEN(条件)语句;OTHERWISE 语句;END;v这种这种SELECT语句没有选择表达式,而是在每一个语句没有选择表达式,而是在每一个 HEN语句指定一个条件(逻辑表达式)语句指定一个条件(逻辑表达式)v执行第一个满足条件的执行第一个满足条件的WHEN后的语句后的语句v如果所有条件都不满足则执行如果所有条件都不满足则执行OTHERWISE后的语句。后的语句。计算中心计算中心数据步语句数据步语句SELECT;WHEN(age=12)put 少年少年;WHEN(age35)put 青年青年;OT
4、HERWISE put 中老年中老年;END;计算中心计算中心数组语句数组语句-数值型数组数值型数组v数值型数组:数值型数组:v定义数值型数组的格式为:定义数值型数组的格式为:ARRAY 数组名(维数说明)数组元素名列表(初始值表);例如:ARRAY tests(3)math chinese english(0,0,0);计算中心计算中心数组语句数组语句-数值型数组数值型数组v数组名是一个合法的数组名是一个合法的SAS名字且不能与同一数据步中的变名字且不能与同一数据步中的变量重名。量重名。v对一维数组,维数说明只要说明元素个数,这时下标从对一维数组,维数说明只要说明元素个数,这时下标从1开始。
5、数组元素名列表列出这个数组的各个元素实际代表开始。数组元素名列表列出这个数组的各个元素实际代表的变量名,各变量名以空格分隔的变量名,各变量名以空格分隔.v初始值表给各数组元素赋初值,按顺序对应。数组说明中初始值表给各数组元素赋初值,按顺序对应。数组说明中初始值表可以省略,这时其初始值为相应数组元素的值初始值表可以省略,这时其初始值为相应数组元素的值(如果其数组元素还没有值则初值为缺失值)。(如果其数组元素还没有值则初值为缺失值)。v 数组说明中的数组元素名列表可以省略,这时其元素也数组说明中的数组元素名列表可以省略,这时其元素也有对应的变量名,变量名为数组名后附加序号。有对应的变量名,变量名为
6、数组名后附加序号。计算中心计算中心数组语句数组语句-数值型数组数值型数组v例:例:ARRAY x(3);中数组x的各元素名为x1,x2,x3。v 也可以在说明维数时用也可以在说明维数时用“下标下界下标下界:下标上界下标上界”来说明一来说明一个其它的下标下界,如个其它的下标下界,如 ARRAY sales(95:97)yr95yr97;这时sales(95)为yr95,sales(96)为yr96,sales(97)为yr97。v一维数组的维数说明还可以是一个星号,这时数组大小由一维数组的维数说明还可以是一个星号,这时数组大小由提供的元素列表中的变量个数决定提供的元素列表中的变量个数决定 ARR
7、AY tests(*)math chinese english (0,0,0);v可以用函数可以用函数DIM(数组名数组名)来获得数组的长度。来获得数组的长度。计算中心计算中心数组语句数组语句-数值型数组数值型数组v可以定义二维数值型数组,只要在维数说明中指可以定义二维数值型数组,只要在维数说明中指定用逗号分开的两个下标界说明,例如:定用逗号分开的两个下标界说明,例如:array table(2,2)x11 x12 x21 x22;说明table(1,1)为x11,table(1,2)为x12,table(2,1)为x21,table(2,2)为x22v 二维数组元素的顺序按行排列二维数组元素
8、的顺序按行排列计算中心计算中心数组语句数组语句-字符型数组字符型数组ARRAY 数组名(维数说明)$元素长度说明数组元素名列表(初始值表);例如:ARRAY names(3)$10 child father mother;v字符型数组其它方面的用法与数值型相同。字符型数组其它方面的用法与数值型相同。计算中心计算中心数组语句数组语句使用数组使用数组vSAS以变量为元素的数组可以方便变量的循环处理以变量为元素的数组可以方便变量的循环处理例如,读入了comp1-comp10 十个计算机销售额变量,prin1-prin6六个打印机销售额变量,希望计算其总和,可以用如下的数组说明与DO循环配合进行:da
9、ta sales;input comp1-comp10 prin1-prin6;ARRAY y(*)comp1-comp10 prin1-prin6;tot=0;do i=1 to DIM(y);tot+y(i);end;cards;run;计算中心计算中心SAS过程中常用语句过程中常用语句vPROCvBYvCLASSvVARvWEIGHTvFREQvFORMATvLABELvOUTPUTvTITLEvFOOTNOTEvGOPTIONS计算中心计算中心PROC 语句语句v语句格式:语句格式:PROC 选择项;v功能功能:指定所需调用的过程以及该过程的若干选择项。v选择项选择项关键字关键字=值关
10、键字=SAS数据集,如 DATA=数据集计算中心计算中心SAS常用过程常用过程vIMPORTvSQLvPRINTvFREQvMEANSvSORTvFORMAT计算中心计算中心IMPORT过程过程Proc import out=数据集数据集 datafile=“文件全名文件全名”|table=“表名表名”DBMS=标识名标识名 REPLACE 其他语句;其他语句;Run;其中,标识名如下:Access2000|dbf|excel2000|dlm|csv|tab上述标识名依次对应的扩展名为:.mdb|.dbf|.xls|.*|.csv|.txt其他语句Getnames=yes|noDatarow=
11、n(标识名为dlm|csv|tab时可用)计算中心计算中心IMPORT过程过程Proc import out=aaa datafile=e:sasdatabank.xls DBMS=excel2000;Run;计算中心计算中心SQL过程过程PROC SQL;CREATE TABLE 数据集名数据集名 AS SELECT 语句语句;Proc SQL;CREATE TABLE AB.CLASSBAK ASSELECT NAME,GENDER FROM AB.CLASS1 WHERE AGE=5;Run;计算中心计算中心FREQ过程过程vProc freq data=数据集名数据集名 选项选项;vt
12、ables 变量名列表变量名列表/选项选项;vRun;vTables语句中的选项:语句中的选项:nocum不要累计的频数和百分数 nopercent-不要百分数和累计的百分数vProc freq语句中的选项:语句中的选项:order=internal-按变量值排序freq-按频数降序排序data-按数据集中的值的次序排序formatted-按变量格式化的值排序计算中心计算中心MEANS过程过程PROC MEANS DATA=;VAR;BY;CLASS;RUN;计算中心计算中心可以计算的描述性统计量关键字及其含义见下表关键字所代表的含义关键字所代表的含义n有效数据记录数range极差nmiss缺
13、失数据记录数skewness偏度mean均值kurtosis峰度std标准差t分布位置假设检验之t统计量stderr标准误probt上述t统计量对应的概率值var方差q1第一四分位数median中位数q3第三四分位数mode众数qrange四分位数间距cv变异系数p1第一百分位数max最大值p5第五百分位数min最小值p10第十百分位数sum总计p90第九十百分位数sumwgt加权值总计p95第九十五百分位数css校正平方和p99第九十九百分位数uss未校正平方和计算中心计算中心UNIVARIATE过程过程PROC UNIVARIATE DATA=;VAR;BY|CLASS;HISTOGRAM
14、/;OUTPUT OUT=;RUN;计算中心计算中心UNIVARIATE过程过程vUNIVARIATE过程和过程和MEANS过程的格式非常过程的格式非常相似,相同的语句和选项其含义也相同,所不同相似,相同的语句和选项其含义也相同,所不同的是某些统计量只能在的是某些统计量只能在UNIVARIATE过程中计过程中计算(如众数),而且算(如众数),而且UNIVARIATE过程中具有过程中具有绘图功能。绘图功能。v 其中,其中,HISTOGRAM语句用来指示语句用来指示SAS对其后对其后所指定的变量绘制直方图,其后的选项用来指示所指定的变量绘制直方图,其后的选项用来指示SAS添加不同类型的拟合图形(如
15、正态分布的分添加不同类型的拟合图形(如正态分布的分布密度曲线)。布密度曲线)。计算中心计算中心用分析家作频数统计用分析家作频数统计v选择选择”解决方案解决方案/分析分析/分析家分析家”进入分析家环境进入分析家环境v点击点击”文件文件/按按SAS名称打开名称打开”打开数据集打开数据集v点击点击”统计统计/描述性统计描述性统计/频数统计频数统计”,在弹出的对在弹出的对话框中:话框中:AGE=Frequencies,Sex=Frequencies点击OK计算中心计算中心FORMAT过程过程vPROC FORMAT;vVALUE 格式变量名 分组形式;vRUN;其中其中:格式变量名由用户命名格式变量名
16、由用户命名,在其他在其他过在其他在其他过程中可以引用该格式名程中可以引用该格式名.v引用:PROC 过程名过程名 DATA=数据集名数据集名;过程语句过程语句;FORMAT 数据集中的变量名数据集中的变量名 格式名格式名.;RUN;计算中心计算中心FORMAT过程过程Proc format;Value wfmt low-13=“low 13-16=“13-16 16-high=“high“;Run;Proc print data=temp.class;Format weight wfmt.;若没有该语句,数据集中的Weight数据仍按原始显示Run;计算中心计算中心SAS制作图形的过程制作图形
17、的过程v建立(或转换)数据文件建立(或转换)数据文件v根据设计者的要求选用恰当的模型,生成图形根据设计者的要求选用恰当的模型,生成图形v编辑、整理,得到满意的结果。编辑、整理,得到满意的结果。v图形参数语句图形参数语句Goptions 图形选项设置图形输出的参数,如goptions ftext=SWISS ctext=BLACK htext=1 cells;Symbole 图形选项常对GPLOT过程输出的图形进行参数设置Pattern 图形选项常对CHART过程输出的图形进行参数设置计算中心计算中心使用使用GPLOT过程绘制散点图和连线图过程绘制散点图和连线图v通常用散点图和连线图可以表示:通
18、常用散点图和连线图可以表示:一个变量随另一个变量的变化;变量之间的关系;数据值的分布。vGPLOT过程的一般格式过程的一般格式PROC GPLOT DATA=;PLOT *=/;SYMBOLn;RUN;计算中心计算中心选项选项意义意义说明说明FRAM|NOFRAMFRAM|NOFRAM在在图图形四周加入或不加入形四周加入或不加入边边框框缺省缺省为为加入加入CFRAM=CFRAM=颜颜色色边边框内的框内的颜颜色色缺省缺省为为白色白色AUTOHREF(AUTOVEREF)AUTOHREF(AUTOVEREF)在水平在水平(垂直垂直)轴轴的每个主刻度的每个主刻度处处加入水平加入水平(垂直垂直)参参考
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析 系统 sas 03
限制150内