ThelittleSASbook学习笔记第三章外语学习法语学习_外语学习-法语学习.pdf
《ThelittleSASbook学习笔记第三章外语学习法语学习_外语学习-法语学习.pdf》由会员分享,可在线阅读,更多相关《ThelittleSASbook学习笔记第三章外语学习法语学习_外语学习-法语学习.pdf(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、The little SAS book 学习笔记 第三章 开发你的数据 3.1 创建并重新定义变量 可以通过分配语句来创建并重新定义变量,基本形式为:Variable=expression Variable 是变量名,expression 可以是常量、其他变量、或者数学表达式。分配语句的基本类型有:Expression 是数学表达式时,需要遵循运算法则,先算指数、再算乘除、之后是加减。可以用括号改变运算等级。例子 如下是一个农产品估重数据,每位农民要求对他们的番茄、南瓜、豌豆、葡萄进行估重:下面代码从 garden.dat 原始文件中读取数据,并进行修改:这个程序包含了 5 句分配语句,第一个
2、将 14 赋值给 zone,第二个使 type 等于一个字符串常量打印出的结果中,既包括旧变量,又包括新变量:由于观测值 susan 的 peas 变量出现了缺失值,因此这个观测值的 total 和 pertom 变量也出现了缺失值。日志窗口的说明如下:NOTE:Missing values were generated as a result of performing an operation on missing values.3.2 使用 SAS函数 SAS 有 400 多个函数,主要涵盖如下领域:函数基本形式:function-name(argument,argument,),所有的
3、函数都需要括号,即使没有参数。下面的程序计算使用 MDY 函数,MDY 函数需要三个参数:月、日、年。Birthday=MDY(MonthBorn,DayBorn,YearBorn);函数可以嵌套,即一个函数可以是另一个函数的参数。比如:NewValue=INT(LOG(10);例子 有一个南瓜雕刻比赛的数据,pumpkin.dat 数据包含了参赛者的名字、年龄、雕刻的南瓜类型、报名日期、五位裁判给出的分数。下面的代码读取了数据、创建了两个新变量、转换了一个大小写:AvgScore 使用均值函数创建的变量,计算参数的均值,这与直接相加再除以 5 不同的地方在于,当参数中出现缺失值时,直接相加再
4、除的方法返回缺失值,而均值函数计算非缺失参数的均值。DayEntered 变量使用 DAY 函数,返回日期在一个月里的天数。Type 用大写转换函数将原来的字母转换成大写字母。结果是:可以是常量其他变量或者数学表达式分配语句的基本类型有是数学表达式时需要遵循运算法则先算指数再算乘除之后是加减可以用括号改变运算等级例子如下是一个农产品估重数据每位农民要求对他们的番茄南瓜豌豆葡萄进行估重常量打印出的结果中既包括变量又包括新变量由于观测值的变量出现了缺失值因此这个观测值的和变量也出现了缺失值日志窗口的说明如下使用函数有多个函数主要涵盖如下领域函数基本形式所有的函数都需要括号即使没有参数下个南瓜雕刻比
5、赛的数据数据包含了参赛者的名字年龄雕刻的南瓜类型报名日期五位裁判给出的分数下面的代码读取了数据创建了两个新变量转换了一个大小写使用均值函数创建的变量计算参数的均值这与直接相加再除以不同的地方3.3 选出的 SAS字符函数 3.4 选出的 SAS数值函数 3.5 使用 IF-THEN 语句 条件语句 IF-THEN的基本形式为:IF 条件 THEN 执行;比如:IF Model=Mustang THEN Make=Ford;条件语句中的一些基本比较符号:还有 IN 比较符,比如这句中 IF Model IN(Corvette,Camaro)THEN Make=Chevrolet;代表当Model
6、 为 Corvette 或 Camaro 的时候,将 Chevrolet 赋给 Make。一个条件只能有一个执行,如果要多个执行,则需要 DO 和 END 关键字。可以用 AND和 OR 来定义多个条件:IF Model=Mustang AND Year1975 THEN Status=classic;例子 如下的数据包含了模型的名字、年份、制造商和颜色:下面的代码从 cars.dat 的原始文件中读取数据,使用 IF-THEN语句填满缺失值,并创建一个新变量 Status 可以是常量其他变量或者数学表达式分配语句的基本类型有是数学表达式时需要遵循运算法则先算指数再算乘除之后是加减可以用括号改
7、变运算等级例子如下是一个农产品估重数据每位农民要求对他们的番茄南瓜豌豆葡萄进行估重常量打印出的结果中既包括变量又包括新变量由于观测值的变量出现了缺失值因此这个观测值的和变量也出现了缺失值日志窗口的说明如下使用函数有多个函数主要涵盖如下领域函数基本形式所有的函数都需要括号即使没有参数下个南瓜雕刻比赛的数据数据包含了参赛者的名字年龄雕刻的南瓜类型报名日期五位裁判给出的分数下面的代码读取了数据创建了两个新变量转换了一个大小写使用均值函数创建的变量计算参数的均值这与直接相加再除以不同的地方输出结果如下:3.6 用 IF-THEN 语句将观测值分组 IF THEN/ELSE 的一般形式为:IF cond
8、ition THEN action;ELSE IF condition THEN action;ELSE IF condition THEN action;用 else 语句与直接用多个 IF-THEN语句比起来,有两个优势,第一是更有效率,电脑将占用更少的时间;第二是 else 可以确保你的两个 condition 之间互斥。有时候最后一个 ELSE 只有 action,没有 IF-THEN:例子 有一个住房改善的数据,home.dat,包括了姓名、改善工作、改善成本:下面的代码读取数据,并新建了一个 CostGroup 的变量。根据 Cost 的值将数据分成 high、medium、low
9、 和 missing 三类:输出结果是:可以是常量其他变量或者数学表达式分配语句的基本类型有是数学表达式时需要遵循运算法则先算指数再算乘除之后是加减可以用括号改变运算等级例子如下是一个农产品估重数据每位农民要求对他们的番茄南瓜豌豆葡萄进行估重常量打印出的结果中既包括变量又包括新变量由于观测值的变量出现了缺失值因此这个观测值的和变量也出现了缺失值日志窗口的说明如下使用函数有多个函数主要涵盖如下领域函数基本形式所有的函数都需要括号即使没有参数下个南瓜雕刻比赛的数据数据包含了参赛者的名字年龄雕刻的南瓜类型报名日期五位裁判给出的分数下面的代码读取了数据创建了两个新变量转换了一个大小写使用均值函数创建的
10、变量计算参数的均值这与直接相加再除以不同的地方 3.7 构造子集 IF 语句可以构造子集,取数据集中的部分数据。基本形式为:IF+expression;比如:IF Sex=f;如果 IF 条件中的数据是真,则数据步将继续执行。还可以使用 DELETE 语句,来删除哪些不要的数据:IF expression THEN DELETE;这两句话是等价的:IF Sex=f;IF Sex=m THEN DELETE;例子 有关于莎士比亚歌剧的清单,Shakespeare.dat,包含歌剧名、首次表演年份、类型:下面的代码读取数据,并且用 IF 语句构造一个只包含喜剧(comedies)的子集:输出结果如
11、下:观察日志有时能很好的保证我们截取了我们要的数据:在这个例子中,用 DELETE 等价的语句为:IF Type=tragedy OR Type=romance OR Type=history THEN DELETE;可以是常量其他变量或者数学表达式分配语句的基本类型有是数学表达式时需要遵循运算法则先算指数再算乘除之后是加减可以用括号改变运算等级例子如下是一个农产品估重数据每位农民要求对他们的番茄南瓜豌豆葡萄进行估重常量打印出的结果中既包括变量又包括新变量由于观测值的变量出现了缺失值因此这个观测值的和变量也出现了缺失值日志窗口的说明如下使用函数有多个函数主要涵盖如下领域函数基本形式所有的函数都
12、需要括号即使没有参数下个南瓜雕刻比赛的数据数据包含了参赛者的名字年龄雕刻的南瓜类型报名日期五位裁判给出的分数下面的代码读取了数据创建了两个新变量转换了一个大小写使用均值函数创建的变量计算参数的均值这与直接相加再除以不同的地方3.8 处理 SAS的日期数据 日期数据的处理很棘手,有的月份有 31 天、有的 30 天、有的 28 天。SAS 简化的日期数据,将所有的日期转化成一个以 1960 年 1 月 1 日为起点的数。比如:SAS 处理日期数据的三个工具为:读取数据的 informats,使用数据的函数(functions),打印数据的 formats。Informats 读取日期数据需要用
13、formatted input。比如,如何告诉 SAS 用 MMDDYY10.informats 读取名为 BirthDate 的变量:INPUT BirthDate MMDDYY10.;设定默认的百年 07/04/76 这样的数据可能是 1976,也可能是 2076、1776。因此需要YEARCUTOFF=来指定一个一百年的第一年,默认的是 1920 年。下面的语句就是告诉 SAS将一个两位年份的日期解释为 1960 年到 2049 年之间:OPTIONS YEARCUTOFF=1950;SAS 表达式中的日期 一旦被以 SAS 日期格式读取之后,可以将此数据想其他数值数据一样用在表达式中。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ThelittleSASbook 学习 笔记 第三 外语 法语
限制150内