《spss软件应用3(1).ppt》由会员分享,可在线阅读,更多相关《spss软件应用3(1).ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSS软件应用(软件应用(3)北京大学公共卫生学院北京大学公共卫生学院授课教师:张敬旭授课教师:张敬旭变量编辑和转换变量编辑和转换-2日期的计算日期的计算计算产生新变量计算产生新变量赋值产生新变量赋值产生新变量统计分析:求变量的频数统计分析:求变量的频数日期计算日期计算 Date/Time 用日期与时间进行计算用日期与时间进行计算两个日期之间的计算两个日期之间的计算Date1Date1与与Date2Date2之差之差以以“天天”为单位为单位结果变量:结果变量:day,单位,单位为为“天天”变量标签变量标签生成的新变量:生成的新变量:练习练习用用zong.sav数据库练习日期变量计算数据库练习
2、日期变量计算 计算儿童年龄(天)计算儿童年龄(天)计算儿童年龄(月)计算儿童年龄(月)通过计算产生新变量通过计算产生新变量 computeCompute菜单特点菜单特点目标变量可以是新变量,也可以是已有的变量目标变量可以是新变量,也可以是已有的变量(此时系统会弹出提示对话框加以确认(此时系统会弹出提示对话框加以确认)。赋给变量的值可以是一个常数(数值、日期等),赋给变量的值可以是一个常数(数值、日期等),也可以是从已有变量值或系统函数计算而来的值。也可以是从已有变量值或系统函数计算而来的值。SPSSSPSS提供了多达提供了多达7070余种的系统函数余种的系统函数(数值变换、(数值变换、时间变换
3、、统计概率计算等)。时间变换、统计概率计算等)。操作记录可以是所有操作记录可以是所有casecase,也可以设定逻辑条件,也可以设定逻辑条件,即只对满足条件的记录加以赋值。其余记录的相即只对满足条件的记录加以赋值。其余记录的相应变量或保持原状或被赋为缺失值。应变量或保持原状或被赋为缺失值。要求:根据出生体重小于要求:根据出生体重小于2500克划分低出生体重克划分低出生体重组组(=1)和正常出生体重组和正常出生体重组(=0)(系统默认系统默认)Transform菜单 Compute命令新变量数据库新变量数据库如果出生体重小于如果出生体重小于2500克划分低出生体重组克划分低出生体重组(=1)和和
4、正常出生体重组正常出生体重组(=2),则需要使用则需要使用“IF”对话框对话框.第一步同上面操作第一步同上面操作第二步再次选择第二步再次选择Transform菜单菜单第三步定义已生成变量第三步定义已生成变量LBW=2,同时点击,同时点击“IF”子对话框。子对话框。第四步定义条件,即第四步定义条件,即birthw 2500克克ComputeCompute命令命令SPSSSPSS对话框如下:对话框如下:计算计算BMI指数指数公式公式BMI=体重(体重(kg)/身高(身高(m)2SPSS程序:程序:transform菜单下打开菜单下打开compute子菜单子菜单产生一个新变量:产生一个新变量:bmi
5、体重体重/(身高)(身高)*2)常用数学函数常用数学函数ABS 绝对值绝对值ARSIN 反正弦值反正弦值ARTAN 反正切值反正切值COS 余弦值余弦值EXP e 的数值表达式次幂的数值表达式次幂LG10 以以10为底的对数值为底的对数值LN 自然对数值自然对数值RND 四舍五入后得到整数值四舍五入后得到整数值SIN 正弦值正弦值SORT 平方根平方根TRUNC 截尾以后得到整数值截尾以后得到整数值练习练习计算母亲的计算母亲的BMI指数指数母亲身高值四舍五入取整后生成新变量母亲身高值四舍五入取整后生成新变量(new_h)。)。儿童出生体重转换成千克为单位的新变儿童出生体重转换成千克为单位的新变
6、量(量(new_bw)。重新赋值产生新变量重新赋值产生新变量l 根据已计算产生的变量根据已计算产生的变量BMI,判断母亲,判断母亲为肥胖、超重还是正常。为肥胖、超重还是正常。l SPSS程序:程序:l Transform菜单菜单 Recode命令命令Recode.Into different variables定义新的变量名:定义新的变量名:bmi _ gr新值及旧值变量新值及旧值变量根据根据BMIBMI判断肥胖与否判断肥胖与否根据根据bmi对记录进行分组,对记录进行分组,bmi:正常:正常:18.023.9;超重:;超重:24.027.9;肥胖:;肥胖:28.0。问题:当问题:当bmi23.
7、91时,时,bmi_gr的取何值?的取何值?根据上述根据上述recode方法,方法,bmi_gr为缺失值!为缺失值!解决办法:从大到小赋值解决办法:从大到小赋值RECODE bmi(28.0 thru Highest=3)(24.0 thru 28.0=2)(18.0 thru 24.0=1)INTO bmi_gr.EXECUTE.也可以如下赋值:增加小数点位数也可以如下赋值:增加小数点位数练习打开打开data1.sav数据,根据已产生变量数据,根据已产生变量BMI进行分组:进行分组:正常正常超重超重肥胖肥胖 求变量的频数:求变量的频数:analyze-descriptive statisti
8、cs-frequencies 频数:当汇总频数:当汇总大量大量的原始数据时,把数的原始数据时,把数据按类型分组,其中每个组的数据个数,据按类型分组,其中每个组的数据个数,称为该组的称为该组的频数频数。频数表(频数分布):表示各组及它们频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数对应的组频数的表格称为频数表或频数分布。分布。练习练习:用SPSS绘制频数表SPSS直接输出的是精确频数表直接输出的是精确频数表传统意义频数表(分布表)的作用:传统意义频数表(分布表)的作用:了解计量资料的分布规律。了解计量资料的分布规律。制作传统意义上的频数表需要利用制作传统意义上的频数表需要利
9、用Record过程过程对相应变量进行对相应变量进行重新赋值重新赋值即即可。可。频数表的编制频数表的编制 编制步骤:1.1.求极差(又称全距)求极差(又称全距)R R;2.2.确定组数确定组数n n、组距组距i i,并写出组段;并写出组段;3.3.列表划记。列表划记。具体步骤将绘制频数表的变量按从大到小的顺序排将绘制频数表的变量按从大到小的顺序排列,(使用排序方法或列,(使用排序方法或Frequency过程)求过程)求出变量的最大值、最小值,计算全距(极出变量的最大值、最小值,计算全距(极差)。差)。根据样本量和极差确定组段数,计算根据样本量和极差确定组段数,计算组距组距,写出写出组段组段。使用
10、使用Record过程建立一个新变量用于记录过程建立一个新变量用于记录组段号组段号使用组段号变量对原变量进行统计描述、使用组段号变量对原变量进行统计描述、绘图等,即可得到需要的频数表。绘图等,即可得到需要的频数表。找出最大值、最小值找出最大值、最小值(数据排序、描述性统计)(数据排序、描述性统计)-data sort cases sort by-身高身高 sort order-ascending/decending 最小值为最小值为144cm144cm,最大值为最大值为176cm176cm,故极差(全距)故极差(全距)R=176-144=32cmR=176-144=32cm确定组数。一般根据样本
11、量的多少分成确定组数。一般根据样本量的多少分成8-158-15组。组。理论上组距等于极差除以组数。但不拘泥于计算理论上组距等于极差除以组数。但不拘泥于计算结果,而常常取一个比较好处理的数。结果,而常常取一个比较好处理的数。打开表打开表1.sav1.sav数据库数据库 全距全距=176-144=32cm组距组距=全距全距/10=32/103cm3cm(四舍五入)四舍五入)组段:上限、下限组段:上限、下限144146.99147149.99174176重新赋值(重新编码新变量组段)重新赋值(重新编码新变量组段)Recode Into different variables旧及新的变量值旧及新的变量
12、值分析组段频数表,结果输出窗口显示结果分析组段频数表,结果输出窗口显示结果(统计描述)(统计描述)-Analysze Descriptive Statistics frequencies注意注意:SPSS的输出结果文件为的输出结果文件为*.spo注意:每一列的涵义注意:每一列的涵义能看出什么规律?能看出什么规律?组段应该写组段应该写成区间成区间,而且而且含下限不含含下限不含上限上限如果数据有如果数据有最大值最大值,最大最大组应该写出组应该写出上限上限组段生成方法组段生成方法:a.为变量中表示各组的值加数值标签为变量中表示各组的值加数值标签b.在结果输出表格中修改在结果输出表格中修改30名儿童身
13、高的频数分布名儿童身高的频数分布身高组段(cm)频数频率(%)累计频率(%)14413.33.3147 13.36.7150 13.310.0153 413.323.3156 516.740.0159 826.766.7162 310.076.6165 26.783.3168 310.093.3171 13.396.7174 17713.3100.0合计30100.0-频数分布的两个特征:频数分布的两个特征:集中趋势与离散趋势集中趋势与离散趋势频数分布的类型:频数分布的类型:对称分布与偏态分布(集中位置偏向小的一对称分布与偏态分布(集中位置偏向小的一侧叫正偏态,反之叫负偏态)侧叫正偏态,反之叫负偏态)频数表的主要用途:频数表的主要用途:1.揭示分布类型揭示分布类型 2.发现特大值和特小值发现特大值和特小值 3.计算集中趋势指标与离散趋势指标计算集中趋势指标与离散趋势指标练习练习绘制表绘制表1.sav数据中儿童身高的频数表。数据中儿童身高的频数表。
限制150内