SPSS操作与数值变量统计描述.ppt
SPSS软件概述公卫学院流行病与统计学系易伟宁 讲师82801619 SPSS是什么?美国美国SPSS公司公司()产品产品社会科学统计软件包社会科学统计软件包(曾经曾经)Statistical Package for Social Sciences统计产品和服务解决方案统计产品和服务解决方案(现在的解释现在的解释)Statistical Product and Service Solutions主要功能:专业的统计分析,强大的数据主要功能:专业的统计分析,强大的数据管理,一定的制表绘图功能管理,一定的制表绘图功能SPSS常用窗口介绍数据编辑窗口 Data Editor,类似Excel表格形式,每一行代表一个个体(case)每一列代表该个体的一个属性。语法编辑窗口 Syntax Editor,将窗口操作以文本形式记录,便于调试和重复。结果浏览窗口 Output Viewer,可编辑和导出为word或html等格式。对应扩展名为SAV,SPS,SPO的文件数据输入实例某地区学龄儿童的体检表学号:40025 姓名:李婷婷 年级:1 性别:男 女 出生日期:04年3月31日体检结果身高120.0cm 体重19.5kg 肺活量883ml变量清单变量名中文含义 类型宽度备注xh学号数值F8.0 xm姓名字符A8 nj年级数值F8.0 xb性别字符A1m=男 f=女csrq出生日期 日期Date10mm/dd/yyyysg身高数值F8.1厘米tj体重数值F8.1千克fhl肺活量数值F8.0毫升练习将体检表输入SPSS,并在指定文件夹保存(SAV)另存为excel97格式的文件(XLS),删除姓名变量用SPSS读取XLS文件。读之前要注意关闭EXCEL窗口如在点击“打开”或“确定”前选”Paste”,操作过程用程序记录,点 之前不运行打开文本数据文件(体检表.dat)讨论哪些变量命名方式是SPSS不接受的 Help-Topics-Data editor-Variable view-Variable names-The following rules apply SPSS整理编辑功能公卫学院流行病与统计学系易伟宁 讲师82801619 Data菜单定义变量属性定义变量属性复制数据属性复制数据属性定义日期定义日期插入变量插入变量插入个案插入个案跳至跳至.排序排序转置转置重构重构合并文件合并文件数据汇总数据汇总发现重复数据发现重复数据正交设计正交设计分割文件分割文件选择观测选择观测加权加权Transform菜单计算计算重编码重编码可视化分组可视化分组计数计数数据编秩数据编秩自动编码自动编码Data菜单练习打开体检表.sav练习插入(删除)cases或者variables先对性别排升序,再对身高排降序按照 性别=男&身高120的条件选择观测(注意不要在中文输入状态下敲单引号)分性别保存数据文件打开男生数据,追加女生数据(注意进行了删除添加操作后,要另存.)数据加权练习新建一个数据文件在数据窗口里输入数据,包括6个1,6个2,6个3共18个数。如何快速完成?Data-Weight cases-weight by f用描述性统计菜单下的freq命令验证23名病人,其中12名病人用A药治疗,有效7名,无效5名;另外11名用B药治疗,有效3名,无效8名。如何建立文件Transform菜单练习打开OneCase.sav,计算年龄Compute产生新变量now,值为02/15/2012用now减去生日得出年龄(秒),再换算为年打开体检表.sav,从学号里提取班级信息(compute,substr)将字符型变量-性别变换为数值型的(record)身高120,120130,130+的学生各有多少对身高进行每3岁一组分组(Visual Bander)身高资料是对称(正态)分布的106名学生身高(cm)的频数表身高组段频数频率(%)累计频率(%)102 1 0.9 0.9 105 5 4.7 5.7 132135 1 0.9 100.0合计106100.0 106名学生身高(cm)的均数表性别组段例数数均数标准差男 1 0.9 0.9 女 5 4.7 5.7SPSS作统计描述公卫学院流行病与统计学系易伟宁 讲师82801619 数值变量的统计描述统计描述是用统计指标和统计图表描述资料的数量特征。常见变量类型包括数值和分类变量,相应采用不同统计方法数值变量特点,有单位,连续取值描述数值变量的集中趋势,用均数mean、中位数median、几何均数G。描述其离散趋势,用全距range、四分位数间距Interquartile range、方差variance、标准差standard deviation和变异系数等指标。常用集中离散趋势指标公式对身高、肺活量列频数表、绘制直方图由于身高是对称(正态)分布的,所以选择均数、标准差来进行描述而肺活量是偏态分布的,所以选中位数和四分位间距进行统计描述还可作箱式图、茎叶图和正态Q-Q图在explore命令里定义性别为因素factor可以对身高等指标分性别描述SPSS操作正态分布有一类特殊的连续型随机变量,具有正态分布(normal distribution)的分布特点例如:106名儿童的身高和体重值总体和样本、参数和统计量的概念正态分布两个重要参数:均数、标准差正态分布曲线的形状由这两个参数决定查表可知正态曲线下任意区间所围面积SPSS提供正态概率函数,可免于查表作业对全部学生的体重指标编频数表,选择适合的统计指标进行描述。分性别对体重进行描述,编写统计表从理论上说大部分(95%)的学生的体重在什么范围内?为什么?应如何估计这些学生肺活量的95%参考值范围?(注意:要写公式,表格要符合统计学要求)关于考试开卷上机考试两个小时的考试时间,不允许延长只能带入一本课本,可以带入课件。不能带入u盘,目的是让大家专心答题,不要把大部分时间花在翻书找答案上基本上每次课会布置一些小作业,上交后用于计算平时成绩,和考试成绩汇总在一起,构成大家的最后成绩。