薛薇-《SPSS统计分析方法及应用》第三章--数据预处理.pptx
《薛薇-《SPSS统计分析方法及应用》第三章--数据预处理.pptx》由会员分享,可在线阅读,更多相关《薛薇-《SPSS统计分析方法及应用》第三章--数据预处理.pptx(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3.1 数据的排序 排序目的:排序目的:数据排序便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等;通过数据排序能够快捷的找到数据的最大值和最小值,进而可以计算出数据的全距数据的全距,初步把握和比较数据的离散程度离散程度;通过数据排序能够快捷地发现数据的异常值,为进一步明确它们是否会对分析产生重要影响提供帮助。第1页/共32页排序方法:排序方法:(1)单值排序单值排序,指排序变量只有一个(2)多重排序多重排序,首先按照主排序变量的大小次序排序,对于有相同主排序变量的数据,再按第二排序变量的大小次序依次安排。第2页/共32页说明:说明:1、数据排序是整行数据排序,而不是只对某列变量排序
2、;2、多重排序中指定排序变量的次序很关键。先指定的变量优先于后指定的变量。多重排序可以在按某个变量值升序(或降序)排序的同时再按其他变量值降序(或升序)排序;3、数据排序后,原有数据的排序次序必然被打乱。第3页/共32页操作例子:操作例子:职工住房状况调查要求:要求:分析本市户口和外地户口家庭的住房面积情况。方法:方法:采用多重排序,主排序变量为本市户口,【数据】【排序个案】然后指定主排序变量到【排序依据】中,并在【排列顺序】中升序或者降序 注意:数据排序是整行数据排序,不只是对某列变量排序。第4页/共32页3.2 变量的计算数据计算的目的目的:数据的转换处理是在原有数据的基础上,计算产生一些
3、含有更丰富信息的新数据。例如根据职工的基本工资、失业保险、奖金等数据,计算实际月收入,这些新变量具有更直观更有效的特点。SPSS变量计算是在原有数据的基础上,根据用户给出的SPSS算术表达式以及函数,对所有个案或满足条件的部分个案,计算产生一系列新变量。(1)变量计算是针对所有个案(或指定的部分个案)的,每个个案都有自己的计算结果。(2)变量计算的结果应保存到一个指定变量中,该变量的数据类型应与计算结果的数据类型相一致。第5页/共32页变量计算中有三个概念:一、一、SPSS算术表达式算术表达式(numeric expression)它是由变量、常量、算术运算符、括号、函数等组成的式子。运算先后
4、顺序运算先后顺序:自左向右,先算括号内的;先计算乘方(*),再计算乘(*)、除(/),最后计算加(+)、减()第6页/共32页 二、SPSS 条件表达式1、简单的表达式由SPSS关系运算符、变量、常量以及算术表达式组成的式子。其中关系运算符:(大于)、=(大于等于)、35、sr=35)and(sr=700)(nl35)|(sr=700)第8页/共32页 三是函数指事先编好的并储存在SPSS 软件中,能够事先按照某些特定任务完成计算的一段计算机程序。运行后,会得到一个函数值。结构:函数名(参数)函数名(参数)括号中参数可以是常量(字符型常量用引号括起来),也可以是变量或算术表达式。参数可以是多个
5、,需要用逗号分开。SPSS函数有算术函数、统计函数、与分布相关的函数、查找函数、字符函数、缺失值函数,以及其它函数等(见课本:p41)三、SPSS函数第9页/共32页3.2.5变量计算应用举例 (职工基本情况数据)操作:【转换】【计算变量】在【目标变量】输入存放计算结果的变量名在【如果个案满足条件则包括】选项中输入条件表达式。依据职称级别计算实发工资(sr-bx)*0.5(0.3)第10页/共32页3.3 数据选取一、数据选取的目的数据选取就是根据分析的需要,从已收集到的大批量数据(总体)中按照一定的规则抽取部分数据(样本)参与分析的过程,通常也称为抽样。SPSS可根据指定的抽样方法从数据编辑
6、窗口中选出部分样本以实现数据选取,这样后面的分析操作就只针对选出的数据,直到用户取消这种选取为止。提高数据的分析效率,检验模型的需要(部分数据参与建模,剩余用于模型检验)第11页/共32页二、选取的基本方式(1)选取全部数据(All cases)(2)按指定条件选取指定条件选取(If condition is satisfied)SPSS要求用户以条件表达式给出数据选取的条件,SPSS将自动对数据编辑窗口中的所有个案进行条件判断。那些满足条件的个案,即条件判断为真的个案将被自动选取出来,而那些条件判断为假的个案则不被选中。第12页/共32页(3)随机抽样随机抽样(Random sample o
7、f cases),即对数据编辑窗口中的所有个案进行随机筛选,包括如下两种方式:第一,近似抽样(Approximately)近似抽样要求用户给出一个百分比数值,SPSS将按照这个比例自动从数据编辑窗口中随机抽取相应百分比数目的个案。注:由于SPSS在样本抽样方面的技术特点,抽取出的个案总数不一定恰好精确地等于用户指定的百分比数目,会有小的偏差,因而称为近似抽样。第13页/共32页 第二,精确抽样(Exactly)精确抽样要求用户给出两个参数。第一个参数是希望选取的个案数,第二个参数是指定在前几个个案中选取。SPSS自动在数据编辑窗口的前若干个个案中随机精确地抽出相应个数的个案来。第14页/共32
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS统计分析方法及应用 薛薇 SPSS 统计分析 方法 应用 第三 数据 预处理
限制150内