SPSS数据分析导论.pdf
《SPSS数据分析导论.pdf》由会员分享,可在线阅读,更多相关《SPSS数据分析导论.pdf(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 SPSS 数据分析技术课程提纲 教材:自编讲义 阮桂海主编,2000,SPSS 实用教程电子工业出版社 课程内容 第一讲 SPSS 基本知识及数据录入 一概述 二SPSS 的基本模块 三SPSS 的基本窗口 四SPSS 文件类型 五问卷及编码 六什么是数据 七数据录入问卷资料转变为原始数据文件(一)WORD 中录入(二)在 EXCEL 中录入数据(三)在 SPSS 中录入(四)Epidat 录入(六)数据文件的编辑与管理 第二讲 SPSS 命令文件的编写 一 SPSS 的命令文件(一)Data l
2、ist(二)Variable label 的命令格式(三)value label 的命令格式 (四)程序中的缺少值(Missing Value 命令)第三讲 用 Frequencies 做数据汇总 一.数据汇总使用的数据类型 二频次统计及统计量的计算(一)Statistics统计量(二)画图 第四讲 描述性统计(Descriptives 与 Explore 的应用)一Descriptives(一)应用实例(二)统计量分析 二Explore 分析 第五讲 数据变换 一Recode 命令对数据重新编码 二用 Compute 命令创建新变量 三COUNT 命令 四用 If 命令做条件变换和逻辑校 第
3、六讲 交叉汇总与关联分析(Crosstabs 的应用)一 交叉汇总表的一般形式及其特点 二 交互表的检验两个变量之间是否相关 三 两个变量之间相关的强度(一)定类定类 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年(二)定序定序(三)定类定距(四)定距定距 四运用 CRPSSTABS 做交互表及对变量之间的关系进行测量 第七讲 引进其他变量后的交互分析 一 因果分析explanation model 二 阐明分析Interpretation analysis 三 条件分析 conditional analysis 第八讲 描述子总体均值的差异(
4、Means 过程的应用)一Means 过程运行 二One Sample T-Test 第九讲 均值比较分析(TTest 过程)一独立样本 T 检验 二成对样本 T-TEST 三注意事项 第十讲 方差分析 ANOVA 一 实例 二 解释 第十一讲 相关分析(Correlate 过程分析)一Bivariate Correlate 二Partial correlation 偏相关(也叫净相关)三距离分析(Distance)第十二讲 简单线性相关(一元线性回归分析)一回归分析对变量的要求(假设条件)二一元线性回归模型及其含义 三在对话框中做一元线性回归模型 第十三讲 SPSS 统计图形 一Bar 条形
5、图 二Line 线图年龄与收入 三Area 面积图 四 Pie 饼图 五 High-LOW 高低图 六Pareto 帕雷托图 七Control 控制图 八Boxplot 箱图 九Error Bar 误差条图 十Scatter 散点图 十一.Histogram 直方图 十二P-P:P-P 概率图 十三Q-Q:Q-Q 概率图 十四Sequence 序列图 十五Time Series 时间序列图 第十四讲 非参数检验 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 SPSS 数据分析技术 第一讲 SPSS基本知识及数据录入.3 第二讲 SPSS命令文
6、件的编写.25 第三讲 用Frequencies做数据汇总.27 第四讲 描述性统计(Descriptives与Explore的应用).32 第五讲 数据变换P4355.39 第六讲 交叉汇总与关联分析(Crosstabs的应用).50 第一讲 SPSS 基本知识及数据录入 一概述 SPSS(statistical package for the social science)是美国 SPSS 公司开发的社会科学统计软件,SPSS 最初的几个版本都是在 DOS 系统下运行,虽然功能比较强,但在用户界面、输入、输出环境等方面并不十分理想。80 年代末,Microsoft 推出 Windows 后
7、,SPSS 迅速向 Windows 移植。90 年代以来,由于 MS Windows的普及,SPSS 公司于 1992、1993、1994 年相继推出了在 Windows 操作系统下的 5.0,6.0 6.1 版本,随着 Windows95 与 WindowsNT3.5 以上版本的 32 位操作系统的出现,1997 年以来又相继推出了 8.0,9.0,10.0 及 11.5 版本。11.5 版本的界面与 10.0 版本相比没有什么变化,只是增加了一些统计功能和方法。与其他版本相比,11.5 版本的用户界面更为友好,使用更加方便,统计功能更为强大。它的基本特点有四个:1大多数操作是通过菜单、图表
8、按钮、对话框完成,操作简单方便;2命令语句、子命令、选择项大部分通过对话框来进行,无需记忆大量的命令、过程与选择项;3可以与其他数据转换接口,其他软件生成的数据,可以转化为 SPSS 数据 4与其他 Windows 兼容,输出结果可以复制到 WORD,以便进一步编辑。二SPSS 的启动及基本模块 BSPSS 11.0 版一共由十个模块组成 SPSS BaseAdvanced Models Regression Models Tables Trends Categories Conjoint Exact Tests Missing Value Analysis Maps 三SPSS 的基本窗口(
9、一)打开 SPSS 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 (二)基本窗口Data Editor File 文件管理菜单,完成对数据文件的建立、读取、存储、打印等操作。Edit 文件编辑菜单,完成对数据文件的重新编辑、检索、拷贝、剪贴与替换等操作。View 浏览编辑,完成文本或数据内容的状态栏、工具栏、字体、网格线以及数值标签等功能的操作。Data 数据管理,数据的选择、排序菜单,包括对数据行的增加、合并、变量值的选择等 Transform 数据变换菜单,创建新变量、重新编码、计算同值的次数等。Analyze 统计过程菜单,完成各种统计
10、分析。Graphs 统计图表,完成统计图表的建立与编辑 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 Utilities 实用程序,有关命令解释、字体选择、文件信息、定义输出标题和窗口设计等。Windows 窗口控制,可进行窗口的排列、选择和显示操作 Help 帮助文件,帮助文件的调用、选择和显示等操作。(三)SPSS 的其他窗口 在 SPSS 的主窗口中还有两个窗口,一个是数据管理窗口,其标题名称是“Newdata”,且默认为激活状态。数据管理器是一种典型的电子表格形式,用户可通过定义变量名、格式化数据类型后输入原始数值,并可根据需要对数据
11、进行增删、剪贴、修改、存储等操作。另一个是结果输出窗口,标题名称是“!Output1”,启动时为非活动窗口,只有当完成一项处理后,才在该窗口显示处理过程提示和计算结果。当进行某项具体的统计方法操作时,可点击对话框的“Paste”钮激活命令编辑窗口,其标题名称是“!Syntax1”,或选 Window 菜单的!Syntax1 项也可激活命令编辑窗口。用户可利用该窗口进行 SPSS 命令的输入、编辑和运行,这对熟悉 DOS 版本的 SPSS 用户是十分方便的。上述三个窗口在实际操作时,经常因为内容很多,一个窗口中无法看到全部内容。有两种方法可帮助用户看到全部内容:1、使用窗口的滚动条 每个窗口的右
12、侧有一个垂直滚动条,用鼠标点击滚动条上下两头的箭号钮或用鼠标按住滚动条中的方块上下拖动,可使窗口中的内容前后翻滚;底边有一个水平滚动条,用鼠标点击滚动条左右两头的箭号钮或用鼠标按住滚动条中的方块左右拖动,可使窗口中的内容左右移动。如此,用户便可看清所有内容。2、改变窗口的大小 一般情况下,鼠标指针是一个朝左上方的箭头,当把鼠标指针指向窗口边界时,鼠标指针变成双向箭头形。这时,若按住鼠标左键移动,可改变窗口的大小,同样可看清窗口内容。SPSS 的退出 完成 SPSS 的统计分析后,退出该系统的方法是:选 File 菜单的 Exit 项,回答系统提出的有关是否需要存储原始数据、计算结果和 SPSS
13、 命令之后,即退到 Windows 的程序管理器中。SPSS 的求助系统 SPSS 提供了丰富且详尽的在线帮助。主要有下列几种方式:1、主窗口的 Help 菜单:在软件运行的任何时候,点击 Help 菜单选相关的子菜单,可得到所需的各种帮助。2、主窗口的 Utilities 菜单:在 Utilities 菜单中,有 Command index.子菜单,它提供有关 SPSS 各项统计分析技术能解决什么问题的信息。3、各种对话框中的 Help 钮:在具体操作过程中,当弹出某一对话框时,一般总有 Help钮,点击该钮,用户可得到这一对话框选项内容的详细帮助。4、结果输出窗口中的 Grossary 钮
14、:当用户在浏览计算结果时,可点击结果输出窗的Grossary 钮,它显示各种专用统计术语的解释信息以便用户理解。5、命令编辑窗口中的 Syntax 钮:激活命令编辑窗,可见一 Syntax 钮,点击该钮,可得到与用户正在编辑的命令相关的命令语法提示。北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 四SPSS 文件类型 1原始数据文件及其类型*.Dat(原来还有 ASCII 码)生成方法 DOS 中的 EDIT WORD 中的TXT EXCEL 中的XLS DBASE 中的DBF 以上形式的数据文件在 SPSS 中可以直接调用 打开一个已有的数据
15、文件的方式如下:北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 2数据文件*SAV *SAS(原来)数据文件可以根据原始数据的转换获得 3图形文件 *CHT 4命令文件 *SPS 5结果文件 *SPO(OUTPUT,原来是LST)五问卷及编码 1多选择题的处理(0,1 编码)2多位题(要补位)3缺失值,以 9 结尾,如年龄,编码为 99,如答案正好是 9,以 0 替补 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 4不适用,以 8 结尾,8,98,998,如答案正好是 8,以 0 替补。如有四
16、个可选项的多选题而不适用,则为 8888。六什么是数据 数据是一个矩阵,行是一个 case 在多维空间下的位置,列是不同空间的维度用来分析用行收集到的资料。数据分析:用微观的方法分析宏观的资料,分析平均人、平均的体系;这个分析都是在平均的基础上,这种推断是不能还原到个案的,分析的过程是不断抛弃个人影响的过程。数据的计算机表示法:变量-问卷中的每一个问题,在 dBASE 中称为字段(Field)变量名-变量名以字母为首,后面跟 A-Z,0-9 字符(字符8 个字符),变量名不能带扩展名,如 A11。变量值-变量的答案 七数据录入问卷资料转变为原始数据文件(一)WORD 中录入,存成TXT 1方法
17、:打开 WORD 文档,录入数据 固定格式:这种数据要根据已经确定的栏目位置对号入座地录入数据,在对问卷进行编码时,指定了各个项目的数值与栏位(书 P10),给数据指定栏目位置时,前后数据一般不留空格,这样可以提高数据录入的速度,缺点是前后的数据不太容易区分。如:栏位(列号)1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 0 0 0 0 1 2 2 6 1 5 0 0 0 0 0 0 2 2 3 1 4 0 0 自由格式 P22:按照问卷编码方案将某个个案数据直接录入,中间可以没有任何空格和其他符号,也可以在输入时在不同的变量之间以空挡、逗号、分号等
18、把变量分开,不同个案之间的数据要对齐,数据录入完成以后,存成*TXT 文件 2把 TXT 文件转变为*SAV 文件 SPSSFile-Read Text Data-点选*TXT-对话框(六步),即Text Import Wizard-Fixed wide-No-下一步-The first case begins on which line-划线即可-下一步完成 SPSSFile-Read Text Data-点选*TXT-对话框(六步),即Text Import Wizard-Delimite-下一步-SPACE-下一步-完成 如果特殊数据、负数、小数点多时,则不用这种方法,可以用 EXCEL
19、 录入。(二)在 EXCEL 中录入数据 打开 EXCEL 表 不用补 0,可以录入汉字,速度较慢,一般在小样本时用比较好。第一行录入变量,第二行开始录入数据 文件保存类型:*XLS(工作簿 BOOK)转变为为*SAV 文件:SPSS-File-Open-Data-点选文件类型*XLS-点选BOOK-OK-存成 SPSS 的*SAV 文件即可 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 用 EXCEL 录入的优点:1可以进行各种计算,如数学与三角函数 2可以进行位置计算,还可以直接 COPY 3可以用 EXCEL 做辅助分析,进行数据变换
20、4可以作表,非常方便 (三)在 SPSS 中录入 直接在 SPSS WIN 中录入数据 方法:SPSSFILENEW DATA点选 Data View(数据浏览界面)录入数据存成*SAV,适合于较小的样本 在 Data View(数据浏览界面)中录入的数据还没有在各个数据之间区分意义,可以在 Variable View(变量浏览界面)中对录入数据的意义进行界定,这个工作也可以在问卷数据录入前做,也可以在数据录入后做。点击 Variable View(变量浏览界面),对变量进行定义。定义变量有 10 种功能选项,1Name:变量栏名,在这个栏目中输入变量名,如 V1、V2、age sex 或其他
21、名称。定义变量名注意:A变量名以字母为首,后面跟 A-Z,0-9 字符(字符8 个字符),?!/等不能作为变量名,变量名也不能带扩展名,如 A11。B有些关键词不能作为变量的名字,如 AND OR NOT EQ LT LE GT GE NE NE TO BY crosstabs WITH ALL THRU P-Percentage SPSS 中不区别大小写字符 可以用中文做变量名,但最好不用,因为涉及一个兼容性问题。北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 2Type:变量类型,有 8 种类型可供选择 Numeric:数值型变量,系统默认
22、值为数值型,系统默认长度为 8,小数位数为 2 Comma:带逗号的数值型变量,即整数部分每 3 位数加一逗号,其余定义方式同数值型。输入:1,287,300,显示:1,287,300 Dot:带圆点的数值型变量,3 位加点数值型,无论数值大小,均以整数形式显示,每 3位加一小点(但不是小数点),可定义小数位置,但都显示 0,且小数点用逗号表示。如 1.2345 显示为 12.345,00(实际是 12345E-4).Scientific notion:科学记数法 输入:253.7E2,输出:253.7E2 Date:日期型变量,有 27 种表示方法。点 date 即可以看到 Dollar:货
23、币型变量,有 12 种表示方法 Custom currency:自定义型变量,是一种用户利用 Edit 菜单的 Options 功能定义的。String:字符型变量 一般最常用的是数字型变量与字符型变量。日期型变量格式:ddmmmyyyy 日日-月月月-年年年年 mm/dd/yyyy 月月/日日/年年年年 qQyyyy 季度 Q 年年年年 mMmyy 月份年年 wWWKyy 周数 WK 年年 hh:mm:ss 时时分分秒秒 SPSS 中存储的实际上是该时间与 1582 年 10 月 14 日零点相差的秒数,如 1582年 10 月 15 日存储的就是 60602486400,在我们把变量类型变
24、换为数值型时可以看到这种数字。如定 date 的类型为 mm/dd/yyyy,输入 10/15/1582,当我们把日期型数据转变为数值型数据时,看到数据变为 86400。北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 货币型变量格式 格式 总长度 小数位数$#2 0$#3 0$#4 0$#7 2$#,#6 0$#,#9 0$#,#,#,#16 0$#,#,#,#19 2 要求:能够辨别数值型、字符型与日期型变量就可以。3width:宽度,指的是运算宽度,默认值为 8,运算宽度实际上只会改变输出结果的显示宽度,数据的存储结果与运算的精度不受宽度的
25、影响。4Decimals:小数位数,根据每个变量数据的大小,定义小数的位数 5Label:变量标签,给相应的变量以文字说明 6values:数值标签,value 1 value 男 add 最后点 OK 7missing values 缺失值,有三种选项 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 No missing values 没有缺失值 Discrete missing values 定义 13 个单一数为缺失值 Range plus optional discrete values 定义指定范围为缺失值,同时指定另外一个不在这一范
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 数据 分析 导论
限制150内