第一讲 SPSS数据分析.pdf
《第一讲 SPSS数据分析.pdf》由会员分享,可在线阅读,更多相关《第一讲 SPSS数据分析.pdf(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 SPSS 数据分析技术课程提纲数据分析技术课程提纲 教材:自编讲义教材:自编讲义 阮桂海主编,阮桂海主编,2000,SPSS 实用教程电子工业出版社实用教程电子工业出版社 课程内容课程内容 第一讲第一讲 SPSSSPSS 基本知识及数据录入基本知识及数据录入 一概述一概述 二二SPSSSPSS 的基本模块的基本模块 三三SPSSSPSS 的基本窗口的基本窗口 四四SPSSSPSS 文件类型文件类型 五问卷及编码五问卷及编码 六什么是数据六什么是数据 七数据录入七数据录入问卷资料转变为原始数据文件问
2、卷资料转变为原始数据文件 (一)(一)WORDWORD 中录入中录入 (二)在(二)在 EXCELEXCEL 中录入数据中录入数据 (三)在(三)在 SPSSSPSS 中录入中录入 (四)(四)EpidatEpidat 录入录入 (六)数据文件的编辑与管理(六)数据文件的编辑与管理 第二讲第二讲 SPSSSPSS 命令文件的编写命令文件的编写 一一 S SPSSPSS 的命令文件的命令文件 (一)(一)Data listData list (二)(二)Variable labelVariable label 的命令格式的命令格式 (三)(三)value labelvalue label 的命令
3、格式的命令格式 (四)程序中的缺少值(四)程序中的缺少值(Missing ValueMissing Value 命令)命令)第三讲第三讲 用用 FrequenciesFrequencies 做数据汇总做数据汇总 一一.数据汇总使用的数据类型数据汇总使用的数据类型 二频次统计及统计量的计算二频次统计及统计量的计算 (一)(一)StatisticsStatistics统计量统计量 (二)画图(二)画图 第四讲第四讲 描述性统计(描述性统计(DescriptivesDescriptives 与与 E Explorexplore 的应用)的应用)一一DescriptivesDescriptives (
4、一)应用实例(一)应用实例 (二)统计量分析(二)统计量分析 二二E Explorexplore 分析分析 第五讲第五讲 数据变换数据变换 一一RecodeRecode 命令对数据重新编码命令对数据重新编码 二用二用 ComputeCompute 命令创建新变量命令创建新变量 三三COUNTCOUNT 命令命令 四用四用 IfIf 命令做条件变换和逻辑校命令做条件变换和逻辑校 第六讲第六讲 交叉汇总与关联分析(交叉汇总与关联分析(CrosstabsCrosstabs 的应用)的应用)一一 交叉汇总表的一般形式及其特点交叉汇总表的一般形式及其特点 二二 交互表的检验交互表的检验两个变量之间是否相
5、关两个变量之间是否相关 三三 两个变量之间相关的强度两个变量之间相关的强度 (一)定类(一)定类定类定类 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年(二)定序(二)定序定序定序 (三)定类(三)定类定距定距 (四)定距(四)定距定距定距 四运用四运用 CRPSSTABSCRPSSTABS 做交互表及对变量之间的关系进行测量做交互表及对变量之间的关系进行测量 第七讲第七讲 引进其他变量后的交互分析引进其他变量后的交互分析 一一 因果分析因果分析explaexplanation modelnation model 二二 阐明分析阐明分析Inte
6、rpretation analysisInterpretation analysis 三三 条件分析条件分析 conditional analysisconditional analysis 第八讲第八讲 描述子总体均值的差异(描述子总体均值的差异(MeansMeans 过程的应用)过程的应用)一一MeansMeans 过程运行过程运行 二二One Sample TOne Sample T-TestTest 第九讲第九讲 均值比较分析(均值比较分析(T TTestTest 过程)过程)一独立样本一独立样本 T T 检验检验 二成对样本二成对样本 T T-TESTTEST 三注意事项三注意事项
7、第十讲第十讲 方差分析方差分析 ANOVAANOVA 一一 实例实例 二二 解释解释 第十一讲第十一讲 相关分析(相关分析(CorrelateCorrelate 过程分析)过程分析)一一Bivariate CBivariate Correlateorrelate 二二Partial correlationPartial correlation 偏相关(也叫净相关)偏相关(也叫净相关)三距离分析(三距离分析(D Distanceistance)第十二讲第十二讲 简单线性相关(一元线性回归分析)简单线性相关(一元线性回归分析)一回归分析对变量的要求(假设条件)一回归分析对变量的要求(假设条件)二一
8、元线性回归模型及其含义二一元线性回归模型及其含义 三在对话框中做一元线性回归模型三在对话框中做一元线性回归模型 第十三讲第十三讲 SPSSSPSS 统计图形统计图形 一一BarBar 条形图条形图 二二LineLine 线图线图年龄与收入年龄与收入 三三AreaArea 面积图面积图 四四 PiePie 饼图饼图 五五 HighHigh-LOWLOW 高低图高低图 六六ParetoPareto 帕雷托图帕雷托图 七七ControlControl 控制图控制图 八八BoxplotBoxplot 箱图箱图 九九Error BaError Bar r 误差条图误差条图 十十ScatterScatte
9、r 散点图散点图 十一十一.HistogramHistogram 直方图直方图 十二十二P P-P:PP:P-P P 概率图概率图 十三十三Q Q-Q:QQ:Q-Q Q 概率图概率图 十四十四SequenceSequence 序列图序列图 十五十五Time SeriesTime Series 时间序列图时间序列图 第十四讲第十四讲 非参数检验非参数检验 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 SPSS 数据分析技术数据分析技术 第一讲第一讲 SPSS 基本知识及数据录入基本知识及数据录入 一概述一概述 SPSS(statistical
10、package for the social science)是美国)是美国 SPSS 公司开发的社公司开发的社会科学统计软件,会科学统计软件,SPSS 最初的几个版本都是在最初的几个版本都是在 DOS 系统下运行,虽然功能比系统下运行,虽然功能比较强较强,但在用户界面、输入、输出环境等方面并不十分理想。,但在用户界面、输入、输出环境等方面并不十分理想。80 年代末,年代末,Microsoft推出推出 Windows 后,后,SPSS 迅速向迅速向 Windows 移植。移植。90 年代以来,由于年代以来,由于 MS Windows的普及,的普及,SPSS 公司于公司于 1992、1993、1
11、994 年相继推出了在年相继推出了在 Windows 操作系统下操作系统下的的 5.0,6.0 6.1 版本,随着版本,随着 Windows95 与与 WindowsNT3.5 以上版本的以上版本的 32 位操作位操作系统的出现,系统的出现,1997 年以来又相继推出了年以来又相继推出了 8.0,9.0,10.0 及及 11.5 版本。版本。11.5 版本的版本的界面与界面与 10.0 版本相比没有什么变化,只是增加了一些统计功版本相比没有什么变化,只是增加了一些统计功能和方法。与其他能和方法。与其他版本相比,版本相比,11.5 版本的用户界面更为友好,使用更加方便,统计功能更为强大。版本的用
12、户界面更为友好,使用更加方便,统计功能更为强大。它的基本特点有四个:它的基本特点有四个:1大多数操作是通过菜单、图表按钮、对话框完成,操作简单方便;大多数操作是通过菜单、图表按钮、对话框完成,操作简单方便;2命令语句、子命令、选择项大部分通过对话框来进行,无需记忆大量的命令语句、子命令、选择项大部分通过对话框来进行,无需记忆大量的命令、过程与选择项;命令、过程与选择项;3可以与其他数据转换接口,其他软件生成的数据,可以转化为可以与其他数据转换接口,其他软件生成的数据,可以转化为 SPSS 数据数据 4与其他与其他 Windows 兼容,输出结果可以复制到兼容,输出结果可以复制到 WORD,以便
13、进一步编辑。,以便进一步编辑。二二SPSS 的启动及基本模块的启动及基本模块 BSPSS 11.0 版一共由十个模块组成版一共由十个模块组成 SPSS BaseAdvanced Models Regression Models Tables Trends Categories Conjoint Exact Tests Missing Value Analysis Maps 三三 SPSS 的基本窗口的基本窗口(一)打开(一)打开 SPSS 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 (二)基本窗口(二)基本窗口Data Editor Fil
14、e 文件管理菜单,完成对数据文件的建立、读取、存储、打印等操作。文件管理菜单,完成对数据文件的建立、读取、存储、打印等操作。Edit 文件编辑菜单,完成对数据文件的重新编辑、检索、拷贝、剪贴与替文件编辑菜单,完成对数据文件的重新编辑、检索、拷贝、剪贴与替换等操作。换等操作。View 浏览编辑,完成浏览编辑,完成文本或数据内容的状态栏、工具栏、字体、网格线以文本或数据内容的状态栏、工具栏、字体、网格线以及数值标签等功能的操作。及数值标签等功能的操作。Data 数据管理,数据的选择、排序菜单,包括对数据行的增加、合并、数据管理,数据的选择、排序菜单,包括对数据行的增加、合并、变量值的选择等变量值的
15、选择等 Transform 数据变换菜单,创建新变量、重新编码、计算同值的次数等。数据变换菜单,创建新变量、重新编码、计算同值的次数等。Analyze 统计过程菜单,完成各种统计分析。统计过程菜单,完成各种统计分析。Graphs 统计图表,完成统计图表的建立与编辑统计图表,完成统计图表的建立与编辑 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 Utilities 实用程序,有关命令解释、字体选择、文件信息、定义输出标题和窗实用程序,有关命令解释、字体选择、文件信息、定义输出标题和窗口设计等。口设计等。Windows 窗口控制,可进行窗口的排列
16、、选择和显示操作窗口控制,可进行窗口的排列、选择和显示操作 Help 帮助文件,帮助文件,帮助文件的调用、选择和显示等操作。帮助文件的调用、选择和显示等操作。(三)(三)SPSSSPSS 的其他窗口的其他窗口 在在 SPSSSPSS 的主窗口中还有两个窗口,一个是数据管理窗口,其标题名称是的主窗口中还有两个窗口,一个是数据管理窗口,其标题名称是“Newdata”“Newdata”,且默认为激活状态。数据管理器是一种典型的电子表格形式,用户可通过定义变量名、格且默认为激活状态。数据管理器是一种典型的电子表格形式,用户可通过定义变量名、格式化数据类型后输入原始数值,并可根据需要对数据进行增删、剪贴
17、、修改、存储等操作。式化数据类型后输入原始数值,并可根据需要对数据进行增删、剪贴、修改、存储等操作。另一个是结果输出窗口,标题名称是“另一个是结果输出窗口,标题名称是“!Output1”!Output1”,启动时为非活动窗口,只有当完,启动时为非活动窗口,只有当完成一项处理后,才在该窗口显示处理过程提示和计算结果。成一项处理后,才在该窗口显示处理过程提示和计算结果。当进行某项具体的统计方法操作时,可点当进行某项具体的统计方法操作时,可点击对话框的“击对话框的“Paste”Paste”钮激活命令编辑窗口,钮激活命令编辑窗口,其标题名称是其标题名称是“!Syntax1“!Syntax1”,或选,或
18、选 WindowWindow 菜单的菜单的!Syntax1!Syntax1 项也可激活命令编辑窗口。用户项也可激活命令编辑窗口。用户可利用该窗口进行可利用该窗口进行 SPSSSPSS 命令的输入、编辑和运行,这对熟悉命令的输入、编辑和运行,这对熟悉 DOSDOS 版本的版本的 SPSSSPSS 用户是十分用户是十分方便的。方便的。上述三个窗口在实际操作时,经常因为内容很多,一个窗口中无法看到全部内容。有上述三个窗口在实际操作时,经常因为内容很多,一个窗口中无法看到全部内容。有两种方法可帮助用户看到全部内容:两种方法可帮助用户看到全部内容:1 1、使用窗口的滚动条、使用窗口的滚动条 每个窗口的右
19、侧有一个垂直滚动条,用鼠标点击滚动条上下每个窗口的右侧有一个垂直滚动条,用鼠标点击滚动条上下两头的箭号钮或用鼠标按住滚动条中的方块上下拖动,可使窗口中的内容前后翻滚;底边两头的箭号钮或用鼠标按住滚动条中的方块上下拖动,可使窗口中的内容前后翻滚;底边有有一个水平滚动条,用鼠标点击滚动条左右两头的箭号钮或用鼠标按住滚动条中的方块左一个水平滚动条,用鼠标点击滚动条左右两头的箭号钮或用鼠标按住滚动条中的方块左右拖动,可使窗口中的内容左右移动。如此,用户便可看清所有内容。右拖动,可使窗口中的内容左右移动。如此,用户便可看清所有内容。2 2、改变窗口的大小、改变窗口的大小 一般情况下,鼠标指针是一个朝左上
20、方的箭头,当把鼠标指针一般情况下,鼠标指针是一个朝左上方的箭头,当把鼠标指针指向窗口边界时,鼠标指针变成双向箭头形。这时,若按住鼠标左键移动,可改变窗口的指向窗口边界时,鼠标指针变成双向箭头形。这时,若按住鼠标左键移动,可改变窗口的大小,同样可看清窗口内容。大小,同样可看清窗口内容。SPSSSPSS 的退出的退出 完成完成 SPSSSPSS 的统计分析后,退出该系统的方法是:选的统计分析后,退出该系统的方法是:选 FileFile 菜单的菜单的 ExitExit 项,回答系统提项,回答系统提出的有关是否需要存储原始数据、计算结果和出的有关是否需要存储原始数据、计算结果和 SPSSSPSS 命令
21、之后,即退到命令之后,即退到 WindowsWindows 的程的程序管理序管理器中。器中。SPSSSPSS 的求助系统的求助系统 SPSSSPSS 提供了丰富且详尽的在线帮助。主要有下列几种方式:提供了丰富且详尽的在线帮助。主要有下列几种方式:1 1、主窗口的、主窗口的 HelpHelp 菜单:在软件运行的任何时候,点击菜单:在软件运行的任何时候,点击 HelpHelp 菜单选相关的子菜单,可菜单选相关的子菜单,可得到所需的各种帮助。得到所需的各种帮助。2 2、主窗口的、主窗口的 UtilitiesUtilities 菜单:在菜单:在 UtilitiesUtilities 菜单中,有菜单中,
22、有 Command index.Command index.子菜单,它子菜单,它提供有关提供有关 SPSSSPSS 各项统计分析技术能解决什么问题的信息。各项统计分析技术能解决什么问题的信息。3 3、各种对话框中的、各种对话框中的 HelpHelp 钮:在具体操作过程中,当弹出某一对话框时,一般总有钮:在具体操作过程中,当弹出某一对话框时,一般总有 HelpHelp钮,点击该钮,用户可得到这一对话框选项内容的详细帮助。钮,点击该钮,用户可得到这一对话框选项内容的详细帮助。4 4、结果输出窗口中的、结果输出窗口中的 GrossaryGrossary 钮:当用户在浏览计算结果时,可点击结果输出窗的
23、钮:当用户在浏览计算结果时,可点击结果输出窗的GrossaryGrossary 钮,它显示各种专用统计术语的解释信息以便用户理解。钮,它显示各种专用统计术语的解释信息以便用户理解。5 5、命令编辑窗口中的、命令编辑窗口中的 SyntaxSyntax 钮:激活命令编辑窗,可见一钮:激活命令编辑窗,可见一 SyntaxSyntax 钮,点击该钮,可钮,点击该钮,可得到与用户正在编辑的命令相关的命令语法提示。得到与用户正在编辑的命令相关的命令语法提示。北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 四四SPSS 文件类型文件类型 1原始数据文件及其类
24、型原始数据文件及其类型*.Dat(原来还有(原来还有 ASCII 码)码)生成方法生成方法 DOS 中的中的 EDIT WORD 中的中的TXT EXCEL 中的中的XLS DBASE 中的中的DBF 以上形式的数据文件在以上形式的数据文件在 SPSS 中可以直接调中可以直接调用用 打开一个已有的数据文件的方式如下:打开一个已有的数据文件的方式如下:北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 2数据文件数据文件*SAV *SAS(原来)(原来)数据文件可以根据原始数据的转换获得数据文件可以根据原始数据的转换获得 3图形文件图形文件 *CHT
25、 4命令文件命令文件 *SPS 5结果文件结果文件 *SPO(OUTPUT,原来是原来是LST)五问卷及编码五问卷及编码 1 多选择题的处理(多选择题的处理(0,1 编码)编码)2 多位题(要补位)多位题(要补位)3 缺失值,以缺失值,以 9 结尾,如年龄,编码为结尾,如年龄,编码为 99,如答案正好是,如答案正好是 9,以,以 0 替补替补 北京大学社会学系北京大学社会学系 数据分析课程讲义数据分析课程讲义 刘爱玉刘爱玉 2004 年年 4 不适用,以不适用,以 8 结尾,结尾,8,98,998,如答案正好是,如答案正好是 8,以,以 0 替补。如有四个可替补。如有四个可选项的多选题而不适用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一讲 SPSS数据分析 第一 SPSS 数据 分析
限制150内