SPSS统计软件应用.doc
《SPSS统计软件应用.doc》由会员分享,可在线阅读,更多相关《SPSS统计软件应用.doc(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 2.1 File:文件管理菜单,有关文件的调入、存储、显示和打印等; 2.2 Edit:编辑菜单,有关文本内容的选择、拷贝、剪贴、寻找和替换等; 2.3 View:窗口外观控制菜单, 状态栏、工具栏、表格线的显示及隐藏,字体设置等。 2.4 Data:数据管理菜单,有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等; 2.5 Transform:数据转换处理菜单,有关数值的计算、重新赋值、排序、缺失值替代等; 2.7 Analyze:统计菜单,有关一系列统计方法的应用,比如概括描述、均值比较、相关、回归等分析; 2.7 Graphs:作图菜单,有关统计图
2、的制作; 2.8 Utilities:用户选项菜单,有关命令解释、字体选择、文件信息、定义输出标题、窗口设计等; 2.9 Windows:窗口控制菜单,有关窗口的排列、选择、显示等; 2.7 Help:求助菜单,有关帮助文件的调用、查寻、显示等。点击菜单选项即可激活菜单,这时弹出下拉式子菜单,用户可根据自己的需求再点击子菜单的选项,完成特定的功能。Missing values:定义缺省值。问卷中有一些特殊情况的编码,如被调查者不回答、打错、不需要填答等情况,要进行缺省值的处理。缺省值又叫用户缺省值(User missing value)No missing values:没有缺省值。 Disc
3、rete missing values:定义13个单一数的缺省值。 Range plus one of optional missing values:定义指定范围为缺省值,同时指定另外一个不在这一范围内的单一数为缺省值。 宽度为1的变量:单项选择题的缺省值一般是0、9,当答案有9选项时,就为0;或设定一个范围也可。多向选择题的缺省值就可设为9,或设定一个范围。宽度为2及以下的变量:缺省值设为99,或设一个范围均可。依此类推,视具体情况而定。 2.在数据浏览窗口输入数据 打开spss输入数据保存。 二、通过foxpro录入数据 特点:适用于大型调查;通用性好;输入速度快;易于修改。 1.建库
4、create *dbf(此处要定义变量名、类型及宽度) 变量名称 变量类型 宽度。 小数位数。 2.操作 append 加数字 append from 合盘 edit 编辑 browse 浏览 delete 删除 insert 插入 3.存盘并转换为spss数据格式 导出到foxpro2.0版本,然后在spss窗口打开foxpro2.0版本的数据表,在file里点击save as,把新的数据文件保存在制定的位置即完成数据转换。 4.定义变量的其它属性 Label: 变量标签,解释变量的含义。Values: 对标签进行定义。 Missing values:定义缺省值。Columns:定义数据管理
5、器纵列的长度 Align:字符排序方向。Measure:数据亮度选择。第二章:统计中常用的数据编辑第一节:个案查找、排序与选择 输入的原始数据,经常在统计分析前或统计分析过程中,需要作一些特殊的处理。为此,系统提供了如下主要方法。 一、个案查找 Data Go to Case 二、个案排序 Cases排序是重新排列数据行的先后次序,即以人为指定的某个变量值为基准进行升序排序Cases(默认方式)或降序排序Cases。步骤: (1)单击Data - Sort Cases; (2)单击需排序的变量右箭头,让所选变量进入Sort by文本框内。 (3)Sort Order有2个含义: Ascendi
6、ng升序排序,此为默认方式;Descending降序排序。 (4)单击图中的OK按钮,显示排序结果。 注意:用户也可选多个变量,当多个变量同时排序时,系统将按变量选择的先后逐级依次排序,即SPSS将先根据第1个变量排列数据行,当第1个变量值相同时再根据第2个变量值排序。 三、选择个案 如何在一个数据库或一个目标数据文件中限选部分个案(Some Cases)进行统计分析。这是常用的按部门或按地区的统计方法。 1.几种常见的选择个案情况: All cases :表示所有的观察例数都被选择,该选项可用于解除先前的选择; If Condition is Satisfied :表示按指定条件选择,限选某
7、个子总体进行统计; Random sample of cases:表示提取随机样本进行统计; Based on time or case range:表示按照顺序限选一定范围内的Cases统计; Use filter variable:表示用指定的变量作过滤,用户先选择1个变量,系统自动在数据管理器中将该变量值为0的观察单位标上删除标记,系统对有删除标记的观察单位不作分析。 若用户在Select Cases对话框的Unselected Cases Are框中选Deleted项,则系统将删除所有被标上删除标记的观察单位。 没有选中的个案处理:filtered(过滤)或deleted(删除) 调用
8、Select Cases命令完成定义后,SPSS将在主窗口的最下面状态行中显示Filter On字样;若调用该命令后的数据库被用户存盘,则当这个数据文件再次打开使用时,仍会显示Filter On字样,意味着数据选择命令依然有效。 2.限选某个子总体进行统计 限选某个子总体是指限选数据库或目标数据文件中某类个案的数据进行统计。 步骤:1)单击Data中的Select Cases按钮进入对话框; 2)从对话框中选择If Condition is Satisfied命令按钮,单击If按钮,进入设置表达式; 3)在设置表达式的文本框中按照选取的需要输入表达式,单击Continue按钮;4)单击OK按钮
9、确认选择并显示结果。 说明:如选择filtered,则被打上斜杠/的Cases是落选的。 3.提取随机要本进行统计 提取随机样本,是从数据库或目标数据中提取一定比例的数据行(Cases)进行统计分析。 例3:目标数据共有72个Cases,要求随机抽取30%的Cases进行样本统计。 步骤: 1)单击Data,进入Select Cases对话框; 2)单击对话框中的中的“Random sample of cases” 下面的“Sample”按钮,进入抽样类型对话框,输入需要的抽样要求后,点击Continue - OK按钮,获得结果。 4.限选一定范围内的若干个Cases 限选一定范围内的n个Ca
10、ses是指依次选择数据文件中若干连续的Cases进行统计,比如需要限选前30个,或后30个或其他范围的进行统计。 步骤: 1)单击Data中的Select Cases按钮进入对话框; 2)从对话框中选择Based on time or case range下的range按钮,进入设置范围对话框; 3)输入个案的选取范围,点击Continue - OK按钮,获得结果。 第二节:数据的增删、合并与拆分 一、数据的增删 1.增加一个新的变量列 例如要在第2列前增加一个新的列,使原来的第2列右移变成第3列,则可先激活第2列的任一单元格,然后选Data菜单的Insert Variable命令项,系统自动
11、为用户在第2列前插入一个新的变量列,原第2列自动向右移一列成为第3列。 Data Insert variable 2.增加一个新的个案 例如要在第6个观察单位前增加一个观察单位(亦即在第6行前增加一行,使原来的第6行下移成为第7行),则可先激活第6行的任一单元格,然后选Data菜单的Insert Case命令项,系统自动为用户在第6行前插入一个新的行,原第6行列自动向下移一行成为第7行。 Data Insert Case 3.删除一个个案 例如要删除第9行(即删除这个观察单位的所有观察值),则可先点击第9行的行头,这时整个第9行被选中(呈黑底白字状),然后按Delete键或选Edit菜单的Cl
12、ear命令项,该行即被删除。 4.删除一个变量列 例如要删除第4个变量列,则可先点击第4列的列头,这时整个第4列被选中(呈黑底白字状),然后按Delete键或选Edit菜单的Clear命令项,该列即被删除。 二、合并数据 1.合并个案 从外部数据文件中增加记录到当前数据文件中,称为纵向合并,用Add Cases对话框完成,相互合并的数据文件中应该有相同的变量。 Data C Merge files C Merge cases C 选中需要合并的数据文件(在Add Cases对话框中,左侧显示的是新、老数据文件中不匹配的变量名,右侧显示的是已经匹配的变量名。可以用Rename按钮对不匹配变量改名
13、(先选中)或用鼠标强行匹配(即先按Ctrl键选中匹配的两个变量再单击Pair钮)。右下方的Indicate case source as variable复选框用于定义一个新变量以区分哪些记录是后来添加的。选择停当后单击OK,该操作就完成了。) C OK即可。2.合并变量 从外部数据文件增加变量到当前数据文件,称为横向合并,用Add Variable对话框完成,相互合并的数据文件中应包含同样的记录。 Data C Merge files C Merge variablesC 选中需要合并的数据文件C OK即可。 三、数据的拆分Data C Split File 用于将数据文件分组进行处理: A
14、nalyze all cases:和下面的两个单选框为一组,选中本框不拆分文件; Compare groups:按所选变量拆分文件,各组分析结果紧挨在一起便于相互比较; Organize output by groups:按所选变量拆分文件,各组分析结果单独放置; Groups based on框:用于选择拆分数据文件的变量; Sort the file by grouping variables:将数据按所用的拆分变量排序; File is already sorted:数据保持原状,不按所用的拆分变量排序。第三章:常用的数据转换第一节:数据的运算与缺失值的替代 一、数据的运算与新变量的生成
15、 如果原始数据中只有月收入变量,但在统计中需要计算年收入,则应创建新变量来表示年收入,它等于月收入乘以12,类似的很多。这些都可以通过compute 命令实现。 1.步骤: 1)单击spss菜单行中的transform,进入compute对话框,Compute.命令项既可对选定的变量进行运算操作,又可通过运算操作让系统生成新的变量。 2)在弹出的Compute Variable对话框中,首先在Target Variable指定一个变量(可以是数据管理器中已有的变量,也可是用户欲生成的新变量),然后点击Type & Label.钮确定是数值型变量,还是字符型变量,或加上变量标签; 3)在Nume
16、ric Expression框中键入运算公式,系统提供计算器和82种函数(在Functions框内)让用户使用; 若点击If.钮会弹出Compute Variable:If Cases对话框,用户可指定符合条件的变量参与运算。 4)点击OK钮即可在数据管理器中产生一个新变量。 二、缺失值的替代 对于缺失值,可采取多种手段进行科学替代。 1.选Transform菜单的Replace Missing Values.命令项; 在弹出的Replace Missing Values 对话框中,先在变量名列中选1个或多个存在缺失值的变量点击钮,使之进入New Variable(s)框,这时系统自动产生用于
17、替代缺失值的新变量; 2.点击Method的下箭头选择缺失值的替代方式: 1)Series mean: 用该变量所有非缺失值均数做替代; 2)Mean of nearby points:用缺失值相邻点的非缺失值的均数做替代,取多少个相邻点可任意定义; 3)Median of nearby points:用缺失值相邻点的非缺失值的中位数做替代,取多少个相邻点可任意定义; 4)Linear interpolation: 用缺失值相邻两点非缺失值的中点值做替代; 5)Linear trend at point:用线性拟合方式确定替代值。 第二节:数据重新编码 在数据管理器中,用户可对各单元的数值重新
18、赋予新值。 选Transform菜单的Recode命令项,此时有两种选择: 一是对变量自身重新赋值(Into Same Variables.); 二是对新生成的变量进行赋值(Into Different Variables.)。 一、对变量自身重新赋值(Into Same Variables.) 步骤: 1.单击spss菜单行中的transform,进入recode对话框; 2.单击对话框中的In to Same Variables ; 3.在弹出的Recode into Same Variables对话框中,先在变量名列中选1个或多个变量点击钮使之进入Numeric Variables框;
19、4.点击Old and New Values.钮,弹出Recode into Same Variables:Old and New Value对话框,用户根据实际情况确定旧值和新值; 5.点击Continue钮返回,再点击OK钮即可。 二、对新生成的变量进行赋值(Into Different Variables.) 1.单击spss菜单行中的transform,进入recode对话框; 2.单击对话框中的In to Different Variables; 3.在弹出的Recode into Different Variables对话框中,先在变量名列中选1个或多个变量点击钮,使之进入Nume
20、ric Variable Output Variable框,同时在Output Variable框确定一赋值变量,命名后点击Change按钮; 4.点击Old and New Values.钮,弹出Recode into Different Variables : Old and New Value对话框,用户根据实际情况确定旧值和新值; 5.点击Continue钮返回,再点击OK钮即可。 在两种赋值情况下,用户均可点击If.钮指定条件来确定观察单位。 与Compute方法不同的是:Recode方法不能进行运算,只能根据指定变量值作数值转换,且这种转换是单一数值的转换。第四章:频数分布与描述统
21、计 初学者具备了前几章的预备知识并获得原始数据或可执行的*.sav目标数据之后,接下来可进行统计分析。 统计分析的第1步是采用SPSS的Frequencies过程,计算变量的频次分布。比如某次调查中,需要统计男性人数、女性人数、男女性别比例、婚姻状况、人均收入等。 本章综合运用Frequencies和Descriptives过程进行完整的描述统计。第一节:选用Frequencies过程进行频次统计 Frequencies过程既可统计频次分布,又可简单探测数据的真伪。比如,当在频率表中看出sex=3(非男非女)时,可以立即断定数据输入有误。 一、 数据准备 打开数据管理窗口,即打开需要进行统计的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 统计 软件 应用
限制150内