spss统计软件应用-(更新)课件.pptx
《spss统计软件应用-(更新)课件.pptx》由会员分享,可在线阅读,更多相关《spss统计软件应用-(更新)课件.pptx(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计软件件SPSS应用用绪论数据管理统计描述T检验、方差分析卡方检验、秩和检验绪论l1.1 统计软件简介l1.2 SPSS使用基础l1.3 SPSS窗口简介l1.4 SPSS的帮助系统l1.5 利用SPSS进行数据分析的步骤统计软件简介统计软件的作用l帮助人们整理大量的数据l协助人们迅速地对大量数据进行统计分析l把分析结果以便于理解的方式展现出来统计软件的注意事项l统计学是一个工具,统计分析软件则是工具的工具!因此关键在于你如何使用这个工具去解决所面临的问题如何使用这个工具去解决所面临的问题,而不要指望软件会“自动”地解决。l统计模型的严格数学表达比较复杂繁琐,但其背后的统计思想往往相当简单,
2、作为统计方法的使用者,重要的是掌握统计方法解掌握统计方法解决问题的思想、步骤和结果的解读决问题的思想、步骤和结果的解读,至于那些研究方法本身的事情,交给统计学家去做吧!l统计方法未必越未必越“高深高深”越好越好,当你不能确定使用哪种统计方法的时候往往选择最简单的那个就可以解决问题。l没有没有哪个模型是绝对正确的哪个模型是绝对正确的,但有些模型是有用的l注意统计学方法的适用条件统计学方法的适用条件,滥用统计学会造成十分严重的负效果。统计软件简介统计软件的种类lSPSS Statistical Package for the Social Science (社会科学统计软件包)Statistica
3、l Product and Service Solutions (统计产品与服务解决方案)lSAS Statistical Analysis SystemlStata “statistics”和“data”合成的一个新词lR Ross Ihaka和Robert Gentleman 开发统计软件简介SASl美国北卡罗来纳州立大学1966年开发,经过多年的完善和发展,已发展成为一套大型集成应用软件系统,在国际上被誉为统计分析的标准软件l是一个组合软件系统,由多个功能模块组成,其基本部分是BASE SAS模块,可以增加不同模块而增加不同的功能。l具有完备的数据存取、数据管理、数据分析和数据展现功能。
4、尤其是统计分析系统部分,由于其强大的数据分析能力,已成为专业研究人员进行统计分析的标准软件。l然而,其操作至今仍以编程为主,人机对话界面不太友好,系统地学习和掌握,需要花费一定的时间和经历,更适合统计专业人员使用。统计软件简介Stata l由美国计算机资源中心研制l统计功能强大,除传统的统计分析方法外,还收集了近20年发展起来的新方法。l具有自己的编程语言,在使用上比SAS简单。l占用很少的磁盘空间,输出结果简洁,受到初学者和高级用户的普遍欢迎。Rl是自由、免费、开放源代码的软件,用于统计计算、数据分析和统计制图的软件系统。l它提供了大量的集成的统计工具包(R package),各种数学计算和
5、统计计算的函数,用户可以灵活的通过编写程序调用函数进行数据分析。l使用者可以自由编制新的统计计算方法并生成R package,因此,该软件更多的应用于科研课题中新算法的开发,非常适合具有计算机编程基础的统计专业人员使用。统计软件简介SPSSl20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSSl界面友好:windows风格的操作界面极为友好,输出结果美观漂亮。l操作简单:基本操作可通过点击鼠标来完成,有一定统计基础且熟悉windows一般操作的基本上都可以自学使用。l数据管理功能强大:集成了数据录入、转换、检索、统计分析、作图、制表及编辑等功能。l统计方法全面:提
6、供了从简单的描述统计到复杂的多元统计方法。l功能模块组合灵活:由17个功能模块组成,可根据分析工作需要和计算机设备的配置情况选择和装配。l方便的数据接口:能够读取及输出多种格式的文件。SPSS使用基础SPSS的运行环境:l硬件环境:SPSS要求的硬件环境取决于选择哪些分析模块及所选用的版本号。SPSS16.0对计算机硬件的基本要求如下:Intel Pentium系列或同等性能处理器至少512M内存至少450M硬盘空间VGA显示器或者更高配置CD-ROM光盘驱动器。用于光盘安装SPSS网络适配卡。用于访问SPSS公司的网站l软件环境:Windows XP(32位)或Vista(32位和64位)等
7、。SPSS使用基础SPSS的安装l需要接受软件使用协议(License Agreement)l系统默认的安装路径是C:Program FilesSPSS,如用户需改变安装路径,可以单击Browse按钮来自定义安装位置l在安装过程中会询问许可证的不同类型,即用户的不同种类,如果是单机用户选择选项“Single user license”l用户需填写用户名(username)、单位名称(organization)l安装过程需填写序列号SPSS使用基础SPSS的启动与退出lSPSS的启动:通过双击SPSS桌面快捷方式图标启动SPSS通过“开始”菜单的“程序”运行方式启动SPSSlSPSS的退出:单击
8、主菜单的“File”,在下拉菜单中单击“Exit”,可退出SPSS单击主菜单右上角控制框中的关闭按钮 ,可退出SPSSSPSS窗口简介数据编辑窗口启动SPSS后,出现如图所示的空白数据编辑窗口,是一个类似于MS Excel界面的空文件。SPSS窗口简介结果输出窗口SPSS结果输出窗口名为Viewer,它是显示和管理SPSS统计分析结果、报表及图形的窗口。用户可以将此窗口中的内容以结果文件*.spv的形式保存。SPSS的帮助系统Topics:按专题组织的帮助Tutorail:指南Case Studies:实例学习Statistics Coach:统计教练Command Syntax Refere
9、nce:命令语句参考Algorithms:算法 利用SPSS进行数据分析的步骤统计学中数据分析的一般步骤l明确数据分析目标l正确收集数据l数据的加工整理l明确统计方法的含义和适用范围l正确解释分析结果利用SPSS进行数据分析的一般步骤lSPSS数据的准备阶段(定义数据结构,录入和修改数据)lSPSS数据的加工整理阶段(数据的预处理)lSPSS数据的分析阶段(选择正确的统计分析方法对数据进行分析和建模)lSPSS分析结果的阅读和解释(对分析结果结合背景知识作出合理解释)数据管理l新建数据文件l调用已建立的数据文件l数据存储l数据文件的管理数据管理新建数据文件例1-1:从某调研的体检数据中随机抽取
10、了10份,试建立spss数据文件“例1-1.sav”,以方便以后进行统计学处理、分析。编号性别年龄(岁)身高(m)1男651.682男351.863男361.664男501.585男191.696女411.657女411.648女621.529女381.5610女271.58新建数据文件第一步:定义变量l进入变量视图:启动SPSS,进入数据编辑窗口,单击左下方的“Variable View”标签或双击列的题头(Var),进入如图所示的变量定义视图窗口,在此窗口中即可定义变量。新建数据文件第一步:定义变量l定义变量名:在框中输入要定义的变量名称。若不定义,系统将一次默认为Var00001、Var
11、00002等。为变量命名应采用以下原则:变量名最长不能超过64个字节(即4个汉字)。首字母必须是字母、汉字,不能用下划线“_”、或点“.”作为变量名的最后一个字符变量名中不能有空格或者某些特殊符号,如“?”、“、”“!”和“*”等。变量名不能用“ALL、AND、OR、BY、NOT”等SPSS关键字。变量名中英文字母的大小写不作区分,如ABC和abc、Abc被认为是同一个变量。新建数据文件在本例中,涉及编号、性别、年龄、身高四个项目,为每一个项目确立一个变量名,并按顺序输入在“Name”列中,如图所示新建数据文件第一步:定义变量l变量类型与数据长度:将光标移至某个变量的“Type”单元格右方,右
12、键点击图标,弹出定义变量类型的窗口。本例中所有变量均采取默认的数值型。Numeric Numeric :标准数值型:标准数值型 Comma Comma:加逗号的数值型:加逗号的数值型 Dot Dot:圆点数值型:圆点数值型 Scientific notation Scientific notation:科学计数法:科学计数法 Date Date:日期时间型:日期时间型 Dollar Dollar:货币型:货币型 Custom currency Custom currency:自定义型:自定义型 String String:字符型:字符型新建数据文件第一步:定义变量l变量标签(Label)和变量
13、值标签(Values):变量标签:是对变量名的进一步说明,可以是中文或英文。变量的含义较为复杂时,使用变量标签会方便很多。变量值标签:是对变量的可能取值所附加的一种说明。对分类变量往往要定义变量值标签。新建数据文件第一步:定义变量l缺失值(Missing):单击Missing相应单元中的按钮,弹出如图所示的对话框。(本例中不需要定义缺失值,故可不操作此部分内容)无缺失值No Missing ValueNo Missing Value:无缺失值:无缺失值Discrete missing valuesDiscrete missing values:可以定义3个单独的缺失值。Range plus o
14、ne Range plus one:可以定义一个缺失值范围和一个单独的缺失值。新建数据文件第二步:数据录入l点击“Data View”进入数据编辑窗口。表格的顶部标有已定义的变量名,表格的左侧有观测对象的序号,一个变量名和一个序号就对应了二维表中的一个单元格。调用已建立的数据文件直接打开数据文件(1)FileOpenData,弹出数据文件对话框(2)在Look in(查找范围)下拉列表中选择文件所在路径(3)在Files of type(文件类型)下拉列表选择相应的文件类型,默认为SPSS数据文件,即(*.sav)(4)在文件框内用光标点击所选文件,则选中的文件名会出现在File name(文
15、件名)后的文本框中(5)单击open(打开按钮),选定的文件就被读入。调用已建立的数据文件读入Excel数据(1)FileOpenData,弹出数据文件对话框(2)在Look in(查找范围)下拉列表中选择文件所在路径(3)在Files of type(文件类型)下拉列表选择ExcelExcel文件类型(4)在文件框内用光标点击所选文件,则选中的文件名会出现在File name(文件名)后的文本框中(5)单击open(打开按钮),选定的文件就被读入。数据文件的存储SPSS提供两种数据保存方式,一是保存为spss数据文件,一是保存为其他格式的数据文件,如Excel(*.xls),ASCII(*.
16、txt)等数据文件。l菜单FileSave/Save as练习1.将例1-1的数据资料建立一个数据文件,保存文件名为“例1-1.sav”2.调用Excel文件“例1-2.xls”,并另存为“例1-2.sav”文件。3.调用文本文件“例1-3.txt”数据管理有时为了统计分析的需要,要对原来的数据文件进行编辑加工。SPSS的数据管理功能强大且操作直观l数据的拆分l变量的增加和删减l观察值的增加和修改l对数据进行转换或重新编码l数据的排序数据管理DataDefine Variable Properties定义变量特征Copy Data Properties复制数据特征New Custom Attr
17、ibute新的自定义特征Define Dates定义时间,主要用于时间序列Define Multiple Response Sets定义多选回答变量集Validation确定有效个案Identify Duplicate Cases确定重复个案Identify Unusual Cases确定异常个案Sort Cases对所选变量的观测值排序Transpose将原始数据的行和列互换Restructure改变数据文件的结构Merge Files合并数据文件Aggregate分类汇总Orthogonal Design生成正交设计表格Copy Dataset复制数据文件Split File拆分文件Sel
18、ect Cases选择个案Weigh Cases个案加权数据整理观测值排序(Sort cases)例:将例1-1数据先按年龄升序,然后在年龄相同时,再按身高从高到低降序。SPSS操作步骤:(1)DataSort Cases,系统弹出如右对话框,右下方“Sort Order”中“Ascending”表示按所选变量升序排序,“Descending”表示按所选变量降序排序;(2)先选中“年龄”,再选择“Ascending”,将“年龄”选入“Sort by”框中;(3)选中“身高”,再选择“Descending”,将“身高”选入“Sort by”框中,单击OK。数据整理行列转置(Transpose)S
19、PSS操作步骤:(1)DataTranspose,系统弹出如右对话框(2)所有变量都选入Variable框中(3)右下方Name Variable框,用于指定转置后数据的新变量名。如果该变量为字符型,则新变量名为原字符;如果该变量为数值型,新的变量名可以缺失,系统会自动会新数据产生新变量名“var001”、“var002”;此外系统还自动生成一个变量名为CASE_LBL的新字符变量,用于自动保存原变量名(4)单击OK数据整理拆分文件(Split File)用于将某些分类变量进行分层分析例:对“例1-1.sav”的男性、女性分别进行分析SPSS操作步骤:(1)Data Split File,系统
20、弹出如右对话框(2)选择需要选择相应选项Analyze all case:分析所有个案,取消拆分命令Compare groups:按所选变量拆分文件,各组分析结果放在一起便于比较Organize output by groups:按所选变量拆分文件,各组分析结果单独放置Sort the file by:要求拆分时将数据按所用的拆分变量排序File is already sorted:如果数据文件很大,而且已按分层变量将观察单位排过序了,可选此项以节省运行时间。(3)从变量表中,选择变量“性别”调入“Group Based on”下的矩形框,单击OK注:Split File 命令执行后,数据文件
21、不会看到任何变化,只有进一步执行了其他分析命令后才会按分组进行统计数据整理合并文件(Merge Files)增加观测对象(Add Cases):从外部数据文件中增加观测对象到当前数据文件中,称为纵向合并。这种合并要求相互合并的数据文件中应该有相同的变量。例:将“例1-1-2.sav”中的记录添加到“例1-1.sav”中SPSS操作步骤:(1)首先打开文件“例1-1.sav”,然后Data Merge FilesAdd Cases,系统弹出打开数据文件对话框,选中需要添加的数据文件“例1-1-2.sav”,并按Continue,系统弹出Add Cases对话框,如右(2)单击OK数据整理合并文件
22、(Merge Files)增加变量(Add Variables):从外部数据文件中增加变量到当前数据文件中,称为横向合并。这种合并要求较高,默认是按照相同记录号进行合并,如果使用进行一一对应的一个关键变量进行匹配合并,则应对数据文件按照关键变量作升序排序,若无法一一对应,则无法横向匹配。例:将“例1-1.sav”文件与“例1-1-3.sav”文件横向合并SPSS操作步骤:(1)首先打开文件“例1-1.sav”,然后Data Merge FilesAdd Variables,系统弹出打开数据文件对话框,选中需要合并的数据文件“例1-1-3.sav”,并按Continue,系统弹出Add Vari
23、ables对话框,如右(2)选中“Match cases on key variable”复选框,选择一个默认状态。(3)将“编号”调入右下角“Key Variable”对话框,单击OK。数据管理TransformCompute Variable计算新变量Count Values within Cases个案内数值计数Recode into Same Variables重编码为同一变量Recode into Different Variables重编码为新变量Automatic Recode自动重编码Visual Binning直观分段Optimal Binning最优分段Rank Cases
24、排秩Date and Time Wizard日期与时间Create Time Series创建时间序列Replace Missing Values重置缺失值Random Number Generators随机数种子设置Run Pending Transforms根据转换结果运行数据整理计算新变量(Compute)例:在“例1-1-4.sav”建立新变量BMI,计算公式为BMI=体重/身高2SPSS操作步骤:(1)首先打开文件“例1-1-4.sav”,然后Data TransformCompute,弹出如右对话框。(2)在左上角Target Variable下的矩形框中输入 bmi(3)将左下方
25、候选变量列表中的体重和身高变量按照公式“体重/身高*2”直接引入右上方的“Numeric Expression”下的矩形框中(4)单击OK数据整理重新赋值(Recode)有两种情况:可以是新赋值代替原观测值,不更改变量名,也可以是根据原变量建立新的分类,后者较多见。例:将刚才数据文件中根据bmi指数建立变量名为“bmigrp”的新变量,分组原则为:18.51,18.5-242,243.SPSS操作步骤:(1)TransformRecode into different variables,弹出如右对话框。(2)将bmi选入“Numeric Variable”下的矩形框,此时右上方的Output
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 统计 软件 应用 更新 课件
限制150内