SPSS基础教程讲解(共29页).doc
《SPSS基础教程讲解(共29页).doc》由会员分享,可在线阅读,更多相关《SPSS基础教程讲解(共29页).doc(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上SPSS基础目录第一章 SPSS简介1.1 SPSS概述1.2 SPSS窗口1、数据编辑窗口(data editor)2、输出窗口(Viewer)3程序编辑窗口1.3 SPSS系统参数的设置1.3.1 Options选择对话框1.3.2通用参数设置1.3.3结果输出窗口参数设置1.3.4 Currency窗口参数设置第二章 数据文件的编辑与管理2.1.11变量名(Name):2.变量类型(Type) 3变量长度(Width):4变量小数点占位(Decimal):5变量标签(Lable):6变量值标签(Values):7缺失值的定义方式(Missing):8变量的显示宽
2、度(Columns):9变量显示的对齐方式(Align)10变量的度量方式(Measure): 2.1.2数据的输入2.1.3数据的保存例2.2.1读入EXCEL数据文件student.xls,并保存为同名的SPSS数据集student.sav2.3 File菜单中的其他条目2.4的编辑2.4.1单元值的查找2.4.2增加或删除一个观测2.4.3分析数据的排序2.4.4分析数据集的转置2.4.5选取数据的观测子集2.4.6分析数据归类分组汇总 2.4.7缺失值的替代 2.5数据变量的操作2.5.1增加或删除一个变量2.5.2从原有变量构造新变量2.5.3数据排秩2.5.4产生计数变量2.5.5
3、数据重新编码2.5.6产生自动分组变量2.5.7变量集的定义和使用2.6 数据文件的合并与拆分2.6.1数据文件的纵向合并2.6.2数据文件的横向合并2.6.3数据文件的拆分第一章SPSS简介1.1 SPSS概述Statistical package for Social Science,社会科学统计软件包是一个组合式软件包,它集数据整理、分析过程、结果输出等功能于一身,是世界上著名的统计分析软件之一。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“Statistical Product and Service Solutions”,意为“统
4、计产品与服务解决方案”,标志着SPSS 软件的应用领域有了重大拓展。SPSS解决方案广泛应用于市场研究、电讯、卫生保健、银行、财务金融、保险、制造业、零售等领域。SPSS的5大特色l 智能操作,易学易用l 一般情况下无须编写程序l 数据转换接口有很好的兼容性l 具有丰富的统计分析功能和完善的分析报告功能l Complex Samples模块增加了统计建模的功能SPSS公司的历史 1968年:美国斯坦福大学的三位专业背景截然不同的研究生Norman H. Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent开发了最早的统计软件系统,他们称呼这个软件系统为“社会科学统计软
5、件包”,简称“SPSS”。他们的出发点是使用统计方法来将原始数据转变为决策所必需的信息。Nie是一位社会科学家、斯坦福大学的博士生,承担了用户的角色,提出应用需求;Bent是斯坦福大学的运筹学博士生,拥有着数据分析方面的专业知识,设计出了SPSS系统文件结构;Hull刚从斯坦福大学获得MBA学位,由他来负责编程。1975年:在芝加哥成立SPSS总部 1984年:推出用于个人电脑的SPSS/PC+ 1992年:推出Windows版本,同时在纳斯达克上市,股票代码为SPSS。目前在全球100多个国家和地区有分支机构或合作伙伴,直系员工超过2000人。SPSS软件家族广泛应用于自然科学、技术科学、社
6、会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。SPSS是世界上应用最广泛的专业统计软件,全球约有25万家SPSS公司产品的用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,全球500强中有80%的公司使用SPSS,而在市场研究和市场调查领域有超过80%的市场占有率。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。 1.2 SPSS 窗口1、数据编辑窗口(data edit
7、or)基本功能 建立SPSS数据文件主要构件l 标题栏和系统状态栏l 菜单栏l 工具栏文件以.sav为扩展名2输出窗口(Viewer) 以.spo为扩展名3程序编辑窗口编辑SPSS程序,通过运行主菜单的RUN命令将编辑好的程序一次性地提交给计算机执行。也可以将编好的程序保存为一个后缀为.sps的文件供以后需要的时候调用。1.3 SPSS系统参数的设置1.3.1 Options选择对话框 Edit=Options1.3.2通用参数设置1.3.3结果输出窗口参数设置1.3.4 Currency窗口参数设置第二章 数据文件的编辑与管理2.1.1大多数情况下我们需要从头定义变量,在SPSS 10.0中
8、,定义变量的操作界面和FoxPro等数据库非常相似,只需单击左下方的Variable View标签就可以切换到变量定义界面开始定义新变量。1变量名(Name): 变量名必须以字母、汉字或开头,剩下的字符可以是字母,数字,句点,#,_,$等 变量名不能以句点结尾 名字长度不能超过8个字符 空格和特殊字符不能被用,如?,!,* 每一个变量名必须是唯一的,重复的变量名是不被允许的 变量名无大小写之分 下列关键词不能用作变量名 all NE EQ TO le lt by or gt and not ge with 举例: location loc#5 x.1 over$5002.变量类型(Type):
9、 变量类型可由变量类型对话框确定在SPSS数据集中,变量分为8种类型,主要有字符型变量(String)和数值型变量(numeric)。Numeric 数值型Comma 加有逗号的数值型Dot 加有圆点的数值型Scientific notation 科学计数型Date 日期型Dollar 货币型Custom currency 用户自定义型String 字符型3变量长度(Width):4变量小数点占位(Decimal):5变量标签(Lable):6变量值标签(Values):变量值标签则在它右侧的Value框定义。以性别为例,单击Value框右半部的省略号,会弹出变量值标签对话框如下:上部的两个文
10、本框分别为变量值输入框和变量值标签输入框,分别在其中输入“f”和“女生”,此时下方的Add钮变黑,单击它,该变量值标签就会被加入下方的标签框内。与此类似定义变量值“m”为“男生”,最后按OK,变量值标签就设置完成。切换回Data View界面,然后选择菜单View=Value Labels.7缺失值的定义方式(Missing):定义缺失值的作用:凡是在定义的缺失值范围内的数据不参与统计分析。SPSS有两类缺失值:系统缺失值和用户缺失值。数据长方形中任何空的数字单元都被认为是系统缺失值,用点“”表示。由特殊原因造成的信息缺失值被认为是用户缺失值,例如调查问卷中,被调查者不愿意回答的项目可定义为用
11、户缺失值。单击missing框下相应变量右侧的省略号,会弹出缺失值对话框如下:no missing values:无缺失值,系统默认选项;discrete missing values:定义离散缺失值,选择该选项后,激活下面3个输入框,可以在其中指定3个数值作为缺失值,也可以少于3个。例如对于性别变量,值2,3,4都被认为是非法的,在输入数据过程中有可能输入了这几个数,则可以把这3个值分别输入到3个矩形框中;range puls one optional discrete miss:定义一个缺失值的范围,选择该选项后,激活下面3个输入框。在low和hight输入框中分别输入缺失值的下限和上限。
12、可以在最下方的discrete框中输入范围之外的一个离散值。8变量的显示宽度(Columns):9变量显示的对齐方式(Align)选择变量值显示时的对齐方式,系统默认是右对齐。备选方式: l Left 左对齐l Right 右对齐l Center 居中对齐10变量的度量方式(Measure): 为了区分变量在分析中的不同作用,又按变量的度量方式分为三类:选择变量的度量方式,系统默认是定距变量。备选方式: l Scale 定距变量 必须是数值型变量,可以对其观测值进行四则运算。l Ordinal 顺序变量,可以是数值型的,也可以是字符型的,可以对其观测值进行排序。l Nominal 名义变量 可
13、以是数值型的,也可以是字符型的,常起分类作用。使用该窗口,我们可以一次定义许多新变量,不会象老版本那样一个一个的定义了。2.1.2 数据的输入2.1.3 数据的保存在对数据做了修改后,保存数据文件是必不可少的工作之一。选择菜单File=Save,如果数据文件曾经存储过,则系统会自动按原文件名保存数据;否则,就会弹出和选择Save as 菜单时相同的Save as对话框。里面可以保存的数据类型和可以打开的几乎一样多,选择合适的类型,确定就是了。2.2 SPSS可以直接读入许多格式的数据文件,选择菜单File=Open=Data或直接单击快捷工具栏上的“”按钮,系统就会弹出Open File对话框
14、,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式,分别是:SPSS(*.sav)SPSS数据文件(6.010.0版)SPSS/PC+(*.sys)SPSS 4.0版数据文件Systat(*.syd)*.syd格式的Systat数据文件Systat(*.sys)*.sys格式的Systat数据文件SPSS portable(*.por)SPSS便携格式的数据文件EXCEL(*.xls)EXCEL数据文件(从5.0版2000版)Lotus(*.w*)Lotus数据文件SYLK(*.slk)SYLK数据文件dBase(*.dbf)dBase系列数据文件,(从dBase IIIV)Text
15、(*.txt)纯文本格式的数据文件data(*.dat)纯文本格式的数据文件选择所需的文件类型,然后选中需要打开的文件,SPSS就会按你的要求打开你要使用的数据文件,并自动转换为数据SPSS格式。例2.2.1读入EXCEL数据文件student.xls,并保存为同名的SPSS数据集student.sav2.3File菜单中的其他条目【Disp Data Info】该菜单项用于显示数据的基本信息,选择它后会弹出非常类似于打开文件的一个对话框用于选择数据文件,选择好后按OK,系统就会在结果窗口中列出所选数据的基本情况,如建立时间、标签设置、记录数、变量设置等。【Apply Data Diction
16、ary】即使用数据字典,该功能使你可以直接在新数据集中套用以前定义好的变量设置(格式、标签等,但不包括数据类型),例:打开Li1_1.sav文件,将变量x的长度从8改为4,标签删掉,然后选择菜单File=Apply Data Dictionary,在文件对话框中选择Li1_1.sav并按OK(即将Li1_1.sav的变量设置按相同变量名一一套用在现在的数据集上)。【Cache Data】建立数据缓冲区。以前SPSS每执行一条命令都会重新读取所需的数据,如果是从远程用SQL调用数据库,这会非常的费时。现在使用Cache Data,可以将数据全部读入暂存盘,建立活动数据的缓冲区。大大加快处理速度。
17、如果是处理本机数据的话,该命令对速度的提升不是非常明显。【Print和Print Preview】这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来,其中Print Preview是新增加的,使用上和WPS2000的打印预览非常相似(其实用的是同样的程序),不过和SPSS结果的打印程序一样,用SPSS直接打印数据非常的浪费纸张。【Stop Processor】用于停止执行当前的SPSS命令。由于SPSS处理速度非常的慢,如果你正在对一个大型的数据执行统计命令,等了半天都没有结束,可是你的结果还没有存,执行命令时又存不了,怎么办呢?试试这个命令吧。但并非所有的命令都可以喊停的,许多数据库
18、操作命令(计算变量,合并等)好象就停不了。2.4的编辑在SPSS中,数据文件的编辑、整理等功能被集中在了Edit,Data和Transform三个菜单项中。Data:Insert Variable:在选中的单元格之前的一列插入一个新变量。Insert Cases: 在选中的单元格之前的一行插入一个新观测。Goto Case:定位到指定的观测值Sort Case:按某变量的取值对观测值进行排序。Transpose:对数据文件进行转置。Merge Files:合并数据文件。Aggregate: 对数据进行分类和不分类的汇总。Orthogonal Design:正交设计。Split File:按照某
19、个分组变量对数据文件进行拆分。Select Cases:选择观测值。Weight Cases:对观测值加权。下面我们将根据其功能来分别讲述。2.4.1观测与变量的查找 编辑(Edit)转至个案(Go to Case) 打开 转至(G)(Go to Case)对话框 2.4.2增加或删除一个观测l 增加一个新的行激活需要添加行的下一行的任意单元,选择EditInsert Casel 删除一个行 单击要删除行的行头,将该行全部选中,按Delete键2.4.3分析数据的排序观测数据的排序,特别是逐级排序,可以从统计角度了解整体数据的取值情况。 例 将数据集补钙产品.sav按“性别”降序,再按“问卷编
20、号”升序排序操作: 选择菜单 数据(Data)=排序个案(Sort Cases),系统弹出排序个案(Sort Cases)对话框 下方的排列顺序(Sort Order)单选钮,有升序和降序两种选择。请注意,该单选钮是和上方的Sort By框一起使用的,具体方法如下:确认降序单选钮被选择,将“性别”选入Sort By框;选择升序单选钮,将“问卷编号”选入Sort By框。2.4.4分析数据集的转置 将观测(行)和变量(列)位置互换,特别适用于实现存/取Excel文件进行数据共享功能前/后的预操作。 例 将数据集“补钙产品.sav”中的变量“性别”,“年龄”和“居住时间”进行转置操作选择菜单 数据
21、(Data)=Transpose,打开 Transpose对话框;将需要转置的变量移入Variable列表框;如果在数据文件中有一个变量是代表转置后各变量的变量名,则将该变量移入Name Variable列表框中;否则转置后数据集的变量将被分别命名为“Var001”, “Var002”“Var003”;单击OK2.4.5选取观测的子集 在统计分析时,有时并不需要对所有的观测进行分析,只需要对某些观测进行分析,例如在补钙产品的市场调查中,我们只对女性被调查者的情况感兴趣,或者只有在本市居住时间超过3年的被调查者才具有统计分析价值。另一种情况是在全部样品中抽取一小部分样品进行分析,SPSS的Sel
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 基础教程 讲解 29
限制150内