spss操作实验手册.pdf
S PS S 操 作 实 验 手 册 2 0 1 5 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 SPSS 实验操作指导手册(2015 版)2.SPSS 数据整理 2.1 SPSS 数据文件的建立 SPSS 数据文件的建立可以利用【File(文件)】菜单中的命令来实现。具体来说,SPSS 提供了四种创建数据文件的方法:新建数据文件【File(文件)】【New(新建)】【Data(数据)】命令;直接打开已有数据文件【File(文件)】【Open(打开)】【Data(数据)】命令;使用数据库查询;【File(文件)】【Open Database(打开数据库)】【New Query(新建查询)】命令,弹出【Database Wizard(数据库向导)】对话框 从文本向导导入数据文件。【File(文件)】【Read Text Data(打开文本 数据)】命令,弹出【Open Data(打开数据)】对话框 实例分析:股票指数的导入 文件 2-1.xls是上证指数从 2007 年 1 月 4 日至 2008 年 10 月 16 日的数据资料,包括了开盘价、当日最高价、当日最低价和收盘价等选项,请将该数据导入至 SPSS 中。2.2 SPSS 数据文件的属性 一个完整的 SPSS 文件结构包括变量名称、变量类型、变量名标签、变量值标签等内容。注意:SPSS 数据文件中的一列数据称为一个变量,每个变量都应有一个变量名。SPSS 数据文件中的一行数据称为一条个案或观测量(Case)2.2.1 实例分析:员工满意度调查表的数据属性设计 1.实例内容 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 为了提高员工的工作积极性,完善公司各方面管理制度,并达到有的放矢的目的,某公司决 定对本公司员工进行不记名调查,希望了解员工对公司的满意情况。请根据该公司设计的员 工满意度调查题目(行政人事管理部分)的特点,设计该调查表数据在 SPSS 的数据属性。2.实例操作 具体步骤如下文件(2-2.sav.)Step01:打开 SPSS 中的 Data View 窗口,录入或导入原始调查数据。Step02:选择菜单栏中的【File(文件)】【Save(保存)】命令,保存数据文件,以免丢失。Step03:单击 SPSS 中的【Variable View(变量视图)】选项卡,按窗口提示进行数据属性的定义,如变量名称、标签、标签值等。2.3 SPSS 数据文件的整理【Data(数据)】菜单中的命令主要用于实现数据文件的整理功能。2.3.1 观测量排序:地区生产总值分析 1.操作详解 Step01:打开观测量排序对话框【File(文件)】【Data(数据)】【Sort Cases(排序个案)】命令 Step02:选择排序变量 Step03:选择排序类型 Step04:单击【OK】按钮,此时操作结束。2.实例内容:地区生产总值分析 数据 2-3.sav列出了 2005 年我国部分省份的地区生产总值及第一产业、第二产业和第三产业的生产总值,请根据这些数据分析不同省份经济发展状况的差异性。2.3.2 数据的转置:国家财政分项目收入 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 1.操作详解 Step01:打开转置对话框【File(文件)】Data(数据)】【Transpose(转置)】命令 Step02:选择转置变量 Step03:新变量命名 Step04:单击【OK】按钮,操作结束。注意:数据文件转置后,数据属性的定义都会丢失,因此用户要慎重选择本功能。2.实例内容:国家财政分项目收入数据(2-4.sav)2.3.3 文件合并:固定资产投资【data(数据)】【Merge Files(合并文件)】菜单中有两个命令选项:【Add Cases(添加个案)】和【Add Variables(添加变量)】。1.观测量合并的 SPSS 操作详解 Step01:打开观测量合并对话框【File(文件)】【Data(数据)】【Merge Files(合并文件)】【Add Cases(添加个案)】命令 Step02:选择合并文件 点选【An external SPSS Statistics data file(外部 SPSS Statistics 数据文件)】单选钮,同时单击【Browse】按钮,选中需要合并的文件,并指定文件路径,然后单击【Continue】按钮。Step03:选择合并方法。Step04:单击【OK】按钮,操作结束。2.变量合并的 SPSS 操作详解 Step01:打开变量合并对话框。Step02:选择合并文件。精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 Step03:选择合并方法。Step04:单击【OK】按钮,操作结束。3.实例内容:固定资产投资文件的合并 已知 2-5-1.sav、2-5-2.sav 和 2-5-3.sav 中的数据是北京、天津、河北等省市在 2005 年部分行业的固定投资额(亿元)数据,请完成以下问题。问题一:将 2-5-1.sav 和 2-5-2.sav 的数据文件纵向合并(观测量合并)。问题二:将 2-5-1.sav 和 2-5-3.sav 的数据文件横向合并(变量合并)。2.3.4 数据分类汇总:城乡居民储蓄存款 对数据进行分类汇总就是按指定的分类变量值对所有的观测量进行分组,对每组观测量的变量求描述统计量,并生成分组数据文件。例如,将一个工厂的数据资料,按照该工厂的各个部门进行分组,并统计各个部门的人员年龄均值、方差等,这些工作就属于数据分类汇总的范畴。1.数据分类汇总的 SPSS 操作详解 Step01:打开数据汇总对话框【File(文件)】【Data(数据)】【Aggregate(分类汇总)】命令 Step02:选择分类变量;Step03:选择汇总变量 Step04:选择汇总函数;Step05:添加变量标签 Step06:选择汇总结果保存方式 Step07:大规模数据的排序选择 Step08:完成上述操作后,单击【OK】按钮,操作结束 2.实例内容:城乡居民人民币储蓄存款 我国部分省份 2004 年度城乡居民的人民币储蓄存款金额(年底余额,单位:亿元)精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 2.3.5 数据文件的拆分 Split 1.数据分类汇总的 SPSS 操作详解 Step01:打开数据拆分对话框【File(文件)】【Data(数据)】【Split File(拆分文件)】命令 Step02:选择数据拆分方式。Step03:选择拆分变量。Step04:单击【OK】按钮,操作结束。2.实例内容:分行业职工平均工资 2005 年我国部分按细行业划分的职工平均工资,请根据不同的行业类型,对原始数据进行拆分,数据详见 2-7.sav。2.3.6 选择数据:城市设施水平 1.操作详解 Step01:打开数据选择对话框【File(文件)】【Data(数据)】【Select Cases(选择个案)】命令 Step02:选择数据选择方式 单击【If】按钮单击【Sample】按钮单击【Range】按钮 Step03:选择输出方式 Step04:单击【OK】按钮,操作结束 2.实例内容:城市设施水平 数据文件 2-8.sav中是 2006 年我国部分地区城市设施水平指标,包括城市用水普及率、城市燃气普及率等。请根据这些原始数据,按照以下条件选择数据。条件一:选择城市用水普及率和城市燃气普及率都大于 90%的地区。精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 条件二:随机选取 10 个地区。条件二属于随机选择的问题,因此需要点选【Random samples of cases(随机个案样本)】单选 钮,同时在弹出的【Select Cases:Random Sample(选择个案:随机样本)】对话框的“Exactly cases form the fiirst cases”文本框中分别输入 10 和 31,表示从 31 个观测量中选择 10 个观测量。最后,单击【Continue】按钮返回主对话框,随机选取的样本结果如下页所示。2.3.7 数据加权:蔬菜的平均价格 权重是数据分析中的一个重要概念,它是一个相对的概念。权重的大小描述了该指标在整体评价中的相对重要程度。在数据处理中,常需要对数据进行加权处理。1.数据加权的 SPSS 操作详解 Step01:打开数据加权对话框【File(文件)】【Data(数据)】【Weight cases(加权个案)】命令 2.实例内容:蔬菜的平均价格 某经销商希望掌握菜市场的蔬菜销销售的平均价格,收集数据见数据文件 2-9.sav。现请利用这些数据,求出这些蔬菜的平均价格。Step1:以蔬菜的销售量 为权重计算各种蔬菜销售的平均价格更为合适。选择“销售量”变量作为权重变量,将其放入【Frequencies Variable(频率变量)】列表框中 Step02:选择变量是否加权,用户首先选择是否对观测量进行加权。Step03:单击【OK】按钮,操作结束。2.4 SPSS 数据的计算和变换 2.4.1 变量计算:国内生产总值的产业构成 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 1.SPSS 操作详解【File(文件)】【Transform 转换】【Compute(计算)】命令 Step02:定义新变量及其类型 在【Target Variable(目标变量)】文本框中用户需要定义目标函数名,它可以是一个新变量名,也可以是已经定义的变量名。Step03:输入计算表达式 Step04:条件样本选择 2.实例内容:国内生产总值的产业构成 数据文件 2-10.sav为我国 1978-2005年国内生产总值、第一产业国内生产总值、第二产业国内生产总值和第三产业国内生产总值,请分析不同产业所占国内生产总值的变动情况。Step01:打开对话框 Step02:定义第一产业比重变量 Step03:计算第一产业生产总值所占比重 Step04:完成操作 2.4.2 变量重新赋值:空气质量等级划分 SPSS 的【Transform(转换)】菜单中有【Recode into Same Variable(重新编码为相同变量)】和【Recode into Different Variable(重新编码为不同变量)】两个命令可以实现重新赋值功能。1.SPSS 操作详解 Step01:打开重新赋值对话框【File(文件)】【Transform(转换)】【Recode into Different Variable】Step02:选择重新赋值变量和输出变量 Step03:设置重新赋值规则 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 Step04:选择样本赋值 Step05:最后单击【OK】按钮,此时操作结束 2.实例内容:空气质量等级的划分 我国部分城市 2005 年空气质量的指标数据(见数据文件 2-11.sav),请利用这个规则对不同城市的空气质量等级进行划分。2.4.3 变量值计数:消费价格指数的上涨项目 1.SPSS 操作详解 Step01:打开重新赋值对话框【File(文件)】【Transform(转换)】【Count Values within Cases(对个案内的值计数)】命令 Step02:输入目标计数变量 Step03:选择计数变量 Step04:设置计数规则 Step05:选择样本计数 Step06:最后单击【OK】按钮,此时操作结束 2.实例内容:消费价格指数的上涨项目 我国城市和农村居民消费价格分类指数数据见数据文件 2-12.sav。由于不同产品的价格涨跌不同,请找出城市和农村居民消费价格指数都较去年上涨超过 1%的项目。3.SPSS 描述性统计分析【Descriptive Statistics】菜单中。最常用的是列在最前面的四个过程。Frequencies:产生频数表。精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 Descriptives:进行基本的统计描述分析。Explore:探索性分析。Crosstabs:列联表分析。3.1 SPSS 在频数分析中的应用 3.1.2 频数分析的 SPSS 操作详解 Step01:打开主窗口 选择菜单栏中的【Analyze(分析)】【Descriptive Statistics(描述性统计)】【Frequencies(频率)】命令 Step02:选择分析变量 Step03:输出频数分析表 勾选【Display frequency tables(显示频率表格)】复选框 Step04:其他基本统计分析 还可以单击【Statistics(统计量)】和【Charts(图表)】等按钮 Step05:输出格式选择 单击【Format】按钮 Step06:完成操作 单击【OK】按钮,结束操作,SPSS 软件自动输出结果。3.1.3 实例图文分析:产品的销售量(见数据文件 3-1.sav)假设某公司每周大约卖出 2000 万件产品,但市场的需求不稳定,该公司的生产经理想更好的掌握近期该产品的分布情况。假设下面给出的销售数字(单位:百万)代表近期公司该产品每周的销售数据。利用频数分析你能得到什么有助于生产及销售的信息?24 18 18 26 24 23 16 18 21 20 21 24 19 19 14 22 21 26 27 15 19 17 20 20 19 22 23 16 23 21 15 19 21 20 22 15 24 19 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 3.2 SPSS 在描述统计分析中的应用 3.2.2 描述统计分析的 SPSS 操作详解 Step01:打开主窗口【Analyze(分析)】【Descriptive Statistics(描述性统计)】【Descriptives(描述)】命令 Step02:选择分析变量 Step03:计算基本描述性统计量 Step04:保存标准化变量 勾选【Save standardized values as variables(保存标准化变量值)】复选框 Step05:完成操作 单击【OK】按钮,结束操作,SPSS 软件自动输出结果。3.2.3 实例图文分析:奥斯卡获奖者的年龄(见数据文件 3-2.sav)请你分析不同性别演员获得奥斯卡奖的年龄差异性。男演员:32 37 36 32 51 53 33 61 35 45 55 39 76 37 42 40 32 60 38 56 48 48 40 43 62 43 42 44 41 56 39 46 31 47 45 60 女演员:50 44 35 80 26 28 41 21 61 38 49 33 74 30 33 41 31 35 41 42 37 26 34 34 35 26 61 60 34 24 30 37 31 27 39 34 3.3 SPSS 在探索性分析中的应用 1.使用目的:探索性数据分析(Exploratary Data Analysis,简称 EDA)的基本思想是从数据本身出发,不拘泥于模型的假设而采用非常灵活的方法来探讨数据分布的大致情况,也可以为进一步结合模型的研究提供线索,为传统的统计推断提供良好的基础和减少盲目性。2.主要内容:检查数据是否有错、获得数据分布特征、对数据的初步观察,发现一些内在规律。精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 3.3.2 探索性分析的 SPSS 操作详解 SPSS 中的 Explore 过程用于计算指定变量的探索性统计量和有关的图形。它既可以对观测量整体分析,也可以进行分组分析。从这个过程可以获得箱线图、茎叶图、直方图、各种正态检验图、频数表、方差齐性检验等结果,以及对非正态或正态非齐性数据进行变换,并表明和检验连续变量的数值分布情况。Step01 打开主窗口【Analyze(分析)】【Descriptive Statistics(描述性统计)】【Explore(探索)】命令 Step02 选择分析变量 Step03 选取分组变量 Step04 选择标签值 Step05 选择输出类型 Step06 描述性统计量结果输出 Step07 统计图形结果输出 Step08 选择缺失值的处理方式 Step09 操作完成 3.3.3 实例图文分析:中国南北城市的温度差异 Step01:打开对话框 打开数据文件 3-3.sav,其中增加变量“地域”表示所在城市的区域位置,“1”表示南方城市,“2”表示北方城市。选择菜单栏中的【Analyze(分析)】【Descriptive Statistics(描述性统计)】【Explore(探索)】命令,弹出【Explore(探索)】对话框。3.4 SPSS在列联表分析中的应用 3.4.2 列联表分析的 SPSS 操作详解 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 Step01 打开主窗口 选择菜单栏中的【Analyze(分析)】【Descriptive Statistics(描述性统计)】【Crosstabs(列联表)】命令 Step02 选择行、列变量 Step03 选择层变量 Step04 列联表输出格式的选择 Step05 行、列变量相关程度的度量 Step06 选择列联表单元格的输出类型 Step07 选择列联表单元格的输出排列顺序 Step08 完成操作 3.4.3 实例图文分析:大学生身体素质调查 在一次上海大学生身体素质的实际调查中,选择了部分大专院校的学生进行实际问卷调查,收集的数据见 3-4.sav。调查内容主要 包括:性别、出生日期、身高、体重、血型、教育背景、学科、男女身高级别和男女体重级别等内容。请根据调查数据分析下面问题:(1)进行“性别”和“体重级别”双因素交叉作用下的列联表分析,并研究“性别”对“体重级别”有无显著性影响。(2)进行“教育背景”和“身高级别”双因素交叉作用下的列联表分析,并研究“教育背景”对“身高级别”有无显著性影响。4.SPSS 的均值比较过程 SPSS 主要有以下模块实现均值比较过程。One-Sample T Test:单样本 t 检验。Independent-Sample T Test:两个独立样本均值的 t 检验。精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 Paired-Sample T Test:两个配对样本均值的 t 检验。4.1 SPSS 在单样本 t 检验的应用 单样本 t 检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在明显的差异。它是对总体均值的假设检验。如果概率 P 值小于或等于显著性水平,则拒绝零假设;如果概率 P 值大于显著性水平,则接受零假设。4.1.2 单样本 t 检验的 SPSS 操作详解 Step01:打开单样本 t 检验对话框【Analyze(分析)】【Compare Means(比较均值)】【One-Sample T Test(单样本 T检验)】命令 Step02:选择检验变量 Step03:选择样本检验值 Step04:其他选项设置 Step05:单击【OK】按钮结束操作,SPSS 软件自动输出结果 4.1.3 实例图文分析:交通通勤时间(见数据文件 4-1.sav)1.实例内容 根据一份公共交通调查报告显示,对于那些在一个城市乘车上下班的人来说,平均通勤时间为 19 分钟,其人数总量为 100 万 300 万。假设一个研究者居住在一个人口为 240 万的城市里,想通过验证以确定通勤时间是否和其他城市平均水平是否一致。他随机选取了 26 名通勤者作为样本,收集的数据如下所示。假设通勤时间服从正态分布,这位研究者能得到什么结论?19 16 20 23 23 24 13 19 23 16 17 15 14 27 17 23 18 18 20 18 18 18 23 19 19 28 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 2.实例操作(略)4.2 SPSS 在两独立样本 t 检验的应用 4.2.2 两独立样本 t 检验的 SPSS 操作步骤 Step01:打开两独立样本 t 检验对话框。【Analyze(分析)】【Compare Means(比较均值)】【Independent-Samples T Test(独立样本 T 检验)】命令 Step02:选择检验变量 Step03:选择分组变量 Step04:定义组别名称 Step05:单击【OK】按钮,结束操作,SPSS 软件自动输出相关结果 4.2.3 实例图文分析:机场等级分数比较(见数据文件 4-3.sav)1.实例内容 国际航空运输协会(The International Air Tran sport Association)对商务旅游人员进行了一项调查,以便确定多个国际机场的等级分数。最高可能分数是 10 分,分数越高说明其等级也越高。假设有一个由 50 名商务旅行人员组成的简单随机样本,要求这些人给迈阿密机场打分。另外有一个由 50 名商务旅行人员组成的样本,要求这些人给洛杉矶机场打分。这两个组人员打出的等级分数如表 4-5所示。请你判断迈阿密机场和洛杉矶机场的等级评分是否相同?精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 4.3 SPSS 在两配对样本 t 检验的应用 在现实中,总体或样本之间不仅仅表现为独立的关系,很多情况下,总体之间存在着一定的相关性。当分析这些相关总体之间的均值关系时,就涉及到两配对样本的 t 检验。配对样本主要包括下列一些情况:(1)同一实验对象处理前后的数据。例如对患肝病的病人实施某种药物治疗后,检验病人在服药前后的差异性。(2)同一实验对象两个部位的数据。例如研究汽车左右轮胎耐磨性有无显著差异。(3)同一样品用两种方法检验的结果。例如对人造纤维在 60 度和 80 度的水中分别作实验,检验温度对这 种材料缩水率的影响性。(4)配对的两个实验对象分别接受不同处理后的数据。例如对双胞胎兄弟实施不同的教育方案,检验他们在学习能力上的差异性。进行配对样本检验时,通常要满足以下三个要求。(1)两组样本的样本容量要相同;(2)两组样本的观察值顺序不能随意调换,要保持一一对应关系;(3)样本来自的总体要服从正态分布。4.3.2 两配对样本 t 检验的 SPSS 操作详解 Step01:打开两配对样本 t 检验对话框【Analyze(分析)】【Compare Means(比较均值)】【Paired-Samples T Test(配对样本 T 检验)】命令 Step02:选择配对变量 Step03:其他选项选择 Step04:单击图【OK】按钮,结束操作,SPSS 软件自动输出结果 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 4.3.3 实例图文分析:看电视和读书的时间(见数据文件 4-5.sav)1.实例内容“每月读书俱乐部”的成员进行了一项调查,以确信其成员用于看电视的时间是否比读书的时间多。假定抽取 15 个人组成的样本,得到了下列有关他们每周观看电视的小时数和每周读书时间的小时数的数据,见表 4-11所示。你能够得到结论:“每月读书俱乐部”的成员每周观看电视的时间比读书的时间更好吗?表 4-11 每天观看电视和读书时间(单位:小时)被调查者 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 看 电 视 时间 10 14 16 18 15 14 10 12 4 8 16 5 8 19 11 读书时间 6 16 8 10 10 8 14 14 7 8 5 10 3 10 6 5.SPSS 的方差分析 多个总体均值是否相等的假设检验问题了,所采用的方法是方差分析。方差分析中有以下几个重要概念:因素、水平、单元、元素、交互作用 5.1.2 方差分析的基本思想 表 5-1 某公司产品销售方式所对应的销售量 序号 销售方式 1 2 3 4 5 水平均值 方式一 77 86 81 88 83 83 方式二 95 92 78 96 89 90 方式三 71 76 68 81 74 74 方式四 80 84 79 70 82 79 总均值 81.5 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 在表 5-1中,要研究不同推销方式的效果,其实就归结为一个检验问题,设为第 i(i=1,2,3,4)种推销方式的平均销售量,即检验原假设是否为真。从数值上观察,四个均值都不相等,方式二的销售量明显较大。从表 5-1可以看到,20 个数据各不相同,这种差异可能是由以下两方面的原因引起的。一是推销方式的影响,不同的方式会使人们产生不同消费冲动和购买欲望,从而产生不同的购买行动。这种由不同水平造成的差异,称之为系统性差异。二是随机因素的影响。同一种推销方式在不同的工作日销量也会不同,因为来商店的人群数量不一,经济收入不一,当班服务员态度不一,这种由随机因素造成的差异,我们称之为随机性差异。两个方面产生的差异用两个方差来计量:一是变量之间的总体差异,即水平之间的方差。二是水平内部的方差。前者既包括系统性差异,也包括随机性差异;后者仅包括随机性差异。5.1.3 方差分析的基本假设(1)各样本的独立性。即各组观察数据,是从相互独立的总体中抽取的。(2)要求所有观察值都是从正态总体中抽取,且方差相等。在实际应用中能够严格满足这些假定条件的客观现象是很少的,在社会经济现象中更是如此。但一般应近似地符合上述要求。水平之间的方差(也称为组间方差)与水平内部的方差(也称组内方差)之间的比值是一个服从 F 分布的统计量 F=水平间方差/水平内方差=组间方差/组内方差 5.2 SPSS 在单因素方差分析中的应用 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 用来研究一个因素的不同水平是否对观测变量产生了显著影响 应用方差分析时,数据应当满足以下几个条件:在各个水平之下观察对象是独立随机抽样,即独立性;各个水平的因变量服从正态分布,即正态性;各个水平下的总体具有相同的方差,即方差 齐;2.基本原理 方差分析认为:SST(总的离差平方和)=SSA(组间离差平方和)+SS E(组内离差平方和)如果在总的离差平方和中,组间离差平方和所占比例较大,说明观测变量的变动主要是由因素的不同水平引起的,可以主要由因素的变动来解释,系统性差异给观测变量带来了显著影响;反之,如果组间离差平方和所占比例很小,说明观测变量的变动主要由随机变量因素引起的。SPSS 将自动计算检验统计量和相伴概率 P 值,若 P 值小于等于显著性水平,则拒绝原假设,认为因素的不同水平对观测变量产生显著影响;反之,接受零假设,认为因素的不同水平没有对观测变量产生显著影响。5.2.2 单因素方差分析的 SPSS 操作详解 Step01:打开主操作窗口【Analyze(分析)】【Compare Means(比较均值)】【One-Way ANOVA(单因素 ANOV A)】命令 Step02:选择因变量 Step03:选择因素变量 Step04:均值精细比较 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 Step05:均值多重比较 5.2.3 实例图文分析:信息来源与传播(见数据文件 5-1.sav)1.实例内容 某机构的各个级别的管理人员需要足够的信息来完成各自的任务。最近,一项研究调查了信息来源对信息传播的影响。在这项特定的研究中,信息来源是上级、同级和下级。在每种情况下,对信息传播进行测度:数值越高,说明信息传播越广。检验信息来源是否对信息传播有显著影响?你的结论是什么?2.实例操作 由于不同的信息来源可能导致信息传播测度不同。本案例中,信息来源是因素,“上级、同级和下级”是因素的三种不同水平,信息传播测度是因变量(观测变 量)。由于这里有三个水平,因此不能采用两样本的均值检验过程,故考虑采用单因素方差分析法。进行如下假设检验:H0:三种不同信息来源对信息传播测度平均值没有显著性影响;H1:三种不同信息来源对信息传播测度平均值存在显著性影响。5.3 SPSS 在多因素方差分析中的应用 方法概述 多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。它不仅能够分析多个因素对观测变量的独立影响,更能够分析多个因素的交互作用能否对观测变量产生显著影响。观测变量值的波动要受到多个控制变量独立作用、控制变量交互作用及随机因素等三方面的影响。5.3.2 多因素方差分析的 SPSS 操作详解 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 Step01:打开主对话框【Analyze(分析)】【General Linear Model(一般线性模型)】【Univariate(单变量)】命令 Step02:选择分析变量(因变量、因素变量、随机变量、协变量、权重变量)Step03:模型选择 Step04:选择比较方法 Step05:选择轮廓图 Step06:选择多重比较 Step07:预测值保存 Step08:其他选项选择 5.3.3 实例图文分析:薪金的区别(见数据文件 5-3.sav)1 实例内容 假设某一杂志的记者要考察职业为财务管理、计算机程序员和药剂师的男女雇员其每周的薪金之间是否有显著性差异。从每种职业中分别选取了 5 名男性和 5 名女性组成样本,并且记录下来样本中每个人的周薪金(单位:美元)。所得数据见表 5-11所示。请你分析职业和性别对薪金有无显著影响。精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 2 实例操作 由于薪金水平的高低和所从事的职业、性别等因素都有关系。因此这里要考虑两个因素水平 下的薪金差异问题,即建立双因素的方差分析模型。本案例中,职业和性别是两个影响因 素,而每周薪金是因变量。同时,我们也要考虑职业和性别这两个因素之间有无交互作用。5.4 SPSS 在协方差分析中的应用 协方差分析是将那些很难控制的因素作为协变量。在排除协变量影响的条件下,分析因素变量对观察变量的影响,从而更加准确地对因素变量进行评价。在协方差分析中,将观察变量总的离差平方和分解为由因变量引起的、由因变量的交互作用引起的、由协变量引起的和由其他随机因 素引起的。5.4.2 协方差分析的 SPSS 操作详解 1、确定是否存在协变量 2、“Univariate”过程中引入协变量 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 由于协方差分析也是采用【General Linear Model(一般线性模型)】中的【Univariate(单变量)】命令,因此它的基本操作和多因素方差分析的 SPSS 操作是相同的,这里就不再重复了 5.4.3 实例图文分析:人体的血清胆固醇(见数据文件 5-4.sav)1 实例内容 某医生欲了解成年人体重正常者与超重者的血清胆固醇是否不同。而胆固醇含量可能与年龄有关系,具体资料数据见表 5-17所示。请建立模型分析体重对人体胆固醇含量的影响,同时也要兼顾年龄的因素。表 5-17 血清胆固醇含量 正 常组 年龄 48 33 51 43 44 63 49 42 40 47 41 41 56 胆 固醇 3.5 4.6 5.8 5.8 4.9 8.7 3.6 5.5 4.9 5.1 4.1 4.6 5.1 超 重组 年龄 58 41 71 76 49 33 54 65 39 52 45 58 67 胆 固醇 7.3 4.7 8.4 8.8 5.1 4.9 6.7 6.4 6.0 7.5 6.4 6.8 9.2 2 实例操作 案例中需要分析体重对人体的血清胆固醇有无直接影响,同时体重这个因素分为正常组和超重组两个水平,因此可以考虑单因素方差分析模型。但如果仅分析体重的影响作用,而不考虑实验对象 年龄的差异,那么得出的结论可能是不准确的。这是因为年龄的大小在一定程度上会影响人体的血清胆固醇含量的高低。因此,为了更准确描述体重对人体的血清胆固醇的影响,就应该尽量排除年龄因素对分析结果的影响。所以将年龄作为协变量引入模型,考虑建立协方差分析模型。在打开或建立数据文件 5-4.sav后,具体操作步骤如下。Step01:选择观测变量 选择菜单栏中的【Graphs(图形)】【Legacy Dialogs(旧对话框)】【Scatter/Dot(散点图/点图)】【Simple/Scatter(简单分布)】命令,弹出【Simple Scatter plot(简单分布图)】对话框 Step02:打开对话框 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 选择菜单栏中的【Analyze(分析)】【General Linear Model(一般线性模型)】【Univariate(单变量)】命令,弹出【Univariate(单变量)】对话框。Step03:选择分析比较 在候选变量列表框中选择“chol”变量作为因变量,将其添加至【Dependent Variable(因变量)】列表框中。选择“group”作为因素变量,将其添加至【Fixed Variable(s)(固定变量)】列表框中。选择“age”作为协变量,将其添加至【Covariate(s)(对比)】列表框中。Step05:其他选项选择 单击【Options】按钮,弹出【Options(选项)】对话框。勾选【Descriptive(描述性统计量)】复选框表示输出描述性统计量;勾选【Homogeneity-of-variance(方差同质性检验)】复选框表示输出方差齐性检验表。再单击【Continue 按钮】,返回主对话框。提示:根据数据特点及您的实验要求,选择不同的均值多重比较方法。Step06:完成操作 最后,单击【OK(确定)】按钮,操作完成。7.SPSS 的相关分析 7.2 SPSS 在简单相关分析中的应用 7.2.2 简单相关分析的 SPSS 操作详解 Step01:打开主菜单【Analyze(分析)】【Correlate(相关)】【Bivariate(双变量)】命令 Step02:选择检验变量 Step03:选择相关系数类型 精品好资料-如有侵权请联系网站删除 精品好资料-如有侵权请联系网站删除 对于非等间距测度的连续变量,因为分布不明可以使用等级相关分析,也可以使用 Pearson 相关分析;对于完全等级的离散变量必须使用等级相关分析相关性。当资料不服从双变量正态分布或总体分布型未知,或原始数据是用等级表示时,宜用 Spearman 或 Kendall 相关。Step04:假设检验类型选择 Step05:其他选项选择 Step06:单击【OK】按钮,结束操作,SPSS 软件自动输出结果 7.2.3 实例分析:股票指数之间的联系(见数据文件 7-1.sav)1.实例内容 道琼斯工业平均指数(DJIA)和标准普尔指数 500(S&P 50 0)都被用做股市全面动态的测度。DJIA 是基于 30 种股票的价格动态;S&P 500 是由 500 种股票组成的指数。有人说 S&P 500 是股票市场功能的一种更好的测度,因为它基于更多的股票。表 7-2显示了 DJIA 和 S&P 500 在 1997 年 10 周内的收盘价。请计算它们之间的样本相关系数。不仅如此,样本相关系数告诉我们 DJIA 和 S&P 500 之间的关系是怎样的?2.实例操作 表给出了道琼斯工业平均指数和标准普尔指数在同一时间点的数值。由于这些数值都是连续型变量,同时根据两个股票指数的散点图,可见它们呈显著的线性相关,因此可以采用 Pear son 相关系数来测度它们之间的相关性。但为了比较,我们也计算了这两组变量的 Kendall 和Spearman 相