《SPSS实验报告151239.pdf》由会员分享,可在线阅读,更多相关《SPSS实验报告151239.pdf(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大丈夫处世,不能立功建业,几与草木同腐乎?罗贯中老当益壮,宁移白首之心;穷且益坚,不坠青云之志。唐王勃 第四章 描述性统计分析 一、实验目的 通过计算诸如样本均值、中位数、样本方差等重要基本统计量,并辅助于 SPSS 提供的图形功能,能够使分析者把握数据的基本特征和数据的整体分布形态,对进一步的统计推断和数据建模工作起到重要作用。并且,通过例子学习描述性统计分析及其在 SPSS 中的实现,包括统计量的定义及计算、频率分析、描述性分析、探索性分析、交叉表分析和多重响应分析,能够使分析者更好的掌握基本的统计分析,即单变量频数分布的编制、基本统计量的计算以及数据的探索性分析等。二、实验内容 1打开数
2、据文件 data4-8.sav,完成以下统计分析。(1)计算各科成绩的描述统计量:平均成绩、中位数、众数、标准差、方差、极差、最大值和最小值;解决问题的原理:描述性分析 实验步骤:通过“分析-描述统计-描述”,打开“描述性”对话框,根据题目所需要的统计量进行设置。结果及分析:描述统计量 N 全距 极小值 极大值 均值 标准差 方差 成绩 45 83 15 98 60.51 23.048 531.210 有效的 N(列表状态)45 表中分析变量“成绩”的个案数、所有个案中的极大值、极小值、均值、标准差及方差。(2)使用 Recode 命令生成一个新变量“成绩段”,其值为各科成绩的分段:90100
3、 为 1,8089 为 2,7079 为 3,6069 为 4,60 分以下为 5,其值标签:1优,2良,3中,4及格,5不及格。分段以后进行频数分析,统计各分数段的人数,最后生成条形图和饼图。解决问题的原理:频率分析。实验步骤:通过“分析-描述统计-频率”,打开“频率”对话框,根据题目所需要的统计量进行设置。结果及分析:成绩 频率 百分比 有效百分比 累积百分比 有效 15 1 2.2 2.2 2.2 19 1 2.2 2.2 4.4 24 1 2.2 2.2 6.7 28 1 2.2 2.2 8.9 30 1 2.2 2.2 11.1 32 2 4.4 4.4 15.6 33 1 2.2
4、2.2 17.8 34 1 2.2 2.2 20.0 36 1 2.2 2.2 22.2 37 2 4.4 4.4 26.7 43 1 2.2 2.2 28.9 49 1 2.2 2.2 31.1 50 1 2.2 2.2 33.3 55 1 2.2 2.2 35.6 丈夫志四方,有事先悬弧,焉能钧三江,终年守菰蒲。顾炎武忍一句,息一怒,饶一着,退一步。增广贤文56 4 8.9 8.9 44.4 60 3 6.7 6.7 51.1 62 1 2.2 2.2 53.3 63 1 2.2 2.2 55.6 69 1 2.2 2.2 57.8 70 1 2.2 2.2 60.0 73 3 6.7 6
5、.7 66.7 74 1 2.2 2.2 68.9 75 1 2.2 2.2 71.1 76 1 2.2 2.2 73.3 78 1 2.2 2.2 75.6 81 1 2.2 2.2 77.8 83 1 2.2 2.2 80.0 85 2 4.4 4.4 84.4 86 1 2.2 2.2 86.7 90 2 4.4 4.4 91.1 91 1 2.2 2.2 93.3 95 2 4.4 4.4 97.8 98 1 2.2 2.2 100.0 合计 45 100.0 100.0 表中显示了变量“成绩段”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。表中显
6、示了变量“成绩段”的直方图,从图上可以看出不具备明显的正态分布。老当益壮,宁移白首之心;穷且益坚,不坠青云之志。唐王勃丈夫志四方,有事先悬弧,焉能钧三江,终年守菰蒲。顾炎武 表中显示了变量“成绩段”的饼图,从图上可以更好的看出“成绩段”的分布。2打开数据文件 data4-9.sav,完成以下统计分析。(1)对身高进行考察,分析四分位数,计算上奇异值、上极端值、下奇异值和下极端值,并生成茎叶图和箱图;解决问题的原理:探索性分析 实验步骤:通过“分析-描述统计-探索”,打开“绘制”对话框,根据题目所需要的统计量进行设置。结果及分析:身高 Stem-and-Leaf Plot Frequency S
7、tem&Leaf 2.00 9.99 16.00 10.0000001222333344 39.00 10.555555556666677778888888999999999999999 18.00 11.000000112222233344 13.00 11.5556667788999 7.00 12.0000002000 1.00 12.5 Stem width:10.0 Ea00ch leaf:1 case(s)从上的茎叶图可以更加详细地分析身高数据。表 4.22 吸烟人群健康状况调查表 是否吸烟 是否患气管炎 人数 是 患病 43 是 健康 162 否 患病 13 否 健康 121 万
8、两黄金容易得,知心一个也难求。曹雪芹人不知而不愠,不亦君子乎?论语 从上的箱图可以分析变量“身高”的四分位数。(2)考察身高、体重和胸围的正态性。解决问题的原理:运用频率分析、描述性分析、探索性分析。实验步骤:通过“分析-描述统计-交叉表”,打开“交叉表”对话框,根据题目所需要的统计量进行设置。结果及分析:吾日三省乎吾身。为人谋而不忠乎?与朋友交而不信乎?传不习乎?论语先天下之忧而忧,后天下之乐而乐。范仲淹 从上的 Q-Q 图中可以看出,身高、体重、胸围三个变量都很好的服从正态分布。3表 4.22 是对吸烟与患气管炎的调查表,试分析吸烟与患气管炎之间的关系。(用交叉列联表分析,参见数据文件:d
9、ata4-10.sav。)解决问题的原理:运用交叉表分析。实验步骤:通过“分析-描述统计-交叉表”,打开“交叉表”对话框,根据题目所需要的统计量进行设置。结果及分析:案例处理摘要 案例 有效的 缺失 合计 N 百分比 N 百分比 N 百分比 是否患气管炎*是否吸烟 4 100.0%0.0%4 100.0%表给出了数据基本信息,表中给出了参与分析的个案数、缺失信息等。本例中,每个变量有4 个个案参与分析,无缺失值。是否患气管炎*是否吸烟 交叉制表 古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。苏轼志不强者智不达,言不信者行不果。墨翟计数 是否吸烟 合计 是 否 是否患气管炎 患病 1 1 2
10、 健康 1 1 2 合计 2 2 4 表给出了了数据的交叉表,与原始数据在形式上基本一致。卡方检验 值 df 渐进 Sig.(双侧)精确 Sig.(双侧)精确 Sig.(单侧)Pearson 卡方.000a 1 1.000 连续校正b.000 1 1.000 似然比.000 1 1.000 Fisher 的精确检验 1.000.833 线性和线性组合.000 1 1.000 有效案例中的 N 4 a.4 单元格(100.0%)的期望计数少于 5。最小期望计数为 1.00。b.仅对 2x2 表计算 表是行、列变量通过卡方检验给出的独立性检验结果。从表可知,各种检验方法显著水平都远小于0.05,所
11、以有理由拒绝“实验准备与评价结果是独立的”假设,即认为实验准备这一评价指标与评价结果是相关的。各组状况条形图相当于交叉表的直观表示,用图形表示可直观地得出各种情况的比较。老当益壮,宁移白首之心;穷且益坚,不坠青云之志。唐王勃以铜为镜,可以正衣冠;以古为镜,可以知兴替;以人为镜,可以明得失。旧唐书魏征列传4为分析某中学学生填报志愿的倾向,设计了一道问卷调查题,每位同学可填报 3 个志愿,请按顺序依次选择打算报考的大学:第一志愿 第二志愿 第三志愿 北京大学 清华大学 复旦大学 中国人民大学 北京交通大学 四川大学 问卷调查的结果存放在 SPSS 数据文件 data4-11.sav 中,按如下要求
12、进行统计分析。(1)对第一、二、三志愿填报情况进行统计分析;(2)对各学校填报志愿的情况进行统计分析,包括人数、百分比等。解决问题的原理:运用频率分析、描述性分析、交叉表分析。实验步骤:通过“分析-描述统计-频率”,打开“频率”对话框,根据题目所需要的统计量进行设置。通过“分析-描述统计-交叉表”,打开“交叉表”对话框,根据题目所需要的统计量进行设置。结果及分析:统计量 志愿 1 志愿 2 志愿 3 N 有效 100 100 100 缺失 0 0 0 中值 3.00 3.00 3.00 众数 3 3 4 标准差 1.578 1.429 1.642 方差 2.491 2.041 2.695 极小
13、值 1 1 1 极大值 6 6 6 百分位数 25 2.00 2.00 2.00 50 3.00 3.00 3.00 75 4.00 4.00 5.00 频率表 志愿1 频率 百分比 有效百分比 累积百分比 有效 1 20 20.0 20.0 20.0 2 17 17.0 17.0 37.0 3 26 26.0 26.0 63.0 4 14 14.0 14.0 77.0 5 14 14.0 14.0 91.0 6 9 9.0 9.0 100.0 合计 100 100.0 100.0 志愿2 频率 百分比 有效百分比 累积百分比 有效 1 20 20.0 20.0 20.0 2 24 24.0
14、24.0 44.0 海纳百川,有容乃大;壁立千仞,无欲则刚。林则徐先天下之忧而忧,后天下之乐而乐。范仲淹3 26 26.0 26.0 70.0 4 15 15.0 15.0 85.0 5 10 10.0 10.0 95.0 6 5 5.0 5.0 100.0 合计 100 100.0 100.0 志愿 3 频率 百分比 有效百分比 累积百分比 有效 1 14 14.0 14.0 14.0 2 19 19.0 19.0 33.0 3 18 18.0 18.0 51.0 4 21 21.0 21.0 72.0 5 12 12.0 12.0 84.0 6 16 16.0 16.0 100.0 合计
15、100 100.0 100.0 表中显示了变量“志愿”在各个取值上出现的次数(频率)、其频率占所有个案中的百分比、有效百分比及累积百分比。三、实验心得与体会 通过本章例子学习描述性统计分析及其在 SPSS 中的实现,学会了基本描述性统计量的定义及计算、频率分析、描述性分析、探索性分析、交叉表分析。深刻体会到了如何计算诸如样本均值等重要的基本统计量,并辅助于 SPSS 提供的图形功能来分析把握数据的基本特征和数据的整体分布形态。同时加强了自己的操作能力。第五章 参数估计与假设检验 一、实验目的 如果掌握了所研究总体的全部数据,那么只需做一些简单的统计描述,就可得到有关总体的数据特征,如方差、总体
16、均值等,但在现实情况中,很多时候不可能或者不必对总体中的每个单位进行测定,就需要从总体抽取一部分单位进行测定,通过样本提供的信息来对总体信息进行估计和推断。而参数估计和假设检验就是通过样本分析总体,从样本的观察或试验结果的特征对总体的特征进行估计和推断。二、实验内容 3表 5.20 是某班学生的高考数学成绩,试分析该班的数学成绩与全国的平均成绩 70 分之间是否有显著性差异。(参见数据文件:data5-16.sav。)解决问题的原理:单样本 T 检验 实验步骤:通过“分析-比较均值-单样本 T 检验(S)”,打开“单样本 T 检验”对话框,根据题目所需要的统计量进行设置。结果及分析:单个样本统
17、计量 N 均值 标准差 均值的标准误 表 5.20 某班学生数学成绩 序号 成绩 序号 成绩 序号 成绩 1 63 10 94 19 70 2 99 11 98 20 65 3 81 12 73 21 84 4 77 13 89 22 84 5 68 14 98 23 95 6 79 15 77 24 61 7 80 16 67 25 69 古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。苏轼古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。苏轼单个样本统计量 N 均值 标准差 均值的标准误 成绩 27 77.93 12.111 2.331 表给出了单样本T检验的描述性统计量,包括样本数(N
18、)、均值、标准差、均值的标准差。单个样本检验 检验值=70 t df Sig.(双侧)均值差值 差分的 95%置信区间 下限 上限 成绩 3.400 26.002 7.926 3.13 12.72 表是单样本T检验结果表,当置信区间为95%时,显著水平为0.05,从表中可以看出,双尾检测概率P值为0.02,小于0.05,故原假设不成立,也就是说,数学成绩与全国的平均成绩70分之间有显著性差异。4在某次测试中,随机抽取男女学生的成绩各10名,数据如下:男:99 79 59 89 79 89 99 82 80 85 女:88 54 56 23 75 65 73 50 80 65 假设样本总体服从正
19、态分布,比较置信度为95%的情况下男女得分是否有显著性差异。(参见数据文件:data5-17.sav。)解决问题的原理:独立样本T 检验 实验步骤:通过“分析-比较均值-独立样本 T 检验(T)”,打开“独立样本 T 检验”对话框,根据题目所需要的统计量进行设置。结果及分析:上表中是独立样本T检验的均值检验结果。显著水平为0.05,从表中可以看出T统计量的概率P小于0.05,故拒绝原假设,所以男女得分有显著性差异。5某医疗机构为研究某种减肥药的疗效,对16位肥胖者进行为期半年的观察测试,测试指标为使用该药之先天下之忧而忧,后天下之乐而乐。范仲淹万两黄金容易得,知心一个也难求。曹雪芹前和之后的体
20、重,数据如表5.21所示。假设体重近似服从正态分布,试分析服药前后,体重是否有显著变化。(参见数据文件:data5-18.sav。)表5.21 服药前后的体重变化 体 重 服药前 198 237 233 179 219 169 222 167 199 233 179 158 157 216 257 151 服药后 192 225 226 172 214 161 210 161 193 226 173 154 143 206 249 140 解决问题的原理:配对样本 T 检验 实验步骤:通过“分析-比较均值-配对样本 T 检验(P)”,打开“配对样本 T 检验”对话框,根据题目所需要的统计量进行
21、设置。结果及分析:从上表一及表二中可以看出,在显著水平为 0.05 时,概率 P 值明显小于 0.05,拒绝原假设,可以认为减肥药前后的体重有明显的线性关系。从上表三是配对样本 T 检验的最终结果,可以看出,在显著水平为 0.05时,由于概率 P 值明显小于 0.05,拒绝原假设,故可以认为服药前后,体重有显著变化。10某农民想了解两品种的小麦、产量是否有显著区别,其产量数据如表5.24 所示,分别在显著性水平 0.05 和 0.01 下检验两品种产量是否有显著性差异。(数据来源:M.R.斯皮格尔,统计学(第 3 版),科学出版社;参见数据文件:data5-23.sav。)表 5.24 两种小
22、麦的产量数据 小麦1 15.9 15.3 16.4 14.9 15.3 16 14.6 15.3 14.5 16.6 16 小麦2 16.4 16.8 17.1 16.9 18 16 18.1 17.2 15.4 解决问题的原理:独立样本非参数检验。天行健,君子以自强不息。地势坤,君子以厚德载物。易经我尽一杯,与君发三愿:一愿世清平,二愿身强健,三愿临老头,数与君相见。白居易实验步骤:通过“分析-非参数检验-独立样本”,打开“非参数检验”对话框,根据题目所需要的统计量进行设置。结果及分析:由图可知,因为显著性水平为 0.05,而相伴概率 Sig.=1.0000.05,所以接受原假设,两品种产量
23、无显著性差异。由图可知,因为显著性水平为 0.01,而相伴概率 Sig.=1.0000.05,所以接受原假设,两品种产量无显著性差异。11为研究长跑运动对增强普通高校学生心脏功能的效果,对某校 15 名男生进行测试,经过 5 个月的长跑锻炼后看其晨脉是否减少。锻炼前后的晨脉数据如表 5.25 所示。表 5.25 长跑锻炼前后晨脉变化表 锻炼前 70 76 56 63 63 56 58 60 65 65 75 66 56 59 70 锻炼后 48 54 60 64 48 55 54 45 51 48 56 48 64 50 54 试问锻炼前后的晨脉在显著性水平 0.05 下有无显著性差异。(数据
24、来源:卢纹岱,SPSS for Windows 统计分析(第 3 版),电子工业出版社;参见数据文件:data5-24.sav。)解决问题的原理:相关样本的非参数检验。实验步骤:通过“分析-非参数检验-相关样本”,打开“非参数检验”对话框,根据题目所需要的统计量进行设置。结果及分析:其身正,不令而行;其身不正,虽令不从。论语大丈夫处世,不能立功建业,几与草木同腐乎?罗贯中 由图可知,因为显著性水平为 0.05,而相伴概率 Sig.=0.220.05,所以接受原假设,可以得知锻炼前后的晨脉之间差异的中位数等于 0,即锻炼前后的晨脉无显著性差异。三、实验心得与体会 通过对本章的学习以及实例分析的操
25、作,学会了如何用T 检验解决两样本间均值比较的问题。对数据的分析有了进一步的认识和技能的掌握有了很大的提高。从而在以后的学习工作中,遇到此类问题,能更快的反应、理解和掌握。第七章 相关分析 一、实验目的 利用分析多个性质不同的 SPSS 变量,从而分析总体的多个特征,并分析这些特征的联系。相关分析是比较简单的多元分析,使用多元分析方法,能快速发现总体特征之间的关系,并检验这些特征的显著性。以此广泛用于生物学、经济学等各个领域。二、实验内容 3K.K.Smith 在烟草杂交繁殖的花上收集到如表 7.21 所示的数据,要求对以上 3 组数据两两之间进行相关分析,以 0.05 的显著性水平检验相关系
26、数的显著性。(数据来源:苏金明,统计软件 SPSS 系列应用实践篇,电子工业出版社;参见数据文件:data7-9.sav。)表 7.21 K.K.Smith 所调查的长度资料 花瓣长 49 44 32 42 32 53 36 39 37 45 41 48 45 39 40 34 37 35 花枝长 27 24 12 22 13 29 14 20 16 21 22 25 23 18 20 15 20 13 花萼长 19 16 12 17 10 19 15 14 15 21 14 22 22 15 14 15 15 16 解决问题的原理:两变量相关分析 实验步骤:通过“分析-相关-双变量”,打开“
27、双变量相关”对话框,根据题目所需要的统计量进行设置。结果及分析:一寸光阴一寸金,寸金难买寸光阴。增广贤文谋事在人,成事在天!增广贤文 从上表一列出了描述性统计量均值、标准差和统计量个案数。从上表二是相关分析的主要结果,可以看出,相关系数 0.9550,0.7970,说明呈正相关,相关系数的显著性为 0.0020,双尾检验的相伴概率明显小于 0.05,应拒绝两变量不相关的原假设,说明两变量具有显著的正相关性。从上表的下半部分可以看出,两变量的Spearman 相关系数为 0.9950,同时双尾检验的相伴概率显著性明显小于 0.05,也说明两变量呈显著的正相关性。从表的脚注可看出双尾检测下两变量在
28、 0.01 水平上具有显著的正相关性。故 19621988 年安徽省国民收入与城乡居民储蓄存款余额两个变量间具有显著的线性相关性。5某高校抽样 10 名短跑运动员,测出 100 米短跑的名次和跳高的名次如表 7.23 所示,问这两个名次是否在 0.05 的显著性水平下具有相关性。(数据来源:马庆国,应用统计学:数据统计方法、数据获取与 SPSS应用,科学出版社;参见数据文件:data7-11.sav。)表 7.23 10 名运动员的 100 米短跑及跳高名次 百米名次 1 2 3 4 5 6 7 8 9 10 跳高名次 4 3 1 5 2 7 10 8 9 6 解决问题的原理:偏相关分析 实验
29、步骤:通过“分析-相关-偏相关”,打开“偏相关”对话框,比照例题根据题目所需要的统计量进行设置。结果及分析:人人好公,则天下太平;人人营私,则天下大乱。刘鹗人之为学,不日进则日退,独学无友,则孤陋而难成;久处一方,则习染而不自觉。顾炎武 从上表可以看出 100 米短跑的名次和跳高的名次的偏相关系数为0.697,双尾检测的相伴概率为 0.25,明显大于 0.05,故接受原假设,说明在 0.05 的显著性水平下具有相关性。6某公司太阳镜销售情况如表 7.24 所示,请分析销售量与平均价格、广告费用和日照时间之间的关系,并说明此题用偏相关分析是否有实际意义(显著性水平为 0.05)。(数据来源:卢纹
30、岱,SPSS for Windows统计分析(第 3 版),电子工业出版社;参见数据文件:data7-12.sav。)表 7.24 某公司销售太阳镜的数据 月 份 1 2 3 4 5 6 7 8 9 10 11 12 销 量 75 90 148 183 242 263 278 318 256 200 140 80 价 格 6.8 6.5 6 3.5 3 2.9 2.6 2.1 3.1 3.6 4.2 5.2 广 告 费 2 5 6 7 22 25 28 30 22 18 10 2 云路鹏程九万里,雪窗萤火二十年。王实甫大丈夫处世,不能立功建业,几与草木同腐乎?罗贯中用 日 照 时 间 2.4
31、4 5.2 6.8 8 8.4 10.4 11.5 9.6 6.1 3.4 2 解决问题的原理:距离分析。实验步骤:通过“分析-相关-距离”,打开“距离”对话框,比照例题根据题目所需要的统计量进行设置。结果及分析:从上表可以看出销售量与平均价格、广告费用和日照时间为控制量,销量与月份偏相关系数为0.203,双尾检测的相伴概率为0.559,明显大于显著水平0.05。故接受原假设,说明销量与月份不存在显著的相关性。故此题用偏相关分析无实际意义。三、实验心得与体会 通过本章的学习以及 SPSS 实例分析的训练,学会了如何运用分析多个性质不同的SPSS 变量来发现总体特征之间的关系,并检验这些特征的显著性。深刻体会到相关分析的实际意义,用于生物学、经济学等各个领域的重要性。认识到了相关分析对于实验数据的处理、经验公式的建立、管理标准的测定、自然现象和经济现象的统计预报等,是一种极为有效且广泛使用的数理统计工具。在以后的工作学习中,遇到此类问题,能更加的快速地解决。在知识领域和技能的掌握上有了很大的提高。一寸光阴一寸金,寸金难买寸光阴。增广贤文谋事在人,成事在天!增广贤文
限制150内