《SPSS170在生物统计学中的应用实验指导-实验三、参数估计实验四、t检验解读.pdf》由会员分享,可在线阅读,更多相关《SPSS170在生物统计学中的应用实验指导-实验三、参数估计实验四、t检验解读.pdf(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSS在生物统计学中的应用实验指导手册 太原师范学院生物系生物技术专业内部使用参考资料 SPSS在生物统计学中的应用 实验指导手册 实验三:参数估计 一、实验目的与要求 1.理解参数估计的概念 2.熟悉区间估计的概念与操作方法 二、实验原理 1.参数估计的定义 参数估计(parameter estimation)是根据从总体中抽取的样本估计总体分布中的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。点估计(point estimation):又称定值估计,就是用实际样本指标数值作为总体参数的估计值。当总体的性质不清楚时,我们须利用某一量数(
2、样本统计量)作为估计数,以帮助了解总体的性质,如:样本平均数乃是总体平均数 的估计数,当我们只用一个特定的值,亦即数线上的一个点,作为估计值以估计总体参数时,就叫做点估计。点估计的数学方法很多,常见的有“矩估计法”、“最大似然估计法”、“最小二乘估计法”、“顺序统计量法”等。点估计的精确程度用置信区间表示。区间估计(interval estimation)是从点估计值和抽样标准误出发,按给定的概率值建立包含待估计参数的区间。其中这个给定的概率值称为置信度或置信水平(confidence level),这个建立起来的包含待估计函数的区间称为置信区间,指总体参数值落在样本统计值某一区内的概率 置信
3、区间(confidence interval)是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。划定置信区间的两个数值分别称为置信下限(lower confidence limit,lcl)和置信上限(upper confidence limit,ucl)2.参数估计的基本原理 统计分析的目的就是由样本推断总体,参数估计即是实现这一目的的方法之一。3.参数估计的方法 参数估计的结果,常用点估计值(样本均值)+置信区间(置信下限、置信上限)来表示。三、实验内容与步骤 1.单个总体均值的区间估计 打开数据文件“描述性统计(100 名女大学生的血清蛋白含量).sav
4、”选择菜单【分析】【描述统计】【探索】”,打开图 3.1 探索(Explore)对话框。从源变量清单中将“血清蛋白含量”变量移入因变量列表(Dependent List)框中。SPSS在生物统计学中的应用实验指导手册 太原师范学院生物系生物技术专业内部使用参考资料 图 3.1 Explore 对话框 单击上图右方的“统计量”按钮打开“探索:统计量”对话框。在设置均值的置信水平,如键入 95,完成后单击“继续”按钮回到主窗口。图 3.2 探索 统计量设置窗口 返回主窗口点击“确定”运行操作。分析结果简单说明:表 3.1 描述统计量 Descriptive SPSS在生物统计学中的应用实验指导手册
5、 太原师范学院生物系生物技术专业内部使用参考资料 如上表显示。从上表“95 Confidence Interval for Mean”中可以得出,女大学生区间估计(置信度为95)为:(72.4932,74.0848),其中 lower Bound 表示置信区间的下限,Upper Bound 表示置信区间的上限。点估计是:73.2890。说明女大学生血清蛋白含量总体水平有平百分之九十五的机率落 72.4932g/L 和 74.0848g/L 之间,总体水平低于 72.4932g/L 和高于 74.0848g/L 的可能性小于百分之五。2两个总体均值之差的区间估计 【课本例 14-2】现有两组饲料
6、喂猪的料重比数据如下。饲料 A 3.08 2.73 3.03 2.95 2.21 3.03 2.86 3.13 2.59 2.89 饲料 B 3.43 3.04 3.37 3.29 2.46 3.37 3.19 2.89 3.49 要求对饲料 A 喂猪的平均料重比与饲料 B 喂猪的平均料重比之差进行区间估计,预设的置信度为 95。打开 SPSS,打开数据文件:“两组饲料喂猪的料重比数据.xls”。计算两总体均值之差的区间估计,采用“独立样本 T 检验”方法。选择菜单“【分析】【比较均值】【独立样本 T 检验】”,SPSS在生物统计学中的应用实验指导手册 太原师范学院生物系生物技术专业内部使用参
7、考资料 图 3.3 “独立样本 T 检验”菜单选择 打开“独立样本 T 检验”对话框。变量选择 (1)从源变量清单中将“料重比”变量移入检验变量框中。表示要求该变量的均值的区间估计。从源变量清单中将“饲料”变量移入分组变量框中。表示总体的分类变量。图 3.4 独立样本 T 检验 对话框 定义分组 单击定义组按钮,打开 Define Groups 对话框。在 Group1 中输入 A,在 Group2 中输入 B(A 表示饲料 A,B 表示饲料 B)。SPSS在生物统计学中的应用实验指导手册 太原师范学院生物系生物技术专业内部使用参考资料 图 3.5 定义组 define groups 设置窗口
8、 完成后单击“继续”按钮返回到“独立样本 T 检验”对话框。确定置信水平 单击“独立样本 T 检验”对话框右上方的“选项”按钮,弹出“独立样本 T 检验:选项”对话框,图 3.6 “独立样本 T 检验:选项”对话框 确定置信区间为 95%,单击“继续”按钮返回到“独立样本 T 检验”对话框。计算结果 单击“确定”按钮,输出结果如下图所示。(1)Group Statistics(分组统计量)表 分别给出不同总体下的样本容量、均值、标准差和平均标准误。从该表中可以看出,A 饲料的平均增重为 2.8500,B 饲料的平均增重为 3.1700。表 3.2 分组统计量 Group Statistics
9、(2)Independent Sample Test(独立样本 T 检验)表 表 3.3 独立样本 T 检验结果 方差齐性检验检验总体均值是否相等的t 检验 等方差假设SPSS在生物统计学中的应用实验指导手册 太原师范学院生物系生物技术专业内部使用参考资料 方差齐性检验检验总体均值是否相等的t 检验 等方差假设不等方差假设 结果说明,在当前抽样方式下,由样本均数差值-.32000(A饲料的平均增重2.8500与B饲料的平均增重3.1700之差。)估计两种饲料喂猪的总体增重水平差值有95%的可能性在-.61399与-.02601之间。T检验结果:方差同质性检验:F值为0.275,其概率P=0.6
10、700.05,表明两未知总体方差差异不显著,可按照等方差假设进行检验。(Levene检验统计量W服从自由度为 1=k-1,2=N-k的F分布。)检验:t 值为-2.296,其概率P=0.0350.05,表明B饲料增重效果显著地好于A饲料。置信区间为-.61399与-.02601,推断总体参数的差异为0的可能性很小。实验四:t 检验 一、实验目的与要求 1.理解 t 检验的基本原理和用途 2.熟练掌握 T 检验的 SPSS 操作 3.学会利用 T 检验方法解决身边的实际问题 二、实验原理 有三类 t 检验可用:独立样本 t 检验(双样本 t 检验)。利用成组设计获取样本数据,比较一个变量中两组个
11、案的均值,以推断两组个案所在总体的差异是否显著。提供了每组的描述统计和 Levene 方差相等性检验,以及相等和不等方差 t 值和均值差分的 95%置信区间。配对样本 t 检验(相关 t 检验)。利用配对设计获取成对样本数据,比较单个组的两个变量的均值。此检验还用于匹配对或个案控制研究设计。输出包括检验变量的描述统计、变量之间的相关性、配对差分的描述统计、t 检验和 95%置信区间。单样本 t 检验。将一个变量的均值与已知值或假设值进行比较。检验变量的描述统计随 t 检验一起显示。检验变量的均值和假设的检验值之间差的 95%置信区间是缺省输出的一部分。三、实验演示内容与步骤 独立样本 t 检验
12、 SPSS在生物统计学中的应用实验指导手册 太原师范学院生物系生物技术专业内部使用参考资料 在“实验三”内容里“2两个总体均值之差的区间估计”中,已完成独立样本 t 检验的操作,大家可重复其操作步骤,以熟练操作步骤。应记住独立样本 t 检验的数据结构,可在 SPSS 中创建数据文件,也可以在 EXCEL 中创建数据文件。独立样本 t 检验的重点在于先根据方差齐性检验的结果,确定方差的同质性,再选择 t 检验的结果。配对样本 t 检验 【课本例 5.7】在研究饮食中缺乏维生素 E 与肝中维生素 A 的关系时,将试验动物按性别、体重等配成 8 对,并将每对中的两头试验动物用随机分配法分配在正常饲料
13、组和维生素 E 缺乏组,然后将试验动物杀死,测定其肝中的维生素 A 的含量,其结果如下表,试检验两组饲料对试验动物肝脏中维生素 A 含量的作用是否有显著差异。正常 饲料组 3550 2000 3000 3950 3800 3750 3450 3050 维生素 E 缺乏组 2450 2400 1800 3200 3250 2700 2500 1750 打开 SPSS,打开数据文件:“课本 5.7 配对设计资料.xls”。选择菜单“【分析】【比较均值】【配对样本 T 检验】”,弹出“配对样本 T 检验”对话框,图 4.1 “配对样本 T 检验”菜单选择 SPSS在生物统计学中的应用实验指导手册 太
14、原师范学院生物系生物技术专业内部使用参考资料 图 4.2 “配对样本 T 检验”对话框 Paired-Samples T Tes 如图 4.2 所示,将两个配对变量移入右边的成对变量 Pair Variables 列表框中。移动的方法是先选择其中的一个配对变量,再选择第二个配对变量,接着单击中间的箭头按钮。选项按钮的用于设置置信度选项,这里保持系统默认的 95 在主对话框中单击 ok 按钮,执行操作。在输出视图中看分析结果 表 4.1 两组饲料饲养后样本肝中的维生素 A 的含量的描述统计量 表3.4给出了两组饲料饲养后样本肝中的维生素A 的含量的均值、标准差、均值标准误差。表 4.2 两种饲料
15、的相关系数 表3.5给出了两组饲料饲养后样本肝中的维生素A 的含量的相关系数。表4.3 配对样本t检验结果 SPSS在生物统计学中的应用实验指导手册 太原师范学院生物系生物技术专业内部使用参考资料 表 4.3 给出了配对样本 t 检验结果,包括配对变量差值的均值、标准差、均值标准误差以及差值的 95%置信度下的区间估计。当然也给出了最为重要的 t 统计量和 p 值。结果显示 p0.0040.01,表明,维生素 E 缺乏组肝中的维生素 A 的含量极显著地低于正常饲料组,造成肝中的维生素 A 的含量低的原因是饲料中缺乏维生素 E。置信区间为 355.821 与 1269.179,推断总体参数的差异
16、为 0 的可能性极小。单样本 t 检验(单个总体均值的假设检验)【课本例 5.1】按照规定,100g 罐头番茄汁中的平均维生素 C 含量不得少于 21mg/g,现从工厂的产品中随机抽取 17 个罐头,其 100g 番茄汁中的维生素 C 含量记录如下:维生素c含量 16 25 21 20 23 21 19 15 13 23 17 20 29 18 22 16 22,问这批罐头是否符合规定要求。打开 SPSS,打开数据文件:“课本例题 5.1 单样本 t 检验资料.xls”。判断检验类型 该例属于“小样本、总体标准差未知。假设形式为:H0:0,H1:0 判断分布类型 因不知道番茄汁中的平均维生素
17、C 含量是否服从正态分布,先按照“实验二 描述性统计:频率”的方法,对数据进行描述性统计。选择菜单“【分析】【描述统计】【频率】”。弹出如图 2.7 所示“频率”对话框,在“频率:统计量”、“频率:图表”、“频率:格式”三个对话框中选择“均值”、“标准差”、“方差”、“均值的标准误”、“偏度”、“峰度”、“直方图-带正态曲线”后,点击【继续】继续返回“频率”对话框,点击【确定】后,在弹出的“结果输出”视图中显示上述各项选择的对应结果如下:表4.4 描述统计:频率 SPSS在生物统计学中的应用实验指导手册 太原师范学院生物系生物技术专业内部使用参考资料 图 4.3 描述统计-频率-直方图 从表
18、4.4 和图 4.3 可知,茄汁中的平均维生素 C 含量是基本服从正态分布的,可以采用基于正态分布的 T 检验进行分析。软件程序操作 选择菜单“【分析】【比较均值】单样本 T 检验”,SPSS在生物统计学中的应用实验指导手册 太原师范学院生物系生物技术专业内部使用参考资料 图 4.4 “单样本 T 检验”菜单选择 弹出 One-Sample T Test 对话框。从源变量清单中将“维生素 C 含量”向右移入“检验变量 Test Variables”框中。图 4.5 “单样本 T 检验”对话框 one-sample T test 在“检验值 Test Value”框里输入一个指定值(即假设检验值
19、,本例中假设为 21),T 检验过程将对每个检验变量分别检验它们的平均值与这个指定数值相等的假设。“One-Sample T Test”窗口中“确定”按钮,输出结果如下表所示。(1)“One-Sample Statistics”(单个样本的统计量)表 分别给出样本的容量、均值、标准差和平均标准误。本例中,产品数量均值为 20.00。表 4.5 单样本统计量 One-Sample Statistics (2)“One-Sample Test”(单个样本的检验)表 表 4.6 单样本 T 检验结果 One-Sample Test 表中的 t 表示所计算的 T 检验统计量的数值,本例中为-1.035。表中的“df”,表示自由度,本例中为 16。表中的“Sig”(双尾T 检验),表示统计量的P-值,并与双尾T检验的显著性的大小进行比较:Sig.=0.3160.05,说明这批样本的平均维生素 C 含量与 21 无显著差异。表中的“Mean Difference”,表示均值差,即样本均值与检验值 21 之差,本例中为1.000。表中的“95 Confidence Internal of the Difference”,样本均值与检验值偏差的 95%置信区间为(-3.05,1.05),置信区间包括数值 0,推断总体参数的偏差接近于 0,产品符合要求。
限制150内