统计学——假设检验概念和方法ppt课件.ppt
第 6章 假设检验1 假设检验的基本问题假设检验的基本问题 2 一个正态总体参数的检验一个正态总体参数的检验3 两个正态总体参数的检验两个正态总体参数的检验4 假设检验中的其他问题假设检验中的其他问题假设检验在统计方法中的地位统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验学习目标1. 了解假设检验的基本思想了解假设检验的基本思想 2. 掌握假设检验的步骤掌握假设检验的步骤3. 对实际问题作假设检验对实际问题作假设检验4. 利用置信区间进行假设检验利用置信区间进行假设检验5. 利用利用P - 值进行假设检验值进行假设检验6.1 假设检验的基本问题1假设问题的提出假设问题的提出2假设的表达式假设的表达式3两类错误两类错误4假设检验中的值假设检验中的值5假设检验的另一种方法假设检验的另一种方法6单侧检验单侧检验让我们先看一个例子让我们先看一个例子.基本概念基本概念 生产流水线上罐装可生产流水线上罐装可乐不断地封装,然后装箱乐不断地封装,然后装箱外运外运. 怎么知道怎么知道这批罐装这批罐装可乐的容量是否合格可乐的容量是否合格呢?呢?罐装可乐的容量按标准应为罐装可乐的容量按标准应为355毫升毫升.基本概念基本概念 每隔一定时间,抽查若干罐每隔一定时间,抽查若干罐 . 如每隔如每隔1小时,小时,抽查抽查5罐,得罐,得5个容量的值个容量的值X1,X5,根,根据这些值来判断生产是否正常据这些值来判断生产是否正常.通常的办法是进行抽样检查通常的办法是进行抽样检查.基本概念基本概念根据样本的信息检验关于总体的某个命题根据样本的信息检验关于总体的某个命题是否正确是否正确.这类问题称作这类问题称作假设检验假设检验问题问题 .基本概念基本概念什么是假设?(hypothesis) 对总体参数的的数值所作的一种陈述 总体参数包括总体均值总体均值、比例比例、方差方差等 分析之前之前必需陈述什么是假设检验? (hypothesis testing)1. 事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2. 有参数假设检验和非参数假设检验3. 采用逻辑上的反证法,依据统计上的小概率原理假设检验的基本思想m m = 50假设检验的过程我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设! 别无选择别无选择.提出原假设和备择假设 什么是原假设?什么是原假设?(null hypothesis)1. 待检验的假设,又称“0假设”2. 研究者想收集证据予以反对的假设3. 总是有等号 , 或 4. 表示为 H0H0:m 某一数值 指定为 = 号,即 或 例如, H0:m 3190(克)为什么叫为什么叫 0 假设?假设?之所以用零来修饰原假设,其原因是原假设的内容总是没有差异或没有改变,或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等 什么是备择假设?什么是备择假设?(alternative hypothesis)1. 与原假设对立的假设,也称“研究假设”2. 研究者想收集证据予以支持的假设总是有不等号: , 或 3. 表示为 H1H1:m 某一数值,或m 某一数值例如, H1:m 3910(克),或m 3910(克) 什么检验统计量?什么检验统计量?1. 用于假设检验决策的统计量2. 选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知3. 检验统计量的基本形式为规定显著性水平(significant level) 什么显著性水平?什么显著性水平?1. 是一个概率值2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.104. 由研究者事先确定作出统计决策1. 计算检验的统计量2. 根据给定的显著性水平,查表得出相应的临界值z或z/2, t或t/23. 将检验统计量的值与 水平的临界值进行比较4. 得出拒绝或不拒绝原假设的结论假设检验中的小概率原理 什么小概率?什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定什么是小概率什么是小概率?概率是从0到1之间的一个数,因此小概率就应该是接近0的一个数著名的英国统计家Ronald Fisher 把20分之1作为标准,这也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的假设检验中的两类错误1. 第一类错误(弃真错误)第一类错误(弃真错误) 原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为 被称为显著性水平2. 第二类错误(取伪错误)第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为 (Beta)陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假接受接受H0正确决策正确决策(1 )第二类错第二类错误误( ()拒绝拒绝H0第一类错第一类错误误( ()正确决策正确决策(1-(1-) 错误和 错误的关系你不能同时减你不能同时减少两类错误少两类错误!影响 错误的因素1. 总体参数的真值 随着假设的总体参数的减少而增大2. 显著性水平 当 减少时增大3. 总体标准差 当 增大时增大4. 样本容量 n 当 n 减少时增大什么是P 值?(P-value)1. 是一个概率值2. 如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于大于等于检验统计量部分的面积3. 被称为观察到的(或实测的)显著性水平H0 能被拒绝的的最小值双侧检验的P 值左侧检验的P 值右侧检验的P 值利用 P 值进行检验(决策准则)1. 单侧检验若p-值 ,不拒绝 H0若p-值 , 拒绝 H02. 双侧检验若p-值 /2, 不拒绝 H0若p-值 /2, 拒绝 H0双侧检验与单侧检验 (假设的形式)假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0m m = m m0 0m m m m0 0m m m m0 0H1m m m m0 0m m m m0 0双侧检验(原假设与备择假设的确定)1. 属于决策中的假设检验决策中的假设检验2. 不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施3. 例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立4. 建立的原假设与备择假设应为 H0: m m 10 H1: m m 10双侧检验(显著性水平与拒绝域 ) /2 双侧检验(显著性水平与拒绝域) /2 双侧检验 (显著性水平与拒绝域) /2 双侧检验 (显著性水平与拒绝域) /2 单侧检验(原假设与备择假设的确定)1.将研究者想收集证据予以支持的假设作为备择假设H1例如,一个研究者总是想证明自己的研究结论是正确的一个销售商总是想正确供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致2.将研究者想收集证据证明其不正确的假设作为原假设H03.先确立备择假设H1单侧检验 (原假设与备择假设的确定)q 一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“”(寿命延长)建立的原假设与备择假设应为 H0: m m 1500 H1: m m 1500单侧检验 (原假设与备择假设的确定)q 一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立研究者总是想证明自己的研究结论(废品率降低)是正确的备择假设的方向为“”(废品率降低)建立的原假设与备择假设应为 H0: m m 2% H1: m m 2%单侧检验 (原假设与备择假设的确定)q 某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验检验权在销售商一方作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的 备择假设的方向为“ 1020 = 0.05n = 16临界值临界值(s):2 未知大样本均值的检验 (例题分析)【例【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准? (0.05)2 未知大样本均值的检验 (例题分析)H0: m m 1200H1: m m 1200 = 0.05n = 100临界值临界值(s):总体均值的检验 (2未知小样本)1. 假定条件 总体为正态分布 2未知,且小样本2. 使用t 统计量2 未知小样本均值的检验 (例题分析)【例【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。 2 未知小样本均值的检验 (例题分析)H0: m m = 5H1: m m 5 = 0.05df = 10 - 1 = 9临界值临界值(s):2 未知小样本均值的检验 (P 值的计算与应用)第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击,并在函数分类中点击“统 计” ,然后,在函数名的菜单中选择字符 “TDIST”,确定第3步:在弹出的X栏中录入计算出的t值3.16 在自由度(Deg-freedom)栏中录入9 在Tails栏中录入2,表明是双侧检验(单测 检验则在该栏内录入1) P值的结果为0.011550.025,拒绝H02 未知小样本均值的检验 (例题分析)【例【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05)均值的单尾 t 检验 (计算结果) H0: m m 40000H1: m m 40000 = 0.05df = 20 - 1 = 19临界值临界值(s):总体比例的检验(Z 检验)适用的数据类型离散数据离散数据 连续数据连续数据数值型数据数值型数据数数 据据品质数据品质数据一个总体比例检验1. 假定条件有两类结果总体服从二项分布可用正态分布来近似2. 比例检验的 Z 统计量一个总体比例的检验 (例题分析)【例【例】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?( = 0.05)一个总体比例的检验 (例题分析)H0: = 14.7%H1: 14.7% = 0.05n = 400临界值临界值(s):方差的卡方 (2) 检验1. 检验一个总体的方差或标准差2. 假设总体近似服从正态分布3. 检验统计量方差的卡方 (2) 检验(例题分析)【例【例】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分 别 进 行 测 定 ( 用 样 本 减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求 ( =0.05)0.3-0.4 -0.71.4-0.6-0.3 -1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5 -0.2 -1.9-0.51-0.2 -0.61.1方差的卡方 (2) 检验(例题分析)H0: 2 = 1H1: 2 1 = 0.05df = 25 - 1 = 24临界值临界值(s):6.3 两个正态总体参数的检验1检验统计量的确定检验统计量的确定2两个总体均值之差的检验两个总体均值之差的检验3两个总体比例之差的检验两个总体比例之差的检验4两个总体方差比的检验两个总体方差比的检验5检验中的匹配样本检验中的匹配样本两个正态总体参数的检验两个总体的检验两个总体的检验Z 检验检验(大样本大样本)t 检验检验(小样本小样本)t 检验检验(小样本小样本)Z 检验检验F 检验检验均值均值比例比例方差方差独立样本总体均值之差的检验两个独立样本之差的抽样分布 m m1 1总体总体1 2 m m2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2m m1- 1- m m2 2两个总体均值之差的检验 (12、 22 已知)1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布, 可以用正态分布来近似(n130和 n230)2.检验统计量为两个总体均值之差的检验 (假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异均值均值1 1 均值均值2 2均值均值1 1 均值均值2 2H0m m 1 m m2 = 0m m 1 m m2 0m m 1 m m2 0H1m m 1 m m2 0m m 1 m m2 0两个总体均值之差的检验 (例题分析) 两个总体均值之差的检验 (例题分析)H0: m m1 1- m m2 2 = 0H1: m m1 1- m m2 2 0 = 0.05n1 = 32,n2 = 40临界值临界值(s):两个总体均值之差的检验 (12、 22 未知且不相等,小样本)1.检验具有不等方差的两个总体的均值2.假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知且不相等12 223.检验统计量两个总体均值之差的检验 (12、 22 未知但相等,小样本)1.检验具有等方差的两个总体的均值2.假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等12 223.检验统计量两个总体均值之差的检验 (例题分析)两个总体均值之差的检验 (例题分析用统计量进行检验)H0: m m1 1- m m2 2 0H1: m m1 1- m m2 2 0 = 0.05n1 = 15,n2 = 20临界值临界值(s):两个总体均值之差的检验 (例题分析用R进行检验)第1步:选择“工具”下拉菜单,并选择“数据分析”选项第2步:选择“t检验,双样本异方差假设检验,双样本异方差假设”第3步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”的方框内键入0 在“”框内键入0.05 在“输出选项”中选择输出区域 选择确定 两个总体均值之差的检验(匹配样本的 t 检验)1. 检验两个总体的均值 配对或匹配 重复测量 (前/后)2. 假定条件 两个总体都服从正态分布 如果不服从正态分布,可用正态分布来近似 (n1 30 , n2 30 )匹配样本的 t 检验 (假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异总体总体1 1 总体总体2 2总体总体1 1 总体总体2 2H0m mD = 0m mD 0m mD 0H1m mD 0m mD 0匹配样本的 t 检验 (数据形式) 观察序号观察序号样本样本1 1样本样本2 2差值差值1x 11x 21D1 = x 11 - x 212x 12x 22D1 = x 12 - x 22M MM MM MM Mix 1ix 2iD1 = x 1i - x 2iM MM MM MM Mnx 1nx 2nD1 = x 1n- x 2n匹配样本的 t 检验(检验统计量)【例【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:匹配样本的 t 检验 (例题分析)训练前训练前94.5101110103.59788.596.5101104116.5训练后训练后8589.5101.5968680.58793.593102样本差值计算表样本差值计算表训练前训练前训练后训练后差值差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计合计98.5配对样本的 t 检验(例题分析)配对样本的 t 检验 (例题分析)H0: m m1 m m2 8.5H1: m m1 m m2 8.5 = 0.05df = 10 - 1 = 9临界值临界值(s):配对样本的 t 检验 (例题分析)配对样本的 t 检验 (例题分析用R进行检验)第第1步:步:选择“工具” 第第2步:步:选择“数据分析”选项第第3步:步:在分析工具中选择“t检验:平均值的成对二样本检验:平均值的成对二样本分析分析”第第4步:步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”方框内键入8.5 显著性水平保持默认值 用用R进行检验进行检验两个总体比例之差的检验1. 假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似2. 检验统计量两个总体比例之差的Z检验两个总体比例之差的检验(假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异比例比例1 1 比例比例2 2比例比例1 1 比例比例2 2H0P1P2 = 0P1P2 0P1P2 0H1P1P2 0P1P20两个总体比例之差的Z检验 (例题分析)两个总体比例之差的Z检验 (例题分析)H0: 1 1- 2 2 0H1: 1 1- 2 2 )3. 检验统计量F = S12 /S22F(n1 1 , n2 1)两个总体方差的 F 检验(临界值)0不能拒绝不能拒绝H0F拒绝拒绝H0) 1, 1(1) 1, 1(2121212-nnFnnF) 1, 1(2121-nnF拒绝拒绝 H0两个总体方差的 F 检验 (例题分析)0F6.4 假设检验中的其他问题1用置信区间进行检验用置信区间进行检验2单侧检验中假设的建立单侧检验中假设的建立用置信区间进行检验(双侧检验)1.求出双侧检验均值的置信区间用置信区间进行检验(单侧检验)1. 左侧检验:求出单边置信下限用置信区间进行检验 (例题分析) 用置信区间进行检验 (例题分析)H0: m m = 1000H1: m m 1000 = 0.05n = 49临界值临界值(s):本章小节1. 假设检验的概念和类型假设检验的概念和类型 2. 假设检验的过程假设检验的过程3. 基于一个样本的假设检验问题基于一个样本的假设检验问题4. 基于两个样本的假设检验问题基于两个样本的假设检验问题5. 用置信区间进行检验用置信区间进行检验6. 利用利用p - 值进行检验值进行检验