《假设检验》PPT课件.ppt
2008-2009统计设计统计设计统统计计调调查查统统计计整整理理推推断断分分析析描描述述分分析析2008-2009假设检验在统计方法中的地位假设检验在统计方法中的地位统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验2008-2009学习目标假设检验的基本思想和原理假设检验的基本思想和原理 假设检验的步骤假设检验的步骤总体均值的检验总体均值的检验总体比例的检验总体比例的检验 P值的计算与应用值的计算与应用用用Excel进行检验进行检验2008-20096.1 假设检验的基本问题假设检验的基本问题v假设的陈述假设的陈述v两类错误与显著性水平两类错误与显著性水平v统计量与拒绝域统计量与拒绝域v利用利用P 值进行决策值进行决策2008-2009什么是假设?(hypothesis)对总体参数的具体数值所作对总体参数的具体数值所作的陈述的陈述总体参数包括总体均值总体均值、比例比例、方差方差等分析之前必需陈述我认为这种新药的疗效我认为这种新药的疗效比原有的药物更有效比原有的药物更有效! !v假设的陈述假设的陈述2008-2009什么是假设检验什么是假设检验?(hypothesis test)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理2008-2009原假设原假设(null hypothesis)研究者想收集证据予以反对的假设又称“0假设”总是有符号 , 或 表示为 H0H0 : = 某一数值 指定为符号 =, 或 例如, H0 : 10cm2008-2009研究者想收集证据予以支持的假设也称“研究假设”总是有符号 , 或 表示为 H1H1 : 某一数值,或 某一数值例如, H1 : 10cm,或 10cm备择假设备择假设(alternative hypothesis)2008-2009【例】【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设提出假设提出假设解:解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为 H0 : 10cm H1 : 10cm 2008-2009【例】【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设解:解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为H0 : 500 H1 : ”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)备择假设的方向为“”,称为右侧检验右侧检验 双侧检验与单侧检验双侧检验与单侧检验2008-2009假设的形式假设的形式假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : : = 0 0H0 : : 0 0H0 : : 0 0备择假设备择假设H1 : : 0 0H1 : : 0 02008-2009假设检验中的两类错误第第类错误类错误(弃真错误弃真错误)原假设为真时拒绝原假设第类错误的概率记为被称为显著性水平第第类错误类错误(取伪错误取伪错误)原假设为假时未拒绝原假设第类错误的概率记为 (Beta)v两类错误与显著性水平2008-2009H0:陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假未拒绝未拒绝H0正确决策正确决策(1 ) )第第类错类错误误( ( ) )拒绝拒绝H0第第类错类错误误( ( ) )正确决策正确决策(1-(1- ) )假设检验就好像假设检验就好像一场审判过程一场审判过程统计检验过程统计检验过程决策结果决策结果2008-2009 错误和 错误的关系 你不能同时减你不能同时减少两类错误少两类错误! !2008-2009影响 错误的因素1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平 当 减少时增大3.总体标准差 当 增大时增大4.样本容量 n当 n 减少时增大2008-2009显著性水平 (significant level)1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为 (alpha)常用的 值有0.01, 0.05, 0.104.由研究者事先确定2008-2009假设检验中的小概率原理假设检验中的小概率原理什么是小概率?什么是小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定2008-2009根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布 检验统计量检验统计量(test statistic)v统计量与拒绝域统计量与拒绝域点估计量假设值标准化检验统计量点估计量的抽样标准差标准化的检验统计量 2008-2009拒绝域拒绝域v能够拒绝原假设的检验统计量的所有可能取值的集合。v由显著性水平围成的区域。v如果检验统计量的具体数值落在了拒绝域内,就拒绝原假设,否则就不拒绝原假设。v根据给定的显著性水平确定的拒绝域的边界值,称为临界值。(查表所得)2008-2009显著性水平和拒绝域临界值临界值临界值临界值 /2 拒绝拒绝H0拒绝拒绝H0双侧检验 2008-20090临界值临界值临界值临界值 样本统计量样本统计量拒绝拒绝拒绝拒绝H0抽样分布抽样分布双侧检验双侧检验 2008-2009临界值临界值 样本统计量样本统计量拒绝拒绝置信水平置信水平2008-2009单侧检验单侧检验 临界值临界值拒绝拒绝H0抽样分布抽样分布置信水平置信水平2008-2009左侧检验左侧检验 临界值临界值样本统计量样本统计量拒绝拒绝抽样分布抽样分布置信水平置信水平观察到的样本统计量观察到的样本统计量2008-2009抽样分布抽样分布置信水平置信水平2008-2009右侧检验右侧检验 临界值临界值样本统计量样本统计量抽样分布抽样分布置信水平置信水平观察到的样本统计量观察到的样本统计量2008-2009临界值临界值样本统计量样本统计量抽样分布抽样分布置信水平置信水平2008-2009决策规则给定显著性水平,查表得出相应的临界值z或z/2, t或t/2将检验统计量的值与 水平的临界值进行比较作出决策双侧检验:I统计量I 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H02008-2009什么是P 值(P-value)在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率双侧检验为分布中两侧面积的总和反映实际观测到的数据与原假设H0之间不一致的程度被称为观察到的(或实测的)显著性水平决策规则:若p值, 拒绝 H0v利用利用P值值进行决策进行决策2008-2009双侧检验的双侧检验的P值值拒绝拒绝H0拒绝拒绝H0计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P 值值1/2P 值值1/21/22008-2009左侧检验的左侧检验的P值值抽样分布抽样分布置信水平置信水平计算出的样本统计量计算出的样本统计量P 值值2008-2009右侧检验的右侧检验的P值值临界值临界值拒绝拒绝H0抽样分布抽样分布置信水平置信水平计算出的样本统计量计算出的样本统计量P 值值2008-2009假设检验步骤的总结假设检验步骤的总结陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值值作出决策2008-20096.2 总体均值的检验总体均值的检验v大样本的检验方法大样本的检验方法v小样本的检验方法小样本的检验方法2008-2009一个总体参数的检验一个总体参数的检验z 检验检验(单尾和双尾单尾和双尾) t 检验检验(单尾和双尾单尾和双尾)z 检验检验(单尾和双尾单尾和双尾) 2 检验检验(单尾和双尾单尾和双尾)均值均值一个总体一个总体比例比例方差方差2008-2009总体均值的检验总体均值的检验(作出判断作出判断) 是否已是否已知知样本容量样本容量n 是否已是否已知知 t 检验检验0 xtsnz 检验检验0 xzsnz 检验检验 0 xznz 检验检验0 xzn2008-2009总体均值的检验(大样本)假定条件正态总体或非正态总体大样本(n30)使用z检验统计量 2 已知: 2 未知:v大样本的检验方法大样本的检验方法) 1 , 0(0Nnxz) 1 , 0(0Nnsxz2008-2009总体均值的检验总体均值的检验( 2 已知已知)【例】【例】一种罐装饮料采用自动生产 线 生 产 , 每 罐 的 容 量 是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?2008-2009由题已知由题已知H0 : = 255H1 : 255 = 0.05n = 40 =5 临界值临界值(c):检验统计量检验统计量: :00.025拒绝拒绝 H0拒绝拒绝 H00.025决策决策: :结论结论: : 不拒绝不拒绝样本提供的证据表明:该天生样本提供的证据表明:该天生产的饮料符合标准要求产的饮料符合标准要求 01. 14052558 .2550nxz2008-2009 用Excel计算P 值第第1步:步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第第2步:步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定第第3步:步:将 z 的绝对值1.01录入,得到的函数值为 0.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于,故不拒绝H02008-2009【例】【例】 ( 2 未知)未知) 一种机床加工的零件尺寸绝对平一种机床加工的零件尺寸绝对平均误差允许值为均误差允许值为1.35mm。生产。生产厂家现采用一种新的机床进行加厂家现采用一种新的机床进行加工以期进一步降低误差。为检验工以期进一步降低误差。为检验新机床加工的零件平均误差与旧新机床加工的零件平均误差与旧机床相比是否有显著降低,从某机床相比是否有显著降低,从某天生产的零件中随机抽取天生产的零件中随机抽取50个进个进行检验。利用这些样本数据,检行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降误差与旧机床相比是否有显著降低?低? ( =0.01) 左侧检验左侧检验50个零件尺寸的误差数据个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验总体均值的检验( 2 未知未知)2008-2009由题已知由题已知H0 : 1.35H1 : 1.35 = 0.01n = 50临界值临界值(c):检验统计量检验统计量: : 拒绝拒绝H0新机床加工的零件尺寸的平均误新机床加工的零件尺寸的平均误差与旧机床相比有显著降低差与旧机床相比有显著降低决策决策: :结论结论: :拒绝拒绝H06061. 250365749. 035. 13152. 1z2008-2009拒绝拒绝抽样分布抽样分布计算出的样本统计量计算出的样本统计量=-2.6061=-2.6061P 值值2008-2009用Excel计算P 值(z检验)第第1步:步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第第2步:步:在函数分类中点击“统计”,并在函数名的菜单下 选择 “ZTEST”,然后确定第第3步:步:在所出现的对话框Array框中,输入原始数据所 在区域 ;在X后输入参数的某一假定值(这里为 1.35);在Sigma后输入已知的总体标准差(若未 总体标准差未知则可忽略不填,系统将自动使用 样本标准差代替) 第第4步:步:用1减去得到的函数值0.995421023 即为P值 P值=1-0.995421023=0.004579 P值 5200 = 0.05n = 36临界值临界值(c):检验统计量检验统计量: : 拒绝拒绝H0改良后的新品种产量有显著提高改良后的新品种产量有显著提高 决策决策: :结论结论: :0拒绝拒绝H075. 33612052005275z2008-2009抽样分布抽样分布P = 0.0000881.645拒绝拒绝计算出的样本统计量计算出的样本统计量=3.75=3.75值值2008-2009总体均值(大样本)的检验方法的总结总体均值(大样本)的检验方法的总结假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : =0H1 : 0H0 : 0H1 : 0统计量统计量 已知: 未知:拒绝域拒绝域P值决策值决策拒绝H00 xzn0 xzsn2/zz zzzz P2008-2009总体均值的检验总体均值的检验 (小样本小样本)假定条件总体服从正态分布小样本(n 30)检验统计量 2 已知: 2 未知:v小样本的检验方法小样本的检验方法) 1 , 0(0Nnxz) 1(0ntnsxt2008-2009总体均值(总体均值(小小样本)检验方法的总结样本)检验方法的总结假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : =0H1 : 0H0 : 0H1 : 0统计量统计量 已知: 未知:拒绝域拒绝域P值决策值决策拒绝H00 xzn0 xtsn) 1(2/ntt) 1( ntt) 1( nttP注注: 已知的拒绝域同大样本已知的拒绝域同大样本2008-2009 【例】【例】 一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求? 10个零件尺寸的长度个零件尺寸的长度 (cm)12.210.812.011.811.912.411.312.212.012.32008-2009由题已知由题已知H0 : = 12H1 : 12 = 0.05df = 10 - 1 = 9临界值临界值(c):检验统计量检验统计量: : 不拒绝不拒绝H0该供货商提供的零件符合要求该供货商提供的零件符合要求 决策:决策:结论:结论:t02.262-2.2620.025拒绝拒绝拒绝拒绝 H00.0257035. 0104932. 01289.11t2008-2009用Excel计算P 值(t 检验)第第1步:步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第第2步:步:在函数分类中点击“统计”,并在函数名的菜单 下选择“TDIST”,然后确定第第3步:步:在出现对话框的X栏中输入计算出的t的绝对值 0.7053,在Deg-freedom(自由度)栏中输入 本例的自由度9,在Tails栏中输入2(表明是双 侧检验,如果是单侧检验则在该栏输入1) 第第4步:步:P值=0.498469786 P值=0.05,故不拒绝H0 2008-20096.3 总体比例的检验总体比例的检验v大样本的检验方法大样本的检验方法2008-2009总体比例检验总体比例检验假定条件总体服从二项分布可用正态分布来近似(大样本)检验的z 统计量 0 0为假设的总体比例为假设的总体比例) 1 , 0()1 (000Nnpz2008-2009总体比例检验检验方法的总结总体比例检验检验方法的总结假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0: = 0H1: 0H0 : 0H1 : 0统计量统计量拒绝域拒绝域P值决策值决策拒绝H0P2/zz zzzz npz)1(0002008-2009【例】【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平 =0.05和 =0.01 ,检验该杂志读者群中女性的比例是否为80%?它们的值各是多少?双侧检验2008-2009H0 : = 80%H1 : 80% = 0.05n = 200临界值临界值(c):检验统计量检验统计量: :拒绝H0 (P = 0.013328 = 0.01)该杂志的说法属实 决策决策: :结论结论: :拒绝 H0拒绝 H0475. 2200)80. 01 (80. 080. 073. 0z2008-2009本章小节假设检验的基本问题假设检验的基本问题 总体均值的检验总体均值的检验总体比例的检验总体比例的检验用用Excel进行检验进行检验利用利用p值进行检验值进行检验