假设检验与样本数量分析④——单比率检验、双比率检验.pptx
《假设检验与样本数量分析④——单比率检验、双比率检验.pptx》由会员分享,可在线阅读,更多相关《假设检验与样本数量分析④——单比率检验、双比率检验.pptx(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、单比率检验 双比率检验假设检验与样本数量分析单比率检验、双比率检验 Four short words sum up what has lifted most successful individuals Four short words sum up what has lifted most successful individuals above the crowd: a little bit more. above the crowd: a little bit more. -author -author -date-date单比率检验 双比率检验预备知识预备知识总体研究的一类对象的全体组
2、成的集合。个体总体中的每一个考察的对象。样本从总体中抽出的一部分个体的集合。样本数量样本中包含的个体的数量。总体与样本总体与样本噢!这么多健身球,应该全是合格的吧从中抽出几个,测量一下。看看废品率。?我们通过样本来了解总体由样本信息作为总体信息估计值统计推断是由样本的信息来推测总体性能的一种方法。在通过样本获得一批数据后,要对总体的某一参数进行估计和检验。建立检验建立检验假设假设(如双侧检验)单样本例如,我们想了解一种健身球生产过程的不合格品率p p是否为p02%,通过对样本的测量获得一批数据,然后对健身球不合格品率p p进行推断,这是单样本检验的问题。H H :p p p0H H1 1: p
3、 p p0H H :p p 0.02H H1 1: p p 0.02不合格品率为2%不合格品率不不是2%单比率检验 双比率检验预备知识预备知识总体与样本总体与样本2种健身球生产过程的不合格品率应该一样吧,?我们通过2个样本来了解2个总体由样本信息推断2个总体相比是否有差异统计推断是由2个样本的信息来推测2个总体性能,推断特征相比是否有显著差异。建立检验建立检验假设假设(如双侧检验)双样本例如,直径为65cm的健身球,新研制出健身球2#生产成本较低,如果生产过程的不合格品率与原来的1#产品一致,则用2#产品替代1#产品。 通过对2个样本的测量获得两部分数据,然后对两种健身球(1#产品和2#产品)
4、的不合格品率进行是否存在差异进行推断(或推断1#产品的不合格品率是否大或小于2#产品的不合格品率),这是双样本比率检验的问题。健身球1#健身球2#样本间的差异是由抽样误差引起的样本与样本所代表的总体间存在显著差异不合格品率无差异 不合格品率有差异 H H :p p 1p p 2H H1 1: p p 1p p 2单比率检验 双比率检验预备知识预备知识P二项分布的概念 二项分布(binominal distribution) 是一种重要的离散型分布。 数据属于只有两个可能结果的独立实验的结果,一个表示希望的“事件”,另一个表示“非事件”(每一观察只具有相互独立的一种结果),如,通过与失败、合格与
5、报废、有效或无效、是或否、0 或 1等。 通常,1代表抽到不合格品,0代表抽到合格品。 总体不合格品比率记作 p,样本不合格品比率记作 其中n总体中随机抽取样本个数X出现不合格品数(X =0,1,2,3,n)nXP单比率检验 双比率检验二项二项分布 p=0.1,n=5 概率分布图 n=30n=50 n=100p=0.1p=0.1, n=30、50、100 二项分布的概率分布图形预备知识预备知识质量部门对一批 产品进行了检验,长期以来生产过程的不合格品率10%,检验员检测了5件产品(有放回抽样),求检验到的不合格品数。n = 总体中随机抽取样本个数X = 出现不合格品数xnpxpxCxXPnn)
6、1 ()(二项分布的概率不合格品数是0的概率050055)1.01(1.0)0(CXP=0.59049 不合格品数是1的概率151155)1 .01 (1 .0)1(CXP=0.32805 !) 1() 1(xxnnnCxn 同理计算不合格品数为2、3、4、5的概率X=012345p=0.59049 0.32805 0.07290.07290.00810.00810.000450.000450.000010.0000110nC0.590490.328050.07290.00810.000450.00001 n足够大,分布近似正态分布.单比率检验 双比率检验预备知识预备知识比率比率检验检验比率比
7、率检验检验单比率检验单比率检验1 Proportion-test一个总体双双比率检验比率检验2 Proportion-test精确检验 超几何分布两个总体 Z检验检验 正态近似检验精确检验二项分布Z检验检验正态近似检验 总体服从二项分布两个总体服从二项分布Z检验的适用条件:样本含量n足够大, 与 均大于5,此时样本率的分布近似正态分布,可利用正态分布的原理作Z检验。当两样本含量n1及n2足够大, 及 均大于5可根据正态分布原理,进行Z检验。 Z检验的适用条件:Pn)P1n()P-(1、Pn1111n)P-(1、Pn2222n单比率检验 双比率检验单比率检验单比率检验统计量统计量式中:式中:单比
8、率检验单比率检验1 Proportion-test双侧检验左侧检验右侧检验检验假设H H :p p0H H1 1:p p0H H :p p0H H1 1:pp0拒绝域| Z Z | Z1- a/2 Z Z Z a Z Z Z1- aP P值 决策P P值 拒绝H HnppppZ)1(000样本含量n足够大n :样本数 :样本的比率p0:比率参考值Z检验检验正态近似检验 样本比率 = xn其中x是观察到的”成功”数单比率用于根据样本数据对总体比率进行推断5Pn5)P1n(PP单比率检验 双比率检验 确定临界值H H1 1:p p0H H1 1:pp0双侧检验左侧检验右侧检验单比率检验单比率检验显
9、著性水平 与拒绝域 2=0.0252=0.025临界值临界值1-=95%拒绝零假设拒绝零假设不拒绝H0范围 Z1- a/2 Z a/2 = 0.05临界值1-=95%拒绝零假设不拒绝零假设 = 0.05 Z检验检验 正态近似检验 Z a = 0.05临界值1-=95% Z1- a 不拒绝零假设拒绝零假设Z 0.975 =1.96Z 0.025= -1.96Z 0.05= -1.645Z 0.95= 1.645 = 0.05 = 0.05 单比率检验 双比率检验假设检验的例子(假设检验的例子(16) 我们长园集团有个公司的一台注塑机加工某种电缆附件产品,长期以来生产过程的不合格品率p02%,估计
10、当前生产过程的不合格品率仍为2%。 随机抽取500个产品,测量得到不合格品数为9。建立检验假设给定显著水平 = 0.0512计算统计量3双侧检验双侧检验H H :p 0.02H H1 1:p 0.02n=500n=500 x x =9=9单比率检验单比率检验本例样本比率提供了总体比率的估计值样本比率 =xn =95000.018比率参考值p00.02(2%)1- p =0.982,500)02.01(02.002.0018.0= = -0.3194-0.3194nppppZ)1(000P单比率检验 双比率检验接上页如果| Z Z | =0.319 Z1- a/2 4用算得的统计量与相应的临界值
11、作比较则拒绝原假设;否则无法拒绝原假设。单比率检验单比率检验反查正态分布表(右尾概率)Z临界值为: Z 0.025=1.96Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.3121.90.0290.0280.0270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.02
12、00.0200.0190.0190.018 Z 0.025=1.96用算得的统计量与相应的临界值作比较 | Z Z | = 0.319 Z 0.025=1.965作出不拒绝零假设的统计结论即:当前生产过程的不合格品率仍为2%。 u 计算检验计算检验 P- 值值 Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.3121.90.0290.0280.0
13、270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018P(Z-0.31 或Z 0.31)= 0.378 2 = 0.756 P = P(Z -0.31 及 Z 0.31) = 0.378 2 = 0.756 P P= 0.748 = 0.05 按=0.05的水平无法拒绝零假设H0 H0 查正态分布表查不到| Z Z | =0.3194 P = P(Z -0.32 及 Z 0.32) = 0.374 2 = 0.748 P(Z -0.32 及 Z 0.32) = 0.37
14、4 2 = 0.748 | Z Z | 临界值、未落入拒绝域及P0.05是对应的见下页图示单比率检验 双比率检验接上页单比率检验单比率检验Z检验检验 正态近似检验 Z =1.96Z = -1.962=0.0252=0.025不拒绝零假设拒绝零假设拒绝零假设临界值临界值双侧检验示意图(显著性水平与拒绝域 )1 = 0.95 Z= 0.319Z= - 0.3192P= 0.3747 Z = - 0.319 Z = 0.3192P= 0.3747 P = P = 0.7494 | Z Z | 临界值则未落入拒绝域此处Z的绝对值=0.319小于临界值1.96样本观测值落在“不拒绝零假设”范围内 | Z
15、 Z | 临界值则P0.05(直观易见)此处Z的绝对值=0.319小于临界值1.96假设检验的P P值 = 0.7494 直观易见0.050.7494| Z Z | = 0.319P = 0.7494 单比率检验 双比率检验功效和样本数量分析功效和样本数量分析 评价检验功效假设检验的例子16,Z的绝对值=0.319小于临界值Z 0.025=1.96( P P值值= P = 0.7494 = 0.05 )出了不拒绝零假设的统计结论。 当H0 为假时正确否定它的概率 (p = 1 )双侧检验双侧检验Power = 1 ( 0.02-0.018+1.96 0.0063 ) /0.0059 +( 0.
16、02-0.018-1.96 0.0063 ) /0.0059 = 1 ( 2.4319 )+( -1.7539) = 0.0075 +0.03972 = 0.0472功效功效 Power Power = = 0.04720.0472双侧检验双侧检验单比率检验单比率检验500)02.01 (02.0)1 (00npppPower = 1 ( ) + ( )PPSZpp2/0 PPSZpp2/0 500)018.01 (018.0)1 (nppSp参考比率标准误样本比率标准误P将 P0 =0.02 、 =0.018 、Z /2 = 1.961.96(右尾概率分位数、当 = 0.05 ) = 0.0
17、063= 0.0059 及 p= 0.0063、Sp= 0.0059 代入上式 。 : 标准正态分布的累积分布函数z/2=upper /2 point of the standard normal distribution单比率检验 双比率检验 样本数量样本数量假设检验的例子16中,如果总体比率实际为 0.02 但在样本比率=0.018时,则检测到差异的可能性为 4 .72%如果我们仍然规定可以检测到的最小差值 =0.002,并希望功效 Power =0.9需要抽取产品样本多少个?将 Z /2 = Z 0.05/2 =1.96 、 Z = Z 0.1 =1.28及 P0 =0.02 、 =0.
18、018 代入上式双侧检验双侧检验容许差值越小,需要样本量越大。(为使差值符合选择,容许差值越小,需要样本量越大。(为使差值符合选择, 有时需主观规定)有时需主观规定)功效和样本数量分析功效和样本数量分析双侧检验双侧检验单比率检验单比率检验接上页210122/)sin2sin2()(PPZZnsin-1:反正弦P三角函数采用弧度计算公式中2112)018.0sin202.0sin2()28.196.1 (n2)13457.02141897.02(4976.10= 48882.71733需要抽取产品样本48883个单比率检验 双比率检验假设检验的例子(假设检验的例子(17) 我们有一个公司生产继电
19、保护装置,所在的主板生产中一次通过率只在97%。为了提高主板的一次通过率,六西格玛项目组对流程进行了改进。 为确定改进后主板的一次通过率是否97%。随机抽取800个产品,测量得到不合格品数为16。建立检验假设1单侧检验单侧检验(左)H H :p 0.03 H H1 1:p 0.03(希望被证明)单比率检验单比率检验n=800n=800 x x =16=16样本比率 =xn =168000.02比率参考值p00.03(3%)P本例用不合格品率计算5Pn5)P1n(可用正态近似检验 给定显著水平 = 0.052计算统计量3800)03.01(03.003.002.0= = -1.66-1.66np
20、pppZ)1(000用通过率计算结果是一样的,不合格率是小数值,一般会将小数值定义为p。单比率检验 双比率检验接上页如果| Z Z | =1.66 Z1- a 4用算得的统计量与相应的临界值作比较则拒绝原假设;否则无法拒绝原假设。单比率检验单比率检验反查正态分布表(右尾概率)Z临界值为:Z = Z 0.05 =1.64Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.
21、3190.3160.3121.50.067 0.066 0.064 0.063 0.062 0.061 0.059 0.058 0.057 0.056 1.60.055 0.054 0.053 0.052 0.051 0.049 0.048 0.047 0.046 0.046 Z 0.05=1.64用算得的统计量与相应的临界值作比较 | Z Z | = 1.66 Z 0.05=1.645作出拒绝零假设的统计结论:不合格品率 0.03即:改进后改进后主板的一次通过率主板的一次通过率97%97% u 计算检验计算检验 P- 值值 Z-Value0.000.010.020.030.040.050.0
22、60.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.3121.50.067 0.066 0.064 0.063 0.062 0.061 0.059 0.058 0.057 0.056 1.60.055 0.054 0.053 0.052 0.051 0.049 0.048 0.047 0.046 0.046 P(Z -1.66 ) = 0.048 P = P(Z -1.66 ) = 0.048P P= 0. 048
23、= 0.05 按=0.05的水平拒绝零假设H0 H0 查正态分布表查到| Z Z | =1.66| Z Z | 临界值、落入拒绝域及P0.05是对应的见下页图示单比率检验 双比率检验接上页单比率检验单比率检验Z检验检验 正态近似检验 =0.05拒绝零假设不不拒绝零假设左侧检验示意图(显著性水平与拒绝域 )1 = 0.95 P = 0.048 Z = - 0.319 Z = 0.3192P= 0.3747左侧检验 Z Z = -1.66 Z-1.64则落入拒绝域左侧检验 Z Z = -1.66 Z-1.64则P= 0.0480.05(直观易见)直观易见0.050.048Z= -1.66P(Z -
24、1.66 ) = 0.048临界值 Z = -1.64单比率检验 双比率检验功效和样本数量分析功效和样本数量分析 评价检验功效假设检验的例子17中,检验功效有多大? 当H0 为假时正确否定它的概率 (p = 1 )左侧检验左侧检验Power = ( 0.03-0.02-1.64 0.00603 ) /0.00495 = 0.022384 = =0.5089功效功效 Power Power = = 0.50890.5089(50. 89%)左侧检验左侧检验单比率检验单比率检验800)03.01 (03.0)1 (00npppPower = ( )PPSZpp 0800)02.01 (02.0)1
25、 (nppSp参考比率标准误样本比率标准误P将 P0 =0.03 、 =0.02 、Z = 1.641.64(右尾概率分位数、当 = 0.05 ) = = 0.00603= = 0.00495 及 p= 0.00603、Sp= 0.00495 代入上式 。z =one-sided critical value (upper point of the standard normal distribution)单比率检验 双比率检验 样本数量样本数量上页的例子中,检验功效 Power = 0.5089(50. 89%),如果我们仍然规定 =0.01差异可以检测到,并希望检测功效 Power =0.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验 样本 数量 分析 比率 检验
限制150内