《显著性检验》PPT课件.ppt
总体总体总体总体样本样本样本样本样本样本样本样本样本样本抽样抽样分布分布统计统计推断推断图图 抽样分布与统计推断的关系抽样分布与统计推断的关系第四章第四章 显著性检验显著性检验统计推断统计推断假设检验假设检验参数估计参数估计显著性检验显著性检验点估计点估计区间估计区间估计t,u,F,2检验检验第一节第一节 显著性检验基本原理显著性检验基本原理第二节第二节 单个样本平均数的显著性检验单个样本平均数的显著性检验第三节第三节 两个样本平均数差异的显著性检验两个样本平均数差异的显著性检验第四节第四节 百分数资料的显著性检验百分数资料的显著性检验率五节率五节 参数的区间估计参数的区间估计本章主要内容及难点本章主要内容及难点1.1.首先介绍显著性检验的基本原理和步骤首先介绍显著性检验的基本原理和步骤;2.2.其次介绍显著水平、两类错误、一尾检验、其次介绍显著水平、两类错误、一尾检验、两尾检验的概念;两尾检验的概念;3.3.单个样本平均数的单个样本平均数的t t检验检验4.4.配对资料配对资料t t检验,非配对资料检验,非配对资料t t检验检验5.5.百分数资料的百分数资料的u u检验检验难点:显著性检验基本原理理解,难点:显著性检验基本原理理解,t t检验、检验、u u检验的使用条件。检验的使用条件。第一节第一节第一节第一节 显著性检验显著性检验显著性检验显著性检验的基本原理的基本原理的基本原理的基本原理一、显著性检验的意义一、显著性检验的意义一、显著性检验的意义一、显著性检验的意义显显著著性性检检验验的的意意义义在在于于:区区分分样样本本统统计计数数与与所所在在总总体体参参数数的的差差异异是是由由试试验验误误差差引起,还是二者本质不同。引起,还是二者本质不同。例例如如,大大豆豆籽籽粒粒蛋蛋白白质质含含量量高高于于45%(45%(记记为为0 0)的的品品种种为为高高蛋蛋白白品品种种。某某种种子子公公司司对对一一大大豆豆新新品品种种随随机机抽抽取取5 5个个样样品品进进行行测测定定,得得平平均均蛋蛋白白质质含含量量为为 ,。我我们们能能否否根根据据1.5%1.5%就就认认定定该该大大豆豆新新品品种种就就是是高高蛋蛋白白品种?品种?不一定。不一定。真实差异真实差异表面差异表面差异 虽虽然然真真实实差差异异(0 0)不不能能计计算算,但但表表面面差差异异(0 0)可可以以计计算算,试试验验误误差差也也可可以以用用数数理理统统计计方方法法估估计计。所所以以可可将将表表面面差差异异与试验误差比较间接推断真实差异是否存在。与试验误差比较间接推断真实差异是否存在。如如果果(0 0)=0=0,我我们们就就说说真真实实差差异异不存在;不存在;如如果果(0 0)00,我我们们就就说说真真实实差差异异存在。这就是显著性检验的基本思想。存在。这就是显著性检验的基本思想。又又如如,某某地地做做了了两两个个水水稻稻品品种种对对比比试试验验,在在相相同同条条件件下下,两两个个水水稻稻品品种种分分别别种种植植1010个个小区,获得两个水稻品种的平均产量为小区,获得两个水稻品种的平均产量为 =510 =510/666.7/666.7、=500 =500/666.7/666.7。=10=10/666.7/666.7。仅仅凭凭这这个个表表面面差差值值我我们们照照样样不不能能判判断断两两个个水水稻稻品品种种生生产产潜潜力力本本质上不同。质上不同。于是于是表面差异表面差异真实差异真实差异试验误差试验误差 同同样样真真实实差差异异(1 12 2)不不能能计计算算,但但表表面面差差异异()可可以以计计算算,试试验验误误差差也也可可以以用用数数理理统统计计方方法法估估计计。所所以以可可将将表表面面差差异异与与试验误差比较间接推断真实差异是否存在。试验误差比较间接推断真实差异是否存在。如如果果(1 12 2)=0=0,我我们们就就说说真真实实差差异异不存在;不存在;如如果果(1 12 2)00,我我们们就就说说真真实实差差异存在。异存在。统计假设测验的意义用简式表示为统计假设测验的意义用简式表示为 (0)00?由由 推断推断 ()120?二、显著性检验的步骤二、显著性检验的步骤二、显著性检验的步骤二、显著性检验的步骤 【例例4141】已已知知某某品品种种玉玉米米单单穗穗重重x xN N(300300,9.59.52 2),即即单单穗穗重重总总体体平平均均数数300g300g,标标准准差差9.5g9.5g。种种植植过过程程喷喷洒洒了了增增产产素素,随随机机抽抽取取9 9个个果果穗穗,测测得得平平均均单单穗穗重重308g308g,问问这这种种增增产产素素对对该该品品种种玉玉米米的的平平均均单单穗穗重重有有无无真真实实影影响响?(一一)提提出出假假设设 对对样样本本所所在在总总体体作作一一个个假假设设。假假设设喷喷洒洒增增产产素素的的玉玉米米单单穗穗重重总总体体平平均均数数与与原原玉玉米米单单穗穗重重总总体体平平均均数数0 0之之间间没没有有真真实实差差异异,记记为为H H0 0:或或 。也也就就是是假假设设表表面面差差异异()全全由由抽抽样样误误差差造造 成成。这这 个个 假假 设设 叫叫 无无 效效 假假 设设(null null hypothesishypothesis)。与与 此此 对对 应应 的的 还还 有有 一一 个个 备备 择择 假假 设设(alternative(alternative hypothesis)hypothesis)。备备择择假假设设是是在在无无效效假假设设被被否否定定时时,准准备备接接受受的的假假设设,记记为为 H HA A:或或 。具具体体到到这这个个例例子子,备备择择假假设设意意味味着着喷喷洒洒增增产产素素的的玉玉米米单单穗穗重重总总体体平平均均数数与与原原来来的的玉玉米米单单穗穗重重总总体体平平均均数数0 0之之间间存存在在真真实实差差异。异。(二二)计计算算概概率率 在在无无效效假假设设成成立立前前提提下下,根根据据所所检检验验的的统统计计数数的的抽抽样样分分布布规规律律,计计算算表表面面差差异异()全全由由抽抽样样误误差差造造成成的的概概率率有有多多大大。也也就就是是计计算无效假设成立这个事件的概率有多大。算无效假设成立这个事件的概率有多大。本本例例是是在在无无效效假假设设H H0 0:成成立立的的前前提提下下,研研究究从从N N(300300,9.59.52 2)总总体体中中以以n=9n=9抽抽样样所所得得样样本本平平均均数数 的的分分布布。由由抽抽样样分分布结论知:布结论知:本例本例 那么那么u=2.526u=2.526的概率是多少?的概率是多少?因为因为 (u(u0.050.05=1.96)=1.96)(u(u2.526)2.526)(u(u0.010.01=2.58)=2.58)所所以以,这这个个u u值值的的概概率率为为:0.01:0.01p p0.050.05,说说明明我我们们所所作作的的无无效效假假设设H H0 0:成成立立的的可可能能性性在在1%1%与与5%5%之之间间,也也即即表表面面差差异异()全全由由抽样误差造成的概率在抽样误差造成的概率在0.010.010.050.05之间。之间。(三三)统统计计推推断断 根根据据小小概概率率原原理理作作出出否否定定或不能否定无效假设的推断。或不能否定无效假设的推断。若若随随机机事事件件的的概概率率很很小小,例例如如小小于于0.050.05,0.010.01,0.0010.001,称之为小概率事件。,称之为小概率事件。在在统统计计学学上上,把把小小概概率率事事件件在在一一次次试试验验中中看看成成是是实实际际不不可可能能发发生生的的事事件件,称称为为小小概概率事件实际不可能原理率事件实际不可能原理。如如果果把把0.050.05作作为为判判定定小小概概率率事事件件的的标标准准,那那么么本本例例所所作作的的无无效效假假设设是是一一个个小小概概率率事事件件。它它在在一一次次抽抽样样中中实实际际不不可可能能发发生生,因因而而否否定定H H0 0:=0 0,接接受受H HA A:0 0,认认为为这这个个样样本本所所在在的的总总体体与与原原总总体体存存在在真真实实差差异异。即即喷喷施施增增产产素素对对这这个个玉玉米米品品种种的的平平均均单单穗穗重重有有真真实影响,它能使玉米的穗重增加。实影响,它能使玉米的穗重增加。这这种种利利用用u u分分布布计计算算概概率率进进行行的的假假设设检检验称为验称为u u检验。检验。三、显著水平与两类错误三、显著水平与两类错误三、显著水平与两类错误三、显著水平与两类错误 (一一)显显著著水水平平(significant significant levellevel)用用来来判判定定小小概概率率事事件件的的概概率率标标准准叫叫显显著著水水平平,记作记作。在在生生物物学学研研究究中中常常取取=0.05=0.05、0.010.01。到到底底选选用用哪哪种种显显著著水水平平,要要根根据据试试验验要要求求或或试验结论的重要性而定。试验结论的重要性而定。对对u u检检验验,若若uu1.961.96,说说明明试试验验的的表表面面差差异异属属于于试试验验误误差差的的概概率率 p p0.050.05,即即表表面面差差异异属属于于试试验验误误差差的的可可能能性性大大。统统计计学学上上把把这这一一检检验验结结果果表表述述为为:“总体平均数总体平均数与与0 0差异不显著差异不显著”;若若1.96|u|1.96|u|2.582.58,则说明试验的,则说明试验的表面差异属于试验误差的概率表面差异属于试验误差的概率p p在在0.010.010.050.05之间,即之间,即0.010.01pp0.050.05,表面差异,表面差异属于试验误差的可能性较小。统计学上属于试验误差的可能性较小。统计学上把这一检验结果表述为:把这一检验结果表述为:“总体平均数总体平均数与与0 0差异显著差异显著”,u u值右上方标记值右上方标记 *;若若|u|2.58|u|2.58,则则说说明明试试验验的的表表面面差差异异属属于于试试验验误误差差的的概概率率p p不不超超过过 0.01 0.01,即即p p 0.010.01,表表面面差差异异属属于于试试验验误误差差的的可可能能性性更更小小。统统计计上上把把这这一一检检验验结结果果表表述述为为:“总总体体平平均均数数与与0 0差差异异极极显显著著”,U U值值右右上方标记上方标记*。假设检验的几何意义:假设检验的几何意义:接受区域接受区域(u)u 0 u u否定区域否定区域 (二二)两类错误两类错误 显著性检验可能出现两种类型的错误:显著性检验可能出现两种类型的错误:型型错错误误又又称称为为错错误误,本本来来无无效效假假设设H H0 0正正确确,但但检检验验结结果果却却否否定定H H0 0。就就是是把把试试验验误误差当成真实差异。差当成真实差异。犯犯型型错错误误的的原原因因是是根根据据小小概概率率原原理理否否定无效假设造成的。定无效假设造成的。例例如如140140行行水水稻稻产产量量一一例例,假假如如把把它它们们当当成成一一个个有有限限总总体体,且且服服从从正正态态分分布布。每每个个观观察察值值是是一一个个样样本本,则则距距平平均均数数1.961.96范范围围内内观观察察值值占占95%,95%,大大于于这这个个范范围围以以外外,占占5%5%,处处在在正正态态分分布布的的两两尾尾。如如果果从从这这个个总总体体抽抽样样,抽抽到到范范围围外外的的观观察察值值几几率率较较小小,只只有有5%5%,但但它它仍仍是是这这个个总总体体的的样样本本。现现在在我我们们根根据据小小概概率率原原理理否否定定了了它它是是这这个个总总体体的的样样本本,犯犯的的这这个个错错误误叫叫型错误,概率不超过型错误,概率不超过5%5%。又又如如我我们们在在做做新新品品种种与与原原品品种种的的比比较较试试验验中中,无无效效假假设设是是新新品品种种不不增增产产,备备择择假假设设是是新新品品种种增增产产。=0.05=0.05,通通过过样样本本信信息息和和在在无无效效假假设设前前提提下下,计计算算的的概概率率小小于于0.050.05,则则否否定定无无效效假假设设,如如果果概概率率为为10%10%,则则不不能能否否定定无无效效假假设设,但但是是新新品品种种不不增增产产的的概概率率也也只只有有10%10%,增增产产的的可可能能性性为为90%90%,实实际际应应用用中中,人人们们把把没没有有充充分分理理由由否否定定的的无无效效假假设设认认可可为为接接受受,那那么么接接受受这这个个无无效效假假设设就就有有可可能能犯犯型型错错误误,犯犯型型错误的概率在本例为错误的概率在本例为10%10%。型错误又称型错误又称错误错误,本来无效假设,本来无效假设H H0 0是错误的是错误的,但检验结果却接受但检验结果却接受H H0 0。就是把。就是把真实差异当成试验误差。真实差异当成试验误差。犯犯型错误,一般是随着型错误,一般是随着 的减小或试验误差的增大而增大。犯的减小或试验误差的增大而增大。犯型型错误的原因是原假设下的抽样分布与真实错误的原因是原假设下的抽样分布与真实分布发生部分重叠。分布发生部分重叠。为为了了降降低低犯犯两两类类错错误误的的概概率率,一一般般从从选选取取适适当当的的显显著著水水平平和和增增加加试试验验重复次数重复次数n n来考虑。来考虑。四、两尾检验与一尾检验四、两尾检验与一尾检验四、两尾检验与一尾检验四、两尾检验与一尾检验 两两尾尾检检验验:对对应应于于无无效效假假设设H H0 0:的的备备择择假假设设为为H HA A:。在在水水平平上上的的否否定定域域为为 和和 ,对对称称地地分分配配在在u u分分布布曲曲线线的的两两侧侧尾尾部部 ,每每侧侧尾尾部部的的概概率率为为/2/2。u u为为水平两尾检验的临界水平两尾检验的临界u u值。值。两两尾尾检检验验的的目目的的在在于于判判断断与与0 0有有无无显显著著差差异异,而而不不考考虑虑与与0 0谁谁大大谁谁小小。这这种种利利用用两尾概率进行的假设检验称两尾检验。两尾概率进行的假设检验称两尾检验。接受区域接受区域 95%否定区域否定区域 2.5%否定区域否定区域2.5%-uaua图图4.14.1 =0.05时时 HA:0的的HA接受区和否定区接受区和否定区 一尾检验:对应于无效假设一尾检验:对应于无效假设H H0 0:0 0的备择假设为的备择假设为H HA A:0 0(或(或H HA A:0 0)。)。这时否定域位于这时否定域位于u u分布曲线的右尾分布曲线的右尾(或左尾或左尾),即即 或或 )。)。例如例如 ,当当 =0.05=0.05 时时 ,否定域为否定域为 (或或 ),u u为为一一尾尾检检验验的的临临界界u u值值。这这种种利利用用一一尾尾概概率率进进行行的的假设检验称一尾检验。假设检验称一尾检验。图图a=0.05,a=0.05,H H0 0:=0;H;HA A:0 00.95=0.05接受区否定区=0.05否定区接受区0.95图图b b=0.05,H0:=0;H HA A:0 0 五、显著性检验应注意的问题五、显著性检验应注意的问题五、显著性检验应注意的问题五、显著性检验应注意的问题 1 1、要要有有合合理理的的试试验验设设计计和和准准确确的的试试验验操操作作,避避免免系系统统误误差差、降降低低试试验验误误差,提高试验的准确性和精确性。差,提高试验的准确性和精确性。2 2、选用的显著性检验方法要符合选用的显著性检验方法要符合其应用条件。其应用条件。3 3、选用合理的统计假设。选用合理的统计假设。4 4、正确理解显著性检验结论的统计意义。正确理解显著性检验结论的统计意义。5 5、统计分析结论的应用,还要与经济效益、统计分析结论的应用,还要与经济效益 等结合起来综合考虑。等结合起来综合考虑。第二节第二节第二节第二节 样本平均数与总体平均数样本平均数与总体平均数样本平均数与总体平均数样本平均数与总体平均数 差异显著性检验差异显著性检验差异显著性检验差异显著性检验一、总体方差一、总体方差一、总体方差一、总体方差2 2 2 2已知或已知或已知或已知或2 2 2 2虽未知但虽未知但虽未知但虽未知但 样本容量样本容量样本容量样本容量n n n n相当大,用相当大,用相当大,用相当大,用u u u u检验法。检验法。检验法。检验法。【例例4242】糯糯玉玉米米良良种种苏苏玉玉糯糯1 1号号的的鲜鲜果果穗穗重重x xN N(216.5(216.5,45.22)45.22)。现现引引进进一一高高产产品品种种奥奥玉玉特特1 1号号,在在8 8个个小小区区种种植植,得得其其鲜鲜果果穗穗重重为为:255.0255.0185.0185.0252.0252.0290.0290.0159.9 159.9 190.0190.0212.7212.7 278.5278.5(g g),问问新新引引入入品品种种鲜果穗重与苏玉糯鲜果穗重与苏玉糯1 1号有无显著差异?号有无显著差异?1 1、提出假设、提出假设H H0 0:0 0 216.5g216.5g,即新引入品种鲜果,即新引入品种鲜果穗重与苏玉糯穗重与苏玉糯1 1号鲜果穗重相同;号鲜果穗重相同;H HA A:216.5g216.5g,即新引入品种鲜果,即新引入品种鲜果穗重与苏玉糯穗重与苏玉糯1 1号鲜果穗重不相同。号鲜果穗重不相同。2 2、计算、计算u u值值 3 3、统计推断、统计推断 由于计算所得的由于计算所得的u uu u0.050.05=1.96=1.96,故,故p p 0.050.05。不能否定。不能否定H H0 0:=0 0=216.5g=216.5g,表明新,表明新引入品种鲜果穗重与苏玉糯引入品种鲜果穗重与苏玉糯1 1号鲜果穗重差异号鲜果穗重差异不显著,可以认为新引入品种鲜果穗重与苏玉不显著,可以认为新引入品种鲜果穗重与苏玉糯糯1 1号鲜果穗重相同。号鲜果穗重相同。【例例4343】晚晚稻稻良良种种汕汕优优6363的的千千粒粒重重0 027.5g27.5g。现现育育成成一一高高产产品品种种协协优优辐辐819819,在在9 9个个小小区区种种植植,得得千千粒粒重重为为:32.532.5、28.628.6、28.428.4、24.724.7、29.129.1、27.227.2、29.829.8、33.333.3、29.729.7(g g),试试问问新新育育成成品品种种的的千千粒粒重与汕优重与汕优6363有无显著差异?有无显著差异?二、总体方差二、总体方差二、总体方差二、总体方差2 2 2 2为未知、且为小样本为未知、且为小样本为未知、且为小样本为未知、且为小样本 (n n n n 30 30 30 30),用),用),用),用t t t t检验法检验法检验法检验法 本例本例,由于总体方差未知,又是小样由于总体方差未知,又是小样本,故采用本,故采用t t检验法。其步骤如下:检验法。其步骤如下:1 1、提出假设、提出假设H H0 0:0 027.5g27.5g,即新育成品种千粒重,即新育成品种千粒重与当地良种汕优与当地良种汕优6363的千粒重相同。的千粒重相同。H HA A:27.5g27.5g,即新育成品种千粒重与当,即新育成品种千粒重与当地良种汕优地良种汕优6363的千粒重不相同。的千粒重不相同。2 2、计算、计算t t值值 3 3、统计推断、统计推断 由由df=8df=8查查临临界界t t值值,得得:t t0.05(8)0.05(8)=2.306=2.306,计计算算所所得得的的|t|t|t|t0.05(8)0.05(8),故故p p0.05 0.05,不不能能否否定定H H0 0:27.5g27.5g,表表明明新新育育成成品品种种千千粒粒重重与与当当地地良良种种汕汕优优6363的的千千粒粒重重差差异异不不显显著著,可可以以认认为为新新育育成成品品种种千千粒粒重重与与当当地地良良种种汕汕优优6363的的千千粒粒重相同。重相同。第三节第三节第三节第三节 两个样本平均数差异两个样本平均数差异两个样本平均数差异两个样本平均数差异显著性检验显著性检验显著性检验显著性检验 一、非配对设计两个样本平均数一、非配对设计两个样本平均数一、非配对设计两个样本平均数一、非配对设计两个样本平均数 差异显著性检验差异显著性检验差异显著性检验差异显著性检验 非非配配对对设设计计是是将将试试验验单单位位完完全全随随机机地地分分为为两两组组,然然后后再再随随机机地地对对两两组组分分别别实实施施两两种种不不同同处处理理;两两组组试试验验单单位位相相互互独独立立,所所得得观观测测值值相相互互独独立立;两两个个处处理理的的样样本本容容量量可可以以相相等等,也也可可以以不不相相等等,所所得得数数据据称称为非配对数据为非配对数据(也称成组数据也称成组数据)。(一一)两两个个样样本本的的总总体体方方差差1 12 2和和2 22 2已已知知或或总总体体方方差差1 12 2和和2 22 2未未知知,但但为为大大样样本时,用本时,用u u检验法。检验法。u u值的计算公式为:值的计算公式为:均数差数标准误计算公式为:均数差数标准误计算公式为:【例例4444】已已知知优优质质早早稻稻佳佳辐辐占占小小区区产产量量的的2 21.351.35。现现用用A A、B B两两种种方方法法抽抽样样,A A法法取取1515(n(n1 1)个个样样点点,得得小小区区产产量量 7.69kg7.69kg;B B法法取取9 9(n(n2 2)个个样样点点,得得小小区区产产量量 8.77kg8.77kg。问问A A、B B两种取样方法的小区产量差异是否显著?两种取样方法的小区产量差异是否显著?1 1、提出假设、提出假设 H H0 0:1 12 2;即即A A、B B两种取样法的小两种取样法的小区产量相同;区产量相同;H HA A:1 12 2;即即A A、B B两种取样法的小两种取样法的小区产量不相同。区产量不相同。显著水平为显著水平为0.050.05。2 2、计算、计算u u值值已知已知 ,n n1 11515,n n2 29 9 3 3、统计推断、统计推断 因为计算所得的因为计算所得的|u|u|介于介于u u0.050.05=1.96=1.96与与u u0.010.01=2.58=2.58之间,故之间,故0.010.01p p0.05 0.05,否,否定定H H0 0:1 1=2 2,接受,接受 H HA A:1 12 2,即,即A A、B B 两种取样方法所得的小区产量差异两种取样方法所得的小区产量差异显著。显著。(二二)在两个样本的总体方差在两个样本的总体方差1 12 2和和2 22 2未知、但未知、但 ,且为小样本时,且为小样本时,用用t t 检验法。检验法。又又在在H0:1 1=2 2前前提提下下,意意味味着着两两样样本本来来自自同同一一总总体体,因因而而可可将将样样本本合合并并,计计算算样样本本合合并并均均方方估估计计总总体体方方差差。且且统统计计学学已已证证明明,合并均方是总体方差的无偏估计。合并均方是总体方差的无偏估计。【例【例4545】测得马铃薯两个品种鲁引测得马铃薯两个品种鲁引1 1号和大西洋的块茎干物质含量号和大西洋的块茎干物质含量 (%)结果)结果如下表所示。试检验两个品种的块茎干物如下表所示。试检验两个品种的块茎干物质含量有无显著差异。质含量有无显著差异。鲁引鲁引1号号18.68 20.67 18.42 18.00 17.44 15.95 大西洋大西洋18.68 23.22 21.42 19.00 18.921 1、提出假设、提出假设H H0 0:1 12 2,即两个马铃薯品种的块茎干,即两个马铃薯品种的块茎干物质含量相同;物质含量相同;H HA A:1 12 2,即两个马铃薯品种的块茎干,即两个马铃薯品种的块茎干物质含量不相同。物质含量不相同。2 2、计算、计算t t值值 本例本例 3 3、统计推断、统计推断 根据根据dfdf9 9,查附表,查附表3 3得:得:t t0.05(9)0.05(9)=2.262=2.262,因为计算得的,因为计算得的|t|t|1.9261.926t t0.05(9)0.05(9)=2.262=2.262,故,故p p 0.050.05,不能否定,不能否定H H0 0:1 12 2,表明两个马铃薯品种的块,表明两个马铃薯品种的块茎干物质含量差异不显著,可以认为两茎干物质含量差异不显著,可以认为两个马铃薯品种的块茎干物质含量相同。个马铃薯品种的块茎干物质含量相同。(三)两个样本的总体方差(三)两个样本的总体方差1 12 2 和和2 22 2为未知,为未知,且两个样本又,且两个样本又为小样本时,用近似为小样本时,用近似t t 检验法。检验法。t t的自由度为有效自由度的自由度为有效自由度 df df,其其计计算公式算公式为为 【例【例4646】测定糯玉米品种江南花糯测定糯玉米品种江南花糯的出籽率(的出籽率(%)8 8次(次(n n1 1=8=8),得),得 68.0668.06,123.74123.74;测定扬测定扬 农农01 01 的出籽率的出籽率(%)6 6次(次(n n2 2=6=6),得),得 62.8862.88,46.6746.67。试检验这两个糯玉米品种出籽率差。试检验这两个糯玉米品种出籽率差异是否显著。异是否显著。1 1、提出假设、提出假设H H0 0:1 12 2,即两个糯玉米品种出籽,即两个糯玉米品种出籽率相同;率相同;H HA A:1 12 2,即两个糯玉米品种出籽,即两个糯玉米品种出籽率不相同。率不相同。2 2、计算、计算t t 值值 3 3、统计推断、统计推断 根据根据dfdf1010查附表查附表3 3得:得:t t0.05(10)0.05(10)=2.228=2.228,因计算得的因计算得的|t|t|2.2282.228,故,故p p0.050.05,不能否定,不能否定H H0 0:1 12 2,表明两个,表明两个糯玉米品种出籽率差异不显著,可以认为糯玉米品种出籽率差异不显著,可以认为两个糯玉米品种出籽率相同。两个糯玉米品种出籽率相同。二、配对设计两样本平均数差异显著性检验二、配对设计两样本平均数差异显著性检验 当当试试验验单单元元间间差差异异较较大大,用用完完全全随随机机设设计计将将会会增增大大试试验验误误差差,降降低低试试验验结结果果的的准准确确性性。为为此此可可按按局局部部控控制制的的原原理理,把把条条件件一一致致的的两两个个供供试试单单元元配配成成一一对对,并并设设多多个个配配对对,再再对对每每一一配配对对两两个个单单元元随随机机独独立立实实施施一一处处理理,这这就就是是配配对对试试验验,实实为为处处理理数数为为2的的随随机机区区组组试试验验,这这样得到的数据称为配对数据。样得到的数据称为配对数据。(x11,x21)(x12,x22)(x13,x23)(x14,x24)由于各配对间供试单元差异较大,不便由由于各配对间供试单元差异较大,不便由x1-x2-推断推断1=2?可由可由di=x1i-x2i消除不同配对间试验单元的差异。消除不同配对间试验单元的差异。因此可通过各配对差数的平均数来推断因此可通过各配对差数的平均数来推断d=0或某一常数?或某一常数?-d)(d _st=d-sd-=nsd遵从遵从df=n-1的的t分布。分布。sd-称为差数标准误称为差数标准误-sd=(di-d)2 2n-1di2(di)2 2/n/nn-1=例例5.65.6 选较一致的两株番茄配成一对,选较一致的两株番茄配成一对,共共7 7对,每对中一株接种对,每对中一株接种A A处理处理病毒病毒、另一株接种、另一株接种B B处理病毒,处理病毒,以叶面枯斑数作为致病力强弱的指以叶面枯斑数作为致病力强弱的指标。标。试分析这两种处理试分析这两种处理病毒方法的差异显著性病毒方法的差异显著性。配对号配对号 1 2 3 4 5 6 7 A x1i 10 13 8 3 5 20 6 B x2i 25 12 14 15 12 27 18 差数差数di -15 1 -6 -12 -7 -7 -12 -581、提出假设提出假设H0:d120,即两种钝化病毒,即两种钝化病毒方式病斑数相同;方式病斑数相同;HA:d120,即两种钝化病毒,即两种钝化病毒方式病斑数本质不相同;方式病斑数本质不相同;2 2、计算、计算t t值值 t t值公式值公式 差数标准误公式差数标准误公式 dfn13、推断、推断第四节第四节第四节第四节 百分率资料的显著性检验百分率资料的显著性检验百分率资料的显著性检验百分率资料的显著性检验二项变量二项变量 X(次数),(次数),百分率百分率 (成数、频率),(成数、频率),如如 发芽率、死虫率、座果率等。发芽率、死虫率、座果率等。一、样本百分率与总体百分率差异一、样本百分率与总体百分率差异一、样本百分率与总体百分率差异一、样本百分率与总体百分率差异显著性检验显著性检验显著性检验显著性检验由由 推断推断 当当满满足足 n n 足足够够大大,p p 不不过过小小,np np 和和nq nq 均均大大于于5 5的的条条件件时时,可可近近似似地地采采用用u u 检验法检验法 【例例4848】用用糯糯玉玉米米和和非非糯糯玉玉米米杂杂交交,预预期期 F F1 1 植植 株株 上上糯糯性性花花粉粉粒粒的的百百分分率率为为P P0 0=0.50=0.50。现现检检视视150150粒粒花花粉粉,得得糯糯性性花花粉粉6868粒粒,其其百百分分率率 =0.453=0.453,问问此此结结果果和和理理论论百分率百分率P P0 0=0.50=0.50是否相符?是否相符?1 1、统计假设、统计假设H H0 0:P PP P0 0,即糯性花粉粒样本百分率,即糯性花粉粒样本百分率 =0.453=0.453所在的总体百分率所在的总体百分率P P与理论百分率与理论百分率P P0 0=0.50=0.50相同;相同;H HA A:PPPP0 0=0.50=0.50,即糯性花粉粒样本百分率,即糯性花粉粒样本百分率 =0.453 =0.453所在的总体百分率所在的总体百分率P P与理论百分与理论百分率率P P0 0=0.50=0.50不相同。不相同。2 2、计算、计算u u 值值 本例本例 3 3、统计推断、统计推断 计算所得的计算所得的|u|u|u u0.05 0.05=1.96=1.96,故,故 p p0.050.05,不能否定,不能否定H H0 0:P=PP=P0 0,表明糯性花粉样,表明糯性花粉样本百分率本百分率 0.4530.453和和P P0 0=0.5=0.5差异不显著,可差异不显著,可以认为糯性花粉粒样本百分率以认为糯性花粉粒样本百分率 =0.453 =0.453所在所在的总体百分率的总体百分率P P与理论百分率与理论百分率P P0 0=0.50=0.50相同。相同。二、两个样本百分率差异显著性检验二、两个样本百分率差异显著性检验二、两个样本百分率差异显著性检验二、两个样本百分率差异显著性检验 由由 推断推断 当当两两样样本本的的npnp、nqnq均均大大于于5 5时时,可可以以采采用用正正态态近近似似法法,即即用用u u 检检验验法法进进行行检验。检验。【例【例4949】调调 查查 春春 大豆品种大豆品种A A的的120120(n n1 1)个豆荚,其中有瘪荚)个豆荚,其中有瘪荚3838(x x1 1)荚,瘪)荚,瘪荚率荚率31.7%31.7%();调查春大豆品种);调查春大豆品种B B的的135135(n n2 2)个豆荚,其中有瘪荚)个豆荚,其中有瘪荚5252(x x2 2)荚,瘪)荚,瘪荚率荚率38.5%38.5%()。试检验这两个品种的瘪)。试检验这两个品种的瘪荚率差异是否显著?荚率差异是否显著?1 1、统计假设、统计假设 H H0 0:P P1 1P P2 2,即两个品种的总体瘪荚率相,即两个品种的总体瘪荚率相同;同;H HA A:P P1 1PP2 2,即两个品种的总体瘪荚率不,即两个品种的总体瘪荚率不相同。相同。2 2、计算、计算u u 值值 本例本例 3 3、统计推断、统计推断 由于计算所得的由于计算所得的(|u|=1.133)(u(|u|=1.133)0.050.05,不能否定,不能否定H H0 0:P P1 1=P=P2 2,表明两个品种的瘪荚率差异不显著,表明两个品种的瘪荚率差异不显著,可以认为两个品种的瘪荚率相同。可以认为两个品种的瘪荚率相同。三、百分率资料显著性检验的三、百分率资料显著性检验的三、百分率资料显著性检验的三、百分率资料显著性检验的连续性矫正连续性矫正连续性矫正连续性矫正 (一一)样本百分率与总体百分率差异显著样本百分率与总体百分率差异显著性检验的连续性矫正性检验的连续性矫正 如果如果npnp和和nqnq小于或等于小于或等于3030,还须对,还须对u u 进进行连续性矫正。将连续性矫正后计算的值记行连续性矫正。将连续性矫正后计算的值记为为u uc c,u uc c的计算公式为:的计算公式为:(二二)两个样本百分率差异显著性检验两个样本百分率差异显著性检验的连续性矫正的连续性矫正 如果两样本的如果两样本的npnp和和nqnq均均小于或等于小于或等于3030,也须对,也须对u u进行连续性矫正。进行连续性矫正。u uc c值的计值的计算公式为:算公式为:第五节第五节第五节第五节 参数的区间估计参数的区间估计参数的区间估计参数的区间估计 点估计点估计 区区间间估估计计:指指在在一一定定概概率率保保证证下下,结结合合抽抽样样误误差差估估计计出出参参数数可可能能出出现现的的一一个个范范围围。这这个个范范围围叫叫置置信信区区间间,给给出出的的概概率率保保证称置信度。证称置信度。一、正态总体平均数一、正态总体平均数一、正态总体平均数一、正态总体平均数 的置信区间的置信区间的置信区间的置信区间 设有一来自正态总体的样本,包含设有一来自正态总体的样本,包含n n个观个观测值测值x x1 1、x x2 2、x xn n,样本平均数,样本平均数 ,标准误标准误 ,总体平均数为,总体平均数为。因为因为 服从自由度为服从自由度为n-1n-1的的t t分布,两尾概率为分布,两尾概率为时,有:时,有:也即有也即有 令令 则区间则区间LL1 1,L L2 2 为为的置信度为的置信度为1 1的的置信区间置信区间。其中其中 L L1 1为置信下限,为置信下限,L L2 2为置信上限;为置信上限;为置信半径。为置信半径。置信上、下限之差称为置信距,置置信上、下限之差称为置信距,置信距越小,估计的精确度越高。信距越小,估计的精确度越高。常用的置信度为常用的置信度为95%95%和和99%99%,故总体,故总体平均数平均数的的95%95%和和99%99%置信区间如下:置信区间如下:【例例411411】测测得得某某高高产产、抗抗病病小小麦麦品品种种的的8 8(n n)个个千千粒粒重重,得得其其平平均均数数 =45.2g=45.2g,标标准准差差S=1.64gS=1.64g。试试求求该该品品种种小小麦麦千千粒粒重重在在置信度为置信度为9595的置信区间。的置信区间。查附表查附表3 3,df df(8-1)=7(8-1)=7时,得时,得 t t0.05(7)0.05(7)=2.365,=2.365,故故的的9595置信区间为:置信区间为:说明置信度为说明置信度为9595时,该高产、抗病小时,该高产、抗病小麦品种的千粒重在麦品种的千粒重在43.829 43.829 46.571g46.571g之间。之间。二、二项总体百分率二、二项总体百分率二、二项总体百分率二、二项总体百分率P P P P的置信区间的置信区间的置信区间的置信区间 百分率的置信区间是在一定置信度下对百分率的置信区间是在一定置信度下对总体百分率总体百分率p p作出区间估计。求总体百分率的作出区间估计。求总体百分率的置信区间的方法常用正态近似法。置信区间的方法常用正态近似法。当当n n10001000,p p0.010.01时,总体百分率时,总体百分率p