显著性检验学习.pptx
《显著性检验学习.pptx》由会员分享,可在线阅读,更多相关《显著性检验学习.pptx(119页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 显著性检验显著性检验又叫假设检验假设检验是统计学中的一个重要内容。显著性检验的方法很多,常用的有u检验、t检验、F检验和 2检验等。尽管这些检验方法的使用条件及用途不同,但检验的基本原理是相同的。下一张 主 页 退 出 上一张 第1页/共119页第一节 显著性检验的基本原理 下一张 主 页 退 出 上一张 一、显著性检验的意义第2页/共119页下一张 主 页 退 出 上一张 如,某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种如,某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植植1010个小区,获得两个水稻品种的平均产量为个小区,获得两个水稻品种的平均产量为
2、:我们能否根据我们能否根据 就判定这两个水稻品种平均产量不同?就判定这两个水稻品种平均产量不同?结论是,不一定。结论是,不一定。第3页/共119页因为两个水稻品种平均产量 、都是从试验种植的10个小区获得,仅是两个品种有关总体平均数 的估计值。由于存在试验误差,样本平均数并不等于总体平均数,样本平均数包含总体平均数与试验误差二部分样本平均数包含总体平均数与试验误差二部分,即下一张 主 页 退 出 上一张 第4页/共119页 于是,下一张 主 页 退 出 上一张 其中,其中,为为试验的表面差异试验的表面差异试验的表面差异试验的表面差异,为为试验的真实差异试验的真实差异试验的真实差异试验的真实差异
3、,为为试验误差试验误差试验误差试验误差。第5页/共119页表明,试验的表面差异 是由两部分组成:一部分是试验的真实差异 ;另一部分是试验误差 。虽然真实差异 未知,但试验的表面差异 是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可将试验的表面差异可将试验的表面差异 与试验误差相比较间与试验误差相比较间接推断真实差异接推断真实差异 是否存在是否存在,即进行差异显著性检验。下一张 主 页 退 出 上一张 第6页/共119页显著性检验的目的在于判明,试验的表面差异 主要是由试验的真实差异 造成的,还是由试验误差 造成的,从而得到可靠的结论。下一张 主 页 退 出 上一张 第7页/共11
4、9页二、显著性检验的步骤下一张 主 页 退 出 上一张【例例4 4 1 1】已知某品种玉米单穗重已知某品种玉米单穗重NN(300300,9.59.52 2),即单穗重总体),即单穗重总体平均数平均数300g300g,标准差,标准差9.5g9.5g。在种植过程中喷洒了某种药剂的植株中随机抽。在种植过程中喷洒了某种药剂的植株中随机抽取取9 9个果穗个果穗 ,测得平均单穗重,测得平均单穗重 308g308g,试问这种药剂对该品种玉米的平均单,试问这种药剂对该品种玉米的平均单穗重有无真实影响?穗重有无真实影响?第8页/共119页 (一)提出假设(一)提出假设 下一张 主 页 退 出 上一张 首先对样本
5、所在的总体作一个假设。假设喷洒了药剂的玉米单穗重总体平首先对样本所在的总体作一个假设。假设喷洒了药剂的玉米单穗重总体平均数与原来的玉米单穗重总体平均数之间没有真实差异,即或均数与原来的玉米单穗重总体平均数之间没有真实差异,即或。也就是假设表面差异。也就是假设表面差异 是由抽样误差造成的。是由抽样误差造成的。第9页/共119页这种假设通常称为无效假设无效假设或零假设零假设,记为 。无效假设是待检验的假设,它有可能被接受,也有可能被否定。相应地还要有一个对应假设,称为备择假设备择假设。备择假设是在无效假设被否定时,准备接受的假设,记为 或 。通过检验,若否定无效假设,我们就接受备择假设。下一张 主
6、 页 退 出 上一张 第10页/共119页 (二)计算概率(二)计算概率 下一张 主 页 退 出 上一张 在假定无效假设成立的前提下,根据所检验的统计数的抽样分布在假定无效假设成立的前提下,根据所检验的统计数的抽样分布 ,计算,计算表面差异表面差异 是由抽样误差造成的概率。是由抽样误差造成的概率。本例是在假定无效假设本例是在假定无效假设 成立的前提下,研究在成立的前提下,研究在 NN(300300,9.59.52 2)这一已知正态总体中抽样所获得的样本平均数)这一已知正态总体中抽样所获得的样本平均数 的分布。的分布。第11页/共119页 第三章已述及,若 ,则样本平均数 ,将其标准化,得下一张
7、 主 页 退 出 上一张 本例,本例,得得第12页/共119页下面估计|u|2.526的两尾概率,即估计P(|u|2.526)是多少?我们知道,两尾概率为0.05的临界值为 =1.96,两尾概率为0.01的临界 值为 =2.58,即:下一张 主 页 退 出 上一张 P P(|1.961.96)=P P(1.961.96)+P P(-1.96-1.96)=0.05=0.05 u第13页/共119页 P(|2.58)=P(2.58)+P(-2.58)=0.01下一张 主 页 退 出 上一张 根据样本数据计算所得的根据样本数据计算所得的 值为值为2.5262.526,介于两个临界,介于两个临界 值之
8、间,即:值之间,即:2.5262.526第14页/共119页所以,|2.526的概率P介于0.01和0.05之间,即 0.01 p 0.05 说明假定表面差异()是由抽样误差造成的概率在0.010.05之间。下一张 主 页 退 出 上一张 第15页/共119页 (三三)统计推断统计推断 下一张 主 页 退 出 上一张 根据小概率事件实际不可能性原理作出否定或接受无效假设的推断。第16页/共119页 根据这一原理 ,当表面差异是抽样误差的概率小于0.05时,可以认为在一次抽样中表面差异是抽样误差实际上是不可能的,因而否定原先所作的无效假设H0:,接受备择假设HA:,即认为存在真实差异。当表面差异
9、是抽样误差的概率大于0.05时,说明无效假设H0:成立的可能性大,不能被否定,因而也就不能接受备择假设HA:。下一张 主 页 退 出 上一张 第17页/共119页显著性检验的结果表明:本例的样本平均数与原总体平均数之间的表面差异表面差异()除包含抽样误差外,还包含真实差异包含真实差异(),即喷洒了药剂的玉米单穗重总体平均数 与原来的玉米单穗重总体平均数 不同。下一张 主 页 退 出 上一张 第18页/共119页 综上所述,显著性检验,从提出无效假设与备择假设,到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质概率性质的反证法的反证法”对样本所属总体所作的无
10、效假设的统计推断。下一张 主 页 退 出 上一张 上述显著性检验利用了上述显著性检验利用了 分布来估计出分布来估计出 u u 2.5262.526的两尾概率,所以的两尾概率,所以称称为为 检验检验.第19页/共119页三、显著水平与两种类型的错误 (一一)显著水平显著水平 下一张 主 页 退 出 上一张 用来否定或接受无效假设的概率标准叫用来否定或接受无效假设的概率标准叫显著水平显著水平,记作。,记作。在生物在生物学研究中常取学研究中常取=0.05=0.05,称,称 为为 5%5%显显 著著 水水 平;平;或或=0.01=0.01,称,称 为为 1%1%显显 著著 水水 平平 或或 极显著水平
11、。极显著水平。第20页/共119页对于上述例子的检验来说,若u1.96,则说明试验的表面差异属于试验误差的概率p0.05,即表面差异属于试验误差的可能性大,不能否定。统计学上把这一检验结果表述为:“总体平均数 与差异不显著差异不显著”,在计算所得的 u 值的右上方标记“”或不标记符号;下一张 主 页 退 出 上一张 第21页/共119页若|,则说明试验的表面差异属于试验误差的概率p在0.010.05之间,即0.01p0.05,表面差异 属 于 试 验误差的可能性较小,应否定H0:,接受HA:。统计学上把这一检验结果表述为:“总体平均数与 差异显著差异显著”,在计算所得的值的右上方标记“*”;下
12、一张 主 页 退 出 上一张 第22页/共119页若|2.58,则说明试验的表面差异属于试验误差的概率 p 不超过 0.01,即 p 0.01,表面差异属于试验误差的可能性更小,应否定H0:,接受HA:。统计学上把这一检验结果表述为:“总体平均数与差异极差异极显著显著”,在计算所得的 值的右上方标记“*”。下一张 主 页 退 出 上一张 第23页/共119页可以看到,是否否定无效假设 ,是用实际计算出的检验统计数的绝对值与显著水平对应的临界值比较:若|,则在 水平上否定 若|,则 不 能 在 水 平 上 否定 。下一张 主 页 退 出 上一张 第24页/共119页 下一张 主 页 退 出 上一
13、张 区间 和 称为水平 上的否定域否定域,而区间 则称为 水平上的接受域接受域。第25页/共119页因为在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”,所以我们下的结论不可能有百分之百的把握。下一张 主 页 退 出 上一张(二二)两类错误两类错误 第26页/共119页例如,经检 验获得“差异显著差异显著”的结论,我们有95%的把握否定无效假设H0,同时要冒5%下错结论的风险;经 检验获得“差异极显著差异极显著”的结论,我们有99%的把握否定无效假设H0,同时要冒1%下错结论的风险;而经 检验获得“差异不显著差异不显著”的结论,在统计学上是指“没有理由”否定无效假设H0
14、,同样也要冒下错结论的风险。下一张 主 页 退 出 上一张 第27页/共119页 显著性检验可能出现两种类型的错误:下一张 主 页 退 出 上一张 型错误 与型错误。型错误又称为错误,就是把非真实的差异错判为是真实的差异,即型错误又称为错误,就是把非真实的差异错判为是真实的差异,即实际上实际上HH0 0正确,检验结果为否定正确,检验结果为否定HH0 0。犯犯犯犯类型错误的可能性一般不会超过所选用类型错误的可能性一般不会超过所选用类型错误的可能性一般不会超过所选用类型错误的可能性一般不会超过所选用的显著水平;的显著水平;的显著水平;的显著水平;第28页/共119页型错误又称为错误,就是把真实的差
15、异错判为是非真实的差异,即实际上HA正确,检验结果却未能否定H0。犯犯类型错误的可能性记为类型错误的可能性记为,一般是随着的减小或试验误差的增大而增大,所以越小或试验误差越大,就越容易将试验的真实差异错判为试验误差。下一张 主 页 退 出 上一张 第29页/共119页 显著性检验的两类错误归纳如下:下一张 主 页 退 出 上一张 表4-1 显著性检验的两类错误第30页/共119页 因此,如果经 检验获得“差异显著差异显著”或“差异极显著差异极显著”,我们有95%或99%的把握认为,与 不相同,判断错误的可能性不超过5%或1%;若经 检验获得“差异不显著差异不显著”,我们只能认为在本次试验条件下
16、,与 没有差异的假设 H0:未被否定,这有两种可能存在:或者是 与 确实没有差异,或者是 与 有差异而因为试验误差大被掩盖了。下一张 主 页 退 出 上一张 第31页/共119页因而,不能仅凭统计推断就简单地作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的有很大的可靠性,但有一定的错误率错误率”这是统计推断的基本特点。下一张 主 页 退 出 上一张 第32页/共119页 为了降低犯两类错误的概率,一般从选取适当的显著水平选取适当的显著水平和增加试验重复次数增加试验重复次数来考虑。因为选取数值小的显著水平值可以降低犯类型错误的概率,但与此同时也增大了犯型错误的概率,所以显著水平值的选用
17、要同时考虑到犯两类错误的概率的大小。下一张 主 页 退 出 上一张 第33页/共119页 对于田间试验,由于试验条件不容易控制完全一致,试验误差较大,为了降低犯型错误的概率,也有选取显著水平为0.10或0.20的(注意,在选用这些显著水平值时,一定要予以注明)。通常采用适当增加试验处理的重复次数适当增加试验处理的重复次数(即样本容量),以降低试验误差,提高试验的精确度,降低犯型错误的概率。下一张 主 页 退 出 上一张 第34页/共119页 在在【例例4 4 1 1】中,对应于无效假设中,对应于无效假设 HH0 0:的备择假设为的备择假设为HHAA:。:。HHAA实际上包含了或这两种情况。此时
18、,实际上包含了或这两种情况。此时,在水平上否定在水平上否定域为和,对称地分配在分布曲线的两侧尾部,每侧尾部的概率域为和,对称地分配在分布曲线的两侧尾部,每侧尾部的概率为为 ,如,如图图4-14-1所示。这种所示。这种利用两尾概率进行的检验叫两尾检验利用两尾概率进行的检验叫两尾检验利用两尾概率进行的检验叫两尾检验利用两尾概率进行的检验叫两尾检验.为为 水水平两尾检验的临界值。平两尾检验的临界值。四、两尾检验与一尾检验下一张 主 页 退 出 上一张 第35页/共119页两尾检验的目的在于判断 与 有无差异,而不考虑 与 谁大谁小。下一张 主 页 退 出 上一张 在有些情况下两尾检验不一定符合实际情
19、况。在有些情况下两尾检验不一定符合实际情况。第36页/共119页例如,目前我国大豆育种工作者认为,大豆籽粒蛋白质含量超过45%()的品种为高蛋白品种。如果进行样品含量检测 ,我们关心的是 所在的总体平均数 大于 。此时的无效假设仍为H0:,但备择假设则为HA:。这时否定域位于 分布曲线的右尾,即 。例如当 =0.05时,否定域为 。下一张 主 页 退 出 上一张 第37页/共119页下一张 主 页 退 出 上一张 又如,国家规定稻米中某种农药成分的残留物含量应低于0.1%()。在抽检中,我们关心的是 所在的总体平均数 小于 (即该品种属于合格产品)。此时的无效假设仍为H0:,但备择假设则为HA
20、:。这 时 否 定 域 位 于 分 布 曲 线 的 左尾,即 。例如当 =0.05时,分布的否定域为 ,见图4-2。第38页/共119页一尾检验的一尾检验的 =两尾检验的两尾检验的 =2.33=2.33。这种利用一尾概率进行的检验叫一尾检验利用一尾概率进行的检验叫一尾检验。此时 为一尾检验的临界 值。一尾检验的 =两尾检验的 下一张 主 页 退 出 上一张 例如,例如,一尾检验的一尾检验的=两尾检验的两尾检验的 =1.64=1.64,第39页/共119页实际应用中,如何选用两尾检验或一尾检验,应根据专业的要求在试验设计时就确定。一般情况下,若事先不知道与谁大谁小,只是为了检验与 是否存在差异,
21、则选用两尾检验;如果凭借一定的专业知识和经验推测 应小于(或大于)时,则选用一尾检验。下一张 主 页 退 出 上一张 第40页/共119页下一张 主 页 退 出 上一张 第二节第二节 样本平均数与总体样本平均数与总体 平均数差异显著性检验平均数差异显著性检验 检验一个样本平均数与已知的总体平均数是否有显著差异,即检验检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。已知的总体平均数一般为一些公认的理论数值、该样本是否来自某一总体。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。经验数值或期望数值。第41页/共119页下一张 主 页 退 出 上一张
22、如果总体 未知、且为小样本(n 30),则用t t检验法检验法。t t 检验法,就是在显著性检验时利用检验法,就是在显著性检验时利用 t t分布进行概率计算的检验方法分布进行概率计算的检验方法。第42页/共119页下一张 主 页 退 出 上一张 【例43】晚稻良种汕优63的千粒重 27.5g。现育成一高产品种协优辐819,在9个小区种植,得其千粒重为:32.5、28.6、28.4、24.7、29.1、27.2、29.8、33.3、29.7(g)问新育成品种的千粒重与汕优问新育成品种的千粒重与汕优6363有无显著差异?有无显著差异?第43页/共119页 下一张 主 页 退 出 上一张 1 1、提
23、出假设提出假设:27.5:27.5第44页/共119页下一张 主 页 退 出 上一张 2 2、计算计算t t值值 第45页/共119页下一张 主 页 退 出 上一张 29.255第46页/共119页下一张 主 页 退 出 上一张 第47页/共119页下一张 主 页 退 出 上一张 =0.862 所以 =2.036 第48页/共119页下一张 主 页 退 出 上一张 3 3、统计推断统计推断 由df=n-1=9-1=8查临界t值,得:计算所得的 ,故p0.05,不能否定 ,表明新育成品种千粒重与当地良种汕优63的千粒重差异不显著差异不显著,可以认为新育成品种千可以认为新育成品种千粒重与当地良种汕
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 显著 检验 学习
限制150内