第四章统计假设检验精选文档.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第四章统计假设检验精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章统计假设检验精选文档.ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章统计假设检验本讲稿第一页,共七十一页一、大样本平均数的假设检验-u检验1、u检验的基本原理c.将计算所得将计算所得u值与设定显著性水平下的否定无效假值与设定显著性水平下的否定无效假设的临界值设的临界值u比较比较a.根据正态分布的理论分布,计算抽样平均数总体根据正态分布的理论分布,计算抽样平均数总体的标准差的标准差本讲稿第二页,共七十一页2、u检验的适用条件抽样分布为正态分布(1 1)基础总体为正态分布,无论样本容量大小,其抽样分布肯定为正)基础总体为正态分布,无论样本容量大小,其抽样分布肯定为正态分布态分布(2 2)未知基础总体,样本容量很大时,根据中心极限定理,其抽样分布)未知基础总体
2、,样本容量很大时,根据中心极限定理,其抽样分布也可以看作正态分布也可以看作正态分布 因为用的是大样本的均因为用的是大样本的均方,所以此样本的均方对总体方,所以此样本的均方对总体方差的估计是有效的。方差的估计是有效的。直接用大样本的均方代直接用大样本的均方代替总体方差,这时替总体方差,这时本讲稿第三页,共七十一页3 3、一个样本平均数的检验、一个样本平均数的检验例:在江苏沛县调查例:在江苏沛县调查333333 m2 2小地老虎虫害情况的结果,小地老虎虫害情况的结果,=4.73头头,=2.63头。用某种抽样方法随机抽得一个样本头。用某种抽样方法随机抽得一个样本(n=30),计算得,计算得 =4.3
3、7头。问这个样本对该已知总体有无代表性?头。问这个样本对该已知总体有无代表性?本讲稿第四页,共七十一页解解:注意:此处是注意:此处是对总体参数做对总体参数做假设假设a.提出无效假设提出无效假设(一尾一尾or两尾?两尾?)b.确定一个否定确定一个否定H0的概率的概率 a a 0.05c.检验概率计算(检验概率计算(首先判断要用什么分布首先判断要用什么分布)Q Q 总体标准差已知,且抽样为大样本(总体标准差已知,且抽样为大样本(n=30)可以用可以用u检验检验本讲稿第五页,共七十一页d.做出推断结论并加以解释做出推断结论并加以解释根据以上计算可知样本在假定根据以上计算可知样本在假定总体中出现的概率
4、总体中出现的概率P 0.05,即差异不显著,所以,应该接受,即差异不显著,所以,应该接受H0否定否定HA。由此,我们应该认为,由此,我们应该认为,所抽得的样本平均数对总体所抽得的样本平均数对总体平均数有代表性,抽样平均数和总体平均数之间平均数有代表性,抽样平均数和总体平均数之间的差异是抽样误差造成的。的差异是抽样误差造成的。本讲稿第六页,共七十一页(1)在两个样本的总体方差在两个样本的总体方差 和和 为已知时,用为已知时,用u检验检验 由抽样分布的公式知,两样本平均数由抽样分布的公式知,两样本平均数 和和 的差数标准误的差数标准误 ,在,在 和和 是已知时为:是已知时为:并有并有:在假设在假设
5、 下,正态离差下,正态离差u值为值为 ,故可对,故可对两样本平均数的差异作出假设检验。两样本平均数的差异作出假设检验。4 4、两个样本平均数的检验、两个样本平均数的检验本讲稿第七页,共七十一页 例:例:据以往资料,已知某小麦品种每平方米产量的据以往资料,已知某小麦品种每平方米产量的 。今在该品种的一块地上用。今在该品种的一块地上用A、B两法取样,法取两法取样,法取12个个样点,得每平方米产量样点,得每平方米产量 =1.2(kg);B法取法取8个样点,得个样点,得 =1.4(kg)。试比较。试比较A、B两法的每平方米产量是否有显著差异?两法的每平方米产量是否有显著差异?假设假设H0:A、B两法的
6、每平方米产量相同,即两法的每平方米产量相同,即 系随机误差;对系随机误差;对 显著水平显著水平 因为实得因为实得|u|0.05 推断推断:接受接受 ,即即A、B两种取样方法所得的每平方米产量没两种取样方法所得的每平方米产量没有显著差异。有显著差异。本讲稿第八页,共七十一页G当总体的分布情况以及总体的方差未知,且样本容量很小(n30)时,只有用样本算出的均方s2来估计总体的方差,此时,二、小样本平均数的假设检验-t 检验本讲稿第九页,共七十一页 1908年年W.S.Gosset首先提出,又叫学生氏首先提出,又叫学生氏t分布分布(Students t-distribution)1、t 分布的提出本
7、讲稿第十页,共七十一页本讲稿第十一页,共七十一页2、u分布与分布与t分布的比较分布的比较a.t分布的平均数与分布的平均数与u分分布相同,都是布相同,都是0,并在,并在t=0处曲线最高,以处曲线最高,以0为中心左右对称为中心左右对称c.t分布的曲线性状随自由度分布的曲线性状随自由度而改变,自由度而改变,自由度越小,其分越小,其分布越离散,随布越离散,随值增大,逐渐趋近于值增大,逐渐趋近于u分布,当自由度增大到分布,当自由度增大到30时基本接近时基本接近u分布分布b.与与u分布曲线相比,分布曲线相比,t分布分布曲线的峰高较低,两侧曲线的峰高较低,两侧接近接近x轴的速度更缓慢轴的速度更缓慢本讲稿第十
8、二页,共七十一页3 3、t t分布的概率估计分布的概率估计本讲稿第十三页,共七十一页4 4、t t 检验检验T检验通过比较t值与t的大小关系来判断否定还是接受H0t可以通过查附表3获得(注意是两尾的临界值)本讲稿第十四页,共七十一页一尾检验的t临界值t(1)通过查附表中的相应自由度下对应2的t2(2)获得t表中,相同时,P越大,t值越小,反之亦然因此,当计算所得|t|大于或等于表中所查t时,说明,其属于随机误差的概率小于或等于规定的显著性水平,即t位于否定区内,则否定H0,否则接受H0本讲稿第十五页,共七十一页5、单个样本平均数的假设检验、单个样本平均数的假设检验 这是检验某一样本所属的总体平
9、均数是否和某一这是检验某一样本所属的总体平均数是否和某一指定的总体平均数相同。指定的总体平均数相同。例:某春小麦良种的千粒重例:某春小麦良种的千粒重0 0=34g=34g,现自外地引,现自外地引入一高产品种,在入一高产品种,在8 8个小区种植,得其千粒重个小区种植,得其千粒重(g)(g)为:为:35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,问新引问新引入品种的千粒重与当地良种有无显著差异?入品种的千粒重与当地良种有无显著差异?本讲稿第十六页,共七十一页检验步骤为:H0:新引入品种千
10、粒重与当地良种千粒重指定值相同,即=0=34g;对HA:34g显著水平=0.05检验计算:=(35.6+37.6+34.6)/8=35.2(g)本讲稿第十七页,共七十一页查附表3,=7时,t 0.05=2.365。现实得|t|t=2.365,故P0.05。推断:接受H0:=34g,即新引入品种千粒重与当地良种千粒重指定值无显著差异。本讲稿第十八页,共七十一页6、两个样本平均数的假设检验两个样本平均数的假设检验 这是由两个样本平均数的相差,以检验这两个样本所属的总体平均数有无显著差异。检验的方法因试验设计的不同而分为成组数据成组数据的平均数比较和成对数据成对数据的比较两种。本讲稿第十九页,共七十
11、一页(1 1)成组数据成组数据的平均数比较的平均数比较 如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数成组数据据,以组平均数组平均数作为相互比较的标准。1、在两个样本的总体方差已知时,用u 检验。本讲稿第二十页,共七十一页 例:据以往资料,已知某小麦品种每平方米产量的2=0.4(kg)2。今在该品种的一块地上用A、B两法取样,A法取了12个样点,得每平方米 =1.2(kg);B法取得8个样点,得 =1.4(kg)。试比较A、B两法的每平方米产量是否有显著差异?系随机误差;假设H0:A、B两法的产量相同,即H0:本讲稿第二十一页,共七十一页对
12、HA:12,=0.05推断:接受H0:12 2,即A、B两种取样方法所得每平方米产量没有显著差异。检验计算:因为实得|u|u0.05=1.96,故P0.05。本讲稿第二十二页,共七十一页的加权平均值,即:2、在两个样本的总体方差和为未知,但可假定=2,而两个样本又为小样本时,用t 检验。首先,从样本变异算出平均数差数的均方,作为对2的估计。由于可假定=2,故应为两样本均方本讲稿第二十三页,共七十一页当n1=n2=n 时,则上式变为:本讲稿第二十四页,共七十一页由于假设H0:12,故上式为:例:研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区8株、对照区玉米9株,其观察值如下表:本讲稿第二十
13、五页,共七十一页y1(喷施矮壮素)160160200160200170150 210y2(对照)170270180250270290270 230170 从理论上判断,喷施矮壮素只可能矮化无效而不可能促进植物长高,因此假设H0:喷施矮壮素的株高与未喷的相同或更高,即H0:12对HA:12,即喷施矮壮素的株高较未喷的为矮。显著水平=0.05。检验计算:本讲稿第二十六页,共七十一页本讲稿第二十七页,共七十一页 按=7+8=15,查t 表得一尾t0.05=1.753(一尾检验t0.05等于两尾检验的t0.10),现实得t=-3.05-t0.05=-1.753,故P0.05。推断:否定H0:12,接受
14、HA:12,即认为玉米喷施矮壮素后,其株高显著地矮于对照。本讲稿第二十八页,共七十一页(2 2)成对数据成对数据的比较的比较 若试验设计是将性质相同性质相同的两个供试单位配成对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数成对数据据。本讲稿第二十九页,共七十一页成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。设两个样本的观察值分别为y1和y2,共配成n对,各个对的差数为d=y1-y2,差数的平均数为本讲稿第三十页,共七十一页它具有=n-1。若假设H0
15、:d=0,则上式改成:即可检验 H H0 0:d d=0=0。则差数平均数的标准误为:本讲稿第三十一页,共七十一页 例:选生长期、发育进度、植株大小和其它方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的纯化的病毒效果,表中结果为组别y1(A法)y2(B法)d11025-152131213814-64315-1252027-762020-77618-12本讲稿第三十二页,共七十一页病毒在番茄上产生的病痕数目,试检验两种处理方法的差异显著性。假设:两种处理对纯化病毒无不同效果,即:H H0:d=0;对H HA A:d00。显著水平。显
16、著水平=0.01=0.01。检验计算:本讲稿第三十三页,共七十一页查附表4,=7-1=6时,t0.01=3.707。实得|t|t0.01,故P0.01。推断:否定H0:d=0,接受HA:d0,即A、B两法对纯化病毒的效应有极显著差异。本讲稿第三十四页,共七十一页第三节第三节 样本频率的假设检验样本频率的假设检验 许多生物试验的结果是用百分数或成数表示的,称为样本频率,许多生物试验的结果是用百分数或成数表示的,称为样本频率,如结实率、发芽率等,这些百分数系由计数某一属性的个体数目求如结实率、发芽率等,这些百分数系由计数某一属性的个体数目求得,属得,属间断性的计数资料间断性的计数资料。在理论上,这
17、类百分数的假设检验应按二项分布进行,即从二项式在理论上,这类百分数的假设检验应按二项分布进行,即从二项式(p+q)n的展开式中求出某项属性个体百分数的展开式中求出某项属性个体百分数 的概率。的概率。但是,如样本容量但是,如样本容量n 较大,较大,p较小,而较小,而np和和nq又均不小于又均不小于5时时,(p+q)n的分布趋近于正态。因而可以将百分数资料作正态分布处理,从而作的分布趋近于正态。因而可以将百分数资料作正态分布处理,从而作出近似的检验。出近似的检验。适于用适于用u检验所需的二项样本容量检验所需的二项样本容量n见下表。见下表。本讲稿第三十五页,共七十一页(样样本百分数本百分数)(较较小
18、小组组次数次数)n(样本容量样本容量)0.5015300.4020500.3024800.20402000.10606000.05701400 表表4.1 适于用正态离差检验的二项样本的适于用正态离差检验的二项样本的 和和n值表值表本讲稿第三十六页,共七十一页一、一个样本频率的假设检验一、一个样本频率的假设检验 检验某一样本频率检验某一样本频率 所属总体频率与某一理论值或期望值所属总体频率与某一理论值或期望值p0的差异显著性。的差异显著性。由于样本频率的标准误由于样本频率的标准误 为:为:故由故由 即可检验即可检验H0:p=p0,HA:p p0。本讲稿第三十七页,共七十一页 例例 以紫花和白花
19、的大豆品种杂交,在以紫花和白花的大豆品种杂交,在F2代共得代共得289株,其中株,其中紫花紫花208株,白花株,白花81株。如果花色受一对等位基因控制,则根据遗传学株。如果花色受一对等位基因控制,则根据遗传学原理,原理,F2代紫花株与白花株的分离比率应为代紫花株与白花株的分离比率应为31,即紫花理论百分,即紫花理论百分数数p=0.75,白花理论百分数,白花理论百分数q=1p=0.25。问该试验结果是否符合一。问该试验结果是否符合一对等位基因的遗传规律?对等位基因的遗传规律?假设大豆花色遗传符合一对等位基因的分离规律,紫花植株假设大豆花色遗传符合一对等位基因的分离规律,紫花植株的百分数是的百分数
20、是75%,即,即H0:p=0.75;对;对HA:p0.75。显著水平显著水平 0.05,作两尾检验,作两尾检验,u0.05=1.96。检验计算:检验计算:本讲稿第三十八页,共七十一页因为实得因为实得|u|0.05。推断:接受推断:接受H0:p=0.75,即大豆花色遗传是符合一对等位基因的,即大豆花色遗传是符合一对等位基因的遗传规律的,紫花植株百分数遗传规律的,紫花植株百分数 =0.72和和p=0.75的相差系随机误差。的相差系随机误差。以上资料亦可直接用次数进行假设检验。当二项资料以次数以上资料亦可直接用次数进行假设检验。当二项资料以次数表示时,表示时,,故检验计算:故检验计算:于是于是 结果
21、同上结果同上 本讲稿第三十九页,共七十一页二、两个样本频率相比较的假设检验二、两个样本频率相比较的假设检验 检验两个样本频率和所属总体频率检验两个样本频率和所属总体频率p1和和p2的差异显著性的差异显著性.一般假定两个样本的总体方差是相等的,即一般假定两个样本的总体方差是相等的,即 ,设两个样,设两个样本某种属性个体的观察频率分别为本某种属性个体的观察频率分别为 和和 ,而两样本总体该种属性的个体频率分别为,而两样本总体该种属性的个体频率分别为p1和和 p2,则两样本频率的差数标准误,则两样本频率的差数标准误 为:为:上式中的上式中的q1=(1p1),q2=(1p2)。这是两总体频率为已知时的
22、差。这是两总体频率为已知时的差数标准误公式。数标准误公式。本讲稿第四十页,共七十一页如果假定两总体的频率相同,即如果假定两总体的频率相同,即 p1=p2=p,q1=q2=q,则:,则:p1 和和 p2 未知时,则在未知时,则在 的假定下,可用两样本频率的加权的假定下,可用两样本频率的加权平均值平均值 作为作为 p1 和和 p2 的估计。的估计。本讲稿第四十一页,共七十一页因而两样本频率的差数标准误为:因而两样本频率的差数标准误为:故由故由即可对即可对 H0:p1=p2 作出假设检验。作出假设检验。本讲稿第四十二页,共七十一页 例例 调查低洼地小麦调查低洼地小麦378株株(n1),其中有锈病株,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 统计 假设检验 精选 文档
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内