第四章统计假设检验精选PPT.ppt
《第四章统计假设检验精选PPT.ppt》由会员分享,可在线阅读,更多相关《第四章统计假设检验精选PPT.ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章统计假设检验第1页,此课件共71页哦一、大样本平均数的假设检验-u检验1、u检验的基本原理c.将计算所得将计算所得u值与设定显著性水平下的否定无效假值与设定显著性水平下的否定无效假设的临界值设的临界值u比较比较a.根据正态分布的理论分布,计算抽样平均数总体的标准根据正态分布的理论分布,计算抽样平均数总体的标准差差第2页,此课件共71页哦2、u检验的适用条件抽样分布为正态分布(1 1)基础总体为正态分布,无论样本容量大小,其抽样分布肯定为正)基础总体为正态分布,无论样本容量大小,其抽样分布肯定为正态分布态分布(2 2)未知基础总体,样本容量很大时,根据中心极限定理,其抽样分布)未知基础总体
2、,样本容量很大时,根据中心极限定理,其抽样分布也可以看作正态分布也可以看作正态分布 因为用的是大样本的均因为用的是大样本的均方,所以此样本的均方对总体方,所以此样本的均方对总体方差的估计是有效的。方差的估计是有效的。直接用大样本的均方代直接用大样本的均方代替总体方差,这时替总体方差,这时第3页,此课件共71页哦3 3、一个样本平均数的检验、一个样本平均数的检验例:在江苏沛县调查例:在江苏沛县调查333333 m2 2小地老虎虫害情况的结果,小地老虎虫害情况的结果,=4.73头头,=2.63头。用某种抽样方法随机抽得一个样本头。用某种抽样方法随机抽得一个样本(n=30),计算得,计算得 =4.3
3、7头。问这个样本对该已知总体有无代表性?头。问这个样本对该已知总体有无代表性?第4页,此课件共71页哦解解:注意:此处是注意:此处是对总体参数做对总体参数做假设假设a.提出无效假设提出无效假设(一尾一尾or两尾?两尾?)b.确定一个否定确定一个否定H0的概率的概率 a a 0.05c.检验概率计算(检验概率计算(首先判断要用什么分布首先判断要用什么分布)Q Q 总体标准差已知,且抽样为大样本(总体标准差已知,且抽样为大样本(n=30)可以用可以用u检验检验第5页,此课件共71页哦d.做出推断结论并加以解释做出推断结论并加以解释根据以上计算可知样本在假定根据以上计算可知样本在假定总体中出现的概率
4、总体中出现的概率P 0.05,即差异不显著,所以,应该接受,即差异不显著,所以,应该接受H0否定否定HA。由此,我们应该认为,由此,我们应该认为,所抽得的样本平均数对总体所抽得的样本平均数对总体平均数有代表性,抽样平均数和总体平均数之间的平均数有代表性,抽样平均数和总体平均数之间的差异是抽样误差造成的。差异是抽样误差造成的。第6页,此课件共71页哦(1)在两个样本的总体方差在两个样本的总体方差 和和 为已知时,用为已知时,用u检验检验 由抽样分布的公式知,两样本平均数由抽样分布的公式知,两样本平均数 和和 的差数标准误的差数标准误 ,在,在 和和 是已知时为:是已知时为:并有并有:在假设在假设
5、 下,正态离差下,正态离差u值为值为 ,故可对,故可对两样本平均数的差异作出假设检验。两样本平均数的差异作出假设检验。4 4、两个样本平均数的检验、两个样本平均数的检验第7页,此课件共71页哦 例:例:据以往资料,已知某小麦品种每平方米产量的据以往资料,已知某小麦品种每平方米产量的 。今在该品种的一块地上用。今在该品种的一块地上用A、B两法取样,法取两法取样,法取12个个样点,得每平方米产量样点,得每平方米产量 =1.2(kg);B法取法取8个样点,得个样点,得 =1.4(kg)。试比较。试比较A、B两法的每平方米产量是否有显著差异?两法的每平方米产量是否有显著差异?假设假设H0:A、B两法的
6、每平方米产量相同,即两法的每平方米产量相同,即 系随机误差;对系随机误差;对 显著水平显著水平 因为实得因为实得|u|0.05 推断推断:接受接受 ,即即A、B两种取样方法所得的每平方米产量两种取样方法所得的每平方米产量没有显著差异。没有显著差异。第8页,此课件共71页哦G当总体的分布情况以及总体的方差未知,且样本容量很小(n30)时,只有用样本算出的均方s2来估计总体的方差,此时,二、小样本平均数的假设检验-t 检验第9页,此课件共71页哦 1908年年W.S.Gosset首先提出,又叫学生氏首先提出,又叫学生氏t分布分布(Students t-distribution)1、t 分布的提出第
7、10页,此课件共71页哦第11页,此课件共71页哦2、u分布与分布与t分布的比较分布的比较a.t分布的平均数与分布的平均数与u分分布相同,都是布相同,都是0,并在,并在t=0处曲线最高,以处曲线最高,以0为中心左右对称为中心左右对称c.t分布的曲线性状随自由度分布的曲线性状随自由度而改变,自由度而改变,自由度越小,其分布越小,其分布越离散,随越离散,随值增大,逐渐趋近于值增大,逐渐趋近于u分布,当自由度增大到分布,当自由度增大到30时基本接近时基本接近u分布分布b.与与u分布曲线相比,分布曲线相比,t分布分布曲线的峰高较低,两侧曲线的峰高较低,两侧接近接近x轴的速度更缓慢轴的速度更缓慢第12页
8、,此课件共71页哦3 3、t t分布的概率估计分布的概率估计第13页,此课件共71页哦4 4、t t 检验检验T检验通过比较t值与t的大小关系来判断否定还是接受H0t可以通过查附表3获得(注意是两尾的临界值)第14页,此课件共71页哦一尾检验的t临界值t(1)通过查附表中的相应自由度下对应2的t2(2)获得t表中,相同时,P越大,t值越小,反之亦然因此,当计算所得|t|大于或等于表中所查t时,说明,其属于随机误差的概率小于或等于规定的显著性水平,即t位于否定区内,则否定H0,否则接受H0第15页,此课件共71页哦5、单个样本平均数的假设检验、单个样本平均数的假设检验 这是检验某一样本所属的总体
9、平均数是否和某一指这是检验某一样本所属的总体平均数是否和某一指定的总体平均数相同。定的总体平均数相同。例:某春小麦良种的千粒重例:某春小麦良种的千粒重0 0=34g=34g,现自外地引,现自外地引入一高产品种,在入一高产品种,在8 8个小区种植,得其千粒重个小区种植,得其千粒重(g)(g)为:为:35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,问新引入问新引入品种的千粒重与当地良种有无显著差异?品种的千粒重与当地良种有无显著差异?第16页,此课件共71页哦检验步骤为:H0:新引入品种
10、千粒重与当地良种千粒重指定值相同,即=0=34g;对HA:34g显著水平=0.05检验计算:=(35.6+37.6+34.6)/8=35.2(g)第17页,此课件共71页哦查附表3,=7时,t 0.05=2.365。现实得|t|t=2.365,故P0.05。推断:接受H0:=34g,即新引入品种千粒重与当地良种千粒重指定值无显著差异。第18页,此课件共71页哦6、两个样本平均数的假设检验两个样本平均数的假设检验 这是由两个样本平均数的相差,以检验这两个样本所属的总体平均数有无显著差异。检验的方法因试验设计的不同而分为成组数据成组数据的平均数比较和成对数据成对数据的比较两种。第19页,此课件共7
11、1页哦(1 1)成组数据成组数据的平均数比较的平均数比较 如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数成组数据据,以组平均数组平均数作为相互比较的标准。1、在两个样本的总体方差已知时,用u 检验。第20页,此课件共71页哦 例:据以往资料,已知某小麦品种每平方米产量的2=0.4(kg)2。今在该品种的一块地上用A、B两法取样,A法取了12个样点,得每平方米 =1.2(kg);B法取得8个样点,得 =1.4(kg)。试比较A、B两法的每平方米产量是否有显著差异?系随机误差;假设H0:A、B两法的产量相同,即H0:第21页,此课件共71页哦对
12、HA:12,=0.05推断:接受H0:1 12 2,即,即A A、B B两种取样方法所得每两种取样方法所得每平方米产量没有显著差异。平方米产量没有显著差异。检验计算:因为实得|u|u0.05=1.96,故P0.05。第22页,此课件共71页哦的加权平均值,即:2、在两个样本的总体方差和为未知,但可假定=2,而两个样本又为小样本时,用t 检验。首先,从样本变异算出平均数差数的均方,作为对2的估计。由于可假定=2,故应为两样本均方第23页,此课件共71页哦当n1=n2=n 时,则上式变为:第24页,此课件共71页哦由于假设H0:12,故上式为:例:研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小
13、区8株、对照区玉米9株,其观察值如下表:第25页,此课件共71页哦y1(喷施矮壮素)160160200160200170150 210y2(对照)170270180250270290270 230 170 从理论上判断,喷施矮壮素只可能矮化无效而不可能促进植物长高,因此假设H0:喷施矮壮素的株高与未喷的相同或更高,即H0:12对HA:12,即喷施矮壮素的株高较未喷的为矮。显著水平=0.05。检验计算:第26页,此课件共71页哦第27页,此课件共71页哦 按=7+8=15,查t 表得一尾t0.05=1.753(一尾检验t0.05等于两尾检验的t0.10),现实得t=-3.05-t0.05=-1.
14、753,故P0.05。推断:否定H0:12,接受HA:12,即认为玉米喷施矮壮素后,其株高显著地矮于对照。第28页,此课件共71页哦(2 2)成对数据成对数据的比较的比较 若试验设计是将性质相同性质相同的两个供试单位配成对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据成对数据。第29页,此课件共71页哦成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。设两个样本的观察值分别为y1和y2,共配成n对,各个对的差数为d=y1-y2,差数的平均数为第30页
15、,此课件共71页哦它具有=n-1。若假设H0:d=0,则上式改成:即可检验 H H H H0 0 0 0:d d d d=0=0=0=0。则差数平均数的标准误为:第31页,此课件共71页哦 例:选生长期、发育进度、植株大小和其它方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的纯化的病毒效果,表中结果为组别y1(A法)y2(B法)d11025-152131213814-64315-1252027-762020-77618-12第32页,此课件共71页哦病毒在番茄上产生的病痕数目,试检验两种处理方法的差异显著性。假设:两种处理对纯化病
16、毒无不同效果,即:H H0 0:d d=0=0;对H HA A:d d00。显著水平。显著水平=0.01=0.01。检验计算:第33页,此课件共71页哦查附表4,=7-1=6时,t0.01=3.707。实得|t|t0.01,故P0.01。推断:否定H0:d=0,接受HA:d0,即A、B两法对纯化病毒的效应有极显著差异。第34页,此课件共71页哦第三节第三节 样本频率的假设检验样本频率的假设检验 许多生物试验的结果是用百分数或成数表示的,称为样本频率,许多生物试验的结果是用百分数或成数表示的,称为样本频率,如结实率、发芽率等,这些百分数系由计数某一属性的个体数目求如结实率、发芽率等,这些百分数系
17、由计数某一属性的个体数目求得,属得,属间断性的计数资料间断性的计数资料。在理论上,这类百分数的假设检验应按二项分布进行,即从二项式在理论上,这类百分数的假设检验应按二项分布进行,即从二项式(p+q)n的展开式中求出某项属性个体百分数的展开式中求出某项属性个体百分数 的概率。的概率。但是,如样本容量但是,如样本容量n 较大,较大,p较小,而较小,而np和和nq又均不小于又均不小于5时时,(p+q)n的分布趋近于正态。因而可以将百分数资料作正态分布处理,从而作出近似的的分布趋近于正态。因而可以将百分数资料作正态分布处理,从而作出近似的检验。检验。适于用适于用u检验所需的二项样本容量检验所需的二项样
18、本容量n见下表。见下表。第35页,此课件共71页哦(样样本百分数本百分数)(较较小小组组次数次数)n(样本容量样本容量)0.5015300.4020500.3024800.20402000.10606000.05701400 表表4.1 适于用正态离差检验的二项样本的适于用正态离差检验的二项样本的 和和n值表值表第36页,此课件共71页哦一、一个样本频率的假设检验一、一个样本频率的假设检验 检验某一样本频率检验某一样本频率 所属总体频率与某一理论值或期望值所属总体频率与某一理论值或期望值p0的差异的差异显著性。显著性。由于样本频率的标准误由于样本频率的标准误 为:为:故由故由 即可检验即可检验
19、H0:p=p0,HA:p p0。第37页,此课件共71页哦 例例 以紫花和白花的大豆品种杂交,在以紫花和白花的大豆品种杂交,在F2代共得代共得289株,其中紫花株,其中紫花208株,白花株,白花81株。如果花色受一对等位基因控制,则根据遗传学株。如果花色受一对等位基因控制,则根据遗传学原理,原理,F2代紫花株与白花株的分离比率应为代紫花株与白花株的分离比率应为31,即紫花理论百分数,即紫花理论百分数p=0.75,白花理论百分数,白花理论百分数q=1p=0.25。问该试验结果是否符合一对等。问该试验结果是否符合一对等位基因的遗传规律?位基因的遗传规律?假设大豆花色遗传符合一对等位基因的分离规律,
20、紫花植株的百假设大豆花色遗传符合一对等位基因的分离规律,紫花植株的百分数是分数是75%,即,即H0:p=0.75;对;对HA:p0.75。显著水平显著水平 0.05,作两尾检验,作两尾检验,u0.05=1.96。检验计算:检验计算:第38页,此课件共71页哦因为实得因为实得|u|0.05。推断:接受推断:接受H0:p=0.75,即大豆花色遗传是符合一对等位基因的遗传,即大豆花色遗传是符合一对等位基因的遗传规律的,紫花植株百分数规律的,紫花植株百分数 =0.72和和p=0.75的相差系随机误差。的相差系随机误差。以上资料亦可直接用次数进行假设检验。当二项资料以次数表示时,以上资料亦可直接用次数进
21、行假设检验。当二项资料以次数表示时,,故检验计算:故检验计算:于是于是 结果同上结果同上 第39页,此课件共71页哦二、两个样本频率相比较的假设检验二、两个样本频率相比较的假设检验 检验两个样本频率和所属总体频率检验两个样本频率和所属总体频率p1和和p2的差异显著性的差异显著性.一般假定两个样本的总体方差是相等的,即一般假定两个样本的总体方差是相等的,即 ,设两个样,设两个样本某种属性个体的观察频率分别为本某种属性个体的观察频率分别为 和和 ,而两样本总体该种属性的个体频率分别为,而两样本总体该种属性的个体频率分别为p1和和 p2,则两样本频率的差数标准误,则两样本频率的差数标准误 为:为:上
22、式中的上式中的q1=(1p1),q2=(1p2)。这是两总体频率为已知时的。这是两总体频率为已知时的差数标准误公式。差数标准误公式。第40页,此课件共71页哦如果假定两总体的频率相同,即如果假定两总体的频率相同,即 p1=p2=p,q1=q2=q,则:,则:p1 和和 p2 未知时,则在未知时,则在 的假定下,可用两样本频率的加权平均的假定下,可用两样本频率的加权平均值值 作为作为 p1 和和 p2 的估计。的估计。第41页,此课件共71页哦因而两样本频率的差数标准误为:因而两样本频率的差数标准误为:故由故由即可对即可对 H0:p1=p2 作出假设检验。作出假设检验。第42页,此课件共71页哦
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 统计 假设检验 精选 PPT
限制150内