《样本均数的显著性检验.ppt》由会员分享,可在线阅读,更多相关《样本均数的显著性检验.ppt(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、显著性检验的基本类型、方法及原理一、参数检验(符合或近似符合正态分布)(一)连续性变量l方差的同质性检验l均数的显著性检验l(二)离散型变量l频率的显著性检验l卡方独立性、适合度和拟合度检验二、非参数检验(偏态分布的资料)连续性变量均数、方差的显著性检验连续性变量均数、方差的显著性检验1.1.方差的同质性检验方差的同质性检验(1 1)单个样本方差)单个样本方差(2 2)两个样本方差)两个样本方差2.2.样本均数的显著性检验样本均数的显著性检验(1 1)单个样本均数)单个样本均数(2 2)两个样本均数)两个样本均数a.a.两成组样本两成组样本B.B.两配对样本两配对样本(3 3)3 3个或个或3
2、 3个以上样本个以上样本一、方差的同质性检验一、方差的同质性检验l l方差的同质性是样本均数检验的前提;方差的同质性是样本均数检验的前提;l l方差的同质性检验,就是要以样本的方方差的同质性检验,就是要以样本的方差的关系来推断其总体方差是否同质;差的关系来推断其总体方差是否同质;1.1.单个样本方差的同质性检验单个样本方差的同质性检验例例.一个混杂的小麦品种一个混杂的小麦品种,株高的标准差株高的标准差0 0=14cm,14cm,经一定的方法提纯后,随机从提纯后的群经一定的方法提纯后,随机从提纯后的群体中抽取体中抽取1010株株,测得株高(测得株高(cmcm)分别为:)分别为:90,105,10
3、1,95,100,101,105,93,9790,105,101,95,100,101,105,93,97,100100问问:提纯后的群体是否比原群体整齐提纯后的群体是否比原群体整齐?观测值观测值观测值观测值x xi i:90,105,101,95,100,101,105,93,9790,105,101,95,100,101,105,93,97,100100减去减去减去减去100:100:-10-10,5 5,1,-51,-5,0 0,1 1,5 5,-7,-3 -7,-3 ,0 0 -13-13平方平方平方平方:100,25,1,25,0,1,25,49,9 100,25,1,25,0,1,
4、25,49,9,00235235 2=0.050.05 2 20.050.050.050.052.2.两个样本方差的显著性检验两个样本方差的显著性检验单个样本方差的显著性检验单个样本方差的显著性检验,是在样本统计量与是在样本统计量与零假设所提出的总体参数作比较,检验需要事零假设所提出的总体参数作比较,检验需要事先提出合理的参数作为假设值。先提出合理的参数作为假设值。在实际工作中常常选择两个样本,一个作为处在实际工作中常常选择两个样本,一个作为处理,一个作为对照,在两个样本之间作比较,理,一个作为对照,在两个样本之间作比较,判断他们之间的差异可否用偶然性判断他们之间的差异可否用偶然性(误差误差)
5、来解来解释释;若不能若不能,则认为两个处理之间有显著差异,则认为两个处理之间有显著差异,从而认为两个样本不是来自同一个总体从而认为两个样本不是来自同一个总体.例:测定例:测定2020位青年男子和位青年男子和2020位老年男子的血压值位老年男子的血压值(收缩压(收缩压mmHgmmHg)如下表,问老年人血压值个体间)如下表,问老年人血压值个体间波动是否显著高于青年人?波动是否显著高于青年人?青年男子青年男子老年男子老年男子序号血压序号血压序号血压序号血压1981112311201113321601212521221222031361312931141312041281413241301418251
6、301515451551513061141611561161613971231712671401719081341813281601812491281913691001911010107201301010520130一般大方差作分子,小方差作分一般大方差作分子,小方差作分一般大方差作分子,小方差作分一般大方差作分子,小方差作分母(右尾检验:假定母(右尾检验:假定母(右尾检验:假定母(右尾检验:假定 1 1 2 2)如果对一正态总体在特定的如果对一正态总体在特定的如果对一正态总体在特定的如果对一正态总体在特定的dfdfdfdf1 1 1 1和和和和dfdfdfdf2 2 2 2下进行一系列随机下
7、进行一系列随机下进行一系列随机下进行一系列随机独立抽样,则所有的独立抽样,则所有的独立抽样,则所有的独立抽样,则所有的F F F F构成构成构成构成一个分布一个分布一个分布一个分布F F F F分布分布分布分布二、样本均数的显著性检验1.t检验检验单个样本均数单个样本均数两个成组样本两个成组样本配对数据的两样本配对数据的两样本2.方差分析方差分析三个或三个以上的样本三个或三个以上的样本【例例4.44.4】按饲料配方规定,每按饲料配方规定,每1000kg1000kg某种饲某种饲料中维生素料中维生素C C不得少于不得少于246g246g,现从工厂的产品,现从工厂的产品中随机抽测中随机抽测1212个
8、样品,测得维生素个样品,测得维生素C C含量如下:含量如下:255255、260260、262262、248248、244244、245245、250250、238238、246246、248248、258258、270g/1000kg270g/1000kg,若样,若样品的维生素品的维生素C C含量服从正态分布,问此产品是含量服从正态分布,问此产品是否符合规定要求?否符合规定要求?1.1.单个样本平均数的显著性检验单个样本平均数的显著性检验H0:HA:H0:HA:FF F,结则误差引起的概率结则误差引起的概率P,P,在在概率水概率水平上否定平上否定H H0 0;即各;即各i i不全相等,处理有
9、效。不全相等,处理有效。TiT表表1。不同饲料配方对鱼的增重的影响。不同饲料配方对鱼的增重的影响 F F值显著或极显著,否定了无效假设值显著或极显著,否定了无效假设H HO O,表明试,表明试验的总变异主要来源于处理间的变异,试验中验的总变异主要来源于处理间的变异,试验中各处各处理平均数不全相等或处理效应不为零理平均数不全相等或处理效应不为零,但并不意味但并不意味着每两个处理平均数间的差异都显著或极显著着每两个处理平均数间的差异都显著或极显著,也,也不能具体说明哪些处理平均数间有显著或极显著差不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。异,哪些差异不显著。因而有因而有还必须
10、进行两两处理还必须进行两两处理均数间的比较均数间的比较,以具体判断两两处理均数间的差异,以具体判断两两处理均数间的差异显著性。显著性。统计上把多个平均数两两间的相互比较称统计上把多个平均数两两间的相互比较称为为多重比较多重比较(multiple comparisons)多重比较方法及结果表示多重比较方法及结果表示(1 1)最小显著差数法)最小显著差数法(LSDLSD法法)(2 2)最小显著极差法)最小显著极差法(LSRLSR法法)a q a q检验法检验法 b b 新复极差法新复极差法常用的多重比较的方法常用的多重比较的方法 (1 1)最小显著差数法)最小显著差数法 (LSD法,法,least
11、 significant difference)基本作法:在基本作法:在F F检验显著的前提下,先计算出显检验显著的前提下,先计算出显著水平为著水平为的最小显著差数的最小显著差数 ,然后将任,然后将任意两个处理平均数的差数的绝对值意两个处理平均数的差数的绝对值 与与最小显著差数作比较。最小显著差数作比较。若若 LSDLSD时,则时,则 与与 在在水平水平上差异显著;反之,则在上差异显著;反之,则在水平上差异不显著。水平上差异不显著。最小显著差数由下式计算。最小显著差数由下式计算。LSD LSD 法实质上就是法实质上就是t t检验法检验法。它是将。它是将 t t 检验中由检验中由所求得的所求得的
12、t t之绝对值之绝对值 与临界与临界t ta a值的比较转为将各对均数差值的绝对值值的比较转为将各对均数差值的绝对值与最小显著差数与最小显著差数 的比较而作出统计推断的比较而作出统计推断的。但是,由于的。但是,由于LSDLSD法是利用法是利用F F检验中的误差自由度检验中的误差自由度dfdf e e 查临界查临界t t值,利用误差均方值,利用误差均方 计算均数计算均数差异标准误差异标准误 ,因而又不同于每次利用两组数,因而又不同于每次利用两组数据进行多个平均数两两比较的检验法。据进行多个平均数两两比较的检验法。LSDLSD法适用于各处理组与对照组比较法适用于各处理组与对照组比较而处理组间不进而
13、处理组间不进行比较的比较形式。行比较的比较形式。(2)(2)最小显著极差法最小显著极差法 (LSRLSR法法 ,Least significant ranges),Least significant ranges)LSR LSR法的特点是把平均数的差数看成是平均数的极差,法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数根据极差范围内所包含的处理数(称为称为秩次距秩次距)k 的不同的不同而采用不同的检验尺度,以克服而采用不同的检验尺度,以克服LSDLSD法的不足。这些在法的不足。这些在显著水平显著水平上依秩次距上依秩次距 k 的不同而采用的不同的检验的不同而采用的不同的检
14、验尺度,即尺度,即最小显著极差最小显著极差LSRLSR。当一个平均数大集合的极差不显著时,其中所包含的当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。各个较小集合极差也应一概作不显著处理。常用的常用的LSRLSR法有法有q q检验法和新复极差法两种。检验法和新复极差法两种。a.a.q q检验法检验法又称又称SNKSNK检验检验(Student-Newman-Keuls)(Student-Newman-Keuls)b.b.新复极差法新复极差法(new multiple range method),(new multiple range method),由由邓肯
15、邓肯 (Duncan)(Duncan)提出,故又称提出,故又称DuncanDuncan法法,也称,也称SSRSSR法法(shortest significant ranges)(shortest significant ranges)2.多重比较结果的表示法多重比较结果的表示法各平均数经多重比较后,应以简明的形式将结果表各平均数经多重比较后,应以简明的形式将结果表示出来,常用的表示方法有以下两种。示出来,常用的表示方法有以下两种。l梯形比较法梯形比较法 此法是将多重比较结果直接标记在此法是将多重比较结果直接标记在平均数多重比较表上,如表平均数多重比较表上,如表6-46-4所示。此法的优所示。此
16、法的优点是简便直观,缺点是占的篇幅较大。点是简便直观,缺点是占的篇幅较大。l标记字母法标记字母法 此法是先将各处理平均数由大到此法是先将各处理平均数由大到小自上而下排列小自上而下排列 ;然后在最大平均数后标记字;然后在最大平均数后标记字母,并将该平均数与以下各平均数依次相比,凡母,并将该平均数与以下各平均数依次相比,凡差异不显著标记同一字母,直到某一个与其差异差异不显著标记同一字母,直到某一个与其差异显著的平均数标记字母显著的平均数标记字母b b;三、频率的显著性检验三、频率的显著性检验l l服从二项分布的数据在样本含量服从二项分布的数据在样本含量n n足够大,足够大,p p不不是特别小(一般
17、)是特别小(一般),且且np np 和和nqnq均大于均大于3030时,时,二项分布接近于正态分布即二项分布接近于正态分布即N N(p,pq/np,pq/n)。)。(1 1)样本百分数与总体百分数的)样本百分数与总体百分数的差异显著性检验差异显著性检验l l【例例4.84.8】据往年调查某地区的乳牛隐性乳房据往年调查某地区的乳牛隐性乳房炎一般为炎一般为30%30%,现对某牛场,现对某牛场 500 500 头乳牛进行检测,头乳牛进行检测,结果有结果有175175头乳牛凝集反应阳性,问该牛场的隐头乳牛凝集反应阳性,问该牛场的隐性乳房炎是否与往年相同?性乳房炎是否与往年相同?二项分布数据是离散型数据,用连续型数据的二项分布数据是离散型数据,用连续型数据的正态分布近似有误差:正态分布近似有误差:【例例4.94.9】某养猪场第一年饲养杜长大商品仔某养猪场第一年饲养杜长大商品仔猪猪98009800头,死亡头,死亡980980头;第二年饲养杜长大商品头;第二年饲养杜长大商品仔猪仔猪1000010000头,死亡头,死亡950950头,试检验第一年仔猪头,试检验第一年仔猪死亡率与第二年仔猪死亡率是否有显著差异?死亡率与第二年仔猪死亡率是否有显著差异?此例,两样本死亡率分别为:此例,两样本死亡率分别为:合并的样本死亡率为:合并的样本死亡率为:
限制150内