《统计推断原理和步骤精品文稿.ppt》由会员分享,可在线阅读,更多相关《统计推断原理和步骤精品文稿.ppt(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计推断原理和步骤第1页,本讲稿共66页本章主要介绍统计推断的意义、原理,统计推断与抽样分布的关系,统计推断的思路和一般步骤,两尾检验和一尾检验,统计推断可能犯的两类错误及防止方法第2页,本讲稿共66页生物统计学的一个重要任务是要生物统计学的一个重要任务是要知道知道所研究总体的特征值所研究总体的特征值(参数)(参数)但是总体特征值一般难以知道:但是总体特征值一般难以知道:一方面是由于总体很一方面是由于总体很大大,即,即N 大,有时是大,有时是无限无限的(无的(无限总体,限总体,N ),因此不可能逐一调查清楚),因此不可能逐一调查清楚另一方面,有时所要研究的总体目前并不存在,或者只能另一方面,有
2、时所要研究的总体目前并不存在,或者只能说是说是虚拟虚拟存在(总体是虚的),无法进行调查存在(总体是虚的),无法进行调查作某一试验时更是如此作某一试验时更是如此 第3页,本讲稿共66页但不管是何种类型的总体,我们总是可以通过随机抽样(抽但不管是何种类型的总体,我们总是可以通过随机抽样(抽样调查)的方法获得该总体的随机样本样调查)的方法获得该总体的随机样本通过通过统计推断统计推断来定性或定量地分析所研究总体的特征值来定性或定量地分析所研究总体的特征值统计推断就是用统计推断就是用样本的特征值样本的特征值(统计量)在一定的(统计量)在一定的概率概率保证保证下下推断推断相应相应总体的特征值总体的特征值(
3、参数)(参数)即:随机抽样即:随机抽样 随机样本随机样本 随机样本特征值随机样本特征值 总体特征值总体特征值 (统计量)(统计量)(参数)(参数)计算估计第4页,本讲稿共66页第一节第一节 统计推断的意义和内容统计推断的意义和内容第5页,本讲稿共66页所谓统计推断(所谓统计推断(statistical inference),就是),就是根据统计量根据统计量的分布和概率理论,由样本统计量来推断总体的参数的分布和概率理论,由样本统计量来推断总体的参数实际工作中,一次试验或一次调查所获得的数据资料,实际工作中,一次试验或一次调查所获得的数据资料,通常是一个样本的结果,而我们真正需要知道的是通常是一个
4、样本的结果,而我们真正需要知道的是抽取样本的总体特征抽取样本的总体特征即:统计分析的结论是针对即:统计分析的结论是针对总体参数总体参数而言的,因此,统计推而言的,因此,统计推断是科研工作中一个十分重要的工具,对试验设计也有很断是科研工作中一个十分重要的工具,对试验设计也有很大的指导意义大的指导意义第6页,本讲稿共66页统计推断包括:统计推断包括:统计假设检验(统计假设检验(hypothesis test)参数估计(参数估计(parametric estimation)这样两部分内容这样两部分内容 第7页,本讲稿共66页统计假设检验又称显著性检验(统计假设检验又称显著性检验(significan
5、ce test)其原理和过程是:其原理和过程是:对未知的或不完全知道的总体参数提出一些对未知的或不完全知道的总体参数提出一些假设假设(hypothesis 这些假设通常构成完全事件系),然后这些假设通常构成完全事件系),然后在某一在某一基本假设基本假设的基础上,的基础上,计算计算样本的统计量,并分析样本的统计量,并分析这一统计量的这一统计量的分布规律分布规律最后根据这一统计量作出在一定概率意义下应当最后根据这一统计量作出在一定概率意义下应当接受接受何种假设的结论何种假设的结论第8页,本讲稿共66页这里有一个这里有一个定量定量转化为转化为定性定性的过程:的过程:经计算所得到的统计量一般是呈经计算
6、所得到的统计量一般是呈连续分布连续分布的(定量),但的(定量),但最后的检验结论只有两种:接受最后的检验结论只有两种:接受何种假设何种假设(定性)(定性)即:存在一个即:存在一个临界值临界值,统计量未达到临界值,应当接,统计量未达到临界值,应当接受一种假设受一种假设统计量超过临界值,应当接受另一种假设统计量超过临界值,应当接受另一种假设第9页,本讲稿共66页参数估计包括两部分内容:参数估计包括两部分内容:参数的参数的点估计点估计(point estimation)参数的参数的区间估计区间估计(interval estimation)第10页,本讲稿共66页第二节第二节 统计量的抽样分布与统计推
7、断的关统计量的抽样分布与统计推断的关系系第11页,本讲稿共66页前面已经讲过,由样本的统计量组成的总体分布(抽样分前面已经讲过,由样本的统计量组成的总体分布(抽样分布)其参数与原总体的相应参数有着很密切的布)其参数与原总体的相应参数有着很密切的关系关系同时抽样的结果还告诉我们,样本统计量与总体相应参数之同时抽样的结果还告诉我们,样本统计量与总体相应参数之间存在着一定的间存在着一定的抽样误差抽样误差因此,用样本来推断总体的准确性与抽样误差的因此,用样本来推断总体的准确性与抽样误差的大小大小有有关,抽样误差的大小用关,抽样误差的大小用标准误标准误来衡量来衡量第12页,本讲稿共66页标准误不仅反映了
8、抽样误差的标准误不仅反映了抽样误差的大小大小,而且反映了样本统,而且反映了样本统计量与总体相应参数间的计量与总体相应参数间的差异程度差异程度也反映了用某个样本统计量来估计总体参数的也反映了用某个样本统计量来估计总体参数的准确程准确程度度第13页,本讲稿共66页第三节第三节 统计假设检验统计假设检验第14页,本讲稿共66页一、统计假设检验的基本思路一、统计假设检验的基本思路为了说明问题,我们举几个例子进行讨论为了说明问题,我们举几个例子进行讨论例例1、随机抽取一批小鼠,随机分为两组,一组注射催随机抽取一批小鼠,随机分为两组,一组注射催产素,一组作为对照(即不注射催产素),半小时后产素,一组作为对
9、照(即不注射催产素),半小时后检查这两组小鼠的血糖含量,得:注射催产素组为:检查这两组小鼠的血糖含量,得:注射催产素组为:=106.88 对照组平均值为:对照组平均值为:=109.17 同时我们也发现,同一组内的小鼠其血糖含量也是不同的同时我们也发现,同一组内的小鼠其血糖含量也是不同的两组小鼠的平均血糖含量之间有个差:两组小鼠的平均血糖含量之间有个差:第15页,本讲稿共66页那么我们是否可以认为这个差值就是由于催产素注那么我们是否可以认为这个差值就是由于催产素注射与否的结果?显然仅凭这一差值射与否的结果?显然仅凭这一差值-2.29 是不能是不能说明问题的说明问题的第16页,本讲稿共66页例例2
10、、比较不同日龄(、比较不同日龄(d)正常白化小鼠血浆含)正常白化小鼠血浆含N量,得如下量,得如下一批数据:一批数据:日龄日龄 血浆含血浆含 N 量量35d()0.98 0.83 0.94 0.90 0.99 0.92 0.87 0.86 0.8190d()1.00 1.08 0.97 0.93 1.03 0.94 1.11 1.10对这两组数据进行计算,得:对这两组数据进行计算,得:35d组小鼠的组小鼠的90d组小鼠的组小鼠的发现两组小鼠的血浆含发现两组小鼠的血浆含N量有差异:量有差异:第17页,本讲稿共66页那么我们能否仅凭这一差异就认为日龄的不同,其血浆含那么我们能否仅凭这一差异就认为日龄
11、的不同,其血浆含N量就有差异呢?量就有差异呢?35d的小鼠中也有含的小鼠中也有含N量高的(如量高的(如0.99 0.98 0.94)90d的小鼠中也有含的小鼠中也有含N量低的(如量低的(如0.93 0.94)即:同一组内的小鼠其血浆含即:同一组内的小鼠其血浆含N量之间也是有差异的量之间也是有差异的第18页,本讲稿共66页例例3、某孵化场宣传说该场孵化的鸡苗成活率为某孵化场宣传说该场孵化的鸡苗成活率为90%,我们,我们能轻易相信吗?是否需要做一个试验?如果试验结能轻易相信吗?是否需要做一个试验?如果试验结果是果是100羽苗鸡仅成活了羽苗鸡仅成活了88羽(羽(p=0.88),我们就能),我们就能否
12、定该场的宣传效果吗?否定该场的宣传效果吗?如果我们再做一次呢?我们能一直不断地做下去吗?如果我们再做一次呢?我们能一直不断地做下去吗?第19页,本讲稿共66页例例4、试验某种治疗鸡白痢病的新药,将其与常规药试验某种治疗鸡白痢病的新药,将其与常规药物相比较,对物相比较,对400羽鸡施用常规药物,康复了羽鸡施用常规药物,康复了340羽(康复率羽(康复率 ),相应的,对),相应的,对500羽鸡施羽鸡施用新药,有用新药,有435羽康复了(康复率羽康复了(康复率 ),),我们是否就可以认为新药一定好于常规药物?我们是否就可以认为新药一定好于常规药物?第20页,本讲稿共66页以上几个例题提醒我们,有以下几
13、个以上几个例题提醒我们,有以下几个问题问题是需要我们是需要我们加以注意的:加以注意的:a.我们不可能用我们不可能用总体总体来做试验,各方面的条件不许可我来做试验,各方面的条件不许可我们这样做,也没有必要这样做们这样做,也没有必要这样做b.我们只能用我们只能用样本样本来做试验,且由于时间、经费、人力来做试验,且由于时间、经费、人力等因素的限制,一般同一个试验只能做一次,通过等因素的限制,一般同一个试验只能做一次,通过一一次试验次试验就希望能得到一个比较可靠的结果就希望能得到一个比较可靠的结果c.试验结束以后,用试验结束以后,用什么什么来作为检验的对象?那就是来作为检验的对象?那就是样本样本的的平
14、均值平均值:第21页,本讲稿共66页用样本的平均值来检验总体平均值用样本的平均值来检验总体平均值用两个样本平均值的差异来检验相应两个总体平均值用两个样本平均值的差异来检验相应两个总体平均值的差异的差异用样本平均值作为检验对象的理由是:用样本平均值作为检验对象的理由是:1、我们已经证明了我们已经证明了 为为最小最小,这说明样本平均值,这说明样本平均值 与各变量与各变量 的差异最小,因此的差异最小,因此 是样本资料最好的是样本资料最好的代表代表2、在抽样分布中,我们已经证明了样本平均值在抽样分布中,我们已经证明了样本平均值 是总是总体平均值体平均值 的的无偏估计量无偏估计量,即,即 的数学期望是的
15、数学期望是第22页,本讲稿共66页3、中心极限定理告诉我们:样本平均值中心极限定理告诉我们:样本平均值 服从或近似服从或近似服从服从正态分布正态分布 上述三点,说明样本平均值上述三点,说明样本平均值 可以作为检验的对象可以作为检验的对象但是我们又不能但是我们又不能仅仅凭样本平均值的大小就贸然下结论,凭样本平均值的大小就贸然下结论,认为试验有效或试验无效认为试验有效或试验无效我们必须通过我们必须通过检验检验(test)为什么?为什么?第23页,本讲稿共66页因为任何一次试验都存在误差,即同一组内的观测值都因为任何一次试验都存在误差,即同一组内的观测值都不会完全相同,在正常试验条件下,同一组内的数
16、据不会完全相同,在正常试验条件下,同一组内的数据之间的差异,一般就是误差之间的差异,一般就是误差每一个观测值都是试验的表观效应,每一个数据都可以每一个观测值都是试验的表观效应,每一个数据都可以分成两个部分,即试验(处理)效应和误差(各种偶分成两个部分,即试验(处理)效应和误差(各种偶然因素引起的差异)然因素引起的差异)同一总体中的个体所受到的各种偶然因素是不等的同一总体中的个体所受到的各种偶然因素是不等的每一个数据中所包含的偶然因素是独立的每一个数据中所包含的偶然因素是独立的就总体而言,这种偶然因素的影响是相互抵消的就总体而言,这种偶然因素的影响是相互抵消的第24页,本讲稿共66页用统计学自己
17、的语言来讲,就是:用统计学自己的语言来讲,就是:每一个观测值都有自每一个观测值都有自己独立的试验误差己独立的试验误差,因此,我们有以下公式存在:,因此,我们有以下公式存在:观测值(表观效应)观测值(表观效应)=处理效应处理效应+误差效应误差效应 即:即:进行样本平均,得:进行样本平均,得:同样,两个样本平均值的差异也可以这样分解:同样,两个样本平均值的差异也可以这样分解:第25页,本讲稿共66页实际上,我们感兴趣的、即我们关心的重点是:实际上,我们感兴趣的、即我们关心的重点是:我们试验所得到的表观效应主要是由我们试验所得到的表观效应主要是由处理效应处理效应所引起、还所引起、还是由是由抽样误差抽
18、样误差所引起?应当进行所引起?应当进行权衡权衡第26页,本讲稿共66页结合上面的实例:结合上面的实例:两组小鼠的平均血糖含量之间的差异是否由催产素的两组小鼠的平均血糖含量之间的差异是否由催产素的注射与否所引起?注射与否所引起?不同日龄正常白化小鼠血浆含不同日龄正常白化小鼠血浆含N量的差异是否由于小鼠的量的差异是否由于小鼠的日龄不同而引起?日龄不同而引起?实际试验中苗鸡的成活率与孵化场宣传之间的差异是真实差实际试验中苗鸡的成活率与孵化场宣传之间的差异是真实差异吗?即孵化场是否真的言过其实了?还是试验时的抽样异吗?即孵化场是否真的言过其实了?还是试验时的抽样误差?误差?新药和常规药物之间的差异是否
19、由偶然因素引起?新药和常规药物之间的差异是否由偶然因素引起?第27页,本讲稿共66页为了使得这种比较和权衡所得到的结论更可靠、更科学、为了使得这种比较和权衡所得到的结论更可靠、更科学、更合理、更可信、更正确,必须对试验和统计分析提更合理、更可信、更正确,必须对试验和统计分析提出如下要求:出如下要求:1、合理合理地进行试验设计,地进行试验设计,正确正确地进行试验操作,地进行试验操作,无误无误地进行抽样,地进行抽样,仔细仔细地进行记录,地进行记录,认真认真地进行校对,以地进行校对,以有有效效地降低试验误差,尽可能地降低试验误差,尽可能避免避免系统误差,系统误差,杜绝杜绝人为人为错误,使样本真正代表
20、总体,对试验效应和试验误错误,使样本真正代表总体,对试验效应和试验误差作出差作出无偏无偏的估计的估计2、合理合理地、地、正确正确地分析试验结果,以得出有关总体参地分析试验结果,以得出有关总体参数假设的统计推断数假设的统计推断第28页,本讲稿共66页二二 统计假设检验的一般步骤统计假设检验的一般步骤我们以大样本资料或样本虽小但总体方差为已知的情况我们以大样本资料或样本虽小但总体方差为已知的情况(u-test)来说明统计假设检验的一般步骤)来说明统计假设检验的一般步骤统计假设检验的基本原理和思路是这样的:统计假设检验的基本原理和思路是这样的:首先首先根据具体的试验目的提出一个假设(根据具体的试验目
21、的提出一个假设(hypothesis)(然后在假定这一假设成立(或正确)的前提下进行试验,(然后在假定这一假设成立(或正确)的前提下进行试验,并取得数据)并取得数据)然后然后同样在这一假设成立(或正确)的前提下,对这些数同样在这一假设成立(或正确)的前提下,对这些数据或资料进行统计分析,获得该假设成立(或正确)的据或资料进行统计分析,获得该假设成立(或正确)的概率值概率值第29页,本讲稿共66页最后最后根据所获得概率的大小判断所作假设是否成立:根据所获得概率的大小判断所作假设是否成立:a、如果所得概率较大,就表明我们如果所得概率较大,就表明我们没有足够的理由来否没有足够的理由来否定定所作的假设
22、,即我们必须接受这一假设;所作的假设,即我们必须接受这一假设;b、如果所得概率很小,就表示这一假设不大可能成立,如果所得概率很小,就表示这一假设不大可能成立,应予以否定,从而接受这一假设的对立假设,即应予以否定,从而接受这一假设的对立假设,即接受接受备备择假设择假设上面的上面的a和和b必有一条被否定,另一条被接受必有一条被否定,另一条被接受第30页,本讲稿共66页尽管所计算的概率值是连续变化的,但我们往往设定一个尽管所计算的概率值是连续变化的,但我们往往设定一个概率概率临界值临界值(如(如p=0.05、p=0.01等等),根据所得概等等),根据所得概率值是大于率值是大于p=0.05、还是小于还
23、是小于p=0.05来决定所作假设来决定所作假设是否成立(或正确)是否成立(或正确)因此,概率值是连续分布的(定量),但假设的接受因此,概率值是连续分布的(定量),但假设的接受与否只有两类(定性)与否只有两类(定性)第31页,本讲稿共66页这里我们首先复习一下这里我们首先复习一下u的概念:的概念:在这一式子中,显然在这一式子中,显然 与与 的距离越小,的距离越小,u值就越小,查值就越小,查标准正态分布表,得到的概率值越大,表明标准正态分布表,得到的概率值越大,表明 出现出现的概率越大;反之,的概率越大;反之,与与 的距离越大,的距离越大,u值就越大,值就越大,查标准正态分布表,得到的概率值就越小
24、,表明查标准正态分布表,得到的概率值就越小,表明 出现出现的概率就越小的概率就越小当这一概率小到一定程度时,我们就可以认为这一当这一概率小到一定程度时,我们就可以认为这一 似乎不大可能在一次试验中出现,亦即这一似乎不大可能在一次试验中出现,亦即这一 所在所在总体的平均值与设定总体的平均值总体的平均值与设定总体的平均值不等不等,即两个总,即两个总体体不是不是同一个总体同一个总体第32页,本讲稿共66页反之,我们就没有理由认为反之,我们就没有理由认为 所在总体与所设定的所在总体与所设定的总体不是同一个总体总体不是同一个总体在统计检验中所设定的、用以作为资料分析和最终在统计检验中所设定的、用以作为资
25、料分析和最终判断基础的假设称为无效假设,判断基础的假设称为无效假设,无效假设无效假设又称为又称为解消假设(解消假设(null hypothesis),用),用 表示表示第33页,本讲稿共66页所谓无效假设可以这样理解:我们的试验是所谓无效假设可以这样理解:我们的试验是“无效无效”的,即的,即试验结束以后,所得到的样本平均值并没有试验结束以后,所得到的样本平均值并没有“超超”出设定出设定的总体范围,即试验后得到的样本平均值其效果的总体范围,即试验后得到的样本平均值其效果不见得好不见得好于于原定的效果,即样本平均值所在总体与原设定的总体原定的效果,即样本平均值所在总体与原设定的总体其实是同一个总体
26、,两者的平均值其实是同一个总体,两者的平均值 和和 并没有本质的并没有本质的差异,两者之间的差异是由抽样误差引起的差异,两者之间的差异是由抽样误差引起的无效假设的写法:无效假设的写法:第34页,本讲稿共66页无效假设的含义就是:试验后所得到的样本平均值与原设定无效假设的含义就是:试验后所得到的样本平均值与原设定的已知总体的平均值之间的差异是由误差所引起的的已知总体的平均值之间的差异是由误差所引起的即样本平均值所在总体与已知总体是同一总体即样本平均值所在总体与已知总体是同一总体无效假设在统计分析后有可能被接受,也有可能被否定无效假设在统计分析后有可能被接受,也有可能被否定为了在无效假设被否定后有
27、可以被接受的假设,我们还为了在无效假设被否定后有可以被接受的假设,我们还应当在无效假设设立的同时设立一个后备假设,这一应当在无效假设设立的同时设立一个后备假设,这一后备假设称为后备假设称为备择假设备择假设,用,用 表示表示第35页,本讲稿共66页即即 备择假设是无效假设被否定后必须被备择假设是无效假设被否定后必须被接受的一个假设(下标接受的一个假设(下标 A 是是 alternative 之意)之意)备择假设和无效假设是一对对立的假设,两者构成备择假设和无效假设是一对对立的假设,两者构成了一个完全事件系了一个完全事件系在根据所得到的概率值进行判断时:在根据所得到的概率值进行判断时:接受了无效假
28、设,就自然摒弃了备择假设接受了无效假设,就自然摒弃了备择假设否定无效假设的同时,就必须接受备择假设否定无效假设的同时,就必须接受备择假设备择假设的含义是:样本所在总体与已知总体不是备择假设的含义是:样本所在总体与已知总体不是同一个总体,即:所得样本并不来自于这一已知同一个总体,即:所得样本并不来自于这一已知总体总体第36页,本讲稿共66页将两个假设写完全:将两个假设写完全:既可以是既可以是 ,也可以是,也可以是在设立假设以后,研究样本平均数的抽样分布,分在设立假设以后,研究样本平均数的抽样分布,分析试验或调查所得样本平均值析试验或调查所得样本平均值 出现的概率出现的概率我们会发现,样本平均值一
29、般不会刚好等于已知总我们会发现,样本平均值一般不会刚好等于已知总体的平均值,两者之间会有一定的差异,这一差体的平均值,两者之间会有一定的差异,这一差异,有可能是抽样误差,也有可能是真实性差异,异,有可能是抽样误差,也有可能是真实性差异,对此,我们需要借助概率原理来进行判断对此,我们需要借助概率原理来进行判断第37页,本讲稿共66页进行这种判断可以从两个角度,即有两种方法:进行这种判断可以从两个角度,即有两种方法:一是假定一是假定 是正确的,在此前提下计算是正确的,在此前提下计算 出出现的概率值,我们可以通过查表的方式来完成:现的概率值,我们可以通过查表的方式来完成:如果所得如果所得 u值出现的
30、概率较大,我们就必须接受值出现的概率较大,我们就必须接受如果所得如果所得 u值出现的概率较小,我们就应当放弃值出现的概率较小,我们就应当放弃 而接受而接受 这里的概率大小,以这里的概率大小,以 =0.05 和和 =0.01作为两个临作为两个临界值界值第38页,本讲稿共66页二是在假定二是在假定 为正确的前提下,对为正确的前提下,对 的抽样划出一个区间,的抽样划出一个区间,这一区间称为接受区间,这一区间是有一定的概率保证这一区间称为接受区间,这一区间是有一定的概率保证的的这一区间之外的部分称为否定区间这一区间之外的部分称为否定区间倘若倘若 落在接受区间内,我们就接受落在接受区间内,我们就接受 反
31、之,倘若反之,倘若 落在接受区间外,我们就否定落在接受区间外,我们就否定 而接受而接受 第39页,本讲稿共66页下面的是接受区间示意图:下面的是接受区间示意图:第40页,本讲稿共66页设这一接受区间的概率保证为设这一接受区间的概率保证为 95%,由于,由于 而而 即即将其变换,得:将其变换,得:为接受区间,其概率为为接受区间,其概率为95%而而 和和 为否定区间,其概率之为否定区间,其概率之和为和为5%同样,同样,为为 99%接受区间接受区间而而 和和 为为 1%的否定区间的否定区间第41页,本讲稿共66页在在 u-test 中中以以 为为 水平上否定无效假设的两个界水平上否定无效假设的两个界
32、限限以以 为为 水平上否定无效假设的两个界水平上否定无效假设的两个界限限第42页,本讲稿共66页最后,根据最后,根据小概率事件实际不可能性原理小概率事件实际不可能性原理接受或否定无效假接受或否定无效假设设小概率事件实际不可能性原理是指在一次试验中,小概率事件实际不可能性原理是指在一次试验中,概率很小概率很小的事件实际上是不可能发生的的事件实际上是不可能发生的因此当因此当 与与 之间的差异其概率小于之间的差异其概率小于 时(我们以时(我们以 作为小概率的第一临界值),就可以认为这不是抽样误作为小概率的第一临界值),就可以认为这不是抽样误差,而是实质性差异,从而否定无效假设差,而是实质性差异,从而
33、否定无效假设第43页,本讲稿共66页现在我们将假设检验的几个步骤归纳一下:现在我们将假设检验的几个步骤归纳一下:提出假设,进行试验,并计算样本平均数抽样分布的离提出假设,进行试验,并计算样本平均数抽样分布的离差差 u 值值查相关附表,查出所得查相关附表,查出所得 u 值出现的概率值,并考察其是否值出现的概率值,并考察其是否大于预先设定的大于预先设定的 值值由小概率原理作出接受或否定无效假设的推断,并结合专业由小概率原理作出接受或否定无效假设的推断,并结合专业知识给出合理、科学的解释知识给出合理、科学的解释需要注意的是,当所得概率小于需要注意的是,当所得概率小于 =0.05 以后,还需根据以后,
34、还需根据具体情况继续考察其是否小于具体情况继续考察其是否小于 =0.01 第44页,本讲稿共66页我们以一个实例来系统地说明假设检验的步骤:我们以一个实例来系统地说明假设检验的步骤:某品种正常仔猪每某品种正常仔猪每 45min 红细胞沉降速度为红细胞沉降速度为 (mm)今抽查某猪场今抽查某猪场 20 头头 2月龄仔猪的红细胞沉降速度,得月龄仔猪的红细胞沉降速度,得如下数据:如下数据:22 21 20 18 25 19 21 26 23 2419 21 23 19 18 23 20 22 21 26试问,这批仔猪的红细胞沉降速度是否正常试问,这批仔猪的红细胞沉降速度是否正常由于该例中已有总体方差
35、,因此虽然样本较小,但应使用由于该例中已有总体方差,因此虽然样本较小,但应使用 u-test 进行检验进行检验第45页,本讲稿共66页该例的核心问题是希望知道:该例的核心问题是希望知道:这批仔猪在红细胞沉降速度这一性状上是否正常这批仔猪在红细胞沉降速度这一性状上是否正常或:这批仔猪与正常仔猪在红细胞沉降速度这一性状上是否或:这批仔猪与正常仔猪在红细胞沉降速度这一性状上是否有所区别有所区别或:这批仔猪在红细胞沉降速度这一性状上是否属于这一猪或:这批仔猪在红细胞沉降速度这一性状上是否属于这一猪品种品种因此,需要知道这批仔猪的红细胞平均沉降速度与总体因此,需要知道这批仔猪的红细胞平均沉降速度与总体猪
36、之间是否有区别猪之间是否有区别即:应检查样本仔猪群的红细胞沉降速度与总体猪群之间即:应检查样本仔猪群的红细胞沉降速度与总体猪群之间的差异是由抽样误差所引起,还是属于真实性差异的差异是由抽样误差所引起,还是属于真实性差异第46页,本讲稿共66页需要注意的是,样本越小,抽样就越要有代表性,需要注意的是,样本越小,抽样就越要有代表性,否则,所得到的结论就可能发生很大的偏差否则,所得到的结论就可能发生很大的偏差首先首先设立无效假设,即设设立无效假设,即设 :样本所在的总体仔猪:样本所在的总体仔猪群与原总体无差异群与原总体无差异 vs :样本所在的总体仔猪:样本所在的总体仔猪群与原总体不是一个总体群与原
37、总体不是一个总体 即设即设该假设可以简化为该假设可以简化为其次其次在无效假设已设立的基础上,计算样本平均值,在无效假设已设立的基础上,计算样本平均值,并计算并计算 u 值值当然我们也可以计算样本的标准差,但这一标准差当然我们也可以计算样本的标准差,但这一标准差在本例中不起作用,因此可以不予考虑在本例中不起作用,因此可以不予考虑第47页,本讲稿共66页经计算,得:经计算,得:查附表查附表1,即标准正态分布的分布函数表,得:,即标准正态分布的分布函数表,得:u=1.49 的的概率为:概率为:这一概率值大于这一概率值大于 即:即:因此,我们应当接受无效假设,即接受因此,我们应当接受无效假设,即接受在
38、接受无效假设的同时,就自动放弃了备择假设在接受无效假设的同时,就自动放弃了备择假设这表示这一仔猪样本其血清镁离子是正常的这表示这一仔猪样本其血清镁离子是正常的对这一结果我们可以从专业的角度进行合理的解释对这一结果我们可以从专业的角度进行合理的解释第48页,本讲稿共66页下面我们将这一例题系统归置一下:下面我们将这一例题系统归置一下:某品种正常某品种正常2月龄仔猪每月龄仔猪每45min红细胞沉降速度红细胞沉降速度(mm)为)为今抽查某猪场今抽查某猪场20头头2月龄仔猪的红细胞沉降速度,月龄仔猪的红细胞沉降速度,得如下数据:得如下数据:22 21 20 18 25 19 21 26 23 24 1
39、9 21 23 19 18 23 20 22 21 26试问,这批仔猪的红细胞沉降速度是否正常试问,这批仔猪的红细胞沉降速度是否正常经计算,得:经计算,得:第49页,本讲稿共66页设设查附表查附表1,u=1.49 的概率为的概率为 p=0.14 0.05接受无效假设,即:这批仔猪的红细胞沉降速度属接受无效假设,即:这批仔猪的红细胞沉降速度属正常范围正常范围第50页,本讲稿共66页该题也可以这样完成:该题也可以这样完成:设立无效假设(同前)设立无效假设(同前)计算接受区间:计算接受区间:由于由于 处于这一接受区间内,因此,应接受无处于这一接受区间内,因此,应接受无效假设效假设即:这批仔猪的红细胞
40、沉降速度在正常范围内即:这批仔猪的红细胞沉降速度在正常范围内第51页,本讲稿共66页接受无效假设时,就说样本平均数与已知总体平均接受无效假设时,就说样本平均数与已知总体平均数间数间差异不显著差异不显著如果在如果在 水平上否定了无效假设而接受备择水平上否定了无效假设而接受备择假设,我们就说假设,我们就说差异显著差异显著如果在如果在 水平上否定了无效假设而接受备择水平上否定了无效假设而接受备择假设,就说假设,就说差异极显著差异极显著第52页,本讲稿共66页三、一尾检验和两尾检验三、一尾检验和两尾检验从上面的例子我们可以看出,仔猪红细胞沉降速度的从上面的例子我们可以看出,仔猪红细胞沉降速度的样本平均
41、值有可能大于总体平均值,也有可能小于样本平均值有可能大于总体平均值,也有可能小于总体平均值总体平均值即所得即所得 u 值可能会是负值,在左边判断是接受或否定无效假值可能会是负值,在左边判断是接受或否定无效假设设这这 u 值也有可能是正值,在右边判断是接受或否定无效假值也有可能是正值,在右边判断是接受或否定无效假设设这种既要考虑左边否定区,又要考虑右边否定区,即这种既要考虑左边否定区,又要考虑右边否定区,即须考虑分布曲线两边(即两尾)的检验称为须考虑分布曲线两边(即两尾)的检验称为两尾检两尾检验验第53页,本讲稿共66页这是由于事先我们并不知道所得样本平均数是否肯定大这是由于事先我们并不知道所得
42、样本平均数是否肯定大于总体平均值,还是肯定小于总体平均值于总体平均值,还是肯定小于总体平均值在大多数情况下,一种措施有可能其效应是正向的,也在大多数情况下,一种措施有可能其效应是正向的,也有可能是负向的,即事先我们并不知道抽样或试验的有可能是负向的,即事先我们并不知道抽样或试验的结果会朝向哪个方向,因此我们的备择假设只能是:结果会朝向哪个方向,因此我们的备择假设只能是:这里的这里的 HA,既包含了,既包含了 ,又包含了,又包含了这种两尾检验是应用最广泛的一种检验方法这种两尾检验是应用最广泛的一种检验方法第54页,本讲稿共66页但有的时候,我们的目的非常明确,即所抽样本只可但有的时候,我们的目的
43、非常明确,即所抽样本只可能是大于总体平均值,或只可能是小于总体平均值能是大于总体平均值,或只可能是小于总体平均值例如:某种新型饲料添加剂只可能好于常规添加剂例如:某种新型饲料添加剂只可能好于常规添加剂某些有毒物质只能对被试动物产生毒害作用,等等某些有毒物质只能对被试动物产生毒害作用,等等这一类试验的数据假设检验其备择假设只有一种情况,这一类试验的数据假设检验其备择假设只有一种情况,即只有一个否定区间(一尾)即只有一个否定区间(一尾)这样的假设检验就称为一尾检验这样的假设检验就称为一尾检验第55页,本讲稿共66页一尾检验比两尾检验更容易否定无效假设,因此应用一尾检一尾检验比两尾检验更容易否定无效
44、假设,因此应用一尾检验必须有非常充分的理由验必须有非常充分的理由在常用的假设检验中,我们在常用的假设检验中,我们一般总一般总采用两尾检验,而对采用两尾检验,而对一尾检验应谨慎使用一尾检验应谨慎使用第56页,本讲稿共66页两尾检验和一尾检验的比较:两尾检验和一尾检验的比较:第57页,本讲稿共66页四、假设检验的两类错误四、假设检验的两类错误在假设检验中,接受或否定无效假设的理论依据是在假设检验中,接受或否定无效假设的理论依据是小概率小概率事件的实际不可能性原理事件的实际不可能性原理因此,所得结论并不是百分之百的正确的因此,所得结论并不是百分之百的正确的事实上,统计假设检验有可能犯两类事实上,统计
45、假设检验有可能犯两类错误错误:第58页,本讲稿共66页如果如果 是正确的,即是正确的,即 为真,但检验的结论由于为真,但检验的结论由于差差异显著异显著而被我们否定掉了(此时,我们须冒而被我们否定掉了(此时,我们须冒5%下错下错结论的风险),或由于结论的风险),或由于差异极显著差异极显著而被我们否定掉了而被我们否定掉了(须冒(须冒1%下错结论的风险),因而犯了错,这一类错误下错结论的风险),因而犯了错,这一类错误就称为就称为型型错误,或称错误,或称 型型错误,错误,犯犯型错误的概率型错误的概率不超过不超过显著水平显著水平 值值 犯犯型错误的实质就是把型错误的实质就是把非真实性差异非真实性差异错判
46、为错判为真实性差真实性差异异,即,即弃真弃真第59页,本讲稿共66页如果无效假设如果无效假设 是错误的,即是错误的,即 为假,检验结果却为假,检验结果却发现发现差异不显著差异不显著而被接受,同时摒弃了正确的备择而被接受,同时摒弃了正确的备择假设假设 在统计学中,所谓的在统计学中,所谓的差异不显著差异不显著,其真实含义是,其真实含义是没有充没有充分的理由否定分的理由否定 ,但也没有理由接受但也没有理由接受 但我们所执行的是非此即彼原则,因此,既然差异不但我们所执行的是非此即彼原则,因此,既然差异不显著,就必须接受显著,就必须接受 这一类错误称为这一类错误称为型错误,或称为型错误,或称为 型错误,
47、型错误,型错型错误的概率用误的概率用 表示表示第60页,本讲稿共66页这里的差异不显著,有两种含义:这里的差异不显著,有两种含义:一是样本所在总体与已知总体间的确没有差异,样本平均一是样本所在总体与已知总体间的确没有差异,样本平均值与已知总体平均值间的差异纯属值与已知总体平均值间的差异纯属抽样误差抽样误差二是样本所在总体与已知总体间有差异,但由于二是样本所在总体与已知总体间有差异,但由于试验误试验误差大差大而掩盖掉了这种差异而掩盖掉了这种差异型错误就是把型错误就是把真实性差异真实性差异错判为错判为非真实性差异非真实性差异,即虽,即虽然然 是是假假的,但通过检验却被的,但通过检验却被接受接受了,
48、同时摒了,同时摒弃了真的弃了真的 ,这称为,这称为存伪存伪第61页,本讲稿共66页不同不同 时的时的 值值第62页,本讲稿共66页在统计推断中,我们作出一个判断,有两个方向的错误可在统计推断中,我们作出一个判断,有两个方向的错误可能存在,这说明我们不能绝对地肯定,也不应绝对地否能存在,这说明我们不能绝对地肯定,也不应绝对地否定某一假设定某一假设因此,有一定的把握,但也有一定的犯错率,这就是统计推因此,有一定的把握,但也有一定的犯错率,这就是统计推断的特点、统计学的概率性特征断的特点、统计学的概率性特征下面我们用表的形式来说明两类错误与假设的关系下面我们用表的形式来说明两类错误与假设的关系 接受
49、接受 否定否定无效假设是正确的(无效假设是正确的(为真)为真)(弃真)(弃真)无效假设是错误的(无效假设是错误的(为假)为假)(存伪)(存伪)第63页,本讲稿共66页那么如何减小犯两类错误的可能性?那么如何减小犯两类错误的可能性?1、样本容量样本容量 n 固定时,提高显著水平(取较小的固定时,提高显著水平(取较小的 值)可值)可减小减小 型错误的概率,但可能增大犯型错误的概率,但可能增大犯 型错误的概率(但型错误的概率(但 )2、样本容量样本容量 n、显著水平显著水平 固定时,增大固定时,增大 与与 的差的差距,可有效减小犯距,可有效减小犯型错误的概率型错误的概率3、为了同时降低犯两类错误的概率,可取一个适当的为了同时降低犯两类错误的概率,可取一个适当的显著水平,如取显著水平,如取 ,增大样本容量,增大样本容量 n;或减小总;或减小总体方差体方差 ;或两者同时进行;或两者同时进行第64页,本讲稿共66页4、改进试验技术,合理、科学地安排试验设计,适改进试验技术,合理、科学地安排试验设计,适当增大样本容量,可有效降低犯错的可能性当增大样本容量,可有效降低犯错的可能性 (*)第65页,本讲稿共66页end第66页,本讲稿共66页
限制150内