第三章spss生物统计学课件.ppt
第三章spss生物统计学第1页,此课件共62页哦 尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。本章以平均数的差异显著性检验平均数的差异显著性检验为例阐明显著性检验的原理,介绍几种几种t t检验的方法检验的方法,然后介绍总体均数的区间估计总体均数的区间估计。第2页,此课件共62页哦 第一节第一节 显著性检验的基本原理显著性检验的基本原理 第二节第二节 样本均数与总体均数的差异显著样本均数与总体均数的差异显著 性检验性检验 第三节第三节 两样本平均数的差异显著性检验两样本平均数的差异显著性检验 第四节第四节 显著性检验中应注意的问题显著性检验中应注意的问题 第五节第五节 总体均数的区间估计总体均数的区间估计第3页,此课件共62页哦第一节第一节 显著性检验的基本原理显著性检验的基本原理 一、显著性检验的意义一、显著性检验的意义 二、显著性检验的基本步骤二、显著性检验的基本步骤 三、显著水平与两类错误三、显著水平与两类错误 四、双侧检验与单侧检验四、双侧检验与单侧检验第4页,此课件共62页哦一、显著性检验的意义一、显著性检验的意义 本节的内容主要是解决这样几个问题,即进行显著性检验的目的、检验对象、基本思想和基本前提是什么?下面结合具体例子来说明。(一一)为什么要进行显著性检验?为什么要进行显著性检验?在某种猪场随机抽测了甲、乙两品种经产母猪各10头的产仔初生窝重:甲品种10头母猪产仔平均初生窝重 标准差 ;乙品种10头母猪产仔平均初生窝重 ,标准差 。kgx50.131kgS81.11kgx63.111kgS63.12第5页,此课件共62页哦 问题:问题:能否仅凭这两个样本均数差值 立即得出甲、乙两品种母猪经产仔初生窝重不同的结论呢?统计学认为,这样得出的结论是不可靠的。这是因为这是因为试验指标既受处理因素的影响,又受试验误差(或抽样误差)的影响。如果我们再分别随机抽测10头甲、乙两品种猪母猪产仔初生窝重,又可得到两个样本资料。两样本均数就不一定是13.5kg和11.63kg,其差值也不一定是1.87kg。怎样通过样本来推断总体呢怎样通过样本来推断总体呢?这正是显著性检验要解决的问题解决的问题。kgxx87.121第6页,此课件共62页哦 (二)检验对象(二)检验对象 设甲品种猪经产母猪产仔初生窝重的总体均数为 ,乙品种的总体均数为 。试验研究(本例为抽样比较)的目的,就是要给 、是否相同做出推断,由于总体均数、未知,在进行显著性检验时只能以样本均数在进行显著性检验时只能以样本均数 、作、作为检验对象为检验对象,更确切地说,是以更确切地说,是以 作为检验对作为检验对象。象。事实上,因为样本均数具有下述特征因为样本均数具有下述特征:离均差的平方和 最小。说明样本平均数与样本各个观察值最接近,平均数是资料的平均数是资料的代表数。代表数。121212)(21xx 21xx、2)(xx第7页,此课件共62页哦 样本平均数是总体均数的无偏估计值,统计学中心极限定理统计学中心极限定理,样本平均数 服从或逼近正态分布。所以,以样本平均数作为检验对象,由两个样本均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。由上所述,一方面我们有依据一方面我们有依据由样本均数 的差异来推断总体均数 、相同与否,另一方另一方面又不能面又不能仅据样本均数表面上的差异直接作出结论,其根本原因在于试验误差(或抽样误差)的不可避免性。)(xEx1221xx、第8页,此课件共62页哦 (三)基本思想(三)基本思想 我们所得到的观察值由两部分组成,即 若样本含量为n,则可得到n个观察值 。于是样本平均数 。说明样本均数并非总样本均数并非总体均数,它还包含试验误差的成分体均数,它还包含试验误差的成分。对于接受不同处理的两个样本来说,则有:iixnxxx,.,21x222111,xx)()()(212121 xx两个样本均数之差两个样本均数之差试验的处理效应试验的处理效应试验误差试验误差第9页,此课件共62页哦 样本平均数的差 包含有试验误差,它不只是试验的表面效应。因此,仅凭 就对总体均数、是否相同下结论是不可靠的。只有通过显著性检验才能从 中提取结论。对对 进行显著性检验就是要分析:进行显著性检验就是要分析:主要由处理效应主要由处理效应 引起的,还是主引起的,还是主要由试验误差所造成?要由试验误差所造成?虽然处理效应处理效应 未知未知,但试验的表面效试验的表面效应应是可以计算可以计算的,借助数理统计方法试验误差试验误差又是可以估计可以估计的。)(21xx)(21xx 12)(21xx)(21xx)(21xx)(21)(21第10页,此课件共62页哦 所以,可从试验的表面效应与试验误差的权衡比较权衡比较中间接地推断间接地推断处理效应是否存在,这就是显著性检验的基本思想显著性检验的基本思想。第11页,此课件共62页哦 (四)基本前提(四)基本前提 为了通过样本对其所在的总体作出符合实际的推断,要求合理进行试验设计,准确地进行试验与观察记载,尽量降低试验误差,避免系统误差,使样本尽可能代表总体。只有从正确、完整而又足够的资料中才能获得可靠的结论。若资料中包含有较大的试验误差与系统误差,有许多遗漏、缺失甚至错误,再好的统计方法也无济于事。因此,收集到正确、完整而又足够的资料是收集到正确、完整而又足够的资料是通过显著性检验获得可靠结论的基本前提通过显著性检验获得可靠结论的基本前提。第12页,此课件共62页哦 小结:小结:(一)显著性检验要解决的问题解决的问题如何通过样本来推断估计总体。(二)检验的对象及其依据对象及其依据样本平均数(根据有三条)。(三)显著性检验的基本思想基本思想从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在。(四)通过检验获得可靠结论的基本前提基本前提收集到正确、完整而又足够的资料。第13页,此课件共62页哦二、显著性检验的基本步骤二、显著性检验的基本步骤 (一一)首先对试验样本所在的首先对试验样本所在的总体总体作假设作假设。这里假设 ,即假设甲、乙两品种猪经产母猪仔猪初生重的总体均数相等,其意义是试验的表面效应 系试验误差,处理无效,故称为无效假设无效假设(null hypothesis),记作 。无效假设无效假设是被检验的假设,通过检验可能被是被检验的假设,通过检验可能被接受,也可能被否定接受,也可能被否定。提出 的同时,相应地有一对应假设,称为备择假设备择假设(alternative hypothesis),记作 。02121或kgxx87.1210H210:HAH第14页,此课件共62页哦 备择假设备择假设是在无效假设被否定时准备接受的假设。本例的备择假设是:甲、乙两品种猪经产母猪仔猪初生窝重的总体均数不相等,记作 亦即存在处理效应,试验的表面效应除包含试验误差外,主要的是含有处理效应在内。(二)(二)在无效假设成立的前提下在无效假设成立的前提下,构造合适,构造合适的统计量,并研究试验所得统计量的抽样分布。的统计量,并研究试验所得统计量的抽样分布。就我们的例子,研究在无效假设 成立的前提下,统计量 的抽样分布。经统计学研究,得到一个 的t分布。(请联系上一章的内容思考如何得出该结论的?)(请联系上一章的内容思考如何得出该结论的?)21:AH210:H)(21xx)1()1(21nndf第15页,此课件共62页哦 其中 为均数差异标准误;分别为两样本的含量、平均数、均方。根据前面两个样本的数据,计算得:)11()1()1()1()1(212122221121nnnnsnsnSxx21xxS22212121,ssxxnn、87.163.115.1321xx837.0)101101()110()110(93.1)110(81.1)110(2221xxS第16页,此课件共62页哦 于是 下面进一步估计出 的两尾概率,即估计 是多少。查附表3,在 时,两尾概率为0.05的临界t值 ,两尾概率为0.01的临界t值 ,即:由于根据两样本数据计算所得的t值为2.234,介于二个临界t值之间,*234.2837.087.12121xxSxxt)234.2(tP234.2t18)110()110(df101.2)18(05.0t878.2)18(01.0t05.0)101.2()101.2()101.2(tPtPtP01.0)878.2()878.2()878.2(tPtPtP01.005.0234.2tt第17页,此课件共62页哦所以,|t|2.234的概率P介于0.01和0.05 之间,即:0.01P0.05 (三)根据(三)根据“小概率事件实际不可能性原理小概率事件实际不可能性原理”否定或接受无效假设。否定或接受无效假设。当一事件发生的概率很小当一事件发生的概率很小(例如小于例如小于0.050.05或或0.01)0.01)时,在一次试验中可以认为其实际上不可时,在一次试验中可以认为其实际上不可能发生,这叫能发生,这叫小概率事件实际不可能性原理。小概率事件实际不可能性原理。|t|2.234的两尾概率的两尾概率 说明试验处理效应不存在,即试验的表面试验的表面效应为试验误差的可能性效应为试验误差的可能性在在0.010.010.050.05之间。之间。第18页,此课件共62页哦 在生物学研究中常以0.05和0.01两个概率作为 某事件是否是小概率事件的标准。若 本例中,按所建立的 ,表面效应为试验误差的概率在0.010.05之间,即无效假设 属于小概率事件,根据小概率原理,故有理由否定 ,从而接受 可以认为甲、乙两品种经产母猪的仔猪初生窝重总体平均数不相同。05.001.001.0PP或小概率事件小概率事件不认为是不认为是小概率事件小概率事件0H0H210:H21:AH第19页,此课件共62页哦 小结(显著性检验的基本步骤):小结(显著性检验的基本步骤):首先对试验样本所在的总体作假设首先对试验样本所在的总体作假设(无效假设和备择假设)。在无效假设成立的前提下在无效假设成立的前提下,构造合适的统计量构造合适的统计量,并研究试验所得统计量的抽样分布。,并研究试验所得统计量的抽样分布。(得出无效假设成立的概率)根据根据“小概率事件实际不可能性原理小概率事件实际不可能性原理”否定或否定或接受无效假设接受无效假设。(在一定的概率保证下,对无效假设是否成立作出判断)第20页,此课件共62页哦 综上所述,显著性检验,从建立假设到最后依概率的大小来决定接受还是否定假设,这一过程实际上应用所谓“概率性质的反证法概率性质的反证法”对试验样本所属总体总体所作假设所作假设的统计证明。对于各种显著性检验的方法,除明确其应用条件应用条件,掌握有关统计运算方法有关统计运算方法外,正确的逻辑推理正确的逻辑推理是不可忽视的。第21页,此课件共62页哦 三、显著水平与两类错误 (一)显著水平(一)显著水平(Significance level)在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著水平显著水平,记作。在生物学研究中常取=0.05=0.05 或或 =0.01=0.01。(二二)显著水平显著水平 在显著性检验在显著性检验(t(t检验检验)中的应用中的应用 若若 ,则说明试验的表面效应属,则说明试验的表面效应属于试验误差的概率于试验误差的概率P P0.050.05,即表面效应属于试,即表面效应属于试验误差的可能性大,不能否定验误差的可能性大,不能否定 。05.0tt 0H第22页,此课件共62页哦 这时称这时称“差异不显著差异不显著”,记为,记为“nsns”或不标记;或不标记;若 ,则说明试验的表面效应属于试验误差的概率P在0.010.05之间,即0.010.01P P0.050.05,亦即表面效应属于试验误差的可能性较小,应否定 ,接受 ,这时称“差差异显著异显著”,记为“*”;若 ,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P0.01P0.01。亦即表面效应属于试验误差的可能性更小,应否定 ,接受 ,这时称“差异极显著差异极显著”,记为“*”。01.005.0ttt0HAH01.0tt0HAH第23页,此课件共62页哦 (三)两类错误(三)两类错误 因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不不论是接受还是否定无效假设,都没有论是接受还是否定无效假设,都没有100100的把的把握握。也就是说,在检验一个假设时可能犯两类错误。第一类错误是真实情况为 成立,却否定了它,犯了“弃真弃真”错误错误,也叫型错误型错误 (type(type error)error)犯犯型错误的概率不会超过型错误的概率不会超过,型错误也叫 错误错误,在医学上还称为假阳性错误假阳性错误。0H第24页,此课件共62页哦 第二类错误是 实际不成立,却接受了它,犯了“纳伪”错误,也叫型错误型错误(type(type error)error)。犯犯型错误的概率记为型错误的概率记为。型错误又叫型错误又叫错误错误,在医学上还称为,在医学上还称为假阴性错误假阴性错误。犯犯型错误型错误可能性可能性的大小与的大小与 取值的大小、两均数差异大取值的大小、两均数差异大小等因素有关。小等因素有关。两类错误间的关系两类错误间的关系 如图所示,图中左边曲线是如图所示,图中左边曲线是 为真时,为真时,的的分布密度曲线;右边曲线是分布密度曲线;右边曲线是 为真时,为真时,的分布密度曲线的分布密度曲线()()。0H210:H)(21xx 210:H)(21xx 21第25页,此课件共62页哦 因此,在检验选用显著水平时,应考虑到这两种错误推推断后果的严重性大小断后果的严重性大小,还应考虑到试验的难易试验的难易,试验试验结果的重要程度结果的重要程度。两类错误示意图两类错误示意图 由图不难看出,当 值变小时,值变小时,值变大值变大;反之,;反之,值变大时,值变大时,值变小。也就是说值变小。也就是说型型错误错误 的降低必然伴随着的降低必然伴随着型错误型错误的升高。的升高。第26页,此课件共62页哦 若一个试验耗费大,可靠性要求高,不允许 反复,那么值应取小些;当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,值亦应取小些。对于一些试验条件不易控制,试验误差较大的试验,可将值放宽到0.1,甚至放宽到0.25。在提高显著水平,即减小值时,为了减小犯型错误的概率,可适当增大样本含量。增大增大样本含量可以同时降低犯两类错误的可能性样本含量可以同时降低犯两类错误的可能性。第27页,此课件共62页哦 两两 类类 错错 误误 的的 关关 系系 客观实际否 定 接 受 成 立 型错误()推断正确(1-)不成立推断正确(1-)型错误()0H0H0H0H第28页,此课件共62页哦 小结:小结:因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还不论是接受还是否定无效假设,都没有是否定无效假设,都没有100100的把握的把握。若经若经t t检验检验“差异显著差异显著”,对此结论有,对此结论有95%95%的把握,的把握,同时要冒同时要冒5%5%下错结论的风险;下错结论的风险;“差异极显著差异极显著”,对此结论有,对此结论有99%99%的把握,同时要的把握,同时要冒冒1%1%下错结论的风险;下错结论的风险;“差异不显著差异不显著”,是指在本次试验条件下,无效假,是指在本次试验条件下,无效假设未被否定。设未被否定。第29页,此课件共62页哦 “差异不显著差异不显著”不一定是不一定是“没有差异没有差异”。这有两种这有两种可能:可能:或者这两个样本所在的总体确实没有差异或者这两个样本所在的总体确实没有差异;或者这两个样本所在总体平均数有差异而因为试验或者这两个样本所在总体平均数有差异而因为试验误差大被掩盖了。误差大被掩盖了。因而不能仅凭统计推断就作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错误率有很大的可靠性,但有一定的错误率”,这是统计推断的基本特点。第30页,此课件共62页哦四、双侧检验与单侧检验 (一)双侧检验(一)双侧检验(two-sided test)在显著性检验中,无效假设为 ,备择假设为 。此时备择假设包括了 或 两种可能。这个假设的目的在于判断与有无差异,而不考虑谁大谁小。此时,在水平上否定域否定域为(-,-)和 ,+,对称地分配在t分布曲线的两侧尾部,每侧的概率为/2,如下图所示。这种利用两尾概率进行的检验叫双侧检验双侧检验,也叫双尾检验双尾检验,为双侧检验的临界t值。210:H21:AH2121ttt第31页,此课件共62页哦单侧检验单侧检验 双侧检验双侧检验图A图B第32页,此课件共62页哦 (二)单侧检验二)单侧检验 (one-sided test)(one-sided test)但在有些情况下,双侧检验不一定符合实际情况。如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。若进行新技术与常规技术的比较试验,无效假设应为 ,即假设新技术的实施没有提高产蛋量,备择假设应为 ,即新配套技术的实施使产蛋量有所提高。检验目的检验目的在于推断实施新技术是否提高了产蛋量,这时的否定域在t分布曲线的右尾。210:H21:AH第33页,此课件共62页哦 在水平上,的否定域为 ,+,右侧 的概率为,如图A所示。若无效假设为 ,备择假设为 ,此时的否定域在t分布曲线的左尾。在水平上,的否定域为(-,-),左侧的概率为。如图B所示。这种利用一尾概率进行的检验叫单侧检验单侧检验也叫单尾检验单尾检验。此时 为单侧检验的临界t值。(三三)单侧检验与双侧检验的关系单侧检验与双侧检验的关系 单侧检验的单侧检验的t t=双侧检验的双侧检验的t t220Ht210:H21:AHt0Ht第34页,此课件共62页哦 若对同一资料进行双侧检验也进行单侧检验,那么在水平上单侧检验显著,只相当于双侧检验在2水平上显著。所以,同一资料双侧检验与单侧检验所得的同一资料双侧检验与单侧检验所得的结论不一定相同结论不一定相同。双侧检验显著,单侧检验一定显著;反之,单侧检验显著,双侧检验未必显著。(四)应用(四)应用 选用单侧检验还是双侧检验应根据专业知识选用单侧检验还是双侧检验应根据专业知识及问题的要求(分析的目的)在试验设计时就确及问题的要求(分析的目的)在试验设计时就确定。定。第35页,此课件共62页哦 一般若事先不知道所比较的两个处理效果谁好一般若事先不知道所比较的两个处理效果谁好谁坏,谁坏,分析的目的分析的目的在于推断两个处理效果有无差别在于推断两个处理效果有无差别,则选用双侧检验;,则选用双侧检验;若根据理论知识或实践经验判断甲处理的效果不若根据理论知识或实践经验判断甲处理的效果不会比乙处理的效果差会比乙处理的效果差(或相反或相反),分析的目的分析的目的在于推断在于推断甲处理是否比乙处理好甲处理是否比乙处理好(或差或差),则用单侧检验。,则用单侧检验。一般情况下,如不作特殊说明均指双侧检验一般情况下,如不作特殊说明均指双侧检验。第36页,此课件共62页哦第二节 样本均数与总体均数的差异显著性检验t检验 在实际工作中往往需要检验一个样本均数 与已知总体均数 是否有显著差异,即检验样本是否属于某一总体。这里的 一般为一些公认的指标。如畜禽正常生理生化指标、生产性能指标、经大量调查所得的平均值、经验数或规定的某种指标值。检验的基本步骤:检验的基本步骤:(一)建立假设(一)建立假设x00第37页,此课件共62页哦,其中为样本所在总体均值。(二)在无效假设成立的条件下,计算(二)在无效假设成立的条件下,计算t t 值。值。其中,其中,n n为样本含量,为样本含量,为为样本标准误样本标准误。(三)根据计算出的自由度,查得临界值:(三)根据计算出的自由度,查得临界值:。将计算所得。将计算所得t t值的绝对值与其比较,作出推断值的绝对值与其比较,作出推断。若 ,则P P0.050.05,不能否定 ,表明样本均数与总体均数差异不显著;若 ,则0.010.01P0.05P0.05,000:;:AHH1,0ndfSxtxnSSx/01.005.0,tt0H第38页,此课件共62页哦否定 ,接受 ,表明样本均数 与总体均数差异显著;若 ,则P0.01P0.01,否定 ,接受 ,表明样本均数 与总体均数 差异极显著。【例】在鱼塘中10个点取水样,测定水中含氧量,得数据:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.48,4.55,4.26(mg/l),能否认为该鱼塘中平均含氧量为4.50(mg/l)。显然,本例应进行双侧t检验。1 1建立假设建立假设 0HAHx001.0tt 0HAHx050.4:;50.4:0AHH第39页,此课件共62页哦 2 2计算计算t t值值 经计算得:=4.421,S=0.267 所以 3 3查临界查临界t t值,并作出推断值,并作出推断 由df=10-1=9查t值表(附表3)得,=2.262。因为 ,P0.05,故不能否定 ,可以认为该鱼塘中平均含氧量为4.50(mg/l).x940.0084.0079.010/267.050.4421.40 xSxt05.0t05.0tt 50.4:0H第40页,此课件共62页哦第三节 两样本均数差异显著性检验 在实际工作中还经常会遇到推断两个样本均数差异是否显著的问题,以了解两样本所属总体的均数是否相同。对于两样本均数的显著性检验,因条件或试验设计不同,一般可分为两种情况:一是非配对是非配对设计设计或成组设计成组设计两样本平均数的比较;二是配对配对设计设计两样本平均数的比较。(同学们在学习时要注意理解和掌握基本概念基本概念,同时注意区分两种情况显著性检验的区别两种情况显著性检验的区别。)第41页,此课件共62页哦一、非配对设计两样本平均数差异显著性检验t检验 (一)概念(一)概念 非配对设计或成组设计非配对设计或成组设计是指当进行只有二个处理的试验时,将试验单位完全随机单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得到的两个样本相互独立,其含量不一定相等。(二)步骤(二)步骤 建立假设;2110:;:2AHH第42页,此课件共62页哦 计算均数差异标准误、t值和自由度。当当 时,时,为均数差异标准误均数差异标准误;分别为两样本的含量、平均数、均方。)1()1(,212121nndfsxxtxx)11()1()1()1()1(212122221121nnnnsnsnSxxnnn21nssSxx22212121xxS22212121,SSxxnn、第43页,此课件共62页哦根据根据df=(ndf=(n1 1-1)+(n-1)+(n2 2-1)-1)或或2(n-1)2(n-1),查表得临界,查表得临界 t t值值 ,将计算所得,将计算所得t t值的绝对值与其比较值的绝对值与其比较,作出统计推断。,作出统计推断。【例例】分别测定两个品种的家兔停食分别测定两个品种的家兔停食1818小时后小时后正常血糖值,测定结果如表正常血糖值,测定结果如表5-25-2所示。设两品种所示。设两品种家兔正常血糖值服从正态分布,且方差相等,问家兔正常血糖值服从正态分布,且方差相等,问该两个品种家兔的正常血糖值有无差异该两个品种家兔的正常血糖值有无差异?两个不同品种家兔的正常血糖值 01.005.0,tt品种n血糖值(mg/100ml血)大耳白11 57 120 101 137 119 117104735368118青紫蓝10 89368250393257829631第44页,此课件共62页哦 1建立假设 2计算t值 此例 ,经计算得 ,于是2110:;:2AHH111n102n2.847,0.97211Sx3.650,4.59222Sx)11()1()1()1()1(212122221121nnnnsnsnSxx0.12)101111()111()110(3.65092.84710*133.30.124.590.972121xxsxxt第45页,此课件共62页哦 3.查临界t值,作出推断 查t值表,由df=11+10-2=19得 ,|t|2.861,P0.01,表明两品种家兔正常血糖值差异极显著,这里表现为大耳白品种家兔的正常血糖值极显著高于青紫兰品种家兔的正常血糖值。681.201.0t第46页,此课件共62页哦二、配对设计两样本平均数的差异显著性检验t检验 非配对设计非配对设计要求试验单位尽可能一致。如果试验单位变异较大,如试验动物的年龄、体重相差较大,若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性。为了消除试验单位初使条件不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与与精确性,可以利用局部控制局部控制的原则,采用配对设计配对设计。第47页,此课件共62页哦 (一)配对设计的概念和分类(一)配对设计的概念和分类 配对设计配对设计是指试验单位先根据配对的要求两两配对,然后将配成对子的两个试验单位随机地分配到两个处理中。配对的要求是配对的要求是,配成对子的两个试验单位(对子内对子内)的初始条件尽量一致,不同对子间不同对子间试验单位的初始条件允许有差异。每一个对子就是试验处理的一个重复。配对的方式有两种:同源配对同源配对 自身配对自身配对第48页,此课件共62页哦 1.1.自身配对自身配对 指同一试验单位在二个不同时间二个不同时间 上分别接受前后两次处理,用其前后两次的观察值进行自身对照比较;或在空间上用其不同空间上用其不同部位部位的观察值或不同方法不同方法的观察值进行自身对照比较。如观察某种病畜治疗前后临床检查结果的变化;观察用两种不同方法对畜产品中毒物或药物残留量的测定结果变化等。2.2.同源配对同源配对 指将来源相同、性质相同来源相同、性质相同的两个个体配成一对(如将畜别、品种、窝别、性别、年龄、体重相同的两个试验动物配成一对),第49页,此课件共62页哦然后对配对的两个个体随机地随机地实施不同处理。(二)配对设计显著性检验的步骤(二)配对设计显著性检验的步骤 在配对设计中,由于各对试验单位间存在系在配对设计中,由于各对试验单位间存在系统误差,对内两个试验单位存在相似性,所以其统误差,对内两个试验单位存在相似性,所以其资料的显著性检验资料的显著性检验不同于非配对设计不同于非配对设计。检验的步。检验的步骤是:骤是:1 1建立假设建立假设 其中其中 为为两样本配对数据差值两样本配对数据差值d d总体均数,它总体均数,它等于两样本所属总体平均数等于两样本所属总体平均数 与与 之差,即之差,即 。所设无效假设、。所设无效假设、备择假设相当于备择假设相当于 。0:;0:0dAdHHd1221d21210:;:AHH第50页,此课件共62页哦 2 2、计算差异标准误、计算差异标准误、t t值和自由度;值和自由度;其中:为差异标准误,计算公式为:d为两个样本各对数据之差:,(i=1,2,n);为d的标准差;n为配对的对子数,即试验的重复数。(注意注意:实际计算过程中,运用计算器的统计功能键,在计算 时,即可同时计算出 。)1,ndfsdtdds)1()(2nnddnssddiiixxd21d第51页,此课件共62页哦3 3根据自由度根据自由度df=n-1df=n-1查查t t值表,得临界值表,得临界t t值值 ,然后将计算所得t值的绝对值与其比较,作出推断。【例例】在比较国产与进口的膘厚测定仪时,对14头活体肥猪进行了测定,资料如下(单位:mm)试检验两种仪器测定的结果有无显著差异?1 1建立假设建立假设 ,即假定两种仪器测定的结果相等;即假定两种仪器测定的结果不等。)1(01.0)1(05.0,nntt进口进口 32 40 2737 32 35 28 43 404141 35 49 34国产国产 43 44 3034 30 31 26 26 424042 43 37 430:dAH0:0dH第52页,此课件共62页哦 2 2计算计算t t值值 经计算得 =-11,-4,-3,3,2,4,2,17,-2,1,-1,-8,12,-9 (将以上数据输入计算器,运用统计功能键)=0.214,=7.658,n=14 3.3.查临界查临界t t值,作出推断。值,作出推断。由df=n-1=13,查t值表得 ,P0.05,表明国产和进口测定仪测定的猪活体背膘厚差异不显著。iiixxd21d047.214/658.7/nssddnsdsdt105.0047.2/214.0/05.0)13(05.0,106.2ttt第53页,此课件共62页哦 讨论:讨论:配对设计与非配对设计的显著性检验有那些配对设计与非配对设计的显著性检验有那些区别?区别?如果将非配对设计资料错误地用配对设计的如果将非配对设计资料错误地用配对设计的显著性检验方法(或者将配对设计资料用非配对显著性检验方法(或者将配对设计资料用非配对设计的显著性检验方法)进行检验,结果会怎样设计的显著性检验方法)进行检验,结果会怎样呢?呢?一般说来,相对于非配对设计,配对设计能够提高试验的精确性。(?)(?)第54页,此课件共62页哦第四节 显著性检验中应注意的问题(一)要有严密合理的试验或抽样设计。(一)要有严密合理的试验或抽样设计。(二)选用的显著性检验方法应符合其应用条件(二)选用的显著性检验方法应符合其应用条件。(三)要正确理解差异显著或极显著的统计意义(三)要正确理解差异显著或极显著的统计意义。显著性检验结论中的“差异显著差异显著”或或“差异极差异极显著显著”不应该误解为相差很大或非常大,也不能认为在专业上一定就有重要或很重要的价值。“显著显著”或或“极显著极显著”是指表面上如此差别的不同样本来自同一总体的可能性小于0.05或0.01,已达到了可以认为它们有实质性差异的显著水平。第55页,此课件共62页哦 有些试验结果虽然差别大,但由于试验误差也大,也许还不能得出“差异显著”的结论,而有些试验结果间的差异虽小,但试验误差也小,反而可能推断为“差异显著”。显著水平的高低只表示下结论的可靠程度的显著水平的高低只表示下结论的可靠程度的高低,高低,即在0.01水平下否定无效假设的可靠程度为99,而在0.05水平下否定无效假设的可靠程度为95。“差异不显著差异不显著”是指表面上的这种差异在同一总体中出现的可能性并不小于统计上公认的概率水平(如0.05和0.01),不能理解为不能理解为试验结果间第56页,此课件共62页哦没有差异。下“差异不显著”结论时,客观上存在两 种可能:一是本质上有差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本含量,则可能表现出差异显著性;二是可能确无本质上差异。显著性检验只是用来确定无效假设能否被显著性检验只是用来确定无效假设能否被推翻,而不能证明无效假设是正确的推翻,而不能证明无效假设是正确的。(四)合理建立统计假设,正确计算检验统计量(四)合理建立统计假设,正确计算检验统计量。(五)结论不能绝对化。(五)结论不能绝对化。第57页,此课件共62页哦第五节第五节 对数转换对数转换 一、对数转换的目的一、对数转换的目的 在用t检验法进行均数显著性检验时要求均数所要求均数所在的总体服从正态分布在的总体服从正态分布。但在科学研究中,往往有些资料不服从正态分布,如传染病的潜伏期、抗体滴度、细菌计数等,其分布呈偏态分布,资料的代表数是几何平均数而不是算术平均数。因此对这类资料须先进行对数转换对数转换,使其近似正态分布,然后进行t检验。二、步骤二、步骤 1、先对数据进行对数转换对数转换;第58页,此课件共62页哦 2 2、建立假设;、建立假设;3 3、计算两样本均数(几何平均数)、标准差(、计算两样本均数(几何平均数)、标准差(对数转换后的数据标准差)、均数差异标准误、对数转换后的数据标准差)、均数差异标准误、t t值、自由度。值、自由度。4 4、查临界、查临界t t值表,作结论。值表,作结论。第59页,此课件共62页哦第六章 参数的区间估计 参数估计参数估计就是用样本统计量来估计总体参数,有点估计(point estimation)和区间估计(interval estimation)之分。将样本统计量直接作为总体相应参数的估计值叫点估计点估计。点估计只给出了未知参数估计值的大小,没有考虑试验误差的影响,也没有指出估计的可靠程度,故不尽合理。第60页,此课件共62页哦 区间估计区间估计是在一定概率保证下指出总体参数的可能范围,所给出的可能范围叫置信区间,给出概率保证称为置信度或置信概率(confidence probability)。第61页,此课件共62页哦一、正态总体平均数及二项总体百分率p的置信区间 设有一来自正态总体的样本,包含n个变数,样本平均数 =x/n、标准误 。总体均数为。现对作区间估计。因为 服从自由度为n-1的t分布,当=0.05时,也即是:对 变形有:xnSSx/xSxt/)(95.0)(05.005.0tttP95.0)(05.005.0tSxtpx05.005.0tSxtx第62页,此课件共62页哦