t检验ppt.ppt





《t检验ppt.ppt》由会员分享,可在线阅读,更多相关《t检验ppt.ppt(114页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 t检验检验 统计推断是根据样本和假定模型对总体作统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,它主要包括出的以概率形式表述的推断,它主要包括假设假设检验检验(test of hypothesis)和参数估计和参数估计(parametric estimation)二个内容。二个内容。下一张下一张 主主 页页 退退 出出 上一张上一张 假假 设设 检检 验验 又叫又叫 显著性显著性 检验检验(test of significance)。)。显著性检验的方法很多显著性检验的方法很多,常,常用的有用的有t检验、检验、F检验和检验和 2 2检验等。尽管这些检验检验等。尽管这
2、些检验方法的用途及使用条件不同,但其检验的基本原方法的用途及使用条件不同,但其检验的基本原理是相同的。本章以两个平均数的差异显著性检理是相同的。本章以两个平均数的差异显著性检验为例来阐明显著检验的原理,验为例来阐明显著检验的原理,介绍介绍 几种几种t检验检验的方法,然的方法,然 后后 介介 绍绍 总总 体体 参参 数数 的的 区区 间间 估计估计(interval estimation)。)。下一张下一张 主主 页页 退退 出出 上一张上一张 第一节第一节 显著性检验的基本原理显著性检验的基本原理 一、显著性检验的意义一、显著性检验的意义一、显著性检验的意义一、显著性检验的意义 随机抽测随机抽
3、测随机抽测随机抽测1010头长白猪和头长白猪和头长白猪和头长白猪和1010头大白猪经产母猪的产头大白猪经产母猪的产头大白猪经产母猪的产头大白猪经产母猪的产仔数,资料如下:仔数,资料如下:仔数,资料如下:仔数,资料如下:长白:长白:长白:长白:1111,1111,9 9,1212,1010,1313,1313,8 8,1010,1313 大白:大白:大白:大白:8 8,1111,1212,1010,9 9,8 8,8 8,9 9,1010,7 7 经计算,得长白猪经计算,得长白猪经计算,得长白猪经计算,得长白猪 1010头经产母猪产仔平均数头经产母猪产仔平均数头经产母猪产仔平均数头经产母猪产仔平
4、均数 =11=11头,标准差头,标准差头,标准差头,标准差S S1 1=1.76=1.76头;大白猪头;大白猪头;大白猪头;大白猪1010头经产母猪产头经产母猪产头经产母猪产头经产母猪产仔平均数仔平均数仔平均数仔平均数 =9.2=9.2头,头,头,头,标标标标 准准准准 差差差差S S2 2=1.549=1.549头。头。头。头。下一张下一张 主主 页页 退退 出出 上一张上一张 能否仅凭这两个平均数的差值能否仅凭这两个平均数的差值 -=1.8头,立即得出长白与大白两品种经产母猪产仔数头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不同的结论呢?统计学认为,
5、这样得出的结论是不可靠的不可靠的。这是因为如果。这是因为如果 我们再分别随机抽测我们再分别随机抽测10 头长白猪和头长白猪和10头大白猪经产母猪的产仔数,头大白猪经产母猪的产仔数,又可得到两个样本资料又可得到两个样本资料。由于。由于 抽样误差的抽样误差的 随机随机性,两样本平均数就不一定是性,两样本平均数就不一定是11头和头和9.2头,其头,其差值也不一定是差值也不一定是1.8头头。造成这种差异可能有两。造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽白猪本质不同所致,另一可能是试验误差(或抽样误
6、差)。样误差)。下一张下一张 主主 页页 退退 出出 上一张上一张 对两个样本进行比较时对两个样本进行比较时,必须判断样本间,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。总体?这正是显著性检验要解决的问题。两个总体间的差异如何比较?一种方法是研两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是总体参数进行比较。
7、这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往很准确的,但常常是不可能进行的,因为总体往往是无限总体往是无限总体,或者,或者 是是 包含个体很多的有限总包含个体很多的有限总体。因此体。因此,不得不采用另一种方法,不得不采用另一种方法 ,即研究样,即研究样下一张下一张 主主 页页 退退 出出 上一张上一张 样本,通过样本研究其所代表的总体。例如,设样本,通过样本研究其所代表的总体。例如,设长白猪经产母猪产仔数的总体平均数为长白猪经产母猪产仔数的总体平均数为 ,大大白猪经产母猪产仔数的总体平均数为白猪经产母猪产仔数的总体平均数为 ,试,试 验验研究的目的,就是要给研究的目的,就
8、是要给 、是否相同是否相同 做出推做出推断。由于总体平均数断。由于总体平均数 、未知未知,在进行显著性,在进行显著性检验时只能以样本平均数检验时只能以样本平均数 、作为检验对象,作为检验对象,更确切地说,是以(更确切地说,是以(-)作为检验对象。)作为检验对象。为什么以样本平均数作为检验对象呢?为什么以样本平均数作为检验对象呢?这是这是因为样本平均数具有下述特征:因为样本平均数具有下述特征:1、离均差的平方和、离均差的平方和(-)2最小。说最小。说明样本平均数与样本各个观测值最接近,平均数明样本平均数与样本各个观测值最接近,平均数是资料的代表数。是资料的代表数。下一张下一张 主主 页页 退退
9、出出 上一张上一张 2、样本平均数、样本平均数 是是 总体平均数的总体平均数的 无偏估计无偏估计值值,即,即E()=。3、根据统计学中心极限定理,样本平均数根据统计学中心极限定理,样本平均数 服从或逼近正态分布。服从或逼近正态分布。所以,以样本平均数作为检验对象,由两个所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。数是否相同是有其依据的。由上所述,一方面我们有依据由由上所述,一方面我们有依据由 样本平均样本平均数数 和和 的差异来推断总体平均数的差异来推断总体平均数 、相相 同同 与否,另一方面
10、又不能仅据样本平均数表面与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于上的差异直接作出结论,其根本原因在于 试试 验验 误差(或抽样误差)的不可避免性误差(或抽样误差)的不可避免性。下一张下一张 主主 页页 退退 出出 上一张上一张 通过试验测定得到的每个观测值通过试验测定得到的每个观测值 ,既由被,既由被测个体所属总体的特征决定,又受个体差异和诸测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。所以观测值多无法控制的随机因素的影响。所以观测值 由由两部分组成,即两部分组成,即 =+总体平均数总体平均数 反映了总体特征,表示误差。反映了总体特征,
11、表示误差。若若 样本含量样本含量 为为n,则,则 可可 得得 到到 n 个个 观观 测测值:值:,。于是样本平均数。于是样本平均数 下一张下一张 主主 页页 退退 出出 上一张上一张 说明样本平均数并非总体平均数,它还包含试验误说明样本平均数并非总体平均数,它还包含试验误说明样本平均数并非总体平均数,它还包含试验误说明样本平均数并非总体平均数,它还包含试验误差的成分。差的成分。差的成分。差的成分。对于接受不同处理的两个样本来说,则有:对于接受不同处理的两个样本来说,则有:对于接受不同处理的两个样本来说,则有:对于接受不同处理的两个样本来说,则有:=+=+,=+=+这说明两个样本平均数之差(这说
12、明两个样本平均数之差(这说明两个样本平均数之差(这说明两个样本平均数之差(-)也包括了两部)也包括了两部)也包括了两部)也包括了两部分:分:分:分:一部分是两个总体平均数的差(一部分是两个总体平均数的差(一部分是两个总体平均数的差(一部分是两个总体平均数的差(-),叫),叫),叫),叫 做做做做 试试试试 验验验验 的的的的 处处处处 理理理理 效效效效 应应应应 (treatment effecttreatment effect););););另另另另一部分是一部分是一部分是一部分是试验误差试验误差试验误差试验误差(-)。)。)。)。下一张下一张 主主 页页 退退 出出 上一张上一张 也就是
13、说样本平均数的差(也就是说样本平均数的差(-)包含有)包含有试验误差,它只是试验的表面效应。因此,仅凭试验误差,它只是试验的表面效应。因此,仅凭(-)就对总体平均数)就对总体平均数 、是否相同是否相同 下下结论是不可靠的。只有结论是不可靠的。只有 通过通过 显著性检验显著性检验 才能从才能从(-)中提取结论。)中提取结论。对(对(-)进行显著性检验就是要分析:)进行显著性检验就是要分析:试验的表面效应(试验的表面效应(-)主要由处理效应)主要由处理效应(-)引起的)引起的,还,还 是是 主要主要 由试验误差所造由试验误差所造成。成。下一张下一张 主主 页页 退退 出出 上一张上一张 虽然处理效
14、应(虽然处理效应(-)未知,但试验的表)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可试验误差作出估计。所以,可从试验的表面效应从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。否存在,这就是显著性检验的基本思想。二、显著性检验的基本步骤二、显著性检验的基本步骤 (一)首先对试验样本所在的总体作假设(一)首先对试验样本所在的总体作假设 下一张下一张 主主 页页 退退 出出 上一张上一张 这里假设这里假设 =或或 -=0,即假设长白
15、,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应:相等,其意义是试验的表面效应:-=1.8头是试验误差,处理无效,这种假设称为头是试验误差,处理无效,这种假设称为无效假无效假设设(null hypothesis),),记作记作 :=或或 。无效假设是被检验的假设,通过检验可能被无效假设是被检验的假设,通过检验可能被接受,也可能被否定。提出接受,也可能被否定。提出 :=或或 -=0的同时,相应地提出一对应假设,称为的同时,相应地提出一对应假设,称为备择假设备择假设(alternative hypothesis),记作),
16、记作 。备。备择假设是在无效假设被否定时准备接受的假设。择假设是在无效假设被否定时准备接受的假设。下一张下一张 主主 页页 退退 出出 上一张上一张 本例的备择假设是本例的备择假设是 :或或 -0,即假设长白猪与大白猪两品种经产母猪产仔数的即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数总体平均数 与与 不相等或不相等或 与与 之差不等于之差不等于零,亦即存在处理效应,其意义是指试验的表面零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。效应,除包含试验误差外,还含有处理效应在内。(二)在无效假设成立的前提下,构造合适的(二)在无效假设成立的前提下,构造
17、合适的统计量,并研究试验所得统计量的抽样分布,计统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率算无效假设正确的概率 下一张下一张 主主 页页 退退 出出 上一张上一张 对于上述例子,研究在无效假设对于上述例子,研究在无效假设 :=成立的前提下,统计量(成立的前提下,统计量(-)的抽样)的抽样分布。经统计学研究,得到一个统计量分布。经统计学研究,得到一个统计量t:其中其中 =叫做叫做均数差异标准误均数差异标准误;n1、n2为两样为两样本的含量。本的含量。下一张下一张 主主 页页 退退 出出 上一张上一张 所得的统计量所得的统计量 t服从自由度服从自由度 df=(n1-1)+(n2
18、-1)的的t分布。分布。根据两个样本的数据,计算得:根据两个样本的数据,计算得:-=11-9.2=1.8;下一张下一张 主主 页页 退退 出出 上一张上一张 我们需进一步估计出我们需进一步估计出|t|2.426的两尾概的两尾概率,即估计率,即估计P(|t|2.426)是多少?是多少?查附表查附表3,在,在 df=(n1-1)+(n2-1)=(10-1)+(10-1)=18时,两尾概率为时,两尾概率为0.05的临界值:的临界值:=2.101,两尾概率为,两尾概率为0.01的临界的临界t值:值:=2.878,即:,即:P(|t|2.101)=P(t2.101)+P(t 2.878)=P(t2.87
19、8)+P(t-2.878)=0.01 下一张下一张 主主 页页 退退 出出 上一张上一张 由于由于 根据两样本数据计算所得的根据两样本数据计算所得的 t 值值 为为2.426,介于两个临界,介于两个临界t值之间,即:值之间,即:t0.052.426t0.01 所以,所以,|t|2.426的概率的概率P介于介于0.01和和0.05之间,即:之间,即:0.01 P 0.05。图图5-1|t|2.426的两尾概率的两尾概率 如如图图5-1所示,说明所示,说明 无效假设成立的可能无效假设成立的可能性,性,即试验的表面效应为试验误差的可能性在即试验的表面效应为试验误差的可能性在0.01 0.05之间。之
20、间。下一张下一张 主主 页页 退退 出出 上一张上一张 (三)根据(三)根据“小概率事件实际不可能性原理小概率事件实际不可能性原理”否定或接受无效假设否定或接受无效假设 在统计学上在统计学上 ,把小概率事件在一次试验中看,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于是试验误差的概率小于0.05时时,可以认为在一次,可以认为在一次试试 验验 中中 试试 验验 表表 面面 效效 应应 是是 试试 验误差实际上是验误差实际上
21、是下一张下一张 主主 页页 退退 出出 上一张上一张 不可能的,因而否定原先所作的无效假设不可能的,因而否定原先所作的无效假设 :=,接受备择假设,接受备择假设 :,即即 认认为:试验的处理效应是存在的。当试验的表面效为:试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于应是试验误差的概率大于0.05时,时,则说明则说明 无无效假设效假设 :=成立的可能性大成立的可能性大,不能被否,不能被否定,因而也就不能接受备择假设定,因而也就不能接受备择假设 :。下一张下一张 主主 页页 退退 出出 上一张上一张 本例中,按所建立的本例中,按所建立的 :=,试验的,试验的表面效应是试验误差的概率
22、在表面效应是试验误差的概率在 0.01 0.05 之之间,小于间,小于0.05,故有理由否定,故有理由否定 :=,从,从而接受而接受 :。可以认为长白猪与大白猪。可以认为长白猪与大白猪两品种经产母猪产仔数总体平均数两品种经产母猪产仔数总体平均数 和和 不相不相同。同。综上所述,显著性检验,从提出无效假设与综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所否定或接受无效假设,这一过程实际上是应用所谓谓“概率性质的反证法概率性质的反证法”对试验样本所属总体所对试验样本所属总体所作的无效
23、假设的统计推断。作的无效假设的统计推断。下一张下一张 主主 页页 退退 出出 上一张上一张 三、显著水平与两种类型的错误三、显著水平与两种类型的错误 在显著性检验中,否定或接受无效假设的依在显著性检验中,否定或接受无效假设的依据是据是“小概率事件实际不可能性原理小概率事件实际不可能性原理”。用来确用来确定否定或接受无效假设的概率标准定否定或接受无效假设的概率标准 叫叫 显显 著著 水水 平平(significance level),),记作记作。在生物。在生物学研究中常取学研究中常取=0.05或或=0.01。对于上述例子所用的检验方法(对于上述例子所用的检验方法(t检验)来说:检验)来说:下一
24、张下一张 主主 页页 退退 出出 上一张上一张 若若|t|0.05,即表面效应属于试即表面效应属于试验误差的可能性大,不能否定验误差的可能性大,不能否定 :=,统,统计学上把这一检验结果表述为:计学上把这一检验结果表述为:“两个总体平均两个总体平均数数 与与 差异不显著差异不显著”,在计算所得的,在计算所得的t值的值的右上方标记右上方标记“ns”或不标记符号;或不标记符号;下一张下一张 主主 页页 退退 出出 上一张上一张 若若t0.05|t|t0.01,则,则 说明说明 试验的表面试验的表面效应属于试验误差的概率效应属于试验误差的概率P在在0.010.05之间,之间,即即0.01 P0.05
25、,表面效应属于试验误差的表面效应属于试验误差的可能性较小,应否定可能性较小,应否定 :=,接受接受 :,统计学上把这一检验结果表述为:,统计学上把这一检验结果表述为:“两个总体平均数两个总体平均数 与与 差异显著差异显著”,在计算,在计算所得的所得的t值的右上方标记值的右上方标记“*”;下一张下一张 主主 页页 退退 出出 上一张上一张 若若|t|t0.01,则说明试验的表面效应属于则说明试验的表面效应属于试验误差的概率试验误差的概率P不超过不超过0.01,即,即P 0.01,表面效应属于试验误差的可能性更小表面效应属于试验误差的可能性更小,应否应否定定 :=,接受,接受 :,统计学上把,统计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 检验 ppt

限制150内