第六统计假设检验课件.ppt





《第六统计假设检验课件.ppt》由会员分享,可在线阅读,更多相关《第六统计假设检验课件.ppt(113页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六统计假设检验第1页,此课件共113页哦第一节第一节 统计假设检验的基本原理和方法统计假设检验的基本原理和方法第2页,此课件共113页哦一、统计推断的概念一、统计推断的概念统计推断:统计推断:是指用一个或一系列样本的结果去是指用一个或一系列样本的结果去估计总体可能的结果的过程。统计推断基本上包括估计总体可能的结果的过程。统计推断基本上包括两大部分的内容,一是假设测验,二是参数估计。两大部分的内容,一是假设测验,二是参数估计。第3页,此课件共113页哦统计推断统计推断参数估计参数估计假设测验假设测验点估计点估计区间估计区间估计统计推断的前提条件:统计推断的前提条件:资料必须来自随机样本;资料必
2、须来自随机样本;统计数的分布规律必须已知。统计数的分布规律必须已知。第4页,此课件共113页哦二、统计假设测验的意义二、统计假设测验的意义例例 有一水稻施肥试验,甲乙两种施肥方法的水稻产量如下有一水稻施肥试验,甲乙两种施肥方法的水稻产量如下x1(甲)x2(乙)8.29.68.78.99.48.510.711.29.210.911.110.8=53.3=63.9=8.88=10.65能否仅凭这两个平数的能否仅凭这两个平数的能否仅凭这两个平数的能否仅凭这两个平数的差值差值差值差值-=1.77-=1.77,立即,立即,立即,立即得出甲与乙两种施肥方法得出甲与乙两种施肥方法得出甲与乙两种施肥方法得出甲
3、与乙两种施肥方法的水稻产量不同的结论呢的水稻产量不同的结论呢的水稻产量不同的结论呢的水稻产量不同的结论呢?第5页,此课件共113页哦统计学认为,这样得出的结论是不可靠的统计学认为,这样得出的结论是不可靠的。因为。因为如果我们再做一次甲乙两种施肥方法试验,又可得到如果我们再做一次甲乙两种施肥方法试验,又可得到两个样本资料两个样本资料。由于。由于抽样误差的抽样误差的随机性,两样本平均随机性,两样本平均数就不一定是数就不一定是8.88和和10.65,其差值也不一定是,其差值也不一定是1.77。造成这种差异可能有两种原因,一是两种施肥方。造成这种差异可能有两种原因,一是两种施肥方法不同造成的差异,即是
4、两种施肥方法本质不同所法不同造成的差异,即是两种施肥方法本质不同所致,另一可能是试验误差(或抽样误差)。致,另一可能是试验误差(或抽样误差)。二、统计假设测验的意义二、统计假设测验的意义第6页,此课件共113页哦对两个样本进行比较时对两个样本进行比较时,必须判断样,必须判断样本间差异是本间差异是抽样误差抽样误差造成的,还是造成的,还是本质本质不不同引起的。如何区分两类性质的差异?怎同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检样通过样本来推断总体?这正是显著性检验要解决的问题。验要解决的问题。二、统计假设测验的意义二、统计假设测验的意义第7页,此课件共113页哦二、统
5、计假设测验的意义二、统计假设测验的意义两个总体间的差异如何比较?两个总体间的差异如何比较?一种方法是研究一种方法是研究整个总体,即由总体中的所有个体数据计算出整个总体,即由总体中的所有个体数据计算出总体总体参数进行比较参数进行比较。这种研究整个总体的方法是很。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体准确的,但常常是不可能进行的,因为总体往往是无限总体往往是无限总体,或者是,或者是包含个体很多的有包含个体很多的有限总体。因此限总体。因此,不得不采用另一种方法,即,不得不采用另一种方法,即研究样本,通过样本研究其所代表的总体。研究样本,通过样本研究其所代表的总体。第8页,此
6、课件共113页哦二、统计假设测验的意义二、统计假设测验的意义设甲施肥方法的总体平均数为设甲施肥方法的总体平均数为,乙施肥方,乙施肥方法的总体平均数为法的总体平均数为,试,试验研究的目的,就是要验研究的目的,就是要给给、是否相同做出推断。由于总体平均数是否相同做出推断。由于总体平均数、未知未知,在进行显著性检验时只能以样本平均数,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(作为检验对象,更确切地说,是以(-)作为检验对象。作为检验对象。第9页,此课件共113页哦观测值由两部分组成,即观测值由两部分组成,即若样本含量为若样本含量为n,则可得到,则可得到n个观测值:个观测值:
7、样本平均数:样本平均数:对于接受不同处理的两个样本来说,则有:对于接受不同处理的两个样本来说,则有:二、统计假设测验的意义二、统计假设测验的意义处理效应处理效应处理效应处理效应试验误差试验误差试验误差试验误差表面效应表面效应表面效应表面效应第10页,此课件共113页哦虽然处理效应(虽然处理效应(-)未知,但试验的)未知,但试验的表面效应是可以计算的,借助数理统计方法表面效应是可以计算的,借助数理统计方法可以对可以对试验误差作出估计试验误差作出估计。所以,可。所以,可从试验从试验的表面效应与试验误差的权衡比较中间接地的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验推断
8、处理效应是否存在,这就是显著性检验的基本思想。的基本思想。二、统计假设测验的意义二、统计假设测验的意义第11页,此课件共113页哦先假设真实差异不存在,表面差异全为试验先假设真实差异不存在,表面差异全为试验误差。然后计算这一误差。然后计算这一假设出现的概率假设出现的概率,根据小,根据小概率事件实际不可能性原理,判断假设是否概率事件实际不可能性原理,判断假设是否正确。这是对样本所属总体所做假设是否正正确。这是对样本所属总体所做假设是否正确的统计证明,称为确的统计证明,称为统计假设测验统计假设测验(statistical hypothesis test)(statistical hypothesi
9、s test)。二、统计假设测验的意义二、统计假设测验的意义第12页,此课件共113页哦三、显著性检验的基本步骤三、显著性检验的基本步骤(一)首先对试验样本所在的总体作假设(一)首先对试验样本所在的总体作假设无效假设无效假设:=或或-=0或或无效假设是被检验的假设,通过检验可能被接受,也无效假设是被检验的假设,通过检验可能被接受,也可能被否定。提出可能被否定。提出H0的同时相应地提出一对应假设,的同时相应地提出一对应假设,备择假设备择假设:或或或或备择假设是在无效假设被否定时准备接受的假设。备择假设是在无效假设被否定时准备接受的假设。第13页,此课件共113页哦 如何才能判断如何才能判断Ho是
10、否正确?就需要一个界限和标准。是否正确?就需要一个界限和标准。统计区间:统计区间:在统计假设检验中在统计假设检验中“接受接受”或或“否定否定”所提出的所提出的“无无效假设效假设”Ho的概率范围,的概率范围,称为统计区间。称为统计区间。显著水平:显著水平:统计推断时,衡量差异显著性程度的概率标准,称为统计推断时,衡量差异显著性程度的概率标准,称为显著性水平,以显著性水平,以表示。表示。常用显著水平常用显著水平 =0.05 称为称为5%的显著水平的显著水平 =0.01 称为称为1%的显著水平的显著水平 也有用也有用 =0.25 称为称为25%的显著水平的显著水平 =0.10 称为称为10%的显著水
11、平的显著水平 (一)首先对试验样本所在的总体作假设(一)首先对试验样本所在的总体作假设第14页,此课件共113页哦 0=360kg,=40kgn=16,x=380kg 0?原品种原品种新品系新品系(二)在无效假设成立的前提下,计算无效假(二)在无效假设成立的前提下,计算无效假设正确的概率设正确的概率第15页,此课件共113页哦在在H0:=0(360kg)为正确的前提下,)为正确的前提下,样样本本平平均均数数=380kg则则是是此此分分布布总总体体中中的的一一个个随随机机变变量量,据据此此,就就可可以以根根据据正正态态分分布布求求概概率率的的方方法法算算出出在在平平均均数数=360kg的的总总体
12、体中中,抽抽到到一一个个样样本本平平均均数数和和相相差差20kg的概率,从而确定是接受或否定的概率,从而确定是接受或否定H0。(二)在无效假设成立的前提下,计算无效假(二)在无效假设成立的前提下,计算无效假设正确的概率设正确的概率第16页,此课件共113页哦(二)在无效假设成立的前提下,计算无效假(二)在无效假设成立的前提下,计算无效假设正确的概率设正确的概率 0 f()查附表查附表2 2,即得,即得u u值对应的概率值对应的概率p p0.050.05。表明。表明20Kg20Kg差异属于试差异属于试验误差的概率小于验误差的概率小于5%5%。根据小概率事件实际不可能性原理,这个假设应被否定,即表
13、根据小概率事件实际不可能性原理,这个假设应被否定,即表面差异不全为试验误差,新品系与原品种之间存在真实差异。面差异不全为试验误差,新品系与原品种之间存在真实差异。第17页,此课件共113页哦统计上,当统计上,当1%p 5%称所测差异显著,称所测差异显著,p 1%称差异极显著,称差异极显著,p5%称差异不显著,称差异不显著,所以,统计假设测验又叫所以,统计假设测验又叫差异显著性测验差异显著性测验(difference significance test)判定是否属小概率事件的概率值叫判定是否属小概率事件的概率值叫显著水平显著水平(significant level),一般以一般以表示。农业上常取
14、表示。农业上常取0.05和和0.01。凡计算出的概率凡计算出的概率p小于小于的事件即为小概率事件。的事件即为小概率事件。第18页,此课件共113页哦 从从H0正确出发,根据的抽样分布划出一个区间,如正确出发,根据的抽样分布划出一个区间,如 -的差数在这一区间则接受的差数在这一区间则接受H0,简称为接受区间,则,简称为接受区间,则该差数应解释为随机误差;如该差数应解释为随机误差;如 -的差数在这一区间外的差数在这一区间外则否定则否定H0,简称为否定区间,则该差数应解释为本质,简称为否定区间,则该差数应解释为本质上不同的真实差异。上不同的真实差异。区间的确定:接受区间与否定区间的两个区间的确定:接
15、受区间与否定区间的两个(二)在无效假设成立的前提下,计算无效假(二)在无效假设成立的前提下,计算无效假设正确的概率设正确的概率第19页,此课件共113页哦(二)在无效假设成立的前提下,计算无效假(二)在无效假设成立的前提下,计算无效假设正确的概率设正确的概率若要在若要在0.05水平上接受水平上接受H0:=0=0.05时时,由附表由附表2得得u=1.96则则u=0_x-x-1.96(x-=n)x-01.96x-()01.96x-()假设接受区域假设接受区域(acceptance region)假设否定区域(假设否定区域(negation region)x-(01.96x-)x-x-(0+1.96
16、)或或第20页,此课件共113页哦接受区域接受区域 95%否定区域否定区域 2.5%否定区域否定区域2.5%360340.4379.5 =0.05时时 H0:=0的接受区和否定区的接受区和否定区01.96x-()01.96x-()=360-1.9610=340.4kg=360+1.9610=379.5kg第21页,此课件共113页哦同理,同理,=0.01时,由附表时,由附表2得得u=2.58,则,则 H0:=0的接受区域为的接受区域为x-02.58x-()02.58x-()否定区域为否定区域为-x(02.58x-)x-x(02.58)或或-(二)在无效假设成立的前提下,计算无效假(二)在无效假
17、设成立的前提下,计算无效假设正确的概率设正确的概率第22页,此课件共113页哦在实际检验时,计算概率可以简化,因为在标准正态分布下:在实际检验时,计算概率可以简化,因为在标准正态分布下:P(|u|1.96)=0.05,P(|u|2.58)=0.01,因此,在用因此,在用u分布作检验时,分布作检验时,|u|1.96,表明概率,表明概率P0.05,可在,可在0.05水平上否定水平上否定H0;|u|2.58,表明概率,表明概率P0.01,可在,可在0.01水平上否定水平上否定H0|u|30时,时,t分布与标准正态分布的分布与标准正态分布的区别很小;区别很小;n 100时,时,t分布基本与标准正态分布
18、相同;分布基本与标准正态分布相同;n时,时,t分布与标准正态分布完全一致。分布与标准正态分布完全一致。t分布的主要特性:分布的主要特性:第38页,此课件共113页哦-3 -2 -1 0 1 2 3 t或或u0.40.30.20.1f(t)或或 (u)u分布t分布(df=1)t t分布及其与标准正态曲线的比较分布及其与标准正态曲线的比较第39页,此课件共113页哦4、P(atb)面积面积Aa 0 b t f(t)At分布的主要特性:分布的主要特性:第40页,此课件共113页哦表表3为学生氏为学生氏t值表(两尾),表达式子值表(两尾),表达式子P(tt)=中中t与与之间的关系之间的关系,由由查找查
19、找t。如图,有。如图,有P(|t|t)=P(tt+tt)=P(tt)+P(tt)查查t表时所用参数为自由度表时所用参数为自由度df。-t 0 t t t 第41页,此课件共113页哦例如,当例如,当df=3时,查附表时,查附表3得两尾概率为得两尾概率为0.05的临界的临界t值为值为t0.05,3=3.182。这表明从。这表明从3.182 的概率和从的概率和从-3.182 -的概率各为的概率各为0.025。而两尾概率为。而两尾概率为0.01的临界的临界t值为值为t0.01,3=5.841,由此可见,由此可见,df不变时,不变时,P 越大,越大,t 越小越小;P 越小,越小,t 越大。越大。两尾测
20、验,两尾测验,H0:=0 t t(df),否定否定H0,反之接受,反之接受H0。一尾测验,一尾测验,H0:0 t t2(df),否定否定H0,反之接受,反之接受H0。若若H0:0 t-t2(df),否定否定H0,反之接受,反之接受H0。这种用这种用t t分布计算所作假设的概率分布计算所作假设的概率,进行的假设测验叫进行的假设测验叫t t测验测验(t-test)(t-test)第42页,此课件共113页哦0f(t)t-t(df)=-3.182t(df)=3.182-df=30.0250.025t分布的两尾测验和一尾测验临界分布的两尾测验和一尾测验临界t 值值t2(df)=2.353-t2(df)
21、=-2.353第43页,此课件共113页哦应用条件:应用条件:总体参数总体参数0 0 和和2 2为已知或未知为已知或未知,样本平均数样本平均数来自来自小样本小样本(n30nt0.01(9)3.25 0 否否定定H0,认认为为差差异异极极显显著著,即即受受污污染染地地区区极极显显著著地影响了小麦千粒重。地影响了小麦千粒重。二、二、单个平均数单个平均数 t检验检验第48页,此课件共113页哦单个平均数的统计假设检验单个平均数的统计假设检验U检验t检验适用情况正态分布或已知或n30未知,n30检验方式两尾检验一尾检验两尾检验一尾检验统计假设H0=0=0=0=0HA00 或0 00 或0 检验统计量检
22、验临界值CUU0.05=1.96U0.01=2.58U2U0.1=1.64U0.02=2.32t(n-1)t2(n-1)统计推断否定H0UCtC接受H0UCtC第49页,此课件共113页哦第三节两个平均数相比较的假设检验第三节两个平均数相比较的假设检验由由推断推断120?第50页,此课件共113页哦一一成组数据的平均数比较成组数据的平均数比较成组数据成组数据其中其中n1、n2可可等可不等。等可不等。甲乙将试验单位完全随机分为两组,再随机各实施一处理,将试验单位完全随机分为两组,再随机各实施一处理,这样得到的数据称为这样得到的数据称为成组数据成组数据,以组的平均数作为比较的标,以组的平均数作为比
23、较的标准。准。第51页,此课件共113页哦(一)(一)u检验检验 1、应用条件、应用条件两个样本总体方差两个样本总体方差12和和22已知,已知,总体方差未知,但总体方差未知,但n130、n230一一般般情情况况下下,两两个个总总体体的的方方差差是是未未知知的的,因因此此这这里着重讨论两个大样本的比较。里着重讨论两个大样本的比较。第52页,此课件共113页哦2、方法步骤、方法步骤 假假定定甲甲、乙乙两两总总体体所所属属的的总总体体平平均均数数分分别别为为1和和2,分别从甲、乙两总体各随机抽取一个,分别从甲、乙两总体各随机抽取一个大样本大样本,其中:,其中:样本样本I;S1 n1 样本样本:S2
24、n2(一)(一)u检验检验 第53页,此课件共113页哦统计假设统计假设H0:1=2,HA:12计算样平均数差数标准误计算样平均数差数标准误 和和u值值 在无效假设在无效假设H0:1=2时,时,1-2=0,故上式为:,故上式为:根据根据u值的大小推断差异显著性值的大小推断差异显著性。第54页,此课件共113页哦 例例3 3 不同季度监测某工厂排污水中某污染物含量(不同季度监测某工厂排污水中某污染物含量(mg/Lmg/L)。结果列)。结果列于表于表5.3.25.3.2,试检验两个季度排污水中污染物含量有无显著差异?,试检验两个季度排污水中污染物含量有无显著差异?季度污染物含量(mg/L)一季度3
25、184713846465444882181624557623937692153445361457235627042883774428747466554285863546259305329627853二季度3144652240535450344946484931236958424424513243332549476636363433416238384066477124532025314160325638第55页,此课件共113页哦统计假设统计假设H:1=2,HA:12计算各样本平均数,方差计算各样本平均数,方差S2,样本平均数差数标准误,样本平均数差数标准误 和和u值值第56页,此课件共113页
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 统计 假设检验 课件

限制150内