假设检验的基本思想和作用优秀课件.ppt
假设检验的基本思想和作用第1页,本讲稿共24页续续由资料已知样本均数与总体均数不等,原因有二:由资料已知样本均数与总体均数不等,原因有二:1 1)两者非同一总体,即两者间的差异由地理气候等因素造成;)两者非同一总体,即两者间的差异由地理气候等因素造成;2 2)两者为同一总体,即两者间的差异由抽样误差造成)两者为同一总体,即两者间的差异由抽样误差造成。问题问题3 3、怎样判断以上那个原因是成立的?怎样判断以上那个原因是成立的?利用反证法思想,从利用反证法思想,从=0 0出发,判断是否出发,判断是否 0 0 。=0 0是否成立,视抽样误差造成的可能性(是否成立,视抽样误差造成的可能性(P)P)有多大。有多大。若若x x与与0 0接近,其差别可用抽样误差解释,认为接近,其差别可用抽样误差解释,认为x x来自于来自于0 0;若若x x与与0 0相差甚远,其差别不宜用抽样误差解释,则怀疑相差甚远,其差别不宜用抽样误差解释,则怀疑x x不属于不属于0 0 。那么那么x x与与0 0相差多大算是由抽样误差造成的呢?相差多大算是由抽样误差造成的呢?第2页,本讲稿共24页可通过计算可通过计算t t 值判断值判断 t t 值值越越大大,P P越越小小,=0 0越越有有可可能能不不成成立立,其其对对立立面面 0 0 越有可能成立。越有可能成立。第3页,本讲稿共24页2、基本步骤、基本步骤 1 1)建立检验假设,确定检验水准和单双侧。)建立检验假设,确定检验水准和单双侧。2 2)选定检验方法,计算统计量。)选定检验方法,计算统计量。3 3)确定)确定P P值,做出结论。值,做出结论。P P:a a 从从H H0 0规规定定的的总总体体中中随随机机抽抽得得等等于于及及大大于于(或或等等于于及及小小于于)现现有有统统计计量(如量(如t t 值)的概率。值)的概率。b b 被比较事物间的差别由抽样误差造成的可能性。被比较事物间的差别由抽样误差造成的可能性。Pa,Pa,则拒绝则拒绝H H0 0 ,接受,接受H H1 1,差别有统计学意义。,差别有统计学意义。P Pa,a,则不拒绝则不拒绝H H0 0 ,差别无统计学意义。,差别无统计学意义。第4页,本讲稿共24页情景问题情景问题问题问题4、本资料应如何做假设?、本资料应如何做假设?问题问题5、选择单侧检验还是双侧检验?、选择单侧检验还是双侧检验?问题问题6、通过统计分析,认为两个地区的人脉搏、通过统计分析,认为两个地区的人脉搏 有差异,这个结论肯定正确吗?有差异,这个结论肯定正确吗?第5页,本讲稿共24页3、注意事项:、注意事项:A A 资料之间具有可比性。资料之间具有可比性。B B 根据资料特点选择不同的方法。根据资料特点选择不同的方法。C C 在计算统计量之前,根据研究要求选定在计算统计量之前,根据研究要求选定检验水准检验水准,根,根 据专业知识选定据专业知识选定单双侧单双侧。D D 正确理解正确理解“显著性差异显著性差异”的含义的含义 假设检验的结果只假设检验的结果只 反映性质的差异,而不能说明数量上的大小;只说明反映性质的差异,而不能说明数量上的大小;只说明 是否有统计学意义,而不能说明专业上的差异大小。是否有统计学意义,而不能说明专业上的差异大小。E E 其结论不能绝对化。其结论不能绝对化。F F 结论要书写完整结论要书写完整 统计量值、概率大小、检验水准、单双侧等统计量值、概率大小、检验水准、单双侧等 第6页,本讲稿共24页续续 例:例:t=1.247t=1.247,v=9 v=9,0.20.2双双p p0.40.4,按,按=0.05=0.05的的水平,水平,p p,不拒绝,不拒绝H0H0,无统计学意义(统计结论),根,无统计学意义(统计结论),根据本调查还不能认为两种方法有差异(专业结论)据本调查还不能认为两种方法有差异(专业结论)第7页,本讲稿共24页练习练习1 1、假设检验时,、假设检验时,可以在计算统计量前或后设置可以在计算统计量前或后设置,一般选用一般选用0.05 0.05 或或0.01。2 2、假假设检验设检验中中单单双双侧侧的的选择应选择应是是 ()()A A 在建立假在建立假设设前前进进行行 C C 在在计计算算统计统计量后量后进进行行 B B 在在计计算算统计统计量前量前进进行行 D D 在下在下结论时进结论时进行行 E E 没有一定没有一定规规定定3 3、两、两样样本均数比本均数比较时较时,P,P越小越小,说说明明 ()()A A 两两样样本均数相差越大本均数相差越大 C C 越有理由越有理由认为认为两两总总体均数不同体均数不同 B B 两两总总体均数相差越大体均数相差越大 D D 越有理由越有理由认为认为两两样样本均数不同本均数不同 E E 以上都不是以上都不是 第8页,本讲稿共24页练习4、显著性检验的结果、显著性检验的结果P0.01哪个正确。哪个正确。A差别无显著性差别无显著性 B.差别很大差别很大 C.两样本来自同一总体两样本来自同一总体 D.差别有高度显著性差别有高度显著性 E由抽样造成误差的机会大于由抽样造成误差的机会大于1%5、有两样本均数推断两总体均数的差别时,所谓差别有显著性是指、有两样本均数推断两总体均数的差别时,所谓差别有显著性是指 A A 样本均数差别有显著性样本均数差别有显著性 B B 两总体均数差别有显著性两总体均数差别有显著性 C C 两样本均数和两总体均数差别均有显著性两样本均数和两总体均数差别均有显著性 D D 其中一个样本均数和总体均数差别有显著性其中一个样本均数和总体均数差别有显著性6、用某疗法治疗某病、用某疗法治疗某病3030人,有效人,有效2525人,由此可认为人,由此可认为 A A 该法疗效好该法疗效好 B B 该法疗效一般该法疗效一般 C C 例数太少,不能说明问题例数太少,不能说明问题 D D 无对照,不能说明问题无对照,不能说明问题第9页,本讲稿共24页判断题:判断题:1)t 检验是对两个不同均数的差别进行假设检验的方法之一。检验是对两个不同均数的差别进行假设检验的方法之一。2)t检验结果检验结果t=1.5,可认为两总体均数差别无意义。,可认为两总体均数差别无意义。3)两次两次t检验都是对两个不同样本均数的差别进行假设检验,一次检验都是对两个不同样本均数的差别进行假设检验,一次P0.01,一次,一次0.01P0.05,就表明前者两样本均数差别大,后者两样本均数差别小,就表明前者两样本均数差别大,后者两样本均数差别小 4)当总体方差已知时,检验样本均数和总体均数差别的假设检验只能用当总体方差已知时,检验样本均数和总体均数差别的假设检验只能用t检验。检验。5)在配对在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。检验后的结论是相同的。6)确定假设检验的检验水准后,同一资料双侧确定假设检验的检验水准后,同一资料双侧t检验的结论为有显著性差异,检验的结论为有显著性差异,单侧单侧t检验的结论必然也为有显著性差异。检验的结论必然也为有显著性差异。第10页,本讲稿共24页情景问题情景问题问题问题7、t检验适用于什么资料?检验适用于什么资料?问题问题8、t检验分为几种?他们分别适用的资料在设计上有何区别检验分为几种?他们分别适用的资料在设计上有何区别?问题问题9、t检验和检验和u检验有何区别和联系?检验有何区别和联系?问题问题10、怎么理解小概率事件原理在假设检验中的作用?、怎么理解小概率事件原理在假设检验中的作用?问题问题11、为什么说任何统计推断的结果都不是百分之百正确的?、为什么说任何统计推断的结果都不是百分之百正确的?问题问题12、p34例题例题4.10 结论会发生什么类型的错误?错误的可能结论会发生什么类型的错误?错误的可能 性是多少?如何减少?性是多少?如何减少?P32例题例题4.8结论会发生什么类型的错误?错误的可能性结论会发生什么类型的错误?错误的可能性 是多少?如何减少?是多少?如何减少?第11页,本讲稿共24页4、t检验和检验和u检验检验(1 1)t t检验检验 a a 条件:条件:n n较小时,样本取自正态总体;较小时,样本取自正态总体;两样本方差齐性。若不齐,用两样本方差齐性。若不齐,用tt检验。检验。(但但在在实实际际应应用用中中,与与条条件件略略有有偏偏离离,只只要要其其分分布布为为单单峰峰对对称称分分布,也无大碍)布,也无大碍)第12页,本讲稿共24页b t检验种类:检验种类:样本均数与总体均数比较样本均数与总体均数比较 配对设计的两均数比较配对设计的两均数比较 成组设计两样本均数的比较成组设计两样本均数的比较 第13页,本讲稿共24页1、样本均数与总体均数比较、样本均数与总体均数比较 据大量调查知,健康成年男子脉搏的均数为据大量调查知,健康成年男子脉搏的均数为72次分,某一身在山区随机次分,某一身在山区随机调查了调查了25名健康男子,其脉搏均数为名健康男子,其脉搏均数为74.2次次/分,标准差为分,标准差为6.0次次/分,能否分,能否认为该山区成年男子的脉搏高于一般人群?认为该山区成年男子的脉搏高于一般人群?=1.83 1=24 双侧p:0.05-0.10。95%CI:=74.22.064*6.0/(25)=71.7276.68第14页,本讲稿共24页 2、配对设计的两均数比较、配对设计的两均数比较 同源配对同源配对 异源配对异源配对 统计分析是比较配对差值与总体均数统计分析是比较配对差值与总体均数 0 的差别进行的的差别进行的第15页,本讲稿共24页第16页,本讲稿共24页3、成组设计两样本均数的比较、成组设计两样本均数的比较第17页,本讲稿共24页 V=122第18页,本讲稿共24页(2)u检验检验条件:条件:n n(n n5050)较大,或已知)较大,或已知。种类:种类:一个样本和总体的比较一个样本和总体的比较 两个样本的两个样本的u u检验(成组检验(成组u u检验)检验)第19页,本讲稿共24页五、五、型错误和型错误和型错误型错误1 1、型型错错误误:拒拒绝绝了了实实际际上上成成立立的的H0H0而而犯犯的的错错误误。其其大大小小相相当当于于。可可有有单双侧。单双侧。=0.05=0.05,当拒绝,当拒绝H0H0时,则理论上时,则理论上100100次检验中平均有次检验中平均有5 5次发生这样的错误。次发生这样的错误。2 2、型型错错误误:接接受受了了实实际际上上不不成成立立的的H0H0而而犯犯的的错错误误。其其大大小小用用表表示示。只只有有单单侧。侧。的大小不可知,一般的大小不可知,一般越大,则越大,则越小。越小。要同时减少这两类错误,只有增加样本数量。要同时减少这两类错误,只有增加样本数量。1-1-称称为为检检验验效效能能,即即当当两两者者确确有有差差异异,按按规规定定检检验验水水准准所所能能发发现现该该差差异异的的能能力力第20页,本讲稿共24页第21页,本讲稿共24页六、可信区间与假设检验的区别和联系六、可信区间与假设检验的区别和联系 1 1、可信区间用于说明量的大小,而假设检验用于推断质的不同。、可信区间用于说明量的大小,而假设检验用于推断质的不同。2 2、可信区间也能回答假设检验的问题。、可信区间也能回答假设检验的问题。若可信区间包含了若可信区间包含了H0H0,则不拒绝,则不拒绝H0H0;若不包含;若不包含H0H0,则接受,则接受H1H1。3 3、可可信信区区间间比比假假设设检检验验可可提提供供更更多多的的信信息息。不不但但回回答答是是否否有有统统计计学学意意义义,还还能能提提示示差差别别是是否否有有专专业业意意义义。(详详见见高高等等医医学院校学院校卫生统计学卫生统计学第四版第四版P46P46)。)。第22页,本讲稿共24页练习练习1 1、关于统计推断中单双侧的确定错误的、关于统计推断中单双侧的确定错误的 ()()A A 根据专业知识确定根据专业知识确定 B B 根据研究者需要确定根据研究者需要确定 C C 双侧较稳妥,故常采用双侧较稳妥,故常采用 D D 做初步研究时,一般选取双侧做初步研究时,一般选取双侧 E E 必须在计算统计量前确定必须在计算统计量前确定2 2、下列哪种资料不适用、下列哪种资料不适用T-T-检验检验 ()()A A 一个小样本均数和总体均数的比较一个小样本均数和总体均数的比较 B B 一个大样本均数和总体均数的比较一个大样本均数和总体均数的比较 C C 两个小样本均数的比较两个小样本均数的比较 D D 两个大样本均数的比较两个大样本均数的比较 E E 四格表资料的比较四格表资料的比较第23页,本讲稿共24页 3、已已知知总总体体均均数数和和标标准准差差,要要推推断断某某一一样样本本含含量量为为100,样样本本代代表表的的总总体体是是否否与与已已知总体相同知总体相同,该用什么方法该用什么方法?A.t检验检验 B.u检验检验 C.X2检验检验 D.t,u检验均可检验均可 4、两样本均数比较时两样本均数比较时,分别取以下检验水准分别取以下检验水准,以下所取第二类错误最小以下所取第二类错误最小;A.=0.05 B.=0.01 C.=0.1 D.=0.2.第24页,本讲稿共24页