《u检验和t检验学习.pptx》由会员分享,可在线阅读,更多相关《u检验和t检验学习.pptx(73页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、t testt test单样本均数 t 检验配对样本均数的t检验两个独立样本均数的t 检验正态性检验两样本的方差齐性检验两总体方差不等时均数比较的 检验案例 练习和思考 小结主要内容-contents-第1页/共73页第一页,编辑于星期日:八点 分。t t 检验是假设检验中最见的一种方法,它是检验是假设检验中最见的一种方法,它是以以t t分布分布为为基础。由于基础。由于t t分布的发现使得小样本统计推断成为可能,分布的发现使得小样本统计推断成为可能,因而,它被认为是统计学发展史中的里程碑之一,在医因而,它被认为是统计学发展史中的里程碑之一,在医学统计学中,学统计学中,t t检验是非常活跃的一类
2、假设检验方法。检验是非常活跃的一类假设检验方法。什么是t检验?第2页/共73页第二页,编辑于星期日:八点 分。单样本单样本t检验检验配对样本配对样本t检验检验两个独立样本两个独立样本t检验检验同源配对同源配对异源配对异源配对t 检验的分类:第3页/共73页第三页,编辑于星期日:八点 分。t t 假设检验的应用条件:假设检验的应用条件:(1 1)未知且未知且n n较小;较小;(2 2)样本来自正态分布总体;)样本来自正态分布总体;(3 3)两样本均数比较时还要求所对应的两总)两样本均数比较时还要求所对应的两总体方差相等(体方差相等(1 12 2 =2 22 2 ),即方差齐性),即方差齐性(Ho
3、mogeneity of VarianceHomogeneity of Variance););(4 4)独立性。)独立性。在实际应用中,与上述条件略有偏离,但对结在实际应用中,与上述条件略有偏离,但对结果影响不大。果影响不大。问题:问题:已知,或已知,或n n较大时,用什么检验?较大时,用什么检验?第4页/共73页第四页,编辑于星期日:八点 分。f(t)=(标准正态曲线)=5=10.10.2-4-3-2-1012340.3z z 检验 t t 检验是根据检验是根据t t分布判断样本概率而进行的假设分布判断样本概率而进行的假设检验,而当样本量检验,而当样本量n n很大时,很大时,t t分布就接
4、近标准正态分布就接近标准正态分布,标准正态分布也称为分布,标准正态分布也称为u u分布,而国外教科书则分布,而国外教科书则称为称为Z Z分布,这时候根据分布,这时候根据u u分布判断概率所进行的假分布判断概率所进行的假设检验称为设检验称为u u检验。检验。应用条件:应用条件:已知或者已知或者未知未知且且n n足够大(如足够大(如n100n100)。)。复习第5页/共73页第五页,编辑于星期日:八点 分。(1 1)样本均数与总体均数的比较目的:推断该样本是否来自某已知总体;样本均数代表的总体均数 与 0 0是否相等。总体均数 0 0一般为理论值、标准值或经大量观察所得并为人们接受的公认值、习惯值
5、。未知总体未知总体已知总体已知总体0?第6页/共73页第六页,编辑于星期日:八点 分。t t 检验例例3.16 3.16 根据大量调查,已知健康成年男子听到最高声音根据大量调查,已知健康成年男子听到最高声音频率的平均数为频率的平均数为18000Hz18000Hz。某医生随机抽查。某医生随机抽查2525名接触噪名接触噪声作业的男性工人,测得可以听到的最高声音频率的均数声作业的男性工人,测得可以听到的最高声音频率的均数为为17200Hz17200Hz,标准差为,标准差为650Hz650Hz。试问能否认为接触噪。试问能否认为接触噪声作业工人的听力水平与正常成年男性的听力水平不声作业工人的听力水平与正
6、常成年男性的听力水平不同?同?0=18000Hz总体总体健康成年男子健康成年男子样本样本接触噪声接触噪声作业工人作业工人总体总体=未知总体未知总体?第7页/共73页第七页,编辑于星期日:八点 分。1 1、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(=。)接触噪声作业工人的听。)接触噪声作业工人的听力水平与正常成年男性的听力水平相同。力水平与正常成年男性的听力水平相同。H H1 1 (。)接触噪声作业工人的听力)接触噪声作业工人的听力水平与正常成年男性的听力水平不同。水平与正常成年男性的听力水平不同。=0.05=0.05针针对对总总体体2 2、选定检验方法,计算检验统计量、选定检
7、验方法,计算检验统计量t t值。值。n=25 n=25,X=17200HzX=17200Hz,s=650Hzs=650Hz,。=18000Hz=18000Hz统计量统计量t t表示,在标准误的尺度下,样本均数与总表示,在标准误的尺度下,样本均数与总体均数的偏离。这种偏离称为标准体均数的偏离。这种偏离称为标准t t离差离差(standard t deviationstandard t deviation)假设检验步骤:假设检验步骤:第8页/共73页第八页,编辑于星期日:八点 分。3 3、确定、确定P P值,作出推断结论。值,作出推断结论。查查t t界值表双侧界值表双侧0t=6.154现有统计量现
8、有统计量t=6.1542.797t=6.1542.797,P0.01P0.01。按。按=0.05=0.05水准,拒绝水准,拒绝H H。,接受。,接受H1H1,差异,差异有统计学意义。结合本题有统计学意义。结合本题有理由认为接触噪声作业有理由认为接触噪声作业的男性工人平均听力水平的男性工人平均听力水平低于正常成年男性。低于正常成年男性。第9页/共73页第九页,编辑于星期日:八点 分。-tt0第10页/共73页第十页,编辑于星期日:八点 分。-2.0642.0640=240.0250.025t0.05,24=2.064 P=P(|t|2.064)=0.05 P=P(|t|5.4545)0.050.
9、05第11页/共73页第十一页,编辑于星期日:八点 分。思路解析:思路解析:0=18000Hz总体总体健康成年男子健康成年男子样本样本总体总体=未知总体未知总体0第12页/共73页第十二页,编辑于星期日:八点 分。0=18000Hz总体总体样本样本假设该样本来自已知总体假设该样本来自已知总体0=18000Hz总体总体样本样本这些样本是什么分布规律?第13页/共73页第十三页,编辑于星期日:八点 分。这些样本是什么分布规律?(1 1)这些样本的均数服从正态分布:)这些样本的均数服从正态分布:这里这里0=18000Hz,未知,因此未知,因此这种正态分布往往是这种正态分布往往是未知的,这样就没办法求
10、目前手头这个样本(未知的,这样就没办法求目前手头这个样本()在样本抽样分布中出现的概率就无法确认。即无法获)在样本抽样分布中出现的概率就无法确认。即无法获得等于及大于(或等于及小于)得等于及大于(或等于及小于)现有样本均数的现有样本均数的概率,也就无法概率,也就无法判断是否是小判断是否是小概率。概率。?只知道它服从正只知道它服从正态分布,至于是态分布,至于是什么样的正态分什么样的正态分布,不清楚布,不清楚第14页/共73页第十四页,编辑于星期日:八点 分。这些样本的均数服从正态分布,但至于是什么样的正态分这些样本的均数服从正态分布,但至于是什么样的正态分布,往往未知,这时我们不去追究,而是回避
11、这个问题,布,往往未知,这时我们不去追究,而是回避这个问题,采用采用t t分布来解决。分布来解决。第15页/共73页第十五页,编辑于星期日:八点 分。(2 2)由这些样本的均数和标准差导出的新的统计量)由这些样本的均数和标准差导出的新的统计量t t服从的不是正态分布,而是服从的不是正态分布,而是t t分布。分布。都是已知的服从自由度为服从自由度为n-1n-1的的t t分布,分布,即即v=25-1=24v=25-1=24的的t t分布。分布。f(t)=(标准正态曲线)=5=10.10.2-4-3-2-1012340.3t 仅分布与自由度有关第16页/共73页第十六页,编辑于星期日:八点 分。-t
12、t0不同自由度下不同自由度下t t界值对应的概率有差异界值对应的概率有差异第17页/共73页第十七页,编辑于星期日:八点 分。t 仅分布与自由度有关 f(t)=(标准正态曲线)=5=10.10.2-4-3-2-1012340.3第18页/共73页第十八页,编辑于星期日:八点 分。-tt0P0.01第19页/共73页第十九页,编辑于星期日:八点 分。对这个样本是否来自这对这个样本是否来自这个总体产生了怀疑,因个总体产生了怀疑,因此从已知总体中抽样,此从已知总体中抽样,获得这样的样本的概率获得这样的样本的概率太少了太少了P0.01P100n100)。)。(n(n较大时较大时)(。已知时。已知时)第
13、21页/共73页第二十一页,编辑于星期日:八点 分。这些样本是什么分布规律?这些样本的均数服从正态分布:这些样本的均数服从正态分布:。它服从正态分布,它服从正态分布,至于是什么样的至于是什么样的正态分布,是清正态分布,是清楚的。楚的。(。已知时。已知时)第22页/共73页第二十二页,编辑于星期日:八点 分。(n(n较大时较大时)f(t)=(标准正态曲线)=5=10.10.2-4-3-2-1012340.3u 分布分布第23页/共73页第二十三页,编辑于星期日:八点 分。例例3.18 3.18 为了解医学院学生的心理健康状况,随机抽查某为了解医学院学生的心理健康状况,随机抽查某医科大学在校大学生
14、医科大学在校大学生210210名,用名,用SCLSCL9090症状自评量表进行症状自评量表进行测定,得出因子总分的均数为测定,得出因子总分的均数为142.6142.6,标准差为,标准差为31.2531.25。已知全国已知全国SCLSCL9090因子总分的均数(常模)为因子总分的均数(常模)为130130。试问该。试问该医科大学在校学生的医科大学在校学生的SCLSCL9090因子总分是否与全国水平相同因子总分是否与全国水平相同?0=130总体总体全国水平全国水平样本样本某医学大学某医学大学在校学生在校学生总体总体=未知总体未知总体?第24页/共73页第二十四页,编辑于星期日:八点 分。(n(n较
15、大时较大时)f(t)=(标准正态曲线)=5=10.10.2-4-3-2-1012340.3u 分布分布第25页/共73页第二十五页,编辑于星期日:八点 分。1 1、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(=。)该医科大学在校学生的。)该医科大学在校学生的SCL90SCL90因子总分与全国水平相同。因子总分与全国水平相同。H H1 1 (。)医科大学在校学生的)医科大学在校学生的SCL90SCL90因子总分与全国水平不同。因子总分与全国水平不同。=0.05=0.05针针对对总总体体2 2、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量u u值。值。n=210100
16、 n=210100,X=142.6X=142.6,s=31.25s=31.25,。=130=130假设检验步骤:假设检验步骤:第26页/共73页第二十六页,编辑于星期日:八点 分。3 3、确定、确定P P值,作出推断结论。值,作出推断结论。查查u u界值表双侧,即界值表双侧,即t t界值表中界值表中v v为为时的一行,双侧:时的一行,双侧:0u=5.843现有统计量现有统计量u=5.8432.58u=5.8432.58,P0.01P0.20;在慢性实验中,应保持配对因素的可比性,即实验全程配对因素应保持齐同;在实际资料处理时,配对可能是成功的(属配对设计),也可能是不成功的,是完全随机设计。第
17、29页/共73页第二十九页,编辑于星期日:八点 分。设计模式:研究对象N N合格对象NeNe组组D D0 0D D1 1C C因素T T1 1因素统计分析分组施加因素效应配对P P随机R R第30页/共73页第三十页,编辑于星期日:八点 分。若两处理因素的效应无差别,差值若两处理因素的效应无差别,差值d d的总体均数的总体均数 d d应该应该为为0 0,故可将该检验理解为样本均数与总体均数,故可将该检验理解为样本均数与总体均数 d d =0=0的比较的比较差值均数的大小及其抽样误差差值均数的大小及其抽样误差反应因素的效应反应因素的效应 第31页/共73页第三十一页,编辑于星期日:八点 分。配对
18、设计t t检验的思路:例例3.19 3.19 为研究某心理干预措施对抑郁症患者的疗效,为研究某心理干预措施对抑郁症患者的疗效,对对1010名抑郁症患者于干预前、干预后分别进行生活满意度名抑郁症患者于干预前、干预后分别进行生活满意度指数指数B B(LSIBLSIB)的心理测试,结果如表)的心理测试,结果如表3-73-7所示。问该干预所示。问该干预措施是否有效?措施是否有效?第32页/共73页第三十二页,编辑于星期日:八点 分。12345678910编号编号 干预前干预前 干预后干预后 差值(差值(d)d21291065813111091512161012919181511336471675299
19、36164913649254合计合计 d=44 d2=234 表表3-7 10抑郁症患者干预前后心理指标抑郁症患者干预前后心理指标LSIB测试结果测试结果第33页/共73页第三十三页,编辑于星期日:八点 分。d=0总体总体总体总体=?第34页/共73页第三十四页,编辑于星期日:八点 分。1 1、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(d d=0=0)干预措施实施前后无差别干预措施实施前后无差别H H1 1 (d d 0 0)干预措施实施前后有差别)干预措施实施前后有差别 =0.05=0.05针针对对总总体体2 2、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量t
20、 t值。值。n=10 n=10,d=d=d/n=44/10=4.4,假设检验步骤:假设检验步骤:第35页/共73页第三十五页,编辑于星期日:八点 分。3 3、确定、确定P P值,作出推断结论。值,作出推断结论。查查t t界值表双侧界值表双侧0t=6.563现有统计量现有统计量t=6.5633.250t=6.5633.250,P0.01P50n50时),自由度足够大,可用u u检验。两个样本均数差值的标准误第40页/共73页第四十页,编辑于星期日:八点 分。例例3.21 3.21 为评价交通污染对交通警察心理健康状况的影响,为评价交通污染对交通警察心理健康状况的影响,某医生随机抽取某市交警大队外
21、勤警察某医生随机抽取某市交警大队外勤警察212212名(男性)作名(男性)作为暴露组,进行为暴露组,进行SCL90SCL90评定,测得均数为评定,测得均数为152.51152.51,标准差,标准差为为35.2735.27。已知全国(男性,。已知全国(男性,n=724n=724)常模的均数为)常模的均数为129.96129.96,标准差为,标准差为38.7638.76。试问该市交警心理状况。试问该市交警心理状况SCL90SCL90评分是否高于全国常模?评分是否高于全国常模?暴露组暴露组 对照组对照组或常模组或常模组第41页/共73页第四十一页,编辑于星期日:八点 分。假设检验步骤:假设检验步骤:
22、(1)(1)、建立假设,确定检验水准。、建立假设,确定检验水准。H H。(1 1=2 2)该市交警心理状况该市交警心理状况SCL90SCL90评分评分与全国常模与全国常模相同相同H H1 1 (1 12 2 )该市交警心理状况该市交警心理状况SCL90SCL90评分评分高于全国常模高于全国常模 =0.05=0.05针针对对总总体体(2)(2)、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量u u值。值。n 1=212 n 1=212,X=152.51X=152.51,s1=35.27s1=35.27n 2=724 n 2=724,X=129.96X=129.96,s2=38.76s
23、2=38.76第42页/共73页第四十二页,编辑于星期日:八点 分。(3)(3)、确定、确定P P值,作出推断结论。值,作出推断结论。查查u u界值表双侧,即界值表双侧,即t t界值表中界值表中v v为为时的一行,双侧:时的一行,双侧:0u=8.001现有统计量现有统计量u=8.0012.58u=8.0012.58,P0.01P 0.50.050.50.05,差差别别无无统统计计学学意意义义,可以还不能认为可以还不能认为13-1613-16岁居民腭弓深度有性别差异。岁居民腭弓深度有性别差异。第46页/共73页第四十六页,编辑于星期日:八点 分。正态性检验(1 1)未知且未知且n n较小;较小;
24、(2 2)样本来自正态分布总体;样本来自正态分布总体;(3 3)两样本均数比较时还要求所对应的两)两样本均数比较时还要求所对应的两总体方差相等(总体方差相等(1 12 2 =2 22 2 ),即方差齐),即方差齐性(性(Homogeneity of VarianceHomogeneity of Variance););(4 4)独立性。)独立性。第47页/共73页第四十七页,编辑于星期日:八点 分。方差齐性检验(1 1)未知且未知且n n较小;较小;(2 2)样本来自正态分布总体;)样本来自正态分布总体;(3 3)两样本均数比较时还要求所对应的两总两样本均数比较时还要求所对应的两总体方差相等(
25、体方差相等(1 12 2 =2 22 2 ),即方差齐性),即方差齐性(Homogeneity of VarianceHomogeneity of Variance););(4 4)独立性。)独立性。第48页/共73页第四十八页,编辑于星期日:八点 分。两样本所属总体方差不等(SatterthwaiteSatterthwaite近似法)如果1 12=2=2 22 2,两样本所属总体方差不相等,如果两总体为正态分布,分别记为N N(1 1,2 2)和(2 2,2 2 ),检验假设为:H H0 0:1 1=2 2H H1 1:1 1 2 2t t(v)分布分布第49页/共73页第四十九页,编辑于星
26、期日:八点 分。例例6-5 6-5 为探讨硫酸氧钒对糖尿病性白内障的防治作用,为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的研究人员将已诱导糖尿病模型的2020只大鼠随机分成为只大鼠随机分成为两组。一组用硫酸氧钒治疗(两组。一组用硫酸氧钒治疗(DVDV组),另一组作对组),另一组作对照观察(照观察(D D组),组),1212周后测大鼠血糖含量(周后测大鼠血糖含量(mmol/Lmmol/L)。)。结果为,结果为,DVDV组组1212只,样本均数为只,样本均数为6.5mmol/L6.5mmol/L,标准差为,标准差为1.34mmol/L1.34mmol/L;D D组组8 8
27、只,样本均数为只,样本均数为13.7mmol/L13.7mmol/L,标准,标准差为差为4.21mmol/L4.21mmol/L。试问两组动物血糖含量的总体均数是否。试问两组动物血糖含量的总体均数是否相同?相同?H H0 0:1 1=2 2 ,H H1 1:1 1 2 2双侧双侧 =0.05=0.05检验假设检验假设第50页/共73页第五十页,编辑于星期日:八点 分。DVDV组组D D组组提示方差不齐提示方差不齐04.68174.6817第51页/共73页第五十一页,编辑于星期日:八点 分。配对设计与完全随机设计比较由于配对设计的抽样误差较小,它的实验效率往往优于完全随机设计,在实际工作中多数
28、情况也如此,但也有特殊情况,主要有两个方面原因:(1)标准误的大小若采用两组的标准差计算配对设计的标准误:(r为两列数据相关系数)当样本量相等时,完全随机设计的两组差值均数的标准误为:因此,当r0配对成功,当r100n100)。)。第55页/共73页第五十五页,编辑于星期日:八点 分。大样本均数比较的u检验(1)样本均数与总体均数比较的u检验假定样本数据X1、X2、X n 服从正态分布 ,当检验假设H。:=0 成立时,样本均数 服从正态分布 ,这里的总体均数0一般是指已知的理论值、标准值或经过大量观察所得到的稳定值,为总体方差,检验统计量为:当总体标准差 未知,n60时,可用样本标准差S作为
29、的估计值,即:第56页/共73页第五十六页,编辑于星期日:八点 分。例7-1 7-1 根据19831983年大量调查结果,已知某地成年男子的脉搏均数为7272次/分钟。某医生20032003年在该地随机调查了7575名成年男子,求得其脉搏均数为74.274.2次/分钟,标准差为6.56.5次/分钟,能否据此认为该地成年男子的脉搏数不同于19831983年?0=72次次/分钟分钟总体总体19831983年年大量大量调查结果调查结果样本样本20032003年调查年调查总体总体=未知总体未知总体第57页/共73页第五十七页,编辑于星期日:八点 分。假设检验的步骤:步骤一:建立检验假设,确定检验水准H
30、。:=72,即该地成年男子的平均脉搏没有变化,即该地成年男子的平均脉搏没有变化H1 :72,即该地成年男子的平均脉搏与,即该地成年男子的平均脉搏与1983年不同年不同=0.05 (=0.05 (认为这个事件不可能发生认为这个事件不可能发生)步骤二:计算检验统计量-u值步骤三:确定P值,作出推断结论因此P0.05,按预先设定=0.05的检验水准,不拒绝H。,统计结论为差别无统计学意义,根据本试验结果尚不能推断补锌对新生儿出生体重有影响。第62页/共73页第六十二页,编辑于星期日:八点 分。案 例第63页/共73页第六十三页,编辑于星期日:八点 分。第64页/共73页第六十四页,编辑于星期日:八点
31、 分。案例案例6-2 为研究不同药物对肥胖患者的疗效,将BMI28的肥胖患者随机分成两组,每组10人,测得他们服药前及服药2个月后体重的变化(教材表6-10)。试评价:A、B两种药物对肥胖患者是否有效。A、B两种药物的疗效有无差别。第65页/共73页第六十五页,编辑于星期日:八点 分。第66页/共73页第六十六页,编辑于星期日:八点 分。第67页/共73页第六十七页,编辑于星期日:八点 分。第68页/共73页第六十八页,编辑于星期日:八点 分。案例辨析案例辨析 “同一受试对象处理前后的比较”严格地说不是合格的配对设计,因为处理前的个体接受的是空白处理,而处理后的同一个体接受的是“处理(长跑)+时间(5个月)”,因此,即便长跑前后的晨脉次数有差别,也不能就判断是长跑的作用,因为有5个月的时间效应混杂在其中。正确做法正确做法 处理此类问题的最好办法是加一个平行对照,使“时间效应”在两组比较时互相抵消,从而可以更真实地揭示“长跑与否”产生的效应之间的差别有无统计学意义。第69页/共73页第六十九页,编辑于星期日:八点 分。练习与思考第70页/共73页第七十页,编辑于星期日:八点 分。第71页/共73页第七十一页,编辑于星期日:八点 分。第72页/共73页第七十二页,编辑于星期日:八点 分。感谢您的观看。第73页/共73页第七十三页,编辑于星期日:八点 分。
限制150内