[精选]t检验与u检验相关资料(ppt 84页).pptx
本资料来源第五章第五章 t t检验和检验和u检验检验 1.t 检验的应用检验的应用:主要用于样本含量较小主要用于样本含量较小n60、或总体标准差未知的情况。、或总体标准差未知的情况。.样本均数与总体均数的比较样本均数与总体均数的比较;.两个小样本均数的比较两个小样本均数的比较;.配对设计资料均数的比较。配对设计资料均数的比较。2.t 检验的应用条件检验的应用条件:.正态性正态性;.方差齐性。方差齐性。2.u检验的应用检验的应用:要求样本含量较大要求样本含量较大,或或n较小但较小但。.样本均数与总体均数的比较;样本均数与总体均数的比较;.两个大样本均数的比较。两个大样本均数的比较。第一节第一节 单样本的单样本的t t检验检验 进进行行样样本本均均数数与与总总体体均均数数的的比比较较,比比较较的的目目的的:推推断断样样本本所所代代表表的的未未知知总总体体均均数数与与的的总体均数有无差异。总体均数有无差异。总总体体均均数数:理理论论值值、标标准准值值或或经经过过大大量量观观察所得的稳定值。察所得的稳定值。检验统计量检验统计量t 的计算公式及自由度的计算公式及自由度:例例5.1:根根据据大大量量调调查查,健健康康成成年年男男子子的的脉脉搏搏均均数数为为72次次/分分,标标准准差差为为6.0次次/分分。某某医医生生在在某某山山区区随随机机调调查查25名名健健康康成成年年男男子子,求求得得脉脉搏搏均均数数为为74.2次次/分分,能能否否认认为为该该山山区区的的成成年年男男子子的的脉脉搏搏均均数数高高于于一一般般成成年男子的脉搏均数?年男子的脉搏均数?对资料进行分析对资料进行分析:1.资料提供的信息资料提供的信息:计量资料计量资料 总体均数总体均数 0=72次次/分分,n=25,S=6.0次次/分分。2.应进行样本均数与总体均数比较的应进行样本均数与总体均数比较的 t检验。检验。3.目的目的:推断样本所代表的未知总体均推断样本所代表的未知总体均 数与的总体均数有无差异。数与的总体均数有无差异。1 建立检验假设,确定检验水准建立检验假设,确定检验水准 HH0 0:=0 0,山区成年男子脉搏均数与一般成年男子的脉山区成年男子脉搏均数与一般成年男子的脉山区成年男子脉搏均数与一般成年男子的脉山区成年男子脉搏均数与一般成年男子的脉 搏均数相同搏均数相同搏均数相同搏均数相同 HH1 1:0 0,山区成年男子脉搏均数与一般成年男子的脉山区成年男子脉搏均数与一般成年男子的脉山区成年男子脉搏均数与一般成年男子的脉山区成年男子脉搏均数与一般成年男子的脉 搏均数不同搏均数不同搏均数不同搏均数不同 =0.050.05 3 确定确定P值值,作出统计推断结论作出统计推断结论 以以=n-1=25-1=24,查查t界值表界值表,t0.052,24=2.064,tt0.052,24,P0.05,按按=0.05水准尚不拒绝水准尚不拒绝H0,两者的差异无统计学意义。据此资料还不能两者的差异无统计学意义。据此资料还不能认为山区成年男子的脉搏均数与一般健康成年认为山区成年男子的脉搏均数与一般健康成年男子的脉搏均数不同。男子的脉搏均数不同。2 计算统计量计算统计量 1 建立检验假设,确定检验水准建立检验假设,确定检验水准 HH0 0:=0 0,山区成年男子脉搏均数与一般成年男子的脉山区成年男子脉搏均数与一般成年男子的脉山区成年男子脉搏均数与一般成年男子的脉山区成年男子脉搏均数与一般成年男子的脉 搏均数相同搏均数相同搏均数相同搏均数相同 HH1 1:0 0,山区成年男子脉搏均数高于一般成年男子的山区成年男子脉搏均数高于一般成年男子的山区成年男子脉搏均数高于一般成年男子的山区成年男子脉搏均数高于一般成年男子的 脉搏均数脉搏均数脉搏均数脉搏均数 单侧单侧单侧单侧 =0.050.05 3 确定确定P值值,作出统计推断结论作出统计推断结论 以以=n-1=25-1=24,查查t界值表界值表,t0.05,24=1.711,tt0.05,24,P0.05,按按=0.05水准拒绝水准拒绝H0,接受接受H1,两者的差异有统计学意义。可以两者的差异有统计学意义。可以认为山区成年男子的脉搏均数高于一般健认为山区成年男子的脉搏均数高于一般健康成年男子的脉搏均数。康成年男子的脉搏均数。2 计算统计计算统计量量0=72次次/分分=?次次/分分 Xn n =25=25X=X=74.274.2次次/分分S S=6.0=6.0次次/分分 山区人群山区人群山区人群山区人群未知总体未知总体未知总体未知总体一般人群一般人群一般人群一般人群总体总体总体总体假设:=00 01.8331.8331.7111.7112.4922.4920.010.01p p0.050.05 例例5.2 以以往往通通过过大大规规模模调调查查某某地地新新生生儿儿出出生生体体重重为为3.30kg,从从该该地地难难产产儿儿中中随随机机抽抽取取35名名新新生生儿儿作作为为研研究究样样本本,平平均均出出生生体体重重为为3.42kg,标标准准差差为为0.40kg。问问该该地地难难产产儿儿出出生生体体重重是是否否与与一一般般新新生生儿儿体体重重不不同?同?对资料进行分析对资料进行分析:1.资料提供的信息资料提供的信息:计量资料计量资料 总体均数总体均数 0=3.30kg,n=35,S=0.40kg。2.应进行样本均数与总体均数比较的应进行样本均数与总体均数比较的 t检验。检验。3.目的目的:推断样本所代表的未知总体均推断样本所代表的未知总体均 数与的总体均数有无差异。数与的总体均数有无差异。1 建立检验假设,确定检验水准建立检验假设,确定检验水准 HH0 0:=0 0,该地难产儿与一般新生儿平均出生体重相同该地难产儿与一般新生儿平均出生体重相同该地难产儿与一般新生儿平均出生体重相同该地难产儿与一般新生儿平均出生体重相同 HH1 1:0 0,该地难产儿与一般新生儿平均出生体重不同该地难产儿与一般新生儿平均出生体重不同该地难产儿与一般新生儿平均出生体重不同该地难产儿与一般新生儿平均出生体重不同 =0.050.05 3 确定确定P值值,作出统计推断结论作出统计推断结论 以以 =n-1=35-1=34,查查t界值表界值表,t0.052,34=2.032,tt0.052,34,P0.05,按按=0.05水水准准尚尚不不拒拒绝绝H0,两两者者的的差差异异无无统统计计学学意意义义。据据样样本本提提供供的的信信息息,还还不不能能认认为为该该地地难难产产儿儿与与一一般般新新生生儿儿平平均均出出生生体重不同。体重不同。2 计算统计量计算统计量 检验水准检验水准:=0.05 P0.05 两者的差异无统计学意义两者的差异无统计学意义 0.01 P 0.05 两者的差异有统计学意义两者的差异有统计学意义 P 0.01 两者的差异有高度统计学意义两者的差异有高度统计学意义例例:某某医医生生测测量量了了36名名从从事事铅铅作作业业男男性性工工人人的的血血红红蛋蛋 白白 含含 量量,算算 得得 均均 数数 为为 130.83g/L,标标 准准 差差 为为25.74g/L。正正常常成成年年男男性性的的血血红红蛋蛋白白平平均均值值为为140g/L,问问从从事事铅铅作作业业工工人人的的血血红红蛋蛋白白平平均均值值是是否不同于正常成年男性?否不同于正常成年男性?3 3 确定确定确定确定P P值值值值,作出统计推断结论作出统计推断结论作出统计推断结论作出统计推断结论 以以以以 =n n-1=36-1=35-1=36-1=35,查,查,查,查t t界值表,界值表,界值表,界值表,t t0.050.052 2,3535=2.030=2.030,t tt t0.050.052 2,35 35,P P 0.05 0.05,按,按,按,按 =0.05=0.05水准拒绝水准拒绝水准拒绝水准拒绝HH0 0,接受接受接受接受HH1 1,差异有统计学意义。可以认为从事铅作业差异有统计学意义。可以认为从事铅作业差异有统计学意义。可以认为从事铅作业差异有统计学意义。可以认为从事铅作业男性工人的血红蛋白含量不同于正常成年男性。男性工人的血红蛋白含量不同于正常成年男性。男性工人的血红蛋白含量不同于正常成年男性。男性工人的血红蛋白含量不同于正常成年男性。即从事铅作业男性工人的血红蛋白含量低于正常即从事铅作业男性工人的血红蛋白含量低于正常即从事铅作业男性工人的血红蛋白含量低于正常即从事铅作业男性工人的血红蛋白含量低于正常成年男性。成年男性。成年男性。成年男性。2 计算统计量计算统计量第二节第二节 配对样本均数的配对样本均数的t t检验检验 配对设计配对设计paired design:将受试对象:将受试对象按按照某种特征相同或相近的原则配成对子照某种特征相同或相近的原则配成对子,每每对中的两个受试对象随机分配到两个不同处对中的两个受试对象随机分配到两个不同处理组或实验组和对照组中理组或实验组和对照组中,分别给予不同的分别给予不同的处理处理,称配对设计。称配对设计。优点优点:由于同对的受试对象间均衡性较好由于同对的受试对象间均衡性较好,可减少非研究因素对结果的影响可减少非研究因素对结果的影响,提高统计提高统计处理的效率。处理的效率。人群试验中人群试验中:常将性别相同、年龄、生活常将性别相同、年龄、生活条件、工作条件、病情等因素相近的人配成条件、工作条件、病情等因素相近的人配成对子。对子。动物实验中动物实验中:常将动物的种属、窝别、性常将动物的种属、窝别、性别相同、体重相近的动物配成对子。别相同、体重相近的动物配成对子。在医学科研中在医学科研中,配对设计主要有以下几种配对设计主要有以下几种情况情况:1.两个同质受试对象分别接受两种不同的处理两个同质受试对象分别接受两种不同的处理;2.同一受试对象或同一标本的两个局部同一受试对象或同一标本的两个局部,分别接分别接 受两种不同的处理受两种不同的处理;目的目的:推断两种处理有无差异。推断两种处理有无差异。3.同一受试对象处理前后比较同一受试对象处理前后比较自身比照自身比照;目的目的:推断该种处理有无作用。推断该种处理有无作用。特点特点:不能随机分配处理因素不能随机分配处理因素,在实验研究中应在实验研究中应 设平行对照。设平行对照。配对配对t t检验的基本原理检验的基本原理:假设两种处理的效应相同假设两种处理的效应相同,即即1=2,则则1-2=0 可视为总体均数可视为总体均数0=0,即可看成是即可看成是差值的样本均数所代表的未知总体均数差值的样本均数所代表的未知总体均数d与总体均数与总体均数0=0的比较。的比较。应用条件应用条件:差值服从正态分布。差值服从正态分布。样样 本本 治疗前后血红蛋治疗前后血红蛋治疗前后血红蛋治疗前后血红蛋白的变化白的变化白的变化白的变化差值差值差值差值问题归纳:问题归纳:样本疗效样本疗效 药物作用药物作用 +机遇机遇 对上面问题可以作如下考虑:对上面问题可以作如下考虑:问题:问题:究竟多大能够下究竟多大能够下“有效的结论?有效的结论?假定治疗前后血红蛋白检测结果的差值服从正态分布,假设假定治疗前后血红蛋白检测结果的差值服从正态分布,假设假定治疗前后血红蛋白检测结果的差值服从正态分布,假设假定治疗前后血红蛋白检测结果的差值服从正态分布,假设 则则则则 服从服从服从服从t t t t 分布。分布。分布。分布。根据根据根据根据 t t 分布能够得到有如此大差异的相应的概率分布能够得到有如此大差异的相应的概率分布能够得到有如此大差异的相应的概率分布能够得到有如此大差异的相应的概率P P值值值值 ,如果如果如果如果P P 值很小值很小值很小值很小,即计算出的即计算出的即计算出的即计算出的t t 值超出了给定的界限值超出了给定的界限值超出了给定的界限值超出了给定的界限,则倾向于拒绝则倾向于拒绝则倾向于拒绝则倾向于拒绝HH0 0,认认认认为治疗前后有差异。为治疗前后有差异。为治疗前后有差异。为治疗前后有差异。图图4-3 4-3 利用利用t t 分布进行假设检验原理示意图分布进行假设检验原理示意图 检验统计量检验统计量t 值的计算公式及自由度值的计算公式及自由度:例例5.3:测得贫血儿童治疗一个疗程前后血测得贫血儿童治疗一个疗程前后血红蛋白红蛋白g/L,资料见表。试比较治疗前后资料见表。试比较治疗前后患儿血红蛋白含量有无差异?患儿血红蛋白含量有无差异?资料所提供的信息资料所提供的信息:1.计量资料计量资料 2.配对设计。配对设计。表表 贫血患儿治疗一个疗程前后血红蛋白贫血患儿治疗一个疗程前后血红蛋白g/L变化情况变化情况患者编号患者编号患者编号患者编号血红蛋白血红蛋白血红蛋白血红蛋白g/Lg/L差值差值差值差值d dd d2 2 治疗前治疗前治疗前治疗前 治疗后治疗后治疗后治疗后1 1 98 981281283030 900 9002 2 102 1021361363434 1156 11563 3 83 831141143131 961 9614 4 101 1011291292828 784 7845 5 96 961311313535 1225 12256 6 94 941341344040 1600 16007 7 113 1131301301717 289 2898 8 81 8111911938 38 1444 14449 9 74 741211214747 2209 22091010 83 831181184444 1936 1936合合合合 计计计计 335335 11793 11793 HH0 0:d d=0,=0,即治疗前后患者血红蛋白含量相同即治疗前后患者血红蛋白含量相同即治疗前后患者血红蛋白含量相同即治疗前后患者血红蛋白含量相同 HH1 1:d d 0,0,即治疗前后患者血红蛋白含量不同即治疗前后患者血红蛋白含量不同即治疗前后患者血红蛋白含量不同即治疗前后患者血红蛋白含量不同 =0.05=0.05 以以n-110-19,查查t t界值界值表得表得:t0.05/2,92.262,t0.01/2,93.250,13.3053.250,故故P0.01,按按0.05水准水准,拒绝拒绝H0,接受接受H1,差异有统计学意义。即可以差异有统计学意义。即可以 认为治疗前后患者血红蛋白含量不同认为治疗前后患者血红蛋白含量不同,治疗治疗 后血红蛋白水平升高后血红蛋白水平升高,治疗有效。治疗有效。例例:应用某药治疗应用某药治疗9例高胆固醇患者例高胆固醇患者,观察治疗观察治疗前后血浆胆固醇变化情况前后血浆胆固醇变化情况,结果见表。问该药是结果见表。问该药是否对患者治疗前后血浆胆固醇变化有影响?否对患者治疗前后血浆胆固醇变化有影响?表表 用某药治疗前后血浆胆固醇变化情况用某药治疗前后血浆胆固醇变化情况病人编号病人编号病人编号病人编号血浆胆固醇血浆胆固醇血浆胆固醇血浆胆固醇mmol/Lmmol/L差值差值差值差值d dd d2 2 治疗前治疗前治疗前治疗前 治疗后治疗后治疗后治疗后1 1 10.10 10.10 6.69 6.693.413.41 11.63 11.632 2 6.78 6.78 5.40 5.401.831.83 3.35 3.353 3 13.22 13.22 12.67 12.670.550.55 0.30 0.304 4 7.78 7.78 6.56 6.561.221.22 1.49 1.495 5 7.47 7.47 5.65 5.651.821.82 3.31 3.316 6 6.11 6.11 5.26 5.260.850.85 0.72 0.727 7 6.02 6.02 5.43 5.430.590.59 0.35 0.358 8 8.08 8.08 6.26 6.261.821.82 3.31 3.319 9 7.56 7.56 5.06 5.062.502.50 6.25 6.25合合合合 计计计计 14.5914.59 30.71 30.71 HH0 0:d d=0=0,该药对血浆胆固醇无影响,该药对血浆胆固醇无影响,该药对血浆胆固醇无影响,该药对血浆胆固醇无影响 HH1 1:d d 0 0,该药对血浆胆固醇有影响该药对血浆胆固醇有影响该药对血浆胆固醇有影响该药对血浆胆固醇有影响 =0.05=0.05 以以n-19-18,查,查t t界值界值表得:表得:t0.05/2,82.306,t0.01/2,82.355,5.172.355,故故P0.01,按按0.05水准水准,拒绝拒绝H0,接受接受H1,差异有统差异有统 计学意义。可以认为该药对血浆胆计学意义。可以认为该药对血浆胆 固醇有影响固醇有影响,该药物可降低胆固醇。该药物可降低胆固醇。第三节第三节 两独立样本均数的两独立样本均数的t t检验检验 应用:两样本应用:两样本t 检验又称成组检验又称成组t检验检验,适用适用于于完全随机设计的两样本均数比较。完全随机设计的两样本均数比较。目的目的:推断两样本所来自的总体其总体均推断两样本所来自的总体其总体均数是否相同。数是否相同。要求要求:样本来自正态总体,两样本均数样本来自正态总体,两样本均数比较时还要求两样本总体方差相等。比较时还要求两样本总体方差相等。完全随机设计完全随机设计 pletely random design:是将全部试验对象按随机化的方法分配是将全部试验对象按随机化的方法分配到到 g 个处理组个处理组水平组水平组,各组分别接受各组分别接受不同水平的处理不同水平的处理,试验结束后比较各组均数试验结束后比较各组均数之间的差异有无统计学意义之间的差异有无统计学意义,推断处理因素推断处理因素的效应。各组样本含量可以相等也可以不的效应。各组样本含量可以相等也可以不等等,相等时检验效率较高。相等时检验效率较高。完全随机设计样本均数的比较完全随机设计样本均数的比较,有两种类型有两种类型:一种是选择一定数量的研究对象一种是选择一定数量的研究对象,将他们随机分将他们随机分成两组成两组,分别施以不同的处理。分别施以不同的处理。如如:临床试验中临床试验中,为比较两种治疗方案的治疗效为比较两种治疗方案的治疗效果果,选择具有一定特征的病例选择具有一定特征的病例,将他们随机分成两将他们随机分成两组组,每组分别接受不同的治疗方案。每组分别接受不同的治疗方案。第二种第二种:从两组具有不同特征的人群中从两组具有不同特征的人群中,分别随分别随机抽取一定数量的样本机抽取一定数量的样本,比较某一指标在不同特征比较某一指标在不同特征人群中是否相等。人群中是否相等。如如:比较矽肺患者与煤工尘肺的损伤程度是否相比较矽肺患者与煤工尘肺的损伤程度是否相同。同。1.两样本均数的比较两样本均数的比较 当样本来自的两总体方差相等当样本来自的两总体方差相等,即即12=22时时,进进行行t t 检验。此时将两样本方差合并检验。此时将两样本方差合并,求两者的共求两者的共同方差同方差-合并样本方差:合并样本方差:Sc2。例例:为研究某新药的降糖效果为研究某新药的降糖效果,某医院对某医院对40名名型糖尿病病人进行同期随机对照试验型糖尿病病人进行同期随机对照试验,试试验者将这些病人随机等分到试验组验者将这些病人随机等分到试验组新药新药和对照组和对照组传统药传统药,分别测得试验开始分别测得试验开始前和前和8周后的空腹血糖下降值周后的空腹血糖下降值,详细情况见详细情况见下表下表,能否认为新药与传统药的降糖效果不能否认为新药与传统药的降糖效果不同?同?试验组试验组X X1 1-0.70-0.70-5.60-5.602.002.002.802.800.700.703.503.504.004.005.805.807.107.10-0.50-0.50n n1 1=20=202.502.50-1.60-1.601.701.703.003.000.400.404.504.504.604.602.502.506.006.00-1.40-1.40对照组对照组X X2 23.703.706.506.505.005.005.205.200.800.800.200.200.600.603.403.406.606.60-1.10-1.10n n2 2=20=206.006.003.803.802.002.001.601.602.002.002.202.201.201.203.103.101.701.70-2.00-2.00表表 试验组和对照组空腹血糖下降值试验组和对照组空腹血糖下降值mmol/L H0:12,新药和传统药的降糖效果相同新药和传统药的降糖效果相同 H1:12,新药和传统药的降糖效果不同新药和传统药的降糖效果不同=0.05查查t界值界值表得表得,t0.05/2,382.024,tt0.05/2,38,得得P 0.05,按按=0.05水准水准,尚不拒绝尚不拒绝H0,两者的差异无统计学意义两者的差异无统计学意义,还不能认为还不能认为新药和传统药的降糖效果不同。新药和传统药的降糖效果不同。例例:某克山病区随机抽样测得某克山病区随机抽样测得11例急性克山例急性克山病患者和病患者和13例健康人的血磷值如表。问急性例健康人的血磷值如表。问急性克山病患者和健康人的血磷值是否不同?克山病患者和健康人的血磷值是否不同?急性克山急性克山急性克山急性克山病患者病患者病患者病患者0.840.841.051.051.201.201.201.201.391.391.531.531.671.671.801.801.871.872.072.072.112.11健康人健康人健康人健康人0.540.540.640.640.640.640.750.750.760.760.810.811.161.161.201.201.341.341.351.351.481.481.561.561.871.87 表表 11例急性克山病患者与例急性克山病患者与13例健康人的血磷值例健康人的血磷值mmol/L H0:12,急性克山病人与健康人的血磷值相同急性克山病人与健康人的血磷值相同 H1:12,急性克山病人与健康人的血磷值急性克山病人与健康人的血磷值不同不同=0.05查查t界值界值表得表得,t0.05/2,222.024,t0.01/2,22 2.712,t0.05/2,22 t t0.01/2,22,得得0.01 P 0.05,按按=0.05水准水准,拒绝拒绝H0,接受接受H1,两者的差异有两者的差异有统计学意义统计学意义,可以认为可以认为该地急性克山病患者该地急性克山病患者和健康人的血磷值不同和健康人的血磷值不同,急性克山病患者较急性克山病患者较高。高。2、两样本几何均数比较的两样本几何均数比较的t t 检验检验 目的目的:比较两样本几何均数比较两样本几何均数,推断其各自所代推断其各自所代表的总体几何均数是否差异。表的总体几何均数是否差异。例例:选甲型流感病毒血凝抑制抗体滴度选甲型流感病毒血凝抑制抗体滴度倒数倒数 5者者24人人,随机分为两组随机分为两组,每组每组12人。用甲型流感病人。用甲型流感病毒活疫苗进行免疫毒活疫苗进行免疫,一组用气雾法一组用气雾法,另一组用鼻腔另一组用鼻腔喷雾法。免疫后一个月采血喷雾法。免疫后一个月采血,分别测定血凝抑制分别测定血凝抑制抗体滴度抗体滴度,结果如下结果如下,问两法免疫的效果有无差问两法免疫的效果有无差别?别?气雾组气雾组气雾组气雾组40402020 30302525101015152525 303040401010n n1 1=12=1215153030鼻腔鼻腔鼻腔鼻腔喷雾组喷雾组喷雾组喷雾组50504040 30303535606070703030 202025257070n n2 2=12=1235352525表表 气雾组和鼻腔喷雾组甲型流感病毒血凝抑制抗体测定结果气雾组和鼻腔喷雾组甲型流感病毒血凝抑制抗体测定结果 H0:两总体几何均数相等两总体几何均数相等 H1:两总体几何均数不等两总体几何均数不等 =0.05 计算计算t值值:查查t界值界值表得表得,t0.05/2,222.024,t0.01/2,22 2.712,t t0.01/2,22,得得P 0.01,按按=0.05水准水准,拒绝拒绝H0,接受接受H1,两者的差异有统计学意义两者的差异有统计学意义,可可以认为以认为两种免疫方法的效果有差异两种免疫方法的效果有差异,鼻腔喷鼻腔喷雾免疫法效果较好。雾免疫法效果较好。进行两样本均数的比较进行两样本均数的比较,两样本含量相两样本含量相等等,其优点其优点:1、两样本含量相等时、两样本含量相等时,计算简便计算简便;2、两样本含量相等时、两样本含量相等时,检验效能较高。检验效能较高。第四节第四节 u检验检验 1、单样本、单样本u检验检验:进行样本均数与总体均数的比较。进行样本均数与总体均数的比较。00未知未知,但但n足够大足够大60 例例:根据以往经验根据以往经验,传统疗法治疗肺炎的平均退传统疗法治疗肺炎的平均退热天数为热天数为6.3天天,标准差为标准差为1.1天。某医师用某新疗天。某医师用某新疗法治疗观察了法治疗观察了30例肺炎患者例肺炎患者,平均退热天数为平均退热天数为5.3天。问该新疗法的治疗效果是否与传统疗法相同?天。问该新疗法的治疗效果是否与传统疗法相同?1 建立检验假设,确定检验水准建立检验假设,确定检验水准 HH0 0:=0 0,该疗法与传统疗法的平均退热天数相同该疗法与传统疗法的平均退热天数相同该疗法与传统疗法的平均退热天数相同该疗法与传统疗法的平均退热天数相同 HH1 1:0 0,该疗法与传统疗法的平均退热天数不同该疗法与传统疗法的平均退热天数不同该疗法与传统疗法的平均退热天数不同该疗法与传统疗法的平均退热天数不同 =0.050.05 3 确定确定P值值,作出统计推断结论作出统计推断结论 查查u界值表界值表,u0.052=1.96,u0.012=2.58,uu0.012,P0.01,按按=0.05水水准准拒拒绝绝H0,接接受受H1,两两者者的的差差异异有有统统计计学学意意义义。可可以以认认为为两两种种疗疗法法治治疗疗肺肺炎炎的的效效果果不不同同,新新疗疗法法优优于于传传统统疗疗法。法。2 计算统计量计算统计量 2、两样本、两样本u检验:检验:适用于两样本含量均较大适用于两样本含量均较大n160,且,且 n260时。特点时。特点:简单简单,但只是近似方法。但只是近似方法。u界值与自由度无关。界值与自由度无关。u0.05/21.96,u0.01/22.58 例例:某地随机抽查了某地随机抽查了2529岁正常人群的红细胞数岁正常人群的红细胞数,其中其中:男性男性156人人,得均数为得均数为4.651012/L,标准差标准差为为0.55 1012/L;女性女性74人得均数为人得均数为4.221012/L,标准差为标准差为0.44 1012/L,问该人群男女不同性别问该人群男女不同性别间间红细胞数有无差异?红细胞数有无差异?H0:12,不同性别间红细胞数相同不同性别间红细胞数相同 H1:12,不同性别间红细胞数不同性别间红细胞数不同不同=0.05查查u界值界值表得表得,u0.05/21.96,u0.01/22.56,uu0.01/2,得得P 0.01,按按=0.05水准水准,拒绝拒绝H0,接受接受H0,两者的差异统计学意义两者的差异统计学意义,可以认可以认为为该地该人群男女不同性别之间红细胞数有该地该人群男女不同性别之间红细胞数有差异差异,男性高于女性。男性高于女性。第五节第五节 假设检验的本卷须知假设检验的本卷须知 一、要有严密的研究设计一、要有严密的研究设计 这是假设检验的前提。要求样本具有代表性和这是假设检验的前提。要求样本具有代表性和均衡可比性均衡可比性,即除比较的主要因素外即除比较的主要因素外,其他影响结其他影响结果的有关因素都应尽可能一致果的有关因素都应尽可能一致,或能在资料处理时或能在资料处理时消除其影响。样本的获得必须遵循随机化的原则消除其影响。样本的获得必须遵循随机化的原则,防止主观、随意选择。防止主观、随意选择。二、应根据资料的特点和分析目的二、应根据资料的特点和分析目的,选用适当的选用适当的假设检验方法。假设检验方法。资料的性质不同、设计类型不同、样本含量的资料的性质不同、设计类型不同、样本含量的多少多少,均可影响所选用的假设检验的方法。均可影响所选用的假设检验的方法。三、正确理解假设检验的结论概率性、正确理解假设检验的结论概率性、正确理解假设检验的结论概率性、正确理解假设检验的结论概率性 假设检验利用小概率反证法的思想假设检验利用小概率反证法的思想假设检验利用小概率反证法的思想假设检验利用小概率反证法的思想,根据样本统计量作根据样本统计量作根据样本统计量作根据样本统计量作出的推断结论具有概率性出的推断结论具有概率性出的推断结论具有概率性出的推断结论具有概率性,所以其正确性不是绝对的:所以其正确性不是绝对的:所以其正确性不是绝对的:所以其正确性不是绝对的:1 1、当、当、当、当P P,拒绝拒绝拒绝拒绝HH0 0,接受接受接受接受HH1 1;按接受按接受按接受按接受HH1 1下结论,但是下结论,但是下结论,但是下结论,但是HH0 0不是绝对不成立不是绝对不成立不是绝对不成立不是绝对不成立,所以可能犯错误;所以可能犯错误;所以可能犯错误;所以可能犯错误;2 2、当当当当P P,不能拒绝不能拒绝不能拒绝不能拒绝HH0 0,不能接受不能接受不能接受不能接受HH1 1;按不能接受按不能接受按不能接受按不能接受HH1 1下下下下结论结论结论结论,但是但是但是但是HH0 0不是绝对成立不是绝对成立不是绝对成立不是绝对成立,也可能犯错误。也可能犯错误。也可能犯错误。也可能犯错误。3 3、假设检验的结果并不是指差异的大小、假设检验的结果并不是指差异的大小、假设检验的结果并不是指差异的大小、假设检验的结果并不是指差异的大小,只能反映两者只能反映两者只能反映两者只能反映两者是否相同或不同。是否相同或不同。是否相同或不同。是否相同或不同。1、当、当P,则结论为按所取检验水准则结论为按所取检验水准,拒绝拒绝H0,接接受受H1,有统计学意义有统计学意义统计结论统计结论。可认为。可认为.不同或不等不同或不等专业结论专业结论。2、当当P,则结论为按所取检验水准则结论为按所取检验水准,不拒绝不拒绝H0,无无统计学意义统计学意义统计结论统计结论。还不能认为。还不能认为.不不同或不等同或不等专业结论专业结论。3、不拒绝不拒绝H0不等于接受不等于接受H0,因为此时拒绝因为此时拒绝H0的证的证据缺乏。据缺乏。下结论时下结论时,对对H0只能说只能说:拒绝或不拒绝拒绝或不拒绝H0;而对而对H1只能说接受只能说接受H1。四、假设检验的结论不能绝对化四、假设检验的结论不能绝对化 所有的统计结论均具有概率性质所有的统计结论均具有概率性质,在做推断时在做推断时,可可能会犯错误能会犯错误;因此不宜用因此不宜用“肯定、肯定、“一定、一定、“证明证明等类似的词。当计算出的检验统计量其相应的等类似的词。当计算出的检验统计量其相应的P值值接近接近时时,下结论应尤其慎重。下结论应尤其慎重。1 1因取同一检验水准因取同一检验水准,就现有样本的信息尚不就现有样本的信息尚不拒绝拒绝H0,但增加样本含量后但增加样本含量后,由于抽样误差的减少由于抽样误差的减少可能拒绝可能拒绝;2 2检验水准检验水准是根据分析要求确定的是根据分析要求确定的,具有一具有一定的灵活性。定的灵活性。五、单侧检验与双侧检验的选择五、单侧检验与双侧检验的选择 1 对同一资料进行检验对同一资料进行检验,有可能双侧检验无统有可能双侧检验无统计计学意义学意义,单侧检验有统计学意义。因此单侧检验有统计学意义。因此,在进行假在进行假设检验时设检验时,应事先根据专业知识和问题的要求在设应事先根据专业知识和问题的要求在设计时确定计时确定;2 如果已具备了单侧检验的条件而放弃单侧如果已具备了单侧检验的条件而放弃单侧检检验验,则会丧失局部信息。则会丧失局部信息。六、正确理解实际意义与统计学意义的区别六、正确理解实际意义与统计学意义的区别 假设检验的结果并不表示专业上的实际意义假设检验的结果并不表示专业上的实际意义,只只能反映两者是否相同。能反映两者是否相同。1.差异有统计学意义差异有统计学意义,不应理解为差异很大或不应理解为差异很大或有显著的价值有显著的价值;2.差异大小的实际意义只能根据专业知识确差异大小的实际意义只能根据专业知识确定定 3.P值的大小不能表示实际差异水平的上下。值的大小不能表示实际差异水平的上下。实际意义与统计学意义两者间的关系实际意义与统计学意义两者间的关系:1.统计结论与专业结论一致统计结论与专业结论一致,最终结论与两者一致最终结论与两者一致;2.统计结论与专业结论不一致统计结论与专业结论不一致,最终结论需根据实最终结论需根据实际情况加以考虑际情况加以考虑;3.统计结论有意义统计结论有意义,专业结论无意义专业结论无意义,则可能由于则可能由于 样本含量过大或设计存在缺陷样本含量过大或设计存在缺陷,则最终结论无意则最终结论无意义义;4.统计结论无意义统计结论无意义,专业结论有意义专业结论有意义,应当检查设应当检查设计是否合理、统计方法是否选用得当、样本含量计是否合理、统计方法是否选用得当、样本含量是否足够等方面是否足够等方面,并进一步进行分析验证。并进一步进行分析验证。如如:有研究者调查我国城市女婴的出生体重有研究者调查我国城市女婴的出生体重,北北方方5385人人,均数为均数为3.08kg,标准差为标准差为0.53kg,南方南方4896人人,均数均数3.10kg,标准差标准差0.34kg。u=2.30,P0.05。七、结果报告七、结果报告 格式格式:检验统计量检验统计量 单侧检验应说明单侧检验应说明 检验水准检验水准 P值的比较确切的范围值的比较确切的范围 统计推断结果结合专业知识对所研究的事物统计推断结果结合专业知识对所研究的事物做出比较全面的分析。做出比较全面的分析。第七节第七节 假设检验中的两类错误假设检验中的两类错误客观实际客观实际假设检验结论假设检验结论拒绝拒绝H0不拒绝不拒绝H0H0成立成立型错误型错误推断正确推断正确1-H0不成立不成立推断正确推断正确1-型错误型错误 型错误:型错误:型错误:型错误:拒绝了实际成立的拒绝了实际成立的拒绝了实际成立的拒绝了实际成立的HH0 0,即,即,即,即“弃真,其概率弃真,其概率弃真,其概率弃真,其概率大小为大小为大小为大小为。假设检验时,研究者可根据不同研究目确实假设检验时,研究者可根据不同研究目确实假设检验时,研究者可根据不同研究目确实假设检验时,研究者可根据不同研究目确实定定定定 的大小,如的大小,如的大小,如的大小,如规定规定规定规定=0.05=0.05,当拒绝,当拒绝,当拒绝,当拒绝HH0 0 时,理论上时,理论上时,理论上时,理论上100100次检验中平均有次检验中平均有次检验中平均有次检验中平均有5 5次发生这样的错误次发生这样的错误次发生这样的错误次发生这样的错误;型错误:型错误:型错误:型错误:没有没有没有没有拒绝实际不成立的拒绝实际不成立的拒绝实际不成立的拒绝实际不成立的HH0 0,即,即,即,即“存伪,其存伪,其存伪,其存伪,其概率大小为概率大小为概率大小为概率大小为,其大小一般不能确切的知道,其大小一般不能确切的知道,其大小一般不能确切的知道,其大小一般不能确切的知道 ,需要根据,需要根据,需要根据,需要根据两总体差值、检验水准两总体差值、检验水准两总体差值、检验水准两总体差值、检验水准 、样本含量、样本含量、样本含量、样本含量n n计算得到。计算得到。计算得到。计算得到。1 1-称为检验效能,它的意义是当两总体确有差异,称为检验效能,它的意义是当两总体确有差异,称为检验效能,它的意义是当两总体确有差异,称为检验效能,它的意义是当两总体确有差异,按照规定的检验水准按照规定的检验水准按照规定的检验水准按照规定的检验水准 所能发现该差异的能力。所能发现该差异的能力。所能发现该差异的能力。所能发现该差异的能力。如如如如两总体确有差异