《第五章 假设检验(新版预防医学).ppt》由会员分享,可在线阅读,更多相关《第五章 假设检验(新版预防医学).ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 数值变量资料的假设检验数值变量资料的假设检验公共卫生学院公共卫生学院 王淑康王淑康2主要内容主要内容1 假设检验的基本思想和步骤假设检验的基本思想和步骤 2 t 检验检验 3 u 检验检验 4 正态性检验(自学)正态性检验(自学) 5 两个方差的齐性检验两个方差的齐性检验 6 型错误和型错误和型错误型错误 7 假设检验时应注意的事项假设检验时应注意的事项 31 假设检验的基本思想假设检验的基本思想假设检验的目的假设检验的目的 假设检验的原理假设检验的原理假设检验的基本步骤假设检验的基本步骤4一、假设检验的目的一、假设检验的目的据大量调查得知,健康成年男子脉搏的均数为据大量调查得知
2、,健康成年男子脉搏的均数为7272次次/ /分,某分,某医生在山区随机调查了医生在山区随机调查了2525名健康成年男子,其脉搏均数为名健康成年男子,其脉搏均数为74.274.2次次/ /分,标准差为分,标准差为6.56.5次次/ /分,能否认为该山区成年男子的分,能否认为该山区成年男子的脉搏高于一般健康成年男子?脉搏高于一般健康成年男子? 判断均数差别引起的原因:判断均数差别引起的原因:一种可能是,样本是从该总体中随机抽取的,其差异仅仅是一种可能是,样本是从该总体中随机抽取的,其差异仅仅是由抽样误差造成的;由抽样误差造成的;另一种可能是,样本不是从该总体中随机抽取的,而是有本另一种可能是,样本
3、不是从该总体中随机抽取的,而是有本质上的不同,单纯用抽样误差解释不了。质上的不同,单纯用抽样误差解释不了。5前已述及,由于个体变异的普遍存在,抽样研究时,不可避免地存在着抽样误差。从 cm, cm的正态分布总体中,以固定 随机抽取100个样本时,各样本均数基本不等,也不等于155.4,这些差别是由抽样误差造成的。因此,在医学研究中,由样本资料得出样本统计量( 、 、 )后,首先要考虑抽样误差的存在。 4 .1553 . 510nXpX6假设检验的目的假设检验的目的也就是说,当遇到样本统计量与某一总体参数不等时,应想到两种可能性:一种可能是,样本是从该总体中随机抽取的,其差异仅仅是由抽样误差造成
4、的;另一种可能是,样本不是从该总体中随机抽取的,而是有本质上的不同,单纯用抽样误差解释不了。那么,如何判断这两种可能呢? 需要进行假设检验需要进行假设检验7假设检验的目的假设检验的目的:判断均数差别引起的原因:判断均数差别引起的原因:一种可能是,样本是从该总体中随机抽取的,其差一种可能是,样本是从该总体中随机抽取的,其差异仅仅是由抽样误差造成的;异仅仅是由抽样误差造成的;另一种可能是,样本不是从该总体中随机抽取的,另一种可能是,样本不是从该总体中随机抽取的,而是有本质上的不同,单纯用抽样误差解释不了。而是有本质上的不同,单纯用抽样误差解释不了。80t 分布分布一簇曲线),(2 NX),(2XN
5、 X0N(0,1)XXu XsXt Xun足够大时,分分布布分分布布ut(1)(2)(3)以固定以固定 n 随机抽样随机抽样二、假设检验的基本思想二、假设检验的基本思想9当以固定 n 从均数为 的正态分布总体中随机抽样时,对于 u 分布,理论上,有95的 ,有5的 。若进行一次抽样,则有95的可能 ,而 的可能只有5。961./ )(XXu 961.u961.u961.u -1.961.962.5%2.5%95%10n对于 t 分布,理论上有95的 ,有5的 ;若进行一次抽样时,有95的可能 ,而 的可能只有5。 0-t0.05/2,vt0.05/2,v2.5%2.5%95%t , 2/05.
6、 0tt , 2/05. 0tt , 2/05. 0tt , 2/05. 0/ )(tsXtX 11总之,当以固定n从均数为 的正态分布总体中进行一次随机抽样时,抽到 或 的机会(概率)很小。 假设,在一次抽样研究中,就得到了 或 ,即 ,为小概率事件,依据小概率事件在一次试验不可能发生的定理,可认为此样本不是来自均数为 的正态分布总体,而是来自均数不等于 的另一个正态分布总体。 96. 1u05. 0 P假设检验的原理假设检验的原理96. 1 u , 2/05. 0tt , 2/05. 0tt 12三、假设检验的基本步骤三、假设检验的基本步骤 适用于任何类型的变量适用于任何类型的变量 通过实
7、例说明:据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般健康成年男子? 13分析思路:分析思路:两个均数不等的可能原因有二:一是抽样误差,即山区健康成年男子的脉搏均数与一般健康成年男子的脉搏均数相同,其不同是由抽样误差造成的;二是本质上的不同,即因山区的影响,人体的生理代偿所致。可通过假设检验来判断。基本步骤:基本步骤:1.建立假设和确定检验水准建立假设和确定检验水准 2.选定检验方法和计算统计量选定检验方法和计算统计量 3. 确定确定P值,做出推断结论值,做出推断
8、结论假设检验的基本步骤假设检验的基本步骤14(一一) 建立假设和确定检验水准建立假设和确定检验水准1. 建立假设建立假设:检验假设检验假设(常称无效假设或零假设, null hypothesis, hypothesis under test)用 表示,假设样本所代表的总体参数与已知总体参数相等 ( );备择假设备择假设(alternative hypothesis),用 表示,与 是对立且相互联系的假设,假设样本所代表的总体参数与已知的总体参数不等 (,或 ,或72次/分, 。 72:00 H01: H假设检验的基本步骤假设检验的基本步骤16(一一) 建立假设和确定检验水准建立假设和确定检验水
9、准 2. 确定单、双侧检验确定单、双侧检验建立假设前,先要根据专业知识和研究目的来确定是单侧检验还是双侧检验。若从专业知识和研究目的上考虑,未知的总体参数只能大于(或只能小于)已知总体参数时,用单侧检验;若从专业知识和研究目的上认为,未知的总体参数大于或小于已知总体参数的两种情况都可能存在时,用双侧检验。通常用双侧检验。单、双侧检验的区别可从备择假设反映出来:双侧检验时, ;单侧检验时, 。假设检验的基本步骤假设检验的基本步骤01: H)(:001 或或H17(一一) 建立假设和确定检验水准建立假设和确定检验水准 3. 确定检验水准确定检验水准是判断拒绝或不拒绝无效假设的水准是判断拒绝或不拒绝
10、无效假设的水准假设检验的基本步骤假设检验的基本步骤18(二二)选定检验方法和计算统计量选定检验方法和计算统计量假设检验的方法很多,如t检验、u检验、方差分析、 检验、秩和检验、,各检验方法都有其应用条件。选择时,须根据研究目的、设计类型、资料类型及其分布特征等选用适当的统计检验方法,并计算出相应的检验统计量。如本例,是样本与总体均数的比较,样本是按完全随机设计抽取的,是数值变量资料,且样本含量较小,总体标准差未知,须选用样本均数与总体均数比较的t检验。2 假设检验的基本步骤假设检验的基本步骤19求出检验统计量后,查相应的统计用表,得出概率P值。P值是指从 所规定的总体中随机抽样时,获得等于及大
11、于(负值时为等于及小于)现有样本统计量的概率。(三三)确定确定P值,做出推断结论值,做出推断结论0H假设检验的基本步骤假设检验的基本步骤20(三三)确定确定P值,做出推断结论值,做出推断结论若所得的概率 时,认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的,不拒绝 ;若 时,认为从该总体抽到现有样本的可能性很小,其差别并非是由单纯的抽样误差造成的,根据小概率事件一次不可能发生的定理,拒绝 ,接受 。以上为统计推断,还要结合专业做出专业结论。本例, 按 检验水准,不拒绝 ,尚不能认为山区成年男子的总体脉搏均数高于一般人群。 P0H P0H1H假设检验的基本步骤假设检验的基本步骤0H05
12、. 0 P21第二节第二节 t 检验检验nt 检验(t-test) ,其理论基础为1908年W.S.Gosset以笔名“student”发表的 t 分布,故 t 检验亦称students t-test。nt 检验适用于:检验适用于: 样本均数与总体均数比较( 未知且 或 ); 成组设计的两小样本均数比较( 均小于30或50); 配对设计的两样本均数比较。 50n30n21,nn22t 检验检验t 检验的应用条件:检验的应用条件: 当样本含量较小( 或 )时,要求样本来自正态分布总体; 用于成组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。主要包括:主要包括: 单样本 t 检验 配对
13、 t 检验 两样本 t 检验 50n30n231. 单样本单样本 t 检验检验(one sample t-test)用于用于样本均数与已知总体均数(一般为理论值、标 准值或经过大量观察所得的稳定值等)比较。研究目的:研究目的:推断样本所代表的未知总体均数 与 已知总体均数 有无差别。计算公式:计算公式: 0nsXsXtX/00 1 nv24 对例对例4.1进行进行 t 检验检验 (1)建立假设,确定检验水准建立假设,确定检验水准 单侧(2)计算统计量计算统计量 本例, 次/min, , 次/min, 次/min 00:H01:H05. 072026n7 .73X8 . 8s985. 026/8
14、 . 8727 .73/0nsXt单样本单样本 t 检验检验25(3)确定确定P 值,做出推断结论值,做出推断结论 以 ,查附表2 t界值表,得单侧 , , , ,按 检验水准不拒绝 ,根据本资料尚不能认为男性汽车司机的脉搏平均数高于一般男性脉搏平均数。 对例对例4.1进行进行 t 检验检验 25126v856. 025,20. 0t316.125,10.0t316. 1856. 0 t20. 010. 0 P05. 00H单样本单样本 t 检验检验262. 配对配对 t 检验检验(paired t-test for dependent samples )用于用于配对设计资料的两均数的比较。
15、配对设计类型:配对设计类型: 先将受试对象按配比条件配对,然后用随机分组方法将各对中的2个受试对象分别分配到不同处理组; 同一对象分别接受2种不同处理(同一标本、不同部位); 同一对象处理前后。研究目的:研究目的:推断2种处理的效果有无差别(或), 推断某种处理有无作用()。 27配对配对 t 检验检验计算公式:计算公式:式中, 为差值d 的样本均数; 为 所代表的未知总体均数,当2种处理的效应相同或某种处理无作用时 ; 为差值的标准差, 为差值样本均数的标准误;n为对子数, 为自由度。ddd0ddsdsvnsdsdtddd/01 nv28例例4.3例4.3 将20只按体重、月龄及性别配对的大
16、白鼠随机分入甲、乙2组,甲组给正常饲料,乙组饲料缺乏维生素E。10天后测定大白鼠肝脏的维生素A含量(IU/g),结果如下。问2组大白鼠肝脏维生素A含量是否有差别? 配对配对 t 检验检验29配对配对 t 检验检验30例例4.3(1)建立假设,确定检验水准建立假设,确定检验水准 (2)计算统计量计算统计量 本例, , , , ,0:0dH0:1dH05. 010n配对配对 t 检验检验7950d88325002d0 .79510/7950/ndd336.52811010/)7950(88325001/)(222nnddsd75841033652807950././ nsdtd31(3)确定确定P
17、值,做出推断结论值,做出推断结论 以 ,查附表2 t界值表,得双侧 , , , ,按 检验水准拒绝 ,接受 ,可认为2组大白鼠肝脏维生素A含量的差别有统计学意义,维生素E缺乏组的大白鼠肝脏维生素A含量低于正常饲料组。 例例4.39110 v297490020.,. t781490010.,. t781. 4297. 4t00200010. P050. 0H1H配对配对 t 检验检验32 例例4.4 有12名志愿受试者服用某减肥药,服药前和服药一个疗程后各测量一次体重(kg),数据如表4-2所示。试判断此减肥药是否有效。配对配对 t 检验检验表表 4-2 12 名名受受试试者者服服某某药药前前后
18、后体体重重(kg) 编编号号 服服药药前前 服服药药后后 差差值值(d) 2d 1 101 100 1 1 2 131 136 - 5 25 3 131 126 5 25 4 143 150 - 7 49 5 124 128 - 4 16 6 137 126 11 121 7 126 116 10 100 8 95 105 - 10 100 9 90 87 3 9 10 67 57 10 100 11 84 74 10 100 12 101 109 -8 64 合合计计 016 710 33例例4.4(1)建立假设,确定检验水准建立假设,确定检验水准 单侧 (2)计算统计量计算统计量 本例,
19、, , , ,00 dH :01 dH :050. 12 n配对配对 t 检验检验16 d7102 d3311216./ ndd91711212167101222./)( nnddsd580129173310././ nsdtd34(3)确定确定P值,做出推断结论值,做出推断结论 以 ,查附表2 t界值表,得单侧 , , ,按 检验水准不拒绝 ,根据本资料尚不能认为该减肥药有效。 例例4.311112 v697011250.,. t11250,.tt 250. P050. 0H配对配对 t 检验检验353. 两样本两样本 t 检验检验(two-sample/group t-test for i
20、ndependent samples )用于用于完全随机设计的两样本均数的比较,两样本 来自于两个总体(如不同的处理方法、不同 职业、性别等) 。 研究目的:研究目的:推断两样本所分别代表的总体均数 是否相等 。36两样本两样本 t 检验检验计算公式:计算公式:式中, 为两样本均数差值的标准误, 为两样本的合并方差, 、 分别为两样本的方差。221 nnv)()()()(2121222121212122121112111121nnnnnSnSXXnnSXXsXXtcXX 21XXs2cS21S22S37例例4.5例4.5 将19只雌性大白鼠随机分为2组,分别饲以高蛋白和低蛋白饲料8周,各鼠体重
21、的增加克数如下,问不同饲料组大白鼠的增重有无差别? 高蛋白组(高蛋白组( ): 134 146 104 119 124 161 107 83 113 129 97 123 低蛋白组(低蛋白组( ): 70 118 101 85 107 132 94两样本两样本 t 检验检验1X2X38(1)建立假设,确定检验水准建立假设,确定检验水准两样本两样本 t 检验检验例例4.5210 :H211 :H050. 39(2)计算统计量计算统计量 本例本例 例例4.589171121271217622011239211011201121122212122212121.)()(.)(.)()()( nnnnn
22、SnSXXt121 n1201 X39211. s72 n1012 X62202. s两样本两样本 t 检验检验40(3)确定确定P值,做出推断结论值,做出推断结论 以 ,查附表2 t界值表,得双侧 , , ,按 检验水准不拒绝 ,可认为两组雌性大白鼠增重的差别无统计学意义,尚不能认为两种饲料对雌鼠的增重不同。 例例4.5172712 v110217050.,. t17050,.tt 050. P050. 0H两样本两样本 t 检验检验41第三节第三节 u 检验检验u 检验(u-test),亦称Z-test。适用于:适用于:样本均数与总体均数的比较; 成组设计两样本均数的比较。应用条件:应用条
23、件:样本含量n足够大(n50),或n虽小 但 已知时。包括:包括: 单样本u检验 两样本u检验421. 单样本单样本 u 检验检验(one sample u-test)用于用于样本均数与已知总体均数(一般为理论值、标 准值或经过大量观察所得的稳定值等)比较。研究目的:研究目的:推断样本所代表的未知总体均数 与 已知总体均数 有无差别。计算公式:计算公式: 0nsXu/0 43例例4.7n例4.7 一般男性血色素含量的医学参考值为14.0g()。某研究者从某高原地区人群中随机抽取120名健康男性,测得其血色素均数 g(),标准差 g()。问该高原地区健康男性血色素含量是否高于一般男性? 单样本单
24、样本 u 检验检验8 .14X42. 1s44例例4.7(1)建立假设,确定检验水准建立假设,确定检验水准 单侧(2)计算统计量计算统计量 本例, , , , 00:H01:H05. 00140. 120 n814. X421. s1761204210148140././ nsXu 单样本单样本 u 检验检验45例例4.7(3)确定确定P值,做出推断结论值,做出推断结论 , ,按 检验水准拒绝 ,接受 ,该地健康男性与一般男性血色素含量的差别有统计学意义,可认为该高原地区健康男性血色素含量高于一般男性。 单样本单样本 u 检验检验33. 217. 6u01. 0P05. 00H1H462.两样
25、本两样本 u 检验检验(two-sample u-test for independent samples )用于用于完全随机设计的两样本均数的比较,两样本 来自于两个总体。研究目的:研究目的:推断两样本所分别代表的总体均数 是否相等。计算公式:计算公式: 222121212121nsnsXXsXXuXX/ 47例例4.8例4.8 某医师欲比较某地工人和农民全血胆碱脂酶活力,检测工人143名,均数为3.52mol/L,标准差为0.49mol/L;检测农民156名,均数为3.36mol/L,标准差为0.53mol/L。问该地工人与农民全血胆碱脂酶活力有无差别? 两样本两样本 u 检验检验48例例
26、4.8(1)建立假设,确定检验水准建立假设,确定检验水准 (2)计算统计量计算统计量 本例, 210 :H211 :H050. 两样本两样本 u 检验检验1431 n5231. X4901. s1562 n3632. X5302. s7121565301434903635232222212121./././ nsnsXXu49例例4.8(3)确定确定P值,做出推断结论值,做出推断结论 , ,按 检验水准拒绝 ,接受 ,可认为该地工人与农民的全血胆碱脂酶活力不同,工人高于农民。 两样本两样本 u 检验检验582712. u01. 0P05. 00H1H50第六节第六节 型错误和型错误和型错误型错
27、误 假设检验利用小概率反证法的思想,根据样本统计量做出的推断结论具有概率性,因此其结论有可能出现判断错误,通常可能发生以下两类错误。以单样本t检验为例说明。 5152型错误型错误 (type error) 型错误型错误 拒绝了实际上成立的 ,即样本来自 的总体,由于抽样的偶然性,检验统计量 , ,按 检验水准拒绝 ,接受 ( )。这类在假设检验中拒绝了原本正确的 的错误为型错误。理论上犯型错误的概率为 , 值的大小视研究目的确定。通常设 ,即允许犯型错误的概率为0.05。 0H0 05. 0tt 05. 0P05. 00H1H00H 05. 053型错误型错误 (type error) 型错误
28、型错误 不拒绝实际上不成立的 ,即样本来自 的总体,由于抽样的偶然性,检验统计量 , ,按 检验水准不拒绝 。这类在假设检验中不拒绝原本不正确的 的错误为型错误。犯型错误的概率为 ,它只有与特定的 结合起来才有意义。 0H0 050.tt 050. P05. 00H0H1H5455型错误的概率 只取单尾,通常在假设检验时其大小是未知的,需在已知两总体差值 、总体标准差 、检验水准 和样本含量n时尚能算出(详见第10章实验设计概述)。通常,当样本含量不变时, 越小, 越大;反之, 越大, 越小。同时减少 和 的方法是增加样本含量。56 称为检验效能或把握度(power of a test),即两
29、总体确有差别时,按 水准能识别该差别的能力。如 表示:若两总体确有差别,理论上平均100次抽样中,有95次能得出两总体有差别的结论。在假设检验中, 值的大小是事先确定的。严格地说, 值也应事先确定,以保证一定检验效能( )。 195. 01157第七节第七节 假设检验时应注意的事项假设检验时应注意的事项 要有严密的抽样研究设计要有严密的抽样研究设计 样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性,即对比组间除处理因素(如新药和常规药)外,非处理因素(如年龄、性别、病程、病情轻重等)应尽可能相同。正确选用检验方法正确选用检验方法 应根据研究目的、设计类型、资料类型及其分布特征
30、等选用适当的假设检验方法。58正确理解正确理解“显著性显著性”的含义的含义 以往,习惯上把 称为差异有显著性。此“显著性”易被理解为二者差异大,或被理解为所分析的指标具有“显著效果”或“显著价值”。 为了避免对显著性含义的错误理解,目前在医学统计学中已用“差别有统计学意义”和“差别无统计学意义”分别表示 和 。 在假设检验的推断结论中,既要有统计结论,又在假设检验的推断结论中,既要有统计结论,又要依据专业知识做出专业结论。要依据专业知识做出专业结论。 P P P59对差别有无统计学意义的判断不能绝对化对差别有无统计学意义的判断不能绝对化 假设检验的推断结论是概率结论,其检验水准 是人为规定的。
31、在统计学中是否拒绝 的依据是小概率事件定理,当根据检验统计量得出 ,例如 时,不拒绝 的可能性仅有5或不到5,是小概率事件,因而拒绝 ,但并不能排除 尚有5或不到5成立的可能性。 因此,做统计结论时要留有余地,不宜用“肯定”,“一定”,“必定”等词,而且最好列出检验统计量的值,写出值的确切范围成 ,以便读者与同类研究进行比较。 0H P050. P0H0H0H050020. P60小小 结结假设检验是依据样本提供的有限信息对总体作推断的假设检验是依据样本提供的有限信息对总体作推断的统计学方法,是在对研究总体的两种对立的判断之间统计学方法,是在对研究总体的两种对立的判断之间作选择的决策程序。作选择的决策程序。假设检验的过程:建立检验假设、计算统计量、确定假设检验的过程:建立检验假设、计算统计量、确定P 值并与给定的值并与给定的 比较、做出结论。比较、做出结论。假设检验的理论依据假设检验的理论依据“小概率事件在一次抽样中不太小概率事件在一次抽样中不太可能发生可能发生”。假设检验有两类错误。假设检验有两类错误。假设检验的基本思想、假设检验的基本思想、 P 值的含义、两类错误、值的含义、两类错误、t 检检验和验和u 检验的适用条件及用途。检验的适用条件及用途。61
限制150内