《假设检验基础》PPT课件.ppt
《《假设检验基础》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《假设检验基础》PPT课件.ppt(162页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第六章第六章假设检验基础假设检验基础 假设检验Hypothesis Testing2022/10/262统计推断统计推断(statistical inference):v参数估计参数估计(parameter estimation)Where is the parameter?v假设检验假设检验(hypothesis test)Are these samples come from one population?定义:由样本信息对相应总体的特征进行推断。2022/10/263v一、假设检验的概念与原理v二、t检验v三、二项分布与poisson分布资料的z检验v四、假设检验与区间估计的关系v五、
2、假设检验的功效v六、正态性检验主要内容主要内容2022/10/264为什么要进行假设检验?为什么要进行假设检验?例题:欲考察某药物A预防孕妇早产的效果,某医院的妇科进行一项临床试验。随机抽取两个样本各15例孕妇:处理组(药物A)婴儿出生体重:均数为 对照组(安慰剂)婴儿出生体重:均数为7.1kg 2022/10/265处理组处理组婴儿出生体重婴儿出生体重 对照组对照组婴儿出生体重婴儿出生体重总体总体A总体总体B样本样本b(样本均数(样本均数)样本样本a(样本均数(样本均数)2022/10/266统计量不同的两种可能统计量不同的两种可能v其一:其一:本质上的差异(系统误差,如药物的作用)(必然的
3、、大于随机误差必然的、大于随机误差)v其二:其二:抽样误差 (偶然的、随机的、较小的偶然的、随机的、较小的)两种情况两种情况只有一个只有一个只有一个只有一个是正确的,且是正确的,且二者必居其一二者必居其一,需,需要我们作出推断。要我们作出推断。2022/10/267假设检验处理问题的特点假设检验处理问题的特点v1、需要从全局的范围,即从总体上对问题作出判断;v2、不可能或者不允许对研究总体的每一个个体均做观察。(如抽检合格率,新药疗效评价)v抽样 统计推断2022/10/268一、假设检验的思维逻辑一、假设检验的思维逻辑2022/10/269下面我们用一例说明这个原则:下面我们用一例说明这个原
4、则:两个盒子,各装有两个盒子,各装有100个球个球.小概率事件在一次试验中不会发生小概率事件在一次试验中不会发生.一个盒子中的白球和红球数一个盒子中的白球和红球数99个白球个白球一个红球一个红球99个个另一盒中的白球和红球数另一盒中的白球和红球数99个红球个红球一个白球一个白球99个个2022/10/2610将盒子密封;将盒子密封;现从两盒中随机取出一个盒子,现从两盒中随机取出一个盒子,问这个盒子里是白球问这个盒子里是白球99个还是红球个还是红球99个?个?2022/10/2611我们不妨先假设:我们不妨先假设:这个盒子里有这个盒子里有99个白球个白球.现在我们从中随机摸出一个球,发现是现在我
5、们从中随机摸出一个球,发现是此时你如何判断这个假设是否成立呢?此时你如何判断这个假设是否成立呢?2022/10/2612假设其中真有假设其中真有99个白球,个白球,摸出红球的概率只有摸出红球的概率只有1/100,这是小概率事件,这是小概率事件.小概率事件在一次试验中竟然发生了,不小概率事件在一次试验中竟然发生了,不能不使人怀疑所作的假设能不使人怀疑所作的假设.小概率反证法小概率反证法.2022/10/2613假设检验的概念假设检验的概念vHypothesis Testingv对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验。2022/10/2614二、假设检
6、验的基本步骤二、假设检验的基本步骤v例例6-16-1 在某市城区在某市城区6 6所小学按概率抽样方法抽取所小学按概率抽样方法抽取了了400400名小学生进行视力干预研究。基线调查时,名小学生进行视力干预研究。基线调查时,v干预组干预组200200人,屈光度的均数为人,屈光度的均数为-0.34D,-0.34D,标准差为标准差为0.21D;0.21D;v对照组对照组200200人,屈光度的均数为人,屈光度的均数为-0.57D,-0.57D,标准差为标准差为0.36D;0.36D;v试问:试问:干预组和对照组小学生屈光度在基线时总干预组和对照组小学生屈光度在基线时总体均数有无差别?体均数有无差别?2
7、022/10/2615问题:干预组干预组 对照组对照组 2?样本均数样本均数:-0.57D标准差标准差:0.36D 1?样本均数样本均数:-0.34D标准差标准差:0.12D2022/10/2616二、假设检验的基本步骤二、假设检验的基本步骤v1、建立检验假设,确定检验水准;v2、选定检验方法,计算检验统计量;v3、确定P值,作出推断。2022/10/2617一对关于总体特征的假设:一对关于总体特征的假设:零零假假设设(null hypothesis),记记为为H0,又又称称原原假假设设,表示目前的差异是由于抽样误差引起的。,表示目前的差异是由于抽样误差引起的。对对立立假假设设(alterna
8、tive hypothesis),记记为为H1,又又称称备备择择假假设设,表表示示目目前前的的差差异异是是主主要要由由于于本本质上的差别引起。质上的差别引起。两两个个假假设设既既有有联联系系又又互互相相独独立立,应应该该包包括括两两种(也是所有)可能的判断。要做出抉择。种(也是所有)可能的判断。要做出抉择。1、建立检验假设,确定检验水准、建立检验假设,确定检验水准2022/10/2618例例6-1分析步骤:分析步骤:(1)建立检验假设,确定检验水准 H0:12,干预组小学生和对照组小学生屈光度的总体均数相等;H1:12,干预组小学生和对照组小学生屈光度的总体均数不等。2022/10/2619v
9、:称称检验水准(size of a test),是预先规定的概率值,它确定了小概率事件标准。v 通常取值为或。v确定采用确定采用双侧检验双侧检验还是还是单侧检验。单侧检验。2022/10/2620统计量:是随机样本的函数,其计算公式中不应包含任何未知参数。选择Z检验(2)计算统计量(计算统计量(statistic)2022/10/2621(3)(3)确定确定P P值值,作出统计推断作出统计推断 P值的定义:在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率(累积概率)。vP,为小概率事件,“不大可能”犯假阳性错误,拒绝 H0;接受 H1。vP,不是小概率事件,“颇有可能”犯假阳性
10、错误,没有足够的理由拒绝 H0;2022/10/2622 查附表1,或t界值表(=时),得P,按 水准,拒绝H0,接受H1,差异有统计学意义,可认为干预组小学生和对照组小学生屈光度的总体均数不等。例例6-1 (3)确定确定P值值,作出统计推断作出统计推断2022/10/2623第第I 类错误(类错误(type I error)和第)和第II 类错误(类错误(type II error)实际情况假设检验的结果假设检验的结果拒绝 H0 不拒绝 H0 H0 成立,无差异第I 类错误()假阳性假阳性正确(1-)H0 不成立 有差异正确(1-)第II 类错误()假阴性假阴性2022/10/2624法官的
11、审判法官的审判真实情况法官审判的结果有罪 无罪无罪错误正确有罪正确错误无罪假设2022/10/26251-01-H0:=01t(界值)H1:=101I、II型错误示意(以单侧型错误示意(以单侧t检验为例)检验为例)t()2022/10/2626定义定义v第I 类错误:v 如果实际情况与H0 一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝原本正确的H0,这样的错误称为。v第II 类错误:v 如果实际情况与H0 不一致,仅仅由于抽样的原因,使得统计量的观察值落到接受域,不能拒绝原本错误的H0,这样的错误称为。2022/10/2627第二节第二节 t检验检验v t分布的发现使得小样本统
12、计推断成为可能。被认为是统计学发展历史中的里程碑之一。v 以t分布为基础的检验称为t检验。v 医学统计学中应用较多。2022/10/2628t检验的检验的应用条件应用条件随机样本;随机样本;正态性正态性(Normality):来自正态分布总体;:来自正态分布总体;方差齐性方差齐性(Homoscedasticity):两个均数比较时,:两个均数比较时,要求两总体方差相等。要求两总体方差相等。以上条件的考察方法后续介绍。以上条件的考察方法后续介绍。2022/10/2629一、单样本资料的一、单样本资料的t检验(检验(one sample t-test)v检验的目的:推断该样本来自的总体均数是否与已
13、知的某一总体均数0相等。v已知总体均数0一般指已知的理论值、标准值或大量观察得到的稳定值。认为这是一个确定的总体特征。2022/10/2630v例例 已知北方地区一般儿童前囟门闭合月龄为个月。某研究人员从东北某县(缺钙地区)抽取36名儿童,得囟门闭合月龄均值为个月,标准差为个月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?2022/10/2631(1)建立检验假设,确定检验水准 H0:=0该县儿童前囟门闭合月龄与一般儿童相等。(意为就总体而言,该县儿童前囟门闭合月龄与一般儿童的均数相等意为就总体而言,该县儿童前囟门闭合月龄与一般儿童的均数相等)H1:0该县儿童前囟门闭合月龄高于一般儿童。单
14、侧=检验步骤检验步骤2022/10/2632(2)选定检验方法,计算检验统计量样本均数 与总体均数0间的差别可以用统计量t来表示:统计量t表示,在标准误的尺度下,样本均数与总体均数0的偏离。2022/10/2633总体总体样本样本t1t2t3t4tn0t分布分布P(-t/2,t t/2,)=1-理论基础:理论基础:t 分布分布2022/10/2634 2.计算统计量 2022/10/2635自由度概率,P单侧0.25 0.20 0.10 0.05 0.0250.010.0050.00250.0010.0005双侧0.50 0.40 0.20 0.10 0.050.020.010.0050.00
15、20.001350.682 0.852 1.306 1.690 2.030 2.438 2.724 2.996 3.340 3.591 360.681 0.852 1.306 1.688 2.028 2.434 2.719 2.990 3.333 3.582 370.681 0.851 1.305 1.687 2.026 2.431 2.715 2.985 3.326 3.574 380.681 0.851 1.304 1.686 2.024 2.429 2.712 2.980 3.319 3.566 390.681 0.851 1.304 1.685 2.023 2.426 2.708 2.
16、976 3.313 3.558 400.681 0.851 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551 500.679 0.849 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496 2022/10/2636(3)确定P值,做出推断:如果 H0 成立,是否有可能得到现有结果?查附表2,t界值表,t0.05,35,t0.25,35,由于本例t,tt0.05,35,且t t t=2.33=2.33t t,1111,故故0.020.02P P。作结论:在作结论:在a的水准上,拒绝的水准上,拒绝H H0 0
17、,接受,接受H H1 1,差别,差别有统计学意义,可以认为孪生兄弟的出生体重与出有统计学意义,可以认为孪生兄弟的出生体重与出生顺序有关,且先出生者的出生体重大于后出生者生顺序有关,且先出生者的出生体重大于后出生者的出生体重。的出生体重。2022/10/2647例例6-3 用两种方法测定用两种方法测定12份血清样品中镁离子的含量,问两份血清样品中镁离子的含量,问两种方法测定结果有无差异?种方法测定结果有无差异?表表6-3 6-3 两种方法测定血清两种方法测定血清MgMg(mmol/Lmmol/L)的结果)的结果试样号试样号甲基百里酚蓝法甲基百里酚蓝法葡萄糖激酶两点法葡萄糖激酶两点法差值差值1 1
18、0.940.940.920.920.020.022 21.021.021.011.010.010.013 31.141.141.111.110.030.034 41.231.231.221.220.010.015 51.311.311.321.32-0.01-0.016 61.411.411.421.42-0.01-0.017 71.531.531.511.510.020.028 81.611.611.611.610.000.009 91.721.721.721.720.000.0010101.811.811.821.82-0.01-0.0111111.931.931.931.930.000.
19、0012122.022.022.042.04-0.02-0.022022/10/2648假定血清镁离子测定结果的差值服从正态分布假定血清镁离子测定结果的差值服从正态分布v(1)建立检验假设,确定检验水准建立检验假设,确定检验水准vH0:d0,即两种方法测定结果之差的总体均数,即两种方法测定结果之差的总体均数为为0;H1:d0,即两种方法测定结果之差的总体均数即两种方法测定结果之差的总体均数不为不为0;。(2)计算检验统计量计算检验统计量 t 2022/10/2649(3 3)确定)确定P P值,作出推断。值,作出推断。查表得,查表得,t t,1111,t t,1111,t t,1111 本例本
20、例t t,1111 t t=0.764=0.764t t,1111,故故0.400.40P P0.50 0.50 作结论:按作结论:按 的的检验水准,不拒绝检验水准,不拒绝H H0 0,差别无统计,差别无统计学意义,尚不能认为两法测定结果不同。学意义,尚不能认为两法测定结果不同。2022/10/2650三、两独立样本资料的三、两独立样本资料的t检验检验 (完全随机设计、成组设计)v1、将受试对象完全随机分入两组,接受两种不同的处理(视为代表两不同总体的独立样本)试验组与对照组,新药组与传统药组试验组与对照组,新药组与传统药组v2、从两个总体中完全随机地抽取一定数量观察对象,对测量指标进行比较:
21、男性与女性,中国人和美国人,不同职业类型等男性与女性,中国人和美国人,不同职业类型等2022/10/2651u 目的:目的:推断两样本各自代表的总体均数推断两样本各自代表的总体均数1 1与与2 2是否是否相等。相等。特点:特点:样本含量较小。样本含量较小。两种情况两种情况 v(一一)两样本所属总体方差相等:两样本所属总体方差相等:v(二二)两样本所属总体方差不等:两样本所属总体方差不等:2022/10/2652vt检验的应用条件独立性独立性(Independence):随机样本;:随机样本;正态性正态性(Normality):两总体均服从正态分布;:两总体均服从正态分布;方差齐性方差齐性(Ho
22、mogeneity of variance):两个总体:两个总体均数比较时,要求两总体方差相等。均数比较时,要求两总体方差相等。2022/10/2653例例6-4v某医师要观察两种药物对原发性高血压的疗效,将某医师要观察两种药物对原发性高血压的疗效,将诊断为诊断为期高血压的期高血压的20名患者随机分为两组(两组名患者随机分为两组(两组基线时血压之间的差别无统计学意义)基线时血压之间的差别无统计学意义)。v卡托普利组:卡托普利组:12 17 13 8 4 10 9 12 10 712 17 13 8 4 10 9 12 10 7v尼莫地平组:尼莫地平组:11 8 12 13 9 10 8 0 7
23、 1611 8 12 13 9 10 8 0 7 16v 3 3个月后观察舒张压下降的幅度(个月后观察舒张压下降的幅度(mmHgmmHg),试比试比较两药的降压效果有无差异?较两药的降压效果有无差异?2022/10/2654vt检验条件:检验条件:v经检验,两组患者舒张压的下降值均服从正态分布;经检验,两组患者舒张压的下降值均服从正态分布;v 具有方差齐性。具有方差齐性。2022/10/2655分析步骤:(1)建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:1 2,两组患者舒张压下降值的总体均数相等;两组患者舒张压下降值的总体均数相等;H1:1 2,两组患者舒张压下降值的总体均数不
24、等。两组患者舒张压下降值的总体均数不等。(2)计算检验统计量计算检验统计量 t t()自由度自由度 =n1+n2-2。2022/10/2656均数之差的标准误v联合方差联合方差(方差的加权平均方差的加权平均)v均数之差的标准误均数之差的标准误2022/10/26572022/10/2658(2)计算统计量计算统计量 2022/10/2659(3)确定确定P值,作出推断。值,作出推断。查查表表得得,v=10+10-2=18=10+10-2=18,t t0.05/2,18 0.05/2,18=2.101,=2.101,tttP,按按 水水准准,不不拒拒绝绝H H0 0,差差别别有有没没统统计计学学
25、意意义义,尚尚不不能能认认为为两两种种药药物物的的降降压压效效果果有差别。有差别。2022/10/26602022/10/26612022/10/26622022/10/26632022/10/26642022/10/26652022/10/2666Spss运行结果运行结果2022/10/2667Spss运行结果运行结果2022/10/2668 用近似t 检验 检验常用方法:Cochran&Cox法(1950):对临界值进行校正Satterthwaite法(1946)Welch法(1947)对自由度进行校正对自由度进行校正2.两样本所属总体方差不等两样本所属总体方差不等2022/10/2669
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验基础 假设检验 基础 PPT 课件
限制150内