第六讲假设检验基础课件.ppt
第六讲假设检验基础1第1页,此课件共49页哦假设检验(假设检验(hypothesis test)亦称显著性检验是对所估计的总体首先提出一个假设,然亦称显著性检验是对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设后通过样本数据去推断是否拒绝这一假设科研数据处理的重要工具科研数据处理的重要工具;某事发生了:某事发生了:是由于碰巧?还是由于必然的原因?统计学家运用显著性检是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这类问题验来处理这类问题举例:上课迟到,买鸡蛋举例:上课迟到,买鸡蛋第2页,此课件共49页哦假设检验的原因假设检验的原因 由于个体差异的存在,即使从同一总体中严格的随机抽由于个体差异的存在,即使从同一总体中严格的随机抽样,样,X1、X2、X3、X4、,、,不同。不同。因此,因此,X1、X2 不同有两种(而且只有两种)可能:不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造成)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无统计学意义了样本均数的差别。差别无统计学意义。(2)分别所代表的总体均数不同。差别有统计学意义。)分别所代表的总体均数不同。差别有统计学意义。第3页,此课件共49页哦 假设检验的基本原理假设检验的基本原理已知健康成年男子的脉搏均数为已知健康成年男子的脉搏均数为72次次/分。某医生分。某医生在某山区随机调查在某山区随机调查25名健康男子,求得脉搏均数为名健康男子,求得脉搏均数为74.2次次/分,标准差分,标准差6.5次次/分。能否认为该山区的成分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数年男子的脉搏均数高于一般成年男子的脉搏均数?样本均数和总体均数的差异有两种可能:样本均数和总体均数的差异有两种可能:抽样误差所致抽样误差所致,有本质差异有本质差异n=25第4页,此课件共49页哦利用反证法思想,假设是由于第一个原因,计算产生 的概率(P)。若P较小,是小于或等于小概率事件的概率,即在一次抽样中一般不能发生,现在发生了,则有理由拒绝原假设 ,接受与之对立的假设。若P不是很小,暂时接受原假设。第5页,此课件共49页哦假设检验的一般步骤假设检验的一般步骤建立假设、确定检验水准建立假设、确定检验水准1两种假设:两种假设:(1)检验假设:又称无效假设、零假设、原假设,是从反证法思想提检验假设:又称无效假设、零假设、原假设,是从反证法思想提出的。出的。(2)备择假设:拒绝备择假设:拒绝H0时而被接受的假设,与时而被接受的假设,与H0对立。有三种情况:对立。有三种情况:双侧检验双侧检验 单侧检验单侧检验 单侧检验单侧检验2单、双侧的选择:由专业知识来确定。单、双侧的选择:由专业知识来确定。3检验水准:检验水准:,又称显著性水准,是小概率事件的概率。通常取,又称显著性水准,是小概率事件的概率。通常取0.05。第6页,此课件共49页哦选定检验方法,计算检验统计量根据资料类型和推断目的选用不同的检验方法。不同的检验方法有相应不同的检验统计量及计算公式。所有检验统计量都是在H0 成立的条件下计算出来的,反映了抽样误差的大小,并且服从已知的分布。例:成立条件下,则 用s代替,检验统计量为 第7页,此课件共49页哦-2.0641.692 2.0640=240.0250.025t0.05,24=2.064 P=P(|t|2.064)=0.05 P=P(|t|1.692)0.050.05第8页,此课件共49页哦确定P值,作出推断结论1P的含义:从规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。根据检验统计量值,查相应的界值表,确定P值。2得出结论:若 ,按检验水准拒绝H0,接受H1,有统计学意义;若 ,按检验水准不拒绝,无统计学意义。第9页,此课件共49页哦假设检验特点假设检验特点1.类似于数学中的反证法类似于数学中的反证法 先建立假设(假设上课不迟到,鸡蛋是新鲜的),先建立假设(假设上课不迟到,鸡蛋是新鲜的),然后通过计算证明,得出小概率事件发生,则该然后通过计算证明,得出小概率事件发生,则该假设不成立。假设不成立。2.数学推断是确定性的,而统计学推断是以概率给出数学推断是确定性的,而统计学推断是以概率给出的,因此结论是相对的,得到任何结论都存在发的,因此结论是相对的,得到任何结论都存在发生错误的可能。生错误的可能。第10页,此课件共49页哦t 检验t检验的应用条件:当样本含量n较小时(n50),要求样本取自正态总体,两小样本均数比较时还要求样本总体方差相等。1.1.单个样本的单个样本的t t 检验检验2.2.配对样本的配对样本的t t 检验检验3.3.两独立样本两独立样本t t检验检验第11页,此课件共49页哦一、一组样本资料的一、一组样本资料的t 检验检验目的:目的:比较一个小样本均数所代表的未知总比较一个小样本均数所代表的未知总 体均数与已知的总体均数有无差别。体均数与已知的总体均数有无差别。计算公式:计算公式:t 统计量:统计量:自由度:自由度:n-1第12页,此课件共49页哦 适用条件:适用条件:(1)已知一个总体均数;已知一个总体均数;(2)可得到一个样本均数及该样本标准误;可得到一个样本均数及该样本标准误;(3)样本来自正态或近似正态总体。样本来自正态或近似正态总体。第13页,此课件共49页哦例7-1已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄 的均数是否大于一般儿童?第14页,此课件共49页哦第15页,此课件共49页哦二二 、配对、配对 t检验检验配对设计是研究者为了控制可能存在的主要的非处理因素而采用的一种实验设计方法。第16页,此课件共49页哦配对设计的形式配对设计的形式自身配对同一对象接受两种处理,如同一标本用两种方法进行检验,同一患者接受两种处理方法;异体配对将条件相近的实验对象配对,并分别给予两种处理。第17页,此课件共49页哦配对检验的思想配对检验的思想若两处理因素的效应无差别,差值d的总体均数d应该为0,故可将该检验理解为样本均数与总体均数d=0的比较第18页,此课件共49页哦例例7-27-2 健康教育干预三个月前后血红蛋白()健康教育干预三个月前后血红蛋白()第19页,此课件共49页哦H0:d0,干预前后血红蛋白差值的总体均数为零,干预前后血红蛋白差值的总体均数为零H1:d0,=0.05。按按 =n-1=11,查查t值表,则值表,则0.01P 0.005,拒绝,拒绝H0,可认,可认为健康干预前后该地区儿童血红蛋白量有变化为健康干预前后该地区儿童血红蛋白量有变化。第20页,此课件共49页哦三、两独立样本三、两独立样本t检验检验目的:由两个样本均数的差别推断两样本所代表的总体均数间有无差别。计算公式及意义:自由度:n1+n2 2 第21页,此课件共49页哦 适用条件:适用条件:(1)已知)已知/可计算两个样本均数及它们的标准差可计算两个样本均数及它们的标准差;(2)样本来自正态或近似正态总体;样本来自正态或近似正态总体;(3)方差齐方差齐 。第22页,此课件共49页哦例7-4 试验组10.28.910.19.2-0.810.66.511.29.3810.79.512.714.411.9 对照组56.7-1.447.1-0.62.84.33.75.84.664.15.14.7 第23页,此课件共49页哦第24页,此课件共49页哦方差不齐的两个样本均数的t检验(1)方差齐性检验:(2)t检验第25页,此课件共49页哦Z检验均数的Z检验 应用条件:样本含量n较大,或总体标准差已知 1.单样本Z检验2.两大样本的Z检验 第26页,此课件共49页哦例题例题某地抽样调查了360名健康成年男性的红细胞数,其均数为4.66,标准差为0.58,问该地男性红细胞数与标准值4.84有无差别?第27页,此课件共49页哦第28页,此课件共49页哦例题某年某地随机抽样调查了部分正常成年人的血红蛋白含量(g/L),男性360名,均数134.5,标准差7.1,女性255名,均数117.6,标准差10.2,问该地正常成年男、女血红蛋白含量有无差别?第29页,此课件共49页哦第30页,此课件共49页哦率的z检验 应用条件:当n较大,p和1-p均不太小时,即np及n(1-p)均大于5时 1.样本率与总体率的比较2.两样本率的比较第31页,此课件共49页哦例题某医院称治疗声带白斑的有效率为80%。今统计前来求医的此类患者60例,其中45例治疗有效。试问该医院宣称的疗效是否客观?第32页,此课件共49页哦第33页,此课件共49页哦例题某医院用黄芪注射液和胎盘球蛋白进行穴位注射治疗小儿支气管哮喘病人,黄芪注射液治疗117例,有效103例;胎盘球蛋白治疗55例,有效49例。试比较两种疗法有效率有无差别?第34页,此课件共49页哦第35页,此课件共49页哦假设检验两类错误假设检验两类错误 弃真错误,即类错误(),和存伪错误,即类错误()大,则小,反之小大第36页,此课件共49页哦第37页,此课件共49页哦假设检验中需注意的几个问题假设检验中需注意的几个问题1.1.建立假设建立假设“假设”是对总体特征的表述 H0与H1的表述随资料性质、分析目的和检验方法而定。第38页,此课件共49页哦 2.不同变量或资料应选用不同的检验不同变量或资料应选用不同的检验 3.资料的代表性与可比性资料的代表性与可比性 所谓代表性是指该样本从相应总体中经随机抽样获得,能够代表总体的特征;所谓可比性是指各对比组间除了要比较的主要因素外,其它影响结果的因素应尽可能相同或相近 为了保证资料的可比性,必须要有严密的实验设计,保证样本随机抽取于同质总体,这是假设检验得以正确应用的前提 第39页,此课件共49页哦4.结论不能绝对化结论不能绝对化 报告结果应说明P 值。5.统计结论必须与专业结论有机的结合统计结论必须与专业结论有机的结合 在做专业结论时,应在综合考虑两均数大小的实际意义、P值大小和设计科学性的基础上进行统计结论的专业解释。第40页,此课件共49页哦6.检验水准的确定 犯型错误后果严重时,要减小。如一种新药治疗高血压,该药物副作用小,成本低。经检验若拒绝 ,则该药有效,可推广使用,这时为减小犯型错误的概率,降低。如新检测方法与旧方法比较,不拒绝 ,可用新检测方法代替旧方法,这时应慎重,减少犯型错误的概率,提高。第41页,此课件共49页哦7.单双侧的选择:结合专业知识确定。应该用双侧,用了单侧,易拒绝,易得出有差别的结论;应该用单侧,用了双侧,降低了检验效能。第42页,此课件共49页哦-2.0642.0640=240.0250.025第43页,此课件共49页哦正态性检验正态性检验 正态分布有两个特征:一是对称性,二是正态峰。若分布不对称则称偏态分布:峰偏左,长尾向右侧拖尾,称右偏态(正偏态);峰偏右,长尾向左侧拖尾,称左偏态(负偏态)。下图分别为两个特征的示意图。第44页,此课件共49页哦第45页,此课件共49页哦第46页,此课件共49页哦正态性检验正态性检验1.图示法:P-P图,Q-Q图2.矩法3.W检验4.D检验5.Kolmogorov D检验6.2检验第47页,此课件共49页哦小结小结1.假设检验的过程是:建立假设;选择检验方法,计算检验统计量;确定P值,得出结论。2.假设检验的基本思想是:小概率事件在一次抽样中不太可能出现。3.假设检验方法很多,每种方法均有相应的适用条件。综合考虑研究目的、设计类型、变量类型、样本含量等要素,才能选择合适的检验方法。第48页,此课件共49页哦三种形式的三种形式的t检验比较检验比较资料检验假设应用条件计算公式自由度样本均数和总体均数比较样本来自正态总体配对设计差值服从正态分布两独立样本两组样本均来自正态总体,两总体方差相等第49页,此课件共49页哦