《假设检验基础精选PPT.ppt》由会员分享,可在线阅读,更多相关《假设检验基础精选PPT.ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、假设检验基础第1页,此课件共36页哦2假设检验(假设检验(hypothesis test)在数理统计上亦称显著性检验是对所估计的总体首先提出一个假设,在数理统计上亦称显著性检验是对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设然后通过样本数据去推断是否拒绝这一假设科研数据处理的重要工具科研数据处理的重要工具;某事发生了:某事发生了:是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这类问题类问题举例:上课迟到,买鸡蛋举例:上课迟到,买鸡蛋第2页,此课件共36页哦3假设检验的原因假设检验的原因 由于个体
2、差异的存在,即使从同一总体中严格的随由于个体差异的存在,即使从同一总体中严格的随机抽样,机抽样,X1、X2、X3、X4、,、,不同。不同。因此,因此,X1、X2 不同有两种(而且只有两种)可能:不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造成)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无统计学意义了样本均数的差别。差别无统计学意义。(2)分别所代表的总体均数不同。差别有统计学意义。)分别所代表的总体均数不同。差别有统计学意义。第3页,此课件共36页哦4 假设检验的基本原理假设检验的基本原理已知健康成年男子的脉搏均数为已知健康成年男子的脉搏均
3、数为72次次/分。某医生分。某医生在某山区随机调查在某山区随机调查25名健康男子,求得脉搏均数为名健康男子,求得脉搏均数为74.2次次/分,标准差分,标准差6.5次次/分。能否认为该山区的成分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数年男子的脉搏均数高于一般成年男子的脉搏均数?样本均数和总体均数的差异有两种可能:样本均数和总体均数的差异有两种可能:抽样误差所致抽样误差所致,有本质差异有本质差异n=25第4页,此课件共36页哦5利用反证法思想,假设是由于第一个原因,利用反证法思想,假设是由于第一个原因,计算产生计算产生 的概率(的概率(P)。)。若若P较小,是小于或等于小概率
4、事件的概率,较小,是小于或等于小概率事件的概率,即在一次抽样中一般不能发生,现在发生了,即在一次抽样中一般不能发生,现在发生了,则有理由拒绝原假设则有理由拒绝原假设 ,接受与之对,接受与之对立的假设。立的假设。若若P不是很小,暂时接受原假设。不是很小,暂时接受原假设。第5页,此课件共36页哦6假设检验的一般步骤假设检验的一般步骤建立假设、确定检验水准建立假设、确定检验水准1两种假设:两种假设:(1)检验假设:又称无效假设、零假设、原假设,是从反证法思想提出检验假设:又称无效假设、零假设、原假设,是从反证法思想提出的。的。(2)备择假设:拒绝备择假设:拒绝H0时而被接受的假设,与时而被接受的假设
5、,与H0对立。有三种情况:对立。有三种情况:双侧检验双侧检验 单侧检验单侧检验 单侧检验单侧检验2单、双侧的选择:由专业知识来确定。单、双侧的选择:由专业知识来确定。3检验水准:检验水准:,又称显著性水准,是小概率事件的概率。通常取,又称显著性水准,是小概率事件的概率。通常取0.05。第6页,此课件共36页哦7选定检验方法,计算检验统计量选定检验方法,计算检验统计量根据资料类型和推断目的选用不同的检根据资料类型和推断目的选用不同的检验方法。不同的检验方法有相应不同的验方法。不同的检验方法有相应不同的检验统计量及计算公式。检验统计量及计算公式。所有检验统计量都是在所有检验统计量都是在H0 成立的
6、条件下成立的条件下计算出来的,反映了抽样误差的大小,计算出来的,反映了抽样误差的大小,并且服从已知的分布。并且服从已知的分布。例:例:成立条件下成立条件下,则则 用用s代替代替,检验统计量为,检验统计量为 第7页,此课件共36页哦8-2.0641.692 2.0640=240.0250.025t0.05,24=2.064 P=P(|t|2.064)=0.05 P=P(|t|1.692)0.050.05第8页,此课件共36页哦9确定确定P值,作出推断结论值,作出推断结论1P的含义:从规定的总体随机抽得等的含义:从规定的总体随机抽得等于及大于(或等于及小于)现有样本获于及大于(或等于及小于)现有样
7、本获得的检验统计量值的概率。根据检验统得的检验统计量值的概率。根据检验统计量值,查相应的界值表,确定计量值,查相应的界值表,确定P值。值。2得出结论:若得出结论:若 ,按,按检验水准拒检验水准拒绝绝H0,接受,接受H1,有统计学意义;若,有统计学意义;若 ,按,按检验水准不拒绝,无统计学意义。检验水准不拒绝,无统计学意义。第9页,此课件共36页哦10假设检验特点假设检验特点1.类似于数学中的反证法类似于数学中的反证法 先建立假设(假设上课不迟到,鸡蛋是新鲜的),先建立假设(假设上课不迟到,鸡蛋是新鲜的),然后通过计算证明,得出小概率事件发生,则该然后通过计算证明,得出小概率事件发生,则该假设不
8、成立。假设不成立。2.数学推断是确定性的,而统计学推断是以概率给数学推断是确定性的,而统计学推断是以概率给出的,因此结论是相对的,得到任何结论都存出的,因此结论是相对的,得到任何结论都存在发生错误的可能。在发生错误的可能。第10页,此课件共36页哦11u(Z)检验均数的均数的 u 检验检验 应用条件:应用条件:样本含量样本含量n较大,或总体标准差较大,或总体标准差已知已知 1.单样本单样本u检验检验2.两大样本的两大样本的u检验检验 第11页,此课件共36页哦12例题例题71根据根据19831983年大量调查结果,已知某地成年男子的脉搏均年大量调查结果,已知某地成年男子的脉搏均数为数为7272
9、次次/分,某医生分,某医生20032003年在该地随机调查了年在该地随机调查了7575名成名成年男子,求其脉搏均数为年男子,求其脉搏均数为74.274.2次次/分,标准差为分,标准差为6.56.5次次/分,能否据此认为该地成年男子的脉搏不同于分,能否据此认为该地成年男子的脉搏不同于19831983年?年?第12页,此课件共36页哦13第13页,此课件共36页哦14例题例题72为研究孕妇补锌对胎儿生长发育的影响,将为研究孕妇补锌对胎儿生长发育的影响,将96名孕名孕妇随机分为试验组和对照组,一组在孕期不同时间妇随机分为试验组和对照组,一组在孕期不同时间按要求补锌,另一组为对照,观察两组孕妇所生新按
10、要求补锌,另一组为对照,观察两组孕妇所生新生儿体重有无不同,两组的例数、均数、标准差分生儿体重有无不同,两组的例数、均数、标准差分别为:别为:第14页,此课件共36页哦15第15页,此课件共36页哦16率的u检验应用条件:应用条件:当n较大,p和1-p均不太小时,即np及n(1-p)均大于5时 1.样本率与总体率的比较2.两样本率的比较第16页,此课件共36页哦17例题例题7-3全国调查结果显示,学龄前儿童营养性贫血患病全国调查结果显示,学龄前儿童营养性贫血患病率为率为23.5%,某医院为了解当地学龄前儿童营养性贫,某医院为了解当地学龄前儿童营养性贫血患病情况,对当地血患病情况,对当地1396
11、例学龄前儿童进行了抽例学龄前儿童进行了抽样调查,查出营养性贫血患儿样调查,查出营养性贫血患儿363例,患病率例,患病率26.0%。问该地学龄前儿童营养性贫血患病率是否。问该地学龄前儿童营养性贫血患病率是否不同于全国平均水平?不同于全国平均水平?第17页,此课件共36页哦18第18页,此课件共36页哦19例题7-4为了解某地在校男大学生肥胖与超重的情况,用随为了解某地在校男大学生肥胖与超重的情况,用随机的方法分别调查了该地一所文科大学和一所工科机的方法分别调查了该地一所文科大学和一所工科大学的部分在校男生,其中文科大学调查了大学的部分在校男生,其中文科大学调查了765人,人,检出超重检出超重53
12、人,超重率为人,超重率为6.9%,工科大学调查了,工科大学调查了882人,检出超重人,检出超重22人,超重率为人,超重率为2.5%,试比较两,试比较两所大学男生的超重检出率有无差别。所大学男生的超重检出率有无差别。第19页,此课件共36页哦20第20页,此课件共36页哦21假设检验两类错误假设检验两类错误 弃真错误,即弃真错误,即类错误(类错误(),和存伪错误,即),和存伪错误,即类错误(类错误()大,则小,反之小大第21页,此课件共36页哦22第22页,此课件共36页哦23假设检验中需注意的几个问题假设检验中需注意的几个问题1.1.建立假设建立假设“假设”是对总体特征的表述 H0与H1的表述
13、随资料性质、分析目的和检验方法而定。第23页,此课件共36页哦24 2.不同变量或资料应选用不同的检验不同变量或资料应选用不同的检验 3.资料的代表性与可比性资料的代表性与可比性 所谓代表性是指该样本从相应总体中经随机抽样获所谓代表性是指该样本从相应总体中经随机抽样获得,能够代表总体的特征;得,能够代表总体的特征;所谓可比性是指各对比组间除了要比较的主要因素所谓可比性是指各对比组间除了要比较的主要因素外,其它影响结果的因素应尽可能相同或相近外,其它影响结果的因素应尽可能相同或相近 为了保证资料的可比性,必须要有为了保证资料的可比性,必须要有严密的实验设计严密的实验设计,保证样本随机抽取于同质总
14、体,这是保证样本随机抽取于同质总体,这是假设检验得以假设检验得以正确应用的前提正确应用的前提 第24页,此课件共36页哦254.结论不能绝对化结论不能绝对化 报告结果应说明P 值。5.统计结论必须与专业结论有机的结合统计结论必须与专业结论有机的结合 在做专业结论时,应在综合考虑两均数大小的实际意义、P值大小和设计科学性的基础上进行统计结论的专业解释。第25页,此课件共36页哦266.检验水准的确定检验水准的确定 犯犯型错误后果严重时,要减小型错误后果严重时,要减小。如一种新药治疗高血压,该药物副作用小,如一种新药治疗高血压,该药物副作用小,成本低。经检验若拒绝成本低。经检验若拒绝 ,则该药有效
15、,则该药有效,可推广使用,这时为减小犯可推广使用,这时为减小犯型错误的概率,型错误的概率,降低降低。如新检测方法与旧方法比较,不拒绝如新检测方法与旧方法比较,不拒绝 ,可用新检测方法代替旧方法,这时应慎重,可用新检测方法代替旧方法,这时应慎重,减少犯减少犯型错误的概率,提高型错误的概率,提高。第26页,此课件共36页哦277.单双侧的选择:结合专业知识确定。单双侧的选择:结合专业知识确定。应该用双侧,用了单侧,易拒绝,易得应该用双侧,用了单侧,易拒绝,易得出有差别的结论;应该用单侧,用了双出有差别的结论;应该用单侧,用了双侧,降低了检验效能。侧,降低了检验效能。第27页,此课件共36页哦28-
16、2.0642.0640=240.0250.025第28页,此课件共36页哦29假设检验的统计意义假设检验的统计意义 1.P值的正确理解值的正确理解 2.检验结果的正确理解检验结果的正确理解.统计结论的表述统计结论的表述.假设检验与可信区间的区别与联系假设检验与可信区间的区别与联系 第29页,此课件共36页哦30假设检验的实际意义假设检验的实际意义 P说明如果总体均数相等,得到本次实验(观察说明如果总体均数相等,得到本次实验(观察结果(如两样本结果(如两样本均数的差值)不大可能出现,因而拒绝此均数的差值)不大可能出现,因而拒绝此H0,并不是说发现的差,并不是说发现的差异一定有实际意义。从本章异一
17、定有实际意义。从本章u检验的所有计算公式中可以看出,检验的所有计算公式中可以看出,假设检验的结论与样本大小有关。当样本量足够大时,标准误趋于假设检验的结论与样本大小有关。当样本量足够大时,标准误趋于,无论两样本均数或两样本率相差多少,都能得足以拒绝,无论两样本均数或两样本率相差多少,都能得足以拒绝H0的的u值和值和P值。值。反之,当样本很小时,即使样本均数差别较大也会得出较小的检验反之,当样本很小时,即使样本均数差别较大也会得出较小的检验统计量值和较大的统计量值和较大的P值而作出差别无统计意义的结论。因此,值而作出差别无统计意义的结论。因此,P值大值大小只能说明统计学意义的小只能说明统计学意义
18、的“显著显著”,不一定有实际意义。,不一定有实际意义。第30页,此课件共36页哦31影响检验效能的影响检验效能的4个因素个因素 检验效能用概率检验效能用概率1-表示,其中表示,其中为假设检验不拒绝为假设检验不拒绝H0时时犯犯类错误的概率。检验效能的意义是,当两总体确有类错误的概率。检验效能的意义是,当两总体确有差别,按检验水准差别,按检验水准假设检验能发现其差别(拒绝假设检验能发现其差别(拒绝H0)的能力。)的能力。.总体参数的差异越大,检验效能越大。总体参数的差异越大,检验效能越大。.个体差异(标准差)越小,检验效能越大。个体差异(标准差)越小,检验效能越大。3.样本量越大,检验效能越大。样
19、本量越大,检验效能越大。.检验水准检验水准(类错误的概率)定得越宽,检验效能越类错误的概率)定得越宽,检验效能越大。大。第31页,此课件共36页哦32多次重复检验问题多次重复检验问题 多个观察指标的多次重复检验问题多个观察指标的多次重复检验问题 一个观察指标多次测量的重复检验问题一个观察指标多次测量的重复检验问题 第32页,此课件共36页哦33小结小结1.假设检验的过程是:建立假设;选择检验方法,假设检验的过程是:建立假设;选择检验方法,计算检验统计量;确定计算检验统计量;确定P值,得出结论。值,得出结论。2.假设检验的基本思想是:小概率事件在一次抽样假设检验的基本思想是:小概率事件在一次抽样
20、中不太可能出现。中不太可能出现。3.假设检验方法很多,每种方法均有相应的适用条假设检验方法很多,每种方法均有相应的适用条件。综合考虑研究目的、设计类型、变量类型、样件。综合考虑研究目的、设计类型、变量类型、样本含量等要素,才能选择合适的检验方法。本含量等要素,才能选择合适的检验方法。第33页,此课件共36页哦34u检验资料检验假设应用条件计算公式大样本均数和总体均数比较n30两独立大样本均数比较n1与n2均大于30样本率与总体率的比较np及n(1-p)均大于5两独立样本率比较两组np及n(1-p)均大于5第34页,此课件共36页哦35习题习题1.两个样本均数比较,经两个样本均数比较,经t检验,
21、差别有统计学意义时,检验,差别有统计学意义时,P值越小,值越小,说明(说明()A.两样本差别越大两样本差别越大 B.两总体均数差别越大两总体均数差别越大C.越有理由认为两总越有理由认为两总体均数不同体均数不同 D.越有理由认为两样本均数不同越有理由认为两样本均数不同 E.拒绝拒绝H1犯错误的概率越小犯错误的概率越小2.两样本均数比较时,以下检验水准中第二类错误最小的是(两样本均数比较时,以下检验水准中第二类错误最小的是()A.=0.05 B.=0.01 C.=0.15 D.=0.20 E.=0.30 3.()时,应做单侧检验)时,应做单侧检验 A.已知已知A药不会优于药不会优于B药药 B.已知已知A药优于药优于B药药 C.已知已知A药劣于药劣于B药药 D.不知不知A药好还是药好还是B药好药好 E.以上答案都不对以上答案都不对第35页,此课件共36页哦364.某年级全体男女同学的平均血压作对比,某年级全体男女同学的平均血压作对比,要不要进行假设检验?要不要进行假设检验?5.为什么假设检验的结论不能绝对化?为什么假设检验的结论不能绝对化?第36页,此课件共36页哦
限制150内