《假设检验基础精.ppt》由会员分享,可在线阅读,更多相关《假设检验基础精.ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、假设检验基础第1页,本讲稿共36页2假设检验(假设检验(hypothesis test)在数理统计上亦称显著性检验是对所估计的总体首先提出一个在数理统计上亦称显著性检验是对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设假设,然后通过样本数据去推断是否拒绝这一假设科研数据处理的重要工具科研数据处理的重要工具;某事发生了:某事发生了:是由于碰巧?还是由于必然的原因?统计学家运用显著性检验是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这类问题来处理这类问题举例:上课迟到,买鸡蛋举例:上课迟到,买鸡蛋第2页,本讲稿共36页3假设检验的原因假设检验的原因 由于个体差异
2、的存在,即使从同一总体中严格的随由于个体差异的存在,即使从同一总体中严格的随机抽样,机抽样,X1、X2、X3、X4、,、,不同。不同。因此,因此,X1、X2 不同有两种(而且只有两种)可能:不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造成了)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无统计学意义样本均数的差别。差别无统计学意义。(2)分别所代表的总体均数不同。差别有统计学意义。)分别所代表的总体均数不同。差别有统计学意义。第3页,本讲稿共36页4 假设检验的基本原理假设检验的基本原理已知健康成年男子的脉搏均数为已知健康成年男子的脉搏均数为7
3、2次次/分。某医生在某分。某医生在某山区随机调查山区随机调查25名健康男子,求得脉搏均数为名健康男子,求得脉搏均数为74.2次次/分,标准差分,标准差6.5次次/分。能否认为该山区的成年男子分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?的脉搏均数高于一般成年男子的脉搏均数?样本均数和总体均数的差异有两种可能:样本均数和总体均数的差异有两种可能:抽样误差所致抽样误差所致,有本质差异有本质差异n=25第4页,本讲稿共36页5利用反证法思想,假设是由于第一个原因,利用反证法思想,假设是由于第一个原因,计算产生计算产生 的概率(的概率(P)。)。若若P较小,是小于或等于小概率事件的
4、概率,较小,是小于或等于小概率事件的概率,即在一次抽样中一般不能发生,现在发生了即在一次抽样中一般不能发生,现在发生了,则有理由拒绝原假设,则有理由拒绝原假设 ,接受与之,接受与之对立的假设。对立的假设。若若P不是很小,暂时接受原假设。不是很小,暂时接受原假设。第5页,本讲稿共36页6假设检验的一般步骤假设检验的一般步骤建立假设、确定检验水准建立假设、确定检验水准1两种假设:两种假设:(1)检验假设:又称无效假设、零假设、原假设,是从反证法思想检验假设:又称无效假设、零假设、原假设,是从反证法思想提出的。提出的。(2)备择假设:拒绝备择假设:拒绝H0时而被接受的假设,与时而被接受的假设,与H0
5、对立。有三种情况:对立。有三种情况:双侧检验双侧检验 单侧检验单侧检验 单侧检验单侧检验2单、双侧的选择:由专业知识来确定。单、双侧的选择:由专业知识来确定。3检验水准:检验水准:,又称显著性水准,是小概率事件的概率。通常取,又称显著性水准,是小概率事件的概率。通常取0.05。第6页,本讲稿共36页7选定检验方法,计算检验统计量选定检验方法,计算检验统计量根据资料类型和推断目的选用不同的检根据资料类型和推断目的选用不同的检验方法。不同的检验方法有相应不同的验方法。不同的检验方法有相应不同的检验统计量及计算公式。检验统计量及计算公式。所有检验统计量都是在所有检验统计量都是在H0 成立的条件下成立
6、的条件下计算出来的,反映了抽样误差的大小,计算出来的,反映了抽样误差的大小,并且服从已知的分布。并且服从已知的分布。例:例:成立条件下成立条件下,则则 用用s代替代替,检验统计量为,检验统计量为 第7页,本讲稿共36页8-2.0641.692 2.0640=240.0250.025t0.05,24=2.064 P=P(|t|2.064)=0.05 P=P(|t|1.692)0.050.05第8页,本讲稿共36页9确定确定P值,作出推断结论值,作出推断结论1P的含义:从规定的总体随机抽得等的含义:从规定的总体随机抽得等于及大于(或等于及小于)现有样本获于及大于(或等于及小于)现有样本获得的检验统
7、计量值的概率。根据检验统得的检验统计量值的概率。根据检验统计量值,查相应的界值表,确定计量值,查相应的界值表,确定P值。值。2得出结论:若得出结论:若 ,按,按检验水准拒检验水准拒绝绝H0,接受,接受H1,有统计学意义;若,有统计学意义;若 ,按,按检验水准不拒绝,无统计学意义。检验水准不拒绝,无统计学意义。第9页,本讲稿共36页10假设检验特点假设检验特点1.类似于数学中的反证法类似于数学中的反证法 先建立假设(假设上课不迟到,鸡蛋是新鲜的),先建立假设(假设上课不迟到,鸡蛋是新鲜的),然后通过计算证明,得出小概率事件发生,则该假然后通过计算证明,得出小概率事件发生,则该假设不成立。设不成立
8、。2.数学推断是确定性的,而统计学推断是以概率给数学推断是确定性的,而统计学推断是以概率给出的,因此结论是相对的,得到任何结论都存出的,因此结论是相对的,得到任何结论都存在发生错误的可能。在发生错误的可能。第10页,本讲稿共36页11u(Z)检验均数的均数的 u 检验检验 应用条件:应用条件:样本含量样本含量n较大,或总体标准差较大,或总体标准差已知已知 1.单样本单样本u检验检验2.两大样本的两大样本的u检验检验 第11页,本讲稿共36页12例题例题71根据根据19831983年大量调查结果,已知某地成年男子的脉搏年大量调查结果,已知某地成年男子的脉搏均数为均数为7272次次/分,某医生分,
9、某医生20032003年在该地随机调查了年在该地随机调查了7575名名成年男子,求其脉搏均数为成年男子,求其脉搏均数为74.274.2次次/分,标准差为分,标准差为6.56.5次次/分,能否据此认为该地成年男子的脉搏不同于分,能否据此认为该地成年男子的脉搏不同于19831983年?年?第12页,本讲稿共36页13第13页,本讲稿共36页14例题例题72为研究孕妇补锌对胎儿生长发育的影响,将为研究孕妇补锌对胎儿生长发育的影响,将96名名孕妇随机分为试验组和对照组,一组在孕期不同时孕妇随机分为试验组和对照组,一组在孕期不同时间按要求补锌,另一组为对照,观察两组孕妇所生间按要求补锌,另一组为对照,观
10、察两组孕妇所生新生儿体重有无不同,两组的例数、均数、标准差新生儿体重有无不同,两组的例数、均数、标准差分别为:分别为:第14页,本讲稿共36页15第15页,本讲稿共36页16率的u检验应用条件:应用条件:当n较大,p和1-p均不太小时,即np及n(1-p)均大于5时 1.样本率与总体率的比较2.两样本率的比较第16页,本讲稿共36页17例题例题7-3全国调查结果显示,学龄前儿童营养性贫血患病率全国调查结果显示,学龄前儿童营养性贫血患病率为为23.5%,某医院为了解当地学龄前儿童营养性贫,某医院为了解当地学龄前儿童营养性贫血患病情况,对当地血患病情况,对当地1396例学龄前儿童进行了抽样例学龄前
11、儿童进行了抽样调查,查出营养性贫血患儿调查,查出营养性贫血患儿363例,患病率例,患病率26.0%。问该地学龄前儿童营养性贫血患病率是否不同于问该地学龄前儿童营养性贫血患病率是否不同于全国平均水平?全国平均水平?第17页,本讲稿共36页18第18页,本讲稿共36页19例题7-4为了解某地在校男大学生肥胖与超重的情况,用随为了解某地在校男大学生肥胖与超重的情况,用随机的方法分别调查了该地一所文科大学和一所工科机的方法分别调查了该地一所文科大学和一所工科大学的部分在校男生,其中文科大学调查了大学的部分在校男生,其中文科大学调查了765人,人,检出超重检出超重53人,超重率为人,超重率为6.9%,工
12、科大学调查了,工科大学调查了882人,检出超重人,检出超重22人,超重率为人,超重率为2.5%,试比较两,试比较两所大学男生的超重检出率有无差别。所大学男生的超重检出率有无差别。第19页,本讲稿共36页20第20页,本讲稿共36页21假设检验两类错误假设检验两类错误 弃真错误,即弃真错误,即类错误(类错误(),和存伪错误,即),和存伪错误,即类错误(类错误()大,则小,反之小大第21页,本讲稿共36页22第22页,本讲稿共36页23假设检验中需注意的几个问题假设检验中需注意的几个问题1.1.建立假设建立假设“假设”是对总体特征的表述 H0与H1的表述随资料性质、分析目的和检验方法而定。第23页
13、,本讲稿共36页24 2.不同变量或资料应选用不同的检验不同变量或资料应选用不同的检验 3.资料的代表性与可比性资料的代表性与可比性 所谓代表性是指该样本从相应总体中经随机抽样获所谓代表性是指该样本从相应总体中经随机抽样获得,能够代表总体的特征;得,能够代表总体的特征;所谓可比性是指各对比组间除了要比较的主要因素所谓可比性是指各对比组间除了要比较的主要因素外,其它影响结果的因素应尽可能相同或相近外,其它影响结果的因素应尽可能相同或相近 为了保证资料的可比性,必须要有严密的实验设计,为了保证资料的可比性,必须要有严密的实验设计,保证样本随机抽取于同质总体,这是假设检验得以保证样本随机抽取于同质总
14、体,这是假设检验得以正确应用的前提正确应用的前提 第24页,本讲稿共36页254.结论不能绝对化结论不能绝对化 报告结果应说明P 值。5.统计结论必须与专业结论有机的结合统计结论必须与专业结论有机的结合 在做专业结论时,应在综合考虑两均数大小的实际意义、P值大小和设计科学性的基础上进行统计结论的专业解释。第25页,本讲稿共36页266.检验水准的确定检验水准的确定 犯犯型错误后果严重时,要减小型错误后果严重时,要减小。如一种新药治疗高血压,该药物副作用小,如一种新药治疗高血压,该药物副作用小,成本低。经检验若拒绝成本低。经检验若拒绝 ,则该药有效,则该药有效,可推广使用,这时为减小犯可推广使用
15、,这时为减小犯型错误的概率,型错误的概率,降低降低。如新检测方法与旧方法比较,不拒绝如新检测方法与旧方法比较,不拒绝 ,可用新检测方法代替旧方法,这时应慎重,可用新检测方法代替旧方法,这时应慎重,减少犯减少犯型错误的概率,提高型错误的概率,提高。第26页,本讲稿共36页277.单双侧的选择:结合专业知识确定。单双侧的选择:结合专业知识确定。应该用双侧,用了单侧,易拒绝,易得应该用双侧,用了单侧,易拒绝,易得出有差别的结论;应该用单侧,用了双出有差别的结论;应该用单侧,用了双侧,降低了检验效能。侧,降低了检验效能。第27页,本讲稿共36页28-2.0642.0640=240.0250.025第2
16、8页,本讲稿共36页29假设检验的统计意义假设检验的统计意义 1.P值的正确理解值的正确理解 2.检验结果的正确理解检验结果的正确理解.统计结论的表述统计结论的表述.假设检验与可信区间的区别与联系假设检验与可信区间的区别与联系 第29页,本讲稿共36页30假设检验的实际意义假设检验的实际意义 P说明如果总体均数相等,得到本次实验(观察说明如果总体均数相等,得到本次实验(观察结果(如两样本均结果(如两样本均数的差值)不大可能出现,因而拒绝此数的差值)不大可能出现,因而拒绝此H0,并不是说发现的差异一,并不是说发现的差异一定有实际意义。从本章定有实际意义。从本章u检验的所有计算公式中可以看出,假设
17、检检验的所有计算公式中可以看出,假设检验的结论与样本大小有关。当样本量足够大时,标准误趋于,无验的结论与样本大小有关。当样本量足够大时,标准误趋于,无论两样本均数或两样本率相差多少,都能得足以拒绝论两样本均数或两样本率相差多少,都能得足以拒绝H0的的u值和值和P值。值。反之,当样本很小时,即使样本均数差别较大也会得出较小的检反之,当样本很小时,即使样本均数差别较大也会得出较小的检验统计量值和较大的验统计量值和较大的P值而作出差别无统计意义的结论。因此,值而作出差别无统计意义的结论。因此,P值大小只能说明统计学意义的值大小只能说明统计学意义的“显著显著”,不一定有实际意义。,不一定有实际意义。第
18、30页,本讲稿共36页31影响检验效能的影响检验效能的4个因素个因素 检验效能用概率检验效能用概率1-表示,其中表示,其中为假设检验不拒绝为假设检验不拒绝H0时时犯犯类错误的概率。检验效能的意义是,当两总体确类错误的概率。检验效能的意义是,当两总体确有差别,按检验水准有差别,按检验水准假设检验能发现其差别(拒绝假设检验能发现其差别(拒绝H0)的能力。)的能力。.总体参数的差异越大,检验效能越大。总体参数的差异越大,检验效能越大。.个体差异(标准差)越小,检验效能越大。个体差异(标准差)越小,检验效能越大。3.样本量越大,检验效能越大。样本量越大,检验效能越大。.检验水准检验水准(类错误的概率)
19、定得越宽,检验效能越大。类错误的概率)定得越宽,检验效能越大。第31页,本讲稿共36页32多次重复检验问题多次重复检验问题 多个观察指标的多次重复检验问题多个观察指标的多次重复检验问题 一个观察指标多次测量的重复检验问题一个观察指标多次测量的重复检验问题 第32页,本讲稿共36页33小结小结1.假设检验的过程是:建立假设;选择检验方法,计假设检验的过程是:建立假设;选择检验方法,计算检验统计量;确定算检验统计量;确定P值,得出结论。值,得出结论。2.假设检验的基本思想是:小概率事件在一次抽样中假设检验的基本思想是:小概率事件在一次抽样中不太可能出现。不太可能出现。3.假设检验方法很多,每种方法
20、均有相应的适用条假设检验方法很多,每种方法均有相应的适用条件。综合考虑研究目的、设计类型、变量类型、件。综合考虑研究目的、设计类型、变量类型、样本含量等要素,才能选择合适的检验方法。样本含量等要素,才能选择合适的检验方法。第33页,本讲稿共36页34u检验资料检验假设应用条件计算公式大样本均数和总体均数比较n30两独立大样本均数比较n1与n2均大于30样本率与总体率的比较np及n(1-p)均大于5两独立样本率比较两组np及n(1-p)均大于5第34页,本讲稿共36页35习题习题1.两个样本均数比较,经两个样本均数比较,经t检验,差别有统计学意义时,检验,差别有统计学意义时,P值越小,值越小,说
21、明(说明()A.两样本差别越大两样本差别越大 B.两总体均数差别越大两总体均数差别越大C.越有理由认为两总体越有理由认为两总体均数不同均数不同 D.越有理由认为两样本均数不同越有理由认为两样本均数不同 E.拒绝拒绝H1犯错误的概率越小犯错误的概率越小2.两样本均数比较时,以下检验水准中第二类错误最小的是(两样本均数比较时,以下检验水准中第二类错误最小的是()A.=0.05 B.=0.01 C.=0.15 D.=0.20 E.=0.30 3.()时,应做单侧检验)时,应做单侧检验 A.已知已知A药不会优于药不会优于B药药 B.已知已知A药优于药优于B药药 C.已知已知A药劣于药劣于B药药 D.不知不知A药好还是药好还是B药好药好 E.以上答案都不对以上答案都不对第35页,本讲稿共36页364.某年级全体男女同学的平均血压作对比,某年级全体男女同学的平均血压作对比,要不要进行假设检验?要不要进行假设检验?5.为什么假设检验的结论不能绝对化?为什么假设检验的结论不能绝对化?第36页,本讲稿共36页
限制150内