《07假设检验基础.ppt》由会员分享,可在线阅读,更多相关《07假设检验基础.ppt(110页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、假设检验基础假设检验基础 v下载课件公共邮箱:下载课件公共邮箱:用户名:用户名:密码:密码:weishengjianyan存放位置:网盘存放位置:网盘2内容内容假设检验原理假设检验原理1T检验、检验、z检验检验2假设检验与区间估计假设检验与区间估计3假设检验功效假设检验功效43统计资料处理统计资料处理v统计描述(统计描述(statisticaldescription)v统计推断统计推断(statisticalinference)1、参数估计、参数估计estimationofparameter2、假设检验、假设检验hypothesistesting4v某医生测量了某医生测量了36名男性铅作业工人
2、的血红蛋白含名男性铅作业工人的血红蛋白含量,均数为量,均数为130.8g/L,标准差为,标准差为25.74g/L,正常男性血红蛋白含量一般为正常男性血红蛋白含量一般为140g/L,铅作业工铅作业工人的血红蛋白含量与正常人有无不同?人的血红蛋白含量与正常人有无不同?5总总 体体随机抽样随机抽样抽样误差抽样误差样本样本总总 体体0=140?假设检验假设检验6假设检验假设检验(hypothesis testing)v样本均数与总体均数不等,有两种可能:样本均数与总体均数不等,有两种可能:由抽样误差所致由抽样误差所致 两者来自不同的总体两者来自不同的总体 7v本例目的是判断是否本例目的是判断是否0 0
3、,但直接判断很困难。但可以,但直接判断很困难。但可以利用反证法思想,从利用反证法思想,从=0 0出发,间接的判断是否出发,间接的判断是否0 0.v假设假设=0 0,判断由于抽样误差造成,判断由于抽样误差造成 与与00差别可能性差别可能性有多大?有多大?1 1、如果、如果 与与0 0接近,其差别是抽样造成的可能性就很接近,其差别是抽样造成的可能性就很大;大;2 2、如果差别较大,则有可能不是抽样误差,而是来自的、如果差别较大,则有可能不是抽样误差,而是来自的总体不同。总体不同。89假设检验理论基础假设检验理论基础v假设检验理论基础假设检验理论基础-利用小概率反证法思想,从问题的利用小概率反证法思
4、想,从问题的对立面(对立面(H0)出发,间接判断要解决的问题()出发,间接判断要解决的问题(H1)是否)是否成立。然后成立。然后H0成立的条件下计算检验统计量,最后获得成立的条件下计算检验统计量,最后获得p值来判断。值来判断。1 1、若、若p p为小概率为小概率,则认为假设不成立;则认为假设不成立;2 2、若非小概率大,则还不能认为假设不成立。、若非小概率大,则还不能认为假设不成立。该结论的正确性是冒着该结论的正确性是冒着5%5%的错误风险。的错误风险。假设检验有自己独特的逻辑和统计学思维方式。假设检验有自己独特的逻辑和统计学思维方式。10 例例如如:抛抛硬硬币币,通通常常假假设设:正正反反面
5、面出出现现的的机机会会均均等等,但但是是如如果果抛抛2020次次只只有有1 1次次是是正正面面的的,你你就就有有理理由由怀怀疑疑原原来来假假设设“正正反反面面出出现现的的机机会会均均等等”是是错错的的(因因为为出出现现这这种种情情况况的的概概率率太太小小了了)。同同样样u u检检验验、t t检检验验也也是是类似情况。类似情况。假设检验基本思想11假设检验的基本步骤假设检验的基本步骤v第第 一一 步步:提提 出出 检检 验验 假假 设设(又又 称称 无无 效效 假假 设设 null hypothesis,H0)和和备备择择假假设设(alternative hypothesis,H1)。H0:假设
6、两总体均数相等,即样本与总体或样本与样本间的:假设两总体均数相等,即样本与总体或样本与样本间的差异是由抽样误差引起的。差异是由抽样误差引起的。H1:假设两总体均数不相等,即两总体间存在本质差异。:假设两总体均数不相等,即两总体间存在本质差异。12v某医生测量了某医生测量了36名男性铅作业工人的血红蛋白含名男性铅作业工人的血红蛋白含量,均数为量,均数为130.8g/L,标准差为,标准差为25.74g/L,正常男性血红蛋白含量一般为正常男性血红蛋白含量一般为140g/L,铅作业工铅作业工人的血红蛋白含量与正常人有无不同?人的血红蛋白含量与正常人有无不同?13选择单双侧检验选择单双侧检验(1)H0:
7、=0;H1:0(双侧检验)(双侧检验)(2)H0:=0;H1:0;(单侧检验单侧检验)或者或者H0:=0;H1:0(单侧检验单侧检验)14对于假设检验,需注意:对于假设检验,需注意:v检验假设是针对总体而言,而不是针对样本;检验假设是针对总体而言,而不是针对样本;vH0与与H1是相互对立、相互联系的,最后的结论是是相互对立、相互联系的,最后的结论是根据根据H0与与H1做出的,两者缺一不可;做出的,两者缺一不可;vHo是无效假设,假设常常是两个或多个总体参数是无效假设,假设常常是两个或多个总体参数相等、或之差为相等、或之差为0、或、或.无效、或某资料服从某无效、或某资料服从某一特定分布;一特定分
8、布;vH1的内容直接反映了检验的单双侧。的内容直接反映了检验的单双侧。15设定检验水准设定检验水准(size of test)为为0.05v第二步:选定统计方法,计算出统计量的大小。第二步:选定统计方法,计算出统计量的大小。根根据据资资料料的的类类型型和和特特点点,可可分分别别选选用用t检检验验,则则计计算算t值值,z检检验验则则计计算算z值值,或或其其他他检检验验方方法法:秩秩和和检检验验和和卡卡方方检检验等验等。16v第第三三步步:根根据据统统计计量量的的大大小小及及其其分分布布确确定定检检验验假假设设成立的可能性成立的可能性P的大小并判断结果。的大小并判断结果。推断结论包括:统计学结论、
9、专业结论推断结论包括:统计学结论、专业结论若若P,则则拒拒绝绝H0,接接受受H1,有有统统计计学学意意义义,可可以以认为认为.不等或不同。不等或不同。假设检验的基本步骤假设检验的基本步骤17若若P,则则不不拒拒绝绝H0,无无统统计计学学意意义义,还还不不能能认为认为不等或不同。不等或不同。v注意:注意:1、不拒绝、不拒绝H0不等于接受不等于接受H0;2、对、对H0只能说拒绝不拒绝只能说拒绝不拒绝Ho;对对H1只能说接受只能说接受H1。18t检验检验vt检验的应用条件:检验的应用条件:未知未知,且且 n较小较小样本来自正态总体样本来自正态总体两样本均数比较时还要求两个总体方差相等两样本均数比较时
10、还要求两个总体方差相等(已知或已知或未知但未知但n足够大足够大应用应用z检验检验)19单样本资料的单样本资料的t检验检验v单单样样本本资资料料的的t检检验验(样样本本均均数数与与总总体体均均数数比比较较的的t检检验验)实实际际上上是是推推断断该该样样本本来来自自的的总总体体均均数数与与已已知知的的某某一一总总体体均均数数0(常常为为理理论论值值或或标标准准值值)有有无差别。无差别。v在在进进行行样样本本均均数数与与总总体体均均数数比比较较中中,需需要要建建立立一一个个统统计计量量,根根据据样样本本所所属属不不同同总总体体,该该统统计计量量的的分分布布也不同,由此作出相应的统计推断。也不同,由此
11、作出相应的统计推断。20样本均数与总体均数比较样本均数与总体均数比较v例例8.3:根据大量调查,已知健康成年男性的脉搏均数为72次/分,某医生在一山区随即抽查了25名健康男性,求得其脉搏均数为74.2次/分,标准差为6.0次/分,问是否能据此认为该山区成年男性的脉搏均数高于一般成年男性?21样本均数与总体均数比较样本均数与总体均数比较22样本均数与总体均数比较样本均数与总体均数比较 上上述述两两个个均均数数不不等等既既可可能能是是抽抽样样误误差差所所致致,也也有有可可能真是环境差异的影响,做假设检验。能真是环境差异的影响,做假设检验。因为因为未知,可用未知,可用t检验,检验过程如下检验,检验过
12、程如下:1.建立假设H0:=0=72次/分,H1:0,检验水准为0.05。23样本均数与总体均数比较样本均数与总体均数比较2.计算统计量计算统计量进行样本均数与总体均数比较的u检验,计算u值24样本均数与总体均数比较样本均数与总体均数比较.确定确定p值,判断是否应该拒绝值,判断是否应该拒绝 查t界值表,临界值t0.05/2,24=2.064,检验统计量t=1.8332.064不是小概率事件,对于一次随机抽样而言,是会发生的。25定义值和应用定义值和应用本例本例 t0.05;PP,不拒绝0,不能认为该山区成年男性的脉搏均数与一般成年男性不同。26配对设计资料的配对设计资料的t检验检验v 配对设计
13、;配对设计;自身配对:自身配对:同一个体治疗前后;同一个体治疗前后;同一标本,不同检查方法同一标本,不同检查方法 非自身配对:不同个体配对。非自身配对:不同个体配对。v 先求出各对子的差值先求出各对子的差值d d的均值的均值,若两种处理的效若两种处理的效应无差别,理论上差值应无差别,理论上差值d d 的总体均数应为的总体均数应为0 0。要求差值的总体分布为正态分布。要求差值的总体分布为正态分布。27v t检验的公式为:检验的公式为:例题例题 设有设有1212名志愿受试者服用某减肥药,服药前名志愿受试者服用某减肥药,服药前和服药后一个疗程各测量一次体重和服药后一个疗程各测量一次体重(kg)(kg
14、),数据如表数据如表所示。问此减肥药是否有效?所示。问此减肥药是否有效?28某减肥药研究的体重某减肥药研究的体重(kgkg)观察值观察值29v(1)建立检验假设)建立检验假设v H0:d=0,即该减肥药无效;即该减肥药无效;v H1:d0,即该减肥药有效。即该减肥药有效。v单侧单侧=0.05v(2 2)计算)计算t t值值v本例本例n n=12,=12,d d=-16=-16,dd2 2 =710=710,v差值的均数差值的均数=d/n d/n=-16/12=-1.33(=-16/12=-1.33(kgkg)30v(3 3)确确定定P P值值,作作出出推推断断结结论论 ,=n n-1=12-1
15、=11-1=12-1=11,查查附附表表2 2,t t界界值值表表,得得单单侧侧t t0.05/20.05/2,1111=2.201,=2.201,现现t t=0.58=0.58 0.050.05。按按=0.05=0.05水准,不拒绝水准,不拒绝H H0 0,差异无统计学意义。差异无统计学意义。v结论:结论:故尚不能认为该减肥药有减肥效果。故尚不能认为该减肥药有减肥效果。31v例题例题 某地区随机抽取某地区随机抽取1212名贫血儿童的家庭,实施健康教育干预三个月,名贫血儿童的家庭,实施健康教育干预三个月,干预前后儿童的血红蛋白测量结果如下,问干预对该地区贫血儿童血红干预前后儿童的血红蛋白测量结
16、果如下,问干预对该地区贫血儿童血红蛋白的水平有无变化?蛋白的水平有无变化?序号序号干预前干预前干预后干预后差值差值序号序号干预前干预前干预后干预后差值差值136459742702824664188454503536613925502545757010558025565705115160966055-5125960132(1)建立检验假设)建立检验假设 H0:d=0,即干预前后差值的总体均数为零;即干预前后差值的总体均数为零;H1:d0,即干预前后差值的总体均数不为零。即干预前后差值的总体均数不为零。单侧单侧=0.05(2 2)计算)计算t t值值 t=3.305 t=3.305 t t0.01
17、/2,110.01/2,11=3.106;t=3.106;t0.005/2,110.005/2,11=3.497=3.497 0.01P0.0050.01P0.005 33两独立样本资料的两独立样本资料的t检验检验 independent samples t-testindependent samples t-testv适用于比较按完全随机设计而得到的两组资料,比较的目的是推断它适用于比较按完全随机设计而得到的两组资料,比较的目的是推断它们各自所代表的总体均数和是否相等。们各自所代表的总体均数和是否相等。v当两样本方差齐性时,即总体方差当两样本方差齐性时,即总体方差 相等。用相等。用t t检验
18、检验34v例例3.9测得测得14名慢性支气管炎病人与名慢性支气管炎病人与11名健康人的尿中名健康人的尿中17酮类固醇(酮类固醇(mol/24h)排出量如下,试比较两组人排出量如下,试比较两组人的尿中的尿中17酮类固醇的排出量有无不同。酮类固醇的排出量有无不同。v原始调查数据如下:原始调查数据如下:v病病 人人X X1 1:n=14;n=14;10.05 18.75 18.99 15.94 13.96 17.67 20.51 10.05 18.75 18.99 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.6017.22
19、14.69 15.10 9.42 8.21 7.24 24.60v健康人健康人X X2 2:n=11;n=11;17.95 30.46 10.88 22.38 12.89 23.01 17.95 30.46 10.88 22.38 12.89 23.01 13.89 19.40 15.83 26.72 17.29 13.89 19.40 15.83 26.72 17.29 35(1)建立检验假设)建立检验假设H0:12,即病人与健康人的尿中即病人与健康人的尿中17酮类固醇的酮类固醇的排出量相同排出量相同H1:12,即病人与健康人的尿中即病人与健康人的尿中17酮类固醇的酮类固醇的排出量不同排出量
20、不同0.05(2)计算)计算t值值S1=5.02n1=14S2=6.01n2=113637(3 3)确定)确定P P值值 作出推断结论作出推断结论 =14+11-2=23 =14+11-2=23,查查t t界值表,得界值表,得t t0.05/2,230.05/2,23=2.069,=2.069,现现t=1.8035t=1.8035P0.050.05。按按=0.05=0.05水水准,不拒绝准,不拒绝H H0 0,差异无统计学意义。差异无统计学意义。结结论论:尚尚不不能能认认为为慢慢性性支支气气管管炎炎病病人人与与健健康康人人的的尿尿中中1717酮酮类固醇的排出量不同。类固醇的排出量不同。38v例
21、题例题7-4某妇产医院的研究者欲探索孕妇在孕期补充钙制某妇产医院的研究者欲探索孕妇在孕期补充钙制剂对血清骨钙素的影响,选取孕妇的年龄、基础骨钙素接剂对血清骨钙素的影响,选取孕妇的年龄、基础骨钙素接近、孕周在近、孕周在26-28周的周的30名孕妇,随机分成两组,每组名孕妇,随机分成两组,每组15人,实验组孕妇补充选定的某种钙制剂,对照组孕妇人,实验组孕妇补充选定的某种钙制剂,对照组孕妇采用传统膳食,产后采用传统膳食,产后40-50天内测定两组孕妇血清骨钙天内测定两组孕妇血清骨钙素的改变值(产后骨钙素与产前骨钙素的差值),问孕期素的改变值(产后骨钙素与产前骨钙素的差值),问孕期补钙和传统膳食的产妇
22、骨钙素改变值的总体均数有无差异补钙和传统膳食的产妇骨钙素改变值的总体均数有无差异?39实验组:实验组:10.28.910.19.2-0.810.66.511.29.38.010.79.512.714.411.9对照组:对照组:5.06.7-1.44.07.1-0.62.84.33.75.84.66.04.15.14.7(1)建立检验假设)建立检验假设 H0:12 H1:120.05(2)t=4.988=15+15-2=28(3)t0.001/2,28=3.674tt0.001/2,28Pt0.05/2,14 PF0.05/2,(11,11)P100时。对于后者,时。对于后者,是因为是因为n较大
23、,较大,也较大,则也较大,则t分布很接近分布很接近z分布的分布的缘故。缘故。48z z 值的计算公式为:值的计算公式为:总体标准差总体标准差已知已知时,不管时,不管n n的大小。的大小。总体标准差总体标准差未知未知时,但时,但n100n100时。时。49例例3.4 某托儿所三年来测得某托儿所三年来测得2124月龄的月龄的47名男名男婴平均体重婴平均体重11kg。查得近期全国九城市城区大量查得近期全国九城市城区大量调查的同龄男婴平均体重调查的同龄男婴平均体重11.18kg,标准差为标准差为1.23kg。问该托儿所男婴的体重发育状况与全国九问该托儿所男婴的体重发育状况与全国九城市的同期水平有无不同
24、?(全国九城市的调查结城市的同期水平有无不同?(全国九城市的调查结果可作为总体指标)果可作为总体指标)实实 例例50v(1 1)建立检验假设)建立检验假设 vH H0 0:0 0 ,即即该该托托儿儿所所男男婴婴的的体体重重发发育育状状况况与与全全国九城市的同期水平相同,国九城市的同期水平相同,vH H1 1:0 0 ,即即该该托托儿儿所所男男婴婴的的体体重重发发育育状状况况与与全全国九城市的同期水平不同。国九城市的同期水平不同。v 0.05(0.05(双侧双侧)v(2 2)计计算算z z值值 本本例例因因总总体体标标准准差差已已知知,故故可可用用z z检检验。验。v本本例例n n=47,=47
25、,样样本本均均数数=11,=11,总总体体均均数数=11.18,=11.18,总总体体标标准准差差=1.23,=1.23,51vv(3 3 3 3)确定)确定)确定)确定P P P P值,作出推断结论值,作出推断结论值,作出推断结论值,作出推断结论 查查查查z z z z界值表(附表界值表(附表界值表(附表界值表(附表2,2,2,2,t t t t界值表中为界值表中为界值表中为界值表中为一行),得一行),得一行),得一行),得u u u u0.050.050.050.05=1.96=1.96=1.96=1.96,z=1.003z=1.003z=1.003z=1.003 0.050.050.05
26、0.05。按。按。按。按=0.05=0.05=0.05=0.05水准,不拒绝水准,不拒绝水准,不拒绝水准,不拒绝H H H H0 0 0 0,差异无统计学差异无统计学差异无统计学差异无统计学意义。意义。意义。意义。vv结论:可认为该托儿所男婴的体重发育状况与全国九结论:可认为该托儿所男婴的体重发育状况与全国九结论:可认为该托儿所男婴的体重发育状况与全国九结论:可认为该托儿所男婴的体重发育状况与全国九城市的同期水平相同。城市的同期水平相同。城市的同期水平相同。城市的同期水平相同。52两独立样本资料的两独立样本资料的Z检验检验v该该检检验验也也称称为为独独立立样样本本u检检验验(independe
27、ntsampleu-test)v适用于两样本含量较大(如适用于两样本含量较大(如n150且且n250)时)时53实例实例 例例3.5 3.5 测得某地测得某地20202424岁健康女子岁健康女子100100人收缩人收缩压均数为压均数为15.27kPa15.27kPa,标准差为标准差为1.16kPa1.16kPa;又测得又测得该地该地20202424岁健康男子岁健康男子100100人收缩压均数为人收缩压均数为16.11kPa16.11kPa,标准差为标准差为1.41kPa1.41kPa。问该地问该地20202424岁岁健康女子和男子之间收缩压均数有无差别?健康女子和男子之间收缩压均数有无差别?5
28、4(1)建立检验假设建立检验假设H0:12,即该地即该地2024岁健康女子和男子之间岁健康女子和男子之间收缩压均数相同;收缩压均数相同;H1:12,即该地即该地2024岁健康女子和男子之间岁健康女子和男子之间收缩压均数不同。收缩压均数不同。0.05(双侧)双侧)(2)计算)计算z值值本例本例n1=100,1=15.27,S1=1.16n2=100,2=16.11,S2=1.4155(3 3)确定)确定P P值,作出推断结论值,作出推断结论 查查t t界值表(附表界值表(附表2,2,t t界值表中为界值表中为一行),一行),得得z z0.05/20.05/2=1.96=1.96,现现u u u
29、u0.05/20.05/2=1.96,=1.96,故故PP0.050.05。按水准按水准=0.05=0.05,拒绝拒绝H H0 0,接受接受H H1 1,差异有统计差异有统计学意义。学意义。结论结论:可认为该地:可认为该地20202424岁健康人的收缩压均数岁健康人的收缩压均数男性高于女性。男性高于女性。56Poisson 分布资料的分布资料的Z检验检验常用的方法有两种。常用的方法有两种。直直接接计计算算概概率率法法:与与二二项项分分布布的的计计算算思思 路路 基基 本本 相相 同同。即即 当当 2020时时,按按PoissonPoisson分布直接计算概率值。分布直接计算概率值。正正态态近近
30、似似法法:当当2020时时,PoissonPoisson分分布布接接近近正正态态分分布布。按按正正态态分分布布使使用用z z检检验验处理资料。处理资料。57单样本资料的单样本资料的z检验检验例例题题根根据据医医院院消消毒毒卫卫生生标标准准,细细菌菌总总数数按按每每立立方方米米菌菌落落形形成成单单位位(CFUm3)表表示示。无无菌菌间间的的卫卫生生标标准准为为细细菌菌菌菌落落数数应应不不大大于于200(CFUm3)。某某医医院院引引进进三三氧氧消消毒毒机机,每每天天自自动动对对无无菌菌间间进进行行2小小时时消消毒毒。对对无无菌菌间间抽抽样样调调查查显显示示,细细菌菌总总数数为为121CFUm3。
31、试试问问该该医医院院无无菌间的细菌总数低于国家卫生标准。菌间的细菌总数低于国家卫生标准。58q(1)建立检验假设建立检验假设H0:无菌间的细菌总数符合国家卫生标准,无菌间的细菌总数符合国家卫生标准,=0=200H1:无菌间的细菌总数低于国家卫生标准,无菌间的细菌总数低于国家卫生标准,u0.0005,故故P0.0005。推断结论推断结论 因因P0.0005,拒绝拒绝H0,接受接受H1,差异有统计学意差异有统计学意义。可以认为该医院无菌间的细菌总数低于国家卫义。可以认为该医院无菌间的细菌总数低于国家卫生标准。生标准。看教材例题看教材例题7-860两独立样本资料的两独立样本资料的z检验检验q 应用条
32、件要求资料服从应用条件要求资料服从PoissonPoisson分布,两个分布,两个样本均数样本均数X X1 1及及X X2 2均大于均大于2020。q1 1 两样本观察单元相同两样本观察单元相同 观察单元可以指单观察单元可以指单位面积、容积、体积、时间等。位面积、容积、体积、时间等。q 注意:注意:PoissonPoisson分布中的观察单元具有可分布中的观察单元具有可加性,如加性,如X X1 1和和X X2 2。检验公式为:检验公式为:612两两样样本本观观察察单单元元不不同同当当两两样样本本观观察察单单元元不不同同时时,不不可可直直接接比比较较或或直直接接相相加加后后进进行行比比较较。可可
33、以以将将两两样样本本观观察察单单元元先先转转化化为为相相等等的的观观察察单单元后,再应用公式进行比较。元后,再应用公式进行比较。q一般可计算两样本均数和,再按下式计算一般可计算两样本均数和,再按下式计算z值。值。62观察单位相等时观察单位相等时例例7.12 7.12 调调查查20022002年年某某地地区区人人群群死死亡亡状状况况。结结果果显显示示,男男性性及及女女性性的的意意外外死死亡亡率率分分别别为为5151人人1010万万人人和和2323人人1010万万人人。试试分分析析男男女女意意外外死死亡亡率有无差异。率有无差异。分分析析:该该资资料料服服从从PoissonPoisson分分布布,每
34、每1010万万人人可以作为一个观察单元可以作为一个观察单元。(1 1)建立检验假设)建立检验假设 H H0 0:男女意外死亡率相等,男女意外死亡率相等,H H1 1:男女意外死亡率不相等,男女意外死亡率不相等,=0.05 =0.0563(3(3)确定)确定P P值,推断结论值,推断结论 本例本例z z=3.2549,=3.2549,大于大于u u0.01/20.01/2=2.58,=2.58,则则P P0.01如区间中含有另一个样本均数,则P一、置信区间具有假设检验的功能一、置信区间具有假设检验的功能71区间中含有0,则P如区间中含有0,则P72置信区间可提供假设检验没有提供的信息置信区间可提
35、供假设检验没有提供的信息73假设检验比置信区间多提供的信息假设检验比置信区间多提供的信息v假设检验可以提供确切的假设检验可以提供确切的p值,或提供一个值,或提供一个p值得值得范围。在不拒绝范围。在不拒绝H0的情况小,假设检验可以对检的情况小,假设检验可以对检验的功效做出估计。验的功效做出估计。74假设检验的功效假设检验的功效v一、检验假设的两类错误一、检验假设的两类错误vP不拒绝不拒绝H0有可能犯有可能犯假阴性错误假阴性错误75H0和和1的不同分布图的不同分布图76假阳性错误 第一类错误 统计推断拒绝了实际上成立的H0 又叫“弃真”错误假阴性错误 第二类错误 统计推断不拒绝实际上不成立的H0
36、又称“存伪”错误77二、检验假设的功效二、检验假设的功效1-检验功效:即当研究的总体与检验功效:即当研究的总体与H0却有差别时,却有差别时,按检验水准按检验水准的水平能够拒绝的水平能够拒绝H0、接受、接受H1的概率。的概率。同一检验水准同一检验水准,检验功效大的检验方法比较好。,检验功效大的检验方法比较好。78v单样本设计资料单样本设计资料t检验的功检验的功效效求出Z后,反查标准正态分布表(z分布表),确定,求出1-教材例题7-11 查z分布表 -1.045对应的上端面积=0.8531,1-=0.146979v两独立样本资料两独立样本资料t检验的功效检验的功效80进行假设检验应注意的问题进行假
37、设检验应注意的问题v做假设检验之前,应注意资料本身是否有可比性。做假设检验之前,应注意资料本身是否有可比性。v当当差差别别有有统统计计学学意意义义时时应应注注意意这这样样的的差差别别在在实实际际应应用中有无意义。用中有无意义。v根据资料类型和特点选用正确的假设检验方法。根据资料类型和特点选用正确的假设检验方法。v根据专业及经验确定是选用单侧检验还是双侧检验。根据专业及经验确定是选用单侧检验还是双侧检验。81进行假设检验应注意的问题进行假设检验应注意的问题v当当检检验验结结果果为为拒拒绝绝无无效效假假设设时时,应应注注意意有有发发生生I I类类错错误误的的可可能能性性,即即错错误误地地拒拒绝绝了
38、了本本身身成成立立的的H0H0,发发生生这这种种错错误误的的可可能能性性预先是知道的,即检验水准那么大;预先是知道的,即检验水准那么大;v当当检检验验结结果果为为不不拒拒绝绝无无效效假假设设时时,应应注注意意有有发发生生IIII类类错错误误的的可可能能性性,即即仍仍有有可可能能错错误误地地接接受受了了本本身身就就不不成成立立的的H0H0,发发生生这这种种错错误误的的可可能能性性预预先先是是不不知知道道的的,但但与与样样本本含含量量和和I I类类错错误误的大小有关系。的大小有关系。82进行假设检验应注意的问题进行假设检验应注意的问题v判判断断结结论论时时不不能能绝绝对对化化,应应注注意意无无论论
39、接接受受或或拒拒绝绝检检验假设,都有判断错误的可能性。验假设,都有判断错误的可能性。v报报告告结结论论时时是是应应注注意意说说明明所所用用的的统统计计量量,检检验验的的单单双侧及双侧及P P值的确切范围值的确切范围。83正态性检验正态性检验v一、图示法一、图示法P-P图(图(proportion-proportionplot)以累积频率为单位以累积频率为单位84vQ-Q图图quantile-quantileplot),分位图数),分位图数以以Px为单位为单位85二、统计检验法二、统计检验法1、W检验检验(S.S.ShapiroandM.B.Wilk)提出提出的假设检验方法。的假设检验方法。2、
40、D检验,与检验,与W检验类似,大样本时用。检验类似,大样本时用。86v3 3、矩法:分别检验分布的偏度、矩法:分别检验分布的偏度(Skewness)和峰度(和峰度(kurtosis),用,用z z检验方法,检验方法,Z ZSKEWSKEW为偏为偏度检验;度检验;Z ZKURTKURT为峰度检验。为峰度检验。v矩法的假设检验矩法的假设检验H0:分布为正态分布,不拒绝:分布为正态分布,不拒绝H0的检验结果,就是正态分布;拒绝的检验结果,就是正态分布;拒绝H0分布为非正分布为非正态分布。态分布。87SAS程序程序单样本均数的单样本均数的t检验检验(教材教材P103,例题例题7-1)Dataprg7_
41、1;N=36;S_m=14.3;P_m=14.1;Std=5.08;Df=n-1;T=(s_m-p_m)/(std/sqrt(n);p=(1-probt(abs(t),df)*2;Procprint;Vartp;Run;888990配对设计资料配对设计资料t检验检验DATAprg7_2;INPUTnox1x2;d=x2-x1;CARDS;10.94 0.9221.02 1.0131.14 1.1141.23 1.2251.31 1.3261.41 1.4271.53 1.5181.61 1.6191.72 1.7210 1.81 1.8211 1.93 1.9312 2.02 2.04;PRO
42、CMEANSNMEANSTDERRTPRT;VARd;TITLEpaired-comparisonsttest;RUN;919293两独立样本资料的两独立样本资料的t检验检验9495正态性检验正态性检验96979899Poisson分布单样本的分布单样本的z检验检验Dataprg7_8;N=77755;X=23;Pai=0.00025;Lam=n*pai;Z=(x-lam)/sqrt(lam);P=1-probnorm(abs(z);Procprint;Varlamzp;Run;100101102dataprg7_9;x1=53;x2=23;z=abs(x1-x2)/sqrt(x1+x2);p
43、=(1-probnorm(z)*2;procprint;varzp;run;Poisson 分布两样本分布两样本z检验检验(观察单位相同时观察单位相同时)103104105Poisson 分布两样本分布两样本z检验检验(观察单位相同时观察单位相同时)dataprg7_10;x1=34.33;x2=21.5;N1=3;N2=2;z=abs(x1-x2)/sqrt(x1/n1+x2/n2);p=(1-probnorm(z)*2;procprint;varzp;run;106107108思考题思考题v假设检验是依据样本信息对总体信息进行推断的统计学方法,假设检验是依据样本信息对总体信息进行推断的统计学方法,是在对研究总体两种对立的判断之间做出选择的决策程序。是在对研究总体两种对立的判断之间做出选择的决策程序。v假设检验的基本步骤。假设检验的基本步骤。v假设检验的基本逻辑假设检验的基本逻辑v假设检验的两类错误假设检验的两类错误v假设检验与置信区间估计的关系假设检验与置信区间估计的关系v选择假设检验方法的条件,各种假设检验方法选择假设检验方法的条件,各种假设检验方法v假设检验的功效估计假设检验的功效估计109
限制150内