假设检验的概念及.ppt
第八章 假设检验的概念及t检验 总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参 数数数数 统计推断统计推断统计推断统计推断 statistical inferencestatistical inference如:样本均数如:样本均数样本标准差样本标准差S样本率样本率P如:总体均数如:总体均数总体标准差总体标准差总体率总体率内容:内容:1.参数估计参数估计(estimationofparameters)2.包括:点估包括:点估计与区间估计计与区间估计3.2.假设检验假设检验(testofhypothesis)实例实例通过以往大规模调查,已知某地一般新生通过以往大规模调查,已知某地一般新生儿的头围均数为儿的头围均数为34.50cm。为研究某矿区为研究某矿区新生儿的发育状况,现从该地某矿区随机新生儿的发育状况,现从该地某矿区随机抽取新生儿抽取新生儿55人,测得其头围均数为人,测得其头围均数为33.89cm,问该矿区新生儿的头围总体均问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?数与一般新生儿头围总体均数是否不同?假设检验的步骤及有关概念假设检验的步骤及有关概念总体间差异:总体间差异:1.1.个体差异,抽样误差所致;个体差异,抽样误差所致;2.2.总体间固有差异总体间固有差异 判断差别属于哪一种情况的统计学检验,就是判断差别属于哪一种情况的统计学检验,就是假设检验假设检验。小概率思想小概率思想:P P0.050.05(或或P P0.01(0.05)(0.05)样本差别无统样本差别无统计学意义计学意义假设检验(test of hypothesistest of hypothesis):,事先对总体的特征作出某种假设,通过分析样本数据,判断该样本信息是否支持这种假设,最后作出拒绝或不拒绝这种假设的取舍抉择。此方法称作假设检验。1 1、建立假设与确定检验水准(、建立假设与确定检验水准()H H0 0:1 12 2 无效假设(无效假设(null hypothesisnull hypothesis)H H1 1:1 12 2 备择假设(备择假设(alternative hypothesisalternative hypothesis)检验水准(检验水准(level of a testlevel of a test):):=0.05(=0.05(双侧双侧)2 2、选定方法和计算统计量:、选定方法和计算统计量:根据统计推断目的、设计、资料组数、样本含量、等根据统计推断目的、设计、资料组数、样本含量、等选择方法。如两组小样本比较用选择方法。如两组小样本比较用t t检验、大样本比较检验、大样本比较u u检验、方差齐性检验用检验、方差齐性检验用F F检验。检验。3 3、确定、确定P P值,作出判断值,作出判断 P P(0.05)(0.05)样本差别有统计学意义;样本差别有统计学意义;P P(0.05)(0.05)样本差别无统计学意义样本差别无统计学意义P值:值:指在指在H0成立的假设前提下,出现当前检验统计成立的假设前提下,出现当前检验统计量以及更极端情况的概率。量以及更极端情况的概率。假设检验的步骤假设检验的步骤 1.差异来源差异来源该矿区新生儿总体均数与一般新生儿头围总体均该矿区新生儿总体均数与一般新生儿头围总体均数相同数相同该矿区新生儿总体均数与一般新生儿头围总体均该矿区新生儿总体均数与一般新生儿头围总体均数不同数不同H0:=034.50,H1:034.50单凭一份样本不可能证明哪一个正确,可考虑样单凭一份样本不可能证明哪一个正确,可考虑样本资料和哪一个假设有较大的矛盾来决定拒绝哪本资料和哪一个假设有较大的矛盾来决定拒绝哪一个假设。一般考察样本资料是否与一个假设。一般考察样本资料是否与H0有较大的有较大的矛盾矛盾分析思路2.H0成立时会怎样?成立时会怎样?所得所得u值因样本而异,值因样本而异,但其绝对值多数情况下落在但其绝对值多数情况下落在0 0附近。附近。u的的分布规律可由分布规律可由u界值表查出界值表查出3.当前状况如何,发生的可能性(当前状况如何,发生的可能性(P值)有值)有多大?多大?n=55,=33.89,n=55,=33.89,0 0=34.50=34.50 得得u=-2.273u=-2.273 拒绝域拒绝域接受域接受域拒绝域拒绝域P值值系指在系指在H0成立的假设前提下,出现当成立的假设前提下,出现当前检验统计量以及更极端情况的概率。前检验统计量以及更极端情况的概率。查查u界值表,当前界值表,当前u值以外的双侧尾部面积值以外的双侧尾部面积介于介于0.05和和0.02之间之间4.决策决策决策者需要事先规定一个可以忽略的决策者需要事先规定一个可以忽略的小概率值小概率值。如取如取0.05,那么上述,那么上述P值可认值可认为很小。即为很小。即H0成立时,几乎不可能出现当成立时,几乎不可能出现当前的状况。前的状况。于是,面临两种抉择,一是认为于是,面临两种抉择,一是认为H0是成立的,是成立的,而当前的极端情况又恰好偶然发生了;二是而当前的极端情况又恰好偶然发生了;二是怀疑怀疑H0的正确性,从而接受的正确性,从而接受H1。通常选择后通常选择后者。本例,可认为该矿区新生儿总体均数与者。本例,可认为该矿区新生儿总体均数与一般新生儿头围总体均数不同。一般新生儿头围总体均数不同。例例8-2:1995年,某地年,某地20岁应征男青年平岁应征男青年平均身高为均身高为168.5cm。2003年在当地年在当地20岁岁应征男青年中随机抽取应征男青年中随机抽取85人,平均身高人,平均身高为为171.2cm,标准差为标准差为5.3cm,问这两年问这两年身高是否不同。身高是否不同。解:解:总体方差一般未知,当样本含量足够总体方差一般未知,当样本含量足够大时,用大时,用S作为作为 的估计值。的估计值。1 1 建立假设,确定检验水准建立假设,确定检验水准H0:168.5,H1:168.5 168.5 0.050.052 2 计算统计量计算统计量u u3 确定P值,下结论 查查u界值表,界值表,4.70u0.001/2=3.2905,得得Pu0.001/2=3.2905,得得P0.001,按照按照0.05水准,拒绝水准,拒绝H0,接接受受H1,可认为试验组和对照组退热天数的可认为试验组和对照组退热天数的总体均数不等,疗效不同。试验组比对照总体均数不等,疗效不同。试验组比对照组平均退热天数短。组平均退热天数短。1 1-2 2的的95可信区间为可信区间为-3.3-1.3天天 型错误和型错误和型错误型错误 由样本推断的结果由样本推断的结果 真实结果真实结果 拒绝拒绝H H0 0 不拒绝不拒绝H H0 0 H H0 0成立成立 型错误型错误 a a 推断正确推断正确(1(1a a )H H0 0不成立不成立 推断正确(推断正确(1 1b b)型错误型错误b b(1 1b b)即即把握度把握度(power of a test):power of a test):两总体两总体确有差别,被检出有差别的能力确有差别,被检出有差别的能力(1 1a a)即即可信度可信度(confidence level):confidence level):重复重复抽样时,样本区间包含总体参数(抽样时,样本区间包含总体参数(m m)的百分数的百分数 对于一般的假设检验,对于一般的假设检验,a a定定为为0.050.05(或或0.010.01),b b的的大大小小取取决决于于H H1 1。通通常常情情况况下下,比比较较总总体体间间有有无无差差异异并并不不知知道道,即即H H1 1不不明明确确,b b值值的的大大小小无无法法确确定定,也也就就是是说说,对对于于一一般般的的假假设设检检验验,我我们们并并不不知知道道犯犯型型错错误误的的概概率率b b有多大有多大。通常情况下通常情况下型错误未知型错误未知a ab b减少(增加)减少(增加)I型错误型错误,将会,将会增加(减少)增加(减少)II型错误型错误增大增大n 同时降低同时降低a a 与与 b b a a 与与 b b 间的关系间的关系 假设检验注意事项假设检验注意事项(1 1)可比性)可比性(随机性抽样、分组,资料具有均衡性和随机性抽样、分组,资料具有均衡性和可比性可比性)(2 2)正确选用假设检验方法)正确选用假设检验方法(3 3)“差别差别”的实际意义的实际意义(正确理解差别有统计学意正确理解差别有统计学意义的涵义。义的涵义。有统计学意义指:样本来自不同的总体,而并非指差别很大,不能说明差别的大小.当专业上当专业上和统计学上都有和统计学上都有“显著性意义显著性意义”时,才有实用价值。时,才有实用价值。)假设检验注意事项假设检验注意事项(4(4)判断结论时不能绝对化)判断结论时不能绝对化(原因是存在着两类错误原因是存在着两类错误 写出精确写出精确P P值:若对同一研究内容,值:若对同一研究内容,A A研究的结果研究的结果P=0.002,BP=0.002,B研究的结果研究的结果P=0.04,P=0.04,虽结果均为拒绝虽结果均为拒绝H0,H0,但但A A结果结果更为可信更为可信.(5 5)单侧检验与双侧检验)单侧检验与双侧检验(6 6)报告结果应写出统计量值、具体)报告结果应写出统计量值、具体P P值(单侧时应注明);值(单侧时应注明);9595CICI既能说明差别的大小,也具有检验的作用,建议使既能说明差别的大小,也具有检验的作用,建议使用用。(可信区间与假设检验均为统计推断方法,可信区间可信区间与假设检验均为统计推断方法,可信区间可以检验差值大小,假设检验可精确表示相关事件的概率。可以检验差值大小,假设检验可精确表示相关事件的概率。统计结果同时报告检验统计量、统计结果同时报告检验统计量、P P值和可信区间更值得提值和可信区间更值得提倡。倡。)第十章第十章 t t检验(检验(t t test test)t t检验,亦称检验,亦称studentstudent t t检验(检验(Students Students t t testtest),),主要用于样本含量较小(主要用于样本含量较小(例如n30n30),),总体标准差总体标准差未知的正态分布资料。未知的正态分布资料。一、样本均数与总体均数的比较一、样本均数与总体均数的比较二、配对资料的比较二、配对资料的比较三、两三、两样本均数的比较样本均数的比较四、两方差齐性检验四、两方差齐性检验一、样本均数与总体均数的比较一、样本均数与总体均数的比较 推断样本所代表的未知总体均数推断样本所代表的未知总体均数与与已知总体均数已知总体均数0 0有无差别。有无差别。已知总体均数已知总体均数0 0一般为理论值、标准一般为理论值、标准值或经大量观察所得的稳定值。值或经大量观察所得的稳定值。统计量统计量t t的计算公式:的计算公式:实实 例例附表附表2 2 t t界值表界值表二、配对资料的比较二、配对资料的比较 两种情况两种情况:1.1.随机配对设计随机配对设计(randomized randomized paired design)paired design)是将受试对象按某些混杂因素(如性是将受试对象按某些混杂因素(如性别、年龄、窝别等)别、年龄、窝别等)配成对子配成对子,每对中的两个个体随,每对中的两个个体随机分配给两种处理(如处理组与对照组);机分配给两种处理(如处理组与对照组);2.2.或者或者同同一受试对象一受试对象作两次不同的处理作两次不同的处理(自身对照自身对照)。优点优点:配对设计:配对设计减少了个体差异减少了个体差异。特点:特点:资料成对,每对数据不可拆分。资料成对,每对数据不可拆分。表表3-4 3-4 两法测定两法测定1212份尿铅含量的结果份尿铅含量的结果表表3-3 两法测定两法测定12份尿铅含量的结果份尿铅含量的结果三、两样本均数的比较三、两样本均数的比较 完全随机设计完全随机设计(completely random design)completely random design):把受试把受试对象完全随机分为两组,分别给予不同处理,然后比较独对象完全随机分为两组,分别给予不同处理,然后比较独立的两组样本均数。各组对象数不必严格相同。立的两组样本均数。各组对象数不必严格相同。目的目的:比较两总体均数是否相同。比较两总体均数是否相同。条件:假定资料来自正态总体,条件:假定资料来自正态总体,1 12 2=2 22 2计算公式:计算公式:其中,均数差的标准误其中,均数差的标准误 实实 例例2.方差齐性检验方差齐性检验Ylog(X+a)Y Y Y Y 方差齐性检验方差齐性检验t检验的类型检验的类型样本均数与总体均数比较的t检验(单组设计)(one sample t test)配对设计定量资料的t检验 (paired t-test)成组设计定量资料的t检验 (two sample t test)小小 结结三个概念 1 独立性:指一批实验数据彼此之间是互相独立的。例如测得不同学生的身高、不同学生的考试成绩。2 正态性:是指每个影响因素各水平组的定量资料来自于正态或近似正态分布的总体。3 方差齐性:指每个影响因素各水平组的总体方差应当相等。一一 单组设计的特点及应满足的前提条件单组设计的特点及应满足的前提条件1 设计特点:对一组同质的受试对象不按任何其它因素分组,直接观测或给予一种特定处理后观测这些受试对象某种或多种指标的取值。2 已知总体均数总体均数0 0一般为理论值、标准值或经大量观察所得的稳定值。3 前提条件:样本数据满足正态或近似正态分布。4 统计量的计算:二 配对设计的特点及应满足的前提条件1 设计特点:设计特点:A随机配对设计随机配对设计(randomized paired randomized paired design)design)是将受试对象按某些混杂因素(如性别、是将受试对象按某些混杂因素(如性别、年龄、窝别等)配成对子,每对中的两个个体随机年龄、窝别等)配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组分配给两种处理(如处理组与对照组););B.B.或者同或者同一受试对象作两次不同的处理一受试对象作两次不同的处理(自身对照自身对照)。优点:优点:配对设计减少了个体差异。配对设计减少了个体差异。资料成对,每对数据资料成对,每对数据不可拆分。不可拆分。2 前提条件:成对数据间的差值满足正态或近似正态分布。3 统计量的计算:三 成组设计的特点及资料应满足的前提条件1 设计特点:设计特点:完全随机设计完全随机设计(completely random completely random design)design):把受试对象完全随机分为两组,分别给把受试对象完全随机分为两组,分别给予不同处理,然后比较两组样本均数。两组数据是予不同处理,然后比较两组样本均数。两组数据是独立的,两组对象数不必严格相同。独立的,两组对象数不必严格相同。2 前提条件:两组数据间是互相独立的、两组数据分别服从正态或近似正态分布、两组资料所对应的总体方差相等。3 统计量的计算:五、资料不满足正态与方差齐时进行检验之对策1 对数变换:常用于数据呈正偏态分布,较小数据多,较大数据少。2 平方根变换:常用于服从Poisson分布的资料,算术均数=方差。3 倒数变换:常用在数据呈极严重的正偏态分布,变换后可使特大数据变小,资料近似正态。对策对策五、资料不满足正态与方差齐时进行检验之对策4平方根反正弦 常用于百分率数据(如白血病患者的淋巴细胞转化率,脑电图波的变化率等)5当数据有负数时,作对数或平方根变换可对原始数据相加一个常数使其变为正数。6 6近似近似t检验检验(separatevarianceestimationt-test)t检验检验7 7非参数检验非参数检验-秩和检验秩和检验对策对策 两两均均数数比比较较样本与总体样本与总体 单样本单样本t检验检验配对配对配对配对t检验检验方差齐性方差齐性 变量变化变量变化两两样样本本 t检验检验两样本两样本t检验检验非配对非配对 不齐不齐齐齐差值呈正态差值呈正态秩和检验秩和检验指标呈正态指标呈正态分析思分析思 路路讨论题1要要比比较较一一组组肺肺结结核核病病人人治治疗疗前前后后的的淋淋巴巴细细胞胞与与白白细细胞胞总总数数的百分比,以评价治疗效果,可用(的百分比,以评价治疗效果,可用()A 2检验检验Bt检验检验 C配对配对 2检验检验D配对配对t检验检验2对两样本均数进行假设检验时,对两样本均数进行假设检验时,P值越小,说明(值越小,说明()A两总体均数有差别的可能性越大两总体均数有差别的可能性越大B两总体均数有差别的可能性越小两总体均数有差别的可能性越小C两总体均数相差越大两总体均数相差越大 D两总体均数越小两总体均数越小3 3 两两组组数数据据中中的的每每个个变变量量值值减减同同一一常常数数后后做做两两个个均均数数差差别别的的t t 检验(检验()A tA t值不变值不变 B tB t值变小值变小 C tC t值变大值变大 D tD t值不能确定值不能确定