《假设检验的概念及t精.ppt》由会员分享,可在线阅读,更多相关《假设检验的概念及t精.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、假设检验的概念及t第1页,本讲稿共40页总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参 数数数数 统计推断统计推断统计推断统计推断 statistical inferencestatistical inference如:样本均数如:样本均数 样本标准差样本标准差S 样本率样本率 P如:总体均数如:总体均数 总体标准差总体标准差 总体率总体率内容:内容:1.参数估计参数估计(estimation of parameters)包括:点估计与包括:点估计与区间估计区间估计2.假设检验假设检验(test of hypothesis)第2页,本讲稿共40页实例实例
2、通过以往大规模调查,已知某地一般新生通过以往大规模调查,已知某地一般新生儿的头围均数为儿的头围均数为34.50cm。为研究某矿区。为研究某矿区新生儿的发育状况,现从该地某矿区随机新生儿的发育状况,现从该地某矿区随机抽取新生儿抽取新生儿55人,测得其头围均数为人,测得其头围均数为33.89cm,问该矿区新生儿的头围总体均,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?数与一般新生儿头围总体均数是否不同?第3页,本讲稿共40页假设检验的步骤及有关概念假设检验的步骤及有关概念总体间差异:总体间差异:1.1.个体差异,抽样误差所致;个体差异,抽样误差所致;2.2.总体间固有差异总体间固
3、有差异 判断差别属于哪一种情况的统计学检验,就是假设检验判断差别属于哪一种情况的统计学检验,就是假设检验。小概率思想小概率思想:P P0.050.05(或或P P0.01(0.05)(0.05)样本差别无统计学意义样本差别无统计学意义假设检验(test of hypothesistest of hypothesis):,事先对总体的特征作出某种假设,通过分析样本数据,判断该样本信息是否支持这种假设,最后作出拒绝或不拒绝这种假设的取舍抉择。此方法称作假设检验。第4页,本讲稿共40页1 1、建立假设与确定检验水准(、建立假设与确定检验水准()H H0 0:1 12 2 无效假设(无效假设(null
4、 hypothesisnull hypothesis)H H1 1:1 12 2 备择假设(备择假设(alternative hypothesisalternative hypothesis)检验水准(检验水准(level of a testlevel of a test):):=0.05(=0.05(双侧双侧)2 2、选定方法和计算统计量:、选定方法和计算统计量:根据统计推断目的、设计、资料组数、样本含量、等选择方根据统计推断目的、设计、资料组数、样本含量、等选择方法。如两组小样本比较用法。如两组小样本比较用t t检验、大样本比较检验、大样本比较u u检验、方差齐检验、方差齐性检验用性检验用
5、F F检验。检验。3 3、确定、确定P P值,作出判断值,作出判断 P P(0.05)(0.05)样本差别有统计学意义;样本差别有统计学意义;P P(0.05)(0.05)样本差别无统计学意义样本差别无统计学意义P值:值:指在指在H0成立的假设前提下,出现当前检验统计量成立的假设前提下,出现当前检验统计量以及更极端情况的概率。以及更极端情况的概率。假设检验的步骤假设检验的步骤 第5页,本讲稿共40页1.差异来源差异来源 该矿区新生儿总体均数与一般新生儿头围总体均数该矿区新生儿总体均数与一般新生儿头围总体均数相同相同 该矿区新生儿总体均数与一般新生儿头围总体均数该矿区新生儿总体均数与一般新生儿头
6、围总体均数不同不同 H0:=034.50 ,H1:034.50 单凭一份样本不可能证明哪一个正确,可考虑样单凭一份样本不可能证明哪一个正确,可考虑样本资料和哪一个假设有较大的矛盾来决定拒绝哪一本资料和哪一个假设有较大的矛盾来决定拒绝哪一个假设。一般考察样本资料是否与个假设。一般考察样本资料是否与H0有较大的矛盾有较大的矛盾分析思路第6页,本讲稿共40页2.H0成立时会怎样?成立时会怎样?所得所得u值因样本而异,值因样本而异,但其绝对值多数情况下落在但其绝对值多数情况下落在0 0附近。附近。u的的分布规律可由分布规律可由u界值表查出界值表查出3.当前状况如何,发生的可能性(当前状况如何,发生的可
7、能性(P值)有值)有多大?多大?n=55,=33.89,n=55,=33.89,0 0=34.50=34.50 得得u=-2.273u=-2.273第7页,本讲稿共40页 拒绝域拒绝域 接受域接受域 拒绝域拒绝域 第8页,本讲稿共40页 P值值系指在系指在H0成立的假设前提下,出现当成立的假设前提下,出现当前检验统计量以及更极端情况的概率。前检验统计量以及更极端情况的概率。查查u界值表,当前界值表,当前u值以外的双侧尾部面积值以外的双侧尾部面积 介于介于0.05和和0.02之间之间4.决策决策 决策者需要事先规定一个可以忽略的决策者需要事先规定一个可以忽略的小概率值小概率值。如取。如取0.05
8、,那么上述,那么上述P值可认值可认为很小。即为很小。即H0成立时,几乎不可能出现当成立时,几乎不可能出现当前的状况。前的状况。第9页,本讲稿共40页 于是,面临两种抉择,一是认为于是,面临两种抉择,一是认为H0是成立的,是成立的,而当前的极端情况又恰好偶然发生了;二是而当前的极端情况又恰好偶然发生了;二是怀疑怀疑H0的正确性,从而接受的正确性,从而接受H1。通常选择后。通常选择后者。本例,可认为该矿区新生儿总体均数与者。本例,可认为该矿区新生儿总体均数与一般新生儿头围总体均数不同。一般新生儿头围总体均数不同。第10页,本讲稿共40页例例8-2:1995年,某地年,某地20岁应征男青年平岁应征男
9、青年平均身高为均身高为168.5cm。2003年在当地年在当地20岁岁应征男青年中随机抽取应征男青年中随机抽取85人,平均身高人,平均身高为为171.2cm,标准差为,标准差为5.3cm,问这两年,问这两年身高是否不同。身高是否不同。解:解:总体方差一般未知,当样本含量足够总体方差一般未知,当样本含量足够大时,用大时,用S作为作为 的估计值。的估计值。1 1 建立假设,确定检验水准建立假设,确定检验水准 H0:168.5,H1:168.5 168.5 0.050.05第11页,本讲稿共40页2 2 计算统计量计算统计量u u3 确定P值,下结论 查查u界值表,界值表,4.70 u 0.001/
10、2=3.2905,得得P u 0.001/2=3.2905,得得P 0.001,按照按照 0.05水准,拒绝水准,拒绝H0,接,接受受H1,可认为试验组和对照组退热天数的,可认为试验组和对照组退热天数的总体均数不等,疗效不同。试验组比对照总体均数不等,疗效不同。试验组比对照组平均退热天数短。组平均退热天数短。1 1-2 2 的的95可信区间为可信区间为-3.3-1.3天天第14页,本讲稿共40页 型错误和型错误和型错误型错误 由样本推断的结果由样本推断的结果 真实结果真实结果 拒绝拒绝H H0 0 不拒绝不拒绝H H0 0 H H0 0成立成立 型错误型错误 a a 推断正确推断正确(1(1a
11、 a )H H0 0不成立不成立 推断正确(推断正确(1 1b b)型错误型错误b b(1 1b b)即即把握度把握度(power of a test):power of a test):两总体确两总体确有差别,被检出有差别的能力有差别,被检出有差别的能力(1 1a a)即即可信度可信度(confidence level):confidence level):重复抽样重复抽样时,样本区间包含总体参数(时,样本区间包含总体参数(m m)的百分数的百分数第15页,本讲稿共40页 对于一般的假设检验,对于一般的假设检验,a a定定为为0.050.05(或或0.010.01),b b的的大大小小取取决
12、决于于H H1 1。通通常常情情况况下下,比比较较总总体体间间有有无无差差异异并并不不知知道道,即即H H1 1不不明明确确,b b值值的的大大小小无无法法确确定定,也也就就是是说说,对对于于一一般般的的假假设设检检验验,我们并不知道犯我们并不知道犯型错误的概率型错误的概率b b有多大有多大。通常情况下通常情况下型错误未知型错误未知第16页,本讲稿共40页第17页,本讲稿共40页a ab b减少(增加)减少(增加)I型错误型错误,将会,将会增加(减少)增加(减少)II型错误型错误增大增大n 同时降低同时降低a a 与与 b b a a 与与 b b 间的关系间的关系第18页,本讲稿共40页 假
13、设检验注意事项假设检验注意事项(1 1)可比性)可比性(随机性抽样、分组,资料具有均衡性和可比随机性抽样、分组,资料具有均衡性和可比性性)(2 2)正确选用假设检验方法)正确选用假设检验方法(3 3)“差别差别”的实际意义的实际意义(正确理解差别有统计学意义的正确理解差别有统计学意义的涵义。涵义。有统计学意义指:样本来自不同的总体,而并非指差别很大,不能说明差别的大小.当专业上和统计学当专业上和统计学上都有上都有“显著性意义显著性意义”时,才有实用价值。时,才有实用价值。)第19页,本讲稿共40页假设检验注意事项假设检验注意事项(4(4)判断结论时不能绝对化)判断结论时不能绝对化(原因是存在着
14、两类错误原因是存在着两类错误 写出精确写出精确P P值:若对同一研究内容,值:若对同一研究内容,A A研究的结果研究的结果P=0.002,BP=0.002,B研究研究的结果的结果P=0.04,P=0.04,虽结果均为拒绝虽结果均为拒绝H0,H0,但但A A结果更为可信结果更为可信.(5 5)单侧检验与双侧检验)单侧检验与双侧检验(6 6)报告结果应写出统计量值、具体)报告结果应写出统计量值、具体P P值(单侧时应注明);值(单侧时应注明);9595CICI既能说明差别的大小,也具有检验的作用,建议使用既能说明差别的大小,也具有检验的作用,建议使用。(可信可信区间与假设检验均为统计推断方法,可信
15、区间可以检验差值大小,区间与假设检验均为统计推断方法,可信区间可以检验差值大小,假设检验可精确表示相关事件的概率。统计结果同时报告检验统假设检验可精确表示相关事件的概率。统计结果同时报告检验统计量、计量、P P值和可信区间更值得提倡。值和可信区间更值得提倡。)第20页,本讲稿共40页第十章第十章 t t检验(检验(t t test test)t t检验,亦称检验,亦称studentstudent t t检验(检验(StudentStudents s t t test test),),主要用于样本含量较小(主要用于样本含量较小(例如n30n30),),总体标准差总体标准差未知的正态分布资料。未知
16、的正态分布资料。一、样本均数与总体均数的比较一、样本均数与总体均数的比较二、配对资料的比较二、配对资料的比较三、两三、两样本均数的比较样本均数的比较四、两方差齐性检验四、两方差齐性检验第21页,本讲稿共40页一、样本均数与总体均数的比较一、样本均数与总体均数的比较 推断样本所代表的未知总体均数推断样本所代表的未知总体均数与已知与已知总体均数总体均数0 0有无差别。有无差别。已知总体均数已知总体均数0 0一般为理论值、标准值一般为理论值、标准值或经大量观察所得的稳定值。或经大量观察所得的稳定值。统计量统计量t t的计算公式:的计算公式:第22页,本讲稿共40页实实 例例第23页,本讲稿共40页附
17、表附表2 2 t t界值表界值表第24页,本讲稿共40页二、配对资料的比较二、配对资料的比较 两种情况两种情况:1.1.随机配对设计随机配对设计(randomized randomized paired design)paired design)是将受试对象按某些混杂因素(如性是将受试对象按某些混杂因素(如性别、年龄、窝别等)别、年龄、窝别等)配成对子配成对子,每对中的两个个体随,每对中的两个个体随机分配给两种处理(如处理组与对照组);机分配给两种处理(如处理组与对照组);2.2.或者或者同同一受试对象一受试对象作两次不同的处理作两次不同的处理(自身对照自身对照)。优点优点:配对设计:配对设计
18、减少了个体差异减少了个体差异。特点:特点:资料成对,每对数据不可拆分。资料成对,每对数据不可拆分。第25页,本讲稿共40页表表3-4 3-4 两法测定两法测定1212份尿铅含量的结果份尿铅含量的结果第26页,本讲稿共40页表表3-3 两法测定两法测定12份尿铅含量的结果份尿铅含量的结果第27页,本讲稿共40页三、两样本均数的比较三、两样本均数的比较 完全随机设计完全随机设计(completely random design)completely random design):把受试把受试对象完全随机分为两组,分别给予不同处理,然后比较独对象完全随机分为两组,分别给予不同处理,然后比较独立的两组
19、样本均数。各组对象数不必严格相同。立的两组样本均数。各组对象数不必严格相同。目的目的:比较两总体均数是否相同。比较两总体均数是否相同。条件:假定资料来自正态总体,条件:假定资料来自正态总体,1 12 2=2 22 2计算公式:计算公式:其中,均数差的标准误其中,均数差的标准误 第28页,本讲稿共40页实实 例例第29页,本讲稿共40页2.方差齐性检验方差齐性检验Ylog(X+a)Y Y Y Y 第30页,本讲稿共40页方差齐性检验方差齐性检验第31页,本讲稿共40页t检验的类型检验的类型样本均数与总体均数比较的t检验(单组设计)(one sample t test)配对设计定量资料的t检验 (
20、paired t-test)成组设计定量资料的t检验 (two sample t test)小小 结结第32页,本讲稿共40页三个概念 1 独立性:指一批实验数据彼此之间是互相独立的。例如测得不同学生的身高、不同学生的考试成绩。2 正态性:是指每个影响因素各水平组的定量资料来自于正态或近似正态分布的总体。3 方差齐性:指每个影响因素各水平组的总体方差应当相等。第33页,本讲稿共40页一一 单组设计的特点及应满足的前提条件单组设计的特点及应满足的前提条件1 设计特点:对一组同质的受试对象不按任何其它因素分组,直接观测或给予一种特定处理后观测这些受试对象某种或多种指标的取值。2 已知总体均数总体均
21、数0 0一般为理论值、标准值或经大量观察所得的稳定值。3 前提条件:样本数据满足正态或近似正态分布。4 统计量的计算:第34页,本讲稿共40页二 配对设计的特点及应满足的前提条件1 设计特点:设计特点:A 随机配对设计随机配对设计(randomized paired(randomized paired design)design)是将受试对象按某些混杂因素(如性别、年龄、窝是将受试对象按某些混杂因素(如性别、年龄、窝别等)配成对子,每对中的两个个体随机分配给两种处理别等)配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组(如处理组与对照组););B.B.或者同一受试对象作两次不或者
22、同一受试对象作两次不同的处理同的处理(自身对照自身对照)。优点:优点:配对设计减少了个体差配对设计减少了个体差异。异。资料成对,每对数据不可拆分。资料成对,每对数据不可拆分。2 前提条件:成对数据间的差值满足正态或近似正态分布。3 统计量的计算:第35页,本讲稿共40页三 成组设计的特点及资料应满足的前提条件1 设计特点:设计特点:完全随机设计完全随机设计(completely random(completely random design)design):把受试对象完全随机分为两组,分别给予不:把受试对象完全随机分为两组,分别给予不同处理,然后比较两组样本均数。两组数据是独立的,同处理,然后
23、比较两组样本均数。两组数据是独立的,两组对象数不必严格相同。两组对象数不必严格相同。2 前提条件:两组数据间是互相独立的、两组数据分别服从正态或近似正态分布、两组资料所对应的总体方差相等。3 统计量的计算:第36页,本讲稿共40页五、资料不满足正态与方差齐时进行检验之对策1 对数变换:常用于数据呈正偏态分布,较小数据多,较大数据少。2 平方根变换:常用于服从Poisson分布的资料,算术均数=方差。3 倒数变换:常用在数据呈极严重的正偏态分布,变换后可使特大数据变小,资料近似正态。对策对策第37页,本讲稿共40页五、资料不满足正态与方差齐时进行检验之对策4平方根反正弦 常用于百分率数据(如白血
24、病患者的淋巴细胞转化率,脑电图波的变化率等)5当数据有负数时,作对数或平方根变换可对原始数据相加一个常数使其变为正数。6 6近似近似t检验检验(separate variance estimation t-test)t检验检验7 7非参数检验非参数检验-秩和检验秩和检验对策对策第38页,本讲稿共40页 两两均均数数比比较较样本与总体样本与总体 单样本单样本t检验检验配对配对配对配对t检验检验方差齐性方差齐性 变量变化变量变化两两样样本本 t检验检验两样本两样本t检验检验非配对非配对 不齐不齐齐齐差值呈正态差值呈正态秩和检验秩和检验指标呈正态指标呈正态分析思分析思路路第39页,本讲稿共40页讨论
25、题1 要要比比较较一一组组肺肺结结核核病病人人治治疗疗前前后后的的淋淋巴巴细细胞胞与与白白细细胞胞总总数数的的百百分分比,以评价治疗效果,可用(比,以评价治疗效果,可用()A 2检验检验 B t检验检验 C 配对配对 2检验检验 D 配对配对t检验检验 2 对两样本均数进行假设检验时,对两样本均数进行假设检验时,P值越小,说明(值越小,说明()A 两总体均数有差别的可能性越大两总体均数有差别的可能性越大 B 两总体均数有差别的可能性越小两总体均数有差别的可能性越小 C 两总体均数相差越大两总体均数相差越大 D 两总体均数越小两总体均数越小3 3 两两组组数数据据中中的的每每个个变变量量值值减减同同一一常常数数后后做做两两个个均均数数差差别别的的t t 检检验(验()A tA t值不变值不变 B tB t值变小值变小 C tC t值变大值变大 D tD t值不能确定值不能确定第40页,本讲稿共40页
限制150内