第二章应用统计分析检验.ppt
第二章应用统计分析检验第二章应用统计分析检验现在学习的是第1页,共42页主要内容 假设检验的基本原理,错误,步骤 单样本t检验 独立样本t检验 配对样本的t检验现在学习的是第2页,共42页假设检验 所谓所谓假设检验假设检验,就是事先对总体参数或,就是事先对总体参数或总体分布形式作出一个假设,然后利用总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。从而决定是否接受或否定原假设。现在学习的是第3页,共42页1、假设检验采用的逻辑推理方法是反证法、假设检验采用的逻辑推理方法是反证法 为了检某假设是否成立,先假定它正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设;判断结果合理与否,是基于“小概率事件不易发生”这一原理的 即在一次抽样中,小概率事件不可能发生。如果在原假设下发生了小概率事件,则认为原假设是不合理的;反之,小概率事件没有发生,则认为原假设是合理的。现在学习的是第4页,共42页2、假设检验是基于样本资料来推断总体、假设检验是基于样本资料来推断总体特征的,而这种推断是在一定概率置信特征的,而这种推断是在一定概率置信度下进行的,而非严格的逻辑证明。度下进行的,而非严格的逻辑证明。因此,置信度大小的不同,有可能做出不同的判断。现在学习的是第5页,共42页三、假设检验中的两类错误三、假设检验中的两类错误 由于假设检验是根据有限的样本信息来推断总体特征,由样本的随机性可能致使判断出错。(一)第一类错误 当原假设为真时,而拒绝原假设所犯的错误,称为第I类错误或拒真错误。易知犯第I类错误的概率就是显著性水平 P拒绝H0|H0为真=(二)第二类错误(二)第二类错误 当原假设为假时,而接受原假设所犯的错误,当原假设为假时,而接受原假设所犯的错误,称为第称为第II类错误类错误或取伪错误取伪错误。犯第II类错误的概率常用 表示 P接受接受H0|H0不正确不正确=现在学习的是第6页,共42页H H0 0:无罪无罪无罪无罪陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0检验检验决策决策实际情况实际情况H0为真为真H0为假为假未拒绝未拒绝H0正确决策正确决策(1)第第类错误类错误()拒绝拒绝H0第第类错误类错误()正确决策正确决策(1-(1-)假设检验就好像假设检验就好像假设检验就好像假设检验就好像一场审判过程一场审判过程一场审判过程一场审判过程统计检验过程统计检验过程统计检验过程统计检验过程现在学习的是第7页,共42页原假设 H0结论真实错误拒绝H0第I 类错误 正确 1-接受H0正确 1-第II类错误1、犯第一类错误与犯第二类错误的概率存在此消彼长的关系;2、若要同时减少若要同时减少 与与 ,须增大样本容量,须增大样本容量n。3、通常的作法是、通常的作法是,取显著性水平较小,即控制犯第一类,取显著性水平较小,即控制犯第一类错误的概率在较小的范围内;错误的概率在较小的范围内;4、在犯第二类错误的概率不好控制时,将在犯第二类错误的概率不好控制时,将“接受原假设接受原假设”更倾向于说成更倾向于说成“不拒绝原假设不拒绝原假设”。注意:注意:现在学习的是第8页,共42页假设检验的步骤(1)建立检验假设和确定检验水准(2)选定检验方法和计算检验统计量(3)确定P值和做出推断结论现在学习的是第9页,共42页(1)建立检验假设和确定检验水准在均数的比较中,检验假设是针对总体特征而言,包括相互对立的两个方面,即两种假设:原假设为正待检验的假设:H0;备择假设为可供选择的假设:H1 一般地,假设有三种形式:(1)双侧检验)双侧检验:H0:0;H1:0 (2)左侧检验)左侧检验:H0:0;H1:0 或 H0:0;H1:0 或 H0:0 现在学习的是第10页,共42页双侧检验和单侧检验在进行t 检验时,如果其目的在于检验两个总体均数是否相等,即为双侧检验。例如检验某种新降压药与常用降压药效力是否相同?就是说,新药效力可能比旧药好,也可能比旧药差,或者力相同,都有可能。如果我们已知新药效力不可能低于旧药效力,例如磺胺药+磺胺增效剂从理论上推知其效果不可能低于单用磺胺药,这时,无效假设为H0,备择假设为H1:u1u2,统计上成为单侧检验。现在学习的是第11页,共42页(2)选择显著性水平当原假设H0为真时,却因为样本指标的差异而被否定,这种否定真实的原假设的概率就是显著性水平。用表示。=0.05(即5%)或=0.01(即1%)ho,h1和 的确定,以及单侧检验或双侧检验的选择,都应结合研究设计,在未获得样本结果之前决定,而不受样本结果的影响。现在学习的是第12页,共42页(3)确定P值和做出推断结论P值是指由ho成立时的检验统计量出现在由样本计算出来的检验统计量的末端或更末端处的概率值。当P 时,结论为按所取检验水准拒绝ho,接受h1,这样做出结论的理由是:在ho成立的条件下,出现等于及大于现有检验统计量值的概率P,是小概率事件,这在一次抽样中是不大可能发生的,即现有样本信息不支持ho因而拒绝它;如P,即样本信息支持ho,就没有理由拒绝它,此时只好接受它。现在学习的是第13页,共42页t 检验t检验亦称student t 检验。t检验的用途:样本均数与总体均数的比较,即单样本t检验 来自于同一总体彼此独立的两个不同样本,比较不同类别的显著性差异,即独立样本t检验 两样本均数的比较,即配对样本t检验t检验的应用条件:当样本数较小时,要求样本取自正态总体;做两样本均数比较时,还要求两样本的总体方差相等(1)已知一个总体均数u;(2)可得到一个样本均数及该样本标准差;(3)样本来自正态或近似正态总体。现在学习的是第14页,共42页T检验计算方式 现在学习的是第15页,共42页样本均数与总体均数的比较的t 检验,即单样本t 检验。比较的目的是推断样本所代表的未知总体均数与已知的总体均数uo有无差别。首先对所估计的总体提出一个假设,如:假设这个总体的平均数 等于某个值uo,然后通过样本去推断这个假设是否可以接受,如果可以接受,样本很可能来自这个总体;否则很可能不是来自这个总体.单样本的单样本的T T检验检验现在学习的是第16页,共42页【例【例1】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度个零件尺寸的长度(cm)12.2 10.8 12.0 11.8 11.912.4 11.3 12.2 12.0 12.3现在学习的是第17页,共42页H0:=12 检验统计量检验统计量检验统计量检验统计量:H1:12 =0.05df=10-1=9临界值临界值(c):决策:不拒绝决策:不拒绝ho 结论:结论:该供货商提供零件符合要求该供货商提供零件符合要求 t t0 02.2622.262-2.262-2.2620.0250.025拒绝拒绝 H0 H0拒绝拒绝 H0 H00.0250.025现在学习的是第18页,共42页独立样本的独立样本的T T检验检验 要求要求要求要求:a.a.被比较的两组样本彼此独立被比较的两组样本彼此独立,没有配没有配对关系对关系 b.b.两组样本均来自两组样本均来自正态总体正态总体 c.c.均值均值是对于检验有意义的描述统计量是对于检验有意义的描述统计量两组样本方差相等和不等时使用的计算两组样本方差相等和不等时使用的计算t t值值的公式不同。因此应该先对方差进行齐次性的公式不同。因此应该先对方差进行齐次性检验。检验。SPSSSPSS的输出,在给出方差齐和不齐两的输出,在给出方差齐和不齐两种计算结果的种计算结果的t t值,和值,和t t检验的显著性概率的检验的显著性概率的同时,还给出对方差齐次性检验的同时,还给出对方差齐次性检验的F F值和值和F F检检验的显著性概率。验的显著性概率。现在学习的是第19页,共42页用户需要根据用户需要根据F F检验的结果自己判断选择检验的结果自己判断选择t t检验输出中的哪个结果,得出最后结论。检验输出中的哪个结果,得出最后结论。进行方差齐次检验使用进行方差齐次检验使用F F检验。对应的零检验。对应的零假设是假设是:两组样本方差相等。概率两组样本方差相等。概率p0.05 p -比较均值比较均值-独立样本独立样本T T检验(检验(T T)检验变量:要求平均值的变量检验变量:要求平均值的变量分组变量(只能分成分组变量(只能分成两组两组):):1 1,2 2结果中比较有用的值:方差齐次性检验结果中比较有用的值:方差齐次性检验F F的的SigSig和和方差相等或不相等的方差相等或不相等的SigSig(Sig Sig为显著性概率值)为显著性概率值)现在学习的是第21页,共42页 例例例例2:2:2:2:下表为某银行中的男女职工中下表为某银行中的男女职工中下表为某银行中的男女职工中下表为某银行中的男女职工中3 3 3 3月份的工资表,试分析出该月份的工资表,试分析出该月份的工资表,试分析出该月份的工资表,试分析出该银行男银行男女雇员的平均工资是否有显著性差异。(置信区间百分比为女雇员的平均工资是否有显著性差异。(置信区间百分比为95%95%)雇员编号雇员编号性别性别工资工资101男5300102男5600103女5550104男4000105女4600106女4300107男5100108女5900109女5200110男4100111女4600112男4700现在学习的是第22页,共42页分析:根据上表建立数据集如下:分析:根据上表建立数据集如下:现在学习的是第23页,共42页独立样本独立样本独立样本独立样本T T T T检验检验检验检验对话框及设置:对话框及设置:对话框及设置:对话框及设置:现在学习的是第24页,共42页输出结果:输出结果:P P值值=0.712=0.7120.050.05,应接受原假设,即可以认为,应接受原假设,即可以认为该银行男女雇员的工资不存在显著差异。该银行男女雇员的工资不存在显著差异。在在SPSS中,中,P值被定义为所对值被定义为所对应应t值分布一侧面积的双倍。值分布一侧面积的双倍。因为双侧检验时,可直接比因为双侧检验时,可直接比较较P值与值与值的大小;若为单值的大小;若为单侧检验,则需比较侧检验,则需比较P值与值与2值的大小。值的大小。现在学习的是第25页,共42页配对样本的t 检验配对设计是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对因素是影响实验效应的主要非处理因素。-例如,在动物实验中,常将窝别、性别相同,体重相近的两个动物配成对子;-人群试验中,常将性别相同、年龄相近的两个人配成对子,这样可提高各处理组间的均衡性。现在学习的是第26页,共42页配对样本分三种情况:配成对子的同对受试对象分别给予两种不同的处理,其目的是推断两种处理的效果有无差别;同一受试对象分别接受两种不同处理,其目的是推断两种处理的效果有无差别;同一受试对象处理前后的比较,其目的是推断某种处理有无作用。现在学习的是第27页,共42页 用于检验两配对总体的均值是否具有显著性差异用于检验两配对总体的均值是否具有显著性差异(其前提是两其前提是两样本具有配对关系,且其来自的总体均服从正态分布样本具有配对关系,且其来自的总体均服从正态分布)实质是检验每对测量值差值变量的均值与零之间差异的显实质是检验每对测量值差值变量的均值与零之间差异的显著性,若差异不显著,则说明配对变量均值之间的差异不著性,若差异不显著,则说明配对变量均值之间的差异不显著;显著;现在学习的是第28页,共42页公式:对于配对样本数据,应该首先计算出各对差值的均数。当两种处理结果无差别或某种处理不起作用时,理论上差值的总体均数应该为0,故可将配对样本资料的假设检验视为样本均数与总体均数=0的比较,所用方法为配对t检验为差值d的标准差。操作:操作:菜单:菜单:分析分析-比较均值比较均值-配对样本配对样本T T检验(检验(P P)注:成对变量(注:成对变量(V V):设置配对变量):设置配对变量现在学习的是第29页,共42页例例31010个高血压患者在施以体育疗法前后测定舒个高血压患者在施以体育疗法前后测定舒张压,要求判断体育疗法对降低血压是否有张压,要求判断体育疗法对降低血压是否有效,数据编号为效,数据编号为3 3。患者编号患者编号患者编号患者编号疗法前疗法前疗法前疗法前疗法后疗法后疗法后疗法后 1 12 23 34 45 56 67 78 89 91010112112113113134134110110125 125 117117108 108 120 120 118 118 1381381041049696103 103 909010810811911992929090102102121121配对样本配对样本t t检验实例:检验实例:现在学习的是第30页,共42页分析:根据述信息建立数据集如下:分析:根据述信息建立数据集如下:现在学习的是第31页,共42页配对样本配对样本配对样本配对样本T T T T检验检验检验检验对话框和设置:对话框和设置:指定配对变量指定配对变量指定配对变量指定配对变量现在学习的是第32页,共42页输出结果:输出结果:P P值值=0.000=0.0000.050.05,应拒绝原假设,表明体育疗法对,应拒绝原假设,表明体育疗法对降低血压有效。降低血压有效。现在学习的是第33页,共42页配对样本配对样本t检验与独立样本检验与独立样本t检验的区别:检验的区别:1.独立样本过程用于检验两个独立样本是否来自具有相独立样本过程用于检验两个独立样本是否来自具有相同均值的总体。配对样本用于检验两个相关的样本是否来同均值的总体。配对样本用于检验两个相关的样本是否来自具有相同均值的正态总体。自具有相同均值的正态总体。2.独立样本是指不同样本平均数的比较,而配对样独立样本是指不同样本平均数的比较,而配对样本往往是对相同样本二次平均数的检验。本往往是对相同样本二次平均数的检验。现在学习的是第34页,共42页启示:假设检验注意事项启示:假设检验注意事项35现在学习的是第35页,共42页二、假设检验应注意的问题1.要有严密的研究设计 这是假设检验的前提。组间应均衡,具有可比性,也就是除对比的主要因素(如临床试验用新药和对照药)外,其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近(控制变量)。保证均衡性的方法主要是从同质总体中随机抽取样本,或随机分配样本。36现在学习的是第36页,共42页2.不同的资料应选用不同检验方法 应根据分析目的、资料类型以及分布、设计方案的种类、样本含量大小等选用适当的检验方法。如:配对设计的计量资料采用配对t检验。37现在学习的是第37页,共42页3.正确理解“显著性”一词的含义 差别有或无统计学意义,过去称差别有或无“显著性”,是对样本统计量与总体参数或样本统计量之间的比较而言,相应推断为:可以认为或还不能认为两个或多个总体参数有差别。38现在学习的是第38页,共42页4.结论不能绝对化 因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围,如写成P=0.040或0.02P0.05,而 不 简 单 写 成P0.05,以便读者与同类研究进行比较或进行循证医学时采用Meta分析。39现在学习的是第39页,共42页5.假设检验是为专业服务的,统计结论必须和专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。若统计结论和专业结论一致,则最终结论就和这两者均一致(即均有或均无意义);若统计结论和专业结论不一致,则最终结论需根据实际情况加以考虑。若统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在问题,那么最终结论就没有意义。40现在学习的是第40页,共42页 6.置信区间与假设检验各自不同的作用,要结合使用。一方面一方面,置信置信区间区间亦可回答亦可回答假设检验假设检验的问题,算得的问题,算得的置信区间若包含了的置信区间若包含了H H0 0,则按,则按 水准,不拒绝水准,不拒绝H H0 0;若不包;若不包含含H H0 0,则按,则按 水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1。另一方面另一方面,置信置信区间不但能回答差别有无统计学意义,区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。实际的专业意义。41现在学习的是第41页,共42页 虽然虽然置信区间置信区间亦可回答亦可回答假设检验假设检验的问的问题题,并能提供更多的信息,并能提供更多的信息,但并不意味着置但并不意味着置信区间能够完全代替假设检验。置信区间信区间能够完全代替假设检验。置信区间只能在预先规定的概率只能在预先规定的概率()的前提下进的前提下进行计算,而假设检验能够获得一较为行计算,而假设检验能够获得一较为确切确切的概率的概率P值值。42现在学习的是第42页,共42页