资料类型与医学统计方法选择.pptx
学 习 内 容第第1 1节节 概述概述 统计资料类型统计资料类型的“转换”资料的统计分析方法第第2 2节节 计量资料与计量资料与t t检验检验计量资料的概念 t检验的使用条件t检验的常用方法与类型 实例分析第1页/共37页第第3 3节节 计数资料与计数资料与2 2检验检验计数资料的概念计数资料的概念 2 2检验的使用范围检验的使用范围 2 2检验的常用方法与类型检验的常用方法与类型 实例分析实例分析第第4 4节节 等级资料与秩和检验等级资料与秩和检验 等级资料的概念等级资料的概念 秩和检验的使用范围秩和检验的使用范围 常用秩和检验的基本步骤常用秩和检验的基本步骤第2页/共37页第1节 概述 一、统计资料的类型:一、统计资料的类型:一、统计资料的类型:一、统计资料的类型:在医护科研中,一般将不同性质的实验结果资料在医护科研中,一般将不同性质的实验结果资料在医护科研中,一般将不同性质的实验结果资料在医护科研中,一般将不同性质的实验结果资料 分为计量资料、计数资料和等级资料等类型。分为计量资料、计数资料和等级资料等类型。分为计量资料、计数资料和等级资料等类型。分为计量资料、计数资料和等级资料等类型。表表8 8(A A)统计资料的类型统计资料的类型分类分类分类分类概念概念概念概念特点特点特点特点例子例子例子例子计量计量计量计量资料资料资料资料对每个观察对象用仪对每个观察对象用仪器、工具等测定某项器、工具等测定某项指标数量的大小所得指标数量的大小所得的资料的资料一般有度量衡(计量)单位;一般有度量衡(计量)单位;与计数资料的主要区别在于观察与计数资料的主要区别在于观察 单位之间只有量的差别,没有质单位之间只有量的差别,没有质 不同。不同。身高(身高(cmcm)、体重)、体重(kgkg)血压()血压(mmHgmmHg)、)、时间(分)脉搏(次时间(分)脉搏(次/分)分)、红细胞计数(、红细胞计数(1010/L/L)计数计数计数计数资料资料资料资料将观察单位按照某种将观察单位按照某种性质或类别进行分组,性质或类别进行分组,然后清点各组个数所然后清点各组个数所得的资料得的资料 无固有计量单位;无固有计量单位;计量资料的主要区别在于观察单计量资料的主要区别在于观察单 位之间只有质的不同,没有量的位之间只有质的不同,没有量的 差别。差别。肤色(黑、白)、血型肤色(黑、白)、血型(ABOABO)、职业(工农兵)、职业(工农兵)、性别(男、女)、性别(男、女)等级等级等级等级资料资料资料资料是先将观察单位按照是先将观察单位按照某种性质或属性的不某种性质或属性的不同程度分组,再清点同程度分组,再清点各组个数所得的资料各组个数所得的资料 半定性或半定量的观察结果;半定性或半定量的观察结果;与计数资料的不同点为属性分组与计数资料的不同点为属性分组有程度的差别,各组按不同程度顺有程度的差别,各组按不同程度顺序排列;与计量资料的不同点为每序排列;与计量资料的不同点为每个观察单位没有进行确切定量。个观察单位没有进行确切定量。癌症分期:早、中、晚癌症分期:早、中、晚药物疗效:治愈、好转、药物疗效:治愈、好转、无效、死亡无效、死亡 尿蛋白:尿蛋白:、+、+返返回回第3页/共37页二二.统计资料类型的统计资料类型的“转换转换”应当指出,根据不同的研究目的和数据分布特点,应当指出,根据不同的研究目的和数据分布特点,在在一一定条件下,同一实验指标所得的资料,其类型可以相互转定条件下,同一实验指标所得的资料,其类型可以相互转化化。故实验资料的分类应做到故实验资料的分类应做到“具体情况,具体分析具体情况,具体分析”。如:研究某方法对贫血的治疗效果,其指标是血红蛋如:研究某方法对贫血的治疗效果,其指标是血红蛋白:白:若仅为判断是否有效,则可确定一个血红蛋白界值将若仅为判断是否有效,则可确定一个血红蛋白界值将疗效疗效划分为有效与无效,这属于计数资料;划分为有效与无效,这属于计数资料;若欲了解血红蛋白变化的数量,则按血红蛋白测定值若欲了解血红蛋白变化的数量,则按血红蛋白测定值的变的变化大小进行分析,属于计量资料;化大小进行分析,属于计量资料;但若变化范围较大,程度很不一致,则可按变化程度但若变化范围较大,程度很不一致,则可按变化程度将疗将疗效分为若干等级,属于等级资料。效分为若干等级,属于等级资料。但资料类型一经确定,对它们的统计描述、统计推断但资料类型一经确定,对它们的统计描述、统计推断方法方法和检验分析方法各不相同。和检验分析方法各不相同。返返回回第4页/共37页三三.资料的统计分析方法资料的统计分析方法 资料的分析主要是借助医学统计方法来实现的。医学统计方资料的分析主要是借助医学统计方法来实现的。医学统计方法的种类很多,每种统计方法都有一定的使用条件和使用范围,如法的种类很多,每种统计方法都有一定的使用条件和使用范围,如何正确地选择统计方法,并了解每种统计方法的使用条件和使用范何正确地选择统计方法,并了解每种统计方法的使用条件和使用范围是进行资料分析的关键。围是进行资料分析的关键。表表8 8(A A)资料类型与常用医学统计方法的选择资料类型与常用医学统计方法的选择 返返回回第5页/共37页第二节第二节 计量资料与计量资料与t t检验检验 一、一、t t检验的使用条件检验的使用条件 1.1.两两样样本本是是计计量量资资料料并并均均来来自自正正态态分分布布总体。总体。2.2.总体标准差总体标准差未知。未知。3.3.两个小样本均数比较时,要求两总体方两个小样本均数比较时,要求两总体方差相等,即方差齐同。差相等,即方差齐同。返返回回第6页/共37页二、二、t t检验的使用范围检验的使用范围1.1.用于样本均数与总体均数之间的比较。用于样本均数与总体均数之间的比较。2.2.用于配对计量资料的显著性检验。用于配对计量资料的显著性检验。3.3.用于两样本均数的比较。用于两样本均数的比较。返返回回第7页/共37页三、三、t t检验的常用方法与类型检验的常用方法与类型 表表8-1 t8-1 t检验的检验类型、计算公式及注意事项检验的检验类型、计算公式及注意事项返返回回第8页/共37页假设检验假设检验复习复习内涵:内涵:是判断相比较的两个或多个总体参数之间差异是否有显著是判断相比较的两个或多个总体参数之间差异是否有显著性的性的 方法,从而得知相比较的总体参数之间的差异是来自抽方法,从而得知相比较的总体参数之间的差异是来自抽样误差,样误差,还是来自本质差异。这种用于判断差别属于哪一种情况还是来自本质差异。这种用于判断差别属于哪一种情况的统计的统计 学检验,就是假设检验。学检验,就是假设检验。一般步骤:一般步骤:建立假设与确定检验水准(建立假设与确定检验水准()H H0 0:1 12 2 无效假设无效假设两个总体均数(或率)相等两个总体均数(或率)相等 H H1 1:1 12 2 备择假设备择假设两个总体均数(或率)不相等两个总体均数(或率)不相等 检验水准:检验水准:=0.05=0.05或或0.01(0.01(双侧双侧)选定方法和计算统计量选定方法和计算统计量 如如t t检验、检验、X X2 2检验、检验、u u检验、检验、F F检验、秩和检验等。检验、秩和检验等。确定确定P P值,作出判断值,作出判断 P0.05 P0.05 样本差别有统计学意义;样本差别有统计学意义;P 0.05 P 0.05 样本差别无统样本差别无统计学计学 意义。意义。返返回回第9页/共37页四、实例分析四、实例分析 【案例一】【案例一】已知某市35例难产儿出生体重=3.42Kg,S=0.40Kg,一般婴儿出生体重=3.30Kg(大规模调查获得),问相同否?1.资料分析:资料分析:体重?用体重计称重量有度量衡单位(Kg)计量资料 比较难产儿(样本)与正常产儿(总体)应用何种t检验?2.2.显著性检验分析:显著性检验分析:n=35 X=3.42,=3.30 S=0.40 查附表5-t界值表,,因计算因计算t ,故,故P0.05,即就现有资料尚不能认为难产儿与正常产儿出生体重有显著性差别。返返回回第10页/共37页【案例二】对13名慢性胆囊炎患者施行胆囊切除术,切除前后患者体重如表8-2。问施行胆囊切除术前后患者体重有无改变?返回返回第11页/共37页【案例二】1.1.资料分析:资料分析:体重(体重(kgkg)计量资料计量资料 比较患者手术前后体重是否有改变比较患者手术前后体重是否有改变属于自身对照属于自身对照应选配对计量资料比较应选配对计量资料比较的的t t检验。检验。2.2.显著性检验分析:显著性检验分析:计算计算t t值:本例值:本例 n=13 d=61 dn=13 d=61 d2 2=815 d=d=815 d=dn=61n=6113=4.69213=4.692公式中,d为差数的均数,Sd为差数的标准差 结结论论:查查附附表表5-t界界值值表表,t0.05,12=2.179,因因计计算算tt0.05,12,故故P0.05,可可认认为为慢性胆囊炎患者胆囊切除后体重会增加。慢性胆囊炎患者胆囊切除后体重会增加。返返回回第12页/共37页【案例三】某医院研究游泳对新生儿生长发育的影响,选择足月产正常新生儿某医院研究游泳对新生儿生长发育的影响,选择足月产正常新生儿200200例,随机分为两组。观察组例,随机分为两组。观察组100100例,进行例,进行10min10min的自编水中被动操和的自编水中被动操和5min5min的婴的婴儿自主游等训练;对照组儿自主游等训练;对照组100100例实行单纯沐浴。分别记录两组新生儿的体重例实行单纯沐浴。分别记录两组新生儿的体重指标如表指标如表8-38-3。问游泳对新生儿的生长发育有无影响?。问游泳对新生儿的生长发育有无影响?第13页/共37页【案例三】1.资料分析:体重(g)计量资料。比较游泳组与单纯沐浴组新生儿体重(g)是否不同两样本资料比较选用两样本均数比较的t检验。2.显著性检验分析:查附表5-t界值,得 因刚出生时,计算t=0.135t0.05、198,即P 0.05,不能拒绝H0,故可认为两组新生儿出生时体重无显著性差别,具有可比性。而出生7天后,计算t=3.135513 t0.05、198,即P0.05,拒绝H0,故可认为游泳对新生儿的生长发育有促进作用。返回返回第14页/共37页第三节第三节 计数资料与计数资料与2 2检验检验 一、计数资料的概念一、计数资料的概念一、计数资料的概念一、计数资料的概念 计数资料计数资料计数资料计数资料(enumeration data)enumeration data)enumeration data)enumeration data):是将观察单位按照某种是将观察单位按照某种是将观察单位按照某种是将观察单位按照某种性质或类别进行分组,然后清点各组观察单位的个数所得的性质或类别进行分组,然后清点各组观察单位的个数所得的性质或类别进行分组,然后清点各组观察单位的个数所得的性质或类别进行分组,然后清点各组观察单位的个数所得的资料。与计量资料的主要区别在于观察单位之间只有质的不资料。与计量资料的主要区别在于观察单位之间只有质的不资料。与计量资料的主要区别在于观察单位之间只有质的不资料。与计量资料的主要区别在于观察单位之间只有质的不同,没有量的差别。同,没有量的差别。同,没有量的差别。同,没有量的差别。二、检验的使用范围二、检验的使用范围二、检验的使用范围二、检验的使用范围 2 2 2 2检验检验检验检验(chi-square test)(chi-square test)(chi-square test)(chi-square test)或称卡方检验。或称卡方检验。或称卡方检验。或称卡方检验。1.1.1.1.用于两个或多个样本率(或构成比)之间的比较。用于两个或多个样本率(或构成比)之间的比较。用于两个或多个样本率(或构成比)之间的比较。用于两个或多个样本率(或构成比)之间的比较。2.2.2.2.用于配对计数资料的差异显著性检验。用于配对计数资料的差异显著性检验。用于配对计数资料的差异显著性检验。用于配对计数资料的差异显著性检验。3.3.3.3.检验两类事物间是否存在一定联系。检验两类事物间是否存在一定联系。检验两类事物间是否存在一定联系。检验两类事物间是否存在一定联系。返回返回第15页/共37页三、三、2 2检验的常用方法与类型检验的常用方法与类型返返回回第16页/共37页何谓四格表资料?何谓四格表资料?返返回回第17页/共37页四、实例分析四、实例分析【案例一】【案例一】某市健康教育所调查吸烟者与不吸烟者慢性支气管炎的患病情况资料某市健康教育所调查吸烟者与不吸烟者慢性支气管炎的患病情况资料如表如表8-68-6,问吸烟者与不吸烟者的慢性支气管炎患病率有无本质差别?,问吸烟者与不吸烟者的慢性支气管炎患病率有无本质差别?返回返回第18页/共37页【案例一】【案例一】1.资料分析:研究吸烟者与不吸烟者的慢性支气管炎患病人数与不患病人数(无度量衡单位)属于四格表计数资料选用四格表资料的x2检验。2.显著性检验分析:计算检验统计量 本例n33940,故选用四格表资料的x2检验基本公式:=(2-1)(2-1)=1查附表6-x2界值表得 ,计算 ,p0.01,故可认为吸烟者比不吸烟者更容易导致慢性支气管炎。返回返回第19页/共37页【案例二】【案例二】某医院为探讨行之有效的放射性药物注射方法,现分别用两步注射法(用注射某医院为探讨行之有效的放射性药物注射方法,现分别用两步注射法(用注射器抽吸生理盐水器抽吸生理盐水5 56ml6ml,连接头皮针,于皮肤消毒后行静脉穿刺,见回血后注入,连接头皮针,于皮肤消毒后行静脉穿刺,见回血后注入1 12ml2ml生理盐水,确认针头在静脉内后外固定,注入放射性药物,再将余下的生理盐水,确认针头在静脉内后外固定,注入放射性药物,再将余下的3 34ml4ml生生理盐水注入后拔针)和传统注射法(用注射器直接静脉穿刺给放射性药物)给药,理盐水注入后拔针)和传统注射法(用注射器直接静脉穿刺给放射性药物)给药,有关资料如表有关资料如表8-78-7,问两步注射法与传统注射法致药物血管外漏出情况有无差别?,问两步注射法与传统注射法致药物血管外漏出情况有无差别?返回返回第20页/共37页【案例二】【案例二】1.资料分析:研究“两步注射法”与“传统注射法”致放射性药物血管“外漏出人数”与“未漏出人数”四格表计数资料。2.显著性检验分析:计算检验统计量:本例n40,因 故选用四格表资料x2检验的校正公式 =(2-1)(2-1)=12 结论 查附表6-界值表得 ,因计算 ,p1(2)结论:查附表6-界值表得 ,因计算 ,p0.01 故可认为三个不同区域出生婴儿的致畸率有差别。返回返回第23页/共37页【案例四】【案例四】某医生用两种检验方法对已确诊的120名乳腺癌患者进行检验,获得如下资料(表8-9)。问两种检验方法对乳腺癌患者的检验结果有无差别?返回返回第24页/共37页【案例四】【案例四】1.资料分析:研究两种检验方法的阳性检出率有无差别属于配对的计数资料选用配对计数资料2检验公式进行显著性检验。2.显著性检验分析:(1)算检验统计量:因本例b=32,c=17,b+c40,故应选用配对计数资料2检验的基本公式 2=(b-c)2/b+c=(32-17)2/32+17=4.5918 =1(2)结论 查附表6-x2界值表,x20.05、1=3.84,因计算x2 x2 0.05、1 P0.05,故可认为甲法对乳腺癌患者的检出率比乙法高。返回返回第25页/共37页返回返回第四节第四节 等级资料与秩和检验等级资料与秩和检验 一、等级资料的概念一、等级资料的概念 等级资料等级资料(ranked data)(ranked data):是先将观察单位按照某种:是先将观察单位按照某种性质或属性的不同程度分组,再清点各组观察单位的个性质或属性的不同程度分组,再清点各组观察单位的个数所得的资料,又称半定量资料。数所得的资料,又称半定量资料。与计数资料的不同点为:属性分组有程度的差别,与计数资料的不同点为:属性分组有程度的差别,各组按不同程度顺序排列;与计量资料的不同点为:各组按不同程度顺序排列;与计量资料的不同点为:每个观察单位没有进行确切定量。每个观察单位没有进行确切定量。第26页/共37页返回返回二、秩和检验的使用范围二、秩和检验的使用范围 1.1.偏偏态态分分布布或或分分布布形形式式未未知知的的计计量量资资料料(尤尤其其是是n30)n30)。2.2.等级资料。等级资料。3.3.个别数据偏大(小)或数据的某一端无确定的数值。个别数据偏大(小)或数据的某一端无确定的数值。如:如:“0.01mg”0.10,故就现有资料尚不能认为两法测定空气中CS2的含量有差别。第29页/共37页返回返回(二)两组计量资料的秩和检验(二)两组计量资料的秩和检验【案例二】【案例二】某实验室观察局部湿热治疗小鼠移植性肿瘤的疗效,以生存日数作为观察指标,结果如表8-11,问两组小鼠生存日数有无差别?第30页/共37页返回返回1.资料分析:研究两组小白鼠的生存日数(天)原本属于计量资料,但所得数据资料呈 明显偏态分布,故只能选用两组计量资料的秩和检验。2.显著性检验分析:(1)建立检验假设、确定显著性水准 H0:两组总体分布相同 H1:两组总体分布不同 =0.05(2)编秩次:先将两组数据由小到大排队,再统一编秩。注意:同组同值按顺序编;异组同值取平均秩次。(3)求秩和、确定检验统计量(T值):当两组例数相等时,取任一组的秩和为T;当两组例数不等时,取样本数小者的秩和为T值。本例n1=10,n2=12,故T1=170(4)确定P值和作出推断结论:查表法:查附表8-T界值表(两样本比较的秩和检验),找到n1与n2-n1相交处所对应的4行界值,将检验统计量T值与T界值相比。判断标准:如果T值在界值范围内,P值大于相应概率;如果T值恰好等于界值,P值等于相应概率;如果T值在界值范围外,P值小于相应概率。结果:本例n1=10,n2=12,故T1=170,查得双侧P0.01,故可认为实验组小鼠生存日数较对照组长。第31页/共37页返回返回(三)两组等级资料的秩和检验(三)两组等级资料的秩和检验【案例三】【案例三】某医院用某药治疗不同临床类型的老年性慢性支气管炎病人,疗效见表8-12第栏,试比较两种病情疗效是否有差异?第32页/共37页返返回回1.1.建立检验假设、确定显著性水准:建立检验假设、确定显著性水准:H0:两种病情病人的疗效总体分布相同 H1:两种病情病人的疗效总体分布不同 =0.052.2.编秩次和求平均秩次:编秩次和求平均秩次:定各等级的秩次范围:先计算各等级的合计人数,见第栏,再编定秩次范围。如疗效为控制者共107例,其秩次范围1107。求平均秩次:平均秩次为秩次范围的上、下限值的平均数。如疗效为控制者的平均秩次=(1+107)/2=54,仿此得第栏。3.3.求秩和及确定检验统计量(求秩和及确定检验统计量(T T值):值):求出较小样本的秩和为T(若两样本含量相等时,可求任一组的秩和为T);分别用各等级例数乘以平均秩次,再求和得到T1、T2。见、栏。本例n1=82 n2=126 T=8780.5。4.4.确定确定P P值和作出推断结论:值和作出推断结论:(1)查表法:查附表8(两样本比较的秩和检验),找到n1与n2-n1相交处所对应的界值,将检验统计量T值与T界值相比。判断标准:T值在界值范围内,P值大于相应概率;T值恰好等于界值,P值等于相应概率。T值在界值范围外,P值小于相应概率。若n1和n2超出表的范围,采用u检验(用uc确定P值)。第33页/共37页返回返回(2)(2)正态近似法(正态近似法(u u检验):检验):本例n1=82,n2=126,检验统计量T=8780.5。由于本例n1=82,超过附表8的范围,故需用u检验。=式中“ti”为第j个相同秩次的个数 已知 n1=82 T1=8780.5 n2=126 N=82+126=208 (ti3-ti)=(1073-107)+(243-24)+(533-53)+(243-24)=1401360 u=0.5413 结论:u=0.54131.96,P0.05,故就现有资料尚不能认为该药对两种病情的慢性支气管炎病人有不同疗效。第34页/共37页返回返回 小小 结结 医医学学统统计计分分析析方方法法是是我我们们分分析析科科研研资资料料(数数据据)的的有有力力工工具具。掌掌握握这这些些工工具具的的重重点点不不在在于于了了解解工工具具的的原原理理,而而在在于于熟熟悉悉工工具具的的使使用用。最最重重要要的的是是要要了了解解每每一一种种工工具具(统统计计方方法法)的的功功能能,即即它它能能为为我我们们解解决决什什么么样样的的问问题题,以以便便在在资资料料分分析析中中能能正正确确地地选选择和使用。择和使用。第35页/共37页返回返回目标检测 1.1.计量资料常用的统计方法是什么?能解决哪些计量资料常用的统计方法是什么?能解决哪些 常见问题?常见问题?2.2.计数资料常用的统计方法是什么?能解决哪些计数资料常用的统计方法是什么?能解决哪些 常见问题?常见问题?3.t3.t检验的使用条件和范围。检验的使用条件和范围。4.X4.X2 2 检验的使用条件和范围。检验的使用条件和范围。5.5.等级资料可选用哪些统计等级资料可选用哪些统计 检验方法?检验方法?第36页/共37页感谢您的观看!第37页/共37页