《分类变量的统计描述-课件.ppt》由会员分享,可在线阅读,更多相关《分类变量的统计描述-课件.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1第十六章第十六章 分类变量的统计描述分类变量的统计描述卫生教研室 李巧LOGO2 2主要内容主要内容v常用相对数常用相对数v应用相对数的注意事项应用相对数的注意事项v标准化法标准化法 为什么引入相对数为什么引入相对数?绝对数的局限性绝对数的局限性.LOGO3 3变量变量:所研究的观察对象的一个或几个特征,所研究的观察对象的一个或几个特征,即观察指标。即观察指标。资料资料:变量的观测值组成资料。变量的观测值组成资料。分类变量资料分类变量资料:将观察单位按属性或类别分组计将观察单位按属性或类别分组计数所得的资料。数所得的资料。几几 个个 概概 念念LOGO4 4一、分类变量资料的频数表一、分类变
2、量资料的频数表婚姻状况婚姻状况频数频数单身单身 3 3已婚已婚 5 5离异离异 2 2分居分居 4 4合计合计14 14 14名成人的婚姻状况名成人的婚姻状况编号编号性别性别身高身高婚姻状况婚姻状况1 1男男175175单身单身2 2女女167167单身单身3 3男男187187单身单身4 4女女176176已婚已婚5 5男男167167已婚已婚6 6女女178178已婚已婚7 7男男174174已婚已婚8 8女女170170已婚已婚9 9男男167167离异离异1010女女186186离异离异1111男男182182分居分居1212女女159159分居分居1313男男167167分居分居14
3、14女女182182分居分居案例案例1:14名成人的原始数据名成人的原始数据各类别及各类别下的观察单位数构成频数表LOGOLOGO6 6一、分类变量资料的频数表一、分类变量资料的频数表表表1 1 某市某年各区急性传染病发病数及其相对数某市某年各区急性传染病发病数及其相对数LOGO7 716-1:16-1:某医院肿瘤科当月的住院人数为某医院肿瘤科当月的住院人数为100100人人,死亡死亡人数为人数为2020人人,外科当月的住院人数为外科当月的住院人数为400400人人,死亡人死亡人数为数为2525人人,可否认为该医院当月外科病人的死亡危可否认为该医院当月外科病人的死亡危险性比肿瘤科更大险性比肿瘤
4、科更大?已知外科人数为已知外科人数为400400人,肿瘤人数为人,肿瘤人数为100100人人实际数实际数:某事物现象的实际发生数:某事物现象的实际发生数外科死亡率外科死亡率=6.25%=6.25%肿瘤死亡率肿瘤死亡率=20%=20%相对数相对数:两个有联系的指标之比两个有联系的指标之比LOGO8 8相对数的概念及其意义:相对数的概念及其意义:v绝对数绝对数:即各分类事物的合计数,绝对数反映某事即各分类事物的合计数,绝对数反映某事物实际发生的规模大小。物实际发生的规模大小。v相对数:相对数:是两个有关绝对数之比,统称为相对数。是两个有关绝对数之比,统称为相对数。v相对数的意义:相对数的意义:1.
5、1.消除基数影响,便于事物间的比较。消除基数影响,便于事物间的比较。2.2.给出事物发生频率(强度)的估计。给出事物发生频率(强度)的估计。3.3.相对数是工作决策的依据。相对数是工作决策的依据。LOGOLOGO1010表表1 1 某市某年各区急性传染病发生数及其相对数某市某年各区急性传染病发生数及其相对数 相对比相对比构成比构成比率率LOGO1111一一.率率含义:含义:一定时间内,实际发生某种现象的观察单位数与可能发一定时间内,实际发生某种现象的观察单位数与可能发 生该现象的总观察单位数之比。生该现象的总观察单位数之比。应用:应用:说明某现象在其可能发生的范围内实际发生的说明某现象在其可能
6、发生的范围内实际发生的频率或强频率或强 度度,反映事物的普遍及严重程度。反映事物的普遍及严重程度。计算:计算:LOGOLOGO1313率率表表2 2 某地某年四种常见心血管病死亡率某地某年四种常见心血管病死亡率 LOGOLOGO1515二二.构成比构成比含义:含义:指一事物内部某一组成部分的观察单位数与该事物各指一事物内部某一组成部分的观察单位数与该事物各 组成部分的观察单位总数之比,常用百分数表示组成部分的观察单位总数之比,常用百分数表示应用:应用:用以说明某一事物内部各组成部分所占的比重或分布用以说明某一事物内部各组成部分所占的比重或分布计算:计算:通常以通常以100%100%为比例基数为
7、比例基数LOGO1616二二.构成比构成比v 设设某某事事物物个个体体数数的的合合计计由由A A1 1,A A2 2,A Ak k个个部部分分组组成,构成比的计算为:成,构成比的计算为:.LOGOLOGO1818表表16-1 200016-1 2000年某医院某病的住院人数和死亡人数年某医院某病的住院人数和死亡人数病情严病情严重程度重程度住院人数住院人数 病死数病死数死亡构成死亡构成(%)(%)病死率病死率(%)(%)轻轻3003001212263726374.04.0中中350350181840.040.05.15.1重重150150151533.333.310.010.0合计合计80080
8、04545100.0100.05.65.6LOGO1919特点特点:1 1、各组成部分的构成比之和为各组成部分的构成比之和为100%100%,分子为分,分子为分母一部分母一部分 2 2、某一部分比重变化,则其它部分也相应变、某一部分比重变化,则其它部分也相应变化化LOGO2020二二.构成比构成比案例案例2 2:某医院某医院19901990年和年和19981998年住院病人死于五种年住院病人死于五种疾病的人数见表疾病的人数见表4 4。LOGO2121二二.构成比构成比v从表从表4 4可以看出该医院可以看出该医院19901990和和19981998两年五种两年五种疾病死亡构成比的排序不同;疾病死
9、亡构成比的排序不同;v表表4 4中中,19901990与与19981998年年住住院院病病人人五五种种疾疾病病死死因构成的总和均为因构成的总和均为100%100%;v19981998年呼吸系统疾病死亡人数比年呼吸系统疾病死亡人数比19901990年少,年少,但构成比却比较接近。但构成比却比较接近。LOGO2222二二.构成比构成比注意:注意:死死因因构构成成比比只只能能说说明明某某病病死死亡亡人人数数在在总总死死亡亡人人数数中中所所占占比比重重,如如需需要要比比较较其其病病死死的的严严重程度重程度,则要计算病死率,则要计算病死率。LOGOLOGO2424指标分类:指标分类:v对比指标:对比指标
10、:v关系指标:关系指标:v计划完成指标:计划完成指标:三三.相相 对对 比比LOGO2525三三.相相 对对 比比v对比指标:对比指标:指两个同类事物某种指标的比。如性指两个同类事物某种指标的比。如性别比、某两年发病率比。别比、某两年发病率比。如:某地区流脑发病率如:某地区流脑发病率19751975年为年为4.48/104.48/10万,万,19981998年为年为0.49/100.49/10万,则万,则 表示表示19751975年为年为19981998年的年的9.149.14倍,即倍,即19981998年该病发年该病发病率下降到病率下降到19751975年的年的1/9.141/9.14(10
11、.9%10.9%)。)。LOGO2626三三.相相 对对 比比表表1 1 某市某年各区急性传染病发病数及其相对数某市某年各区急性传染病发病数及其相对数相对相对比比LOGOLOGO2828三三.相相 对对 比比v计划完成指标:计划完成指标:用实际数达到计划数的百分之几或几倍说明计划用实际数达到计划数的百分之几或几倍说明计划完成的程度。完成的程度。v 如:某县原计划在一个伤寒疫区周围人群对如:某县原计划在一个伤寒疫区周围人群对15001500名居民接名居民接种伤寒疫苗,而实际上接种了种伤寒疫苗,而实际上接种了19581958人,计算计划完成指标为人,计算计划完成指标为:v 即完成了计划的即完成了计
12、划的130.5%130.5%,也可改为倍数表示,即完,也可改为倍数表示,即完成了原计划的成了原计划的1.3051.305倍。倍。LOGO2929第二节第二节 应用相对数的注意事项应用相对数的注意事项(1 1)分析时不能以构成比代替率分析时不能以构成比代替率LOGOLOGO3131(2 2)计算相对数时)计算相对数时分母不宜太小分母不宜太小,否则缺乏,否则缺乏稳定性稳定性(3 3)正确计算合计率(总率)正确计算合计率(总率)LOGO3232应用相对数的注意事项应用相对数的注意事项案案例例4 4:用用某某疗疗法法治治疗疗肝肝炎炎,甲甲医医院院治治疗疗150150人人,治治愈愈3030人人,治治愈愈
13、率率为为20%20%;乙乙医医院院治治疗疗100100人人,治治愈愈3030人人,治治 愈愈 率率 为为 30%30%。两两 个个 医医 院院 合合 计计 治治 愈愈 率率 应应 该该 是是(30+30)/(150+10030+30)/(150+100)100%100%=24%24%。若若 算算 为为20%+30%=50%20%+30%=50%或或(20%+30%)/2=25%(20%+30%)/2=25%,则是错的。,则是错的。LOGO33334.4.相对数的比较,要注意可比性。相对数的比较,要注意可比性。观察对象是否观察对象是否同质同质:哮喘发病率的比较,观哮喘发病率的比较,观察季节不同结
14、果就不一样察季节不同结果就不一样观察对象观察对象内部结构是否相同内部结构是否相同:即其他影响因:即其他影响因素在被比较总体之间的分布或构成是否一致。素在被比较总体之间的分布或构成是否一致。如比较某地甲亢的发病率,性别构成不同不如比较某地甲亢的发病率,性别构成不同不能直接比较能直接比较处理方法:标准化、多因素分析。处理方法:标准化、多因素分析。应用相对数应注意的问题应用相对数应注意的问题LOGO34345.5.对相对数的统计应对相对数的统计应考虑抽样误差考虑抽样误差:需进行需进行参数估计和假设检验参数估计和假设检验LOGO3535第三节、标准化法第三节、标准化法LOGO36366LOGO3737
15、(一)标准化的意义(一)标准化的意义v与其合计的差别之所以大,是由于两院中病人中病与其合计的差别之所以大,是由于两院中病人中病型构成不同。要正确比较甲、乙两院的总治愈率,型构成不同。要正确比较甲、乙两院的总治愈率,需需按照统一标准进行校正,然后进行比较。按照统一标准进行校正,然后进行比较。v当两组资料进行比较时,如果其内部不同小组率有当两组资料进行比较时,如果其内部不同小组率有明显差别,而且各小组内部构成也明显不同明显差别,而且各小组内部构成也明显不同 ,直,直接比较不合理。接比较不合理。LOGO3838标化法的基本思想标化法的基本思想:采用统一的标准构成,以消除构采用统一的标准构成,以消除构
16、成不同对各组总率的影响,使求得的标准化率具有可成不同对各组总率的影响,使求得的标准化率具有可比性。比性。标准化率标准化率:也称调整率,经标准化处理后的率也称调整率,经标准化处理后的率LOGO39391 1.选择标准:选择标准:标准人口数、标准人口构成比标准人口数、标准人口构成比选定标准的原则:选定标准的原则:有代表性的、较稳定的、数量较大的人群,有代表性的、较稳定的、数量较大的人群,对比组数据的合计等对比组数据的合计等2.2.计算标计算标准准化率:化率:LOGO4040标准构成:标准构成:1 1、某一组的人口数或人口构成;、某一组的人口数或人口构成;2 2、两组之和的人口数或人口构成;、两组之
17、和的人口数或人口构成;3 3、通用的或便于比较的标准。、通用的或便于比较的标准。标准化方法:直接法和间接法标准化方法:直接法和间接法(二)标准化率的(二)标准化率的计算:计算:LOGO4141直接法的使用条件直接法的使用条件是已经有被观察的人群中各年龄组的患是已经有被观察的人群中各年龄组的患病率(或发病率、死亡率等)资料。病率(或发病率、死亡率等)资料。第一步:选择方法第一步:选择方法直接法或间接法直接法或间接法若缺乏各年龄组的患病率资料,仅有各年龄组的观察单位若缺乏各年龄组的患病率资料,仅有各年龄组的观察单位数和总的患病率,则选择数和总的患病率,则选择间接法间接法 计算公式计算公式标准化率的
18、计算标准化率的计算LOGO4242计算公式:计算公式:(1 1)选择人口数作标准)选择人口数作标准 Ni:为标准年龄别人口数;Pi:为实际年龄别死亡率;N:为标准人口总数。1 1、标准化率的计算、标准化率的计算-直接法直接法是被标化组按标准组年龄组人口数算得得预期死亡数,除以标准组得总人口数就是直接法得标化率LOGO4343表16-3 用标准人口计算甲、乙两医院的标准化治愈率(直接法)科别科别标准人口标准人口原治愈率,原治愈率,P Pi i院预期治愈数院预期治愈数甲医院甲医院乙医院乙医院甲医院甲医院乙医院乙医院内科内科2000200065.065.063.063.013001300126012
19、60外科外科2000200094.094.091.091.01880188018201820传染传染1000100095.095.092.092.0950950920920合计合计5000500076.876.885.685.64130413040004000LOGO4444(2 2)选择人口构成比作标准)选择人口构成比作标准 标准组人口构成比(表标准组人口构成比(表16-4,P320)LOGO4545间接法:间接法:选择死亡率做标准选择死亡率做标准P:P:为标准总死亡率,为标准总死亡率,r:r:为实际总死亡数,为实际总死亡数,n ni i:为实际组别人口数,为实际组别人口数,P Pi i:为
20、标准年龄别死亡率,为标准年龄别死亡率,n ni iP Pi i:为预期死亡数,为预期死亡数,r/nr/ni iP Pi i:为标准化死亡比为标准化死亡比,用用SMRSMR表示。表示。2 2、标准化率的计算、标准化率的计算-间接法间接法什么是什么是SMRSMR?LOGO4646标准化死亡比(标准化死亡比(SMRSMR)v定义:定义:标准化死亡比标准化死亡比(standard mortality ratiostandard mortality ratio,简称,简称SMRSMR)是在死亡资料分析用的较多的一个相对是在死亡资料分析用的较多的一个相对数指标,是指某人群中实际观察到的死亡人数与该数指标,
21、是指某人群中实际观察到的死亡人数与该人群标准化后计算出的期望死亡人数之比。人群标准化后计算出的期望死亡人数之比。v计算公式:计算公式:LOGO4747年年龄龄标准化标准化死亡率死亡率(Pi)吸烟吸烟 不吸烟不吸烟 人数人数ni预期死亡预期死亡数数niPi人数人数ni预期死预期死亡数亡数niPi35354545555565657.047.0425.7025.70108.25108.25263.94263.944970549705426334263328117281171062410624189370189370 10476 104766004360043275402754013.3313.332
22、6.9226.9265.0065.0072.6972.697575451.87451.8761376137145321453265.6765.67合计合计34.6034.60137216137216 100.67 100.67396247396247243.61243.613.53.510.9610.9630.4430.4428.0428.0427.7327.73已知吸烟者中死于肺癌人数为已知吸烟者中死于肺癌人数为432432人,不吸烟者中死于肺癌人,不吸烟者中死于肺癌210210人人2 2、标准化率的计算、标准化率的计算-间接法间接法吸烟标化吸烟标化死亡死亡率率=P Pr r/nni iP
23、Pi i=34.60432/100.67=148.48/10=34.60432/100.67=148.48/10万万不吸烟标化不吸烟标化死亡死亡率率=P Pr r/nni iP Pi i=34.60210/243.61=29.83/10=34.60210/243.61=29.83/10万万LOGO4848v内部构成不同的率比较时应标准化后再比较;内部构成不同的率比较时应标准化后再比较;选定的标准不选定的标准不同,算得的标准化率也不同。当比较几个标准化率时,应采同,算得的标准化率也不同。当比较几个标准化率时,应采用统一标准。用统一标准。v标准化后的率并不表示率的实际水平,只能表示相互比较资标准化
24、后的率并不表示率的实际水平,只能表示相互比较资料间的相对水平。料间的相对水平。v各组分率大小交叉出现时则不宜采用标准化法处理;各组分率大小交叉出现时则不宜采用标准化法处理;如不就如不就算标准化率,而分别比较各分组的率,也可得出正确结论,算标准化率,而分别比较各分组的率,也可得出正确结论,但不能比较总率的大小。但不能比较总率的大小。v两样本标准化率是样本值,存在抽样误差,若想得出标化组两样本标准化率是样本值,存在抽样误差,若想得出标化组和被标化组的总率是否相等的结论,还应作假设检验。和被标化组的总率是否相等的结论,还应作假设检验。标准化时的注意事项标准化时的注意事项LOGO4949小小 结结v掌
25、握率、构成比、相对比的概念、计算方法掌握率、构成比、相对比的概念、计算方法v标准化法的基本思想和计算方法标准化法的基本思想和计算方法LOGO5050v分类变量数据的统计描述方法包括计算相对数指标和必要时分类变量数据的统计描述方法包括计算相对数指标和必要时计算标准化率。常用的相对数指标包括:率、构成比和相对计算标准化率。常用的相对数指标包括:率、构成比和相对比。用率的大小反映某现象发生的频率和强度,用构成比说比。用率的大小反映某现象发生的频率和强度,用构成比说明事物中某部分在全体中的比重大小,明事物中某部分在全体中的比重大小,用相对比表明甲事物用相对比表明甲事物的大小是乙事物的多少倍或几分之几。
26、的大小是乙事物的多少倍或几分之几。v 相对数的计算比较容易,但也容易发生错误。常见的错相对数的计算比较容易,但也容易发生错误。常见的错 误有:误有:把构成比的大小当事物发生的强度或频率来解把构成比的大小当事物发生的强度或频率来解 释;释;计算率的分母较小;计算率的分母较小;用率的算术平均值作为平用率的算术平均值作为平 均率;均率;比较总体率时未注意可比性。比较总体率时未注意可比性。v 进行总率的比较时,影响率高低的某因素内部构成不进行总率的比较时,影响率高低的某因素内部构成不 同,需首先进行率的标准化处理,其步骤包括选择方同,需首先进行率的标准化处理,其步骤包括选择方 法、标准和计算标准化率。
27、法、标准和计算标准化率。LOGO51511.1.某某地地某某年年肝肝炎炎发发病病人人数数占占同同年年传传染染病病人人数数的的10.1%10.1%,这是一种(,这是一种()指标。)指标。A.A.率率 B.B.构成比构成比C.C.发病率发病率 D.D.集中趋势集中趋势E.E.时点患病率时点患病率课堂练习LOGO52522.2.某某项项关关于于某某种种药药物物的的广广告告声声称称:“在在服服用用本本制制剂剂的的10001000名名上上呼呼吸吸道道感感染染的的儿儿童童中中,有有970970名名儿儿童童在在7272小小时时内内症症状状消消失失。”因因此此推推断断此此药药治治疗疗儿儿童童的的上上呼呼吸吸道
28、道感感染染是是非非常常有有效效的的,可以推广应用。这项推论是(可以推广应用。这项推论是()。)。A.A.不正确,因所作的比较不是按率计算的不正确,因所作的比较不是按率计算的 B.B.不正确,因未设对照组或对比组不正确,因未设对照组或对比组 C.C.不正确,因未作统计学假设检验不正确,因未作统计学假设检验 D.D.正确正确,因为比较的是症状消失率因为比较的是症状消失率 E.E.正确正确,因为有效率达到因为有效率达到97.0%97.0%课堂练习LOGO53533.3.某某地地某某年年肝肝炎炎发发病病人人数数占占同同年年传传染染病病人人数数的的 10.1%10.1%,这是一种(,这是一种()指标。)
29、指标。A.A.率率 B.B.构成比构成比 C.C.发病率发病率 D.D.集中趋势集中趋势 E.E.时点患病率时点患病率4.4.计算某地某年肺癌发病率,其分母应为(计算某地某年肺癌发病率,其分母应为()。)。A.A.该地体检人数该地体检人数 B.B.该地年平均就诊人数该地年平均就诊人数 C.C.该地年平均人口数该地年平均人口数 D.D.该地平均患者人数该地平均患者人数 E.E.该地易感人群该地易感人群课堂练习LOGO54545.5.一一种种新新的的治治疗疗方方法法可可以以延延长长生生命命,但但不不能能治治愈愈其其病病,则发生下列情况(则发生下列情况()。)。A.A.该病患病率将增加该病患病率将增
30、加 B.B.该病患病率将减少该病患病率将减少C.C.该病发病率将增加该病发病率将增加 D.D.该病发病率将减少该病发病率将减少 E.E.与患病率和发病率均无关与患病率和发病率均无关6.6.在使用相对数时,容易犯的错误是(在使用相对数时,容易犯的错误是()。)。A.A.将构成比当作率看待将构成比当作率看待 B.B.将构成比当作相对比看待将构成比当作相对比看待 C.C.将率当作构成比看待将率当作构成比看待 D.D.将率当作相对比看待将率当作相对比看待 E.E.将标化率当作构成比看待将标化率当作构成比看待课堂练习LOGO55557.7.已已知知男男性性的的钩钩虫虫感感染染率率高高于于女女性性。欲欲比
31、比较较甲甲、乙乙两两乡乡居居民民的的钩钩虫虫总总感感染染率率,但但甲甲乡乡人人口口女女多多于于男男,而而乙乙乡乡男男多多于女,适当的比较方法是(于女,适当的比较方法是()。)。A.A.分性别进行比较分性别进行比较 B.B.两个率比较的两个率比较的 2 2检验检验 C.C.不具可比性,不能比较不具可比性,不能比较 D.D.对性别进行标准化后再比较对性别进行标准化后再比较 E.E.作两个总率差别的假设检验作两个总率差别的假设检验课堂练习LOGO56568.8.要要比比较较甲甲乙乙两两厂厂某某工工种种工工人人某某种种职职业业病病患患病病率率的的高高低低,采取标准化法的原理是(采取标准化法的原理是()
32、。)。A.A.假设甲乙两厂的工人数相同假设甲乙两厂的工人数相同 B.B.假设甲乙两厂患某职业病的工人数相同假设甲乙两厂患某职业病的工人数相同 C.C.假设甲乙两厂某工种工人的工龄构成比相同假设甲乙两厂某工种工人的工龄构成比相同 D.D.假设甲乙两厂某职业病的患病率相同假设甲乙两厂某职业病的患病率相同 E.E.假设甲乙两厂的工人数构成相同假设甲乙两厂的工人数构成相同课堂练习LOGO57579.9.要要比比较较甲甲乙乙两两厂厂工工人人患患某某种种职职业业病病的的患患病病率率,对对工工龄龄进进行行标标化化,其标准构成的选择是(其标准构成的选择是()。)。A.A.甲厂工人的年龄构成甲厂工人的年龄构成
33、B.B.乙厂工人的年龄构成乙厂工人的年龄构成 C.C.甲乙两厂合并的工人的年龄构成甲乙两厂合并的工人的年龄构成 D.D.当地较稳定人口的年龄构成当地较稳定人口的年龄构成 E.E.甲乙两厂合并的工人的工龄构成甲乙两厂合并的工人的工龄构成课堂练习LOGO585810.10.某某项项关关于于某某种种药药物物的的广广告告声声称称:“在在服服用用本本制制剂剂的的10001000名名上上呼呼吸吸道道感感染染的的儿儿童童中中,有有970970名名儿儿童童在在7272小小时时内内症症状状消消失失。”因因此此推推断断此此药药治治疗疗儿儿童童的的上上呼呼吸吸道道感感染染是是非非常常有有效效的的,可可以以推推广广应应用用。这项推论是(这项推论是()。)。A.A.不正确,因所作的比较不是按率计算的不正确,因所作的比较不是按率计算的 B.B.不正确,因未设对照组或对比组不正确,因未设对照组或对比组 C.C.不正确,因未作统计学假设检验不正确,因未作统计学假设检验 D.D.正确正确,因为比较的是症状消失率因为比较的是症状消失率 E.E.正确正确,因为有效率达到因为有效率达到97.0%97.0%11.11.定基比和环比属于(定基比和环比属于()指标。)指标。A.A.平均数平均数 B.B.构成比构成比 C.C.频率频率 D.D.相对比相对比 E.E.发展速度发展速度课堂练习
限制150内