计数资料的统计描述.ppt
计数资料的统计描述计数资料的统计描述ContentvRate、constituent ratio and ratio vApplication of relative measurement vStandardization rate vDynamic series 第五章第五章计数资料的统计描述计数资料的统计描述v常用的相对数:v一、率。v二、构成比v三、相对比计数资料的统计描述计数资料的统计描述v计数资料常见的数据形式是绝对数,如某病的出院人数、治愈人数、死亡人数等。v但绝对数通常不具有可比性:v1、如甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义v2、如00级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义v因此需要在绝对数的基础上计算相对数。第一节第一节 常用相对数常用相对数一、率率:说明某现象发生的频率或强度。常以百分率(%)、千分率()、万分率(1/万)、十万分率(1/10万)等表示,计算公式为:第一节第一节 常用相对数常用相对数v式中比例基数,可以取100%、1000、10万/10万等。v比例基数的选择主要根据习惯用法和使计算的结果能保留12位整数,以便阅读。例如患病率通常用百分率、婴儿死亡率用千分率、肿瘤死亡率以十万分率表示。第一节第一节 常用相对数常用相对数v例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。v高血压患病率为:v2823/8589 100%=32.87%。第一节第一节 常用相对数常用相对数v二、构成比v构成比:表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。v通常以100%为比例基数。其计算公式为第一节第一节 常用相对数常用相对数v 设某事物个体数的合计由A1,A2,Ak个部分组成,构成比的计算为:.第一节第一节 常用相对数常用相对数 例5-2 某医院1990年和1998年住院病人死于五种疾病的人数见表5-1。1990年因五种疾病死亡的人数共190人,其中死于恶性肿瘤者58人,恶性肿瘤死亡人数占五种疾病死亡人数的构成比为58/190100%=30.53%。同理可分别计算出1990年和1998年循环系统疾病、呼吸系统疾病等死亡占五种疾病死亡人数的构成比,结果见表5-1。第一节第一节 常用相对数常用相对数第一节第一节 常用相对数常用相对数v从表5-1可以看出该医院1990和1998两年五种疾病死亡构成比的排序不同。1990年五种疾病死亡人数中恶性肿瘤所占比重最大,其次为循环系统疾病,消化系统疾病死亡占的比重最小;v1998年循环系统疾病占五种疾病死亡人数的比重最大,其次为恶性肿瘤,消化系统疾病、传染病死亡则占比重最小。第一节第一节 常用相对数常用相对数v构成比有两个特点:v(1)说明同一事物的k个构成比的总和应等于100%,即各个分子的总和等于分母。v(2)各构成部分之间是相互影响的,某一部分比重的变化受到两方面因素的影响。其一是这个部分自身数值的变化,其二是受其它部分数值变化的影响。第一节第一节 常用相对数常用相对数v表5-1中,1990与1998年住院病人五种疾病死因构成的总和均为100%。v1998年呼吸系统疾病死亡人数比1990年少,但构成比却比较接近;再看两年的循环系统疾病死亡人数相同,而1998年的构成比却较1990年高,这不能说明1998年循环系统疾病的病死严重程度较1990年高。v死因构成比只能说明某病死亡人数在总死亡人数中所占比重,如需要比较其病死的严重程度,则要计算病死率。第一节第一节 常用相对数常用相对数v三、相对比v相对比简称比(ratio),是两个有关指标之比,说明两指标间的比例关系。v两个指标可以是性质相同,如不同时期发病数之比;也可以性质不同,如医院的门诊人次与病床数之比。通常以倍数或百分数(%)表示。第一节第一节 常用相对数常用相对数v计算公式为v式中两指标可以是绝对数、相对数或平均数。第一节第一节 常用相对数常用相对数v例5-3 某年某医院出生婴儿中,男性婴儿为370人,女性婴儿为358人,则出生婴儿性别比例为370/358100=103,说明该医院该年每出生100名女婴儿,就有103名男性婴儿出生,它反映了男性婴儿与女性婴儿出生的对比水平。v据大量观察,出生婴儿男多于女,出生性别比一般在104107之间。这个医院的出生性别比为103,说明该年该医院出生女婴相对较多。第二节第二节 应用相对数的注意事项应用相对数的注意事项v1、计算相对数应有足够数量即分母不宜太小。v 如果例数较少会使相对数波动较大。如某种疗法治疗5例病人5例全部治愈,则计算治愈率为55100%=100%,若4例治愈,则治愈率为45100%=80%,由100%至80%波动幅度较大,但实际上只有1例的变化。在临床试验或流行病调查中,各种偶然因素都可能导致计算结果的较大变化,因此例数很少的情况下最好用绝对数直接表示。第二节第二节 应用相对数的注意事项应用相对数的注意事项v但动物实验时,可以通过周密设计,严格控制实验条件,例如毒理实验,每组用10只纯种小鼠也可以了。v分母到底多大才可以呢?v要根据研究目的、研究指标而定!第二节第二节 应用相对数的注意事项应用相对数的注意事项v2、不能以构成比代替率v构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度,在实际工作中经常会出现将构成比指标按率的概念去解释的错误例如表5-2研究已婚育龄妇女在不同情况下放置避孕环与失败率的关系。第二节第二节 应用相对数的注意事项应用相对数的注意事项第二节第二节 应用相对数的注意事项应用相对数的注意事项v临床工作者常常用门诊或住院病人的资料来分析疾病与年龄、性别、职业等因素的关系。但值得注意的是所计算的相对数一般都是构成比,不能当作率来分析。第二节第二节 应用相对数的注意事项应用相对数的注意事项v例如,某医师对口腔门诊不同年龄龋齿患病情况(表5-3)进行了分析,得出4049岁组患病率高,09岁组和70岁及以上组患病率低的错误结论。v第二节第二节 应用相对数的注意事项应用相对数的注意事项第二节第二节 应用相对数的注意事项应用相对数的注意事项v表5-3资料仅能说明该病门诊龋齿患者中各年龄组病人所占比重,只能计算构成比指标,不能反映各年龄组的患病水平,因此不能根据此资料认为4049岁组患病率高,而老年组和少年组低。因为各年龄组人口数、就诊机会等因素,都会影响就诊病人的年龄构成。仅通过门诊记录是不能够得到各年龄组人口数和全部现患病例数的,所以不能分析年龄因素与患病水平的关系。第二节第二节 应用相对数的注意事项应用相对数的注意事项v了解不同年龄龋齿患病情况,需要通过人群的抽样调查,了解各年龄组的调查人数及所有现患病例数,才能分别计算年龄别患病率,从而分析龋齿患病水平与年龄大小的关系。第二节第二节 应用相对数的注意事项应用相对数的注意事项v3.正确计算合计率v对分组资料计算合计率或称平均率时,不能简单地由各组率相加或平均而得,而应用合计的有关实际数字进行计算。例如用某疗法治疗肝炎,甲医院治疗150人,治愈30人,治愈率为20%;乙医院治疗100人,治愈30人,治愈率 为 30%。两 个 医 院 合 计 治 愈 率 应 该 是(30+30)/(150+100)100%=24%。若算为20%+30%=50%或(20%+30%)/2=25%,则是错的。第二节第二节 应用相对数的注意事项应用相对数的注意事项v4.注意资料的可比性在比较相对数时,除了要对比的因素(如不同的药物),其余的影响因素应尽可能相同或相近。在临床研究和动物实验时,应遵循随机抽样原则进行分组。第二节第二节 应用相对数的注意事项应用相对数的注意事项v下列因素可能影响对比组之间的可比性:v(1)观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、周围环境、风俗习惯和经济条件是否一致或相近等。v(2)观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同,可以分别进行同年龄别、同性别的小组率比较或对总率(合计率)进行标准化后再作比较(见本章第三节)。第二节第二节 应用相对数的注意事项应用相对数的注意事项v5.对比不同时期资料应注意客观条件是否相同例如,疾病报告制度完善和资料完整的地区或年份,发病率可以“升高”;居民因医疗普及,就诊机会增加,或诊断技术提高,也会引起发病率“升高”。因此在分析讨论时,应根据各方面情形全面考虑,慎重对待。v6.样本率(或构成比)的比较应做样本率(或构成比)假设检验。第三节第三节 率的标准化法率的标准化法v一、标准化法的意义和基本思想v当比较的两组或多组资料,其内部各小组率明显不同,且各小组观察例数的构成比,诸如年龄、性别、工龄、病情轻重、病程长短等也明显不同时,直接比较两个或多个合计率是不合理的。因为其内部构成不同,往往影响合计率大小。第三节第三节 率的标准化法率的标准化法v例如表5-4两种疗法的治愈率比较。第三节第三节 率的标准化法率的标准化法v要正确比较两种疗法的合计治愈率,必须先将两组治疗对象的病型构成按照统一标准进行校正,然后计算出校正后的标准化病死率再进行比较。这种用统一的内部构成,然后计算标准化率的方法,称为标准化法。v标准化法的基本思想是:采用某影响因素的统一标准构成以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比性。第三节第三节 率的标准化法率的标准化法v二、标准化率的计算v(一)标准化方法v1、直接法v2、间接法v根据已有资料的条件,采用不同的方法计算标准化率。v如对死亡率的年龄构成标准化,若已知年龄别死亡率,可采用直接法;v若只有总死亡数和年龄别人口数而缺乏年龄别死亡率时,或各年龄组人口数较小,年龄别死亡率不稳定时,宜用间接法。第三节第三节 率的标准化法率的标准化法v标准化法计算的关键是选择统一的标准构成。选择标准构成的方法通常有三种:v1.两组资料中任选一组资料的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。v2.两组资料各部分人口之和组成的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。v 3.另外选用一个通用的或便于比较的标准作为两者的“共同标准”,如采用全国、全省或全地区的数据作为标准。第三节第三节 率的标准化法率的标准化法v(二)计算标准化率v计算标准化率的步骤可归纳为:v1.根据对比资料所具备的条件选用直接法或间接法。v2.选定标准构成。v3.选择公式(5-4)、(5-5)或(5-6)计算标准化率,现以死亡率的年龄构成标准化为例说明标准化率的计算。第三节第三节 率的标准化法率的标准化法v(1)直接法的计算:v选择年龄别人口数作标准时,直接法标准化率的计算公式为:(5-4)Ni为标准年龄别人口数,为实际年龄别死亡率 N为标准人口总数。是预期死亡数,它除以标准人口总数N即得直接法的标准化死亡率。第三节第三节 率的标准化法率的标准化法v选择年龄别人口构成比作标准时,直接法标准化率的计算公式为:vNi/N为标准年龄别人口构成比,乘以实际年龄别死亡率,其乘积和也是直接法的标准化死亡率。第三节第三节 率的标准化法率的标准化法v(2)间接法的计算:v选择年龄别死亡率作标准,间接法标准化率的计算公式为:第三节第三节 率的标准化法率的标准化法v标准总死亡率与SMR的乘积即得间接法的标准化死亡率。v需要说明的是,SMR这个指标在流行病学中用的较多,v若SMR 1,表示被标化人群的死亡率高于标准组;v反之,若SMR 1,表示被标化人群的死亡率低于标准组。v但样本的SMR有抽样误差,在单独使用SMR这个指标时,还需作总体SMR是否为1的假设检验。第三节第三节 率的标准化法率的标准化法v(三)标准化率的计算步骤1.直接标准化(1)用标准人口数计算:例5-4对表5-4资料,求甲、乙两种疗法标准化治愈率。第三节第三节 率的标准化法率的标准化法第三节第三节 率的标准化法率的标准化法v其步骤如下:v1)已知甲、乙两种疗法各病型的治愈率,宜采用直接法。v2)选定甲、乙两种疗法各病型的治疗人数之和作标准,见表5-5第(2)栏。v3)求预期治愈人数。将各组标准治疗人数分别乘甲、乙两种疗v法的原治愈率,即得不同病型的甲、乙两种疗法预期治愈人数,见表5-5第(4)、(6)栏。v4)计算甲、乙两种疗法的标准化治愈率。第三节第三节 率的标准化法率的标准化法第三节第三节 率的标准化法率的标准化法经标准化后,乙疗法治愈率高于甲疗法,与分组比较的治愈率结论一致,校正了标准化前甲疗法治愈率高于乙疗法的不妥结论。第三节第三节 率的标准化法率的标准化法v(2)用标准人口构成比计算第三节第三节 率的标准化法率的标准化法v2.间接标准化法v例5-6 经研究表明,女性原发性骨质疏松随年龄增长患病率增高。1998年某省在城市和农村分别抽样调查了50岁以上的老年妇女776例和789例,这些人中患有原发性骨质疏松症者城市为322例,农村为335例,总患病率分别为41.5%和42.5%。v由于本次调查的城乡老年妇女年龄构成不同,如表5-7第2栏和第5栏,需对两个总患病率进行标准化后方可比较。第三节第三节 率的标准化法率的标准化法第三节第三节 率的标准化法率的标准化法第三节第三节 率的标准化法率的标准化法第三节第三节 率的标准化法率的标准化法v三、应用标准化时的注意事项v1.标准化法只适用于某因素两组内部构成不同,并有可能影响两组总率比较的情况。对于因其它条件不同而产生的不具可比性问题,标准化法不能解决。v2.由于选择的标准人口不同,算出的标准化率也不同。因此,当比较几个标准化率时,应采用同一标准人口。第三节第三节 率的标准化法率的标准化法v3.标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。如比较城乡女性原发性骨质疏松症患病率时,经过标准化后的患病率,已不是两地当时实际原发性骨质疏松症患病水平,但它能够说明在共同标准下,城市和农村女性原发性骨质疏松症患病水平相比较,谁高谁低。v4.两样本标准化率是样本值,存在抽样误差。比较两样本的标准化率,当样本含量较小时,还应作假设检验。第四节第四节动态数列及其分析指标动态数列及其分析指标v动态数列(dynamicseries):是一系列按时间顺序排列起来的统计指标(可以为绝对数,相对数或平均数),用以观察和比较该事物在时间上的变化和发展趋势。v常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。动态数列的两个要素:动态数列的两个要素:时点或时期:时点或时期:统计指标:统计指标:基期基期 报告期报告期 末期末期例5-7某医院1991-1999年日门诊量的统计数据见表5-9第(1)、(3)栏,试作动态分析。表表5-9某医院某医院1991-1999年日门诊量动态变化年日门诊量动态变化 一、绝对增长量累累计计增增长长量量(),即即报报告告期期指指标与基期指标之差。标与基期指标之差。逐逐年年增增长长量量(),即即报报告告期期指标与前一期指标之差。指标与前一期指标之差。绝对增长量是说明事物在一定时绝对增长量是说明事物在一定时期增长的绝对值。期增长的绝对值。二、发展速度与增长速度定定 基基 比比,即即 报报 告告 期期 指指 标标 与与 基基 期期 指指 标标 之之 比比,用用 符符 号号 表表 达达 为为 :a1/a0,a2/a0,.,an/a0。环环比比,即即报报告告期期指指标标与与其其前前一一期期指指标标之之比比,用用符符号号表表达达为为:a1/a0,a2/a1,.,an/an-1。增增长长速速度度表表示示的的是净增加速度。是净增加速度。增长速度增长速度=发展速度发展速度1(100%)。)。均为相对比均为相对比,说明事物在一定时期的速度变,说明事物在一定时期的速度变化。发展速度表示报告期指标的水平相当于基期水化。发展速度表示报告期指标的水平相当于基期水平的百分之多少或若干倍,平的百分之多少或若干倍,三、平均发展速度和平均增长速度平平均均发发展展速速度度是是各各环环比比发发展展速速度度的的几几何何平平均均数数,说说明明某某事事物物在在一一个个较较长长时时期期中中逐逐期期(如如逐逐年年)平平均均发发展展的的程度。程度。平平均均增增长长速速度度是是各各环环比比增增长长速速度度的的平平均均数数,说说明明某某事事物在一个较长时期中逐期平均增长的程度。物在一个较长时期中逐期平均增长的程度。其计算公式为其计算公式为式中a0为基期指标;an为第n期指标。平均增长速度=平均发展速度1对例5-7计算平均发展速度与平均增长速度:动态数列分析还可以进行预测,即根据平均发展速度公式(5-7)计算几年后达到的指标。如根据表5-9资料预测2001年的日门诊量,本例2001年相当于,将已知数据代入公式(5-7)a10=1.14110 1200=4488(人次)(人次)即即根根据据该该医医院院1991-1999年年的的平平均均发发展展速速度度,预预计计到到2001年该医院的日门诊量可达年该医院的日门诊量可达4488人次。人次。