《分类资料的统计描述2.ppt》由会员分享,可在线阅读,更多相关《分类资料的统计描述2.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、分类资料的统计描述分类资料的统计描述山东大学公共卫生学院山东大学公共卫生学院2内容提纲内容提纲分类资料的频数表常用的相对数指标应用相对数时应注意的事项率的标准化3p分类变量资料:分类变量资料:将观察单位按属性或类别计数所得的资料。p各类别及其相应的观察单位数构成频数表频数表。分类变量资料频数表编制方法简单。一、分类变量资料的频数表一、分类变量资料的频数表4市区急性传染病发生数A2433B3033C1650D 1503E1282F1853G1130合计12884表表 2-6 某市某年各区急性传染病发病数某市某年各区急性传染病发病数 分类变量资料的频数表分类变量资料的频数表5相对数(relativ
2、e number):由两个数值之比计算得到,此类指标通称相对数或比例指标。绝对数(absolute number):直接统计得到的频数。实际应用中,常把相对数与绝对数结合应用。常用的相对数指标:率、构成比和相对比。二、分类资料的描述指标二、分类资料的描述指标61. 率率率率(rate):用于说明某现象发生的频率或强度,又称频率指标或强度指标。计算公式:式中,K为比例基数,常用的K有100%或1000、 10000/万、100000/10万等。选择K的原则:根据习惯用法,如治愈率、某病病死率、人工流产率等用百分率;出生率、婴儿死亡率等用千分率;恶性肿瘤死亡率用十万分率;使算得的率至少保留12位整
3、数。 K单位总数可能发生某现象的观察总数发生某现象的观察单位率7率率 rate速率速率:反映单位时间内某现象发生的强度,如发病率、死亡率。频率频率:反映研究对象中某现象出现或存在的频率。分母无时间量纲,且分子是分母的一部分。如患病率、治愈率、病死率。率率8发病率 (incidence rate)患病率 (prevalence rate)医学研究中常用的率:死亡率( mortality rate)病死率 (fatality rate)9医学研究中常用的率医学研究中常用的率p发病率发病率(incidence rate):指在一定期间内、一定人群中某病新发病例新发病例出现的频率。用来说明居民在一定时
4、期内某病的发病水平。分子分子是一定期间内的新发病人数,若在观察期间内一个人多次是一定期间内的新发病人数,若在观察期间内一个人多次患病时,则应多次计为新发病例数,如流感等。患病时,则应多次计为新发病例数,如流感等。分母分母中所规定的暴露人口是指可能会发生该病的人群,对那些中所规定的暴露人口是指可能会发生该病的人群,对那些不可能患该病的人,如传染病的非易感者,已接种疫苗的有效不可能患该病的人,如传染病的非易感者,已接种疫苗的有效者,不应计入分母内。但实际工作中不易做到,故分母多用同者,不应计入分母内。但实际工作中不易做到,故分母多用同期平均人口数。期平均人口数。常用于病因学研究。常用于病因学研究。
5、万千,或,/10000/1000%100k 同同时时期期暴暴露露人人口口数数病病新新病病例例数数一一定定期期间间内内某某人人群群中中某某发发病病率率10p患病率患病率(prevalence rate):也称现患率,指某特定时间内总人口中,某病现患病例数(包括新和旧病例)所占的比例。按观察时间不同分为期间患病率和时点患病率。k该该时时点点人人口口数数患患某某病病新新旧旧病病例例数数某某一一时时点点一一定定人人群群中中现现时时点点患患病病率率k同同期期的的平平均均人人口口数数现现患患某某病病新新旧旧病病例例数数某某观观察察期期间间一一定定人人群群中中期期间间患患病病率率医学研究中常用的率医学研究中
6、常用的率患病率大小主要受发病率和病程两个因素影响。对病程较短的急患病率大小主要受发病率和病程两个因素影响。对病程较短的急性病意义不大。性病意义不大。常用于反映病程较长的慢性病的发生或流行情况,为规划医疗设常用于反映病程较长的慢性病的发生或流行情况,为规划医疗设施、估计医院床位周转、评估医疗质量和医疗费用的投入等提供科施、估计医院床位周转、评估医疗质量和医疗费用的投入等提供科学依据。学依据。11p死亡率死亡率(mortality rate):表示在一定期间内,在一定人群中,死于某病(或死于所有原因)的频率。是测量人群死亡危险最常用的指标。用于衡量某一时期、一个地区人群的死亡危险性大小。常以年为单
7、位。死亡率可按病种、年龄、性别、职业等分类计算死亡专率,死亡率可按病种、年龄、性别、职业等分类计算死亡专率,用于探讨病因和评价防治措施。用于探讨病因和评价防治措施。死于所有原因的死亡率称为某人群的粗死亡率或总死亡率,死于所有原因的死亡率称为某人群的粗死亡率或总死亡率,通常以千分率表示。通常以千分率表示。k同同期期平平均均人人口口数数亡亡总总数数某某期期间间内内( (因因某某病病) )死死死死亡亡率率医学研究中常用的率医学研究中常用的率12p病死率病死率(fatality rate):表示一定时期内(通常为1年),患某病的全部病人中因该病死亡者的比例。病死率表示确诊疾病的死亡概率,可表明疾病的严
8、重程度,病死率表示确诊疾病的死亡概率,可表明疾病的严重程度,也可反映医疗水平和诊断能力,通常多用于急性传染病,较也可反映医疗水平和诊断能力,通常多用于急性传染病,较少用于慢性病。少用于慢性病。用病死率作为评价不同医院的医疗水平时,要注意可比性。用病死率作为评价不同医院的医疗水平时,要注意可比性。%100同同期期患患某某病病的的病病人人数数数数某某时时期期内内因因某某病病死死亡亡人人病病死死率率医学研究中常用的率医学研究中常用的率13构成比构成比(proportion),又称构成指标,说明某事物(或现象)内部各组成部分所占的比重或分布,常以百分数表示。计算公式:注意:注意:所有组成部分的构成比之
9、和应等于所有组成部分的构成比之和应等于100%100%; 同一事物内部各组成部分的构成比,计算时小同一事物内部各组成部分的构成比,计算时小 数点后保留位数应相同。数点后保留位数应相同。2. 构成比构成比%100观观察察单单位位数数同同一一事事物物各各组组成成部部分分的的位位数数某某一一组组成成部部分分的的观观察察单单构构成成比比14相对比相对比(relative ratio),亦称比,是A、B 2个有关指标之比,说明A为B的若干倍或百分之几。计算公式为:两个指标可以是性质相同的,也可以是性质不同的;可以是绝对数,也可以是相对数或平均数。同类指标:同类指标:相对比用以说明两事物的相对水平。常以百
10、分数或倍数相对比用以说明两事物的相对水平。常以百分数或倍数表示,如人口出生性别比、两病区病床数之比。流行病学中常用的表示,如人口出生性别比、两病区病床数之比。流行病学中常用的相对危险度相对危险度(RR)(RR)、比数比、比数比(OR)(OR)也为此类。也为此类。不同类指标:不同类指标:如人口密度如人口密度( (人人/ /平方公里平方公里) )、医生数、医生数/ /千人口、病床数千人口、病床数/ /千人口、小鼠肝重与体重之比等。千人口、小鼠肝重与体重之比等。3. 相对比相对比1 10 00 0% %)(或或B BA A相相对对比比15相对比例:某年某机构调查了山东省新生儿神经管缺陷的发生情况。在
11、50954名男性新生儿中检出神经管缺陷者169例;47882名女性新生儿中检出神经管缺陷者303例。则 神经管缺陷儿的出生性别比为 男女新生儿神经管缺陷的发生率之比为56. 03031695241. 0%33. 6%32. 347882/30350954/169oo1617动态数列及其分析指标动态数列及其分析指标相对比是相对数的最简单形式,常用于动态数列的分析。动态数列(动态数列(dynamic series)是按时间顺序排列起来的一系列统计指标(包括绝对数、相对数和平均数),用来说明某事物在时间上的变化和发展趋势。常用的分析指标:绝对增长量、发展速度和增长速度、平绝对增长量、发展速度和增长速
12、度、平均发展速度和平均增长速度均发展速度和平均增长速度等。18 动态数列的两个要素:动态数列的两个要素:时点或时期:时点或时期:统计指标:统计指标: 基期基期 报告期报告期 末期末期012,inttttt012,ina a aaa动态数列及其分析指标动态数列及其分析指标19表表5 5 某地某地19911999年病床数的发展动态年病床数的发展动态%7 .115157. 11400450080nnaa平均发展速度平均发展速度平均增长速度平均增长速度= =1.157-1=0.157=15.7%20动态数列的分析指标p绝对增长量:说明事物在一定时期所增加的绝对数量。绝对增长量:说明事物在一定时期所增加
13、的绝对数量。累计增长量 : 以初期水平为基数,各时间水平与之相减所得差值。 逐年增长量 :各时间水平与相邻上一时间水平的差值。 p发展速度:发展速度: 定基发展速度 环比发展速度p增长速度增长速度: : 增长速度增长速度= =发展速度发展速度-1 -1 定基增长速度 环比增长速度p平均发展速度平均发展速度: : 各时期或时点环比发展速度的几何均数。各时期或时点环比发展速度的几何均数。p平均增长速度:平均增长速度: 平均增长速度平均增长速度= =平均发展速度平均发展速度-1-1 nnnnnnnaaaaaaaaaa00112211平均发展速度平均发展速度计算相对数的分母不宜过小 21三、应用相对数
14、时应注意的事项三、应用相对数时应注意的事项分析时不能以构成比代替率 对观察单位数不等的几个率,不能直接相加求其平均率 比较相对数时应注意其可比性 对样本率(或构成比)的比较应遵循随机抽样,并做假设检验 23错例辩析错例辩析某医院拟分析畸形儿与母亲分娩年龄的关系,检查了新生儿某医院拟分析畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,其中畸形儿例,其中畸形儿116例,得以下资料例,得以下资料,并据此得出结论:并据此得出结论:“母亲年母亲年龄在龄在2429岁时,畸形儿最多,占总数的岁时,畸形儿最多,占总数的92.2%,故,故2429岁的岁的妇女生育的新生儿发生畸形的危险性最高。妇女生育的新生儿
15、发生畸形的危险性最高。”母亲年龄212324252627282930313233合计畸形儿例数121419241819133111116(%)0.861.712.116.420.715.516.411.22.60.860.860.8610092.2%以构成比代替率以构成比代替率!24错例辩析错例辩析p例如,某医师对口腔门诊不同年龄龋齿患病情况进行了例如,某医师对口腔门诊不同年龄龋齿患病情况进行了分析,得出分析,得出4049岁组患病率高,岁组患病率高,09岁组和岁组和70岁及以上岁及以上组患病率低的错误结论。组患病率低的错误结论。p 以构成比代替率以构成比代替率!分类资料的统计描述25例例: 求
16、几组资料的平均率求几组资料的平均率26平均及格率平均及格率=(100%+90%+80%+70%)/4=85%平均及格率平均及格率=169/210 100%=80.48%27例:率的可比性例:率的可比性p为比较不同医院的医疗水平,用同一病种住院病人的病死率作为评价指标,应注意哪些问题?p在某种恶性肿瘤如食管癌的病因学研究中,比较甲、乙两地人群食管癌的死亡率,发现甲地高于乙地,认为甲地居民的生活习惯易导致食管癌的发生。依据是否充分?28从年龄结构来看,乙地的人口较甲地年轻化!从年龄结构来看,乙地的人口较甲地年轻化!食管癌死亡率随年龄增大而增加。食管癌死亡率随年龄增大而增加。29甲地感染性腹泻发病率
17、高于乙地?甲地感染性腹泻发病率高于乙地?30标准化的目的标准化的目的标准化法的基本思想标准化法的基本思想标准组的选择标准组的选择标准化率的计算标准化率的计算四、标准化法四、标准化法31标准化标准化(standardization)的目的的目的在于消除混杂因素(confounding factor)对结果的影响,使资料具有可比性。例如,欲比较两地的总死亡率,若两地的年龄、性别等构成不同,而年龄、性别等又影响死亡率时,则年龄、性别等为混杂因素,使两地总死亡率无可比性。为消除年龄、性别等的影响,可用标准化法。1. 标准化的目的标准化的目的32标准化法的基本思想标准化法的基本思想:将所比较的两组或多组
18、资料的构成按统一的“标准”调整后,计算标化率,使其具有可比性。p需指定一个标准的人口构成,消除内部构成的影响。2. 标准化的基本思想标准化的基本思想333. 标准组的选择标准组的选择以公认的或便于与他人资料比较的标准作为标准组,例如,用全国、全省或本地区的年龄别人口构成作为标准;以两组资料合并的各年龄组的人口数或构成比作为标准组;以两组资料中任一组的年龄别人口数或构成比作为标准组。p应根据研究目的选择有代表性、较稳定和数量较大的人群为标应根据研究目的选择有代表性、较稳定和数量较大的人群为标准组。准组。例如,世界、全国、全省、本地的数据作为标准较理想。p以上三种方法中,最好采用第种,这样便于与其
19、他地区进行比较,第种方法只适用于所研究的两组资料。 344. 标准化率的计算标准化率的计算p标准化率标准化率(standardized rate):简称标化率,亦称调整率。p应用应用:标准化率常用于人群性别、年龄构成不同的两地的出生率、患病率和病死率的比较;也可用于病情轻重、病程长短不同的两组治愈率的比较等。p计算方法计算方法: 直接法直接法 间接法间接法 36已知 被标化组的年龄别率被标化组的年龄别率 标准组的年龄别人口数标准组的年龄别人口数 or 年龄别人口构成比年龄别人口构成比用标准组年龄别人口数计算用标准组年龄别人口数计算用标准组年龄别人口构成比计算用标准组年龄别人口构成比计算直接法直
20、接法37直接法直接法-用标准组年龄别人口数计算用标准组年龄别人口数计算选定标准组选定标准组,且已知标准组的年龄别人口数;计算被标化组的预期死亡人数。计算被标化组的预期死亡人数。将被标化人口各年龄组的实际发病率与标准人口相应的年龄别人口数相乘,得被标化人口各年龄组的预期死亡人数,合计得总预期死亡人数 ;计算标准化死亡率。计算标准化死亡率。用被标化人口的总预期死亡人数除以标准人口总数,得标准化死亡率。 NpNpii iipN3839万万万万乙乙地地标标准准化化总总发发病病率率0986100004369417376. 故甲地总发病率(74.61/万)低于乙地标化后的总发病率。40直接法直接法-用标准
21、组年龄别人口构成比计算用标准组年龄别人口构成比计算选定标准组选定标准组,且已知标准组的年龄别人口构成比; 计算被标化人口各年龄组的分配发病率计算被标化人口各年龄组的分配发病率:用被标化人口各年龄组实际发病率乘以标准人口相应年龄组的人口构成比,得被标化人口相应年龄组的分配发病率。计算标准化死亡率计算标准化死亡率:被标化人口相应年龄组的分配死亡率之和即为标准化死亡率。 iipNNp NpNpii 41故甲地总发病率(74.61/万)低于乙地标化后的总发病率。42p已知被标化组的年龄别人口数与发病(死亡)总数,但年龄别率未知p已知标准组年龄别发病(死亡)率与总发病(死亡)率 (2)间接法间接法43选
22、定标准人口选定标准人口,并已知标准人口的年龄别死亡率和总死亡率。计算被标化组预期死亡人数计算被标化组预期死亡人数:用被标化人口各年龄组实际人口数乘以标准人口相应年龄别死亡率,得被标化人口各年龄组预期死亡人数,求和得总预期死亡人数。计算被标化人口的标准化死亡率:计算被标化人口的标准化死亡率: 间接法的计算方法和步骤间接法的计算方法和步骤iiPnrPp被标化组实际总死亡人数被标化组实际总死亡人数被标化组预期总死亡人数被标化组预期总死亡人数标准化死亡比标准化死亡比(SMR)(SMR)standard mortality ratio44万万万万乙乙地地标标准准化化总总发发病病率率/./.2692092
23、322876174 45注意事项注意事项标准化的目的在于消除混杂因素对结果的影响,使计算的标准总率具有可比性;通常,直接法因其计算简便更为常用,但若原资料中有些年龄组人口过少,易使年龄别死亡率波动较大时宜用间接法;标准化率并不表示某地实际水平,只能表明对比资料间的相对水平,且同一资料用不同“标准”标化,所得标化率不同,但是对比时的分析结论通常不变;46注意事项注意事项对于存在混杂因素的两个总率进行比较时,若不进行标准化,也可通过比较两组的各年龄别发病(死亡)率,得出正确结论;比较两样本的标准化率时,还应进行两样本标准化率的假设检验(见有关统计学书籍)。 47学习要点学习要点p分类变量资料的描述指标常用的相对数(率、构成比、相对比)的计算方法、意义及应用注意事项p标准化法的基本思想和应用注意事项p直接法和间接法标准化率的适用条件与计算方法48小复习小复习p数值变量资料(计量资料)的描述指标:数值变量资料(计量资料)的描述指标: 集中趋势:均数、几何均数、中位数,等 离散趋势:标准差、四分位数间距、极差、变异系数等p分类变量资料(计数资料)的描述指标:分类变量资料(计数资料)的描述指标: 相对数:率、构成比、相对比49T TH HA ANNS SK K
限制150内