《分类变量的描述性统计讲稿.ppt》由会员分享,可在线阅读,更多相关《分类变量的描述性统计讲稿.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于分类变量的描述性统计第一页,讲稿共五十四页哦分类变量的整理(分类变量的整理(1)婚姻状况频数单身 3已婚 5离异 2分居 4合计14 14名成人的婚姻状况名成人的婚姻状况编号性别身高婚姻状况1男175单身2女167单身3男187单身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167离异10女186离异11男182分居12女159分居13男167分居14女182分居14名成人的原始数据名成人的原始数据第二页,讲稿共五十四页哦分类变量的整理(分类变量的整理(2)婚姻状况性别男女单身21已婚23离异11分居22不同性别的婚姻状况不同性别的婚姻状况编号性别身高婚姻状况
2、1男175单身2女167单身3男187单身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167离异10女186离异11男182分居12女159分居13男167分居14女182分居14名成人的原始数据名成人的原始数据第三页,讲稿共五十四页哦一 常用的比例指标常用的比例指标绝对数:资料整理后各组的例数相对数:两个绝对数之比中得到的一种数值第四页,讲稿共五十四页哦例:调查得某年小学生中流脑发病:甲地区例:调查得某年小学生中流脑发病:甲地区6363例,乙地区35例。v甲地区流脑流行比乙地区严重 v如已知小学生总人数:甲地区50051人,乙地区14338人,可算出两个发病率:
3、v甲地区流脑发病率:63/500511000=1.26v 乙地区流脑发病率:35/14338 1000=2.44 v乙地区流脑流行比甲地区严重乙地区流脑流行比甲地区严重第五页,讲稿共五十四页哦1.率:率:速率(速率(rate):与时间有关,如某年某病发病率、死亡率。):与时间有关,如某年某病发病率、死亡率。比率(比率(proportion):与时间无关,如某病治愈率。):与时间无关,如某病治愈率。2.比:比:构成比(构成比(constituent ratio):部分与全部之比):部分与全部之比相对比(相对比(relative ratio):两指标之比):两指标之比常用的比例指标及其意义常用的比
4、例指标及其意义第六页,讲稿共五十四页哦1.率又称强度相对数或频率反映某现象出现的频率或强度。某现象的发生数率=比例基数 可能发生某现象的总数比例基数:100%、1000、10000/万等选取原则:习惯用法、数值大小第七页,讲稿共五十四页哦 例例 1999年年某某幼幼儿儿园园有有36名名儿儿童童患患了了腮腮腺腺炎炎,该该幼幼儿儿园园共共有有200名名儿儿童童(其其中中25名名儿儿童童以以前前患患过过),求求该该幼儿园幼儿园1999年腮腺炎的发病率。年腮腺炎的发病率。腮腺炎腮腺炎发发病率病率=第八页,讲稿共五十四页哦 某医生研究了慢性阻塞性肺病(COPD)病人的吸烟情况,自19982000年收治C
5、OPD病人356人,其中231人有三十年及以上的经常吸烟史(日平均1支以上),在本院其它科室收治的同年龄组段的非COPD病人(无其它呼吸系统疾患)479人,其中有三十年及以上的经常吸烟史的183人,试计算并比较两组病人的吸烟率。表 慢性阻塞性肺病(COPD)病人的吸烟情况第九页,讲稿共五十四页哦速率速率 (rate)速率速率 (rate)是反映单位时间内某事件出现的可能性大是反映单位时间内某事件出现的可能性大小,多用于面向人群的出生、死亡和发病资料的统计小,多用于面向人群的出生、死亡和发病资料的统计.人口出生率人口出生率=(某年中活产总数某年中活产总数/该年平均人口数该年平均人口数)100%第
6、十页,讲稿共五十四页哦常见的几种率 调查时某病患病人数调查时某病患病人数(1)某病患病率某病患病率100 调查人数调查人数 一定期间内某病新病例数一定期间内某病新病例数(2)某病发病率某病发病率1000同期平均人口数同期平均人口数第十一页,讲稿共五十四页哦l 某病死亡人数某病死亡人数(3)某病病死率某病病死率100l 某病患病人数某病患病人数l l 某期间某病死亡人数某期间某病死亡人数(4)某病死亡率某病死亡率1000l同期平均人口数同期平均人口数 第十二页,讲稿共五十四页哦l 某病治愈人数某病治愈人数(5)某病治愈率某病治愈率100l治疗某病人数治疗某病人数 l 错误诊断人数错误诊断人数(6
7、)误诊率误诊率100l 诊断某病人数诊断某病人数 第十三页,讲稿共五十四页哦l 漏诊人数漏诊人数(7)漏诊率漏诊率 100l某病患病人数某病患病人数 l带某病原体带某病原体(阳性结果阳性结果)人数人数(8)感染阳性率感染阳性率100l检查人数检查人数 第十四页,讲稿共五十四页哦 率的正确使用需要注意以下几点:率的正确使用需要注意以下几点:(1)分子为阳性数,分母为(阳性)分子为阳性数,分母为(阳性+阴性数)。阴性数)。(2)当当计计算算麻麻疹疹这这样样具具有有终终生生免免疫疫力力的的传传染染病病发发病病率率时时,分分母母不不应应该该包包括括已已患患过过麻麻疹疹或或腮腮腺腺炎炎的的那那部部分分人
8、。人。(3)率率只只与与本本身身的的频频率率或或强强度度有有关关,而而不不受受其其它它数数据据的的影影响响。如如某某地地红红眼眼病病的的流流行行不不会会导导致致该该地地肝肝癌死亡率下降或上升。癌死亡率下降或上升。第十五页,讲稿共五十四页哦关于率的几点说明(一)l分子和分母都是计数值,从定义上来看,分子应为分母的一部分,但在实际应用中一些率的指标可能并不符合率的定义,但它们是约定俗成、沿习使用的。l根据频率的稳定性,分母较大时,可以用率作为该事件发生机会(即概率)的近似值。例如:医治100例病人,90例痊愈,则:治愈率=90/100=90%。它近似的反映了病人治愈机会的大小。第十六页,讲稿共五十
9、四页哦关于率的几点说明(二)l0 rate1l率常以百分率(%)、千分率()、万分率(1万)、十万分率(l10万)等表示。l比例基数(K)可以是100、1000、,其选取是根据习惯用法和需要选用,主要使算得的率至少保留12位整数,便于阅读。患病率、发病率、感染率:百分率(%)人口出生率与死亡率:千分率()肿瘤死亡率:十万分率(l10万)第十七页,讲稿共五十四页哦2.比(1)构成比(百分比、结构相对数)表示某现象内部各个构成部分所占的比重。某一构成部分的数量构成比=100%各构成部分数量之和 第十八页,讲稿共五十四页哦设某事物个体数的合计由设某事物个体数的合计由A A1 1,A A2 2,A A
10、k k个部分组成,个部分组成,构成比计算为:构成比计算为:第十九页,讲稿共五十四页哦构成比的特点:l同一事物内部的同一事物内部的k个组成部分构成比总和为个组成部分构成比总和为100%。l各部分构成比之间是相互影响的,某一部分比重各部分构成比之间是相互影响的,某一部分比重的变化受到两方面因素的影响:其一是这个部分的变化受到两方面因素的影响:其一是这个部分自身数值的变化,其二受其他部分数值变化的影自身数值的变化,其二受其他部分数值变化的影响。响。第二十页,讲稿共五十四页哦第二十一页,讲稿共五十四页哦第二十二页,讲稿共五十四页哦例 资料见表,计算患病率及病人数百分比。表 某市工人中冠心病调查资料年龄
11、 检查人数 病人数 病人数百分比(%)患病率(%)30-850 9 40-800 2750-750 54 60-195 25合计合计 2595 115 7.8 1.1 23.5 3.4 47.0 7.2 21.7 12.8100.0 4.4第二十三页,讲稿共五十四页哦率与构成比率与构成比率率构成比构成比概念概念发生的频率或发生的频率或强度强度各组成部分所占各组成部分所占的比重的比重强调点强调点随机发生事件随机发生事件各部分的构成各部分的构成资料获得资料获得较难较难容易容易特点特点不一定不一定合计为合计为100100第二十四页,讲稿共五十四页哦(2 2)相对)相对比l相对比相对比(ratio),
12、是,是 A、B两个有关指标之比。两个有关指标之比。l说明说明A为为B的若干倍或百分之几,它是对比的最简的若干倍或百分之几,它是对比的最简单形式。单形式。A、B两个指标可以是绝对数,也可以两个指标可以是绝对数,也可以是相对数;可以性质相同,也可以性质不同;可是相对数;可以性质相同,也可以性质不同;可以是定性资料,也可以是定量资料。以是定性资料,也可以是定量资料。第二十五页,讲稿共五十四页哦人口统计中常用的比的指标l受精时性别比受精时性别比(第一性比例第一性比例)一般为一般为110 170,平均,平均120;出生时;出生时性别比性别比(第二性比例第二性比例)绝大多数国家为绝大多数国家为103 10
13、7,平均,平均106;婚龄;婚龄期性别比期性别比(第三性比例第三性比例)约为约为100;性别比性别比(sex ratio)又称性比例,是指男性人口与女性人口的比又称性比例,是指男性人口与女性人口的比值。值。第二十六页,讲稿共五十四页哦相对比的种类相对比的种类l2.2.两个率之比两个率之比 l某地某年龄组男性吸烟和非吸烟的冠心某地某年龄组男性吸烟和非吸烟的冠心病死亡资料下表所示病死亡资料下表所示,试分析其相对危害试分析其相对危害度。度。分组分组死亡数死亡数 观察人年数观察人年数 死亡率(死亡率(1/101/10万人年)万人年)吸烟组吸烟组 104 43248 240.5104 43248 240
14、.5 非吸烟组非吸烟组 12 10673 112.412 10673 112.4第二十七页,讲稿共五十四页哦RRRR=240.5=240.5112.4=2.139 112.4=2.139 说明男性吸烟的冠心病死亡率是不吸说明男性吸烟的冠心病死亡率是不吸烟的死亡率的烟的死亡率的2.1392.139倍。这种指标在流行倍。这种指标在流行病学研究中称为相对危险度病学研究中称为相对危险度(relative(relative riskrisk简写为简写为RR RR)。第二十八页,讲稿共五十四页哦相对比的种类相对比的种类l3.3.两个相对比之比两个相对比之比 l 临床医生欲探索某病的病因,在以医院病例为基础
15、作病例对照研究临床医生欲探索某病的病因,在以医院病例为基础作病例对照研究时,一般不能计算出时,一般不能计算出RRRR,但可以计算出疾病组暴露比数与对照组暴露比数,但可以计算出疾病组暴露比数与对照组暴露比数之比,称之为比数比或优势比(之比,称之为比数比或优势比(odds ratioodds ratio简写为简写为OROR)l服用反应停与肢体缺陷关系病例对照研究服用反应停与肢体缺陷关系病例对照研究服用反应停畸型儿组对 照 组合计 使 用 未使用 34(a)16(c)2(b)88(d)36 104 合 计 50 90 140第二十九页,讲稿共五十四页哦本例本例 第三十页,讲稿共五十四页哦正确应用相对
16、数(一)l计算相对数的分母不宜过小计算相对数的分母不宜过小 例数较少,相对数波动较大。如:0/2,1/2,2/2例数较少时,宜用绝对数表示,必须用相对数时,可同时列出其可信区间。二 相对数使用应注意的问题第三十一页,讲稿共五十四页哦l分析时不能以构成比代替率分析时不能以构成比代替率率反映的是频率或者强度构成比反映的是比重或分布正确应用相对数(二)第三十二页,讲稿共五十四页哦正确应用相对数(三)l正确计算合并率正确计算合并率对观察单位数不等的几个率,不能直接相加对观察单位数不等的几个率,不能直接相加求其平均率求其平均率(或称总率或称总率)例如用某疗法治疗肝炎,第一次治疗例如用某疗法治疗肝炎,第一
17、次治疗150150人,治愈人,治愈3030人,治愈率人,治愈率20%20%;第二次治疗;第二次治疗100100人,治愈人,治愈3030人,人,治愈率治愈率30%30%。试计算两批的合并治愈率。试计算两批的合并治愈率。第三十三页,讲稿共五十四页哦正确应用相对数(四)l计算率时要注意资料的同质性计算率时要注意资料的同质性l对比分析时应注意资料的可比性对比分析时应注意资料的可比性 v所谓可比,就是说除了要对比的因素外(如不同药物),其余的影响因素应尽可能的相同、相似或接近。观察对象同质,研究方法相同,观察时间相等,以及地区、周围环境、风俗习惯和经济条件应一致或相近。观察对象内部构成内部构成是否相同,
18、若两组资料的年龄、性别构成不同,可以分组或进行标准化后再作比较。第三十四页,讲稿共五十四页哦正确应用相对数(五)l样本率或构成比比较时,不能仅凭表面上的数值大小下结论,应考虑到其抽样抽样误差误差,进一步作统计学处理。第三十五页,讲稿共五十四页哦例题:下表为一抽样研究资料,作如下分析:例题:下表为一抽样研究资料,作如下分析:l填补空白;填补空白;l对(对(5 5)()(6 6)()(7 7)栏做简要分析;)栏做简要分析;l比较比较2020岁于岁于4040岁年龄组死亡率由无差别?岁年龄组死亡率由无差别?第三十六页,讲稿共五十四页哦年龄年龄 人口数人口数 死亡总数死亡总数 恶性肿瘤恶性肿瘤 恶性肿瘤
19、死亡恶性肿瘤死亡 恶性肿瘤死亡恶性肿瘤死亡 年龄别死亡年龄别死亡(1)(2)(3)死亡总数死亡总数 占总死亡的占总死亡的%率(率(1/10万)万)率(率()(4)(5)(6)(7)0-82920 138 4 2.90 4.82 1.6620-46638 63 12 19.05 25.73 1.3540-28161 172 42 24.42 149.14 6.1160-9371 342 32 9.36 341.48 36.50合计合计 167090 715 90 12.59 53.86 4.28某地各年龄组恶性肿瘤死亡情况某地各年龄组恶性肿瘤死亡情况第三十七页,讲稿共五十四页哦年龄年龄 人口数人
20、口数 死亡总数死亡总数 恶性肿瘤恶性肿瘤 恶性肿瘤死亡恶性肿瘤死亡 恶性肿瘤死亡恶性肿瘤死亡 年龄别死亡年龄别死亡(1)(2)(3)死亡总数死亡总数 占总死亡的占总死亡的%率(率(1/10万)万)率(率()(4)(5)(6)(7)0-82920 138 4 2.90 4.82 1.6620-46638 63 12 19.05 25.73 1.3540-28161 172 42 24.42 149.14 6.1160-9371 342 32 9.36 341.48 36.50合计合计 167090 715 90 12.59 53.86 4.28某地各年龄组恶性肿瘤死亡情况某地各年龄组恶性肿瘤死亡
21、情况第三十八页,讲稿共五十四页哦三三 率的标准化法率的标准化法目的:目的:用用统一的标准统一的标准(如年龄别人口数、(如年龄别人口数、年龄别人口构成比、年龄别人死亡率)年龄别人口构成比、年龄别人死亡率),消除,消除内部构成不同内部构成不同对平均率所产生对平均率所产生的影响,使两组平均率具有的影响,使两组平均率具有可比性可比性。第三十九页,讲稿共五十四页哦第四十页,讲稿共五十四页哦一)、方法的选择 1.直接法:各小组率已知,各小组观直接法:各小组率已知,各小组观察数或构成作为标准察数或构成作为标准 2.间接法:各小组观察数或构成,以间接法:各小组观察数或构成,以及平均率已知,以各小组率作为标及平
22、均率已知,以各小组率作为标准准第四十一页,讲稿共五十四页哦二)、标准的选取 1 选一个具有代表性的、内部构成相选一个具有代表性的、内部构成相对稳定的较大人群作为标准对稳定的较大人群作为标准 2.将要比较的两组资料内部各相应小将要比较的两组资料内部各相应小组的观察单位数相加作为标准组的观察单位数相加作为标准 3.从要比较的两组中任选一组作为标从要比较的两组中任选一组作为标准。准。第四十二页,讲稿共五十四页哦直接法(各小组出院人数合计为标准)第四十三页,讲稿共五十四页哦直接法(各小组出院人数构成为标准)第四十四页,讲稿共五十四页哦应用标准化时的注意事项l标准化率的应用价值标准化率的应用价值l仅限于
23、相互比较,不反映具体的实际水平。l要反映实际情况,则需用未标化前的率。第四十五页,讲稿共五十四页哦应用标准化时的注意事项l标准化率的适用范围标准化率的适用范围仅适用于某因素两组内部构成不同,并有可能影响两组总率的比较,对于因其他条件不同而产生的不可比性问题,标准化率不能解决。第四十六页,讲稿共五十四页哦应用标准化时的注意事项l标准化率也有抽样误差标准化率也有抽样误差两样本标准化率作比较时,当样本含量较小时,还应作假设检验第四十七页,讲稿共五十四页哦表表 两矿工人尘肺患病比较两矿工人尘肺患病比较工龄工龄(年)(年)甲甲矿矿乙乙矿矿检查检查 人人数数尘肺尘肺 人人数数患病率患病率(%)检查检查 人
24、人数数尘肺尘肺 人人数数患病率患病率(%)6140261200.86 99220.20610 428525421683163.9212.431905101481170.4211.54合计合计208566042.9039111273.25第四十八页,讲稿共五十四页哦四四 动态数列动态数列l动态数列(动态数列(dynamic seriesdynamic series):一系列按):一系列按时间顺序排列起来的统计指标,用以观察时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。和比较该事物在时间上的变化和发展趋势。第四十九页,讲稿共五十四页哦常用指标:常用指标:增长量增长量:分
25、为累积增长量、逐年增长量:分为累积增长量、逐年增长量定基比定基比:统一用某个时间的指标作基数以各:统一用某个时间的指标作基数以各时间的指标分别与之对比。时间的指标分别与之对比。环比环比:依次用前一个时间的指标作基数,以:依次用前一个时间的指标作基数,以相邻的后一个时间的指标与之对比。相邻的后一个时间的指标与之对比。第五十页,讲稿共五十四页哦增长速度增长速度=发展速度发展速度1a0a1a2a3a4第五十一页,讲稿共五十四页哦平均发展速度与平均增长速度平均发展速度与平均增长速度l平均发展速度:各环比发展速度的几何平均数,平均发展速度:各环比发展速度的几何平均数,表示逐期平均发展的速度表示逐期平均发展的速度 l平均增长速度:各环比增长速度的平均数,表平均增长速度:各环比增长速度的平均数,表示逐期平均增长的速度示逐期平均增长的速度第五十二页,讲稿共五十四页哦l平均发展速度(平均每年相当于前一年的平均发展速度(平均每年相当于前一年的1.188 1.188 倍)倍)l平均增长速度:平均增长速度:平均增长速度平均增长速度=1.188-1=0.188=1.188-1=0.188l根据平均发展速度进行预测根据平均发展速度进行预测 如预测如预测19951995年的次均费用为:年的次均费用为:第五十三页,讲稿共五十四页哦感谢大家观看9/27/2022第五十四页,讲稿共五十四页哦
限制150内