现场流行病学调查资料分析 PPT课件.ppt
参考文献参考文献李全乐:现场流行病学调查技术李全乐:现场流行病学调查技术王滨有:现场调查王滨有:现场调查河南医科大学:传染病流行病学调查研河南医科大学:传染病流行病学调查研究方法究方法 张顺祥:现场流行病学进展张顺祥:现场流行病学进展李立明:流行病学(第五版)李立明:流行病学(第五版)李笠:流行病学李笠:流行病学学学 习习 目目 的的调查资料的整理分析思路调查资料的整理分析思路描述性分析中统计图表的应用描述性分析中统计图表的应用相关分析结果的解释相关分析结果的解释 流行病学定义与特征流行病学定义与特征流行病学是研究人群中疾病与健康状况的分布及其影响因素,并制订防制疾病及促进健康的策略和措施的科学。群体的特征;对比的特征;概率论和数理统计的特征;社会学特征;预防为主的特征;发展的特征现场流行病学定义现场流行病学定义 现场流行病学主要以解决疾病爆发和应急性公共卫生问题为目的,采用现代流行病学和其他学科的理论和方法,及时做出科学的调查结论,并采取有效的控制措施。现场流行病学是流行病学应用于疾病预防和控制实践,同时吸取其他相关学科的理论和方法,而逐渐形成和发展起来的交叉学科,是流行病学向群体和宏观应用方面发展而产生的分支。几个概念流行病学现场调查,涉及到描述、分析和实验流行病学等方面,是一个更广泛的概念现场调查作为流行病学学科的一大特点,是流行病学工作者不可忽视的观念和方法现场流行病学调查是主要针对疾病流行、爆发等突发性公共卫生事件展开的调查,是一个特定的概念现场调查的启动前提条件获得公共卫生事件的相关信息信息来源公共卫生监测系统政府有关部门(如民政、公安、教育等部门)企事业单位(学校、工厂等)公民和媒体(报纸、广播、电视及网络)现场调查的启动接获信息后初步分析信息初步确认后联系信息来源地,进一步核实及时报告有关领导得到有关部门的授权或者事发相关部门的邀请 现场流行病学调查目的查明病因,或寻找病因线索及危险因素,为进一步调查研究提供依据 控制疾病进一步发展,终止疾病暴发或流行 预测疾病暴发或流行的发展趋势 评价控制措施效果 进一步加强已有监测系统或为建立新的监测系统提供依据 培训现场流行病学调查人员现场流行病学调查的要求在各种限制条件和利益竞争条件下,使现场调查最大程度提高科学性,控制疾病进一步蔓延根据公共卫生评价指标(罹患率、发病率、死亡率)和公众关注热点,提出社区人群中重大的公共卫生问题现场调查必须及时予以实施尽早发现传染源等致病源并对其危害作出评价使用合理的描述性或分析性流行病学方法(因果关系、证据充分)有因果关系上的充分证据确定传染源或病因建立疾病的适时控制和长期干预系统现场流行病学调查的步骤组织准备核实诊断确定暴发或流行的存在建立病例定义核实病例并计算病例数 描述性分析(三间分布)建立并检验假设 迅速采取控制措施 完善现场调查 报告交流反馈一一 资料分析计划资料分析计划决定验证假设所需的资料决定验证假设所需的资料为得到所需资料,设计调查表和资料整理表为得到所需资料,设计调查表和资料整理表收集资料收集资料数据录入和整理资料数据录入和整理资料描述性分析:病例计数、频数分布、构成比、率描述性分析:病例计数、频数分布、构成比、率联系的测定:四格表、显著性检验、可信区间计算联系的测定:四格表、显著性检验、可信区间计算分层分析:评价混杂因素和效应修正作用分层分析:评价混杂因素和效应修正作用必要时作多因素分析必要时作多因素分析必要时进一步深入分析必要时进一步深入分析合理解释结果合理解释结果,评价因果关系评价因果关系产生假设产生假设现场流行病学调查资料分析步骤现场流行病学调查资料分析步骤假 设假设中应包括以下几项因素危险因素来源传播的方式和载体引起疾病的特殊暴露因素高危人群 假设应该具备如下特征合理性被调查中的事实所支持能够解释大多数的病例建立假设的过程中应注意注意现场的观察始终保持开放的思维请教相关领域和专业的专家资料的整理资料的整理 规定变量的取值方法如:男性1,女性2,缺失9录入资料时有章可循,正确地处理不可接受数值审查 可与录入同步(Epidata)质量控制:范围核对 逻辑核对 及时纠正数据错误不能因调查结果不在取值范围而将数据随意改动现场审查,列出病例一览表资料分析策略的制定资料分析策略的制定 为实际资料分析提供纲领和指南草拟资料整理表又称预期分析表(一系列)可按逻辑顺序可由简单到复杂可由描述到分析资料整理表资料整理表资料描述整理表1类:临床特征描述2类:三间分布描述分析性研究整理表3类:22表(因素和疾病之间联系的基本表)4类:分层分析表(混杂因素、效应修正)5类:剂量反应关系6类:配比病例对照研究整理表举例整理表举例KawasakiKawasaki综合征调查资料整理表综合征调查资料整理表整理表整理表A 川崎病临床症状频数分布川崎病临床症状频数分布 项目 病人数 百分比(%)1.发热大于5天2.双眼结膜充血3.口腔改变(1)双唇充盈(2)咽充血(3)唇干裂(4)草莓舌4.皮肤和四肢改变(1)水肿(2)红斑(3)指(趾)甲脱落5.皮疹6.颈部淋巴结肿大1.5cm整理表整理表B 川崎病严重并发症病人频数分布川崎病严重并发症病人频数分布 并发症 病人数 构成(%)关节炎冠状动脉瘤其他并发症死亡整理表整理表C 川崎病病例特征川崎病病例特征 项项目目 特征特征 病人数病人数 构成(构成(%)年龄(岁)1 1 2 3 4 5 6性别 男 女种族 白人 黑人 亚裔整理表整理表D 川崎病病人家庭收入川崎病病人家庭收入年均家庭收入(元)病人数 构成(%)150001500029999300004499945000整理表整理表E 川崎病病例地区分布川崎病病例地区分布地区名称 病例数 人口数 罹患率(%)甲乙丙丁戊己整理表整理表F 川崎病病例发病时间分布川崎病病例发病时间分布 日期日期 病人数病人数 构成(构成(%)X月1日 X月2日 X月3日 X月4日 X月5日 X月6日 X月7日 X月8日 X月9日 X月10日 X月11日 X月12日整理表整理表G 川崎病与既往病史关系的病例对照研究川崎病与既往病史关系的病例对照研究 病例对照合计OR95%CL:2 =P值既往病史有无合计整理表整理表H 川崎病与地毯清洁剂关系的病例对照研究川崎病与地毯清洁剂关系的病例对照研究病例对照合计OR95%CL:2 =P值使用地毯清 洁 剂有无合计整理表整理表I 川崎病与家庭收入关系的病例对照研究川崎病与家庭收入关系的病例对照研究 病例对照合计OR家庭年均收入(千美元)15153045合计二、资料的描述性研究二、资料的描述性研究临床资料的描述临床资料的描述1、体征和症状的频率表 一种疾病一般可根据观察到的各种症状和体征的相对频率来描述。频率表是描述在至少1组30个病例中观察到的体征或症状的次数,如果想使结果更为准确,病例数则应更多。若有足够多的被检病例数,可将疑似病例、临床诊断病例、确诊病例,或轻型和重型病例的疾病资料分开单独制成图表。临床资料的描述临床资料的描述2、疾病过程的描述 每一种症状或体征有出现的时间和消失的时间,如果有足够数量的被检病例,可将体征和症状的频率从起病到康复按一定的时间间隔列成表格,或绘成曲线图,了解疾病过程中体征和症状的动态情况。表表1 1 病毒性脑膜炎病例症状和体征的频数分布病毒性脑膜炎病例症状和体征的频数分布 (N=101)图图2A 2A 病毒性脑膜炎病例症状和体征的频数分布图病毒性脑膜炎病例症状和体征的频数分布图图图2B 2B 病毒性脑膜炎病例症状和体征的频数分布图病毒性脑膜炎病例症状和体征的频数分布图流行强度的描述流行强度的描述常用指标感染率罹患率(总罹患率)死亡率 基本概念散发爆发流行(局部、大流行)三间分布的描述三间分布的描述时间分布绘制疾病暴发的时间分布图,表示暴发的开始、高峰、终止的整个时间动态过程。地点分布按病例的不同地点进行统计,计算罹患率或绘制标点地图,或按照活动场所或其他有关资料(如停留时间)等污染区或/和暴露区。人群分布按人群特征进行流行病学分析,全面描述病例特征,发现病例与普通人群的不同。人人 地地 时时 三间分布三间分布 描述流行病学分析描述流行病学分析 综合信息分析综合信息分析 病病 原原?传染来源传染来源?传播途径传播途径?时间分布时间分布统计图类型按时间发病率分布:线图或频数多边形按时间发病数分布:直方图流行曲线流行曲线绘制绘制Y轴表示病例数,X轴表示时间间隔(小于潜伏期:1/3 to 1/4)制作特定地点或群体的流行曲线图特殊事件的描述从曲线形状可以做出多种推断利用潜伏期后推可能的暴露时间区分暴露的类型预测病例数量流行曲线图流行曲线图点源点源连续性的同源连续性的同源多峰多峰 人人to 人人 或或 二次爆发二次爆发Incidence of Measles in China,1964-2001StartEPIMeaslesvaccinefirstusedColdchainestablished 表表3 1994年年4月月4日日-5月月17日某县麻疹按日分布日某县麻疹按日分布 发病日期发病日期 病例数病例数 发病日期发病日期 病例数病例数4 4月月1 1日日0 05 5月月1 1日日34344 4月月2 2日日0 05 5月月2 2日日22224 4月月3 3日日0 05 5月月3 3日日12124 4月月4 4日日1 15 5月月4 4日日3 34 4月月1616日日3 35 5月月5 5日日5 54 4月月1717日日2 25 5月月7 7日日2 24 4月月1818日日7 75 5月月1111日日1 14 4月月1919日日10105 5月月1212日日2 24 4月月2020日日11115 5月月1313日日4 44 4月月2121日日5 55 5月月1414日日2 24 4月月2222日日3 35 5月月1515日日3 34 4月月2323日日3 35 5月月1616日日4 44 4月月2424日日4 45 5月月1717日日1 14 4月月2525日日1 15 5月月1818日日0 04 4月月2828日日7 75 5月月1919日日0 04 4月月2929日日14145 5月月2020日日0 04 4月月3030日日28285 5月月2121日日0 0图图3A 1994年年4月月4日日-5月月17日某县麻疹发病时间分布日某县麻疹发病时间分布图(按日)图(按日)图图3B 1994年年4月月4日日-5月月17日某县麻疹发病时间分布图日某县麻疹发病时间分布图(按周)(按周)潜伏期的计算潜伏期的计算暴露时间明确,计算平均潜伏期中位数法:资料不明确(少)几何均数法:偏态分布资料(多)算术平均数:正态分布资料 暴露时间不明确,推算共同暴露时间暴露时间不明确,推算共同暴露时间潜伏期推算法:首例病例发病时间 最短潜伏期末例病例发病时间 最长潜伏期发病高峰 常见潜伏期(或平均潜伏期)公式推算法(适用于对数正态分布资料且潜伏期较短的疾病)M1、M0、M2分别为16%、50%、84%位数发病时点平均潜伏期x=(M2-M0)(M0-M1)/(M2-M0)-(M0-M1)共同暴露时间:M0-X发病日期发病日期病例数病例数积累百分数积累百分数6 6月月2121日日1 12.36 6月月2222日日2 27.96 6月月2323日日3 315.86 6月月2424日日8 836.86 6月月2525日日9 960.56 6月月2626日日6 676.36 6月月2727日日5 589.56 6月月2828日日2 294.76 6月月2929日日2 2100.0某幼儿园某年风疹爆发病例发病时间分布表某幼儿园某年风疹爆发病例发病时间分布表举例举例某幼儿园某年风疹爆发病例发病时间分布图某幼儿园某年风疹爆发病例发病时间分布图天最长潜伏期天最长潜伏期天最短潜伏期天最短潜伏期可能的可能的暴露日期暴露日期暴露日期推算暴露日期推算地点分布地点分布按照按照居住地居住地工作地工作地活动场所活动场所标点地图标点地图:特定的居住区和特定的居住区和/或暴露区或暴露区建筑物建筑物城区或近郊城区或近郊县县或或州州WORKHOUSECARNABY STREETMARSHALL STREETREGENT STREETGREAT PULTENEY STREETBREWERYBERWICK STREETBROAD STREETSILVER STREETXXXXXPOLAND STREETGOLDENSQUARENSEWPUMP BPUMPPUMP CPUMP APUMP霍乱病例分布与水井的位点图 GoldenSquareareaofLondon,August-September,18481-4950-99100+No dataCases per 100,000NicosiaPaphosLimassolLarnacaF.Famagusta病毒性脑炎住院病例地区分布图 Cyprus,5 July-5 November 1996人群分布详细描述病例组 鉴别病例的共同暴露因子 获得分母计算发病率 比较不同人群组的发病率AgeAge(years)(years)MaleMaleFemaleFemaleTotalTotal 11 800 800 850 850 1,650 1,650 1-14 1-148,2008,2008,1508,15016,35016,35015-2915-295,5005,5006,0006,00011,50011,50030-4930-496,2506,2506,7506,75013,00013,00050+50+3,0003,0004,5004,5007,5007,500TotalTotal23,75023,75026,25026,25050,00050,000流行区按性别年龄估计人口数流行区按性别年龄估计人口数性别年龄组罹患率性别年龄组罹患率AgeAge(years)(years)MaleMaleFemaleFemaleTotalTotal 1112.812.816.516.514.614.6 1-14 1-142.22.23.13.12.62.615-2915-296.06.010.010.08.18.130-4930-499.19.17.77.78.48.450+50+7.77.75.85.86.56.5TotalTotal5.95.96.76.76.46.4易感?易感?暴露机会多暴露机会多?就诊多?就诊多?敏感?敏感?母婴传播?母婴传播?再分月龄再分月龄病毒性脑炎住院病例年龄分布图病毒性脑炎住院病例年龄分布图 Cyprus,5 July-5 November 1996 危险因素或致病因子暴露的时间或时期病例及接触者中出现临床表现的时间采取治疗、预防、控制等干预措施的时间潜在的相关事件或异常情况出现的时间有关事件的时间顺序有关事件的时间顺序确定诊断确定诊断依据:临床特点(症状和体征表现),流行特征(三间分布)和检验结果推断暴发性质和类型推断暴发性质和类型 1、同源暴发:包括共同传播媒介和共同暴露,可有一次暴露,也可多次暴露。(1)一次暴露的特点:时间分布:流行曲线快速上升快速下降,呈单峰型,全部病例均发生在一个潜伏期全距内。地点分布:病例集中发生在与共同传播因素有关的单位内 人群分布:基本无差异,发病人群均有共同暴露于某因素的历史。(2)二次暴露特点:有两个发病高峰,时间与二次暴露时间一致。发病超过一个潜伏期全距。推断暴发性质和类型推断暴发性质和类型 (3)多次暴露特点:高峰宽,可有多个高峰。(4)连续暴露特点:流行曲线在高水平。2、非同源暴发:暴发时流行曲线可单峰(峰宽),也可多峰,病例在单位内分布不均匀,有聚集家庭或班组性,呈辐射状分布等。3、混合传播:即同源和非同源均存在。往往在同源暴发后有发生非同源暴发。混合传播时流行曲线上往往出现“拖尾现象”。传播途径的分析和判断传播途径的分析和判断 1、判断依据:(1)流行特征(2)传播实现的条件(致病因子污染的可能性、人群暴露机会)(3)实验室检查 传播途径的分析和判断传播途径的分析和判断2、分析步骤:(1)分析流行特征(2)确定共同暴露时间(3)确定传播因素(4)确定污染原因(5)实验室检查知识连续统一体知识连续统一体较少信息较少信息 较多信息较多信息寻找线索寻找线索 确定因果关系确定因果关系描述性研究描述性研究 分析性研究分析性研究三、资料的分析性研究三、资料的分析性研究分析性研究分析性研究关注关注E D关系关系试图确定某种疾病的危险因素或试图确定某种疾病的危险因素或/和保和保护因素护因素寻找研究人群中的暴露和疾病变量的寻找研究人群中的暴露和疾病变量的分布差异分布差异用于检验描述性研究提出的假设用于检验描述性研究提出的假设量化暴露和疾病的关系量化暴露和疾病的关系分析性研究的类型分析性研究的类型实验性研究实验性研究观察性研究观察性研究队列研究队列研究病例对照研究病例对照研究横断面研究横断面研究研研究究对对象象试验组试验组对照组对照组随随 访访有效应有效应无效应无效应有效应有效应无效应无效应随机随机分组分组调调 查查 方方 向向过过 去去现在现在研究对象暴露组非暴露组病例非病例 病例非病例随 访调调 查查 方方 向向过过 去去现现 在在非病例病例暴露组非病例病例非暴露组队列研究:方向队列研究:方向ED+bdb/(b+d)+ac a/(a+c)病例病例对照对照暴暴 露露疾疾 病病人人 数数调调 查查 方方 向向过去过去现在现在研究研究对象对象非暴露暴露病例非暴露暴露的对照(非病例)病例对照研究:方向总是向后的病例对照研究:方向总是向后的联系的测量联系的测量 测定联系就是要量化暴露因素与卫生事件之间的统计学联系的强度和大小。在队列研究时,联系的测量最常采用相对危险度,而病例对照研究时,比值比最为常用。在横断面研究时,可以计算患病率比值(prevalence ratio)或患病率比值比(prevalence odds ratio)。联系的测量联系的测量发病发病未发病未发病合计合计暴露暴露a ab b 非暴露非暴露c cd d 合计合计 RRORRR=暴露中的发病率暴露中的发病率=.a/(a+b)c/(c+d)非暴露中的发病率非暴露中的发病率相对危险度:比较暴露和非暴露对象的发病率相对危险度:比较暴露和非暴露对象的发病率OR=病例组的暴露比值病例组的暴露比值=.a/c b/d 对照组的暴露比值对照组的暴露比值比值比:比较病例组和对照组之间的暴露比值比值比:比较病例组和对照组之间的暴露比值冰淇淋发病未发病合计吃431154未吃31821合计462976疾病爆发与食用某种食物有关疾病爆发与食用某种食物有关?计算指标计算指标OR?RR?匹配病例匹配病例-对照研究对照研究保证病例组和对照组的已知与疾病相关的变量是可比的例如:病例组是北京儿童医院患白血病的儿童 对照组是每个病例最近的邻居儿童对照暴露未暴露病例暴露a b未暴露c dOR(匹配研究)(匹配研究)=配对中不一致的比例配对中不一致的比例=b.C 统计学检验统计学检验 当暴露因素实际与疾病发生无关,仅由于偶然的原因,造成观察结果与实际情况不符时,这种可能性究竟有多大,可通过统计学显著性检验来确定。不同研究设计和数据类型的数据分析方法选择 变量类型研究设计类型两组比较两组以上比较实验前后比较重复测量两变量间的联系数值变量t检验方差分析配对t检验重复测量的方差分析线性回归,Pearson相关系数分类变量c2检验c2检验配对c2检验列联表相关系数有序变量Mann-Whitney秩和检验Kruskal-Wallis分析Wilcoxon符号秩和检验Spearman相关系数生存时间生存分析统计学检验统计学检验2值计算是统计学显著性检验的常用方法,阐明了如果无效假设确实成立,得出暴露与疾病有关这一结论的概率大小,用P值来表示。P值越小,意味着拒绝无效假设的可能性越大。当P值小于某一事先确定的界值,如0.05或5,就可以拒绝无效假设,接受备择假设,认为联系有统计学显著性。统计学检验统计学检验无效假设和备择假设需要事先确定。如果对暴露因素与疾病的联系知之甚少,可以做出暴露与疾病无关的无效假设(RR1或OR1),相应的备择假设是,暴露国素与疾病有关(RR或OR1)。值得指出,备择假设中所指的暴露因素,可以是危险因素,也可以是保护性因素。有两种不同的显著性检验方法常用于四格表资料的统计学处理,即Fisher精确概率法和2检验。值得一提的是这两种方法无特异性,可适用于任何暴露与疾病联系的测量,而与RR或OR计算无关 1、联系的测量与显著性检验的关系、联系的测量与显著性检验的关系联系的测量如RR和OR值,反映了暴露与疾病之间关系的强度,一般来说,可以认为它们是对总人群中暴露与疾病联系程度的最好推测。但这种联系还不一定是因果关系。统计显著性检验是表示联系的观察值(如RR或OR)由于偶然原因造成的可能性大小。所以,联系的测量和显著性检验之间提供了互补的信息。2、统计学检验结果的解释、统计学检验结果的解释“无显著性”并不意味着“无联系”。联系的测量(RR和OR值)表明了联系的强度和方向,而统计学检验则说明了联系的观察值由于偶然原因造成的可能性大小。无显著性不能说明总体人群中暴露与疾病之间无联系,也可能是样本例数偏小,无法对总体的真实联系作出反映。2、统计学检验结果的解释、统计学检验结果的解释统计显著性本身无法表明因果关系。由于偶然原因、选择性偏倚、信息偏倚、混杂和其他存在于研究设计、实施和分析阶段的误差,使观察值反映的联系不呈现因果联系。统计检验结果仅能说明联系由于偶然原因造成的可能性大小,具有显著性仅说明由偶然原因造成的可能性很小,还需要考虑与其他类似研究结果的一致性、暴露与疾病的时间关系、生物学可靠性、以及其他病因推断的标准。2、统计学检验结果的解释、统计学检验结果的解释最后,还须指出,统计显著性与公共卫生意义也没有必然关系。通过一个大规模的研究,对大众健康影响极小的因素可能出现统计显著性,而通常与大众健康或疾病有关的因素,也可能会因为样本例数较小而无统计学意义。评价因果关系的标准关联的强度:RR和OR关联的时间顺序:暴露在前,发病在后关联的可重复性:与其他研究的一致性关联的合理性:生物学上言之有理因子去除后发病率下降因子与疾病的分布相一致剂量-反应关系关联的特异性