《常用的流行病学研究方法.ppt》由会员分享,可在线阅读,更多相关《常用的流行病学研究方法.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1,第八章 常用的流行病学研究方法,2,常用流行病学方法分类:,横断面研究,病例对照研究,队列研究,临床试验,现场试验,社区干预试验,流行病学数学模型,弱联系,强联系,3,流行病学的主要用途: 病因学研究 疾病预防控制对策 疾病监测 研究疾病的自然史 ,4,一、现况调查 现况调查目的 现况调查(prevalence study),又称为横断面调查(cross-sectional study),是指在某一时点或较短时间内,按照研究设计的要求,在一定人群中通过普查或抽样调查的方法,收集有关疾病和健康状况的资料,从而描述疾病或健康状态与影响因素的关系,现况调查研究只能为病因研究提供线索,一般不能得出
2、因果结论。,5,设计模式图:,6,现况调查的主要目的在于: 1描述疾病或健康状况的三间分布情况 通过对一定地区的人群进行调查,可以获得某种疾病和健康状况在时间、地区、人群中的分布,发现疾病的高危人群和相关的病因线索,为疾病的防治提供依据。 2描述某些危险因素、特征与疾病的关系 如高血压、高血脂、超体重与冠心病的关系。 3评价疾病防治措施 通过比较防治措施前后的效果,可以判断某种防治的措施是否有效。 4对某些疾病进行“三早”预防措施 即早发现、早诊断、早治疗。,7,(二)现况研究的基本步骤 1确定调查的目的、内容、范围、对象、时间,并拟订调查表。 2确定所调查疾病的诊断标准 通常诊断标准采用国家
3、标准。 3确定调查方式与检验方法 4确定抽样方法与样本含量 5组织培训并编印有关调查材料,8,(三)调查所需样本量的估计 一般流行病学调查约需1000例以上,血清指标及其定量指标的流行病学调查约需300600例,实际上,抽样方法不同,估计样本量的方法应不同。对于单纯随机抽样的样本含量估计,可采用以下方法。 1对均数作抽样调查时所需样本量的估计 以u代表正态分布中从左至右的累计概率为/2时的u值;以代表允许误差,则:,9,2对率作抽样调查时的样本量的估计 当可能出现的样本量(P )接近0.5时,则 : 若P 接近0或1时,则:,10,(四)资料分析 1计数资料的关联性分析:常用2检验: 2关联程
4、度常用列联系数(r)或关联系数(rn)表达,列联系数和关联系数的取值范围和判断原则与相关系数相同。,11,3对于计量资料通常采用线性相关系数来分析关联性:,12,(五)现况调查的质量控制 现场调查的质量控制主要是防止各种偏性的产生,在现况调查中,常见的偏性主要有以下几种: 1选择性偏倚 在现况调查中,选择性偏倚的产生主要是来源于所抽取的调查对象没有真正的代表所研究的对象总体。因此,在抽样中,应坚持贯彻随机化的原则,减少选择性偏倚的产生。对漏查的调查对象,尽量采取措施进行补救。,13,2信息偏倚 现况调查中的信息偏倚,包括以下几种情况。 (1)由于问卷中所调查的项目不清楚而导致所得到的信息不准确
5、,因此,必须在调查问卷上下工夫。要使调查的问卷能充分反应真实的情况,进行预调查是很关键的环节。此外,通过问卷的说明,向被调查者交代调查的目的、意义、填写方法和注意事项也非常重要,可以取得调查对象的配合,提供可靠的信息。 (2)调查者的因素,必须对调查者进行统一培训,增强责任感,统一调查的程序和方法。避免调查员主观的原因而引起偏性的产生。 (3)测定仪器的标准化问题,许多流行病学的调查除了采用询问的方法外,常涉及到一些生理或生化指标的测定。因此,测量仪器的稳定性和可靠性就影响到所测量指标的准确度和精密度,14,二、病例对照研究 病例对照研究(case-control study)属于回顾性的研究
6、(retrospective studies)的方法。其研究的时间顺序是从“果”到“因”。通常是在有了某种现象的情况下,去探索引起这种现象的原因。病例对照研究的结果,可以有助于在现况研究中因果关系的判断,但并不能完全推测因果关系。图8.2所示病例对照研究的设计模式。,15,图8.2 病例对照研究设计模式,病例组,16,一、研究的基本方法与步骤 1. 提出假设、确定待检验的危险因素 2. 病例对照研究一般是在现况研究结果的基础上进一步的分析疾病与影响因素之间的关系。通常在现况研究中所得到的疾病相关因素就是病例对照研究的初步假设,但是,在病例对照研究中,所假设的因素不宜太多,通常选择主要因素进行调
7、查和分析。 3. 选择研究对象 在病例对照研究中,研究对象包括病例组和对照组的选择。,17,1病例的选择 对于病例组的病人,首先需要经过金标准或公认的标准确诊。最好选择新病例,如3个月以内的病人,旧病人往往因时间太久,不能准确回顾暴露的因素或暴露因素与疾病之间的时间先后顺序。病例的来源可以是同一个医院或不同医院中门诊或住院病人,也可以是社区人群中确诊的病例。一般来说,人群中的病例比医院的病人更具有代表性,在选择病人时,应注意包括轻重各型病人。确定病例的来源后,同样应采用随机抽样的原则抽取调查病例。,18,2对照的选择 对照组应该是在各方面都与病例组有很好的可比性。包括性别、年龄、职业、经济收入
8、、文化层次及健康状况。最好与病例组有相同的来源,如同一地区、单位、同一医院或同一社区。在报道研究结果时,对病例及对照来源应有明确交代。见表8.1。有时可以设立两个对照组,一组来源于医院,另一组则来自人群。,19,表8.1 病例组和对照组的来源比较,20,(三)配比研究(pair-matched study)配比研究是一种选择对照的方法,通过配比,使对照组在一些特征方面与病例相似,在进行配比时,应尽可能的使可能的混杂因素在两组一致,已经匹配的因素,在以后的分析中,再也不能分析其病因作用。因此,要防止匹配过头(overmatching),即将研究的危险因素作为配对条件而无法分析其危险因素。匹配的方
9、法常见的有 1:1、1:2、或1:4进行配比研究,即一个病例选择1、2或4个除了研究因素以外,其他因素都相同或相似的对照进行配比研究。但注意配比的因素不宜太多,更不能将危险因素当着配比的条件。,21,(四)暴露因素的搜集 在调查时,不只是搜集调查对象的姓名、性别、年龄、住址等一般情况,而更重要的是要收集病例组和对照组危险因素的暴露情况。如吸烟、饮酒、有毒有害物质接触史等。最好能对暴露因素的强度进行分级或计量,如吸烟量达到每天多少支,饮酒量每天多少克等,以便考察暴露级别与发病强度的关系,即剂量反应关系。可以设计同时调查多个暴露的因素。在收集暴露因素时,应该设计相同的调查项目对病例组与对照组进行调
10、查,调查时需注意避免诱导,尽量采用客观指标记录过去的暴露情况。对病例组和对照组应该同等认真对待,避免产生偏性。,22,二、调查资料的整理与统计分析 病例对照研究所得结果可归纳为表8.2和表8.3。在病例对照研究中,由于病例和对照最多只是所有病例和对照的有代表的样本,并不知道暴露组和未暴露组观察数是多少,因此无法直接计算真实的疾病率,无法直接计算相对危险度。但可以估计相对危险度,通过回顾和比较病例组和对照组在发病前暴露于某种可能的危险因素的差异,分析暴露与疾病的联系。,23,成组设计病例对照研究的资料分析 调查结果的资料整理为下表:,病例组暴露的比值为:,对照组的暴露比值为:,24,比值比: O
11、R= 2)比值比的标准误 可以采用Woolf氏和Miettinen氏两种方法计算。 Woolf氏法: OR标准误= Miettinen氏法: OR标准误= 3)OR的95%可信区间(confidence interval, C.I)计算: OR 95% C.I= OR 95% C.I= 4) 比值比的显著性检验:采用2检验进行比较,25,2配比设计病例对照研究的资料分析,调查结果的资料整理为下表: 比值比的计算: OR的95%可信区间:OR 95% C.I= 2检验:,26,3Mantel-Haenszel 法 在病例对照研究中,当存在混杂因素的影响时,需要按混杂因素进行的情况进行分层,这时,
12、其OR值的计算和2检验都应采用Mantel-Haenszel 法进行分析。分层资料通常整理成表 :,比值比的计算: Mantel-Haenszel2检验: 上式中:,27,1选择性偏倚(selection bias)这种偏倚是因在选择病例组和对照组时,由于没有遵从随机抽样的原则,使得病例组或对照组不能真正代表其病例或对照的总体。常见的原因有没有严格掌握诊断标准或诊断标准不明确、病例组的构成不同质、或病例组与对照组不具有可比性等,都是导致选择性偏倚的常见原因。 2信息偏倚(information bias)主要是指调查所得到的信息没有反映真实的情况。如病人所提供暴露史情况不准确,特别是在老病例,
13、因时间太远,只能靠模糊的记忆提供暴露情况;对敏感问题的调查不准确等。这种偏倚常常出现对照组的暴露因印象不深而暴露比实际减少,而病例组又有夸大的情况。因此,信息偏倚常常导致疾病与暴露的联系增强。,28,3错误分类偏倚(misclassification bias)是指将一个对象、一个数值或特征错误的分到不属于它的类别中。例如,将早期的病例或不典型的病例归入对照组,将暴露的级别划错等,这种便倚可能夸大或缩小暴露与疾病的联系。 4混杂偏倚(confounding bias)由于混杂而干扰暴露因素对疾病影响的效果观察。当混杂因素在病例组与对照组中分布不均匀的,就会影响暴露与疾病联系的分析。如在研究吸烟
14、与食管癌的关系时,饮酒可能会是混杂因素,在饮酒和不饮酒的人群中,吸烟与食管癌的关系不一致。因此,将饮酒作为混杂因素进行分层,分别分析在饮酒和不饮酒人群中,吸烟与食管癌的联系强度。,29,(二)病例对照研究中的注意事项 1严格定义研究对象的入选标准与排除标准,严格执行疾病的诊断标准,尽量选用新诊断的病例,少用现患病例,减少信息偏倚。 2注意对照组与病例组间的可比性,对照组最好选用普通人群,减少选择性偏倚。 3在收集资料时,对照组与病例组应同样对待。避免在收集资料过程中出现信息偏倚。 4如果采取配比研究,切勿匹配过头,既危险因素作为了配比条件。,30,四、病例对照研究的优缺点与应用 病例对照研究的
15、优点在于简便、快速、节省费用,需要调查的对象少;同一项调查可以识别一个以上的危险因素;可以利用病史的记录进行研究;不存在医德问题。病例对照研究适合于:发病率比较低和罕见病病因研究;潜伏期较长的疾病;需要在较短时间内得出结果,找出原因的疾病的研究 病例对照研究的缺点在于容易发生各种偏倚,不能直接计算发病率,只能估计相对危险度,无法得出因果联系的结论,但可以为进一步的研究提供一些线索。,31,第三节 队列研究 队列研究(cohort study)又称定群研究,属于经典的前瞻性研究(prospective study)。在时间顺序上是从“因”到“果”的研究。它是通过对不同暴露的观察对象进行追踪、观察
16、,收集其发生疾病的资料,通过分析,比较不同人群疾病的发生情况,从而判断暴露与疾病发生的联系强度。,32,(一)前瞻性队列研究(prospective cohort study)通常是指研究开始时,暴露因素已经存在,但还没有疾病的发生。一般是将研究对象按其自然状况下是否可能接受暴露分为暴露组(exposure group)和非暴露组(no-exposure group),追踪、随访并详细记录暴露组和非暴露组健康状况的改变和疾病的发生情况,通过比较分析,找出两组间的差异,从而推断疾病的发生是否与暴露因素有关。,33,(二)回顾性队列研究(retrospective cohort study) 又称
17、为回顾性定群研究(historical prospective study)。其特点是在研究开始时暴露和疾病都已经发生,研究者先追溯有关历史资料确定暴露组和对照组,然后通过各种途径查找这些对象发病和死亡情况。比较和分析两组的发病率和死亡率,从而推断暴露与疾病之间的联系。,34,队列研究设计模式 :,35,研究内容和步骤 (一)确定研究人群 根据研究人群是否变动,队列研究的研究人群分为固定队列(fixed cohort)和流动人群(dynamic population)两种类型。固定队列是指在整个研究过程中,暴露组和非暴露组人群固定不变,如在职业损害的队列研究中,尽管暴露对象因健康损害离开了暴露
18、环境,但仍然将他们归为暴露组。在职业流行病学中,研究对象通常都是固定队列。流动人群在整个研究过程中,人群的数量和具体对象都在不断发生变化,研究者无法确切的随访具体某个对象的暴露情况和患病情况,但可以估计整个群体发病率水平。,36,(二)暴露人群的选择 队列研究暴露人群可以是有某种特殊暴露史的人群,也可以是一般普通的暴露。前者的暴露常常是要研究单一的暴露因素与健康损害的关系,如在二战时期日本广岛遭受原子弹爆炸后存活的居民,就具有特殊的接受辐射的暴露史,可以作为研究辐射与健康研究的特殊暴露人群。而一般暴露人群常常是由不同暴露因素的个体组成,37,(三)对照组人群 病例对照研究的对照组人群大致分为三
19、种:1)内对照:即研究人群中的无暴露或暴露最低剂量的同一研究人群;2)外对照:没有暴露或暴露最低剂量的其他人群,采用外对照人群,要注意各组的年龄、性别、住地、文化程度及随访时间等特征的可比性;3)一般社会人群作对照:利用一般社会人群作对照可以节约经费和时间,但由于社会人群数量大,发病率稳定,常常导致暴露与疾病的关系被低估。,38,(四)暴露资料的收集 暴露的含义是广泛的,并非单指对健康有害的因素,也可以是健康的保护性因素,如某地长期饮用某种矿泉水的人群,可能其健康状况比其他地区要好,这就是一种有益的暴露,一种保护因子。对暴露因素应该尽可能地定量,定量的研究可以了解剂量反应关系;增强对疾病因果关
20、系的可行性;并为制定卫生标准提供依据。在收集暴露资料时,还需要注意记录暴露的时限,以便资料的统计分析。,39,资料的整理和分析 (一)资料的整理 随着计算机应用的普及,流行病学调查资料的数据管理和统计分析已经非常方便,常用数据库软件对数据进行管理,如Foxpro.等。但在调查结果的报告时,常整理成如下表格式。,但在队列研究中,有时由于观察时间较长,观察对象变动,不断有失访、死亡和增加,造成计算发病率的分母不稳定,因而,常用人时发病率的计算代替累积发病率。这时,资料应按暴露时间长短进行整理,40,统计分析 队列研究结果的统计分析主要包括: 1)计算对照组和各暴露组分年龄、性别或暴露时间的发病率或
21、死亡率; 2)计算标准化发病比(standard incidence ratio, SIR)、标化死亡比(Standard mortality ratio, SMR); 3)率差(rate difference, RD)、率比(rate ratio, RR)比较和分析暴露与不暴露发病率或死亡率的差别; 4)采用各种统计模型,如Logistic回归模型、二项分布回归模型、Poisson回归模型等分析影响发病率或死亡率的因素,41,1率的计算 队列研究常计算的率有累计发病率、累计死亡率和发病密度。 1)累计发病率(cumulative incidence rate, CI)或累计死亡率(cumul
22、ative mortality, CM) 当队列研究的观察人群比较小,观察时间短,人群变动不大时,可以计算累计发病率和累计死亡率。公式如下: n: 观察期内被研究疾病的发病或死亡人数 N: 观察期开始时的研究对象人数,42,例题, 某市有200万人口,其中HBsAg携带者10万人,经过2年的前瞻性研究,发现HBsAg携带者中发生原发性肝癌250例,而非HBsAg携带者中仅发生95例肝癌患者。 该例,暴露组( HBsAg携带者) CI1=250/100 000=250/10万 非暴露组( 非HBsAg携带者)CI0=95/1900000=5/10万 可见,暴露组的发病率远高于非暴露组的发病率。,
23、43,发病密度(Incidence Density, ID) 又称为人时发病率或人时死亡率。在队列研究中,当观察随访时间长,观察人数较大,观察人群不稳定,不断有死亡、失访、新近入的观察对象时,计算累计发(死)病率的分母不稳定。因此,引入时间的概念,计算发病密度更为合理。计算发病密度首先需要计算暴露人时。暴露人时可以是人.年、人.月、人日等单位。是观察人数与观察时间的乘积。例如5人接受随访1.5年,那么51.5=7.5人年。人时的计算方法可以有均数累加法和寿命表法两种,详见有关书籍。发病密度的计算公式如下: (8.24) n:观察期内所研究疾病的发病数或死亡数 PT:所观察的人时数。,44,2标
24、准化率或标准化比的计算 由于疾病的发生或死亡与年龄有关,在比较暴露组与非暴露组的发病率或死亡率时,就必需要考虑两组间年龄等因素的可比性,常常是通过计算标准化发病率(比)或死亡率(比)后再进行比较,即计算标准化率(比)。 1)直接法计算标准化率 关于直接法计算标准化率在许多统计学教材都有介绍。,45,2) 间接标准化法 间接标准化法是先用标准年龄发病率或死亡率计算暴露组(或对照组)的期望发病数或死亡数,然后再用实际观察数除以估算到的期望数,得到标准化比值比。标准化比值比常称为标化死亡比或标化发病比(standard morbidity ratio 或standard mortality rati
25、o, SMR)。SMR的计算无需暴露者年龄,与各年龄组的率无关,因而近年来在流行病学研究中广泛应用。标化死亡比的计算公式为:,46,O:是指实际观察到的各年龄组实际死亡数之和, E:用标准年龄发病率或死亡率计算暴露组(或对照组)的期望发病数或死亡数,47,标化死亡比: 说明该校恶性肿瘤死亡率是标准组的2.59倍。,48,3联系强度的估计 在队列研究中,常用相对危险度、归因危险度等指标来估计暴露与疾病的联系强度。 1)相对危险度(relative risk)又称率比(rate ratio)或风险率(risk ratio),通常用RR表示,是暴露组的发病率或死亡率(Ie)与非暴露组的发病率或死亡率
26、(In)之比,用来测定某一暴露与疾病的因果联系。当RR=1时,表示暴露因素与疾病无关;RR1时,表明暴露可能是一种危险因素,RR越大,暴露与疾病的联系越强;RR1时,表明这种暴露可能是保护因素,RR越小,对该病保护的意义越大。RR的计算式为:,49,2)归因危险度(attributable risk, AR)亦称率差(rate difference, RD)是指暴露组的发病率或死亡率(Ie)与对照组的发病率或死亡率(In)之差。反应该病归因于某暴露因素的危险程度。AR的取值范围在负无穷大到正无穷大,并有度量单位。计算式为 :,50,归因危险度百分比(percentage of attribut
27、able risk, AR%)是反映归因危险度在暴露组发病率中所占的百分比。计算式为: 队列研究结果的分析除了计算以上指标外,还用卡方分析进行显著性检验,对危险因素采用Logistic回归模型、二项分布回归模型、Poisson回归模型等统计模型分析详见有关书籍。,51,队列研究的优缺点和应用 (一)优点: 1由于队列研究是对观察对象进行追踪、随访、测量,并记录随访期内研究对象的发病和死亡情况,因此,所得资料可靠,准确; 2并能直接计算发病率或死亡率及相对危险度、归因危险度等指标; 3能初步确定暴露与疾病的因果关系; 4在追踪随访时,能对一种暴露所致的多种疾病进行观察。,52,(二)缺点: 1队列研究所需时间长,工作量大,耗费多; 2如果在追踪随访过程中失访,容易导致失访偏倚;特别是当失访导致暴露组与非暴露组的主要特征出现差别时,应谨慎结论。,53,(三)应用: 1前瞻性队列研究适用于发病率高,潜伏期短的疾病研究; 2当病例对照研究已初步验证病因的基础上,可以采用队列研究作进一步的病因分析; 3可用于某些疾病治疗的副作用观察研究。,
限制150内