(精品)流行病—病例对照研究.ppt
流行病与卫生统计学教研室流行病与卫生统计学教研室 张东峰张东峰 描述流行病学描述流行病学描述流行病学描述流行病学 分析流行病学分析流行病学分析流行病学分析流行病学 研研究究方方法法观观察察法法实实验验法法数数理理法法实验流行病学实验流行病学 理论流行病学理论流行病学病例对照研究病例对照研究队列研究队列研究临床试验临床试验现场试验现场试验社区干预项目社区干预项目产生假设产生假设 检验假设检验假设验证假设验证假设 横断面调查横断面调查监测监测生态学研究生态学研究第一节 概述第二节 病例对照研究的类型第三节 实例第四节 病例对照研究的实施第五节 数据资料的整理与分析第六节 偏倚及其控制第七节 优缺点第八节 小结第一节 概述n n一、基本概念:一、基本概念:选择患有某特定疾病的病人作为病例,以不患有该病但具有可比性的个体作为对照,调查他们发病前对某个(些)因素的暴露暴露情况,比较两组中暴露率和暴露水平的差异,研究该疾病与这个(些)因素的关系暴露 研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态,这些因素或状态即为暴露因素,它可以是有害的,也可以是有益的,也叫研究变量第一节第一节 概述概述 例如,对一组肺癌病人(病例组)和一组未例如,对一组肺癌病人(病例组)和一组未患肺癌但有可比性的人(对照组)调查他们的吸患肺癌但有可比性的人(对照组)调查他们的吸烟(暴露)历史(可包括现在吸烟否,过去吸过烟(暴露)历史(可包括现在吸烟否,过去吸过烟否,开始吸烟年龄,吸烟年数,最近每天吸烟烟否,开始吸烟年龄,吸烟年数,最近每天吸烟支数;如已戒烟则为戒烟前每日吸烟支数,已戒支数;如已戒烟则为戒烟前每日吸烟支数,已戒烟年数,等等)。其目的为通过比较两组吸烟史烟年数,等等)。其目的为通过比较两组吸烟史的差别,检验吸烟(可疑病因)与疾病(肺癌)的差别,检验吸烟(可疑病因)与疾病(肺癌)有因果联系的假设。这就是病例对照研究。有因果联系的假设。这就是病例对照研究。第一节第一节 概述概述二、特二、特 点点n1 属于观察法属于观察法 研究者不给研究对象以任何干预,研究者不给研究对象以任何干预,而只是客观地收集对象的暴露情况。病例对照是而只是客观地收集对象的暴露情况。病例对照是自然形成的。自然形成的。n2 设立对照设立对照 有单独设立的,由未患所研究疾病的有单独设立的,由未患所研究疾病的人组成的,供病例组作比较的对照组。人组成的,供病例组作比较的对照组。n3 观察方向由观察方向由“果果”至至“因因”研究者面对的是病研究者面对的是病因作用的结果。因作用的结果。n4 研究方向是纵向的、回顾性的。研究方向是纵向的、回顾性的。暴露与否已成暴露与否已成事实。研究者不能主动控制病例组和对照组对危事实。研究者不能主动控制病例组和对照组对危险因素的暴露。险因素的暴露。n5 难以证实因果关系。难以证实因果关系。第一节第一节 概述概述 图图1 1 病例对照研究原理示意图病例对照研究原理示意图调查方向:收集回顾性资料调查方向:收集回顾性资料 比较比较 人数人数 暴露暴露 疾病疾病病例病例对照对照+acbd第一节第一节 概述概述第二节 病例对照研究的类型n n(一)病例与对照不匹配(一)病例与对照不匹配n n在设计所规定的病例和对照人群中,分别抽取一定量的研究对象,一般对照数目应等于或多于病例人数。此外没有其它任何限制与规定。(二(二)匹配病例对照研究)匹配病例对照研究n 1.匹配的概念匹配的概念 匹配匹配(matching)又称配比,又称配比,是以对结果有干扰作用的某些因素或特征作为匹是以对结果有干扰作用的某些因素或特征作为匹配因素,使对照组与病例组在匹配因素上保持相配因素,使对照组与病例组在匹配因素上保持相同的一种限制方法。即要求对照在某些因素或特同的一种限制方法。即要求对照在某些因素或特征上与病例保持一致。征上与病例保持一致。n 2.匹配的目的:可以消除匹配因素的作用匹配的目的:可以消除匹配因素的作用(匹匹配因素即混杂因素配因素即混杂因素),从而清楚地表明研究因素与,从而清楚地表明研究因素与疾病的关系;还可以用较小的样本增加分析时的疾病的关系;还可以用较小的样本增加分析时的统计学检验能力,提高流行病学效率。统计学检验能力,提高流行病学效率。3.匹配法(matching)vv 频数匹配(又称成组匹配):匹配因素所占的比例在对照组与病例组一致匹配因素所占的比例在对照组与病例组一致vv个体匹配:vv 给每一个病例选择一个或几个对照,配成对(pair)或配成伍,使对照在某些因素或特征(如年龄、性别等)方面与其相配的病例相同或基本相同4.匹配法注意事项匹配法注意事项 :vv慎重选择匹配因素慎重选择匹配因素 vv可疑病因决不能作为匹配因素可疑病因决不能作为匹配因素 vv比例一般为比例一般为1:1,也可以,也可以 1:2,甚至,甚至1:3或或 1:4,最多不超过,最多不超过1:4 vv匹配的因素不宜过多匹配的因素不宜过多 ,避免发生,避免发生“匹配匹配过度(过度(overmatching)”增加工作的难度增加工作的难度匹配过头匹配过头(overmatching):把不必要的项目列入匹配,企图使病例与对照尽量一致,就可能徒然丢失信息,增加工作难度,结果反而降低了研究效率。这种情况称为匹配过头。(三)病例对照研究的衍生类型n n1.巢式病例对照研究 n n 它是将传统的病例对照研究和队列研究的一些要素进行组合后形成的一种研究方法。n n 巢式病例对照研究的类型:前瞻性和回顾性n n2.2.病例病例-队列研究队列研究(case-cohort study)(case-cohort study)n n又称病例参比式研究又称病例参比式研究(case-base reference(case-base reference study)study),也是一种队列研究与病例对照研究结合,也是一种队列研究与病例对照研究结合的设计形式。的设计形式。n n 3.3.病例交叉研究病例交叉研究 n n 病例交叉研究的基本思想就是比较相同研究病例交叉研究的基本思想就是比较相同研究对象在急性事件发生前一段时间的暴露情况与未对象在急性事件发生前一段时间的暴露情况与未发生事件的某段时间内的暴露情况。发生事件的某段时间内的暴露情况。n n4.4.单纯病例研究单纯病例研究 n n5.5.病例病例-时间时间-对照设计对照设计第三节第三节 实例实例(年轻女性阴道腺癌与母亲妊娠期服用乙烯雌酚的关系)(年轻女性阴道腺癌与母亲妊娠期服用乙烯雌酚的关系)(年轻女性阴道腺癌与母亲妊娠期服用乙烯雌酚的关系)(年轻女性阴道腺癌与母亲妊娠期服用乙烯雌酚的关系)研究背景研究背景 研究步骤研究步骤 研究结果研究结果研究背景 美国波士顿Vincent纪念医院妇产科医生Herbst在发现,19661969年收治7例阴道腺癌患者,均为15岁22岁女青年。通常阴道癌占女性生殖系统癌的2%,阴道腺癌仅占阴道癌的5%10%,非常罕见,而这7例全是腺癌;过去年龄均大于25岁,而这7例全在15岁22岁之间。研究步骤研究步骤nHerbst对阴道腺癌危险因素进行探索 n7例病人加上另一个医院的例阴道腺癌患者作为病例组病例组 n每个病人配4个对照,共32个对照 n调查员用标准调查表对病例、对照与她们的母亲进行了调查,经统计学处理后的主要结果见表1表表表表1 1 1 1 阴道腺癌病例与对照的母亲主要暴露因素的比较阴道腺癌病例与对照的母亲主要暴露因素的比较阴道腺癌病例与对照的母亲主要暴露因素的比较阴道腺癌病例与对照的母亲主要暴露因素的比较研究结果研究结果研究结果研究结果 在比较的因素中,只有三个因素有显著差别在比较的因素中,只有三个因素有显著差别在比较的因素中,只有三个因素有显著差别在比较的因素中,只有三个因素有显著差别vv母亲怀孕期间使用过己烯雌酚激素治疗母亲怀孕期间使用过己烯雌酚激素治疗母亲怀孕期间使用过己烯雌酚激素治疗母亲怀孕期间使用过己烯雌酚激素治疗 (P0.00001)(P0.00001)vv母亲以前流产史母亲以前流产史母亲以前流产史母亲以前流产史(P0.01)(P0.01)vv此次怀孕阴道出血史此次怀孕阴道出血史此次怀孕阴道出血史此次怀孕阴道出血史(P0.05)(P0.05)因有后两个因素存在才使用己烯雌酚治疗因有后两个因素存在才使用己烯雌酚治疗因有后两个因素存在才使用己烯雌酚治疗因有后两个因素存在才使用己烯雌酚治疗做出结论:母亲在妊娠早期服用己烯雌酚使她们在子宫中做出结论:母亲在妊娠早期服用己烯雌酚使她们在子宫中做出结论:母亲在妊娠早期服用己烯雌酚使她们在子宫中做出结论:母亲在妊娠早期服用己烯雌酚使她们在子宫中的女儿以后发生阴道腺癌的危险性增加的女儿以后发生阴道腺癌的危险性增加的女儿以后发生阴道腺癌的危险性增加的女儿以后发生阴道腺癌的危险性增加第四第四节 病例病例对照研究的照研究的实施施n一、提出假设一、提出假设n二、选择适宜的对照形式二、选择适宜的对照形式n三、病例与对照的来源与选择三、病例与对照的来源与选择n四、样本含量的估计四、样本含量的估计 五、资料的来源与收集五、资料的来源与收集一一 提出假设提出假设 根据以往疾病分布研究或现况调查结果并结合文献,提出病因假设二二 明确研究目的,选择适宜的对照形式明确研究目的,选择适宜的对照形式 原则广泛探索病因,采用不匹配或频数匹配罕见病采用个体匹配1:R的匹配法,R值不宜超过4 形式成组比较法匹配法三三 病例与对照的选择病例与对照的选择基本原则基本原则 代表性代表性 病例能代表总体的病例病例能代表总体的病例 对照能代表产生病例的总体人群或源人群对照能代表产生病例的总体人群或源人群 可比性可比性 两组主要特征方面无明显差异两组主要特征方面无明显差异病例的选择1.要求v诊断可靠,尽量使用金标准诊断可靠,尽量使用金标准 v选择确诊的新病例选择确诊的新病例 2.来源v总总体体人人群群中中的的全全部部病病例例或或者者随随机机样样本本人人群群中中的的全部病例全部病例 v医院住院或门诊的病例医院住院或门诊的病例对照的选择1.1.要求要求 vv候选对象必须来自产生病例的总体候选对象必须来自产生病例的总体vv对照一旦发生所研究的疾病便成为病例对照一旦发生所研究的疾病便成为病例组的研究对象组的研究对象 2.2.来源来源vv研究的总体人群或抽样人群中具有代表性的研究的总体人群或抽样人群中具有代表性的非病例非病例 vv医院中患有其他疾病的病人医院中患有其他疾病的病人 vv亲属、邻居、同事、同学等亲属、邻居、同事、同学等四四 样本含量的估计样本含量的估计(一)有关参数(二)估计方法(三)举例(一)有关参数vv病例组的暴露率(P1)和对照组暴露(P0)vv优势比(odds ratio,OR)vv值 vv把握度1-(二)方法(二)方法vv查表法查表法vv公式法:公式法:vv近似公式:近似公式:(三)举例 为研究西安市肺癌与吸烟的关系,欲进行一次病例对照研究。已知西安市普通人群中吸烟率 P0为30%,OR为5.0,为0.05,把握度为0.90 、值查表,Z为1.64,Z为1.28代入公式得:v病例组与对照组,各需28人 v代入近似公式计算,所得结果与原公式接近 五五 资料来源与收集资料来源与收集(一)资料来源(二)调查的含义及实施时遵循的原则(三)调查表(一)资料来源 v 医院病案记录,疾病登记报告等摘录v 检测病人的标本或病人的环境获得 v 对病例或对照的询问调查中取得(二)调查的含义及实施时遵循的原则含义 是信息传达、接受和反映的过程,是属于行为科学的范畴,被调查者要通过感受、回忆、思维、联想和反映等过程来回答问题 原则v调查表的设计需要各专家参加讨论 v调查员要经过严格的培训 v调查员手册v监督与审查(三)调查表 定义 也称“调查问卷”,通过把拟收集的数据项目用 恰当的措词构成一系列问题的答卷,是资料收集的最主要工具内容v调查表的名称、编号v一般项目:姓名、性别、民族等v研究项目:研究变量,疾病史、吸烟史等v结尾部分:调查员签名、调查日期等均衡性检验均衡性检验 计算计算OR 分层分析与多因素分析分层分析与多因素分析 推论因素与疾病关联推论因素与疾病关联第五节资料整理与分析一 均衡性检验 比较病例组与对照组在研究因素以外的其他主要特征方面有否可比性,两组非研究因素均衡,其暴露率的差异与发病有关二 计算ORvOR 又称优势比,比值比,交叉乘积比指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值 v公式vOR:(a/c)/(b/d)=ad/bcOR特点与RR一样,优势比反映暴露者患某种疾病的危险性较无暴露者高的程度 如果能满足2个条件 所研究疾病的发病率(死亡率)很低 病例对照研究中所选择的研究对象代表性好 OR RR(一)成组比较法分析2 检验v传统的四格表的专用公式 vantel-Haenszel(M-H)方法OR计算与可信限的估计及其意义OR 95%C.I.=例例:食管癌发病因素的研究:食管癌发病因素的研究95%的可信范围是在的可信范围是在2.183.78之间之间1.2 检验四格表的专用公式 M-H法公式其中E()为a的期望值;V()为a的方差 两种方法计算结果一致,表明吸烟与食管癌有联系,但联系强度如何,要计算OR2.OR计算与可信限的估计及其意义 Miettinen法的OR可信限:结果表明吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信范围是在2.183.78之间(二)1:1配对资料的分析匹配资料是由病例与对照结合成对子,列成表4的格式,表内的数字a、b、c、d 是病例与对照配成对的对子数1:1配对研究中疾病与暴露的关系配对研究中疾病与暴露的关系公式OR 95%C.I.=例:食管癌发病因素的男性研究资料 表表5 935 93对男性食管癌与对照的吸烟史对男性食管癌与对照的吸烟史第五节第五节 资料整理与分析资料整理与分析95%的可信范围是在1.8410.08之间 表明男性吸烟者患食管癌的危险性是不吸烟者的4.3倍,95%的可信范围是在1.8410.08之间第五节第五节 资料整理与分析资料整理与分析三 混杂因素作用的估计与分层分析v 分层分析的方法识别混杂因素v进行齐性检验v计算合并OR与2值 例:在表3资料886例食管癌病人与对照中有586例饮酒 2 2=31.9,OR=2.29 因此饮酒与食管癌有联系,而生活中饮酒与吸烟关系密切,所以饮酒可能是混杂因素 分层分析统计学估计其作用大小1.1.按饮酒与否进行分层按饮酒与否进行分层表表6 6 按饮酒与否分层分析食管癌与吸烟的关系按饮酒与否分层分析食管癌与吸烟的关系 v饮酒者中吸烟的OR(2.98)稍高于不分层时OR(2.87)不饮酒者中吸烟的OR(1.67)较低 v表明饮酒是混杂因素,加强吸烟的作用.进行齐性检验v消除饮酒与否的影响,就要计算这两组人群合并的与OR值,而在此之前必须先作齐性检验v齐性检验可参照有关书籍v两组人群OR值没有明显差别,用统计学方法消除混杂作用影响,求合并OR值,有显著差异,不宜再计算合并OR值v本例齐性检验的结果无显著差异 3.计算合并OR与2值 合并 合并表表7 食管癌与吸烟关系的病例对照整理表食管癌与吸烟关系的病例对照整理表合并合并合并合并提示 v合并2与合并OR较未调整的2(55.5)与OR(2.87)为低,但吸烟与食管癌之间仍有统计学意义v饮酒是吸烟与食管癌之间的混杂因素,能加强吸烟的作用 1.选择偏倚2.信息偏倚3.混杂偏倚1.选择偏倚 由于选入的研究对象与未选入的研究对象某些 特征上存在差异而引起的误差2.信息偏倚 在收集整理信息过程中由于测量暴露与结局 的方法有缺陷造成的系统误差 3.混杂偏倚 研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系1.选择偏倚 种类入院率偏倚 现患病例-新发病例偏倚 检出征侯偏倚时间效应偏倚入院率偏倚 定义 也叫Berkson偏倚,当利用医院病人作为病例和对照时,对照是医院的某一部分病人不是全体目标人群的一个随机样本,病例只是该医院或某些医院的特定病例不是全体病人的随机样本,所以难免产生偏倚,特别是因为各种疾病的入院率不同导致病例组与对照组某些特征上的系统差异。控制v合理地选择病例与对照;v从总体人群中选择所有或绝大多数符合诊断标准的病例;v从各医院中选取病例,从多病种中选择对照。表表8 8 不同人群骨和运动器官与呼吸道疾病之间关系的不同人群骨和运动器官与呼吸道疾病之间关系的OROR值值 呼吸呼吸道疾道疾病病一般人群骨和运动器官疾病一般人群骨和运动器官疾病住院病人骨和运动器官疾病住院病人骨和运动器官疾病17207515184237618219合计合计201258323234OR1.064.06举例:在一般人群中和住院病人中研究骨和运动器官疾病与呼吸道疾病之间的关系,由于研究来源的不同,OR值不同(Sacket BJ,1979)现患病例-新发病例偏倚定义 又称奈曼偏倚,如果调查对象选自现患病例,即存活病例,可能得到更多的信息,但是其中很多信息可能只与存活有关,而未必与该病的发病有关,从而高估了某些暴露因素的病因作用;另一种情况是,某病的幸存者改变了生活习惯,从而降低了某个危险因素的水平,或当他们被调查时夸大或缩小了病前生活习惯上的某些特征,导致某一因素与疾病的关联误差。控制 调查时明确规定纳入标准为新发病例。检出征侯偏倚定义 也称暴露偏倚,病人常因某些与致病无关的症状而就医,从而提高了早期病例的检出率,致使过高地估计了暴露程度而产生的系统误差。举例 1975年Ziel所做的妇女服用复方雌激素与子宫内膜癌关系的病例对照研究:服用复方雌激素的妇女因导致阴道出血而就医,故被发现有早期子宫内膜癌的机会增多,从而得出复方雌激素与子宫内膜癌有关联的错误结论。控制 延长收集病例的时间,超过由早期向中、晚期发生的时间。时间效应偏倚定义 对于肿瘤、冠心病等慢性疾病,从开始暴露于危险因素到出现病变往往经历一个较长的时间过程,因此那些暴露后即将发生病变的人、已发生早期病变而不能检出的人、或在调查中已有病变但因缺乏早期检测手段而被错误地认为是非病例的人,都可能被选入对照组,由此而产生了结论的误差。控制v尽量采用敏感的疾病早期检查技术;v开展观察期充分长的纵向调查。2.信息偏倚 种类回忆偏倚 调查偏倚 回忆偏倚定义 病例对照研究主要是调查研究对象既往的暴露情况,由于被调查者记忆失真或不完整造成结论的系统误差。原因 与调查时间和事件发生的时间间隔、事件的重要性、被调查者的构成以及询问技术有关。控制v选择不易为人们所忘记的重要指标做调查;v重视问卷的提问方式和调查技术。调查偏倚来源v调查对象v调查者原因 病例与对照的调查环境与条件不同调查技术、调查质量不高或差错以及仪器设备的问题。控制v采用客观指征;v认真做好调查技术培训;v采取复查等方法做好质量控制;v检查条件尽量一致;v使用的检查仪器应精良。3.混杂偏倚特点 不易识别,不易确定,需认真细致地去解决。控制的方法 v 匹配法;v 分层分析法;v 多因素分析。优点v样本量小,病例易获取,工作量不大,所需人力、物力较少,易于进行,出结果快;v可同时对一种疾病的多种病因进行研究;v适合于对病因复杂、发病率低、潜伏期长的疾病;v可以对治疗措施的疗效与副作用做出初步评价。缺 点v易受回忆偏倚的影响;v选择合理的对照较困难;v结果的可靠性不如队列研究;v不能计算暴露与无暴露人群的发病率。1.病例对照研究(case-control study,case reference study)是分析流行病学最基本、最重要的研究类型之一;回顾性从果查因的研究方法,是在疾病发生之后去追溯假定的病因因素。2.病例对照研究的四大要素 人群、对照、病例和暴露;明确产生病例的人群,从中正确地挑选对照,并正确地收集暴露资料是病例对照研究的精髓。小结3.对照不必代表所有未患研究疾病的病人,同样也不必代表所有总体人群;病例不必代表患有该种疾病的全部病人,也不可能做到这一点。4.选择病例原则 符合病例的定义,就应当收入病例组,不受其暴露状态的影响,避免产生选择偏倚。5.新发病例比现患病例好v回忆暴露及暴露与疾病的时序关系时更明确;v新发病例与现患病例暴露分布没有差别,也可用现患病例;v研究先天畸形和某些非致死性慢性疾病,如肥胖、糖尿病等用现患病例;v死亡病例省时省钱,很快可以提供研究线索。6.正确地选择对照是病例对照研究成败的关键v 病例的来源决定了对照的来源;v 可比性比代表性更重要。7.资料质量的可比性与病例和对照成员之间的可比性一样重要;注意两组收集资料时资料质量的可比性,以保证研究的真实性。8.基本分析方法是比较两组暴露比例,计算暴露优势比,估计患病的优势比,在发病率低的情况下估计相对危险度。9.对照所患疾病不应与研究的暴露因素有关v对照疾病的发病率在暴露的各类别或各水平上都一样;v病例是新诊断的病例,对照不应是慢性病患者。