第五章 病例对照研究课件.ppt
关于第五章 病例对照研究1现在学习的是第1页,共77页2 病例对照研究是分析流行病学研究方法中最基本、最重要的的研究类型之一,是验证病因假说的重要工具,是一种由果及因的回顾由果及因的回顾性研究方式性研究方式 现在学习的是第2页,共77页3第一节 病例对照研究的基本原理一、病例对照研究一、病例对照研究(Case-control study)选择患有特定疾病的人群作为病例组,和未患这种疾病未患这种疾病的人群作为对照组,调查两组人群过去暴露于某种(些)可能危险因素的比例,判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。现在学习的是第3页,共77页4二、病例对照研究特点 疾病发生后进行 按发病以否分成病例组与对照组 暴露是由研究对象从现在对过去的回顾 由果推因 分析暴露与疾病的联系现在学习的是第4页,共77页5三、病例对照研究原理示意图三、病例对照研究原理示意图acbda/(a+c)现在学习的是第5页,共77页6目标人群目标人群发病时序发病时序工作时序工作时序暴露暴露未暴露未暴露暴露暴露未暴露未暴露某病患者某病患者(病例病例)非患者非患者(对照对照)可可 比比acbda/(a+c)b/(b+d)比比 较较现在学习的是第6页,共77页7病例对照研究资料整理表病例对照研究资料整理表现在学习的是第7页,共77页8用 途 广泛探索疾病的可疑危险因素 深入检验某个或某几个病因假设 为队列研究提供明确的病因线索 现在学习的是第8页,共77页9暴露暴露(ExposureExposure):):研究对象曾经接触过某些因素,或具备某些特征,或处于某种状态。暴露因素可以是机体的特征,也可以是体外的;可以是先天的,也可以是后天获得的;可以是有害的,也可以是有益的。如:血型、特殊职业暴露、环境污染、疾病家族史、某种基因型、吸烟、少食果蔬、高盐饮食、运动、平衡膳食四、暴露四、暴露现在学习的是第9页,共77页10第二节 典型范例F2020世纪世纪2020年代:年代:生殖因素与乳腺癌 F40405050年代:年代:吸烟与肺癌吸烟与肺癌(Doll and Hill)F6060年代:年代:?口服避孕药与心梗、静脉栓塞;?孕妇服用反应停与婴儿先天畸形;?早孕服用雌激素与阴道腺癌。现在学习的是第10页,共77页11实例实例1.1.吸烟与肺癌吸烟与肺癌 Doll与与Hill于19481952年进行研究。从伦敦20所医院及其他几个地区选取确诊的肺癌病例。每一病例按性别、年龄组、职业等配一个非肺癌对照,调查两者吸烟暴露情况。现在学习的是第11页,共77页12肺癌病例对照研究吸烟史比较吸烟史病例对照合计吸烟6886501338不吸烟215980合计7097091418现在学习的是第12页,共77页13肺癌病例对照研究吸烟史比较(男性)吸烟史病例对照合计吸烟6476221269不吸烟22729合计6496491298现在学习的是第13页,共77页14肺癌病例对照研究吸烟史比较(女性)吸烟史病例对照合计吸烟412869不吸烟193251合计6060120现在学习的是第14页,共77页15分析结果:分析结果:肺癌病人中不吸烟者的比例远小于对照组;肺癌病人在病前10年内大量吸烟者(20支/日)显著多于对照组;随着日吸烟量增加,肺癌预期死亡率升高;肺癌病人开始吸烟的年龄较早,持续的年数较多。现在学习的是第15页,共77页16第三节 病例对照研究的类型 1.1.病例与对照不匹配病例与对照不匹配 :又称成组比较法,按与病例组可比的原则,根据样本的大小,选择一定数量的对照,数量不需成严格的比例关系,但对照的数量等于或多于病例。现在学习的是第16页,共77页17现在学习的是第17页,共77页18 2.2.病例与对照匹配:病例与对照匹配:或称配比(matching),即要求对照在某些因素或特征上与病例保持一致,目的是对两组进行比较时排除匹配因素的干扰。分为个体匹配和频数匹配分为个体匹配和频数匹配 目的:提高研究效率,增加统计检验效率,控制混杂因素的作用现在学习的是第18页,共77页19个体匹配个体匹配(individual matching):给每一个病例选择给每一个病例选择一个或几个对照,配成对(一个或几个对照,配成对(pairpair)或配成伍,使对)或配成伍,使对照在某些因素或特征(如照在某些因素或特征(如年龄、性别年龄、性别等)方面与其等)方面与其相配的病例相同或基本相同相配的病例相同或基本相同现在学习的是第19页,共77页20现在学习的是第20页,共77页21现在学习的是第21页,共77页2253岁岁(5059岁组岁组)5059岁岁现在学习的是第22页,共77页2353岁岁53 3岁岁研究类型研究类型现在学习的是第23页,共77页24频数匹配(频数匹配(frequency matching,又称成组匹配):又称成组匹配):要要求研究组和对照组中匹配变量的频数分布相似,求研究组和对照组中匹配变量的频数分布相似,限制研究因素以外的某些因素干扰研究结果的一限制研究因素以外的某些因素干扰研究结果的一种手段,使研究组和对照组具有可比性。种手段,使研究组和对照组具有可比性。现在学习的是第24页,共77页25匹配的注意事项?匹配的因素不宜过多,防止匹配过头匹配的因素不宜过多,防止匹配过头(overmatching):把不必要的项目列入匹配,企图使病例与对照尽量一致,就可能丢失信息,增加工作难度,结果反而降低了研究效率?慎重选择匹配因素,可疑病因决不能作为匹配因素一般慎重选择匹配因素,可疑病因决不能作为匹配因素一般多只匹配多只匹配age、gender?比例一般为比例一般为1:1,也可以1:2,甚至1:3或1:4,最多不超过1:4现在学习的是第25页,共77页26第四节 病例对照研究实施一、研究步骤一、研究步骤l提出假设(“病因”对应疾病)l选择合适的对照形式(一般采用不匹配或频数匹配,罕见病例采用个体配比)l病例与对照的选择l样本含量的估计l研究因素的选择和资料的收集 l资料的整理和分析现在学习的是第26页,共77页27暴露暴露?疾病疾病?提出病因假设提出病因假设课题课题研究实施研究实施选择研究课题选择研究课题1.1.确定题目确定题目2.2.查阅文献查阅文献3.3.咨询专家咨询专家4.4.确定意义确定意义5.5.科学性论证科学性论证现在学习的是第27页,共77页28二、病例与对照的选择二、病例与对照的选择(一)基本原则(一)基本原则 l代表性:代表性:选择的病例要足以代表总体的病例,对照足以代表能够产生病例的总体人群(实际操作最难把握的)l可比性:可比性:病例组与对照组在年龄、性别等主要特征方面无明显差异现在学习的是第28页,共77页29(二)病例的选择(二)病例的选择1.要求l诊断可靠,尽量使用金标准,国际通用或国内统一的诊断标准l选择确诊的新病例:提供的信息较为可靠 2.来源 l总体人群中的全部病例或者随机样本人群中的全部病例l医院住院或门诊的病例现在学习的是第29页,共77页30(三)对照的选择1.要求l候选对象必须来自产生病例的总体,代表无该病的随机样本(其他疾病的病人和健康抽样)l对照一旦发生所研究的疾病便成为病例l不能为有共同危险因素的疾病病人2.来源(社区或医院)l研究的总体人群或抽样人群中具有代表性的非病例l医院中患有其他疾病的病人l亲属、邻居、同事、同学现在学习的是第30页,共77页31病例和对照常用的选择方法病 例对 照一个医院所有已诊断的病例同个医院内患其他病的病例一个门诊部所有已诊断的病例同个门诊部诊断的其他病例多个医院或门诊部诊断的病例多个医院或门诊部诊断的其他病例以上任何一种方法选出的病例病例所在同一街道或住宅区中的健康人在人群中普查或抽查出的所有病例 在人群中抽查的非病例社会团体中所有诊断的病例社会团体中抽样的非病例以上任何方法选出的病例病例的配偶、同胞、同事、亲朋、同班同学等现在学习的是第31页,共77页32三、样本含量的估计(一)有关参数l病例组的暴露率(P1)和对照组暴露(P0)l比值比(odds ratio,OR)l值,检验的显著性水平,统计推断上弃真的概率l把握度1-,为假设检验第类错误,即假设检验存伪的概率现在学习的是第32页,共77页33(二)方法(二)方法2.公式法公式法非配比的样本大小估计非配比的样本大小估计1.查表法查表法近似公式近似公式其中,N:样本含量;P0:对照组暴露率;P1:病例组暴露率;Z,Z根据标准正态差简表查出;现在学习的是第33页,共77页34或Z(单侧检验)Z(双侧检验)Z(单侧和双侧检验)0.0013.0903.2900.0022.8783.0900.0052.5762.8070.0102.3262.5760.0202.0582.3260.0251.9602.2420.0501.6451.9600.1001.2821.6450.2000.8421.282正态分布的分位数表 现在学习的是第34页,共77页35病例对照研究样本含量表=0.05(双侧),=0.10RR/ORP00.010.100.200.400.600.800.900.1142013766312018230.563236583472031762293782.032063782291762033476583.010741338571891633194.0599775146611172325.0406543735489619410.0150231820316613720.0661211142454115现在学习的是第35页,共77页36 例:现拟用非配比病例对照研究方法调查孕妇暴露于食品中某污染因素与婴儿畸形之间的关系,估计孕妇中该因素暴露率为30%,假定暴露引起的比值比为2,=0.05(双侧),=0.1,需调查多少人?现在学习的是第36页,共77页37例:现拟用非配比病例对照研究方法调查孕妇暴露于食品中某污染因素与婴儿畸形之间的关系,估计孕妇中该因素暴露率为30%,假定暴露引起的比值比为2,=0.05(双侧),=0.1,需调查多少人?P0=0.3,Z=1.96,Z=1.28,OR=2P1=2*0.3/(1-0.3+2*0.3)=0.46,P=(0.3+0.46)/2=0.38N=193,可以确定样本人数为200现在学习的是第37页,共77页38病例对照研究样本含量表=0.05(双侧),=0.10RR/ORP00.010.100.200.400.600.800.900.1142013766312018230.563236583472031762293782.032063782291762033476583.010741338571891633194.0599775146611172325.0406543735489619410.0150231820316613720.0661211142454115P0=0.3,Z=1.96,Z=1.28,OR=2,查表得N=200现在学习的是第38页,共77页39例:小儿先天性心脏病与母亲孕期口服某激素药关系的病例对照研究中,假定育龄妇女中应用某激素药占30,孕期服用某激素药与小儿先天性心脏病的RR=3,=0.05(双侧检验),=0.10,确定样本量?N=73,查表N=75现在学习的是第39页,共77页40配比研究样本量计算(了解)配比研究样本大小的公式估算不作要求,亦可查病例对照研究得样本含量表病例对照研究得样本含量表确定.现在学习的是第40页,共77页41四、资料来源与收集(一)资料来源(一)资料来源l 医院病案记录,疾病登记报告等摘录医院病案记录,疾病登记报告等摘录 l 检测病人的标本或病人所处的的环境检测病人的标本或病人所处的的环境 l 对病例或对照的询问调查中取得对病例或对照的询问调查中取得现在学习的是第41页,共77页42(二)调查遵循的原则(二)调查遵循的原则调查:调查:是信息传达、接受和反映的过程,被调查者要通过是信息传达、接受和反映的过程,被调查者要通过感受、回忆、思维、联想和反映等过程来回答问题感受、回忆、思维、联想和反映等过程来回答问题 原则原则 调查表的设计需要各专家参加讨论调查表的设计需要各专家参加讨论 调查员要经过严格的培训调查员要经过严格的培训 监督与审查监督与审查现在学习的是第42页,共77页43(1)(1)访谈访谈(2)(2)信函信函(3)(3)电话电话(4)(4)档案档案(5)(5)实验室检测实验室检测(6)(6)临床查体临床查体资料收集方法资料收集方法 面面对对面面询询问问,填填表表,是是最最常常用用的的调调查查方方法法 将将调调查查表表及及说说明明通通过过信信件件发发给给调调查查对对象象,应应答答率率受受到到影影响响,可可补补充充调调查查 适适合合调调查查内内容容较较少少的的研研究究 病病历历、职职业业史史、医医疗疗保保险险、户户籍籍管管理理 病病理理、生生化化、分分子子生生物物学学 常常规规、特特殊殊检检查查现在学习的是第43页,共77页44(三)调查表(同现况研究)(三)调查表(同现况研究)调查表:也称“调查问卷”,通过把拟收集的数据项目用恰当的措词构成一系列问题的答卷,是资料收集的最主要工具 内容 调查表的名称、编号 一般项目:姓名、性别、民族等 研究项目:研究变量,疾病史、吸烟史等 结尾部分:调查员签名、调查日期等现在学习的是第44页,共77页45五、资料整理与分析(一)资料整理资料核查、检错、归档、分组、编码、录入计算机现在学习的是第45页,共77页461.成组比较法资料的整理现在学习的是第46页,共77页47l用卡方检验验证,两组暴露率是否存在差异,即验证研究因素与疾病之间有否统计学联系。其计算方法l传统的四格表的专用公式(重点掌握)lantel-Haenszel(M-H)方法(自学)方法(自学)成组资料统计学假设检验:现在学习的是第47页,共77页48校正公式现在学习的是第48页,共77页49卡方检验目的:两个分类变量之间有无关联性(1)建立检验假设,确定检验水平。H0:1=2H1:12=0.05或0.01。现在学习的是第49页,共77页50卡方检验(2)求检验统计量值)求检验统计量值(3)查表,比较)查表,比较与与 (df,)四格表中四格表中df1自由度自由度v=(行数(行数-1)(列数(列数-1)现在学习的是第50页,共77页51卡方检验p若若 (1,0.05),P 0.05,说明两者差异显著,暴露和疾病有关联。p若若 0.05,说明两者差异不不显著,暴露和疾病没有关联。X2(0.05,1)=3.84 X2(0.01,1)=6.63若干若干2 2分布的概率密分布的概率密度曲线度曲线现在学习的是第51页,共77页52l比值比(odds ratio,OR):指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。lOR的特点:反映暴露者患某种疾病的危险性较无暴露者高的程度计算关联强度:现在学习的是第52页,共77页53OR的意义lOR=1:无关联,lOR1:正关联,lOR1:负关联,lOR在0.91.1,暴露与疾病无联系lOR在0.60.8或1.21.6,有弱联系lOR在0.40.5或1.72.5,有中度联系lOR在00.3或2.6,有强联系危险因素保护因素现在学习的是第53页,共77页54OR可信区间l由于OR值是通过一组样本调查所得的点估计值,存在抽样误差。因此,应该估计其可信区间l如果OR的95%可信区间包含1,则表明联系无统计学意义。若OR1.0,则因素为疾病的保护因素OR95%C.I.=现在学习的是第54页,共77页55对照研究成组资料相关性分析步骤(重点)1、调查资料的整理成四格表2、关联性检验,卡方值的计算与比较(3.83或6.63)P P P 0.05,说明两者差异不不显著,暴露和疾病没有关联。3、关联强度计算,计算OR值及可信95区间,指出暴露和疾病的关联强度。现在学习的是第55页,共77页56 例:为了研究黄曲霉毒素与肝癌的关系,进行了成组对照研究。从某肿瘤研究所登记处获得300例肝癌患者,从某医院获得非肝癌患者的对照组500例。经调查,病例组中 210人有黄曲霉毒素接触史,对照组中 170人有黄曲霉毒素接触史,请你整理上述资料,并对黄曲霉毒素与肝癌的关系进行综合分析。现在学习的是第56页,共77页571、整理资料(四格表)病例组对照组合计暴露史210(a)170(b)380(n1)非暴露史90(c)330(d)420(n2)合计300(m1)500(m2)800(N)现在学习的是第57页,共77页582、关联性的检验X2=96 X2(0.01,1)P1说明接触黄曲霉毒素是危险因素OR95%.C.I为3.356.13说明接触黄曲霉毒素诱发肝癌的危险度是无黄曲霉毒素接触史人群的3.356.13倍。OR95%C.I.=结论:黄曲霉毒素可能是诱发肝癌的重要原因,有待队列研究进一步确认。现在学习的是第59页,共77页602.配对病例对照研究的结果分析现在学习的是第60页,共77页611:1配对研究计算公式整理表整理表对照组对照组病例组病例组合计对子合计对子数数+a cb da+b c+d合计对子合计对子数数a+cb+dN casecontrol+a b c d1:1配对病例对照研究资料整理OR95%C.I.=现在学习的是第61页,共77页62对照研究1:1配比资料相关性分析步骤(重点)1、调查资料的整理成四格表(与成组有区别)2、关联性检验,卡方值的计算与比较:P P P 0.05,说明两者差异不不显著,暴露和疾病没有关联。3、关联强度计算,计算OR值及可信95区间,指出暴露和疾病的关联强度。现在学习的是第62页,共77页63例:为了了解食用水果与肝癌之间的关系。水果中以猕猴桃为研究对象。有人对100例病人做了1:1的配比对照试验。经调查,病例组中有60人有食用猕猴桃的习惯,配对后发现,病例组与对照组中均有食用猕猴桃的习惯52对,病例组与对照组中均无食用猕猴桃的习惯11对,请整理资料,并进行综合分析。现在学习的是第63页,共77页641、整理资料(四格表)对照组病例组合计食用史无食用史食用史52(a)29(b)81无食用史8(c)11(d)19合计6040100现在学习的是第64页,共77页652、关联性的检验X2=10.8 X2(0.01,1)P0.01,差异极显著,说,差异极显著,说明食用猕猴桃与肝癌明食用猕猴桃与肝癌有关联。X2(0.05,1)=3.84 X2(0.01,1)=6.63现在学习的是第65页,共77页663、联系强度计算OR=c/b=0.281说明无食用猕猴桃饮食习惯的人群患肝癌的危险度是有食用猕猴桃饮食习惯的人群的3.6倍。结论:食用猕猴桃这种饮食习惯为保护因素,无食用猕猴桃这种饮食习惯可能是肝癌一个重要原因。现在学习的是第67页,共77页683.混杂因素的分层分析(自学)分层的目的:排除混杂因素的干扰分层的目的:排除混杂因素的干扰现在学习的是第68页,共77页691.选择偏倚(selection bias):由于选入的研究对象与未选入的研究对象某些特征上存在差异而引起的误差,对象选择阶段入院率偏倚无应答偏倚 检出症候偏倚:虚假因果联系 奈曼偏倚/幸存者偏倚 控制:合理选择病例与对照第五节 偏倚及其控制偏倚及其控制现在学习的是第69页,共77页70 2.信息偏倚(information bias):在收集整理信息过程中由于测量暴露与结局的方法有缺陷造成的系统误差,资料收集阶段 回忆性偏性调查偏倚 控制:采用客观指标、做好调查技术培训与质量控制,两组调查条件一致现在学习的是第70页,共77页71 3、混杂偏倚(confounding bias):研究某个因素与某种疾病的关联时,由于某个既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,年龄、性别最常见 控制 匹配:把混杂因素作为匹配因素 分层分析:按混杂因素进行分层 多因素分析现在学习的是第71页,共77页72一、优点l1、所需样本量小,省时、省钱、省人力,易于组织,出结果快;l2、可同时进行一病多因的研究;l3、特别适于病因复杂、潜伏期长的疾病及罕见病的病因研究;l4、可初步评价治疗措施的疗效与副作用第六节 病例对照研究优缺点 现在学习的是第72页,共77页73二、缺点l1、不能直接计算发病率、死亡率,不能直接计算RR,也不能证实因素与疾病因果关系。l2、易造成选择偏倚;l3、难以避免回忆偏倚;l4、混杂的影响较难控制。l5、结果的可靠性不如队列研究 现在学习的是第73页,共77页74进行病例对照研究时应注意的事项l(一)病例和对照的选择应应规定严格的定义、入选标准、除外标准。l(二)病例应尽量选用新诊断的病例。l(三)研究的关键是如何选择对照。在危险因素的暴露方面,对照是一般人群的代表。对照与病例应有同等的暴露机会。l(四)病例和对照的暴露资料来源和资料搜集方法应尽可能相似。l(五)匹配时,应注意勿匹配过头现在学习的是第74页,共77页75第七节 新的研究类型(了解)巢式病例对照研究(nested case control study):按队列研究的方式进行,收集每个队列成员的暴露信息及有关混杂因素,确定随访期内发生的病例作为病例组,对照来自同一队列,然后进行病例对照研究。病例-队列研究(case-cohort study):研究开始时在队列中随机选取一组样本作为对照,观察结束时,队列中出现被研究疾病的所有病例作为病例组 现在学习的是第75页,共77页76巢式病例对照研究的优点巢式病例对照研究的优点 统计效率高统计效率高 统计方法常用统计方法常用 收集资料简便收集资料简便现在学习的是第76页,共77页06.04.2023感感谢谢大大家家观观看看现在学习的是第77页,共77页