中山病例对照研究课件.ppt
一起食物中毒暴一起食物中毒暴发调查病例发病周前曾于餐馆就餐病例发病周前曾于餐馆就餐 排除厨师和服务员是传染源(发病时间)排除厨师和服务员是传染源(发病时间)什么食物被污染?什么食物被污染?调查:所有病例发病前在餐馆食用食物调查:所有病例发病前在餐馆食用食物 食用频率最高的食物?(现况研究)食用频率最高的食物?(现况研究)1募集同募集同时期餐期餐馆进餐但未餐但未发病者病者 对照照组 与病例与病例组比比较:食用食物的差异:食用食物的差异 沙拉:沙拉:病例病例 .对照照 辣菜:病例辣菜:病例.对照照青洋葱青洋葱2检验假设检验假设 验证假设验证假设 研研究究方方法法观察察法法实验法法数数理理法法描述流行病学描述流行病学 分析流行病学分析流行病学 横断面横断面调查监测生生态学研究学研究病例病例对照研究照研究队列研究列研究实验流行病学实验流行病学 临床床试验现场试验社区干社区干预项目目理论流行病学理论流行病学 产生假设产生假设 3病例对照研究病例对照研究 刘丽刘丽流行病与卫生统计学系流行病与卫生统计学系4第一节第一节 基本原理基本原理.基本概念:基本概念:病例对照研究:选择患有某病和未患有某特定疾病病例对照研究:选择患有某病和未患有某特定疾病的人群,分别作为病例组和对照组,调查并比较两的人群,分别作为病例组和对照组,调查并比较两组研究对象既往某些因素的暴露情况,判断该暴露组研究对象既往某些因素的暴露情况,判断该暴露因素是否与该病有关联及关联程度大小的一种观察因素是否与该病有关联及关联程度大小的一种观察性研究方法。性研究方法。从疾病出发,去探讨可能的病因从疾病出发,去探讨可能的病因 回顾性研究回顾性研究 ()6l暴露暴露()l 指研究对象接触过某种待研究的物质(如重金指研究对象接触过某种待研究的物质(如重金属、线)、具备某种待研究的特征(如年龄、属、线)、具备某种待研究的特征(如年龄、性别及基因突变等)或行为(如吸烟)。性别及基因突变等)或行为(如吸烟)。l暴露因素暴露因素 可以是有害的,也可以是有益的,也可以是有害的,也可以是有益的,也叫研究因素。叫研究因素。77l危险因素(危险因素()l引起某特定不良结局发生或引起某特定不良结局发生或使其概率增加的因素。使其概率增加的因素。l保护因素(保护因素()l导致疾病事件降低的暴露因导致疾病事件降低的暴露因素称为保护因素素称为保护因素 决定因素研决定因素研究因素究因素暴露即是具有该研究因素暴露即是具有该研究因素8时间时间病例组病例组对照组对照组研究开始研究开始暴露暴露暴露暴露非暴露非暴露非暴露非暴露调查方向调查方向图图 病例对照研究示意图(病例对照研究示意图(Greenberg,2002)()()人数人数比较比较源源人人群群对比的思维(求异法)、概率统计的思维对比的思维(求异法)、概率统计的思维人群基线或期人群基线或期望暴露水平望暴露水平.基本原理基本原理9以确诊患某种特定疾病的病人作为病例组以确诊患某种特定疾病的病人作为病例组以不患该病但具有可比性的个体作为对照组以不患该病但具有可比性的个体作为对照组搜集既往危险因素保护因素的暴露史搜集既往危险因素保护因素的暴露史测量并比较两组各因素的暴露比例,经统计学测量并比较两组各因素的暴露比例,经统计学检验该因素与疾病之间是否存在统计学关联;检验该因素与疾病之间是否存在统计学关联;利用病因推断技术,对统计学关联进行分析。利用病因推断技术,对统计学关联进行分析。.基本原理基本原理10.病例病例对对照研究特点照研究特点 l观察法观察法l按照是否患病分组,设立对照按照是否患病分组,设立对照(分析性方法分析性方法)l测量的是暴露情况,而非疾病情况测量的是暴露情况,而非疾病情况l回顾性,由果回顾性,由果 因研究因研究l一般不能验证病因一般不能验证病因11.病例对照研究的应用病例对照研究的应用l广泛探索疾病的可疑危险因素广泛探索疾病的可疑危险因素l检验病因假说检验病因假说l防治措施效果的评价防治措施效果的评价l药物不良反应的研究药物不良反应的研究l疾病预后因素的研究疾病预后因素的研究12第二节第二节 研究类型研究类型l病例与对照不匹配病例与对照不匹配l病例与对照匹配病例与对照匹配13.病例与对照不匹配病例与对照不匹配 从规定病例源人群中,分别抽取一定量的患病从规定病例源人群中,分别抽取一定量的患病与非患病的研究对象分别作为病例组和对照组与非患病的研究对象分别作为病例组和对照组 对照组人数对照组人数病例组人数病例组人数 对照组应能代表产生病例的源人群对照组应能代表产生病例的源人群 此外没有其他限制与规定。此外没有其他限制与规定。14 进进行吸烟与肺癌关系研究,若因某种原因,行吸烟与肺癌关系研究,若因某种原因,肺癌肺癌组组以女性患者以女性患者较较多,而多,而对对照照组组以男性占多数,以男性占多数,结结果果显显示吸烟与肺癌无关。原因?示吸烟与肺癌无关。原因?15研究对象的选择有问题,即女性患者吸烟比例较研究对象的选择有问题,即女性患者吸烟比例较低,而男性较高。性别分布在两组不均衡,产生混低,而男性较高。性别分布在两组不均衡,产生混杂作用。杂作用。研究吸烟与肺癌关系时,肺癌组和对照组在性别研究吸烟与肺癌关系时,肺癌组和对照组在性别保持一致,依此比较吸烟与肺癌关系,可消除性别保持一致,依此比较吸烟与肺癌关系,可消除性别对结果影响。对结果影响。?如何使病例组和对照组的性别分布保持一致?如何使病例组和对照组的性别分布保持一致?采用匹配,可控制混杂偏倚对结果的影响。采用匹配,可控制混杂偏倚对结果的影响。16.病例与对照匹配病例与对照匹配 l 匹配配比匹配配比()()l要求对照在某些因素或特征上与病例保持一致要求对照在某些因素或特征上与病例保持一致l对两组进行比较时排除匹配因素的干扰对两组进行比较时排除匹配因素的干扰l 分类分类l频数匹配频数匹配 l个体匹配个体匹配 17频数匹配(又称成组匹配)频数匹配(又称成组匹配)匹匹配配因因素素所所占占比比例例在在对对照照组组与与病病例例组组一一致致的的整整体体匹配。匹配。个体匹配个体匹配 以病例和对照个体为单位进行匹配。以病例和对照个体为单位进行匹配。匹配,又称配对;匹配,又称配对;,匹配。匹配。匹配因素的一致程度:匹配因素的一致程度:离散变量,完全匹配;离散变量,完全匹配;连连续续变变量量,在在一一定定范范畴畴内内匹匹配配(分分组组或或分分类)类)18l 匹配法注意事项匹配法注意事项 l避免匹配过度()避免匹配过度()l慎慎重重选选择择匹匹配配因因素素(已已知知混混杂杂因因素素或或有有理理由由怀怀疑为混杂因素!)疑为混杂因素!)l 匹配的目的匹配的目的l 提高研究效率提高研究效率 l 控制混杂因素的作用控制混杂因素的作用 19匹配过度()匹配过度()把不必要的项目进行匹配,企图使病例和对照把不必要的项目进行匹配,企图使病例和对照尽量一致,可能导致信息丢失,增加工作难度,尽量一致,可能导致信息丢失,增加工作难度,反而降低研究效率。反而降低研究效率。不应进行匹配的情况(非混杂因素)不应进行匹配的情况(非混杂因素)疾病因果链上的中间变量;疾病因果链上的中间变量;只与暴露因素有关,与疾病无关的因素;只与暴露因素有关,与疾病无关的因素;可能是疾病的某一危险因素。可能是疾病的某一危险因素。慎重选择匹配因素(已知混杂因素或有理由怀疑慎重选择匹配因素(已知混杂因素或有理由怀疑为混杂因素!)为混杂因素!)20第三节第三节 研究设计与实施研究设计与实施1.1.确定研究目的及研究假设确定研究目的及研究假设2.2.确定研究类型确定研究类型3.3.研究对象的选择研究对象的选择4.4.样本量估计样本量估计5.5.研究因素的选定与测量研究因素的选定与测量6.6.资料收集资料收集7.7.资料整理和分析资料整理和分析8.8.偏倚的识别与控制偏倚的识别与控制21.确定研究目的(拟解决的科学问确定研究目的(拟解决的科学问题是什么?)题是什么?)研究假设(科学问题)研究假设(科学问题):根据以往疾病分布的记录或现况根据以往疾病分布的记录或现况调查得到的结果,结合文献资料,调查得到的结果,结合文献资料,提出研究假设。提出研究假设。研究目的:研究目的:广泛探索疾病的可疑危险因素广泛探索疾病的可疑危险因素深入检验病因假说深入检验病因假说药物不良反应的研究药物不良反应的研究疾病预后因素的研究疾病预后因素的研究防治措施效果的评价防治措施效果的评价22.明确适宜的研究类型明确适宜的研究类型 形式形式:非匹配、频数匹配、个体匹配非匹配、频数匹配、个体匹配原则:原则:广泛探索病因,采用不匹配或频数匹配广泛探索病因,采用不匹配或频数匹配罕见病采用个体匹配罕见病采用个体匹配防止匹配过度防止匹配过度 23.明确研究对象(病例与对照的来源与选择)明确研究对象(病例与对照的来源与选择)基本原则:基本原则:代表性代表性:病例能代表总体的病例病例能代表总体的病例;对照能代表产生病例的总体人群或源人群对照能代表产生病例的总体人群或源人群 可比性(合理的比较往往更重要)可比性(合理的比较往往更重要)来源:来源:以医院为基础以医院为基础 以社区为基础以社区为基础 24()病例的选择()病例的选择判断病人的标准如何获得符合标准的病人?判断病人的标准如何获得符合标准的病人?选择病例的要求:选择病例的要求:诊断可靠诊断可靠 使用金标准使用金标准 对病例的患病部位、病理学分型等明确限对病例的患病部位、病理学分型等明确限制。制。同是胃癌病人,病理学分类有未分化同是胃癌病人,病理学分类有未分化弥漫性腺癌和分化肠型腺癌,病因有差异。弥漫性腺癌和分化肠型腺癌,病因有差异。对病例的外部特征(年龄、性别、种族、职对病例的外部特征(年龄、性别、种族、职业等)明确规定,控制非研究因素,增强业等)明确规定,控制非研究因素,增强比较组的可比性。比较组的可比性。25l病病例例类类型型:新新发发病病例例、现现患患病病例例、死死亡亡病病例例l首选新发病例首选新发病例 回忆偏倚小回忆偏倚小代表性好代表性好容易合作容易合作 被调查因素改变少被调查因素改变少26l病例来源:病例来源:l l 医院住院或门诊的病例医院住院或门诊的病例代表性好代表性好工作开展比较困难工作开展比较困难耗费人力物力耗费人力物力社区的病例社区的病例(最优)(最优)比较合作比较合作 资料易得到且比较可靠资料易得到且比较可靠与对照的可比性好与对照的可比性好代表性差代表性差27()对照的选择(整个研究的关键之一)()对照的选择(整个研究的关键之一)原原 则则未患此病的人(可以是其它疾病);未患此病的人(可以是其它疾病);如如研研究究吸吸烟烟与与肺肺癌癌关关系系,能能否否以以慢慢性性支支气气管管炎炎病人作为对照?病人作为对照?不能患有与所研究疾病有共同病因的疾病。不能患有与所研究疾病有共同病因的疾病。足以代表产生病例的总体(代表性);足以代表产生病例的总体(代表性);除研究因素外其它条件与病例组一致(可比性);除研究因素外其它条件与病例组一致(可比性);必须具有暴露于研究因素的可能性;必须具有暴露于研究因素的可能性;对照是否匹配以及匹配类型设置。对照是否匹配以及匹配类型设置。28l对照来源对照来源l 社社区区来来源源的的健健康康人人或或非非该该病病人人(最最接接近近全人群的无偏样本)全人群的无偏样本)l 医院来源的其他病例(使用最多)医院来源的其他病例(使用最多)l医院为基础的对照选择注意事项:医院为基础的对照选择注意事项:l对照所患疾病与病例的病因无关对照所患疾病与病例的病因无关l选择多个病种的病人组成选择多个病种的病人组成l不选择当前患有多种疾病的病人不选择当前患有多种疾病的病人l从新发病人中选取对照从新发病人中选取对照29病例对照研究病例对照研究社区为基础医院为基础社区为基础医院为基础以社区为基础的病例对照研以社区为基础的病例对照研究究以医院为基础的病例对照研以医院为基础的病例对照研究究可以较好的确定源人群可以较好的确定源人群研究对象的可及性好研究对象的可及性好容易保证病例和对照来自同容易保证病例和对照来自同一源人群一源人群研究对象更易合作研究对象更易合作对照的暴露史更可能反映病对照的暴露史更可能反映病例源人群的暴露情况例源人群的暴露情况比较容易从医疗记录和生物比较容易从医疗记录和生物标本收集暴露信息标本收集暴露信息尽可能设立多种对照尽可能设立多种对照设立两种或两种以上的对照,可以增设立两种或两种以上的对照,可以增强结果的可信度。如果多种对照均获得一致性结果,则结果的强结果的可信度。如果多种对照均获得一致性结果,则结果的说服力便大大增强。说服力便大大增强。30l影响样本大小的因素影响样本大小的因素(发现比较组的暴露率差异)发现比较组的暴露率差异)l人群中被研究因素的暴露率(对照组中的暴露率)人群中被研究因素的暴露率(对照组中的暴露率)l暴暴露露与与疾疾病病关关联联强强度度指指标标或或的的估估计计值值(查查阅阅文文献献或预调查获得)或预调查获得)病例组的暴露率病例组的暴露率l值(值(,研究结果的可信程度),研究结果的可信程度)l值(值(,研究把握度),研究把握度)l根据以上有关参数查表或代入公式计算根据以上有关参数查表或代入公式计算.样本含量的估计样本含量的估计31样本量估计方法样本量估计方法查表法查表法公式法:公式法:不匹配(病例组与对照组人数相等)不匹配(病例组与对照组人数相等)病例组暴露率病例组暴露率对照组暴露率对照组暴露率()例例:为为研研究究某某市市肺肺癌癌与与吸吸烟烟的的关关系系,欲欲进进行行一一次次病病例例对对照研究。照研究。某市普通人群中吸烟率某市普通人群中吸烟率 把握度把握度 问需要多少病例与对照问需要多少病例与对照?33、值查表,值查表,为,为,为为代入公式得:代入公式得:病例组与对照组,各需人。病例组与对照组,各需人。病例组与对照组例数不等时的公式:病例组与对照组例数不等时的公式:病例数病例数:对照数对照数对照组例数为对照组例数为*35匹配设计匹配设计总对子数总对子数 和分别代表目标人群中对照组与病例组和分别代表目标人群中对照组与病例组 的估的估计暴露率计暴露率 为暴露状况不一致的对子数为暴露状况不一致的对子数36.研究因素的选定与测量研究因素的选定与测量 根据研究目的或具体的目标,确定调查变根据研究目的或具体的目标,确定调查变量和每一个变量的具体项目。量和每一个变量的具体项目。每项变量都要有明确的定义。每项变量都要有明确的定义。研究中应尽可能地采用定量或半定量的量研究中应尽可能地采用定量或半定量的量度。度。吸烟与肺癌的关系的研究吸烟与肺癌的关系的研究吸烟的定义:一生中连续或累积吸烟个月或以上者吸烟的定义:一生中连续或累积吸烟个月或以上者吸烟与否;吸烟与否;开始吸烟的年龄、吸烟的年限、每天吸烟量、是否戒烟、开始吸烟的年龄、吸烟的年限、每天吸烟量、是否戒烟、戒烟的时间;是否被动吸烟(被动吸烟的定义);戒烟的时间;是否被动吸烟(被动吸烟的定义);三手烟?三手烟?37.资料来源与收集资料来源与收集 资料来源:资料来源:医院病案记录医院病案记录疾病登记报告等摘录疾病登记报告等摘录检测病人的标本或环境获得检测病人的标本或环境获得询问调查获得询问调查获得38资料收集的方法资料收集的方法()询询问问:包包括括面面询询、函函询询、电电话话询询问问、计计算算机机辅辅助助询问、自填问卷。询问、自填问卷。()查查阅阅记记录录:包包括括出出生生、疾疾病病死死亡亡、健健康康体体检检记记录录等。等。()测测量量:包包括括测测量量各各种种指指标标,如如机机体体、环环境境的的测测量量,区区域域、个个体体采采样样器器监监测测、生生物物监监测测,血血清清学学、组组织织学分析等。学分析等。39第四节第四节 资料的整理与分析资料的整理与分析.资料整理资料整理.描述统计描述统计.统计推断统计推断不匹配资料的分析不匹配资料的分析配对资料的分析配对资料的分析混杂因素作用的估计与分层分析混杂因素作用的估计与分层分析l比较病例与对照中研究因素暴露比较病例与对照中研究因素暴露的比例,估计研究因素与疾病发生的比例,估计研究因素与疾病发生的危险度。的危险度。l控制潜在混杂作用,对研究因素控制潜在混杂作用,对研究因素与疾病的关系做出正确的估计。与疾病的关系做出正确的估计。40.资料整理资料整理核查原始资料(查漏补缺纠错)核查原始资料(查漏补缺纠错)原始资料的分组、归纳、或编码输入计算机原始资料的分组、归纳、或编码输入计算机 双人平行录双人平行录入入41.描述统计:描述统计:研究对象的一般特征描述:研究对象的一般特征描述:病例组和对照组样本量,人口学特征构成,病例组和对照组样本量,人口学特征构成,目的是分析研究对象的代表性。目的是分析研究对象的代表性。均衡性检验均衡性检验 比较病例组和对照组某些基本特征是否相比较病例组和对照组某些基本特征是否相似或齐同,检验病例组和对照组的可比性。似或齐同,检验病例组和对照组的可比性。如有统计学差异的因素,应分析其是否对如有统计学差异的因素,应分析其是否对其他因素产生影响(多因素模型,分层分其他因素产生影响(多因素模型,分层分析等)。析等)。42()将资料整理成表格形式;()将资料整理成表格形式;()病例组和对照组暴露比例差异的统计学检验:()病例组和对照组暴露比例差异的统计学检验:即回答和是否有联系?即回答和是否有联系?()估计暴露因素疾病之间的联系强度;()估计暴露因素疾病之间的联系强度;()评价剂量()评价剂量反应关系(等级暴露资料);反应关系(等级暴露资料);()结果解释。可能存在哪些偏倚?得出什么结论()结果解释。可能存在哪些偏倚?得出什么结论?.推断统计推断统计(按不同的研究类型分析按不同的研究类型分析)43()资料整理成四格表()资料整理成四格表()统计学检验()统计学检验(检验)检验)检验研究因素与疾病之间有否统计学联系?检验研究因素与疾病之间有否统计学联系?l非匹配或频数匹配病例对照资料的分析非匹配或频数匹配病例对照资料的分析44 ,说说明疾病的危明疾病的危险险度因暴露而增加;度因暴露而增加;,说说明疾病的危明疾病的危险险度因暴露而减少。度因暴露而减少。的前提条件的前提条件所研究疾病的所研究疾病的发发病率(死亡率)很低病率(死亡率)很低病例病例对对照研究中所照研究中所选择选择的研究的研究对对象代表性好,象代表性好,则值则值就很接近甚至等于就很接近甚至等于值值47l的置信区间的置信区间(,)估计(为什么?)估计(为什么?)l)自然对数转换法:以自然对数转换法:以 方差为基础方差为基础l()l l ()l)卡方值法卡方值法l置信区间不包括,即可认为该在的水平上有统计学置信区间不包括,即可认为该在的水平上有统计学意义。意义。48 结结果果表表明明吸吸烟烟者者患患食食管管癌癌的的危危险险性性是是不不吸吸烟烟者者的的倍,的置信范围是在之间。倍,的置信范围是在之间。()研究因素与疾病的关联强度评价研究因素与疾病的关联强度评价l匹配资料是由病例与对照结合成对子,分析时不应把对匹配资料是由病例与对照结合成对子,分析时不应把对子拆开分析。子拆开分析。l l 、分别代表病例和对照不同暴露情况的对子、分别代表病例和对照不同暴露情况的对子数数l配对资料的分析配对资料的分析()50()()51()(),表明男性吸烟者患食管癌的危险性是不吸烟者的倍 :吸烟与食管癌无统计学关联:吸烟与食管癌有统计学关联l分级暴露资料分析分级暴露资料分析分析暴露与疾病的剂量反应关系分析暴露与疾病的剂量反应关系根据暴露因素的分级将资料归纳成列联表根据暴露因素的分级将资料归纳成列联表对列联表数据进行卡方检验对列联表数据进行卡方检验以最低暴露水平为参照,计算出各暴露水平的以最低暴露水平为参照,计算出各暴露水平的卡方趋势检验卡方趋势检验暴露分级暴露分级合计合计病例病例对照对照男性每日吸烟的支数与肺癌关系男性每日吸烟的支数与肺癌关系卡方卡方检验():):,说明吸烟量按吸烟水平分明吸烟量按吸烟水平分级后,后,组间差差别有有统计学学意意义。各暴露分各暴露分级的:的:以不吸烟以不吸烟为参参照。,照。,随随吸烟吸烟剂量的增加而量的增加而递增。增。卡方卡方趋势检验:,剂量反量反应趋势具有具有统计学学意意义,说明吸烟明吸烟与与男性肺癌之男性肺癌之间存在存在剂量反量反应关关系。系。54l 病例对照研究中偏倚的种类病例对照研究中偏倚的种类l 偏倚的控制偏倚的控制第五节第五节 常见偏倚及其控制常见偏倚及其控制55.选择偏倚(选择偏倚()选选入入的的研研究究对对象象与与未未选选入入的的研研究究对对象象在在某某些些特特征征上上存存在在差差异异而而引引起起的的误误差差(选选择择的的研研究究对对象象不不能能代代表表总总体人群)。体人群)。最常见偏倚最常见偏倚 入院率偏倚入院率偏倚现患病例新发病例偏倚现患病例新发病例偏倚检出症候偏倚检出症候偏倚l病例对照研究中常见偏倚的种类病例对照研究中常见偏倚的种类无应答偏倚无应答偏倚时间效应偏倚时间效应偏倚56入院率偏倚(入院率偏倚()常见于医院基础的病例对照研究。常见于医院基础的病例对照研究。当利用医院的病例当利用医院的病例(门诊或住院病例门诊或住院病例)作为研究对象作为研究对象时,由于疾病在不同医院入院率的不同而导致的偏时,由于疾病在不同医院入院率的不同而导致的偏倚,称入院率偏倚。倚,称入院率偏倚。不同医院技术专长、患者所患疾病的严重程度、不同医院技术专长、患者所患疾病的严重程度、经济状况等不同,患者对医院具有选择性,医院对经济状况等不同,患者对医院具有选择性,医院对患者亦具有选择性。暴露和疾病影响研究对象的选患者亦具有选择性。暴露和疾病影响研究对象的选择导致倾向性入院率差异。择导致倾向性入院率差异。本质:病例或对照的不能够代表总体。本质:病例或对照的不能够代表总体。控制:多家医院的病例来源;多个对照组。控制:多家医院的病例来源;多个对照组。57检出症候偏倚检出症候偏倚()、暴露偏倚、暴露偏倚f年研究妇女服用复方雌激素子宫内膜癌年研究妇女服用复方雌激素子宫内膜癌f妇女服用复方雌激素导致阴道出血,就医后检出子宫内妇女服用复方雌激素导致阴道出血,就医后检出子宫内膜癌。用这种病例研究时,得出:雌激素与子宫内膜癌有膜癌。用这种病例研究时,得出:雌激素与子宫内膜癌有关。关。f实际情况是,病例即使不服用雌激素,若接受检查,也实际情况是,病例即使不服用雌激素,若接受检查,也可能被检出子宫内膜癌。可能被检出子宫内膜癌。f服用复方雌激素加快其被检出的可能性。服用复方雌激素加快其被检出的可能性。58 作者就此作者就此进进行深入行深入调查调查,结结果果发现发现服用复方雌服用复方雌激素的病例中有激素的病例中有为为第一期病例,而未服用复方雌第一期病例,而未服用复方雌激素病例中,只有激素病例中,只有为为第一期病例;病例第一期病例;病例组组由非同由非同质质人群人群组组成。成。本本质质:病例的代表性:病例的代表性问题问题 控制:延长收集病例的时间,使其超过由早期向控制:延长收集病例的时间,使其超过由早期向中晚期过渡的时间,则检出病例中的暴露者比例中晚期过渡的时间,则检出病例中的暴露者比例接近一般病例。接近一般病例。59 现患病例新发病例偏倚现患病例新发病例偏倚()()、d由由于于现患患病病例例和和新新病病例例在在某某些些特特征征或或行行为上上的的差差异异,造造成成研研究究结果的偏倚。果的偏倚。d以以现患患病病例例为对象象,收收集集到到的的信信息息可可能能只只与与存存活活有有关关,而而与与研研究究的的暴暴露露因因素素无无关关;幸幸存存者者可可能能改改变以以往往的的生生活活习惯,即即降低或增加某研究因素的暴露水平。降低或增加某研究因素的暴露水平。d调查者得到疾病与暴露之者得到疾病与暴露之间的虚假的虚假联系。系。d控控制制:尽尽量量选择新新病病例例;增增加加新新老老病病例例比比较分分析析;对暴暴露露强度度时间与与结局局进行分析行分析60无应答偏倚无应答偏倚()无应答是流行病学研究中常见问题。研究者应尽可能对无应答是流行病学研究中常见问题。研究者应尽可能对确定的研究对象一个不漏地予以调查,无应答可造成偏倚。确定的研究对象一个不漏地予以调查,无应答可造成偏倚。如儿童意外伤害的病例对照研究。如儿童意外伤害的病例对照研究。控制:尽量取得调查对象的合作。控制:尽量取得调查对象的合作。61时间效应偏倚时间效应偏倚 慢性病由于潜慢性病由于潜隐隐期期长长,当病例与,当病例与对对照判断照判断标标准准不明确,或划分界限有缺陷,不明确,或划分界限有缺陷,则则具有早期症状者可具有早期症状者可能被能被选选入入对对照照组组,或把一些,或把一些轻轻型、非典型病人型、非典型病人误误划划入入对对照照组组,则则会引会引发发此种偏倚,掩盖暴露与疾病的此种偏倚,掩盖暴露与疾病的真正关真正关联联。控制:采用准确可靠、控制:采用准确可靠、标标准化的准化的诊诊断断标标准并准并严严格遵守,或延格遵守,或延长观长观察期,可以抵消此察期,可以抵消此类类偏倚。偏倚。62回回忆偏倚偏倚:回回忆既往暴露情况既往暴露情况时准确性和系准确性和系统性存在的系性存在的系统误差差;与与调查时间和和发病病时间间隔、被隔、被调查者构成及者构成及询问技技术等有关。等有关。控制:控制:选择不易忘不易忘记的重要指的重要指标做做调查,并重,并重视问卷卷调查技技术,有助于减少回,有助于减少回忆偏倚。偏倚。值得注意的是,即使得注意的是,即使应用相同用相同调查方法,两方法,两组回回忆误差差可能不一致,病例可能不一致,病例组可能可能记忆清楚,但也可能夸大暴露信清楚,但也可能夸大暴露信息;息;对照照组则相反。相反。.信息偏倚信息偏倚63调查偏倚调查偏倚(疑诊偏倚疑诊偏倚)调查环境不同或调查质量不高可造成偏倚。如两组收集调查环境不同或调查质量不高可造成偏倚。如两组收集数据的方法(询问重点和方式)不同;调查时间、地点有差数据的方法(询问重点和方式)不同;调查时间、地点有差别。调查员对项目理解及掌握标准不一致、态度不认真等,别。调查员对项目理解及掌握标准不一致、态度不认真等,均可造成偏倚。均可造成偏倚。控制:尽量采用客观指标,做好质量控制:优化调查表、控制:尽量采用客观指标,做好质量控制:优化调查表、统一标准、培训调查员、核查调查结果,采用盲法等。统一标准、培训调查员、核查调查结果,采用盲法等。64 在评价暴露因素与疾病之间的关联时,由于一在评价暴露因素与疾病之间的关联时,由于一个或多个既与暴露因素有关,同时与研究疾病有关个或多个既与暴露因素有关,同时与研究疾病有关的外来因素存在,使得暴露因素的效应和外来因素的外来因素存在,使得暴露因素的效应和外来因素的效应混在一起,从而歪曲了暴露因素与疾病的关的效应混在一起,从而歪曲了暴露因素与疾病的关联性。此外来因素即为混杂因素。这种歪曲联系真联性。此外来因素即为混杂因素。这种歪曲联系真实性的偏倚称为混杂偏倚。实性的偏倚称为混杂偏倚。.混杂偏倚混杂偏倚65混杂因素的基本特征(判断混杂因素的基本条件):混杂因素的基本特征(判断混杂因素的基本条件):()混杂因素与研究疾病有关()混杂因素与研究疾病有关()混杂因素与研究因素有关()混杂因素与研究因素有关()混杂因素不是研究因素与疾病因果链上的中间环节。()混杂因素不是研究因素与疾病因果链上的中间环节。混杂因素导致混杂偏倚的条件:混杂因素在各组分布不均。混杂因素导致混杂偏倚的条件:混杂因素在各组分布不均。混杂偏倚类型:混杂偏倚类型:正混杂偏倚:夸大暴露与疾病的关联正混杂偏倚:夸大暴露与疾病的关联负混杂偏倚:减弱暴露与疾病的关联负混杂偏倚:减弱暴露与疾病的关联66流行病学研究中,发现统计学意义上的联系,在流行病学研究中,发现统计学意义上的联系,在进行病因学推论前,必须首先排除潜在混杂因素进行病因学推论前,必须首先排除潜在混杂因素的作用,估计和调整混杂偏倚的影响。的作用,估计和调整混杂偏倚的影响。混杂偏倚的识别混杂偏倚的识别根据专业知识提出可能的混杂因素:人口统计学根据专业知识提出可能的混杂因素:人口统计学指标;研究因素以外的其他危险因素;指标;研究因素以外的其他危险因素;利用分层分析进行判断。利用分层分析进行判断。67混杂因素作用的控制混杂因素作用的控制配比法配比法(设计阶段设计阶段)限制(设计阶段)限制(设计阶段)随机化分组(实验流行病学)随机化分组(实验流行病学)分层分析分层分析 (资料分析阶段)(资料分析阶段)多因素分析(资料分析阶段)多因素分析(资料分析阶段)标准化分析(资料分析阶段)标准化分析(资料分析阶段)统统计计调调整整68非个体匹配分层资料非个体匹配分层资料分层分析是按照某种特征(如年龄、性别等)把研究人群分分层分析是按照某种特征(如年龄、性别等)把研究人群分为不同的层次,然后分别分析各层中暴露与疾病的关联。为不同的层次,然后分别分析各层中暴露与疾病的关联。评价分层因素本身作用及其与暴露之间关系评价分层因素本身作用及其与暴露之间关系评价分层因素与暴露因素在疾病中的交互作用评价分层因素与暴露因素在疾病中的交互作用识别混杂因素,控制混杂,同时提高检验效率。识别混杂因素,控制混杂,同时提高检验效率。帮助正确设计多因素模型帮助正确设计多因素模型 研究吸烟与食管癌的关系,考虑饮酒为混杂因素,如何研究吸烟与食管癌的关系,考虑饮酒为混杂因素,如何进一步分析?进一步分析?吸烟吸烟 食管癌食管癌 饮酒饮酒69分层分析识别和控制混杂偏倚的步骤:分层分析识别和控制混杂偏倚的步骤:()按可能的混杂因素分层,每层整理一个四格表,计算每()按可能的混杂因素分层,每层整理一个四格表,计算每层的卡方和值;层的卡方和值;()判断分层因素是否为混杂因素(三个基本条件)()判断分层因素是否为混杂因素(三个基本条件)()如果两层值接近(同质,混杂作用),计算合并卡方值,()如果两层值接近(同质,混杂作用),计算合并卡方值,合并值()及合并值()及;如果两层不同质如果两层不同质(交互作用),不能合并,分别交互作用),不能合并,分别报告;报告;70l按饮酒与否分层按饮酒与否分层 计算值计算值饮酒者中吸烟的饮酒者中吸烟的()()稍高于不分层稍高于不分层()()不饮酒者中吸烟的不饮酒者中吸烟的()()却低得很多却低得很多吸烟与食管癌的关系列表计算吸烟与食管癌的关系列表计算 齐性检验。齐性检验。71l 进行齐性检验进行齐性检验 (层别效应的一致性假设与检验)(层别效应的一致性假设与检验)l 齐性检验齐性检验 合并合并与值与值l值无明显差别,则饮酒产生混杂作用值无明显差别,则饮酒产生混杂作用 合并合并值值l值有显著差异,则饮酒与吸烟存在交互值有显著差异,则饮酒与吸烟存在交互 合合并值并值l本例齐性检验无显著差异(本例齐性检验无显著差异(),计算合并与),计算合并与72l 计算合并与计算合并与值值 l 公式(法):公式(法):l 73经饮酒分层调整后,吸烟的经饮酒分层调整后,吸烟的与(即合并与(即合并与合并)虽较未调与合并)虽较未调整的整的()与与()为低,但仍有一定强度与统计学上的显著性。为低,但仍有一定强度与统计学上的显著性。吸烟与食管癌之间有显著的关联。吸烟与食管癌之间有显著的关联。饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟的作用饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟的作用表表 分层计算结果整理表分层计算结果整理表 74偏偏 倚倚控制措施控制措施.选择偏倚选择偏倚选入者与未选入者某些特征上选入者与未选入者某些特征上存在差异引起(入院率偏倚、现患新发病例偏存在差异引起(入院率偏倚、现患新发病例偏倚、检出征候偏倚、时间效应偏倚)倚、检出征候偏倚、时间效应偏倚)尽量合理地选择病例与对照尽量合理地选择病例与对照.信息偏倚信息偏倚收集信息时由于测量及获得数收集信息时由于测量及获得数据的方法不正确而造成(回忆偏倚、调查偏倚)据的方法不正确而造成(回忆偏倚、调查偏倚)多人或多次询问并比较结果,采多人或多次询问并比较结果,采用盲法用盲法.混杂偏倚混杂偏倚某因素既与疾病有关系又与研某因素既与疾病有关系又与研究因素有联系,其掩盖或夸大了暴露与疾病的究因素有联系,其掩盖或夸大了暴露与疾病的联系联系匹配、限制、随机化、分层分析、匹配、限制、随机化、分层分析、多因素分析、标准化分析多因素分析、标准化分析小结:偏倚及其控制小结:偏倚及其控制 75第六节第六节 研究实例研究实例 研究背景研究背景 研究方法研究方法 研究结果研究结果76研究背景研究背景美国波士顿纪念医院妇产科医生发现美国波士顿纪念医院妇产科医生发现 年收治例阴道腺癌患者年收治例阴道腺癌患者例在岁之间例在岁之间例均为腺癌例均为腺癌阴道腺癌应为中老年女性的疾病阴道腺癌应为中老年女性的疾病 阴道癌占女性生殖系统癌的阴道癌占女性生殖系统癌的 阴道腺癌仅占阴道癌的,非常罕见阴道腺癌仅占阴道癌的,非常罕见77 对阴道腺癌危险因素进行探索对阴道腺癌危险因素进行探索 例患者加上另一个医院例患者作为病例组例患者加上另一个医院例患者作为病例组 每个病人配个对照,共个对照每个病人配个对照,共个对照 调查员用调查表对病例和对照的母亲进行了调查员用调查表对病例和对照的母亲进行了 调查,经统计学处理后的主要结果见表调查,经统计学处理后的主要结果见表研究方法研究方法78研究结果研究结果79研究结果研究结果在比较的因素中,只有三个因素有显著差别在比较的因素中,只有三个因素有显著差别母亲怀孕期间使用过己烯雌酚激素治疗母亲怀孕期间使用过己烯雌酚激素治疗()()母亲以前流产史母亲以前流产史()()此次怀孕阴道出血史此次怀孕阴道出血史()()因有后两个因素存在才使用己烯雌酚治疗因有后两个因素存在才使用己烯雌酚治疗做做出出结结论论:母母亲亲在在妊妊娠娠早早期期服服用用己己烯烯雌雌酚酚使使她她们们在在子子宫宫中中的的女儿以后发生阴道腺癌的危险性增加女儿以后发生阴道腺癌的危险性增加 80第七节第七节 优点与局限性及优点与局限性及实施时应注意的问题实施时应注意的问题81.病例对照研究的优点特别适用于少见病、罕见病的研究省力、省钱、省时间,并易于组织实施还可用于疫苗免疫学效果考核及暴发调查等可同时研究多个因素与某种疾病的联系82.病例对照研究的局限性病例对照研究的局限性不适于研究暴露比例很低的因素不适于研究暴露比例很低的因素选择偏倚难以避免选择偏倚难以避免存在回忆偏倚存在回忆偏倚暴露与疾病时间先后难以判断,不能证实因果暴露与疾病时间先后难以判断,不能证实因果关系关系不能计算发病率或死亡率,一般只能计算间接不能计算发病率或死亡率,一般只能计算间接估计关联强度估计关联强度83.实施病例对照研究应注意的问题实施病例对照研究应注意的问题l 假设目的是否清楚?假设目的是否清楚?l 疾病与暴露变量的定义明确?疾病与暴露变量的定义明确?l 病例与对照的来源,诊断方法?病例与对照的来源,诊断方法?l 新发病例还是现患病例?新发病例还是现患病例?l 排除标准是否明确?排除标准是否明确?84l 抽样的方法与样本大小的估计是否恰当?抽样的方法与样本大小的估计是否恰当?l 调查表是否经过试用?调查表是否经过试用?l 调查表的真实性与可靠性是否经过评估?调查表的真实性与可靠性是否经过评估?l 资料整理、统计方法及分析内容是否明确资料整理、统计方法及分析内容是否明确?l 如何控制或调整偏倚?如何控制或调整偏倚?l 结论的真实性如何?结论的真实性如何?8586