真实性与可靠性.pptx
第一第一节 研究的真研究的真实性性第二第二节 研究的可靠性研究的可靠性第1页/共95页第一第一节 研究的真研究的真实性性一、真一、真实性性二、偏倚二、偏倚 三、三、选择偏倚偏倚四、信息偏倚四、信息偏倚五、混五、混杂偏倚偏倚六、交互作用六、交互作用第2页/共95页第3页/共95页一、真一、真实性性真真实性性 一系列一系列观察或研究所作推察或研究所作推论的正确及可靠程度,即所得的正确及可靠程度,即所得结果反映了欲果反映了欲测试对象的真象的真实情况。情况。研究的真研究的真实性性 在充分考在充分考虑了各种影响了各种影响结论或推断的因素后,将研究或推断的因素后,将研究结果外推至果外推至样本以外人群本以外人群时的的真真实程度,包括内部真程度,包括内部真实性和外部真性和外部真实性。性。第4页/共95页内部真内部真实性性 internal validity 指一指一项能正确反映研究能正确反映研究人群及目人群及目标人群真人群真实状况的状况的研究研究结果的外延性。果的外延性。内部真内部真实性性强调研究研究结果是否无偏地反映了所研究果是否无偏地反映了所研究因素与疾病的真因素与疾病的真实联系。通系。通常受常受误差(随机差(随机误差和系差和系统误差)影响。差)影响。外部真实性 external validity从研究中得出的联系可否被外推至不同时间、不同地区的不同人群。第5页/共95页 二、偏倚二、偏倚 误差可分差可分为随机随机误差和系差和系统误差。差。以测量血压为例说明随机误差与系统误差之间的关系。第6页/共95页某技术熟练医师测量某人舒张压某技术熟练医师测量某人舒张压先由动脉内插管动脉内插管反复测量,各次读数的均值为80mmHg80mmHg。此法虽然准确但在实际应用中有困难。再用血压计血压计反复测量,各次测量结果均在套管法测量值的右侧,其均值为90mmHg90mmHg。由血压计测量个体血压所得的数值相对于套管法测量的误差,即为系统误差系统误差,这显然是由于检查器械和方法的不同所引起的。但是无论单用插管法测量还是单用血压计法依然有误差,这是随机误差随机误差,是由于机体血压本身就有瞬时变化和测量中的偶然因素所引起的,各自的变异结果均服从随机分布。第7页/共95页观察 系统误差次数 随机误差 80 90 舒张压(mmHg)图1 动脉内插管法和血压计法测量舒张压值的分布 动脉内插管法血压计法随机误差第8页/共95页第一第一节 研究的真研究的真实性性一、真一、真实性性二、偏倚二、偏倚 三、三、选择偏倚偏倚四、信息偏倚四、信息偏倚五、混五、混杂偏倚偏倚六、交互作用六、交互作用第9页/共95页二、偏倚二、偏倚(一)偏倚的定义 对所得观察资料的推理偏离真实值,或自样本人群所得暴露变量与结果变量的联系不能反映目标人群的暴露变量与结果变量间的真实联系即谓之偏倚。第10页/共95页 偏倚是一种系偏倚是一种系统误差,具有方向性。差,具有方向性。正正方向,使原来的真方向,使原来的真实值被被夸大夸大,负方向,使原来的真方向,使原来的真实值被被缩小小。(二)(二)偏倚的偏倚的方向方向偏向第11页/共95页A.B.C.第12页/共95页颠倒偏倚倒偏倚 switchover bias 当当 RR(RR(,或反之,即所或反之,即所产生的偏倚跨生的偏倚跨过零效零效应值,由保由保护效效应偏离偏离为危危险效效应,或由危,或由危险效效应偏离偏离为保保护效效应。颠倒偏倚使偏倚的倒偏倚使偏倚的结论走向原真走向原真实情况的反面,歪曲了真相。情况的反面,歪曲了真相。第13页/共95页(三)偏倚的种(三)偏倚的种类 临床研究从床研究从设计、实施、分析至推断施、分析至推断过程中程中均可均可发生偏倚。偏倚可存在于各种生偏倚。偏倚可存在于各种类型的研究中。型的研究中。偏倚偏倚发生的生的环节繁多,形式各异,大致可分繁多,形式各异,大致可分为以下以下三三类:1.1.选择偏倚偏倚:主要:主要发生在研究的生在研究的设计阶段段 如入院率偏倚、奈曼偏倚和如入院率偏倚、奈曼偏倚和检出征候偏倚等。出征候偏倚等。2.2.信息偏倚信息偏倚:主要:主要发生在研究的生在研究的实施施阶段段 如如报告偏倚、告偏倚、调查者偏倚和回者偏倚和回忆偏倚等。偏倚等。3.3.混混杂偏倚偏倚:主要:主要发生在研究的生在研究的设计和分析和分析阶段段第14页/共95页第一第一节 研究的真研究的真实性性一、真一、真实性性二、偏倚二、偏倚 三、三、选择偏倚偏倚四、信息偏倚四、信息偏倚五、混五、混杂偏倚偏倚六、交互作用六、交互作用第15页/共95页三、三、选择偏倚偏倚 selection bias (一)定(一)定义 医学研究医学研究过程中,从按一定的条件程中,从按一定的条件纳入的研究入的研究对象中象中获得的有关因素与疾病的得的有关因素与疾病的联系,不同于目系,不同于目标人群中人群中该因素与疾病之因素与疾病之间的真的真实联系,即系,即认为有有选择偏倚存在。偏倚存在。第16页/共95页(二)种(二)种类 1.1.检出征候偏倚出征候偏倚 detection signal bias 由于某因素的存在而引起某种疾病症候出由于某因素的存在而引起某种疾病症候出现,使患,使患者提早就者提早就诊,导致致该病的病的检出率增高,形成所研究因素出率增高,形成所研究因素与疾病有关的假象。与疾病有关的假象。口服雌激素口服雌激素子子宫内膜癌的关系内膜癌的关系 服雌激素者易服雌激素者易发生子生子宫出血而去医院就出血而去医院就诊从而被从而被发现子子宫内膜癌而被内膜癌而被选入病例入病例组,因而病例,因而病例组中中选择地地纳入大量口服雌激素的子入大量口服雌激素的子宫内膜癌患者。内膜癌患者。进一步分析可一步分析可见服用雌激素的病人中服用雌激素的病人中7979为早期子早期子宫内膜癌病人,未服内膜癌病人,未服用病例中早期病例用病例中早期病例为5555。第17页/共95页2.2.诊断偏倚断偏倚 diagnostic bias 当当临床医生床医生对暴露者与非暴露者采用不同的暴露者与非暴露者采用不同的诊断断或或报告告标准准时,例如,疾病没有,例如,疾病没有严格的格的统一一诊断断标准准时,临床医生可能根据所掌握的有关危床医生可能根据所掌握的有关危险因素与疾病因素与疾病发生的生的知知识诊断病人,从而使病例断病人,从而使病例对照研究中病例的暴露史在照研究中病例的暴露史在研究开始前就部分研究开始前就部分设定。由此造成的定。由此造成的诊断上的偏倚称断上的偏倚称为诊断偏倚。断偏倚。内用内用卫生棉条生棉条中毒性休克中毒性休克综合征合征 医生医生获得上述两者之得上述两者之间的关系后,会有意或无意地将的关系后,会有意或无意地将经期且使用内用期且使用内用卫生棉条有相关症状的生棉条有相关症状的妇女女诊断断为中毒中毒性休克性休克综合征;合征;对有同有同样症状而近期无使用症状而近期无使用卫生棉条史生棉条史的的妇女,女,较少少获得同得同样的的诊断。因而夸大了内用断。因而夸大了内用卫生棉生棉条与中毒性休克条与中毒性休克综合征合征间的关系。的关系。第18页/共95页3.3.入院率偏倚入院率偏倚 admission rate bias 伯克森偏倚伯克森偏倚 Berksons bias 指在以医院指在以医院为基基础的病例的病例对照研究中,由于所比照研究中,由于所比较各各组入院率不同而入院率不同而导致的偏致的偏倚。倚。第19页/共95页 表1 以社区为基础的病例对照研究中吸烟与疾病A的关系 吸烟 不吸烟 总人数 吸烟者的比例 病例(A)200 800 1000 20 对照(B)200 800 1000 20 OR=(200800)/(200800)=1设设:某人群中患某人群中患A A病和患病和患B B病者各为病者各为10001000人人,患患A A病和病和B B病的患者中各有病的患者中各有20%20%的人吸烟。的人吸烟。如表如表所示。所示。第20页/共95页1A病又吸烟的200人中,(1)因A病住院率为50,其住院人数为100人(20050%)(2)吸烟者入院率为40%,则余下的100人(200-100)中,40人(10040)住院,合计合计:A病又吸烟者住院人数140人(100+40)。2.病而不吸烟的800人中,因A病住院率为50%,住院人数为400人(80050%)。设设:患患A A病的入院率为病的入院率为50%50%,B B病的入院率为病的入院率为20%20%,吸,吸烟者入院率为烟者入院率为40%40%,这样实际住院人数应为:,这样实际住院人数应为:第21页/共95页3 3B B病又吸烟的病又吸烟的200200人中,人中,(1)(1)因因B B病住院率为病住院率为2020,其住院人数为,其住院人数为4040人(人(20020%20020%););(2)(2)吸烟者入院率为吸烟者入院率为40%40%,则余下的,则余下的160160人(人(200-40200-40)中,)中,6464人(人(1604016040)住院,)住院,合计合计:B:B病又吸烟者住院人数病又吸烟者住院人数104104人人(40+64)(40+64)。4 4B B病而不吸烟的病而不吸烟的800800人中,人中,因因B B病住院率为病住院率为20%20%,住院人数为,住院人数为160160人(人(80020%80020%)。)。表2 以医院为基础的病例对照研究中吸烟与疾病A的关系 疾病 吸烟者 不吸烟者 总人数 吸烟者的比例 病例(A)140 400 540 25.93 对照(B)104 160 264 39.39 OR=1第22页/共95页第23页/共95页5.5.现患病例患病例新新发病例偏倚病例偏倚 prevalence-incidence bias 奈曼偏倚,奈曼偏倚,Neyman bias 病例病例对照研究照研究 队列研究列研究 结论不一不一致致 往往只纳入现患病例或存活病例,即同时纳入新、旧病例.而不包括死亡病例和那些病程短的病例。新发病例病情、病型、病程和预后等都不尽相同,既往暴露状况也各有特点。现患病例:相当部分可能为“生物学上的强者”有时会主动更改对危险因素的暴露第24页/共95页第25页/共95页6.6.无无应答偏倚答偏倚 nonresponse bias现况况调查中由于中由于调查对象不合作或不参加象不合作或不参加调查,降低了研究的降低了研究的应答率,或在病例答率,或在病例对照研究和照研究和队列列研究中各比研究中各比较组应答率的不同,从答率的不同,从应答人群中得答人群中得出的有关研究因素与疾病的出的有关研究因素与疾病的联系不能反映两者系不能反映两者间的真的真实联系。系。无无应答偏倚不答偏倚不仅影响影响对象的代表性,当使用缺象的代表性,当使用缺损值处理理软件来件来处理无理无应答者和失答者和失访者者资料料时,产生的偏倚可同生的偏倚可同时涉及涉及选择偏倚和信息偏倚。偏倚和信息偏倚。第26页/共95页7.7.志愿者偏倚志愿者偏倚 volunteer bias 志愿参加志愿参加观察研究者同非志愿者在关心健康、察研究者同非志愿者在关心健康、注意注意饮食食卫生及生及营养食养食疗、禁烟禁酒、禁烟禁酒、坚持持锻炼等等方面有系方面有系统差异,因志愿者常被入差异,因志愿者常被入选为观察察对象,象,而非志愿者常落而非志愿者常落选,故,故这样的的观察或研究察或研究结果肯定果肯定存在存在选择偏倚,偏倚,这种偏倚称种偏倚称为志愿者偏倚。志愿者偏倚。例如,在例如,在体育体育锻炼预防冠心病防冠心病的的观察研究中,志愿参加者察研究中,志愿参加者作作为试验组,而将非志愿者作,而将非志愿者作为对照,以比照,以比较该项措施的效措施的效果。果。这当然是得不出正确当然是得不出正确结论的的。第27页/共95页8.8.失失访偏倚偏倚 loss to follow-up bias 由于失由于失访而引起的偏倚称而引起的偏倚称为失失访偏倚。偏倚。失失访也是一种特殊的无也是一种特殊的无应答形式,只是它主要答形式,只是它主要发生在前瞻生在前瞻性性队列研究及列研究及临床床试验中。中。失失访基本上有两种:基本上有两种:失失访 被被动失失访,一般同所,一般同所观察的暴露因素或察的暴露因素或结果果 无关,无关,统计学学处理理时将将这种失种失访当作截尾数据当作截尾数据 处理,若数量不大,不至于引起偏倚。理,若数量不大,不至于引起偏倚。退出退出主主动退出,一般同所研究的暴露因素或退出,一般同所研究的暴露因素或结果有关,果有关,统计处理理时也当作截尾数据也当作截尾数据处理。若数量理。若数量较大,大,且与研究中的有关且与研究中的有关变量量牵连,则将将产生偏倚。生偏倚。第28页/共95页 不能因为A组和B组失访人数相同而采纳,而应了解各组失访的可能原因及结局,从而纠正编倚。失访产生的偏倚可同时涉及选择偏倚和信息偏倚。第29页/共95页9.9.健康工人效健康工人效应 healthy worker bias 在在进行行职业流行病学研究流行病学研究时,当,当选择接触某种接触某种职业危危险因素的工人作因素的工人作为观察察对象象时,很可能,很可能这些些工人都是留下来不易患所研究疾病的人群,而工人都是留下来不易患所研究疾病的人群,而对该危危险因素敏感的那些工人可能早已因素敏感的那些工人可能早已转出而失出而失访,由此可能会由此可能会发现暴露于暴露于该因素者,某些疾病的死因素者,某些疾病的死亡率或亡率或发病率反而比一般人群低,病率反而比一般人群低,这种偏倚称种偏倚称为健康工人效健康工人效应。第30页/共95页 这并不能表明,木尘暴露可降低呼吸系统疾病的这并不能表明,木尘暴露可降低呼吸系统疾病的危险性。相反,这可能反映出健康工人效应。危险性。相反,这可能反映出健康工人效应。因为非暴露组人群中包括未从事家具制造业的人员或由于因为非暴露组人群中包括未从事家具制造业的人员或由于工种(劳动强度较大)的要求被排除在外的人员(身体条件较工种(劳动强度较大)的要求被排除在外的人员(身体条件较差或危险人群),因此所比较结果很可能是一种负偏倚。差或危险人群),因此所比较结果很可能是一种负偏倚。有人开展了一项历史性队列研究,来评价接触木尘对呼吸系统疾病死亡率的影响。家具制造厂的工人 暴露组全人群非暴露组(年龄、性别和种族等可比)呼吸系统疾病的死亡率第31页/共95页10.10.时间效效应偏倚偏倚 time effect bias 许多慢性病,自接触有效暴露之日起至出多慢性病,自接触有效暴露之日起至出现临床表床表现止,其止,其间经过一段漫一段漫长的潜的潜隐过程,在此期程,在此期间他他们实际上是有暴露史但未出上是有暴露史但未出现症状或未能用症状或未能用现有有检查手段手段发现疾病的病人,因此,常被疾病的病人,因此,常被归入健康入健康对照照组内。如此内。如此产生的偏倚称生的偏倚称为时间效效应偏偏倚。倚。第32页/共95页11.11.领先先时间偏倚偏倚 lead time bias 有些慢性病,比如有些慢性病,比如肿瘤,自瘤,自临床表床表现出出现并被并被诊断后,断后,经治治疗,它的平均存活期是,它的平均存活期是2 2年。若在健康人群中年。若在健康人群中进行行筛检这类疾病,使疾病,使这类病人在其症状出病人在其症状出现前前3 3个月被个月被检出,出,并被并被诊断和治断和治疗,平均存活期,平均存活期约2 2年年3 3个月,于是个月,于是认为,筛检能使能使该病延病延长生存期平均生存期平均约3 3个月。个月。这实际上上为领先先时间偏倚。因偏倚。因为延延长的的 3 3个月是我个月是我们提早提早发现病人的病人的时间,即即领先先时间,实际上病人的生存期自出上病人的生存期自出现临床表床表现算起并算起并未延未延长。筛检症状出现诊断时间存活时间2年3个月2年3个月第33页/共95页(三三)选择偏倚的控制偏倚的控制 1.1.研究研究设计阶段段 (1)(1)建立健全的健康建立健全的健康监测系系统 控制控制选择偏倚的关偏倚的关键在于在于获取有代表性的研究取有代表性的研究样本,而只有建立健全的健康本,而只有建立健全的健康监测系系统(health health information systeminformation system,HISHIS),掌握全人群有关),掌握全人群有关暴露和疾病的信息,才能最大限度地暴露和疾病的信息,才能最大限度地获取人群中取人群中有代表性的有代表性的样本。本。第34页/共95页(2 2)采用)采用严格科学的研究格科学的研究设计 在研究在研究设计过程中程中应明确定明确定义目目标人群和研究人群,根人群和研究人群,根据研究的性据研究的性质预测样本建立本建立过程中可能程中可能产生的各种生的各种选择性性偏倚,并采取相偏倚,并采取相应的措施以减少或控制的措施以减少或控制选择性偏倚的性偏倚的发生。生。若若选择性偏倚可能与潜在的混性偏倚可能与潜在的混杂因素有因素有联系,系,则可通可通过对研究研究对象加以限制或精确地象加以限制或精确地测量量该因素,以便在分析因素,以便在分析过程程中加以控制。中加以控制。临床床试验:随机分随机分组 病例病例对照研究照研究:病例病例类型型 两种以上的两种以上的对照照队列研究列研究:多个比多个比较组第35页/共95页所有所有纳入研究的入研究的对象都必象都必须符合事先符合事先设立的立的纳入入标准,包括疾病准,包括疾病诊断断标准和暴露判准和暴露判别标准。准。应尽可能尽可能选取合格的新取合格的新发病例,病例,避免来自存活者的偏倚。避免来自存活者的偏倚。(3)(3)明确明确对象象纳入入标准、准、统一疾病一疾病诊断和断和监测程序程序第36页/共95页2.2.资料收集料收集阶段段(1 1)加)加强随随访,提高,提高应答率答率在在队列研究和干列研究和干预试验的的实施施过程中程中应动态地掌握整个地掌握整个队列的列的变迁,定期随迁,定期随访、记录队列中有关暴露与疾病的列中有关暴露与疾病的变化,做好研究的宣化,做好研究的宣传和解和解释工作,减少中途退出和失工作,减少中途退出和失访。现况况调查中中应尽量减少无尽量减少无应答的答的发生。可通生。可通过各种途径各种途径增加增加对象象对研究意研究意义的了解,减少研究的了解,减少研究结对象象带来的不来的不便。便。当无当无应答率大于答率大于1010时,应以无以无应答者的随机答者的随机样本来比本来比较其与其与应答者有关敏感信息的可比性,从而估答者有关敏感信息的可比性,从而估计无无应答答偏倚偏倚对研究研究结果的影响程度。果的影响程度。第37页/共95页(2 2)尽可能收集有关暴露史的)尽可能收集有关暴露史的详细信息信息 暴露程度、暴露程度、时间、暴露改、暴露改变以及原因以及原因 (3 3)确保疾病的)确保疾病的诊断不是依据暴露史而得出断不是依据暴露史而得出 3.3.数据分析数据分析阶段段 基基线特征比特征比较:应答者答者-无无应答者答者 完成随完成随访者者-中途退中途退出者出者 估估计伯克森偏倚:不同伯克森偏倚:不同对象入院率象入院率 第38页/共95页第一第一节 研究的真研究的真实性性一、真一、真实性性二、偏倚二、偏倚 三、三、选择偏倚偏倚四、信息偏倚四、信息偏倚五、混五、混杂偏倚偏倚六、交互作用六、交互作用第39页/共95页 四、四、信息偏倚信息偏倚 information bias (一)定一)定义 指研究指研究实施施过程中,由于所收集的有关暴露或疾程中,由于所收集的有关暴露或疾病的信息不准确或不完整,造成病的信息不准确或不完整,造成对研究研究对象或象或结果的果的归类错误。信息偏倚可来自。信息偏倚可来自对各种医各种医疗和和监测记录的摘的摘录过程,也可来自程,也可来自调查表表询问和疾病和疾病报告告过程。程。又称 观察偏倚 observation bias 错分偏倚 misclassification bias第40页/共95页(二)信息偏倚的种(二)信息偏倚的种类 1.1.错分偏倚分偏倚 (1 1)回)回忆偏倚偏倚 recall bias所所调查的因素的因素发生于生于过去,由于去,由于调查者者记忆失真或不完整造失真或不完整造成成结论的系的系统误差差。多多见于病例于病例对照研究和回照研究和回顾性性队列研究。列研究。既往既往经历对病例和非病例的意病例和非病例的意义往往不同,病例往往不同,病例组对既往暴既往暴露露情况的情况的记忆深度和深度和详细程度通常程度通常较对照照组为甚,由此造成了甚,由此造成了回回忆偏倚在各比偏倚在各比较组中分布不同。中分布不同。如果如果对象因种种原因如高象因种种原因如高龄、年幼、重病或死亡不能直、年幼、重病或死亡不能直接接应答而由其配偶、父母、子女或其他答而由其配偶、父母、子女或其他亲属代理属代理时,所,所获得的得的准准确性确性还受到被受到被询问代理者的代理者的记忆和和对对象的了解程度的影响,象的了解程度的影响,由此由此导致的偏倚又称致的偏倚又称代理者偏倚代理者偏倚(surrogate biassurrogate bias)。)。第41页/共95页 欲研究类风湿关节炎的家族史,发现类风湿关节炎的病人比对照更有可能提供阳性家族史。然而,再从病例家庭中未患该病的同胞兄弟姐妹中调查发现,阳性家族史和对照组相比,这种联系就不存在了。第42页/共95页(2 2)报告偏倚告偏倚 reporting bias 研究研究对象象对某些信息的故意夸大或某些信息的故意夸大或缩小。小。当暴露因素涉及到生活方式或当暴露因素涉及到生活方式或隐私如私如饮酒、酒、收入水平、婚姻生育史和性行收入水平、婚姻生育史和性行为时,被研究,被研究对象象会因种种原因而会因种种原因而隐瞒或或编造有关信息,有造有关信息,有时代理代理者也会者也会为了病人或死者的声誉而故意了病人或死者的声誉而故意隐瞒某些不某些不良暴露史,从而影响了所提供信息的准确性,良暴露史,从而影响了所提供信息的准确性,导致致报告偏倚告偏倚发生。生。报告偏倚的影响因其在各比告偏倚的影响因其在各比较组的的发生程生程度而异,其作用同度而异,其作用同样是双向的。是双向的。第43页/共95页(3 3)调查者偏倚者偏倚 interviewer bias 调查者在收集、者在收集、记录和解和解释来自研究来自研究对象象的信息的信息时发生的偏倚称生的偏倚称为调查者偏倚。者偏倚。由于研究者渴望建立并由于研究者渴望建立并验证某些因素的作用,往某些因素的作用,往往会尽其所能地去主往会尽其所能地去主动发现和和诱导对象提供所需要的信象提供所需要的信息,最息,最终影响了各比影响了各比较组中中对暴露或疾病状况的暴露或疾病状况的认定。定。病例病例对照研究照研究 暴露因素暴露因素 队列研究和干列研究和干预试验 诊断和断和发现疾病疾病第44页/共95页 (4 4)测量偏倚量偏倚 measurement bias 由于研究中所使用的由于研究中所使用的仪器、器、设备、试剂、方、方法和条件的不精良、不法和条件的不精良、不标准、不准、不统一,或研究指一,或研究指标设定不合理、数据定不合理、数据记录不完整不完整,造成研究造成研究结果果系系统地偏离其真地偏离其真值的的现象。象。可可发生在各种流行病学研究的生在各种流行病学研究的设计、实施和施和资料料处理理过程中。程中。例如,同一例如,同一调查过程的不同程的不同调查点使用的点使用的仪器型号,或使用年限不同,或精确度差异器型号,或使用年限不同,或精确度差异较大;大;各各调查点点对同一研究指同一研究指标采用不同的采用不同的实验室室检测方法,或尽管使用同一方法,或尽管使用同一检测方法,但其方法,但其检测试剂的供的供货商、品牌或批号不同等。商、品牌或批号不同等。第45页/共95页(二)信息偏倚的种(二)信息偏倚的种类2.2.均数回均数回归趋势3.3.生生态学偏倚学偏倚 生生态学学谬误是研究方法本身的局限性所是研究方法本身的局限性所致致第46页/共95页(三)(三)测量量 信息偏倚的主要表信息偏倚的主要表现形式形式为错误分分类,无,无论是暴是暴露状露状态、疾病、疾病结果果还是混是混杂因素都可因素都可发生生错分。分。1.1.错分分测量的灵敏度和特异度量的灵敏度和特异度 对于于错分,不管是病例分,不管是病例对照研究照研究还是是队列研究,都可根据列研究,都可根据错分的灵敏度和特异度来分的灵敏度和特异度来估估计其其对危危险度的影响,此度的影响,此处以病例以病例对照研究照研究为例来加以例来加以阐述。述。第47页/共95页P.181 第48页/共95页以病例对照研究中的对照组为例,令:真正暴露X=1,反之X=0;被分类为暴露X*=l,反之X*=0。由此得到下面四个概率:第49页/共95页 在有已知或估计的Se和Sp的情况下,可计算调整的OR。设:a、b、c、d为调整前的四格表内相应 值,A、B、C、D为调整后四格表内相应值(表69)第50页/共95页 (1)(1)非特异性非特异性错分分 non-differential misclassification 又称又称 无差异无差异错分分 或或 均衡性均衡性错分分 各比各比较组发生的生的错分程度相同,分程度相同,SeSe和和SpSp分分别相同,相同,产生的生的错分偏倚分偏倚总是是趋向无效假向无效假设(RR=1.0)(RR=1.0)。(2)(2)特异性特异性错分分 differential misclassification 又称又称 差异差异错分分 或或 非均衡性非均衡性错分分 各比各比较组发生生错分的程度不同,分的程度不同,SeSe和和SpSp各不相同,各不相同,产生的生的错分偏倚可以高估或低估因素与疾病分偏倚可以高估或低估因素与疾病间的的联系系强度,其度,其对研究研究结果的影响因果的影响因错分种分种类和程度而异。和程度而异。2.2.错分的分的类型型第51页/共95页3.3.错分的灵敏度分析分的灵敏度分析 错分尽管可以根据分尽管可以根据SeSe和和SpSp来来调整,但通常在研整,但通常在研究中并不清楚所究中并不清楚所发生的生的错分程度。分程度。当有不同程度当有不同程度的的错分存在的情况下,有分存在的情况下,有时可以用不同的可以用不同的SeSe和和SpSp来估来估计研究所研究所获得的得的OROR或或RRRR的影响程度,称之的影响程度,称之为灵敏度分析。灵敏度分析。灵敏度分析本身并不能估灵敏度分析本身并不能估计暴露或疾病暴露或疾病结果的真果的真实情况,在情况,在错分分发生程度不明生程度不明时,利用灵敏度分,利用灵敏度分析可以了解不同程度析可以了解不同程度错分分时所研究疾病与因素之所研究疾病与因素之间联系(系(OROR或或RRRR)的)的变动程度,以及程度,以及SeSe和和SpSp各自各自对相相应研究的影响程度。研究的影响程度。第52页/共95页如:某研究发现树脂类暴露与肺癌死亡的 OROR),可对OROR灵敏度进行分析(表6-106-10):在均衡性错分下,暴露是二分量,偏倚总是朝向无效假设(即校正的OR估计值总是比直接从资料中估计的OR更远离无效假设)。回忆偏倚作为一种错分,并不总是导致高估比值比。此例暴露率低,对于所得到的OR,特异度与灵敏度相比是更强有力的决定因素。错分所致结果的不确定性可能大于可信限传递的不确定性。(P.183-184)第53页/共95页(四四)控制控制 信息偏倚主要来自信息偏倚主要来自资料收集和解料收集和解释过程中的不正程中的不正确信息,而确信息,而产生生这些不正确信息的原因可以是研些不正确信息的原因可以是研究究对象本身的象本身的记忆误差,也可以由研究者的差,也可以由研究者的态度度或方法不当所致,更重要的是在研究或方法不当所致,更重要的是在研究设计过程中程中对调查表表设计、指、指标设立和立和检测方法的方法的选择缺乏缺乏科学性和合理性。因此,控制信息偏倚就是要在科学性和合理性。因此,控制信息偏倚就是要在研究的不同研究的不同阶段控制和消除影响信息准确性的各段控制和消除影响信息准确性的各种因素。种因素。第54页/共95页1.1.研究研究设计阶段段暴露因素暴露因素 有有严格、客格、客观的定的定义,并力求指,并力求指标定量化。定量化。疾病疾病诊断断标准准 统一、明确一、明确调查表表项目目 应易于理解和回答易于理解和回答获取研究取研究对象配合和支持象配合和支持 知情知情 同意同意质量控制程序量控制程序 严格培格培训调查员;定期;定期检查资料的料的质量量第55页/共95页2.2.资料收集料收集阶段段在研究中可在研究中可对同一内容以不同的形式重复同一内容以不同的形式重复询问,以帮助,以帮助对象回象回忆并并检验其其应答的可信性。答的可信性。可在可在询问中使用中使用实物等定量物等定量,以便于以便于对象理解并准确地定量。象理解并准确地定量。为了避免主了避免主观诱导对象,象,应严格培格培训调查员,尽可能,尽可能“盲盲法法”研究中的各种研究中的各种测量量仪器、器、试剂和方法都和方法都应标准化。准化。3.3.资料分析料分析阶段段对错误分类的结果,可进一步在资料分析过程中加以测量、校正,必要时可进行相应的灵敏度分析。第56页/共95页第一第一节 研究的真研究的真实性性一、真一、真实性性二、偏倚二、偏倚 三、三、选择偏倚偏倚四、信息偏倚四、信息偏倚五、混五、混杂偏倚偏倚六、交互作用六、交互作用第57页/共95页五、五、混混杂偏倚偏倚 confounding bias (一)定(一)定义 在流行病学研究中,由于一个或多个外来在流行病学研究中,由于一个或多个外来因素(又称第三因子)的存在,掩盖或夸大了研因素(又称第三因子)的存在,掩盖或夸大了研究因素与疾病(或事件)的究因素与疾病(或事件)的联系,从而部分或全系,从而部分或全部地歪曲了两者之部地歪曲了两者之间的真的真实联系,称系,称为混混杂偏倚偏倚或混或混杂。引起混。引起混杂的因素称的因素称为混混杂因子因子(confounderconfounder)。)。混混杂可在可在队列研究中列研究中发生,也可在病例生,也可在病例对照研究中照研究中发生。生。第58页/共95页(二)形成混(二)形成混杂的条件的条件 假假设:暴露因素:暴露因素 E E 研究的疾病研究的疾病D D 如果如果 混混杂因子因子F F 则应满足如下条件:足如下条件:F F必必须与与D D的的发生有关,是生有关,是该疾病的危疾病的危险因素之一;因素之一;F F 必必须与与E E有有统计学学联系;系;F F 必必须不是不是E E与与D D病因病因链上的中上的中间环节或中或中间步步骤。满足足这些基本条件的些基本条件的F F如果在所比如果在所比较的各的各组间分分布不均,就可布不均,就可导致混致混杂偏倚的偏倚的发生。生。第59页/共95页 在研究体育锻炼心肌梗死的关系时,年龄可能影响两者之间的真实联系。非锻炼组锻炼组 年轻者比例较高 年长者比例较高心肌梗死危险性高估体育锻炼对心肌梗死保护作用年龄因素产生混杂作用心肌梗死发生率第60页/共95页 在研究体育锻炼心肌梗死的关系时,每日水摄入量不可能影响两者之间的真实联系。非锻炼组锻炼组每日水摄入量每日水摄人量并非心肌梗死的一个危险因子每日水摄入量因素不产生混杂作用心肌梗死发生率每日水摄入量心肌梗死危险性第61页/共95页 在研究体育锻炼心肌梗死的关系时,体质指数不影响两者之间的真实联系。非锻炼组锻炼组体质指数锻炼 体质指数 心肌梗死危险心肌梗死发生率体质指数不成为混杂因子中间环节第62页/共95页(三)混(三)混杂的判断和的判断和测量量 1.1.判定混判定混杂的依据的依据 (1)(1)(2)(2)或未控制混杂因素前RR(OR)与控制混杂因素后RR(OR)不等即可疑的混杂因素应在无暴露因素存在的条件下,同疾病间有联系。或第63页/共95页或(4)可疑混杂因子F不应是暴露变量同结果变量之间,或因果联系路径之间的一个中间变量。(3)可疑混杂因子在暴露组及非暴露组中的分布比例不等;或:混杂因素应在无病例存在的条件下(对照组中),同所研究的暴露因素间OR1。第64页/共95页上述内容用箭头图总结如下:(1)-(3)混杂偏倚的几种情况;其中(3)表示F是F的伴随因子,(4)-(8)无混杂偏倚存在,(4)和(5)为混杂条件不满足;(6)和(7)为因果链;(8)为复合病因。第65页/共95页2.2.混混杂分析分析举例例 在一次非配在一次非配对的病例的病例对照研究中,照研究中,暴露因素暴露因素为X X,疾病,疾病为D D,潜在混潜在混杂因素因素为年年龄,研究研究结果如表果如表6-116-11所示。所示。第66页/共95页 代表一般人群的代表一般人群的对照照组中,中,4040岁以下年以下年龄组的暴的暴露比例露比例远低于低于4040岁以上者。以上者。第67页/共95页 用用 Mantel-HaenszelMantel-Haenszel计算的算的 aORaOR为 l.0l.0。从上述分析可从上述分析可见,X X与与 D D的的调整前整前cORcOR,但按年,但按年龄分分层后,后,ORicORORicOR,OROR4040和和OROR4040相等,且相等,且 aORcORaORcOR,此,此时可可认为年年龄作作为一个混一个混杂因素,夸大了因素,夸大了X X与与D D间的真的真实联系。系。第68页/共95页 cRR(cOR)分层后的RRi(ORi)或cRR(cOR)aRR(aOR),混杂 效应修饰 effect modification cRRaRR分层 RR相等以混杂为主 cRRaRR 分层RRi不等以效应修饰为主理论上,当样本足够大时,分析的目的混杂作为一种偏倚,是为了从所得的联系中校正或去除其作用 效应修饰是两种或多种因素共同存在时产生的相互作用,是研究者所要研究、估计和报告的一种真实的存在第69页/共95页3.3.正混正混杂和和负混混杂正混正混杂 由于混由于混杂的存在,使暴露的存在,使暴露-疾病之疾病之间的的cRRcRR被夸大,其被夸大,其值远离离1 1。负混混杂 由于混由于混杂的存在,使暴露的存在,使暴露-疾病之疾病之间的真的真实存在的存在的联系被掩盖了,系被掩盖了,cRRcRR被被缩小,小,接近于接近于1 1。第70页/共95页混杂性质的判定归纳如下表(表6-16)P.190第71页/共95页(四四)混混杂偏倚的控制偏倚的控制 1.1.在研究在研究设计和和资料收集料收集阶段段限制限制 restriction 病例病例组和和对照照组或暴露或暴露组和非暴露和非暴露组的的条件加以限条件加以限制。制。如年如年龄、性、性别、病型、并、病型、并发症。症。匹配匹配 matching 成成组匹配或个体匹配匹配或个体匹配随机化分随机化分组 randomization 临床床试验中中第72页/共95页2.2.在在资料分析料分析阶段段分分层分析分析 straitification 按病情或年按病情或年龄、性、性别等分等分层。标准化准化 standardization多因素分析多因素分析:如多元回如多元回归分析、分析、logisticlogistic回回归分析、分析、CoxCox回回归分析分析灵敏度分析灵敏度分析 对于不确定性,无法于不确定性,无法测量的混量的混杂第73页/共95页术前危险因素:年龄、心功能、冠脉阻塞程度等对术前危险因素的不同进行分层分析,则两医院各层的病死率相同。第74页/共95页 标准化后,乙医院和甲医院的病死率相等(准化后,乙医院和甲医院的病死率相等(4.00%)4.00%),说明两所医院的手明两所医院的手术病死率之差异是由于两所医院病人病死率之差异是由于两所医院病人术前高危因素者所占的比例不同而引起的偏倚所致。甲医院前高危因素者所占的比例不同而引起的偏倚所致。甲医院病人中,病人中,4242属高危因素者,而乙医院只有属高危因素者,而乙医院只有1717的病人属的病人属高危高危险因素者。因素者。第75页/共95页2.2.在在资料分析料分析阶段段分分层分析分析 straitification 按病情或年按病情或年龄、性、性别等分等分层。标准化准化 standardization多因素分析多因素分析:如多元回如多元回归分析、分析、logisticlogistic回回归分析、分析、CoxCox回回归分析分析灵敏度分析灵敏度分析 对于不确定性,无法于不确定性,无法测量的混量的混