《(精品)第五章 病例对照研究1.ppt》由会员分享,可在线阅读,更多相关《(精品)第五章 病例对照研究1.ppt(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 病例对照研究病例对照研究(case-control studycase-control study)1.基本原理基本原理2.研究类型研究类型3.实例实例4.实施实施5.资料整理与分析资料整理与分析6.偏倚及其控制偏倚及其控制7.应考虑的问题应考虑的问题8.优缺点优缺点病例对照研究设计应用史病例对照研究设计应用史n1843年年Guy:职业暴露与肺结核的关系(最早的:职业暴露与肺结核的关系(最早的病例对照研究)病例对照研究)n1884年年Louis:著作(最早的概念提出):著作(最早的概念提出)n1926年年Claypon:生殖因素与乳腺癌关系(最早的生殖因素与乳腺癌关系(最早的符合
2、现代病例对照概念的研究)符合现代病例对照概念的研究)n二战后应用广泛二战后应用广泛n60年代以来方法逐步完善年代以来方法逐步完善第一节第一节 基本原理基本原理 过去 现在 比较 人数 暴露 a/(a+c)a c b/(b+d)b d病病例例对对照照+-+n病例对照研究(病例对照研究(case control study):):以一组患有以一组患有某病者(病例)和一组或几组未患该病但在某些已知某病者(病例)和一组或几组未患该病但在某些已知因素方面与病例组相似者(对照)为研究对象,调查因素方面与病例组相似者(对照)为研究对象,调查他们过去是否暴露于某个或某些可疑致病因素或暴露他们过去是否暴露于某个
3、或某些可疑致病因素或暴露剂量,比较两组暴露比值,推断研究因子作为病因的剂量,比较两组暴露比值,推断研究因子作为病因的可能性。可能性。n暴露(暴露(exposure):指):指研究对象接触某些因素,或具研究对象接触某些因素,或具备某些特征,或处于某种状态。备某些特征,或处于某种状态。n暴露因素(暴露因素(exposure factor):可以是机体固有的、可以是机体固有的、先天的,也可以是体外的、后天的,暴露因素也叫研先天的,也可以是体外的、后天的,暴露因素也叫研究变量(究变量(variable)。)。n混杂与混杂因素(混杂与混杂因素(confounding and confounding co
4、nfounding and confounding factor)factor):研究某因素与某疾病关联时,由于某个既与研究某因素与某疾病关联时,由于某个既与疾病有制约关系,又与所研究的因素有联系的外来因疾病有制约关系,又与所研究的因素有联系的外来因素的影响,掩盖或扩大了所研究的因素与疾病的联系,素的影响,掩盖或扩大了所研究的因素与疾病的联系,这种现象或影响叫这种现象或影响叫混杂混杂,其所带来的偏倚叫,其所带来的偏倚叫混杂偏倚混杂偏倚,该外来因素该外来因素叫混杂因素叫混杂因素。第二节 研究类型一、不匹配:对照数目与病例相等或略多一、不匹配:对照数目与病例相等或略多二、匹配(二、匹配(match
5、ing):):要求对照在某些因素上与病例保持一致。要求对照在某些因素上与病例保持一致。如年龄匹配如年龄匹配 1、频数匹配(频数匹配(frequency matching):):匹配因素所占比例在病例匹配因素所占比例在病例组和对照组一致。如病例组男女各半,平均年龄组和对照组一致。如病例组男女各半,平均年龄56岁。对照组亦应如岁。对照组亦应如此(无显著性差异)。此(无显著性差异)。2、个体匹配(、个体匹配(individual matching):):病例和对照以个体为单位进病例和对照以个体为单位进行匹配。行匹配。目的:提高研究效率(目的:提高研究效率(study efficiency)匹配因素:
6、已知或疑为混杂因子(匹配因素:已知或疑为混杂因子(confounding factor)常见匹配:常见匹配:1:1(配对);(配对);1:2;1:R 匹配过度匹配过度(over matching):):匹配增加了对照选择的匹配增加了对照选择的难度,把不必要项目列入匹配,丢失了信息,降低了难度,把不必要项目列入匹配,丢失了信息,降低了研究效率。研究效率。匹配程度:连续变量可划分为若干组,按组匹配;离散匹配程度:连续变量可划分为若干组,按组匹配;离散变量可完全匹配。变量可完全匹配。(1)研究因素和中间变量:)研究因素和中间变量:吸烟吸烟血脂血脂血脂血脂心血管病心血管病 (2)只与可疑因素有关而与疾
7、病无关的因素)只与可疑因素有关而与疾病无关的因素 避孕药避孕药子宫内膜癌子宫内膜癌 宗教宗教宗教宗教 三、衍生类型三、衍生类型1、巢式病例对照研究(套迭式;嵌入式)、巢式病例对照研究(套迭式;嵌入式)(nested case-control study):):通过队列通过队列研究,确认随访时发生的病例,作为病例组,以研究,确认随访时发生的病例,作为病例组,以同一队列的未发病者为对照。同一队列的未发病者为对照。优点优点:(:(1)暴露资料在发病或死亡前获得,)暴露资料在发病或死亡前获得,时间顺序清楚,无回忆偏倚。时间顺序清楚,无回忆偏倚。(2)两组可比性好)两组可比性好 (3)可提高统计及检验效
8、率)可提高统计及检验效率 暴露率高;共同暴露开始时间暴露率高;共同暴露开始时间 缺点:只能比较暴露的等级缺点:只能比较暴露的等级 例:例:Kent(1988):):血胆固醇与癌症血胆固醇与癌症 类型类型:(1)前瞻性)前瞻性(prospective nested case-control study):研究开始时据一定条件选择某一人群研究开始时据一定条件选择某一人群作为队列,前瞻性地随访一定时间确定病例组作为队列,前瞻性地随访一定时间确定病例组和对照组。和对照组。(2 2)回顾性()回顾性(retrospective nested case-retrospective nested case-
9、control study):control study):据研究之前一段特定时间的据研究之前一段特定时间的情况选择某一人群作为队列,据现在的情况确情况选择某一人群作为队列,据现在的情况确定病例组和对照组。定病例组和对照组。2、病例队列研究(、病例队列研究(case-cohort study)(病例病例参比式研究,参比式研究,case-base reference study):队列研究开始时,在队列中按一定比例随机抽队列研究开始时,在队列中按一定比例随机抽取一个一定量的有代表性的样本作为对照组,取一个一定量的有代表性的样本作为对照组,观察结束时,队列中出现的全部所研究的病例观察结束时,队列中
10、出现的全部所研究的病例为病例组,与上述对照组比较。为病例组,与上述对照组比较。特点:特点:1)对照是随机选取的,不与病例进行匹配)对照是随机选取的,不与病例进行匹配 2)事先抽中的对照组成员如发生所研究的疾病,既)事先抽中的对照组成员如发生所研究的疾病,既可作为病例组,也可作为对照组可作为病例组,也可作为对照组 3)可以研究几种疾病,但对照组是同一样本)可以研究几种疾病,但对照组是同一样本3、病例交叉研究(、病例交叉研究(case-crossover design):比较相同研究对象在急性事件发生前一段时间比较相同研究对象在急性事件发生前一段时间的暴露情况与未发生事件的某段时间内的暴露的暴露情
11、况与未发生事件的某段时间内的暴露情况,如果暴露与少见事件(疾病)有关,则情况,如果暴露与少见事件(疾病)有关,则在事件发生前的这一段时间内的暴露频率应该在事件发生前的这一段时间内的暴露频率应该高于更早时间内的暴露频率。高于更早时间内的暴露频率。4、单纯病例研究(、单纯病例研究(case only study);(病例系列研究);(病例系列研究case series study);();(病例病例研究病例病例研究 case-only studies):):仅用仅用病例作为研究对象来评估所研究的环境因素与易感基因型的相互作病例作为研究对象来评估所研究的环境因素与易感基因型的相互作用。其设计原理是以
12、是否暴露与环境致病因素和易感基因型为标准用。其设计原理是以是否暴露与环境致病因素和易感基因型为标准将资料整理成将资料整理成2222表表 计算公式为:ORca=(A11A00)/(A10A01)无对照病例研究资料整理表 *1:暴露 0:非暴露 A:病例例数第三节第三节 研究实例研究实例Herbst关于年轻女性阴道腺癌的研究关于年轻女性阴道腺癌的研究n美国波士顿美国波士顿Vincent记念医院,记念医院,1966-69年发现年发现7例年轻女性阴道腺例年轻女性阴道腺癌癌n该病为罕见病:占女性生殖系统癌症该病为罕见病:占女性生殖系统癌症0.1%-0.2%,50岁以上多见岁以上多见n怀疑因素:使用阴道局
13、部刺激物、阴道冲洗、阴道塞史;性交史;怀疑因素:使用阴道局部刺激物、阴道冲洗、阴道塞史;性交史;避孕药应用史,均无意义。避孕药应用史,均无意义。n重新研究目的:用病例对照研究比较病例从胚胎期至发病前的情况。重新研究目的:用病例对照研究比较病例从胚胎期至发病前的情况。n研究对象:研究对象:7例加例加1例另一医院的阴道透明细胞癌患者。例另一医院的阴道透明细胞癌患者。n1:4配对:要求对照与病例在同等级病房中出生,时间前后配对:要求对照与病例在同等级病房中出生,时间前后 10天天n使用统一调查表,培训调查员使用统一调查表,培训调查员n结果:此次怀孕流血、以往流产史及此次怀孕使用雌激素史三个因结果:此
14、次怀孕流血、以往流产史及此次怀孕使用雌激素史三个因素有显著意义。素有显著意义。n结论:母亲怀孕早期服用保胎药已烯雌酚使其女儿发生阴道腺癌的结论:母亲怀孕早期服用保胎药已烯雌酚使其女儿发生阴道腺癌的危险性增加。危险性增加。第四节第四节 病例对照研究的实施病例对照研究的实施(一)提出假设:可发现或检验病因线索(一)提出假设:可发现或检验病因线索(二)明确目的,确定对照形式:(二)明确目的,确定对照形式:不匹配或频数匹配:探讨病因线索不匹配或频数匹配:探讨病因线索 个体匹配:提高统计效率,适于罕见疾病个体匹配:提高统计效率,适于罕见疾病 对照数目:按对照数目:按Pitman效率递增公式:效率递增公式
15、:效率效率=2R/(R+1)1:1时,效率时,效率=21/(1+1)=1 1:2时,效率时,效率=22/(2+1)=1.3 1:3时,效率时,效率=1.5 1:4时,效率时,效率=1.6 1:4以上,效率增加缓慢,但对照选择难度增加,故以上,效率增加缓慢,但对照选择难度增加,故 1:4(三)研究对象来源与选择(三)研究对象来源与选择 1、病例:、病例:(1)以医院为基础()以医院为基础(hospital-based):):某期间内全部门某期间内全部门诊诊 或住院病人;病案及出院记录或住院病人;病案及出院记录 (2)以社区人群为基础()以社区人群为基础(community-based):):社区
16、的社区的监测、监测、普查、抽样调查中发现的病例普查、抽样调查中发现的病例 注意:明确的诊断标准(国内外统一;自定);与对照的注意:明确的诊断标准(国内外统一;自定);与对照的 可比性(性别、年龄等);新发、现患、死亡病例可比性(性别、年龄等);新发、现患、死亡病例 2、对照、对照:(理想:全人群或非病人群的随机样本(理想:全人群或非病人群的随机样本 现实:病例的定义可确定其源人群,对照应为病例源人现实:病例的定义可确定其源人群,对照应为病例源人群群 的随机样本)的随机样本)(1)同一或多个医院其他病人:那些与暴露没联系者)同一或多个医院其他病人:那些与暴露没联系者 吸烟与肺癌:排除呼吸道疾病入
17、院者做对照吸烟与肺癌:排除呼吸道疾病入院者做对照 (2)人群对照(社区、社团非病例或健康人):随机抽样;)人群对照(社区、社团非病例或健康人):随机抽样;随机数字拨号随机数字拨号 (3)朋友、同事、亲属及死亡对照)朋友、同事、亲属及死亡对照(四)样本含量的估计(四)样本含量的估计(size of sample)1、影响因素影响因素(1)对照组的暴露率()对照组的暴露率(P0)(2)估计的估计的RR或或OR(3)希望的显著性水平(希望的显著性水平(a=a=0.05 or=0.01)假阳性错误(假阳性错误(false positive error)或称第一类错误(或称第一类错误(type I er
18、ror)即由于判断失误,从而拒绝了原本正确的无效假设。在统计推断即由于判断失误,从而拒绝了原本正确的无效假设。在统计推断 上指允许犯假阳性的概率。上指允许犯假阳性的概率。1-a a 称为精确度。称为精确度。(4 4)希望的把握度()希望的把握度(power)或称功效,(或称功效,(1-b b)b b为假阴性错误(为假阴性错误(false negative error or type II error),),指由于指由于统统 计量(计量(t)没有超过显著水平,从而接受了原本不正确的无效假设。没有超过显著水平,从而接受了原本不正确的无效假设。2、计算、计算(1)非匹配设计:病例数)非匹配设计:病例
19、数=对照数对照数例:吸烟与肺癌,预期例:吸烟与肺癌,预期RR=2.0,人群吸烟率人群吸烟率(p0)=20%,定:定:a a=0.05(双侧)双侧)b b=0.1 查表得查表得:Ua a=1.96 =1.96 Ub b=1.28=1.28 p1=(0.22)/(1+0.21)=0.333 =(0.2+0.333)/2=0.267 =1-0.267=0.733 n=20.2670.733(1.96+1.282)2/0.333-0.2)2 =232 (查表得:查表得:n=229)(2)非匹配调查:病例数)非匹配调查:病例数对照数对照数设:病例数设:病例数:对照数对照数=1:c;则病例数为:则病例数为
20、:p1计算同上式;对照数计算同上式;对照数=cn(3)1:1配对设计:配对设计:Schlesselman公式:公式:总对子数:总对子数:Mm/(p0q1+p1q0)m为结果不一致的对子数为结果不一致的对子数 p0;p1为目标人群中对照组和病例组估计暴露率为目标人群中对照组和病例组估计暴露率例:例:研究口服避孕药与先天性心脏病的关系,设研究口服避孕药与先天性心脏病的关系,设a a=0.05(双侧),双侧),b b=0.1;对照组暴露比例对照组暴露比例p0=0.3;预期预期RR=2.0 求:需要的总对子数?求:需要的总对子数?解:查表得解:查表得:Ua a=1.96 =1.96 Ub b=1.28
21、=1.28 p1=P0RR/1+p0(RR-1)=0.32/1+0.3(2-1)=0.46 p=RR/(1+RR)=2/(1+2)=2/3=0.67 q1=1-p1=1-0.46=0.54 q0=1-p0=1-0.3=0.7 总对子数:总对子数:Mm/(p0q1+p1q0)=90/(0.30.45+0.460.7)=186(人)人)(五)获取研究因素的信息五)获取研究因素的信息 1、变量的选定:与目的有关的变量不能少,且要细致(吸烟:、变量的选定:与目的有关的变量不能少,且要细致(吸烟:量、时间、种类、方式、戒烟时间等);无关的项目不能有。量、时间、种类、方式、戒烟时间等);无关的项目不能有。
22、2、变量的规定:明确规定,统一标准(吸烟者:每天吸烟至少、变量的规定:明确规定,统一标准(吸烟者:每天吸烟至少一支,持续一年以上者)一支,持续一年以上者)3、变量的测量:定性(是、否);半定量(经常、偶尔、不);、变量的测量:定性(是、否);半定量(经常、偶尔、不);定量(平均每周几次?平均每次多少?)定量(平均每周几次?平均每次多少?)4、使变量符合规定:以客观手段与证据为准绳(病情用医疗档、使变量符合规定:以客观手段与证据为准绳(病情用医疗档案核准;职业史以工厂档案核准;空气、水污染用检测结果核准;案核准;职业史以工厂档案核准;空气、水污染用检测结果核准;吸烟量由亲属核准等)吸烟量由亲属核
23、准等)(六)资料收集(六)资料收集 调查问卷;查阅档案;采样化验;实地查看等。调查问卷;查阅档案;采样化验;实地查看等。第五节第五节 资料整理与分析资料整理与分析一、原则一、原则 1、比较两组暴露比例有无显著性差异、比较两组暴露比例有无显著性差异 2、用暴露优势比估计患病优势比(联系强度)、用暴露优势比估计患病优势比(联系强度)3、控制混杂因素:、控制混杂因素:匹配匹配匹配匹配;分层;多因素分析;分层;多因素分析二、方法二、方法(一)描述性分析(一)描述性分析 1、研究对象的一般特征、研究对象的一般特征 2、均衡性检验、均衡性检验(二)推断性分析二)推断性分析分析类型:分析类型:不分层资料不分
24、层资料 非个体匹配资料非个体匹配资料 分层资料分层资料 1:1配对配对 个体匹配资料个体匹配资料 1:2配对配对 1:M配对配对 分级暴露资料分级暴露资料 多因素分析多因素分析 n病例对照研究中表示联系强度的指标病例对照研究中表示联系强度的指标 比值比比值比(比数比比数比;优势比优势比;交叉乘积比交叉乘积比;odds ratio;OR):病例病例组暴露比值与对照组暴露比值之比。组暴露比值与对照组暴露比值之比。病例组暴露比值病例组暴露比值:对照组暴露比值对照组暴露比值:比值比:比值比:OR取值为取值为0,OR1为为“正正”关联,说明发病危险度增大关联,说明发病危险度增大;OR1为为“负负”关联,
25、说明发病危险度减少。关联,说明发病危险度减少。ORRR的条件:的条件:1)良好的代表性)良好的代表性 2)人群疾病频率较低()人群疾病频率较低(5%)暴露暴露 疾病疾病 .病例病例 对照对照 合计合计 +a b a+b=n1 -c d c+d=n0合计合计 a+c=m1 b+d=m0 t 暴露暴露 疾病疾病 .病例病例 非病例非病例 合计合计 +a b a+b=n1 -c d c+d=n0合计合计 a+c=m1 b+d=m0 t OR与与RR之关系之关系病例对照研究资料病例对照研究资料队列研究资料队列研究资料当当人群疾病频率很低时,可将人群疾病频率很低时,可将RR计算公式中计算公式中 a/(a
26、+b)和和c/(c+d)中分母的中分母的 a、c忽略不计,即:忽略不计,即:a+b b;c+dd;则:则:因此,因此,ORRR的条件:的条件:1)良好的代表性)良好的代表性 2)人群疾病频率较低()人群疾病频率较低(5%)相对危险度(相对危险度(RR)与关联强度与关联强度 (Monson RA,1980)RR(OR)关联强关联强度度 0.91.0 1.01.1 无 0.70.8 1.21.4 弱 0.40.6 1.52.9 中等 0.10.3 3.09.9 强 10 很强1、非个体匹配不分层资料、非个体匹配不分层资料 (1)整理表格)整理表格 表表 口服避孕药口服避孕药(OC)与心肌梗死与心肌
27、梗死(MI)关系关系 (2)显著性检验)显著性检验 c c2=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d)=7.7 c c20.01(1)=6.637.7 P1.96 2.58 3.08 2.58 P0.01(4)OR可信区间(confidence interval,,CI)1)Woolf法:本例:Var(lnOR)=0.0826 OR95%CI=ln2.21.960.2874 =1.32180.2252 OR95%CI=exp(1.3218;0.2252)=1.253.75 2)Miettinen法:本例:2、非个体匹配分层资料、非个体匹配分层资料 1)特点)特点 (1)可评
28、价分层因素本身作用及其与暴露之关系)可评价分层因素本身作用及其与暴露之关系 (2)离散变量可完全控制分层因素的混杂作用,连续变量取决)离散变量可完全控制分层因素的混杂作用,连续变量取决 于分层程度于分层程度 (3)简单易行,一目了然,并帮助正确设计多因素模型)简单易行,一目了然,并帮助正确设计多因素模型 (4)缺点是丢失效率,分层太多,层中例数会出现)缺点是丢失效率,分层太多,层中例数会出现“零零”2)资料整理)资料整理 表表5-6 病例对照研究分层资料整理表病例对照研究分层资料整理表暴暴露露特特征征 第第i 层层的的发发病病情情况况 合合计计 病例病例 对照对照 +ai bi n1i -ci
29、 di n0i 合计合计 m1i m0i ti 表表 口服避孕药与心机梗死关系病例对照研究按年龄分层分析口服避孕药与心机梗死关系病例对照研究按年龄分层分析(3)计算各层)计算各层OR:OR1=(2159)/(26 17)=2.8 OR2=(18 95)/(88 7)=2.78 可见两层可见两层OR值均较不分层时大。值均较不分层时大。40 40岁岁 .服服OC 未服未服OC 合计合计 服服OC 未服未服OC 合计合计 病例病例 21(a1)26(b1)47(m11)18(a2)88(b2)106(m12)对照对照 17(c1)59(d1)76(m01)7(c2)95(d2)102(m02)合计合
30、计 38(n11)85(n01)123(t1)25(n12)183(n02)208(t2)分层分层OR值的齐性检验(值的齐性检验(Woolf法)法)1、计算各、计算各层层ORi、lnORi、Var(lnORi)、w wi:Var(lnORi)=1/a+1/b+1/c+1/d w wi=1/Var(lnORi)2、进行进行c c2 2检验:检验:n n为层数;为层数;自由度为自由度为n n-1-1 表表 OR齐性检验资料整理表齐性检验资料整理表计算总计算总OR的:的:ORw w=e1.0266=2.7915计算总计算总OR的标准误:的标准误:计算总计算总OR95%CI:O ORw w9595%C
31、I=e1.0266-1.960.3055e1.0266+1.960.3055=1.53395.080层次层次 ORi lnORi Var(lnORi)w wi 1 2.8 1.0296 1/21+1/26+1/17+1/59=0.1618 6.1805 2 2.78 1.0225 1/18+1/88+1/7+1/95=0.2204 4.5366作作c c2 2检验:检验:c c20.01(1)=6.637.5621 P0.01 结论:各层间的结论:各层间的OROR值值差异显著,说明两个资料不同质,差异显著,说明两个资料不同质,总总OROR值不能说明年龄、口服避孕药及心肌梗死的关系。值不能说明年
32、龄、口服避孕药及心肌梗死的关系。因此计算总因此计算总OROR值无意义。值无意义。进一步分析非暴露组年龄与进一步分析非暴露组年龄与MI及及对照组年龄与对照组年龄与OC之关系之关系 表表5-8 年龄与年龄与MI之关联之关联 OR=0.48;c c2 2=7.27=7.27 说明年龄与心肌梗死有联说明年龄与心肌梗死有联系系(小年龄有保护作用小年龄有保护作用)。年龄不是年龄不是年龄不是年龄不是OCOC和和和和MIMI的中间的中间的中间的中间环节环节环节环节 表表5-8 年龄与年龄与OC之关联之关联 OR=3.91;c c2 2=8.89=8.89 说明年龄与口服避孕药说明年龄与口服避孕药也有联系。也有
33、联系。年龄是研究年龄是研究年龄是研究年龄是研究OCOC与与与与MIMI关系关系关系关系时的混杂因素时的混杂因素时的混杂因素时的混杂因素 40岁岁 40岁岁MI 26 88对照对照 59 95 40岁岁 40岁岁OC 17 7对照对照 59 95(4)计算总)计算总OR值:值:Mantel-Haenszel公式:公式:本例:本例:ORMH=2.79 (5)计算总计算总c c2 2值:值:Mantel-Haenszel公式:公式:其中其中I为总层数,为总层数,i 为第几层为第几层 本例本例 =11.79 u=u=处理组处理组-1=4-1=3-1=4-1=3 P0.01 (6)估计总)估计总OR值值
34、95%CI(7)计算标准化计算标准化OR值:各层间值:各层间OR值相差很大值相差很大时,计时,计 算标准化死亡比(算标准化死亡比(standard mortality ratio,SMR)或标准化率比()或标准化率比(standard rate ratio,SRR),来说明),来说明暴露组与非暴露组死亡暴露组与非暴露组死亡率或发病率之比值率或发病率之比值。分层分析的过程总结分层分析的过程总结 每层每层OR 异质异质 齐性检验齐性检验 标化标化OR 同质同质 总总ORMH OR不等不等 非暴露组混杂因素非暴露组混杂因素 粗分析粗分析 分层分析分层分析 与疾病之关系与疾病之关系(OR、c c2 2
35、)是否混杂是否混杂 OR相等相等 对照组混杂因素与对照组混杂因素与 研究因素之关系研究因素之关系 结论结论 混杂混杂 方向及大小方向及大小?3、分级暴露资料、分级暴露资料(1)资料整理)资料整理 表表5-11 男性每日的吸烟支数与肺癌之关系男性每日的吸烟支数与肺癌之关系c c2 2=43.15 n=3 =43.15 n=3 P0.001 (RC表卡方检验)表卡方检验)暴露暴露 每日吸烟支数每日吸烟支数 .水平水平(Xi)0(X0)1(X1)5(X2)15(Xt)合计合计病例病例ai 2(a0=c)33(a1)250(a2)364(a3)649(n1)对照对照bi 27(b0=d)55(b1)2
36、93(b2)274(b3)649(n2)合计合计mi 29(m0)88(m1)543(m2)638(m3)1298(n)OR 1.0 8.18 11.52 17.93(2)作)作RC表卡方检验表卡方检验(3)计算各分级的)计算各分级的OR值:值:例:例:Xi=5 OR=(250 27)/(2932)=11.52(4)进行趋势卡方检验(自由度为进行趋势卡方检验(自由度为1):):Xi:取每个暴露水平的中点值;第取每个暴露水平的中点值;第i 暴露水平暴露水平 的的Xi=i(如:如:X0=0;X1=1;X2=2;)(但是,但是,EpiEpi IfoIfo的取值为每个暴露水平的初值,的取值为每个暴露水
37、平的初值,本例为本例为X X0 0=0=0;X X1 1=1=1;X X2 2=5=5;X X3 3=15=15)本例:(按本例:(按Epi Info 计算)计算)T1=6743;T2=12373;T3=7587649;V=186886.17 c c2=31.52 P 0.001(按(按Xi=i计算,计算,c c2=63.0842)4、1:1配对资料分析配对资料分析(1)资料整理)资料整理 表表5-13 外源性雌激素与子宫内膜癌的关系外源性雌激素与子宫内膜癌的关系对照对照 病例病例 对子数对子数 有暴露史有暴露史 无暴露史无暴露史有暴露史有暴露史 27(a)3(b)30(a+b)无暴露史无暴露
38、史 29(c)4(d)33(c+d)对子数对子数 56(a+c)7(b+d)63(n)(2)卡方检验:)卡方检验:McNemar公式公式 大样本:大样本:c c2 2 =(b-c)2/(b+c)小样本:小样本:c c2 2 =(|b-c|-1)2/(b+c)本例:本例:c c2 2 =(|b-c|-1)2/(b+c)=19.53 P 0.005(3)计算计算OR值:值:OR=c/b (b0)本例:本例:OR=9.67(4)计算计算OR95%CI:Miettinen法法 本例:本例:ORLORU=3.5626.245、1:2配对资料的分析配对资料的分析(1)资料整理)资料整理 表表5-14 18
39、个个“对子对子”人工流产史与宫外孕关系人工流产史与宫外孕关系 (2)计算)计算OR值:值:OR=(b+2c)/(2d+e)=16 (3)c c2检验:检验:对 照 .+-+1(a)6(b)5(c)病例病例 -0(d)1(e)5(f)宫外孕宫外孕人流史人流史式中:式中:b的期望值:的期望值:E(b)=2/3(b+d)=2/3(6+0)=4 c的期望值:的期望值:E(c)=1/3(c+e)=1/3(5+1)=2 b的方差:的方差:V(b)=2/9(b+d)=1.33 c的方差:的方差:V(c)=2/9(c+e)=1.33 自由度自由度=1,P 0.05(4)OR95%CI=6、病因分值(、病因分值
40、(etiologic fraction,EF)(1)暴露人群:暴露人群:(归因危险度百分比(归因危险度百分比 attributive risk proportion,ARP,AR%)AFe e=ARP=AR%=(Ie Iu)/Ie=(OR-1)/OR I:发病率;发病率;e:暴露人群暴露人群 u:非暴露人群非暴露人群 暴露人群中因暴露于某因素引起的发病占全暴露人群中因暴露于某因素引起的发病占全 部病例的比例。如部病例的比例。如HBsAgHBsAg携带者与肝癌关系研究表明携带者与肝癌关系研究表明,AFAFe e=90.9%=90.9%,说明表面抗原阳性者中说明表面抗原阳性者中发生的肝癌数占该组人
41、群全部肝癌数的发生的肝癌数占该组人群全部肝癌数的90.9%90.9%。(2 2)总人群:)总人群:(人群特异危险度百分比(人群特异危险度百分比 population attributive risk proportion,PARP,PAR%)AFAFp p=PARP=PAR%=PARP=PAR%=(Ip Iu)/Ip =Pe(OR-1)/1+Pe(OR-1)P Pe e:总人群暴露率(用对照组代替)总人群暴露率(用对照组代替)7、多因素分析、多因素分析nLogistic回归模型(回归模型(Logistic regression model)条件条件(conditional):个体配对病例对照研
42、究个体配对病例对照研究 非条件非条件(unconditional):非个体匹配病例对照研非个体匹配病例对照研究究nLoglinear回归模型回归模型三、功效(三、功效(power):):拒绝无效假设的能力拒绝无效假设的能力(1)1:1配对:配对:已知:人群暴露比为已知:人群暴露比为P=0.3;病例病例=对照对照=50;a=a=0.5;OR=2 求:功效求:功效=?计算:功效计算:功效=1-b b;b b 通过通过Z b b值查表;值查表;查表,查表,Z b b=-0.3,b=0.62b=0.62,功效功效=1-b=0.38=38%b=0.38=38%;即在;即在给定条件下,给定条件下,该研究检
43、验出该研究检验出OR1的概率为的概率为38%(应在应在75%以上以上),以上检验未分层。以上检验未分层。第六节第六节 偏倚(偏倚(bias)及其控制及其控制一、选择偏倚一、选择偏倚(一)入院偏倚(一)入院偏倚(Berkson):):对照为部分病人;病例为特对照为部分病人;病例为特定病例;医院、病人双向选择定病例;医院、病人双向选择(随机;多医院选择对象)随机;多医院选择对象)随机;多医院选择对象)随机;多医院选择对象)(二)现患病例(二)现患病例-新发病例偏倚(新发病例偏倚(Neyman bias):):存活旧存活旧病例的信息只与存活有关病例的信息只与存活有关 ;或病例改变习惯;或病例改变习惯
44、(新发病例)(新发病例)(新发病例)(新发病例)(三)检出征候偏倚(三)检出征候偏倚(unmasking bias):):因某些与致病因某些与致病无关的症状就诊,提高了早期病例检出率,过高的估计了无关的症状就诊,提高了早期病例检出率,过高的估计了暴露程度暴露程度(四)时间效应偏倚(四)时间效应偏倚(time effect bias):):慢性病,即将发慢性病,即将发病者、已有早期病变但未检出、已有病变因监测手段未检病者、已有早期病变但未检出、已有病变因监测手段未检出从而划入对照组出从而划入对照组(用敏感检查技术;长期纵向观察)(用敏感检查技术;长期纵向观察)(用敏感检查技术;长期纵向观察)(用
45、敏感检查技术;长期纵向观察)二、信息偏倚(二、信息偏倚(information bias;观察或测量偏倚)观察或测量偏倚)(一)回忆偏倚(一)回忆偏倚(recall bias):调查和事件时间间隔、调查和事件时间间隔、事件重要性、被调查者构成、调查技术等造成回忆失事件重要性、被调查者构成、调查技术等造成回忆失真。病例回忆比对照准确但容易夸大。真。病例回忆比对照准确但容易夸大。(选择重要指(选择重要指(选择重要指(选择重要指标;问卷设计;调查技巧)标;问卷设计;调查技巧)标;问卷设计;调查技巧)标;问卷设计;调查技巧)(二)调查偏倚(二)调查偏倚(investigation bias):来自调查
46、者和被来自调查者和被调查者:调查环境;对调查的态度;诱导偏倚调查者:调查环境;对调查的态度;诱导偏倚(客观(客观(客观(客观指标;调查员培训;同环境、检查手段、时间、调查指标;调查员培训;同环境、检查手段、时间、调查指标;调查员培训;同环境、检查手段、时间、调查指标;调查员培训;同环境、检查手段、时间、调查员)员)员)员)三、混杂偏倚三、混杂偏倚(confounding bias):由于混杂因子的影响由于混杂因子的影响造成造成(匹配;分层;多因素分析)(匹配;分层;多因素分析)(匹配;分层;多因素分析)(匹配;分层;多因素分析)。混杂与混杂因子混杂与混杂因子(confounding and c
47、onfounding factor):研研究某因素与某疾病关联时,由于某个既与疾病有制约关系,又与究某因素与某疾病关联时,由于某个既与疾病有制约关系,又与所研究的因素有联系的外来因素的影响,掩盖或扩大了所研究的所研究的因素有联系的外来因素的影响,掩盖或扩大了所研究的因素与疾病的联系,这种现象或影响叫混杂,其所带来的偏倚叫因素与疾病的联系,这种现象或影响叫混杂,其所带来的偏倚叫混杂偏倚,该外来因素叫混杂因素。混杂偏倚,该外来因素叫混杂因素。第七节第七节 应考虑的问题应考虑的问题 根据以上内容可以自根据以上内容可以自己总结哪些问题应重己总结哪些问题应重点考虑点考虑?第八节第八节 病例对照研究的优缺点病例对照研究的优缺点n相对队列研究相对队列研究(一)优点(一)优点 1、适用于罕见病的研究、适用于罕见病的研究 2、相对省力、省钱、省时,易于实施、相对省力、省钱、省时,易于实施 3、应用广泛,如疫苗免疫学效果考核和爆发研究、应用广泛,如疫苗免疫学效果考核和爆发研究(二)缺点:(二)缺点:1、不适合研究人群中暴露比例很低的因素、不适合研究人群中暴露比例很低的因素 2、难以避免选择偏倚和回忆偏倚、难以避免选择偏倚和回忆偏倚 3、难以判断暴露与发病的时间先后、难以判断暴露与发病的时间先后 4、结论说服力较弱、结论说服力较弱
限制150内