《研究的真实性与因果推断.ppt》由会员分享,可在线阅读,更多相关《研究的真实性与因果推断.ppt(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章第八章 研究的真实性与因果推断研究的真实性与因果推断1、研究结果的变异性、研究结果的变异性2、研究的真实性、研究的真实性3、研究的偏倚、研究的偏倚4、病因定义及模型、病因定义及模型5、因果关系的逻辑方法、因果关系的逻辑方法6、统计关联到因果关联、统计关联到因果关联7、因果关联的推断标准、因果关联的推断标准第一节第一节 研究结果的变异性研究结果的变异性一、概述一、概述变异性(变异性(variability):):研究结果的变动或波动叫研究结果的变动或波动叫研究结果的变异性研究结果的变异性1、生物学变异和测量变异:主要来自个体、生物学变异和测量变异:主要来自个体(个体生(个体生物学变异;测量
2、误差)物学变异;测量误差)、群体、群体(个体遗传学变异、(个体遗传学变异、环境变异测量误差)环境变异测量误差)和样本和样本(抽样方式、样本大(抽样方式、样本大小和测量误差小和测量误差)2、随机变异和系统变异:前者成正态分布;后者的、随机变异和系统变异:前者成正态分布;后者的绝对值和方向保持恒定。绝对值和方向保持恒定。测量误差包括随机误差和系统误差测量误差包括随机误差和系统误差二、个体水平差异变异来源变异来源 特特 点点个体状态个体状态 日间变异,年龄、膳食或运动改变,环境因素日间变异,年龄、膳食或运动改变,环境因素测量误差测量误差 仪器标度差,精密度差,读数或记录错误仪器标度差,精密度差,读数
3、或记录错误三、群体水平的变异性是各个体变异的累积是各个体变异的累积,群体变异常大于个体群体变异常大于个体可根据群体变异来确定正常值的范围可根据群体变异来确定正常值的范围也受到测量误差的影响也受到测量误差的影响四、样本水平的变异性1、描述性结果样本变异:图、描述性结果样本变异:图812、分析性结果样本变异:图、分析性结果样本变异:图82第二节 研究的真实性一、概述一、概述n真实性(效度;真实性(效度;validityvalidity):研究收集的数):研究收集的数据、分析结果和所得结论与客观实际的符据、分析结果和所得结论与客观实际的符合程度。用真实性指数(合程度。用真实性指数(index of
4、index of validity,IV)validity,IV)或灵敏度等表示。或灵敏度等表示。研究误差:研究结果与客观实际不符合的地方。分为系统研究误差:研究结果与客观实际不符合的地方。分为系统误差(偏异;误差(偏异;biasbias)和随机误差)和随机误差n可靠性(信度;可靠性(信度;reliabilityreliability;精密度;精密度;precision)precision):指研究中随机误差的大小程:指研究中随机误差的大小程度度二、内部真实性(二、内部真实性(internal validity)指研究结果与实际研究对象真实情况的符指研究结果与实际研究对象真实情况的符合程度,指
5、研究本身是否真实合程度,指研究本身是否真实真实性高,则系统误差和随机误差小真实性高,则系统误差和随机误差小研究结果真实性差,不能应用于其他人群研究结果真实性差,不能应用于其他人群三、外部真实性三、外部真实性(external validity)研究结果与推论对象真实情况的符合程度研究结果与推论对象真实情况的符合程度增加研究对象的同质性,能改善内部真实增加研究对象的同质性,能改善内部真实性;性;增加研究对象的异质性,能改善外部真实增加研究对象的异质性,能改善外部真实性;性;应综合考虑研究对象的异质性和同质性应综合考虑研究对象的异质性和同质性第三节 研究的偏倚 一、选择偏倚一、选择偏倚定义:选入研
6、究样本的研究对象与未被选定义:选入研究样本的研究对象与未被选入者之间特征差异造成的系统误差。入者之间特征差异造成的系统误差。n描述性研究的选择偏倚:体现在样本对总体的描述性研究的选择偏倚:体现在样本对总体的代表性上代表性上n分析性研究的选择偏倚:体现在研究对象进入、分析性研究的选择偏倚:体现在研究对象进入、排除、不参与、失访等排除、不参与、失访等二、信息偏倚定义:在从研究对象收取所需信息时产生的偏倚。其定义:在从研究对象收取所需信息时产生的偏倚。其表现是使研究对象的某种特征被错误分类表现是使研究对象的某种特征被错误分类(misclassification)。)。同样存在描述性研究和分析性研究的
7、中同样存在描述性研究和分析性研究的中n无差异性错误分类(无差异性错误分类(nondifferential misclassification):暴露或疾病的错误分类与研究分组无关;大多数情况:暴露或疾病的错误分类与研究分组无关;大多数情况下,模糊了组间差异,低估了研究效应下,模糊了组间差异,低估了研究效应n差异性错误分类(差异性错误分类(differential misclassification):暴:暴露或疾病的错误分类与研究分组有关,由于其差异偏向露或疾病的错误分类与研究分组有关,由于其差异偏向不同,可高估或低估研究效应不同,可高估或低估研究效应无差异分类错误无差异分类错误高脂肪膳食低脂
8、肪膳食心肌梗死6040对照4060高脂肪膳食低脂肪膳食心肌梗死4852对照3268高脂肪膳食低脂肪膳食心肌梗死6040对照4060高脂肪膳食低脂肪膳食心肌梗死6040对照3268研究真实数据错误分类数据研究真实数据差异分类错误差异分类错误错误分类数据OR=2.3OR=2.0OR=2.3OR=3.2三、混杂偏倚定义:定义:在研究某因素与某疾病关联时,由于某个既与疾病有在研究某因素与某疾病关联时,由于某个既与疾病有制约关系,又与所研究的因素有联系的外来因素的影响,制约关系,又与所研究的因素有联系的外来因素的影响,掩盖或扩大了所研究的因素与疾病的联系,这种现象或影掩盖或扩大了所研究的因素与疾病的联系
9、,这种现象或影响叫混杂(响叫混杂(confoundingconfounding),其所带来的偏倚叫混杂偏倚),其所带来的偏倚叫混杂偏倚(confounding biasconfounding bias),该),该外来因素叫混杂因素外来因素叫混杂因素(confounding factor)confounding factor)。特点特点:(1 1)必须是所研究疾病的独立危险因子)必须是所研究疾病的独立危险因子 (2 2)必须与研究因素(暴露因素)有关)必须与研究因素(暴露因素)有关 (3 3)必须不是研究因素与研究疾病因果链上中间变量)必须不是研究因素与研究疾病因果链上中间变量二、由统计学关联到
10、因果关联二、由统计学关联到因果关联 (一)统计学关联(一)统计学关联(association)偶然关联偶然关联 选择偏倚选择偏倚 提出提出 验证验证 关关 非因果关联非因果关联 观察偏倚观察偏倚 假设假设 假设假设 联联 混杂等混杂等 统计学关联统计学关联 间接因果关联间接因果关联 因果关联因果关联 直接因果关联直接因果关联 (二)因果关联(二)因果关联(causal association)黄色瘤黄色瘤(E)静脉吸毒静脉吸毒(E)1、继发继发 2、直接、直接 关联关联 高血清胆高血清胆?关联关联 性乱性乱(F)?胆固醇胆固醇(C)歪曲歪曲 冠心病冠心病(D)HIV感染感染(D)病因推断第四节
11、第四节 病因的定义及模型病因的定义及模型一、定义:一、定义:Lilienfeld:那些能使人群发病概率升高的那些能使人群发病概率升高的因素,就可以认为是病因。因素,就可以认为是病因。MacMahon:因果关系是事件或特征之间因果关系是事件或特征之间的一种关联,改变某一事件(的一种关联,改变某一事件(X X)的频率的频率或特征,就会引起另一事件频率或特征或特征,就会引起另一事件频率或特征的改变。此时,前一事件(的改变。此时,前一事件(X X)是后一事是后一事件(件(Y Y)的原因。的原因。(二)防治效应的病因定义(二)防治效应的病因定义n研究因果关系的实验:研究因果关系的实验:在受控的条件下,研
12、在受控的条件下,研究这有意改变一个或多个处理因素,并前究这有意改变一个或多个处理因素,并前瞻性地确定其效应瞻性地确定其效应n防治试验中的处理防治试验中的处理(treatment or maneuver)可看作是防治特定效应(结局)可看作是防治特定效应(结局)的可能原因的可能原因二、病因模型二、病因模型:社会经济因素社会经济因素 生物学因素生物学因素 环境因素环境因素 医学生物学因素医学生物学因素 疾病疾病 心理行为因素心理行为因素 (致病机制)(致病机制)卫生保健因素卫生保健因素鬼神、上帝、天意金木水火土人病原微生物人物质的社会的生物的机体G病原物宿主(人)环境迷信阶段朴素唯物主义生物学病因萌
13、芽三角模型轮状模型疾病因素模型第五节第五节 因果推断的逻辑方法因果推断的逻辑方法一、推理方法一、推理方法(一)假设演绎法(一)假设演绎法(hypothesis-deduction method)1、证明某因子是某病病因的过程:证明某因子是某病病因的过程:横断面研究横断面研究 纵向研究纵向研究 临床资料临床资料 疾病监测疾病监测 病理资料病理资料 病例对照研究病例对照研究 队列研究队列研究 描述EPI形成假设分析EPI实验EPI病因推断2、定义:对描述和分析流行病学研究起衔接作用的逻辑、定义:对描述和分析流行病学研究起衔接作用的逻辑 方法即假设演绎法方法即假设演绎法3、推理形式:、推理形式:PH
14、C组组HBV感染率高于对照感染率高于对照 HBV感染组肝癌发病率高感染组肝癌发病率高 证据证据证据证据(E)(E)有有有有 HBV感染率感染率PHC发病率发病率 HBV感染率感染率PHC发病率发病率 证据证据证据证据(E)(E)无无无无HBV持续感染PHC假设假设假设假设(H)(H)条件C因素(二)(二)Mill准则:准则:1、求同法(、求同法(methodagreement):):在不同的事件在不同的事件中寻找共同点。中寻找共同点。不同的事件不同的事件或情况与一种疾病存在关或情况与一种疾病存在关联,而这多种事件或情况均有一个联,而这多种事件或情况均有一个共同点共同点(因素),(因素),则该点
15、(因素)可能是该病病因。(则该点(因素)可能是该病病因。(1958年川西平原年川西平原不明原因发热,农民和国家职工均有下水劳动史不明原因发热,农民和国家职工均有下水劳动史钩体病)钩体病)2、求异法(、求异法(method of difference):):在不同的事件中在不同的事件中寻找差异点。(吸烟者肺癌发病率显著高于不吸烟者,寻找差异点。(吸烟者肺癌发病率显著高于不吸烟者,吸烟可能是原因)吸烟可能是原因)3、共变法(、共变法(method of concomitant variation):):当当某因素的频率或强度发生变化某病发病率也随之变化某因素的频率或强度发生变化某病发病率也随之变化
16、时,该因素可能是该病病因(吸烟量增加,肺癌发病时,该因素可能是该病病因(吸烟量增加,肺癌发病OR值增加)值增加)4、剩余法(排除法、剩余法(排除法 method of residues;exclusion):在研究的几种因素中,排除):在研究的几种因素中,排除了某些已知与疾病无关的因素,则剩余的了某些已知与疾病无关的因素,则剩余的因素可能是病因。(鼻咽癌与遗传,排除因素可能是病因。(鼻咽癌与遗传,排除鼻腔结构、语言、生活习惯等)鼻腔结构、语言、生活习惯等)5、类推法(、类推法(method of analogy):当一):当一种原因未明的疾病与另一种已知原因的疾种原因未明的疾病与另一种已知原因
17、的疾病分布相同时,两者病因可能相同。非洲病分布相同时,两者病因可能相同。非洲儿童恶性淋巴瘤儿童恶性淋巴瘤 Burkitt lymphoma 与疟与疟疾分布相同(热带非洲疾分布相同(热带非洲;1542m;16),),推断与虫媒(按蚊)有关。推断与虫媒(按蚊)有关。三、因果实验中的对照法则三、因果实验中的对照法则(一)设立对照的必要性(一)设立对照的必要性 求出净效应求出净效应(二)保证对照组的有效性(二)保证对照组的有效性 各组除了处理因素不同,其它因素尽各组除了处理因素不同,其它因素尽 量相同量相同 1、各组干扰因素的可比性:随机分组、各组干扰因素的可比性:随机分组 2、各组效应测量的的可比性
18、:主、客观、各组效应测量的的可比性:主、客观 因素(主观因素消除办法:盲法)因素(主观因素消除办法:盲法)第六节第六节 统计关联到因果关联统计关联到因果关联 (一)统计学关联(一)统计学关联(association)偶然关联偶然关联 选择偏倚选择偏倚 提出提出 验证验证 关关 非因果关联非因果关联 观察偏倚观察偏倚 假设假设 假设假设 联联 混杂等混杂等 统计学关联统计学关联 间接因果关联间接因果关联 因果关联因果关联 直接因果关联直接因果关联 (二)因果关联(二)因果关联(causal association)黄色瘤黄色瘤(E)静脉吸毒静脉吸毒(E)1、继发继发 2、直接、直接 关联关联 高
19、血清胆高血清胆?关联关联 性乱性乱(F)?胆固醇胆固醇(C)歪曲歪曲 冠心病冠心病(D)HIV感染感染(D)病因推断第七节第七节 因果关联的推断标准因果关联的推断标准一、标准的发展一、标准的发展(一)病因推断标准:(一)病因推断标准:1、Henle-koch原理(原理(1882):):u该微生物在每个病例中均存在;该微生物在每个病例中均存在;u该微生物必须能够在体外分离和培养;该微生物必须能够在体外分离和培养;u将培养出的微生物接种于易感宿主时,应可引起此种将培养出的微生物接种于易感宿主时,应可引起此种特异疾病;特异疾病;u由被接种的动物也能分离出此微生物并加以鉴定由被接种的动物也能分离出此微
20、生物并加以鉴定2、美国、美国“吸烟与健康报告吸烟与健康报告”委员会(委员会(1964):):5条条u时间顺序、强度、特异性、重复性、合理性时间顺序、强度、特异性、重复性、合理性1 1、时间顺序:前因后果。幽门螺杆菌感染与十二、时间顺序:前因后果。幽门螺杆菌感染与十二指肠溃疡:指肠溃疡:324324例感染者,例感染者,1010年,年,11%11%发病;发病;133133例对照例对照0.8%0.8%发病;海豹状肢体短畸发生在发病;海豹状肢体短畸发生在反应停销售后反应停销售后8-98-9个月;个月;2 2、强度:强度越大,成为病因可能性越大(吸、强度:强度越大,成为病因可能性越大(吸烟肺癌与烟肺癌与
21、OR=4-20OR=4-20;与心肌梗死为与心肌梗死为2 2)3 3、重复性:至少有、重复性:至少有3030次病例对照研究,次病例对照研究,7 7次队列次队列研究,不同地点、时间、人群研究证明肺癌与研究,不同地点、时间、人群研究证明肺癌与吸烟的关系。吸烟的关系。三、病因判断的标准三、病因判断的标准4 4、合理性:吸烟与肺癌,吸烟与支气管上、合理性:吸烟与肺癌,吸烟与支气管上皮鳞状化有关,与支气管鳞状上皮细胞皮鳞状化有关,与支气管鳞状上皮细胞癌有关,与腺癌无关,患病率男癌有关,与腺癌无关,患病率男女,狗女,狗吸烟动物实验证明,有癌基因;但吸烟动物实验证明,有癌基因;但SnowSnow提出霍乱由微
22、生物引起,由粪口途径经提出霍乱由微生物引起,由粪口途径经水传播,经水传播,经3030年后才发现霍乱弧菌年后才发现霍乱弧菌5 5、论证强度:实验性研究、论证强度:实验性研究队列研究队列研究病病例对照研究例对照研究现况研究现况研究6 6、剂量、剂量-反应关系:吸烟量越大,反应关系:吸烟量越大,RRRR值越大;值越大;7 7、暴露与疾病分布一致性:各国吸烟销售量与肺癌、暴露与疾病分布一致性:各国吸烟销售量与肺癌死亡率正相关。脂肪摄入量与大肠癌;疟疾与按死亡率正相关。脂肪摄入量与大肠癌;疟疾与按蚊;钉螺与血吸虫病蚊;钉螺与血吸虫病8 8、终止效应:戒烟者肺癌死亡率下降;停用某品牌、终止效应:戒烟者肺癌
23、死亡率下降;停用某品牌阴道月经棉条后中毒性休克症(阴道月经棉条后中毒性休克症(toxic shook toxic shook syndromesyndrome)发病率下降,消逝。)发病率下降,消逝。9 9、特异性:指、特异性:指唯一唯一的病因和疾病。传染病与病原体的病因和疾病。传染病与病原体有明显的特异性;从多因多果的观点,此条应取有明显的特异性;从多因多果的观点,此条应取消。消。三、应用举例三、应用举例l病因推断标准应用病因推断标准应用 幽门螺杆菌与十二指肠溃疡幽门螺杆菌与十二指肠溃疡l防治效应推断标准应用防治效应推断标准应用 老年人高血压降压治疗以降低心血管疾病老年人高血压降压治疗以降低心
24、血管疾病危险和死亡率危险和死亡率方法特点方法特点现况研究现况研究病例对照研究病例对照研究前瞻性队列研究前瞻性队列研究现场实验研究现场实验研究研究对象研究对象自然人群自然人群病例与对照病例与对照无病个体无病个体易感者易感者分组标准分组标准是否患病或暴露是否患病或暴露是否患病是否患病是否暴露是否暴露随机随机时间顺序时间顺序现况现况回顾性回顾性(由果推因由果推因)前瞻性前瞻性(由因推果由因推果)前瞻性前瞻性因果性质因果性质多因多果多因多果一果多因一果多因一因多果一因多果一因一果一因一果干预措施干预措施无无无无无无有有比较内容比较内容现患率、暴露率现患率、暴露率暴露比值暴露比值发病率、死亡率发病率、死
25、亡率发病率、死亡率发病率、死亡率疾病与暴疾病与暴露关联强露关联强度指标度指标RR、AR、PAR、AR%、PAR%OR、AR%、PAR%RR、AR、PAR、AR%、PAR%RR、AR、PAR、AR%、PAR%、保护率、效果保护率、效果指数指数病因研究病因研究提出病因线索提出病因线索提出、初步验证提出、初步验证进一步验证进一步验证确证确证优点优点可可迅速获得结果迅速获得结果;可了解基线率可了解基线率样本小样本小,获结果快获结果快;费用低费用低;适于少见适于少见病病资料准确资料准确,结果可结果可靠靠;结论说服力强结论说服力强;可直接计算可直接计算RR;研究过程及结果研究过程及结果分析可标准化分析可标准化;偏偏倚少倚少;结论肯定结论肯定缺点缺点不易确定因果关不易确定因果关系系;不适于病程短、不适于病程短、死亡快的病和少死亡快的病和少见病见病选择及回忆偏倚大选择及回忆偏倚大,样本代表性差样本代表性差,仅仅能计算能计算OR,难判断难判断时间前后关系时间前后关系样本大样本大,时间长时间长,费费用高用高,失访多失访多,设计设计严严,实施难实施难,不适于不适于少见病少见病样本大样本大,时间长时间长,费用高费用高,失访多失访多,设计严设计严,实施难实施难,涉及医德问题涉及医德问题 表表 几种主要流行病学研究方法的比较几种主要流行病学研究方法的比较
限制150内