基层医学研究常见问题.ppt
医学研究医学研究设计中的中的常常见问题方正杰方正杰医学研究医学研究设计概述概述 观察性研究:以客观、真实的观观察性研究:以客观、真实的观 察为依据,对观察结果进行察为依据,对观察结果进行研究类型研究类型 描述和对比分析,推论关联描述和对比分析,推论关联 程度程度 实验性研究:在排除其他因素影实验性研究:在排除其他因素影 响的条件下推论干预措施的响的条件下推论干预措施的 因果效应因果效应 专业设计:选题、建立假说、确专业设计:选题、建立假说、确 定研究对象和技术方法定研究对象和技术方法研究设计研究设计 统计设计:确定统计设计类型统计设计:确定统计设计类型 样本大小样本大小 分组方法,分组方法,统计分析统计分析研究研究设计的原的原则:o重复原则:要有一定数量的重复观察的样本重复原则:要有一定数量的重复观察的样本o对照原则:要设立对照组对照原则:要设立对照组o随机化原则:要做到随机化分组和抽样随机化原则:要做到随机化分组和抽样o均衡原则均衡原则专业设计中常中常见的的问题一、选题(建立假设)缺乏创新性一、选题(建立假设)缺乏创新性 (一)选题重复(一)选题重复 (二)选题滞后(二)选题滞后 (三)不善于检索查新(三)不善于检索查新 难以适应医学研究的发展,在论文质量方面难以适应医学研究的发展,在论文质量方面或科技进步奖评比方面处于落后地位。或科技进步奖评比方面处于落后地位。o资料来源资料来源 1、学术期刊、学术期刊 论文摘抄论文摘抄 综述性文献综述性文献 2、学术会议、学术会议 3、上级疾控机构提供、上级疾控机构提供 4、网络系统检索、网络系统检索中国知网中国知网 (首页)(首页)(中国知识资源总库)(中国知识资源总库)万方数据万方数据 (万方数据库)(万方数据库)二、研究手段仍停留在较原始的阶段二、研究手段仍停留在较原始的阶段 (一)不善于使用病原学、血清学、分子生(一)不善于使用病原学、血清学、分子生物学或其他现代技术作为研究方法。物学或其他现代技术作为研究方法。(二)不善于使用现代流行病学研究方法,(二)不善于使用现代流行病学研究方法,仍局限在描述流行病学或最初级的分析流行病仍局限在描述流行病学或最初级的分析流行病学研究方法,特别缺乏前瞻性研究。学研究方法,特别缺乏前瞻性研究。统计设计中常中常见的的问题一、样本量大小问题:研究的样本量设计没有一、样本量大小问题:研究的样本量设计没有原则,基大小随心所欲,是当前基层医学研原则,基大小随心所欲,是当前基层医学研究中最普遍的存在问题。究中最普遍的存在问题。如何确定研究所需要的如何确定研究所需要的样本量本量o选择研究样本除了要遵循随机原则外,还要选择研究样本除了要遵循随机原则外,还要保证有一定的样本量。样本太小,不容易发保证有一定的样本量。样本太小,不容易发现本应存在的差异,即假阴性,统计学上的现本应存在的差异,即假阴性,统计学上的“第第类错误类错误”;样本太大,又会造成不必;样本太大,又会造成不必要的浪费,而且不容易控制试验条件。要的浪费,而且不容易控制试验条件。o目前基层医学研究大多数不做样本量估计,目前基层医学研究大多数不做样本量估计,由此带来的问题是论文发表上的偏倚:由此带来的问题是论文发表上的偏倚:o当当P0.05时则不发表,或得出时则不发表,或得出“两种干预两种干预的效果无差异的效果无差异”、“两种检验方法可以替代两种检验方法可以替代”等结论。等结论。o只有样本量足够,才能保证得到阳性结果时,只有样本量足够,才能保证得到阳性结果时,假阳性的概率(假阳性的概率()很小;当得到阴性结果)很小;当得到阴性结果时,假阴性的概率(时,假阴性的概率()也很小。)也很小。样本量的估计必须有四个数值:样本量的估计必须有四个数值:1、希望发现的最小差异(、希望发现的最小差异(),包括均数之差、包括均数之差、率之差。率之差。2、总体标准差(、总体标准差()的估计值。)的估计值。3、检验水准(、检验水准(),一般取值),一般取值0.05。4、第、第类错误的概率(类错误的概率(),一般取),一般取0.10或或0.20。1即把握度,指发现差异的概率。即把握度,指发现差异的概率。(一)(一)样本均数与本均数与总体均数的比体均数的比较 例例1、某医师试验某种升白细胞药的疗效,、某医师试验某种升白细胞药的疗效,先以先以9例低白细胞病人做预实验,结果计算出例低白细胞病人做预实验,结果计算出用药前后白细胞差值的标准差为用药前后白细胞差值的标准差为2.5109/L,现,现要做正式临床试验,且要求白细胞平均上要做正式临床试验,且要求白细胞平均上升升1109/L才算该药临床有效,问要多少病人才算该药临床有效,问要多少病人进行正式临床试验?进行正式临床试验?o第一步公式:第一步公式:o这里:这里:=1 =2.5 t 0.05,=1.645(0.05)t 0.1,=1.28 (0.1)o代入公式:代入公式:on取取54第二步:第二步:=1 =2.5 =54-1=53 t 0.05,53=1.674 t 0.1,53=1.298on取取56o可以认为需可以认为需56个病人进行正式临床试验,才有个病人进行正式临床试验,才有90%(即(即1-)的把握发现差别。)的把握发现差别。(二)两(二)两样本均数比本均数比较例例2.在进行有两种处理的动物冠状动脉窦的在进行有两种处理的动物冠状动脉窦的血流量实验时,血流量实验时,A处理使平均血流量增加处理使平均血流量增加1.8ml/min,B处理使平均血流量增加处理使平均血流量增加2.4ml/min。设两种处理的标准差相等,均为设两种处理的标准差相等,均为1.0ml/min,=0.05,=0.10,若要得出两处理之差别有若要得出两处理之差别有统计学意义的结论,需多少实验动物?统计学意义的结论,需多少实验动物?第一步公式第一步公式:这里:这里:=2.41.8=0.6 =1 t 0.05/2,=1.96 t 0.1,=1.282代入公式:n取取59第二步:=0.6 =1 =2(59-1)=116 t 0.05/2,116=1.982 t 0.1,116 =1.289代入公式:代入公式:n1=n2=60可以认为每组需动物可以认为每组需动物60只,两只,两组共需组共需120只。只。(三)样本率与总体率的比较(大样本)(三)样本率与总体率的比较(大样本)o例例3.已知用常规疫苗对某种疾病的保护率是已知用常规疫苗对某种疾病的保护率是80%,现实验一种新型疫苗,预计有效率是,现实验一种新型疫苗,预计有效率是90%。设定。设定=0.05,=0.10,问至少需要观察多少试验对象?,问至少需要观察多少试验对象?o公式:公式:这里:这里:p0=0.8 p1=0.9=p1p00.90.8=0.1u0.05/2=1.96u0.1=1.282代入公式:代入公式:n取取169即至少需观察即至少需观察169个试验对象。个试验对象。(四)两(四)两组样本率比本率比较例例6.观察甲、乙两药对某种疾病的疗效,初步观察甲、乙两药对某种疾病的疗效,初步实验得甲药有效率为实验得甲药有效率为60%,乙药为,乙药为85%。现。现拟进一步作临床试验,设拟进一步作临床试验,设=0.05,=0.10,问每组至少需要观察多少病例?问每组至少需要观察多少病例?公式:公式:p1=0.6 p2=0.85u0.05/2,=1.96u0.1,=1.282代入公式:代入公式:n1=n2=64可以认为每组至少需要观察可以认为每组至少需要观察64例。例。简易公式易公式p1、p2为两个样本总体率的估计值=p1p2当取0.05、取0.1时,f(,)10.5当取0.05、取0.2时,f(,)8.0o代入公式(代入公式(取取0.05,取取0.1)o即每组至少应观察即每组至少应观察62例,仅比以上公式少例,仅比以上公式少2例。例。二、对照组设计问题:不设对照组或对照组分二、对照组设计问题:不设对照组或对照组分配不随机,又是当前基层医学研究中第二个配不随机,又是当前基层医学研究中第二个常见问题。常见问题。如何如何设置置对照照组o设置对照组的原则是,在施加干预前,最大设置对照组的原则是,在施加干预前,最大限度地保证对照组和试验组的所有总体特征限度地保证对照组和试验组的所有总体特征相同。相同。(一)(一)对照的形式照的形式 1、无对照:适用于药物、无对照:适用于药物、期临床试验、期临床试验、探索性预试验以及有可靠的潜在对照(如某手探索性预试验以及有可靠的潜在对照(如某手术无成功先例)、形态学观察和病例个案报导。术无成功先例)、形态学观察和病例个案报导。2、标准对照:以现行公认标准作对照、标准对照:以现行公认标准作对照 3、历史对照:注意要用公认的标准值、诊断、历史对照:注意要用公认的标准值、诊断标准、指标的检测方法无变化。标准、指标的检测方法无变化。4、自身前后对照:应用此法应注意排除非处、自身前后对照:应用此法应注意排除非处理因素,如时间、处理前后的外界剌激、心理因素,如时间、处理前后的外界剌激、心理因素和环境变化的影响。理因素和环境变化的影响。5、非随机化同期对照:在受伦理学要求的限、非随机化同期对照:在受伦理学要求的限制下,有时只能采取非随机化同期对照,此制下,有时只能采取非随机化同期对照,此法缺乏可重复性。法缺乏可重复性。6、随机化同期对照:此法实验结果具可重复、随机化同期对照:此法实验结果具可重复性,性,P值具有统计学推论作用,可形成因果值具有统计学推论作用,可形成因果关系。在医学研究中应尽量用这种方法。关系。在医学研究中应尽量用这种方法。(二)随机分(二)随机分组方法方法 1、分组方法与采用的实验设计模型有关、分组方法与采用的实验设计模型有关(1)单因素模型:)单因素模型:完全随机分组设计完全随机分组设计 配对分组设计配对分组设计 随机区组设计随机区组设计(2)多因素模型:)多因素模型:其中完全随机分组与配对分组设计是最基本、其中完全随机分组与配对分组设计是最基本、最常用的方法。最常用的方法。2、完全随机分组的注意事项:、完全随机分组的注意事项:(1)不能把)不能把“随机随机”与与“随意随意”、“随便随便”和和“非非选择性选择性”相混淆。随机是统计学的一个术语,它具有一套严格相混淆。随机是统计学的一个术语,它具有一套严格的分组程序;的分组程序;(2)可利用随机数进行分组,保证随机性,同时应)可利用随机数进行分组,保证随机性,同时应对分组限定一定条件,保证组间的可比性。对分组限定一定条件,保证组间的可比性。(3)完全随机分组设计通常需要较大样本,需要正)完全随机分组设计通常需要较大样本,需要正确地估算样本量。确地估算样本量。3、配对设计与随机区组设计、配对设计与随机区组设计(1)配对设计能有效减少个体差异带来的试)配对设计能有效减少个体差异带来的试验误差,因而所需要的样本量大大减少;验误差,因而所需要的样本量大大减少;(2)配对设计中如果将)配对设计中如果将2个以上的实验单位配个以上的实验单位配成对,就构成了随机区组设计。成对,就构成了随机区组设计。(3)配对设计也可应用随机数进行排序、分)配对设计也可应用随机数进行排序、分配。配。常用的常用的对照研究形式照研究形式 1、病例、病例-对照研究(回顾性研究):对照研究(回顾性研究):选择患有和未患有某种疾病的人群分别作为病例组选择患有和未患有某种疾病的人群分别作为病例组和对照组,调查两组人群过去暴露于某种或某些可疑和对照组,调查两组人群过去暴露于某种或某些可疑危险因素的比例,了解暴露因素与疾病有无关联及其危险因素的比例,了解暴露因素与疾病有无关联及其关联程度大小的一种观察性研究。关联程度大小的一种观察性研究。应注意:所谓应注意:所谓“暴露暴露”是指接触某种因素,而这种是指接触某种因素,而这种因因素不一定是对人不利的,如暴露于某种治疗方法下,素不一定是对人不利的,如暴露于某种治疗方法下,结果是治愈或有效;暴露于疫苗接种结果是形成免疫结果是治愈或有效;暴露于疫苗接种结果是形成免疫保护。保护。o是一种由是一种由“果果”推及推及“因因”的研究方法。的研究方法。“果果”可以可以是患病,也可以是死亡、某检测阳性等其他情况。是患病,也可以是死亡、某检测阳性等其他情况。o所以病例所以病例-对照研究的分组是对照研究的分组是“病例组病例组”和和“对对照照组组”。“病例组病例组”不一定是病例,也可能是其他的不一定是病例,也可能是其他的“果果”,对照组就是没有出现这种对照组就是没有出现这种“果果”的对象。然后回的对象。然后回顾顾性地调查两组对某种或某些因素的暴露情况性地调查两组对某种或某些因素的暴露情况,比较比较两组的某因素暴露率。两组的某因素暴露率。近期使用口服避孕药(暴露)近期使用口服避孕药(暴露)合合 计计有有无无病例组病例组29(a)205(b)234(a+b)对照组对照组135(c)1607(d)1742(c+d)合合 计计164(a+c)1812(b+d)1976(a+b+c+dn)心肌梗塞与近期服用避孕药的关系心肌梗塞与近期服用避孕药的关系例如,调查心肌梗塞与使用口服避孕药的关系,例如,调查心肌梗塞与使用口服避孕药的关系,结果见下表:结果见下表:o 病例组暴露率病例组暴露率 p1a/a+b29/23412.4(%)o对照组暴露率对照组暴露率 p0c/c+d135/19766.8(%)o比值比(表示结果与某因素关联度)比值比(表示结果与某因素关联度)OR(a/b)/(c/d)ad/bc 291812/1352051.9 2 2、队列研究(前瞻性研究):列研究(前瞻性研究):o将研究将研究对象分象分为暴露暴露组和非暴露和非暴露组,随,随访一段一段时间后,比后,比较两两组或多或多组之之间研究研究结局(局(发病或病或死亡等)死亡等)发生率的差异,判断暴露因素与生率的差异,判断暴露因素与结果之果之间的关系。的关系。o这是一种由是一种由“因因”及及“果果”的研究方法。即先的研究方法。即先控制控制暴露因素,然后暴露因素,然后观察察结果的果的发生情况。一般基生情况。一般基层医院医院进行的行的对某种治某种治疗方法的方法的疗效效观察均属此察均属此类研究。研究。o此类研究将暴露于干预因素的对象作为暴露组(或试验此类研究将暴露于干预因素的对象作为暴露组(或试验组),以未暴露于干预因素的对象作为对照组,观察结组),以未暴露于干预因素的对象作为对照组,观察结果的发生情况。果的发生情况。观察结果观察结果合计合计暴露组暴露组aba+b对照组对照组cdc+d合计合计a+cb+da+b+c+d=n可以计算以下参数:可以计算以下参数:o暴露组结果发生率:暴露组结果发生率:p1a/abo对照组结果发生率:对照组结果发生率:p0c/cdo可比较两个率,如发病率、治愈率、有效率、可比较两个率,如发病率、治愈率、有效率、阳性率等等,适用于一般临床研究。阳性率等等,适用于一般临床研究。o或计算相对危险度或计算相对危险度RRp1/p0,适用于病因,适用于病因探讨。探讨。随机抽随机抽样方法方法o抽样前首先要确定抽样的框架,抽样框架必抽样前首先要确定抽样的框架,抽样框架必需是有限的总体,如某医院某时段的病例。需是有限的总体,如某医院某时段的病例。然后对抽样框架按研究需要设定附加信息,然后对抽样框架按研究需要设定附加信息,如年龄、性别、职业、住址等,这是选取抽如年龄、性别、职业、住址等,这是选取抽样方法的重要依据。样方法的重要依据。分分组方法方法1、完全随机设计、完全随机设计o将受试对象按简单随机抽样或系统抽样的方将受试对象按简单随机抽样或系统抽样的方法随机分配到各个处理组或对照组中,或分法随机分配到各个处理组或对照组中,或分别从不同总体(抽样柜架)中随机抽样进行别从不同总体(抽样柜架)中随机抽样进行研究。本中心是两组比较,也本中心是多组研究。本中心是两组比较,也本中心是多组比较。样本量可以相等,也可以不等,但不比较。样本量可以相等,也可以不等,但不宜相差太大。宜相差太大。2、配对设计、配对设计o将受试者按一定条件配成对子,然后随机分将受试者按一定条件配成对子,然后随机分到两个组中。配对条件是指有可能影响实验到两个组中。配对条件是指有可能影响实验效应的非主要因素,如性别、年龄、职业、效应的非主要因素,如性别、年龄、职业、文化等等。文化等等。3、随机区组设计、随机区组设计o也称配伍设计,是配对设计的扩展。配对设也称配伍设计,是配对设计的扩展。配对设计是计是“对子对子”,适用于两个处理组的研究。,适用于两个处理组的研究。而配伍设计中每个配伍组包含着多个条件相而配伍设计中每个配伍组包含着多个条件相同的受试对象,然后将它们随机分配到各个同的受试对象,然后将它们随机分配到各个处理组,适用于多个处理组的研究。处理组,适用于多个处理组的研究。o不管采用哪种配对方法,原则是要最大限度不管采用哪种配对方法,原则是要最大限度地保证实验组与对照组之间的均衡性(可比地保证实验组与对照组之间的均衡性(可比性)。性)。分配时尽可能用盲法,研究参与者和受试分配时尽可能用盲法,研究参与者和受试对象都不知道哪个对象分入哪个组为对象都不知道哪个对象分入哪个组为“双盲双盲法法”,仅有受试者不知道自己的分组为,仅有受试者不知道自己的分组为“单单盲法盲法”,以保证分组的随机性。,以保证分组的随机性。三、统计学分析问题:对研究资料缺乏正确的三、统计学分析问题:对研究资料缺乏正确的统计学分析,也是基层医学研究中常见的存统计学分析,也是基层医学研究中常见的存在问题。主要是不能按数据性质正确选用统在问题。主要是不能按数据性质正确选用统计学分析方法,或是对统计指标缺乏正确的计学分析方法,或是对统计指标缺乏正确的认识。认识。如何如何对数据数据资料料进行一般性行一般性统计分析分析o为了分析所得出的数据的统计学意义,医学为了分析所得出的数据的统计学意义,医学论文中常用一些统计分析,如论文中常用一些统计分析,如t检验、检验、F检验、检验、2检验等。检验等。o这些统计计算都不难,但是由于对其中的统这些统计计算都不难,但是由于对其中的统计学原理不是很明白,容易出现应用或判断计学原理不是很明白,容易出现应用或判断上的错误。上的错误。(一)(一)t t检验和和F F检验(方差分析)(方差分析)o推论两个均数的差异多用推论两个均数的差异多用t t检验是,检验是,o推论多个均数之间的差异则通常用推论多个均数之间的差异则通常用F F检验。检验。在应用它们时常见的错误有:在应用它们时常见的错误有:1 1、资料不满足应用条件:、资料不满足应用条件:应用应用t t检验和检验和F F检验的先决条件是必须是正态分检验的先决条件是必须是正态分布资料。而且平均数布资料。而且平均数X 3S(方差齐性)(方差齐性),所以,所以当遇到标准差当遇到标准差S S过大的资料时就不能应用过大的资料时就不能应用t t检验和检验和F F检验。检验。有些资料如血清效价、病人存活时间、住院天有些资料如血清效价、病人存活时间、住院天数、医疗费用、潜伏期等偏态分布资料,不能应数、医疗费用、潜伏期等偏态分布资料,不能应用这两种检验方法。用这两种检验方法。2.2.资料不料不满足条件足条件时必必须用用变量量转换转换为对数;数;改用非参数改用非参数检验方法;方法;3、配配对资料与料与团体体资料相混淆:配料相混淆:配对资料料是一种高效率的是一种高效率的资料,所以在料,所以在进行行t t检验和和F F检验时,有,有专用的用的统计量量计算公式,而不适用于算公式,而不适用于团体体资料的公式。料的公式。4、两两组以上的均数比以上的均数比较:一般我:一般我们要尽量避要尽量避免多免多组计量量资料料进行行“一一揽子比子比较”,如果的确,如果的确需需要要进行一个因素,多个水平的比行一个因素,多个水平的比较,应先做方差先做方差分析,分析,P0.05后再做各后再做各组均数的两两比均数的两两比较。如果。如果直接用直接用t t检验两两比两两比较,可能,可能产生假阳性生假阳性结果。果。5、研究目的不明确、主次不分,造成多次重研究目的不明确、主次不分,造成多次重复的复的t检验。(二)(二)2检验 2检验是是应用最广泛的一种用最广泛的一种计数数资料的假料的假设检验方方法,可用来推断二个或多个法,可用来推断二个或多个总体率或构成比之体率或构成比之间的差的差异有无异有无统计学意学意义。因而也最多被。因而也最多被误用。常用。常见有:有:1、错误应用用2检验的具体的具体类型:往往不能根据型:往往不能根据资料料类型型选择正确的正确的2检验的具体的具体类型。如二个率型。如二个率比比较应用四格表用四格表(22)2检验;多个率比;多个率比较应用用RC表表2检验;小;小样本本(n40)或四格表中有或四格表中有“0”的的 格子格子则应用用Fisher确切概率法确切概率法。2 2、处理理RCRC表表资料料时,有一个格子理,有一个格子理论频数数1 1,或理,或理论频数数5 5的格子超的格子超过1/51/5时,没,没有作相有作相邻行(列)合并行(列)合并处理。理。33、比、比较普遍的普遍的问题是是过于迷信于迷信统计学分学分析析结果,似乎只要得到果,似乎只要得到P P0.050.05或或P P0.010.01的的结果就行了。果就行了。假假设检验是建立在是建立在“无效假无效假设”(即假(即假设研究中所出研究中所出现的的差异是因差异是因为抽抽样误差造成的,两差造成的,两组资料或多料或多组资料本来是料本来是同一同一总体)的基体)的基础上,上,P0.05或或P0.01只是无效假只是无效假设成立的概率低于成立的概率低于设定的定的检验水水,按,按“大数原大数原则”我我们拒拒绝接受无效假接受无效假设而已,而已,还可能存在第可能存在第类错误(假阳性)和(假阳性)和第第类错误(假阴性)的可能。(假阴性)的可能。所以我所以我们在下在下结论时不能下得太不能下得太绝对,特,特别是是统计量很量很接近接近统计量界量界值;或抽;或抽样的随机性受到的随机性受到较大限制,只得用大限制,只得用非随机化同期非随机化同期对照照时,下,下结论时更要留有充分余地。更要留有充分余地。