描述研究DescriptiveStudy.ppt
描述研究DescriptiveStudy Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望本章要点本章要点l描述性研究设计与实施描述性研究设计与实施l研究实例研究实例l生态学研究生态学研究2 2流行病学研究方法的分类流行病学研究方法的分类流行病学研究方法流行病学研究方法是否干预是否干预不干预不干预观察性研究观察性研究是否特别设立了对照是否特别设立了对照是否分析危险因素是否分析危险因素描述性研究描述性研究分析性研究分析性研究现况研究现况研究生态学研究生态学研究队列研究队列研究病例对照研究病例对照研究实验性研究实验性研究临床试验临床试验现场试验现场试验社区干预试验社区干预试验研究目的研究目的研究对象研究对象干预方式干预方式干预干预3 3描述性研究(描述性研究(descriptive study)又称描)又称描述流行病学述流行病学(epidemiology)利用已有的数据或对专门调查的数据,按利用已有的数据或对专门调查的数据,按不同地区、不同时间及不同人群特征分组,不同地区、不同时间及不同人群特征分组,把疾病或健康状况的情况真实地描绘、叙把疾病或健康状况的情况真实地描绘、叙述出来。述出来。典型的描述性研究典型的描述性研究现况研究现况研究生态学研究生态学研究4 4现况研究现况研究定义定义研究目的研究目的分类分类设计设计偏倚及防止偏倚及防止生态学研究生态学研究定义定义用途用途类型类型设计设计优缺点优缺点5 5第一节第一节 现况研究现况研究一、概述一、概述(一)定义(一)定义特定时间内特定时间内特定范围内的人群中特定范围内的人群中疾病、健康状况、危险因素的分布疾病、健康状况、危险因素的分布研究有关变量与疾病或健康状况的关系研究有关变量与疾病或健康状况的关系患病率研究患病率研究(prevalence study)横断面研究(横断面研究(cross-sectional study)survey6 6描述人群中一个特定时间上疾病及其影响描述人群中一个特定时间上疾病及其影响因素的一幅快照(因素的一幅快照(snapshot)或静物照片)或静物照片(stillphotograph)7 711092345678TimePrevalence=number of casestotal population=3108 81 7 234 56Time 23 1 new cases over time period population free of disease 3 per time period 7Prevalence=6/10=Incidence=or 43%9 9(二)现况研究的目的(二)现况研究的目的 1描述疾病或健康状况的分布描述疾病或健康状况的分布 2描述某因素与疾病或健康之间的关系描述某因素与疾病或健康之间的关系 3评价防制措施的效果评价防制措施的效果 4为疾病监为疾病监测或其它类型流行病学研究提供测或其它类型流行病学研究提供基础基础1010 (三三)现况研究的种类现况研究的种类普查普查1.概念:为了了解某病的患病率或健康状况,概念:为了了解某病的患病率或健康状况,于一定时间内对一定范围的人群中每一成于一定时间内对一定范围的人群中每一成员所作的调查或检查员所作的调查或检查11112.普查的目的普查的目的(1)早期发现病人)早期发现病人(2)了解疾病分布)了解疾病分布(3)了解人群健康水平)了解人群健康水平(4)建立某生理指标的正常值)建立某生理指标的正常值12123.普查的优缺点普查的优缺点(1)优点)优点确定调查对象上比较简单确定调查对象上比较简单可查出某人群中患某病的所有病人,使其得可查出某人群中患某病的所有病人,使其得到及时治疗到及时治疗开展干预如健康教育开展干预如健康教育1313(2)缺点)缺点普查对象多,调查期限短,难免漏查普查对象多,调查期限短,难免漏查调查质量不易控制调查质量不易控制患病率低,诊断技术复杂的疾病不宜患病率低,诊断技术复杂的疾病不宜进行普查进行普查1414抽样调查抽样调查1.概念概念 只调查某人群中有代表性的人只调查某人群中有代表性的人(统计学上称为样本),根据调查结果(统计学上称为样本),根据调查结果估计出人群某病的患病率或某特征的情估计出人群某病的患病率或某特征的情况况sampled popn.universesample15152.代表性(代表性(representative)的样本)的样本遵循随机化遵循随机化(randomization)原则原则样本大小样本大小(sample size)适当的原则适当的原则(1)随机化原则)随机化原则 是指整个研究人群中的是指整个研究人群中的每一个单位(可以是个人,也可以是个人的每一个单位(可以是个人,也可以是个人的集合体,如学校、连队、班级或居民委员会集合体,如学校、连队、班级或居民委员会等)被选入样本的概率相等等)被选入样本的概率相等1616(2)样本大小适当的原则样本大小适当的原则 是指样本应达到一定数量是指样本应达到一定数量样本过小时可能所抽出的样本的代表性不够样本过小时可能所抽出的样本的代表性不够样本过大不但浪费人力、物力,而且工作量样本过大不但浪费人力、物力,而且工作量过大,过大,容易因调查不够细致而造成偏倚容易因调查不够细致而造成偏倚17173.常用的随机化抽样方法常用的随机化抽样方法单纯随机抽样单纯随机抽样(simple randomized sampling)系统抽样系统抽样(systemic sampling)分层抽样分层抽样(stratified sampling)整群抽样整群抽样(cluster sampling)两级或多级抽样两级或多级抽样(multi-stage sampling)18184.样本含量估计样本含量估计(1)决定样本大小的因素)决定样本大小的因素估计样本率(估计样本均数)估计样本率(估计样本均数)总体率(总体均数)总体率(总体均数)样本均数标准差样本均数标准差显著性水平显著性水平把握度把握度1919(2)样本含量的计算)样本含量的计算1)数值变量)数值变量,numerical variable 公式中公式中n为样本含量,为样本含量,d为容许误差,即样本均数与总为容许误差,即样本均数与总体均数之差,体均数之差,s为样本标准差。为样本标准差。例:欲调查某病病人血红蛋白含量,根据以往的经验,例:欲调查某病病人血红蛋白含量,根据以往的经验,s3.0g/100ml,要求误差不超过,要求误差不超过0.5g/100ml,则,则该调查样本大小为:该调查样本大小为:t=(c-mc-m0 0)/(s/n )20202)分类变量,)分类变量,categorical variable当当a=0.05,a=0.05,容许误差容许误差d=0.1P 时时,则则 N=400Q/P 当当a=0.05,a=0.05,容许误差容许误差d=0.15P 时时,则则 N=178Q/P 当当a=0.05,a=0.05,容许误差容许误差d=0.2P时,时,则则 N=100Q/P 上式中是某病患病率,上式中是某病患病率,Q=1P,N即样本数量即样本数量 此公式适用于呈二项分布性质的资料,且患病率不此公式适用于呈二项分布性质的资料,且患病率不太大或太小的情况太大或太小的情况(p=0.2-0.8)n=k(Q/p)u=(p-p0)/PQ/n n=u2PQ/d2=4pQ/d2 2121If p0.8,Poisson distributionN=22223)患病率很低疾病的样本含量估计患病率很低疾病的样本含量估计按泊松分布期望值的可信限进行估计按泊松分布期望值的可信限进行估计例:某地的肝癌发病率估计为例:某地的肝癌发病率估计为20/10万,欲对该万,欲对该地的肝癌发生情况进行调查,问应抽多少人?地的肝癌发生情况进行调查,问应抽多少人?如果随机抽如果随机抽1万人,按估计的发病率计算,可能万人,按估计的发病率计算,可能发生发生2例病人。参考例病人。参考Poisson分布分布可信限表,期可信限表,期望值为望值为2的的90%可信限下限为可信限下限为0.355,上限为上限为6.302323这样我们就有可能见不到病例,使调查工这样我们就有可能见不到病例,使调查工作失去意义作失去意义 当当期望值为期望值为4时,时,90%可信限下限为可信限下限为1.37,即有,即有90%的机会可见到病例的机会可见到病例抽取抽取20000人可满足期望值为人可满足期望值为4的要求的要求采用整群抽样,样本量须加大,可粗定为采用整群抽样,样本量须加大,可粗定为加大简单随机抽样的样本量的加大简单随机抽样的样本量的1/2,即应抽,即应抽取取30000人人2424期望值期望值0.950.90下限下限上限上限下限下限上限上限0123450.00000.02530.2420.6191.091.623.695.577.228.7710.2411.670.00000.05130.3550.8181.371.973.004.746.307.759.1510.51PoissonPoisson分布期望值的可信限分布期望值的可信限25255.抽样调查的优缺点抽样调查的优缺点(1)优点:)优点:省时、省力、省材料和省经费省时、省力、省材料和省经费调查结果准确调查结果准确(2)缺点:)缺点:方法复杂方法复杂重复和遗漏不易发现重复和遗漏不易发现2626现况研究的局限性现况研究的局限性1.在病因分析时在病因分析时,只能对病因提出初步线索只能对病因提出初步线索,不不能得出有关病因因果关系的结论能得出有关病因因果关系的结论2.适用于病程较长的疾病,适用于病程较长的疾病,主要用于慢性病的主要用于慢性病的研究,也适用于传染病的血清流行病学研究研究,也适用于传染病的血清流行病学研究 3.现况研究现况研究一般不能获得发病率一般不能获得发病率2727优点优点1.容易实施,较短时间内即可获得结果容易实施,较短时间内即可获得结果2.从研究的程序上讲,描述性研究是流行病学从研究的程序上讲,描述性研究是流行病学研究的起点研究的起点3.是前瞻性研究的基础,连续的现况研究将提是前瞻性研究的基础,连续的现况研究将提供好的证据供好的证据28281.明确研究目的明确研究目的2.确定研究对象确定研究对象3.估计样本大小估计样本大小4.抽样的方法抽样的方法5.确定调查时间确定调查时间6.数据的收集数据的收集Exposure的选择及测量的选择及测量Outcome的选择及测量的选择及测量Endpoint outcomeIntermediate outcome调查表调查表(问卷问卷)(questionnaire)的设计的设计二二、现况研究的设计现况研究的设计VariableExposure,independent variableOutcome,dependent variable29297.数据的统计学分析数据的统计学分析人口学特征、临床特征的分析人口学特征、临床特征的分析性别性别年龄年龄教育程度教育程度SBPDBP.3030危险因素的暴露水平危险因素的暴露水平数值变量的平均水平数值变量的平均水平危险因素的流行率危险因素的流行率疾病的流行率疾病的流行率危险因素与疾病关系的分析危险因素与疾病关系的分析OR值值3131可能的统计分析方法可能的统计分析方法Univariate analysiscorrelation coefficientst-test,ANOVAChi-square testMultivariate analysisANCOVALogistic regression32328.研究的组织管理计划研究的组织管理计划3333现况研究中常见的偏倚及其防止现况研究中常见的偏倚及其防止(一)偏倚的概念(一)偏倚的概念1.误差:测得值与真实值之差误差:测得值与真实值之差(1)抽样误差)抽样误差 常用抽样方法的抽样误差由大到小依次常用抽样方法的抽样误差由大到小依次为:整群抽样、单纯随机抽样、系统抽为:整群抽样、单纯随机抽样、系统抽样、分层抽样样、分层抽样(2)系统误差)系统误差 由于某些较恒定的因素造成的测得值倾由于某些较恒定的因素造成的测得值倾向性的偏离真实值向性的偏离真实值34342.偏倚偏倚(bias)在流行病学上将系统误差称为偏倚在流行病学上将系统误差称为偏倚3535Random ErrorBias+-36363.偏倚产生的原因偏倚产生的原因(1)来自受试者)来自受试者(2)来自观察者)来自观察者(3)来自仪器)来自仪器(4)来自外环境)来自外环境3737(二)现况研究中可能发生的偏倚(二)现况研究中可能发生的偏倚1.选择偏倚选择偏倚 (1)选择性偏倚)选择性偏倚 (2)无应答偏倚)无应答偏倚 (3)幸存者偏倚)幸存者偏倚2.信息偏倚信息偏倚 (1)调查对象所引起的偏倚)调查对象所引起的偏倚 (2)调查员偏倚)调查员偏倚 (3)测量偏倚)测量偏倚3838(二)防止产生偏倚的措施(二)防止产生偏倚的措施 正确的研究设计正确的研究设计随机化随机化研究变量的选择研究变量的选择数值变量数值变量客观变量客观变量标准化方法标准化方法 3939提高研究对象的依从性提高研究对象的依从性研究对象理解研究的重要意义研究对象理解研究的重要意义研究对象从研究中获益研究对象从研究中获益某种约束机制某种约束机制-来自行政的,家庭成员的,来自行政的,家庭成员的,实验室监测实验室监测.经济补偿经济补偿培训研究人员培训研究人员严格校正仪器严格校正仪器严格实验条件及研究方法严格实验条件及研究方法4040第二节第二节 生态学研究生态学研究Ecological StudyAggregate Study4141一、定义一、定义以群体为观察和分析单位,通过描述不同以群体为观察和分析单位,通过描述不同人群中某因素的暴露情况与疾病的频率,人群中某因素的暴露情况与疾病的频率,分析该因素与疾病的关系分析该因素与疾病的关系整个人群为观察单位整个人群为观察单位测量群体的数据测量群体的数据群体水平上研究因素与疾病的关系群体水平上研究因素与疾病的关系4242暴露暴露发病发病 不发病不发病合计合计暴露暴露发病发病不发病不发病合计合计a=?b=?a+bABA+Bc=?d=?c+dCDC+D合计合计a+cb+dn合计合计A+CB+DN生态学研究生态学研究现况研究现况研究4343实例实例林县食管癌病因预防效果的考核林县食管癌病因预防效果的考核4444二、用途二、用途描述疾病的分布描述疾病的分布提供病因线索提供病因线索评价干预措施的效果评价干预措施的效果研究疾病的时间趋势研究疾病的时间趋势4545三、研究的类型三、研究的类型1.生态比较研究,生态比较研究,Ecological comparison study2.比较不同人群中疾病分布情况比较不同人群中疾病分布情况因为未包括暴露变量,称为探索性因为未包括暴露变量,称为探索性(exploratory)研究研究探讨危险因素与疾病的关系探讨危险因素与疾病的关系因为包括了暴露因素,称为分析性因为包括了暴露因素,称为分析性(analytical)研究研究4646探索性研究探索性研究4747分析性研究分析性研究4848分析性研究分析性研究49492.生态趋势研究生态趋势研究,Ecological trend study长期和连续观察疾病的危险因素及其疾长期和连续观察疾病的危险因素及其疾病的变化趋势病的变化趋势危险因素与疾病关系的动态变化规律危险因素与疾病关系的动态变化规律5050分析性研究分析性研究5151四、研究的设计四、研究的设计确定研究目的确定研究目的研究人群的选择研究人群的选择exposure的定义和测量的定义和测量outcome的测量的测量5252数据分析数据分析生态比较研究生态比较研究探索性研究探索性研究描述疾病率的地区描述疾病率的地区/人群分布图人群分布图/表表分析性研究分析性研究不同疾病率不同疾病率-危险因素暴露率危险因素暴露率/暴露水平均值的分暴露水平均值的分析析散点图散点图相关分析相关分析5353生态趋势研究生态趋势研究探索性研究探索性研究分析性研究分析性研究检验趋势检验趋势推测背后的因素推测背后的因素检验趋势检验趋势相关分析相关分析5454五、优缺点五、优缺点优点优点可以应用常规数据进行分析,节省时间和经可以应用常规数据进行分析,节省时间和经费,并且很快即可得出结果费,并且很快即可得出结果当要研究一种生物学测量指标与某种疾病的当要研究一种生物学测量指标与某种疾病的关系而需进行较长时间的前瞻性研究时,先关系而需进行较长时间的前瞻性研究时,先应用生态学研究方法进行初步研究可缩小研应用生态学研究方法进行初步研究可缩小研究风险究风险如研究血清胆固醇水平与冠心病的关系,应用巢式病例如研究血清胆固醇水平与冠心病的关系,应用巢式病例-对照研究或队列研究需随访对照研究或队列研究需随访10年,应用生态学研究方法年,应用生态学研究方法可快速得出初步结果,从而降低前瞻性研究的风险可快速得出初步结果,从而降低前瞻性研究的风险5555当个体水平的累积暴露量不易测量时,利用生态学研当个体水平的累积暴露量不易测量时,利用生态学研究可以研究暴露与疾病的关系究可以研究暴露与疾病的关系如在研究市区空气污染与肺癌的关系时,很难准确估计每个个如在研究市区空气污染与肺癌的关系时,很难准确估计每个个体吸入污染空气的量,此时可以应用生态学多组比较研究的方体吸入污染空气的量,此时可以应用生态学多组比较研究的方法来进行研究法来进行研究 食物的摄入量食物的摄入量-尤其是每日摄入量很小的食物尤其是每日摄入量很小的食物当一个人群中个体暴露变异范围不够大,或变异范围当一个人群中个体暴露变异范围不够大,或变异范围处于危险性函数曲线相对平缓的部分,则在一个人群处于危险性函数曲线相对平缓的部分,则在一个人群中(甚至在一个国家的人群范围内)某些暴露因素与中(甚至在一个国家的人群范围内)某些暴露因素与疾病的关系难以检出,而在生态学水平研究多个暴露疾病的关系难以检出,而在生态学水平研究多个暴露水平的不同人群就有可能发现这种暴露因素与疾病的水平的不同人群就有可能发现这种暴露因素与疾病的关系关系 5656缺点缺点由于缺乏个体暴露与疾病联合分布的资料,生由于缺乏个体暴露与疾病联合分布的资料,生态学研究不能在特定的个体中将暴露与疾病联态学研究不能在特定的个体中将暴露与疾病联系起来系起来 由于不能收集协变量资料,无法消除潜在的混由于不能收集协变量资料,无法消除潜在的混杂偏倚对结果的影响杂偏倚对结果的影响 不能区分暴露于疾病的时间关系,因而得不出不能区分暴露于疾病的时间关系,因而得不出因果联系因果联系5757由于生态学研究存在上述局限性,可由于生态学研究存在上述局限性,可造成生态学上的联系与真实情况并不造成生态学上的联系与真实情况并不相符,称为相符,称为“生态学谬误生态学谬误”(ecological fallacy)5858对对研研究究对对象象不不施施加加干干预预措措施施:即即在在不不改改变变研研究究对对象象的的疾疾病病状状态态、暴暴露露状状态态及及其其周周围围环环境境(自自然然及及社社会会环环境境)的的条条件件下下,观观察察疾疾病病、健健康康状状况况及及其其影影响响因因素的自然分布规律素的自然分布规律没没有有设设立立特特别别的的对对照照:在在研研究究设设计计时时不不需需要要考考虑虑设设立立特特别别的的对对照照人人群群。描描述述性性研研究究通通常常是是将将符符合合研研究究要要 求求 的的 研研 究究 对对 象象 进进 行行 普普 查查(census)或或 抽抽 样样(sampling)调调查查,在在数数据据的的分分析析时时,根根据据研研究究对对象象的的疾疾病病及及暴暴露露特特征征,自自然然产产生生出出疾疾病病与与非非疾疾病病、暴露与非暴露的对照,并进行互相比较暴露与非暴露的对照,并进行互相比较描述性研究的特点描述性研究的特点5959只能得出疾病的患病率:只能得出疾病的患病率:通过描述性研究一般不能通过描述性研究一般不能获得疾病的发病率。因为研究的时限较短,我们在获得疾病的发病率。因为研究的时限较短,我们在人群中观察到的是疾病的现症患者,人群中观察到的是疾病的现症患者,正具有某种暴正具有某种暴露特征的研究者,很少看到新发生的早期病例及新露特征的研究者,很少看到新发生的早期病例及新发生的暴露者,对慢性非传染性疾病尤其如此,所发生的暴露者,对慢性非传染性疾病尤其如此,所以不易得出发病率以不易得出发病率研研究究的的期期限限较较短短:刻刻画画人人群群中中疾疾病病及及健健康康状状况况分分布布情情况况的的瞬瞬间间或或一一段段时时间间的的特特征征,研研究究的的时时间间短短,通通常为一个时点、一天、一周或几周常为一个时点、一天、一周或几周6060不能得出因果联系:不能得出因果联系:因为在研究时暴露与疾病的因为在研究时暴露与疾病的发生是共存的,不能区别出因果的顺序发生是共存的,不能区别出因果的顺序;同时描同时描述性研究没有设立有特别的对照,所以因果联系述性研究没有设立有特别的对照,所以因果联系的论证强度较弱,不能得出因果联系,只能提供的论证强度较弱,不能得出因果联系,只能提供病因线索病因线索容易实施,较短时间内即可获得结果容易实施,较短时间内即可获得结果从研究的程序上讲,描述性研究是流行病学研究从研究的程序上讲,描述性研究是流行病学研究的起点的起点是前瞻性研究的基础,连续的现况研究将提供好是前瞻性研究的基础,连续的现况研究将提供好的证据的证据6161626263636464thanks6565调查表的内容调查表的内容第一部分,即第一部分,即一般项目一般项目l包括姓名、性别、年龄、包括姓名、性别、年龄、出生日期、出生地、出生日期、出生地、文化程度、职业、民族、工作单位、现住址文化程度、职业、民族、工作单位、现住址等。等。l主要是为了保证分析项目填写完整、正确、主要是为了保证分析项目填写完整、正确、便于核查,补填或更正而设置的,大部分不便于核查,补填或更正而设置的,大部分不直接用于分析。直接用于分析。6666第二部分,即第二部分,即调查研究项目调查研究项目l与本次调查有关的项目不能遗漏,而与与本次调查有关的项目不能遗漏,而与本次调查无关的项目则不宜列入本次调查无关的项目则不宜列入l每个调查项目都要用通俗的文字准确无每个调查项目都要用通俗的文字准确无误地表达出来误地表达出来l应尽量选用客观指标(变量)应尽量选用客观指标(变量)6767第三部分,即第三部分,即调查者部分调查者部分l调查质量的评价调查质量的评价l记录特别的情况记录特别的情况l列出列出“调查者调查者”和和“调查日期调查日期”,有助于查询和明确责任。有助于查询和明确责任。6868调查表的设计调查表的设计l开放式开放式l封闭式封闭式6969