医学科研设计2之调查设计.ppt
调调 查查 设设 计计第一节 调查研究概况一、调查研究的概念、特点与适用范围一、调查研究的概念、特点与适用范围医学研究中采用的主要方法:医学研究中采用的主要方法:l实验研究实验研究(experimental research)(experimental research)(常用)(常用)l调查研究调查研究(survey research)(survey research)(常用)(常用)观察性研究观察性研究(observational study)(observational study)l实地观察研究实地观察研究(field study)(field study)l文献研究文献研究(document studydocument study)l例例1 Doll1 Doll与与HillHill的吸烟与肺癌关系研究的吸烟与肺癌关系研究 英国的Doll与Hill于1951年开始做了一项吸烟与肺癌关系的队列研究。研究对象:英国登记注册的医生 方式:信函调查了59600个医生 调查的内容:主要围绕吸烟可致肺癌的假设,如是否吸烟、吸烟年限、吸烟种类、吸烟方式、每日吸烟量等。结果表明吸烟者比不吸烟者患肺癌的危险性增大,每日吸烟量越大患肺癌的危险性越大。两个明显的两个明显的特点特点:(1 1)只只能能“被被动动”地地观观察察吸吸烟烟者者与与不不吸吸烟烟者者的的差差异异来进行推断,而不能对人群进行随机分组;来进行推断,而不能对人群进行随机分组;(2 2)吸吸烟烟是是客客观观存存在在的的,不不能能象象做做动动物物实实验验那那样样强强迫对象接触某些物质。迫对象接触某些物质。应应用用:医医学学、社社会会学学、教教育育学学等等领领域域(人人口口普普查查、生活状况调查、市场调查、民意测验等)。生活状况调查、市场调查、民意测验等)。二、调查研究分类(一)从(一)从调查对象调查对象分:分:1.1.全面调查全面调查(overall survey)(overall survey)2.2.抽样调查抽样调查(sampling survey)(sampling survey)3.3.典型调查典型调查(typical survey)(typical survey)(二二)从调查涉及的从调查涉及的时间时间划分划分按调查时间的顺序可分为:1.回顾性调查(如病例-对照研究)2.现况调查3.前瞻性调查(如队列研究)4.历史前瞻性调查按时间的长短可分为:横断面调查和纵向调查(三三)从抽取样本的从抽取样本的方式方式分分:1.概率抽样调查(简单随机抽样、系统抽样、分层随机抽样、整群抽样)2.非概率抽样调查(偶遇抽样、判断抽样、定额抽样、雪球抽样等)(四四)按资料的按资料的来源来源分为:分为:1.初级资料调查2.次级资料调查;(五)按调查(五)按调查项目性质和分析方法项目性质和分析方法可分为:可分为:1.定性调查(qualitative research)2.定量调查(quantitative research)。l调查中选用何种方法进行调查需做出合理的设计,包括如何抽取样本、抽取多少例数、如何制定调查表、如何组织实施等均是关键问题。第二节 调查设计l调查设计:对调查研究所作的周密计划,它包括调查研究资料的收集、整理和分析全过程的统计设想和合理安排。l目的:用尽可能少的人力、物力、财力和时间,获得符合统计学要求的调查资料,得出预期的结论。l要点:调查研究目转化为拟分析的指标,再将分析指标转化为调查项目,并制订调查表进行资料的搜集、整理和分析。l完整的调查设计包括:调查计划、整理计划和分析计划一、调查计划l例例3 3:1996年,万崇华、方积乾对吸毒者的吸毒情况及其生存质量进行了调查研究。1.1.确定调查目的和指标确定调查目的和指标 l确定调查目的:明确在调查中要解决哪些问题,应取得什么样的资料,取得这些资料有什么用途等问题。l从统计学的角度,调查研究的目的可归纳为两类:从统计学的角度,调查研究的目的可归纳为两类:1.了解总体情况即参数,说明总体特征(发汞的平均含量、高血压病患病率等)2.研究事物之间的相关联系,探讨病因(健康与环境污染的关系,发病与生活习惯的关系等)l目的通过调查指标体现,调查指标要精选,要重点突出,尽量用客观性强、灵敏度高、精确性好的定量指标,少用定性指标。例例3 3的研究有的研究有两个目的:两个目的:1.一是测定吸毒者生存质量,2.另一个是推断哪些因素影响其生存质量。分析的指标主要有躯体功能、心理功能、社会功能、症状与副作用方面的得分以及总生存质量得分等。2确定调查对象和观察单位 根据研究目的确定调查的总体,划清调查总体的同质范围。调查对象要具体,明确时间、地点、人物。观察单位是组成总体或样本的个体。例3调查对象确定为1996年2月后进入昆明市戒毒所戒毒、具有小学及以上文化程度、并根据公安收容送检材料和尿液吗啡定性检查确诊为海洛因依赖者(直到调查够所需例数为止),观察单位是每个“人”。(纳入标准,排除标准)3 3确定调查方法和资料搜集方式确定调查方法和资料搜集方式 1)根据调查目的、调查对象范围和具备的调查条件来确定调查方法:现况调查方法:了解总体特征病例-对照和队列研究方法:研究事物之间相互关系和探索病因全面调查:调查的总体不大抽样调查:调查的总体太大或无限问卷调查:面对面(费人、费用),邮寄问卷调查或电话调查小组调查方法(如核心小组法、头脑风暴法):快速得到结果2)资料搜集方式:直接观察法:对于客观指标的测量、临床检查(儿童身高、体重的测量,粪便蛔虫卵检查)询问法:问话得到结果直接访问:如现场问卷调查(自填、他填)、采访、开会调查间接访问:如信访、电话访问、电子邮件访问等例3采用自填式的问卷调查方法自填式的问卷调查方法,全面调查调查者:经过相关培训昆明医学院学生承担调查表4 4拟定调查项目和调查表拟定调查项目和调查表调查项目:分析项目:直接用于计算调查指标以及考虑因素之间的交互影响所必须的内容备查项目:为了便于核查、填补和更正而设置的,通常不直接用于分析,如姓名、地址、编号等把调查项目按逻辑顺序列成表格形式供调查使用即为调查表。l表1和2分别给出了例3中两个调查表的部分项目。其中,“编号”、“填表日期”为备查项目,“您食欲怎么样”等为分析项目。样本含量估计就是在保证调查结果具有一定可靠性的前提下,确定最少的样本例数。5 5估计样本含量估计样本含量(详见相关章节)(详见相关章节)方法:经验法:根据过去研究结果总结的经验或别人研究的经验而确定调查的样本例数。查表法:根据已知的条件或确定的条件查样本例数估计表而确定样本含量。计算法:根据已知条件或确定的条件代入公式计算而确定样本含量。6制定调查的组织计划 l 调查组织计划包括组织领导、宣传动员群众、时间进度、调查人员培训、任务分工与联系、经费预算、调查表和宣传资料的印制、器材的准备等。做试点调查,以便检查和修改调查计划。二、整理计划l整理资料使原始资料系统化、条理化,便于进一步分析。l步骤:问卷接收、问卷核查、数据编码、数据录入、拟定整理表、归纳汇总等。(一)问卷接收(questionnaire receiving)l 工作要点是认真地管理好收回的问卷,并做专门的登记,记录下完成日期和回收日期,掌握每天回收的问卷数。(二)问卷核查(questionnaire checking)l资料完整性核查和逻辑检查。完整性核查:项目是否完整无缺,补填,在调查现场进行。逻辑检查:主要检查逻辑上的矛盾。(三)数据编码 给每一问答项目的每一可能答案分配一个代码事前编码(pre-coding):在问卷设计时编码事后编码(post-coding):在数据收集后编码(开放性问题和封闭性问题中的“其它”一项)(四)数据的计算机录入l采用数据库系统如FoxPro、EXCEL等,建立数据库结构后输入原始数据。l录入员培训,录入说明书,数据核查。(五)拟定整理表使调查目的和预期分析指标更加具体和明确,资料归纳汇总(六)归纳汇总按拟定的整理表,统计不同类别的分布情况。在例3的研究中,采取当场接收并核查问卷的方法。调查员等待被调查者填完后当场收回问卷,并检查有无漏项,若有,请其立即补填。当晚(调查员住戒毒所),由审核员进行交叉过录和审核,发现问题第二天立即找到被调查者核对修改。合格问卷按统一的编码录入FOXBASE数据库。第三节 常用的抽样方法在科学研究中也大多采用抽样调查,其主要原因是:(1)许多总体太大,尤其有些是无限总体,不可能对其进行全面调查。(2)抽样调查花费少,是全面调查所无法比拟的。(3)抽样调查省时省力,能迅速获取所需信息,在许多情况下,争取时间对决策者更重要。(4)有些实验检测可能是毁坏性的,不可能进行全面调查。保证总体中每一个体有同等机会被抽出来作为样本的抽样方法,称为单纯(简单)随机抽样。一、单纯随机抽样 (simple random sampling)l具体方法:将调查总体的全部观察单位编号,从而形成抽样框(sampling frame),再用抽签法或随机数字表等方法在抽样框中随机抽取部分观察单位组成样本。例4 抽样参加夏令营活动 某班有学生100人,欲抽取10人参加夏令营活动。为了体现公平性,使每个学生都有同等机会参与,采取单纯随机抽样。方法是:先将100个学生编为0-99号,然后用随机数字表,从任意一个随机数字开始(比如从第一行第一列的两位数22开始),横向(也可以纵向)依次读取10个随机数字(每个都是两位数,有相同者跳过):22、17、68、65、81、68、95、23、92、35。于是编号为这10个者被抽中。二、系统(机械)抽样 (systematic sampling)按照某种顺序给总体中的各个体编号,然后随机地抽取一个编号作为第一调查个体,其它的调查个体则按照某种确定的规则抽取。如要在1000名新生中抽取200人作样本,其抽样间隔为1000/2005;若随机抽取的第一号为2,则抽取的个体号依次为2,7,12,17,22,27,。先将总体全部个体按某种特征分成若干层,再从每一层内随机抽取一定数量的个体合起来组成样本。三、分层(分类或类型)抽样 (stratified sampling)如调查某县农村妇女下生殖道感染情况,可按乡镇分层(如好、中、差三层),在各个乡镇再随机抽样,各个乡镇可以独立分析。分层的因素一般采取方位(如东、西、南、北、中)、地貌(如山区、坝区、半山区)、行政区划(城市、乡村)、经济状况(好、中、差)等。方式:等比例分配(proportional allocation):各层中抽取的比例与该层在总体中的比例相同非等比例分配(non-proportional allocation)优点:样本具有较好的代表性,减少抽样误差;可以对不同层进行独立分析。先将总体分成若干群体,形成一个抽样框;从中随机抽取几个群体组成样本;对抽中群体的全部个体进行调查。四、整群抽样 (cluster sampling)如调查某县农村儿童贫血状况,可按乡镇分群体;再随机抽取几个乡镇;对其中的全部儿童进行调查。上面四种常用的抽样方法均是按照概率原则来抽取样本,统称为概概率率抽抽样样。可单独使用,也可几种方法联合使用。多多阶阶段段抽抽样样(multi-stage sampling):将整个抽样过程分成若干个阶段进行的抽样方法。比如首先采用单纯随机抽样方法抽出自然村,再采用等距抽样方法在村中抽出调查的个人。四种基本抽样方法比较四种基本抽样方法比较四种基本抽样方法比较四种基本抽样方法比较单纯随机抽样单纯随机抽样系统抽样系统抽样整群抽样整群抽样分层抽样分层抽样优优点点简简单单直直观观,是是其其它它抽抽样样的的基基础础;均均数数(或或比比率率)及及标标准准误误计算简便。计算简便。易理解易理解,简便易行;简便易行;易易得得到到按按比比例例分分配配的的样样本本;样样本本在在总总体体中中的的分分布布较均匀。较均匀。便便于于组组织织;节节省省经经费费;容容易易控制调查质量。控制调查质量。减少抽样误差减少抽样误差;便于对不同层采便于对不同层采用不同抽样方法;用不同抽样方法;可对不同层独立可对不同层独立进行分析。进行分析。缺缺点点例例数数较较多多时时,编编号号麻麻烦烦,实际工作中难以办到;实际工作中难以办到;当当总总体体变变异异大大时时,代代表表性性不不如如分分层层抽抽样样;样样本本分分散散,难难以以组组织织调查。调查。观观察察单单位位按按顺顺序序有有周周期期趋趋势势或或单单调调递递增增(减减)时时易易产生偏差。产生偏差。样样本本例例数数一一定定时时,抽抽样样误误差差大大于于单单纯纯随随机机抽抽样样(因因样样本本未未广广泛泛散散布布于于总总体中体中)。分分层层变变量量选选择择不不当当,层层内内变变异异较较大大,层层间间均均数数相相近近,分分层层抽抽样样就就失失去去意义。意义。适适用用范范围围是是其其它它抽抽样样方方法法的的基基础础,主主要要用用于于总总体不太大的情形。体不太大的情形。主主要要用用于于按按抽抽样样顺顺序序个个体体随随机机分分布的情形。布的情形。主主要要用用于于群群间间差差异异较较小小的的情情形。形。主主要要用用于于层层间间差差异异较较大大的的对对象。象。第四节 调查表的制定与考评一、调查表的制定l调查表是在正式调查前制作好的包括各调查项目的书面材料或电子文件材料,可以是简单的调查提纲,可以是包括很多页的完整的调查表格,也可以是标准的测定量表,统称为问卷(questionnaire)。(一)调查表的构成1.调查表的标题2.调查表说明3.被访者基本情况4.调查主要内容5.编码6.作业证明的记载(二)调查表制定步骤1.设立研究工作组2.提出调查项目,形成项目池(itempool)。3.项目筛选4.确定每个项目的提问形式和类型5.确定每个项目的回答选项6.预调查及初步考评7.修改完善(三)调查表制定中应注意的问题1.调查表说明要简单明了,打动人心调查表说明要简单明了,打动人心2.避免用不确切的词避免用不确切的词3.避免提断定性问题避免提断定性问题4.避免引导性提问避免引导性提问5.避免令被访者难堪和禁忌的敏感问题避免令被访者难堪和禁忌的敏感问题6.避免提笼统、抽象或不确切的问题避免提笼统、抽象或不确切的问题7.避免一问多答的问题避免一问多答的问题8.注意提问的顺序注意提问的顺序9.9.关于定量指标的半定量化关于定量指标的半定量化二、调查表的考评l一般从其效度、信度、可接受性等方面进行。(一)效度考评(一)效度考评l效度(validity):调查表的有效性和正确性,亦即准确度(accuracy)。l意指调查表确实测定了它打算测定的特征(而不是其它特征)以及测定的程度。l一个调查表的效度越高,说明调查表的结果越能显示其所测对象的真正特征。1内容效度内容效度(contentvalidity)l也称内在效度(intrinsicvalidity),是指调查表在多大程度上表示了所测特征的范畴。换言之,调查表是否包含足够的条目来反映所测内容。l评价主要通过经验判断进行。2结构效度结构效度(constructvalidity)l也称构思效度或特征效度(traitvalidity),说明调查表的构造是否符合有关的理论构想和框架,也就是检验调查表是否真正测量了所提出的理论构思。因而结构效度是最重要的效度指标之一。l结构效度的评价较复杂,通常用一种叫因子分析的多元统计方法来揭示众多条目之间内在的联系,看是否与理论构想一致。l3标准关联效度标准关联效度(criterion-relatedvalidity)l也称效标效度(criterionvalidity),是调查表得分与某种外部标准(效标)间的关联程度,常用测量得分与效度标准之间的相关系数表示。(二)信度考评l信度(reliability),指调查表测量结果的可靠 性、稳 定 性 和 一 致 性,亦 即 精 确 度(precision)。一般认为信度反映测量中偶然误差引起的变异程度。1重测信度(test-retestreliability)l是在一定时间间隔中运用同一调查表作重复测量所得的信度系数。也称为稳定系数,因为它说明了使用同一测量工具重复测量时个体分数的稳定性。2分半信度l前述的重测信度要对每个个体进行两次测定,这较麻烦。为此,人们更愿意采用一次性测定的评价方法,分半信度正是如此。l在一次测量后将条目分为等价的两部分,分别计算两部分的得分,并以其相关系数作为信度指标。3内部一致性信度(internalconsistentreliability)l是目前比较流行的信度评价方法,是分半信度的推广。l克朗巴赫系数:lK为整个调查表的条目数lSi2为第i个条目得分的方差,S2为整个调查表得分的方差l系数根据一次测定即可计算,使用简便,利用的信息也充分,应用广泛。(三)可接受性(acceptability)l指被测定者对调查表的接受程度。再好的调查表如果调查者不愿意接受,也难于实行。调查表的可接受性主要取决于以下几个因素:调查表具有简单性,条目少且容易理解;调查表内容为被测者所熟悉,认为有意义(与其生活及健康相关);调查表容易填写;完成调查表所需的时间较少。一般认为5-30分钟较适宜。(四)考评中的几个问题1.考评的对象与范畴2.信度与效度的关系3.考评标准l例例5 5 吸毒者生存质量测定量表的考评吸毒者生存质量测定量表的考评 l在例3的研究中,经多个步骤制定出一个含40个条目的吸毒者生存质量测定量表QOL-DA(V2.0版)。其中,躯体功能领域(PH)9条,心理功能领域(PS)9条,症状及毒副作用领域(ST)11条,社会功能领域(SO)11条。l为了对量表进行考评,在预试中对158名吸毒者的生存质量进行了测定;为考察重测信度,对每个受试者在第二天进行了重测。根据测定结果,可计算出每个条目的得分、每个领域得分以及总量表得分,并得到如下考评结果(详见文献2):(1)内内容容效效度度 本量表由有关的各方面人员参与选题及讨论,所提出的条目池反映了WHO关于生存质量的内涵及吸毒者的特殊问题,并按程序化方式筛选,具有较好的内容效度。(2)结结构构效效度度 经因子分析,全部条目可归为四个大的领域,分别代表戒断症状及毒副作用、躯体功能、心理功能和社会功能四个领域。各条目得分与其领域得分之间相关均较大(相关系数r 均在0.60以上),而与其它领域相关较小。说明量表的结构与设计时的构想相吻合,具有较好的结构效度。(3)效效标标效效度度 我们以量表SF-36为“效标”,对其中的54人同时使用两个量表测定,得到QOL-DA得分与SF-36得分的相关系数为0.71。(4)重重测测信信度度 躯体功能得分、心理功能得分、戒断症状得分、社会功能得分和总分的重测相关系数分别为0.82、0.64、0.78、0.76和0.82。(5)分半信度分半信度 按式14-1得到分半信度为r=0.95。(6)内内部部一一致致性性信信度度 按式14-2得到躯体、心理、症状和毒副作用以及社会功能四个领域的克克朗朗巴巴赫赫系数分别为0.87、0.89、0.93和0.86。(7)量量表表回回收收率率、合合格格率率、平平均均完完成成时时间间 量表回收率和合格率均为100%。平均完成时间为11分钟。综合以上评价指标,可认为该测定量表是一个较好的调查表,可以推广应用。第五节 常用调查方法一、问卷调查方法l通过问卷进行的调查统称为问卷调查。l自填问卷调查和他填问卷调查(由调查员填写)。前者包括个别发送法、集中填答法、邮寄调查法和电子邮件调查法等;后者包括当面访问法和电话询问法等。表表14-414-4几种常用的问卷调查法比较几种常用的问卷调查法比较二、敏感问题调查法l凡是涉及个人的隐私、宗教信仰、性欲、性病、黑色收入等敏感性或高度私人机密的问题,统称为敏感性问题。采取特殊的调查方法,如委婉询问法、对象转移法、假定法、随机应答技术(randomized response technique,RRT)等。三、其它调查方法l小组调查法:需要快速地知道人们对某些问题的观点和看法,或者需要征询大家的意见,集思广益迅速解决某个问题。l常用的小组调查法有:提名小组法(nominal group)、专题小组讨论(focus group discussion)、头脑风暴法(brain storming)等。特尔斐(Delphi)调查法:需要独立地、多轮地了解多方面的专家对某个(些)问题的看法 深入访谈法(in-depth interview):需要深入地了解某些案例以期获得对问题的深刻认识第六节 调查的组织实施与质量控制一、调查的组织与实施(一)调查员的挑选l调查员一般应具有诚实认真、勤奋负责、谦虚耐心等基本条件。此外,还应根据调查研究的具体情况、社区的性质、被访对象的特点等考虑调查员的挑选。l首先,尽量与访问对象的性别、年龄、职业等人口特征和社会经济特征相匹配;l其次,教育程度也是一个很重要的条件。(二)调查员的培训包括以下内容:(1)本次调查研究的计划、内容、目的、方法以及与调查项目有关的其他情况,以使调查员对该研究有一个整体性的认识。(2)抽样的基本方法。例如,如何确定访问地点、如何确定访问对象等。(3)介绍一些基本和关键的调查访问技术。例如如何自我介绍、如何取得被调查者的信任等。(4)以某个调查员为对象,进行模拟调查或访问实习。(5)讨论可能出现的问题,给出解决的办法。(6)建立相互联系、监督和管理的方法及规定,以保证正式调查工作的顺利开展。培训方法:参与式方法(participated method)角色扮演法(role-play)等。二、调查的质量控制是保证取得正确数据的前提。(一)调查误差的种类1.1.非抽样误差:非抽样误差:由各种人为因素或偶然因素造成的,涉及调查人员和调查对象等,并贯穿于设计、资料收集、整理、分析的全过程。主要包括:登记性误差,系统误差。2.2.抽样误差:抽样误差:直接影响着样本对总体的代表性,误差越大,代表性越差。抽样误差不可避免,但有一定规律,不仅易于控制,还可估计其大小。(二)调查的质量控制1.1.设计阶段设计阶段 主要有理论不完善、不严谨或设计方案脱离实际,如指标应用不当、分类不规范、调查方式方法选择不当等。l质量控制应注意从以下方面进行:必须围绕调查的任务,从实际出发,严密设计调查的总体方案。正确划分调查范围。正确选择调查指标,明确定义调查项目和调查问题。选择恰当的调查方式,保证调查质量。广泛听取各方面专家的意见,找出方案中存在的问题,及时修改。预调查。2 2资料收集、整理与分析阶段资料收集、整理与分析阶段 调查问卷的登记与编码。做到不重不漏,尽量减少差错。检查资料的完整性。检查填报的正确性。检查调查问卷的指标填写有无遗漏,是否符合要求。在数据的计算机录入时,要严格控制录入质量。条件许可的话,要由两名工作人员分头作两份输入,称为“双机输入”。设计一定的计算机程序,对已录入的数据作逻辑检查。小 结1.调查研究的特点。2.调查表的研制;3.调查表的考评;4.常用的抽样方法;5.调查方法的选择;6.调查研究中的质量控制。l例:为了解某地居民例:为了解某地居民2008年乙型肝炎患病情况,请简年乙型肝炎患病情况,请简要说明你欲设计的调查方案中:要说明你欲设计的调查方案中:l(1)估计样本含量应考虑哪些因素?这些因素如何影)估计样本含量应考虑哪些因素?这些因素如何影响样本含量的大小?响样本含量的大小?l(2)你欲采用的抽样方法和抽样方案。)你欲采用的抽样方法和抽样方案。l(3)调查应主要包括哪些内容?)调查应主要包括哪些内容?l(4)如何进行调查的质量控制?)如何进行调查的质量控制?l(5)统计分析计划。)统计分析计划。l(6)要达到研究目的的主要分析指标。)要达到研究目的的主要分析指标。