医学统计学之科研方法 第四讲 调查设计.ppt
《医学统计学之科研方法 第四讲 调查设计.ppt》由会员分享,可在线阅读,更多相关《医学统计学之科研方法 第四讲 调查设计.ppt(89页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四讲第四讲 调查设计调查设计1调查设计的基本内容调查设计的基本内容l调查的目的与内容调查的目的与内容l调查对象与范围调查对象与范围l调查项目与指标调查项目与指标l调查单位调查单位l调查表格调查的方式调查表格调查的方式l调查的组织与培训调查的组织与培训2一、前瞻性调查一、前瞻性调查(prospectivestudy)l前瞻性调查又称前瞻性调查又称队列研究队列研究(cohort study),是从一个参考人群(队列)出发,其中一是从一个参考人群(队列)出发,其中一些人暴露于某因素,另一些人则无此暴露。些人暴露于某因素,另一些人则无此暴露。两组在研究开始时,均未患所要研究的疾两组在研究开始时,均未
2、患所要研究的疾病,跟踪观察一定时期后,根据所要研究病,跟踪观察一定时期后,根据所要研究的疾病在两组发生概率有何不同,来分析的疾病在两组发生概率有何不同,来分析暴露的因素是否为病因。队列研究是从原暴露的因素是否为病因。队列研究是从原因到结果。因到结果。3前瞻性调查前瞻性调查l设E为暴露于某因素;为未暴露于此因素。D为发生某疾病,为未发生某疾病。l现在(人群中分暴露组与非暴露组)将来(两组均有发病与未发病)4相对危险度相对危险度(relativerisk,RR)l相对危险度是暴露人群的发病率与未暴露人群发病率之比。lRR是在病因学的临床研究中,分析暴露与发病联系强度的最重要的指标。5相对危险度的意
3、义相对危险度的意义lRR=1表表示示暴暴露露人人群群发发病病率率与与未未暴暴露露人人群群相相同同,因因此此暴暴露露与与发发病病没没有有联联系系,此此暴暴露露因因素素不不可可能能是是病因。病因。lRR1表表示示暴暴露露人人群群的的发发病病率率高高于于未未暴暴露露人人群群,因因此此很很有有可可能能此此暴暴露露因因素素是是病病因因,此此暴暴露露因因素素是是危险因素。危险因素。lRR1(或RROR01OR10时时,两两因因素素有有正正交交互互作作用用,如如是是OR11OR01OR10时时,两因素有负交互作用。两因素有负交互作用。25配对的病例对照研究配对的病例对照研究 l配对是指对每一个病例,配上有相
4、似特点的一配对是指对每一个病例,配上有相似特点的一个或多个对照。认为个或多个对照。认为可能影响研究结果的许多可能影响研究结果的许多特点都可作为配对的基础特点都可作为配对的基础,如年龄、性别、种,如年龄、性别、种族、职业等。在病例对照研究中,通常病例有族、职业等。在病例对照研究中,通常病例有限,而对照很多,因此除了每个病例配上一个限,而对照很多,因此除了每个病例配上一个对照外,也可以配上一个以上的对照,例如对照外,也可以配上一个以上的对照,例如l l:2 2,1 1:3 3,1 1:4 4,一般不宜超过一般不宜超过1 1:5 5。26队列研究的优点队列研究的优点 (1)(1)可可以以了了解解暴暴
5、露露因因素素的的作作用用下下,发发生生全全部部的的变变化化过过程程,包包括括疾疾病病发发生生的的阶阶段段、发发展展速度等。速度等。(2)(2)可以估计暴露和不暴露组的发病率可以估计暴露和不暴露组的发病率 (3)(3)获得的资料是直接观察的,比较可靠。获得的资料是直接观察的,比较可靠。27队列研究的缺点队列研究的缺点 (1)(1)对发病率低的疾病,观察数量需很大。对发病率低的疾病,观察数量需很大。(2)(2)跟跟踪踪观观察察时时间间很很长长,因因此此观观察察对对象象暴暴露露情况可能发生变化。同时保持跟踪困难很大。情况可能发生变化。同时保持跟踪困难很大。(3)(3)比较费钱和费时间。比较费钱和费时
6、间。28病例对照研究的优点病例对照研究的优点 (1)(1)观察的对象比较少。观察的对象比较少。(2)(2)比较省钱和省时间。比较省钱和省时间。(3)(3)对对研研究究的的对对象象没没有有任任何何危危险险,因因为为进进行的是回顾性调查。行的是回顾性调查。(4)(4)可以分析许多危险因素。可以分析许多危险因素。29病例对照研究的缺点病例对照研究的缺点(1)(1)有有关关历历史史上上暴暴露露的的情情况况在在很很大大程程度度上上依依靠靠回回忆忆,往往往往难难以以证证实实资资料料的的可可靠靠性性和和正确性。正确性。(2)(2)无法估计暴露及未暴露两组的发病率。无法估计暴露及未暴露两组的发病率。(3)(3
7、)对于各种干扰因素的控制不易做到。对于各种干扰因素的控制不易做到。30非条件非条件Logistic回归模型回归模型 l当研究的因素或混杂因素较多时,采用分层分析当研究的因素或混杂因素较多时,采用分层分析,分分的层数将很多,每一层的样本含量就大大减少,使的层数将很多,每一层的样本含量就大大减少,使抽样误差增大,有时甚至是难于分析。采用分析多抽样误差增大,有时甚至是难于分析。采用分析多因素的因素的logistic模型将是很有效的。模型将是很有效的。l对于非配对资料可采用非条对于非配对资料可采用非条logistic模型;而对于配模型;而对于配对资料则采用是条件对资料则采用是条件logistic模型。
8、下面仅介绍非条模型。下面仅介绍非条件件Logistic模型。模型。31队列研究队列研究 l设设有有m个个因因素素(包包括括研研究究因因素素与与混混杂杂因因素素),第第i个个因因素素取取值值为为xi(xi可可以以是是计计量量的的;也也可可以以是是等等级级变变量量;也也可可以以是是二二分分类类或或多多分分类类变变量量,后后者者要经过数量化处理要经过数量化处理)。m个因素的取值用向量个因素的取值用向量X表示表示 X=(xl,x2,xm)当当m个变量取值为个变量取值为X时的发病概率为时的发病概率为P(D|X)32队列研究队列研究比数=其中x0=l,0为常数项,i称对应于xi的回归系数,均为未知参数。3
9、3与多元与多元线性回归的区别线性回归的区别lY为正态分布lY为两分类34队列研究35队列研究36估计方法的区别l多元线性回归方程,用最小二乘法lLogistic回归方程用极大似然法37病例对照研究病例对照研究 l设设从从病病例例及及对对照照人人群群总总体体中中,各各按按抽抽样样比比例例1 1及及2 2分分别别抽抽取取一一部部分分病病例例和和对对照照,组组成一个随机样本。成一个随机样本。l一个具有因素变量为的个体是病例,且一个具有因素变量为的个体是病例,且被抽到样本中的概率为被抽到样本中的概率为 l一个具有因素变量为的个体是对照,且一个具有因素变量为的个体是对照,且被抽到样本中的概率为被抽到样本
10、中的概率为 38病例对照研究病例对照研究l具有因素变量为具有因素变量为X X的个体在随机样本中是病的个体在随机样本中是病例的结果,其概率为例的结果,其概率为 而是对照的结果,其概率为而是对照的结果,其概率为39病例对照研究40OR值的估计l可得出因素变量*对于的OR的估计值41OROR值的估计值的估计l当只有Xi变化,其它不变时l当只有Xi变化,其它不变时,却Xi由0到1(或仅变化一个单位)42回归系数i的意义lexp(i):反映其他变量固定不变时,xi增加一个单位时的OR值li0,exp(i)1,说明该因素是危险因素li0,exp(i)1,说明该因素是保护因素43回归系数的解释l等级变量:一
11、般以最小等级或最大等级作为参考组,并按等级顺序依次取为0,1,2,。此时,exp(i)表示xi增加一个等级时的OR。l连续性变量:exp(i)表示xi增加1(个计量单位)时的OR。44回归系数的解释l多分类变量:指示变量x10,x20,x30 表示表示A型血型血x11,x20,x30 表示表示B型血型血x10,x21,x30 表示表示AB型血型血x10,x20,x31 表示表示O型血型血exp(1)表示表示B与与A比之比之OR;exp(2)表示表示AB与与A比之比之OR;exp(3)表示表示O与与A比之比之OR。45假设检验l似然比检验:用于模型或回归系数的检验lWald检验:用于回归系数的检
12、验lScore检验:用于回归系数的检验 统计量S 样本量较大时近似服从分布46非条件非条件LogisticLogistic回归模型回归模型全参数模型全参数模型l将全部的因素(包括研究因素和混杂因将全部的因素(包括研究因素和混杂因素)都一起引入模型,则为全参数模型,素)都一起引入模型,则为全参数模型,即要同时估计所有的未知参数即要同时估计所有的未知参数i。47非条件非条件LogisticLogistic回归模型回归模型 逐步回归模型逐步回归模型l得到的理想模型是和疾病有联系的因素都在模型得到的理想模型是和疾病有联系的因素都在模型内;而和疾病没有联系的因素都不在模型内。所内;而和疾病没有联系的因素
13、都不在模型内。所以全参数模型并不是最优的。要得到最优的模型,以全参数模型并不是最优的。要得到最优的模型,应该对每一种的因素组合,都用应该对每一种的因素组合,都用logisticlogistic模型进模型进行分析,然后对各种结果进行比较。但是这样做,行分析,然后对各种结果进行比较。但是这样做,工作量非常大为了减少计算量,同时又能得到接工作量非常大为了减少计算量,同时又能得到接近最优的结果,可以采用逐步回归方法。通常有近最优的结果,可以采用逐步回归方法。通常有前进法和后退法前进法和后退法。48病例随访研究病例随访研究 l疗效指标疗效指标 l对于急性病,疗效可在较短时期内确定,可用对于急性病,疗效可
14、在较短时期内确定,可用有效率,治愈率,病死率等指标描述。对于慢有效率,治愈率,病死率等指标描述。对于慢性病如肿瘤等,其疗效不是短期内能够确定的,性病如肿瘤等,其疗效不是短期内能够确定的,需作较长时间的随访观察,以上的疗效指标难需作较长时间的随访观察,以上的疗效指标难于应用。评价这些疾病的疗效,不仅要看疾病于应用。评价这些疾病的疗效,不仅要看疾病死亡所占的比例,还要看发生死亡所经历时间死亡所占的比例,还要看发生死亡所经历时间的长短。的长短。49病例随访研究病例随访研究l因此要以时间作为定量观测指标,即生存时间因此要以时间作为定量观测指标,即生存时间的长短是衡量慢性病疗效的重要依据。随访观的长短是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计学之科研方法 第四讲 调查设计 医学 统计学 科研 方法 第四 调查 设计
限制150内