多水平模型简介ppt课件.ppt
《多水平模型简介ppt课件.ppt》由会员分享,可在线阅读,更多相关《多水平模型简介ppt课件.ppt(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多水平模型简介公共卫生与家庭医学学院公共卫生与家庭医学学院 郭秀花郭秀花2011.4.25 传统的统计学分析是建立在个体测量值相传统的统计学分析是建立在个体测量值相互独立的假设上。如:多元回归模型的估互独立的假设上。如:多元回归模型的估计方法是建立在个体测量值要相互独立,计方法是建立在个体测量值要相互独立,当假设不成立时,回归模型中的各参数估当假设不成立时,回归模型中的各参数估计值的有效性和统计特征均会受到影响,计值的有效性和统计特征均会受到影响,从而最终的统计推断结论将可能偏倚。估从而最终的统计推断结论将可能偏倚。估计值的标准误会有偏差。计值的标准误会有偏差。 。多元回归数据结构多元回归数据
2、结构 Data and ExamplesChildren within families: Children with same biological parents tend to be more alike than children chosen at random from the general population. They are more alike because Genetics Environment Both实验研究:如致畸试验 层次结构:层次结构:孕鼠1子鼠m子鼠1 子鼠2。孕鼠2子鼠m子鼠1 子鼠2。子鼠m子鼠1 子鼠2。孕鼠p窝别效应窝别效应Observatio
3、nal Studies Multi-stage sampling is cost effective.1. Take random sample from population (e.g. schools).2. Take random sample from sub-population (e.g. classes).3. Take random sample from sub-population (e.g. students). 某省调查其农村居民的卫生服务某省调查其农村居民的卫生服务 随机抽取随机抽取30个乡镇,每个乡镇分别抽取个乡镇,每个乡镇分别抽取2个个行政村,每个村再随机抽取行政
4、村,每个村再随机抽取33户(家庭),对户(家庭),对每个家庭前半年内的常住人口进行问卷调查。每个家庭前半年内的常住人口进行问卷调查。 调查研究 具有明显的层次结构(乡镇具有明显的层次结构(乡镇行政村行政村户户个体);个体); 在经济水平、生活方式、生活习惯上都在经济水平、生活方式、生活习惯上都具有某种程度上的相似性或聚集性;个具有某种程度上的相似性或聚集性;个体的数据是非独立的体的数据是非独立的 。Examples of HierarchiesLongitudinal DataSame individuals measured on multiple occasions. Strong hie
5、rarchies. Much more variations between individuals than between occasions within individuals.A Hypothetical Example - Two measurement occasions 多水平模型(多水平模型(Multilevel ModelsMultilevel Models)又称随)又称随机效应模型(机效应模型(Random Effect ModelsRandom Effect Models),它是在),它是在二十世纪八十年代,由英美教育统计学家基于方二十世纪八十年代,由英美教育统计学家基
6、于方差成分分析而提出的统计模型。差成分分析而提出的统计模型。 多水平模型理论是国外近些年发展起来的处多水平模型理论是国外近些年发展起来的处理系统结构数据的多元统计方法,是将理系统结构数据的多元统计方法,是将型方差型方差分析理论与多元统计分析相结合的新技术。分析理论与多元统计分析相结合的新技术。多水平统计模型概念多水平统计模型概念Definition of Multilevel AnalysisSnijders & Bosker (1999):Multilevel analysis is a methodology forthe analysis of data with complexpatt
7、erns of variability, with a focus onnested sources of variability.多水平模型的不同称谓:多水平模型的不同称谓: 层次线性模型(层次线性模型(hierarchical linear model) 混合效应模型(混合效应模型(mixed-effects model) 混合模型(混合模型(mixed model) 这些模型或许在算法或应用领域的普及这些模型或许在算法或应用领域的普及程度上有差别,但是都是处理具有层次结构程度上有差别,但是都是处理具有层次结构的数据或非独立数据的。的数据或非独立数据的。常规数据的特征常规数据的特征: :相
8、互独立相互独立,等方差等方差由由y yi i构成的观测向量服从正态分布构成的观测向量服从正态分布具有这种结构的数据叫独立结构数据具有这种结构的数据叫独立结构数据 当应变量的协方差阵不满足对称条件(当应变量的协方差阵不满足对称条件(2 2 )时)时, ,大多为系统结构数据(大多为系统结构数据(hierarchical structure data)。)。 多水平统计模型用于研究具有层次结构或嵌套式多水平统计模型用于研究具有层次结构或嵌套式结构的数据结构的数据, ,此类数据的主要特征是反应变量的此类数据的主要特征是反应变量的分布在个体间不具备独立性分布在个体间不具备独立性, ,但存在某些范围内但存
9、在某些范围内的聚集性的聚集性, , 如分层抽样或整群抽样的数据。如分层抽样或整群抽样的数据。多水平模型主要种类多水平模型主要种类 重复测量资料的多水平模型重复测量资料的多水平模型 二分类资料的多水平模型二分类资料的多水平模型 PoissonPoisson分布资料的多水平模型分布资料的多水平模型 多水平多水平MetaMeta分析模型分析模型 多水平生存时间的统计模型多水平生存时间的统计模型 多元重复测量资料的多水平模型实例新药临床试验资料数据库变量编码新药临床试验资料数据库变量编码 指标变量变量取值医院编号hosp115患者编号no1456观察时间time13周组别group试验组1,对照组0患
10、者年龄age1875岁患者性别gender女性0,男性1疗前ESS评分ess04080 (评分高病情轻)疗前ADL评分adl0095 (评分高病情轻)疗后ESS评分ess0100疗后ADL评分adl0100新药临床试验原始资料格式新药临床试验原始资料格式医院编号患者编号组别 年龄 性别疗前疗后1周疗后2周疗后3周ESS0 ADL0 ESS1 ADL1 ESS2 ADL2 ESS3 ADL311160069 50 73 50 86 90 85 10012043176 75 82 75 84 100 90 10013161140 30 42 35 55 35 72 4514171178 80 90
11、 95 92 100 93 10015071172 75 75 75 82 82 16167180 80 93 85 100 95 二分类多水平模型实例二分类多水平模型实例 某省进行了农村贫困居民的家庭卫生服务调查。先随机抽取乡镇,每个乡镇分别抽取2个行政村,每个村再随机抽取一定数量的家庭进行调查。共调查了30个乡镇,832户贫困家庭户,共计2369名15岁及以上的居民。 现拟探讨该省农村贫困居民卫生服务需要的影响因素。 以两周是否患病作为应变量。结以两周是否患病作为应变量。结合资料的层次结构特点,采用二分合资料的层次结构特点,采用二分类多水平类多水平logistic回归模型探讨农回归模型探讨
12、农村贫困居民两周是否患病的影响因村贫困居民两周是否患病的影响因素。素。 变量赋值表(1)变量名称定义及赋值应变量两周患病 uncomfor0 否 1 是人口学特征性别 gender0 男 1 女民族 ethnic0 汉族 1 其他年龄(岁) agegroup0 15 1 45 2 65 婚姻状况 marriage0 未婚 1 已婚 2 离婚 3 丧偶文化程度 edu0 文盲半文盲 1 小学 2 初中及以上职业 occupy0 非农业劳动者 1 农业劳动者 2 学生 3 离退休 4 无业、失业、半失业者医疗保险 insure0 无 1 有变量赋值表(2)健康相关因素健康相关因素自身健康状况评价自
13、身健康状况评价 self_assess hea_stat0 好好 1 中中 2 差差吸烟吸烟 smoke0 否否 1 吸吸饮酒饮酒 drink0 否、少量否、少量 1 经常饮经常饮家庭一般情况家庭一般情况家庭饮水类型家庭饮水类型 water0 自来水自来水 1 非自来水非自来水家庭户厕类型家庭户厕类型 bathroom0 卫生厕所卫生厕所 1 非卫生厕所非卫生厕所易得的最快方式去最近医疗点易得的最快方式去最近医疗点时间时间(分钟分钟) tim_hosp年人均收入年人均收入(元元) income0 637 1 6381000变量赋值表(变量赋值表(3)乡镇特征乡镇特征乡镇地理地貌乡镇地理地貌 g
14、eography0 山区山区 1 非山区非山区个体水平个体水平id户水平户水平family乡镇水平乡镇水平rural家庭人均居住面积和乡镇人均可耕地面积以连续性变量形式中心家庭人均居住面积和乡镇人均可耕地面积以连续性变量形式中心化之后纳入模型;化之后纳入模型;无序多分类变量婚姻状况和职业以哑元形式纳入;无序多分类变量婚姻状况和职业以哑元形式纳入;有序多分类变量年龄、文化程度和自身健康状况评价,是以分组有序多分类变量年龄、文化程度和自身健康状况评价,是以分组线性变量或哑元的形式纳入,依据似然比检验结果加以判断。线性变量或哑元的形式纳入,依据似然比检验结果加以判断。 哑变量名定义哑变量名定义 ag
15、e1:45,age2:65 ; marriage1:已婚,marriage2:离婚, marriage3:丧偶; education1:小学,education2:初中及以上; occupation1:农业劳动者,occupation2:学生, occupation3:离退休 occupation4:无业、失业、半失业 多水平多水平Poisson回归模型实例回归模型实例Poisson回归(Poisson regression) 单位时间、面积、空间内某事件发生数(count)的影响因素的分析 对于以人群为基础的稀有疾病发病率、卫生事件资料的分析例 收集英格兰和威尔士收集英格兰和威尔士15个地区
16、个地区1959至至1991年按年龄、性别分组的逐年人口年按年龄、性别分组的逐年人口数和肺癌死亡人数。数和肺癌死亡人数。 肺癌死亡资料数据库变量肺癌死亡资料数据库变量编码编码指标变量变量取值年份Year year=年份年份1959-1991地区region115年龄ageage=0,年龄,年龄50岁;岁;age=1,年龄,年龄50岁岁性别gendergender=0,女性;,女性; gender=1,男性,男性年观察人口数 population年肺癌死亡数death资料特点 两水平层次结构 地区(水平2单位) 15 各地区内逐年重复观察(水平1单位) 1980 资料按性别、年龄分组 反应变量是肺
17、癌死亡人数 定性反应变量的多水平模型定性反应变量的多水平模型重点:二分类反应变量的两水平模型重点:二分类反应变量的两水平模型 某省调查其农村居民的卫生服务某省调查其农村居民的卫生服务 随机抽取30个乡镇,每个乡镇分别抽取2个行政村,每个村再随机抽取33户(家庭),对每个家庭前半年内的常住人口进行问卷调查。 具有明显的层次结构层次结构(乡镇 行政村 户 个体) ; 在经济水平、生活方式、生活习惯上都具有某种程度上的相似性或聚集性 ;个体的数据是非独非独立立的 。固定效应和随机效应固定效应和随机效应 固定效应:某研究中有多个不同的处理因素,固定效应:某研究中有多个不同的处理因素,若研究者感兴趣的各
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 水平 模型 简介 ppt 课件
限制150内