多水平统计模型简介操作讲稿.ppt
《多水平统计模型简介操作讲稿.ppt》由会员分享,可在线阅读,更多相关《多水平统计模型简介操作讲稿.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于多水平统计模型简介操作第一页,讲稿共五十二页哦单水平模型单水平模型1,2,.,i,.n个观察对象模型假设:正态性、独立性、残差方差齐同性 协变量的影响保持不变第二页,讲稿共五十二页哦Chongqing Medical University Peng Bin假设不满足时的处理假设不满足时的处理1.正态性不满足 数据变换,增加样本含量2.方差非齐性 增加协变量 数据变换 广义线性模型或非线性模型3.独立性不满足 S.E.的稳健估计 GEE估计方法 拟合非独立性来源的模型拟合非独立性来源的模型第三页,讲稿共五十二页哦Chongqing Medical University Peng Bin非独立
2、性来源非独立性来源1.区域环境对反应变量的影响 卫生服务区域的资源、社会经济条件和政策会影响对病人的服务质量 高血压发病率可能有地区聚集性,取决于经济文化背景和居民饮食习惯2.重复测量结果通常具有强相关 分子生物学研究中重复测量数据处理中的问题3.区组设计和多中心试验 卫生毒理实验研究中同窝动物的相似性 同中心内病人病情、病种相似性第四页,讲稿共五十二页哦 两水平层次结构数据两水平层次结构数据水平2 水平1 层次结构数据的普遍性层次结构数据的普遍性子女子女学生学生两水平层次结构:水平1单位在水平2内聚集测量测量1 1测量测量2 2测量测量3 3第五页,讲稿共五十二页哦Chongqing Med
3、ical University Peng Bin 层层次次结结构构数数据据为为一一种种非非独独立立数数据据,即即某某观观察察值值在在观观察察单单位位间间或或同同一一观观察察单单位位的的各各次次观观察察间间不不独独立立或或不不完完全全独独立立,其大小常用组内相关其大小常用组内相关(intra-class correlation,ICC)度量。度量。例例如如,来来自自同同一一家家庭庭的的子子女女,其其生生理理和和心心理理特特征征较较从从一一般般总总体体中中随随机机抽抽取取的的个个体体趋趋向向于于更更为为相相似似,即即子子女女特特征征在在家家庭庭中中具具有有相相似似性性或或聚聚集集性性(cluste
4、ring),数据是非独立的,数据是非独立的(non independent)。第六页,讲稿共五十二页哦Chongqing Medical University Peng Bin忽略多水平层次结构的后果忽略多水平层次结构的后果1.模型中的参数估计值、标准误有偏差2.残差方差偏大,即模型拟合优度差3.损失高水平(如水平二:学校)对结果的影响信息第七页,讲稿共五十二页哦经经典典模模型型的的基基本本假假定定是是单单一一水水平平和和单单一一的的随随机机误误差差项项,并并假假定定随随机机误误差差项项独独立立、服服从从方方差差为为常常量量的的正正态态分分布布,代代表表不不能能用用模模型型解解释释的的残残留留
5、的的随随机机成份成份多多水水平平模模型型将将单单一一的的随随机机误误差差项项分分解解到到与与数数据据层层次次结结构构相相应应的的各各水水平平上上,具具有有多多个个随随机机误误差差项项并并估估计计相相应应的残差方差及协方差。的残差方差及协方差。构构建建与与数数据据层层次次结结构构相相适适应应的的复复杂杂误误差差结结构构,是是多多水水平平模型区别于经典模型的根本特征模型区别于经典模型的根本特征多多水水平平模模型型由由固固定定与与随随机机两两部部分分构构成成,其其随随机机部部分可以包含解释变量分可以包含解释变量基本的多水平模型基本的多水平模型 第八页,讲稿共五十二页哦 假假定定一一个个两两水水平平的
6、的层层次次结结构构数数据据,学学校校为为水水平平 2 单单位位,学学生生为为水水平平 1 单单位位,学学校校为为相相应应总总体体的的随随机机样本。样本。多水平模型基本结构多水平模型基本结构学校1学生学生学校k学生学生观测指标:观测指标:X,Y第九页,讲稿共五十二页哦Chongqing Medical University Peng Bin普通线性回归,忽略学校普通线性回归,忽略学校第十页,讲稿共五十二页哦Chongqing Medical University Peng Bin按学校分别拟合按学校分别拟合截距不同,斜率相同截距相同,斜率不同截距不同,斜率不同第十一页,讲稿共五十二页哦Chong
7、qing Medical University Peng Bin按学校绘制散点图及拟合线该模型即为多水平模型第十二页,讲稿共五十二页哦Chongqing Medical University Peng Bin和和 分别为第分别为第 j 个学个学校中第校中第 i 个学生应变量观个学生应变量观测值和解释变量观测值测值和解释变量观测值多水平模型基本结构多水平模型基本结构第十三页,讲稿共五十二页哦Chongqing Medical University Peng Bin多水平模型基本结构多水平模型基本结构固定效应部分随机效应部分(残差项)第十四页,讲稿共五十二页哦Chongqing Medical U
8、niversity Peng Bin为为平平均均截截距距,反反映映 与与 的的平平均均关关系系,即即当当 x 取取 0 时,所有时,所有 y 的总平均估计值。的总平均估计值。为为随随机机变变量量,表表示示第第 j 个个学学校校 y 的的平平均均估估计计值值与总均数的离差值,反映了第与总均数的离差值,反映了第 j 个学校对个学校对 y 的随机效应。的随机效应。第十五页,讲稿共五十二页哦Chongqing Medical University Peng Bin 表表示示协协变变量量 x 在在所所有有学学校校的的平平均均效效应应估估计计值值(固固定定部部分分),表表示示协协变变量量 x 在在不不同同
9、学学校校所所产产生生的的特特殊殊效效应应(随随机机部部分分),反反映映协协变变量量与与学学校校之之间间产产生生的的交交互效应,即学校间互效应,即学校间 y 的变异与协变量的变异与协变量 x 的变化有关。的变化有关。第十六页,讲稿共五十二页哦 反反应应变变量量Y可可表表达达为为固固定定部部分分 与与随随机机部部分分 之之和和。模模型型具具有有多多个个残残差差项项,这这是是多多水水平模型区别于经典模型的关键部分。平模型区别于经典模型的关键部分。此此模模型型需需估估计计5个个参参数数,除除两两个个固固定定系系数数 和和 ,还还需需估估计计三三个个随随机机参参数数 和和 。其其中中 即即为为学学校校水
10、平的方差成份,水平的方差成份,为学生水平的方差成份。为学生水平的方差成份。第十七页,讲稿共五十二页哦几种常见类型几种常见类型方差成分模型方差成分模型(Variance Component Model)随机系数模型随机系数模型(Random Coefficient Model)第十八页,讲稿共五十二页哦方差成分模型方差成分模型 只是将反应变量只是将反应变量Y分解为个体差异部分和组(层)差异部分。分解为个体差异部分和组(层)差异部分。水平水平1和水平和水平2都没有预测量变,即零模型(都没有预测量变,即零模型(Null Model)或空)或空模型(模型(Empty Model)只包含固定效应的协变量
11、只包含固定效应的协变量最简单的多水平模型最简单的多水平模型第十九页,讲稿共五十二页哦Chongqing Medical University Peng Bin组内相关的度量组内相关的度量应变量方差为(可含固定效应协变量)应变量方差为(可含固定效应协变量)此即水平此即水平 2 和水平和水平 1 方差之和。方差之和。同一学校中两学生同一学校中两学生(用用i1,i2 表示表示)间的协方差为:间的协方差为:第二十页,讲稿共五十二页哦Chongqing Medical University Peng Bin组内相关组内相关(intra-class correlation,ICC)ICC测测量量了了学学校
12、校间间方方差差占占总总方方差差的的比比例例,实实际际上上它它反反映映了了学学校校内内个个体体间间相相关关,即即水水平平 1 单单位位(学生学生)在水平在水平 2 单位单位(学校学校)中的聚集性或相似性。中的聚集性或相似性。第二十一页,讲稿共五十二页哦Chongqing Medical University Peng Bin 由由于于模模型型不不止止一一个个残残差差项项,就就产产生生了了非非零零的的组组内内相相关关。若若 为为 0,表表明明数数据据不不具具层层次次结结构构,可可忽忽略略学学校校的的存存在在,即即简简化化为为传传统统的的单单水水平平模模型型;反之,若存在非零的反之,若存在非零的 ,
13、则不能忽略学校的存在。,则不能忽略学校的存在。第二十二页,讲稿共五十二页哦Chongqing Medical University Peng Bin随随机机系系数数模模型型是是指指协协变变量量的的系系数数估估计计不不是是固固定定的的而而是是随随机机的的,即即协协变变量量对对反反应应变变量量的效应在不同的水平的效应在不同的水平2 2单位间是不同的。单位间是不同的。仍仍以以学学校校与与学学生生两两水水平平数数据据结结构构说说明明随随机系数模型基本结构与假设。机系数模型基本结构与假设。随机系数模型随机系数模型(Random Coefficient Model)(Random Coefficient
14、Model)第二十三页,讲稿共五十二页哦 方差成份模型中协变量方差成份模型中协变量 的系数估计为固定的的系数估计为固定的 ,表示示协变量,表示示协变量 对反应变量的效应是固定不变的。对反应变量的效应是固定不变的。在随机系数模型中协变量在随机系数模型中协变量 的系数估计为的系数估计为 ,示每,示每个学校都有其自身的斜率估计,表明协变量个学校都有其自身的斜率估计,表明协变量 对反应对反应变量的效应在各个学校间是不同的。变量的效应在各个学校间是不同的。随机系数模型基本形式随机系数模型基本形式第一层:第一层:第二层:第二层:第二十四页,讲稿共五十二页哦 表表示示第第 j 个个学学校校的的 y 随随 x
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 水平 统计 模型 简介 操作 讲稿
限制150内