欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    多层线性模型简介两水平模型精选PPT.ppt

    • 资源ID:87274986       资源大小:988KB        全文页数:76页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    多层线性模型简介两水平模型精选PPT.ppt

    关于多层线性模型简介两水平模型第1页,讲稿共76张,创作于星期日主要内容n为什么要用多层线性模型为什么要用多层线性模型?n回归分析模型回顾回归分析模型回顾n多层(多水平)数据特点多层(多水平)数据特点n什么是多层线性模型?什么是多层线性模型?nHLM发展发展nHLM数学模型数学模型nHLM常见简化模型常见简化模型n两水平模型应用举例两水平模型应用举例n应该注意的问题应该注意的问题第2页,讲稿共76张,创作于星期日回归分析模型第3页,讲稿共76张,创作于星期日回归分析模型的假设n线性(Linearity)n误差正态分布(normally distributed)n误差方差齐性(homoskedastic)n误差或观测个体之间相互独立(independent)第4页,讲稿共76张,创作于星期日什么是多层(多水平)数据?n多层(多水平)数据指的是观测数据在单位上具有嵌套的关系。如学生嵌套于班级,班级嵌套于学校等。n同一单位内的观测,具有更大的相似性。同一个班级的学生由于受相同的班级环境等因素的影响有更大的相似性。第5页,讲稿共76张,创作于星期日嵌套于背景(contextual)特征的多层数据举例n学生水平特征的观测,嵌套于班级或学校n兄弟姊妹特征的观测,嵌套于家庭n个体之间的观测嵌套于社区n个体不同时间点的重复测量嵌套于个体n病人嵌套于医院n参数的估计嵌套于不同的研究(元分析,meta-analysis)第6页,讲稿共76张,创作于星期日对多层数据,我们了解什么.n随机选取两个观测,同一组内的观测之间的相似性要比不同组观测之间的相似性大;n如果回归模型不能解释所有的组间的差异(事实上传统回归不可能做到这一点),那么同一组内的观测之间的误差可能相关;n这就违背了传统回归(OLS)中关于残差相互独立的假设;n至少,传统回归分析得到的标准误的估计不正确(太小)。第7页,讲稿共76张,创作于星期日HLM数据特点n对于嵌套数据,传统回归模型的做法:(1)个体(如学生)水平上分析 问题:同一班级的学生间相互独立的假设是不合理的,同样对不同班级的学生和相同班级的学生作同一假设也是不合理的。(2)组(如学校)水平上分析 问题:丢失了班级内学生个体间的差异的信息。第8页,讲稿共76张,创作于星期日HLM数据特点n对于嵌套数据,传统回归分析的假设往往无法满足。传统的线性回归模型假设变量间存在直线关系,因变量总体上服从正态分布,方差齐性,个体间相互独立。前两个假设较易保证,但方差齐性,尤其是个体间相互独立的假设却很难满足。第9页,讲稿共76张,创作于星期日独立性不满足带来的问题n传统回归系数估计的标准误依赖于相互独立的假设;n如果独立性的假设不满足,得到的标准误的估计往往偏小,因此所犯第一类错误的概率往往偏大。第10页,讲稿共76张,创作于星期日表1 当组内相关存在时,第一类错误限定为0.05时,实际所犯第一类错误的概率第11页,讲稿共76张,创作于星期日HLM数学模型n例如:对73个学校1905名学生进行调查,目的是考虑其刚上高中时的入学成绩与三年后高考成绩之间的关系。考虑方法:(1)如果用传统的线性回归分析,直接在学生水平上进行分析,得出入学学业成绩对高考成绩之间的一条回归直线,如下图1所示,从图1的结果可以看出,传统回归分析没有区分不同的学校之间的差异。第12页,讲稿共76张,创作于星期日图1:不考虑学校之间差异的回归直线 第13页,讲稿共76张,创作于星期日HLM数学模型n(2)如果将数据进行简单合并,用每个学校学生的平均成绩代替这个学校的成绩,直接在学校水平上估计入学成绩对高考成绩的影响,得到一条回归直线,如图2所示,这种方法忽略了不同学生之间的差异;第14页,讲稿共76张,创作于星期日图2:只考虑学校差异忽略学生差异回归直线 第15页,讲稿共76张,创作于星期日HLM数学模型n(3)如果假设不同学校入学成绩对高考成绩的回归直线截距不同,斜率相同(平均学习成绩之间存在差异),得到如图3的结果,从图中结果可以看出,不同学校学生平均高考成绩之间存在差异。第16页,讲稿共76张,创作于星期日图3:考虑不同学校平均成绩差异的回归直线第17页,讲稿共76张,创作于星期日HLM数学模型n(4)对73所学校分别做回归分析,得到如图4的结果,如图4所示,从图中结果可以看出,不同学校回归直线的截距和斜率均不同,即:不同学校学生平均高考成绩之间存在差异,入学学业成绩对高考成绩的影响强度不同。第18页,讲稿共76张,创作于星期日图4:考虑不同学校平均成绩差异 和入学对毕业成绩影响程度差异的回归直线第19页,讲稿共76张,创作于星期日回归模型中,如何解决残差相关的问题?n希望定义一个模型,可以明确地允许因变量水平在组内和组间存在差异n例如,允许学生的学业成绩存在学校之间的差异第20页,讲稿共76张,创作于星期日告别 OLS:一个简单的多层线性模型n将n重写为:第21页,讲稿共76张,创作于星期日一个简单的多层线性模型第22页,讲稿共76张,创作于星期日一个简单的多层线性模型Outcome for observation i in unit j第23页,讲稿共76张,创作于星期日一个简单的多层线性模型Outcome for observation i in unit jIntercept 第24页,讲稿共76张,创作于星期日一个简单的多层线性模型Outcome for observation i in unit jIntercept Coefficient Value of X for observation i in unit j 第25页,讲稿共76张,创作于星期日一个简单的多层线性模型Outcome for observation i in unit jIntercept Coefficient Value of X for observation i in unit j Residual term specific to unit j 第26页,讲稿共76张,创作于星期日一个简单的多层线性模型Outcome for observation i in unit jIntercept Coefficient Value of X for observation i in unit j Residual term specific to unit j Residual term specific to observation i in unit j第27页,讲稿共76张,创作于星期日一个简单的多层线性模型Outcome for observation i in unit jIntercept Coefficient Value of X for observation i in unit j Residual term specific to unit j Residual term specific to observation i in unit j第28页,讲稿共76张,创作于星期日 uj表示什么?n残差项n定义第 j 组(第二水平)n对于第 j组的所有观测都相同n只有下标 j,没有下标 in解释:总截距和第 j组的截距之间的差异第29页,讲稿共76张,创作于星期日 rij表示什么?n残差项n定义第 j 组第i 个观测 n均值为0第30页,讲稿共76张,创作于星期日模型的特征n注意到:ij=uj+rijn我们有:Var(ij)=Var(uj+rij)=Var(uj)+Var(rij)+2*Cov(uj,rij)=Var(uj)+Var(rij)第31页,讲稿共76张,创作于星期日模型的特征n Yij 的值可能存在第二水平(组间)的差异n对于 uj和 rij没有定义其分布.n X 和 Y 之间的关系不依赖于 j(1 不依赖于 j)第32页,讲稿共76张,创作于星期日模型的另一种表达这里第33页,讲稿共76张,创作于星期日多层线性模型n水平1(如:学生)n水平2(如:学校)jju0000+=Yij-第j个学校的第i个学生jju1101+=第34页,讲稿共76张,创作于星期日何谓多层线性模型?n多层线性模型又称为:n多水平分析(Multilevel Analysis)n混合模型(Mixed Models)n随机系数模型(Random Coefficient Models)第35页,讲稿共76张,创作于星期日HLM的发展 快速发展与应用 HLM(Bryk,Randenbush,SeltzerCongdon,1988);Mlwin(Rabash,ProsserGoldstein,1989);VARCL(Longford,1988);MPLUS(Muthen,1992);SAS,SPSS第36页,讲稿共76张,创作于星期日多层线性模型n回归模型的一种n常用来回答背景变量(如班级环境等)与个体变量(如学生特征)之间的关系n常用来估计组内(如班级内)和组间(如班级间)变量间的关系 以及跨水平的交互作用。n例如,学校组织气氛对学生学业成绩的影响;学校组织气氛与学生社会经济地位的交互作用。第37页,讲稿共76张,创作于星期日多层线性模型简介n多层线性模型一种处理嵌套数据的统计方法。通过定义不同水平(层)的模型,将随机变异分解为两个部分,其一是第一水平个体间差异带来的误差,另一个是第二水平班级的差异带来的误差。可以假设第一水平个体间的测量误差相互独立,第二水平班级带来的误差在不同班级之间相互独立。多水平分析法同时考虑到不同水平的变异。第38页,讲稿共76张,创作于星期日多层线性模型n多层分析方法提供了解决嵌套数据关系的合理的正确的统计方法。下面结合上面提到的例子,介绍两水平模型的一般数学表示:第39页,讲稿共76张,创作于星期日多层线性模型n水平1(如:学生)n水平2(如:学校)jjjuW001000+=Yij-第j个学校的第i个学生第40页,讲稿共76张,创作于星期日多层线性模型n合并模型:其中:yij表示因变量(如三年后的高考成绩),xij表示第一水平(学生)的预测变量,Wj表示第二水平(学校)的预测变量。第41页,讲稿共76张,创作于星期日多层线性模型n模型的假设条件为:第42页,讲稿共76张,创作于星期日多层线性模型截距与斜率之间的相关系数:n截距与斜率之间的相关系数大小表示了不同学校平均高考成绩与入学成绩对高考成绩影响强度之间的关系,如果相关系数大于零,表示平均成绩越高,入学成绩对期末成绩的影响越大。第43页,讲稿共76张,创作于星期日HLM常用模型类型n随机效应一元方差分析模型(one-way Anova with Random Effect)第一水平:第二水平:合并模型:ijojijeuY+=00第44页,讲稿共76张,创作于星期日HLM常用模型类型n无条件模型:模型中没任何预测变量的多层分析模型;模型表示与随机效应的方差分析模型相同。在无条件模型中:上式的相关系数描述了水平2单位内个体之间的相关(intra level 2-unit correlation),它测量了学校之间方差占总方差的比例,或者说在总的变异中由水平二解释的方差的比例。第45页,讲稿共76张,创作于星期日HLM常用模型类型n随机效应单因素协方差分析(One-way ANCOVA with Random Effects)水平1:水平2:第46页,讲稿共76张,创作于星期日HLM常用模型类型n一般的线性回归模型 n第一水平:n第二水平:第47页,讲稿共76张,创作于星期日HLM常用模型类型n随机系数回归模型(Random-Coefficients Regression Model)第一水平:第二水平:第48页,讲稿共76张,创作于星期日HLM应用举例nhsb1.sav和hsb2.sav 在水平一的数据文件hsb1.sav中,有7185个观测样本和四个第一水平的变量(不包含第二水平指标变量:学校编号ID),这四个变量所表示的含义如下:minority,学生的种族(1=少数民族,0=其他)female:学生性别(1=女,0=男)ses:学生的社经地位,由学生父母受教育程度、职业和收入合成,变量已被标准化 mathach:学生的数学学业成绩 第49页,讲稿共76张,创作于星期日HLM应用举例n数据文件hsb2.sav中包含有160个学校,每个学校测量了六个学校水平的变量(不包含学校指标变量ID)。nsize:学校招生人数nsector:学校类型(1=天主教教会学校,0=公立学校)npracad:从事学术研究的学生的比例ndisclim:学校纪律环境,由量表测量得到nhimnty:学校招生少数民族学生比例描述(1=超过40%少数民族学生,0=其他)nmeanses:包含在水平1数据中,每个学校学生的平均社经地位 第50页,讲稿共76张,创作于星期日HLM应用举例 目的:分析影响学生数学成绩的学生水平变量和学校水平变量第51页,讲稿共76张,创作于星期日个体水平模型Yij=0j+1jX1ij+2jX2ij+KjXKij+rij第 j 组第 I 个个体因变量的观测值第 j个组的截距第j 组 X1 对应的斜率第j 组 X2 对应的斜率第j 组 XK 对应的斜率第52页,讲稿共76张,创作于星期日背景(Contextual)模型 Yij=0j+1jX1ij+2jX2ij+KjXKij+rij0j=00 1j=10 2j=20 Kj=K0在传统回归(OLS)模型中,截距和斜率都是固定的,即对不同的第二水平单元均相同第53页,讲稿共76张,创作于星期日背景(Contextual)影响问题n第二水平不同单元(如不同学校),截距是否相同?n能否用第二水平的协变量预测截距之间的差异?n斜率是否存在第二水平的变异?n能否用第二水平的预测变量解释斜率之间的差异?第54页,讲稿共76张,创作于星期日截距是否存在第二水平的变异?Yij =0j+1jX1ij+2jX2ij+KjXKij+rij0j=00+u0j1j=10 2j=20 Kj=K0In the random effects model,the intercept varies around some grand mean intercept(00),and the slopes are fixed they are the same in all unitsTest H0:Var(u0j)=0第55页,讲稿共76张,创作于星期日可否用第二水平的预测变量解释截距之间的差异?Yij =0j+1jX1ij+2jX2ij+KjXKij+rij0j=00+01Z1+02Z2+0MZM+u0j 1j=10 2j=20 Kj=K0Here,the Zms predict the intercept.Test H0:0m=0第56页,讲稿共76张,创作于星期日斜率是否存在第二水平的变异?Yij =0j+1jX1ij+2jX2ij+KjXKij+rij0j=00+u0j1j=10+u1j2j=20+u2jKj=K0+uKjThe intercept and each of the slopes varies around their grand means(the k0s)Test H0:Var(ukj)=0第57页,讲稿共76张,创作于星期日能否用第二水平的预测变量解释斜率间的差异?Yij =0j+1jX1ij+2jX2ij+KjXKij+rij0j=00+01Z1+02Z2+0MZM+u0j1j=10+11Z1+12Z2+1MZM+u1j2j=20+21Z1+22Z2+2MZM+u2jKj=K0+K1Z1+K2Z2+KMZM+uKjHere,the Zms predict the slopes.Test H0:km=0第58页,讲稿共76张,创作于星期日无条件模型第59页,讲稿共76张,创作于星期日无条件模型参数估计结果Final estimation of variance components:-Random Effect Standard Variance df Chi-square P-value Deviation Component-INTRCPT1,2.93501 8.61431 159 1660.23259 0.000 level-1,R 6.25686 39.14831-第60页,讲稿共76张,创作于星期日含有第一水平预测变量的HLM模型(随机系数模型)第61页,讲稿共76张,创作于星期日随机系数模型参数估计结果Final estimation of fixed effects(with robust standard errors)-Standard Approx.Fixed Effect Coefficient Error T-ratio d.f.P-value-For INTRCPT1,B0 INTRCPT2,G00 12.664935 0.189251 66.921 159 0.000 For SES slope,B1 INTRCPT2,G10 2.393878 0.117697 20.339 159 0.000-第62页,讲稿共76张,创作于星期日Final estimation of variance components:-Random Effect Standard Variance df Chi-square P-value Deviation Component-INTRCPT1,U0 2.19768 4.82978 159 905.26472 0.000 SES slope,U1 0.64675 0.41828 159 216.21178 0.002 level-1,R 6.06864 36.82835-第63页,讲稿共76张,创作于星期日含有第二水平预测变量的模型第64页,讲稿共76张,创作于星期日The outcome variable is MATHACH Final estimation of fixed effects(with robust standard errors)-Standard Approx.Fixed Effect Coefficient Error T-ratio d.f.P-value-For INTRCPT1,B0 INTRCPT2,G00 12.658410 0.173263 73.059 158 0.000 DISCLIM,G01 -1.128519 0.160735 -7.021 158 0.000 For SES slope,B1 INTRCPT2,G10 2.409288 0.112194 21.474 158 0.000 DISCLIM,G11 0.570615 0.123906 4.605 158 0.000-第65页,讲稿共76张,创作于星期日Final estimation of variance components:-Random Effect Standard Variance df Chi-square P-value Deviation Component-INTRCPT1,U0 1.93467 3.74295 158 730.83940 0.000 SES slope,U1 0.45491 0.20694 158 189.39572 0.045 level-1,R 6.06501 36.78432-第66页,讲稿共76张,创作于星期日三水平模型概括第67页,讲稿共76张,创作于星期日三水平模型n无条件模型 水平1(学生水平):其中:Yijk表示第k个学校第j个班级第i 个学生的学业成绩,表示第k个学校第j个班级学生的平均学业成绩,表示学生水平的随机误差,这里表示学生学业成绩与班级平均成绩的离差,假设服从正态分布,均值为零,方差为2。第68页,讲稿共76张,创作于星期日三水平模型n水平2(班级水平):第69页,讲稿共76张,创作于星期日三水平模型n水平3(学校水平):第70页,讲稿共76张,创作于星期日三水平模型第71页,讲稿共76张,创作于星期日三水平模型n条件模型:n水平1:第72页,讲稿共76张,创作于星期日三水平模型n第二水平:第73页,讲稿共76张,创作于星期日三水平模型n第三水平:kkkuZ10110110010+=第74页,讲稿共76张,创作于星期日应该注意的问题n低水平预测变量的中心化注意总的中心化和组中心化(可直接体现在组内相对水平高低)n高水平样本容量n变量之间共线性问题第75页,讲稿共76张,创作于星期日感感谢谢大大家家观观看看第76页,讲稿共76张,创作于星期日

    注意事项

    本文(多层线性模型简介两水平模型精选PPT.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开