对数线性模型及SPSS操作说课讲解.ppt
《对数线性模型及SPSS操作说课讲解.ppt》由会员分享,可在线阅读,更多相关《对数线性模型及SPSS操作说课讲解.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、对数线性模型及SPSS操作1多项分布对数线性模型多项分布对数线性模型现现在在简单简单直直观观地通地通过过二二维维表介表介绍绍一下一下对对数数线线性模型,假定不同的行代表性模型,假定不同的行代表第一个第一个变变量的不同水平,而不同的列代表第二个量的不同水平,而不同的列代表第二个变变量的不同水平。量的不同水平。用用mij代表二代表二维维列列联联表第表第i行,第行,第j列的列的频频数。数。人人们们常假定常假定这这个个频频数可以用下面的数可以用下面的公式来确定:公式来确定:这这就是所就是所谓谓的的多多项项分布分布对对数数线线性模型。性模型。这这里里i为为行行变变量的第量的第i个水平个水平对对ln(mi
2、j)的影响,而的影响,而j为为列列变变量的第量的第j个水平个水平对对ln(mij)的影响,的影响,这这两个影响称两个影响称为为主效主效应应(main effect);ij代表随机代表随机误误差。差。2多项分布对数线性模型多项分布对数线性模型这这个模型看上去和回个模型看上去和回归归模型很象,但由于模型很象,但由于对对于分布的假于分布的假设设不同,不同,不能不能简单简单地用地用线线性回性回归归的方法来套用的方法来套用(和和Logistic回回归类归类似似);计计算算过过程也很不一程也很不一样样。当然我。当然我们们把把这这个留个留给计给计算机去操心了。只算机去操心了。只要利用数据来要利用数据来拟拟合
3、合这这个模型就可以得到个模型就可以得到对对于参数于参数m的估的估计计(没(没有意有意义义),以及),以及ai和和bj的的“估估计计”。有了估有了估计计的参数,就可以的参数,就可以预测预测出任何出任何i,j水平水平组组合的合的频频数数mij了了(通(通过过其其对对数)。数)。注意,注意,这这里的估里的估计计之所以打引号是因之所以打引号是因为为一个一个变变量的各个水平的量的各个水平的影响是相影响是相对对的的,因此因此,只有事先固定一个参数只有事先固定一个参数值值(比如比如a1=0),或者或者设定类似于设定类似于S Sai=0=0这样的约束,才可能估计出各个的值。这样的约束,才可能估计出各个的值。没
4、有没有约束,则这些参数是估计不出来的。约束,则这些参数是估计不出来的。3多项分布对数线性模型多项分布对数线性模型二维列联表的更完全的对数线性模型为二维列联表的更完全的对数线性模型为这这里的里的()ij代表第一个代表第一个变变量的第量的第i个水平和第二个个水平和第二个变变量量的第的第j个水平个水平对对ln(mij)的共同影响的共同影响(交叉效交叉效应应)。即当。即当单单独独作用作用时时,每个,每个变变量的一个水平量的一个水平对对ln(mij)的影响只有的影响只有i(或或j)大,但如果大,但如果这这两个两个变变量一同影响就不量一同影响就不仅仅是是i+j,而,而且且还还多出一多出一项项。这这里的交叉
5、里的交叉项项的的诸诸参数的大小也是相参数的大小也是相对对的,也需要的,也需要约约束束条件条件来得到其来得到其“估估计计”;涉及的;涉及的变变量和水平越多,量和水平越多,约约束也束也越多。越多。4注意,无论你对模型假定了多少种效应,注意,无论你对模型假定了多少种效应,并并不见得都有意义不见得都有意义;有些可能是多余的。本来;有些可能是多余的。本来没有交叉影响,但如果写入,也没有关系,没有交叉影响,但如果写入,也没有关系,在分析过程中一般可以知道哪些影响是显著在分析过程中一般可以知道哪些影响是显著的,而那些是不显著的。的,而那些是不显著的。5Poisson分布分布简简介介 在某些固定的条件下在某些
6、固定的条件下,人人们认为们认为某些事件出某些事件出现现的次数服从的次数服从Poisson分布分布,比如在某一个比如在某一个时间时间段内某段内某种疾病的种疾病的发发生病数生病数,显显微微镜镜下的微生物数下的微生物数,血球数血球数,门诊门诊病人数病人数,投保数投保数,商店的商店的顾顾客数客数,公共汽公共汽车车到达到达数数,电话电话接通数等等接通数等等.然而然而,条件是不断条件是不断变变化的化的.因此因此,所涉及的所涉及的Poisson分布的参数也随着分布的参数也随着变变化化.Poisson对对数数线线性模型性模型假假定定哮哮喘喘发发生生服服从从Poisson分分布布;但但是是由由于于条条件件不不同
7、同,Poisson分分布布的的参参数数也也应应该该随随着着条条件件的的变变化化而而改改变变。这这里里的的条条件件就就是是给给出出的的性性别别、空空气气污污染染程程度度与与年年龄龄。当当然然,如如何何影影响响以以及及这这些些条条件件影影响响是是否否显显著著则则是是我我们们所所关关心心的的。这这个模型可以写成个模型可以写成 这这里里为为常数常数项项,i为为性性别别(i=1,2分分别别代表女性和男性代表女性和男性两个水平),两个水平),j为为空气空气污污染程度染程度(j=1,2,3代表低、中高代表低、中高三个三个污污染水平),染水平),x为连续变为连续变量年量年龄龄,而而为为年年龄龄前面前面的系数的
8、系数,ij为为残差残差项项。7SPSS 中一共提供了对数线性模型的三个过程:General 过程、过程、Logit 过程过程和和Model Selection 过程过程,三者都应用对数线性模型的基本原理,但在具体的拟和方法和结果输出上有些不同,分别用于不同的研究情况。General 过程适用于研究人员只对某些特定效应项某些特定效应项感兴趣的情况,属于证实证实性研究性研究。General 过程的另外一个特点是,分析中只考虑因素之间是否相关,不考虑谁是原因谁是结果,最后在结果解释时才由研究人员来做出判断。如果因变量为两分类,就可以用Logit 过程提供的Logit 模型来分析。相比之下,它比另两个
9、模型更像方差分析,明确分出了应变量和自变量明确分出了应变量和自变量,直接服务于分类变量之间的因果关系。Model Selection 过程拟合的是分层对数线性模型分层对数线性模型(Hierarchical Mode)。如果在探索性分析中研究人员只是设想若干分类变量之间可能有关系,但是并无明确假设,也没有具体分出哪个是因变量、哪个是自变量,此时比较适宜采用分层对数线性模型分析。8对数线性模型-General模型一般对数线性模型是对数线性模型中最简单的一种。例:某医科大学附属医院用内科疗法治疗一般类型胃溃病患者80 例,治愈63 例,治疗特殊类型胃溃病患者99 例,治愈31 例,试通过此资料比较用
10、内科疗法治疗两种胃溃病病人所得的治愈率是否相同。影响格子中频数大小的因素有两个:组别和治疗结果,根据前面的分析可知,要比较两种类型胃溃疡病的治愈率是否相同,就是分析组别和治疗结果两个因素对单元格频数的作用是否存在交互作用。9可以认为用内科疗法治疗两种胃溃疡病人所得的治愈率是不同的。一般类型病人的治愈率高于特殊类型,或者可以说,治愈率和组别与治疗结果两个因素有关,对单元格频数的作用存在交互作用。10拟合Poisson回归模型时使用首先应当使用Weight Cases 过程,将count 指定为频数变量。结果分析:结果分析:模型迭代的基本情况:允许最大迭代次数为20 次,用于判断收敛的相对容忍度为
11、0.001,本模型迭代4次后即成功收敛。表格下方的脚注给出了具体模型的信息:单元格内频数服从多项分布,具体的模型如下,即含交互作用项的饱含交互作用项的饱和模型和模型。16这里关心的是参数6 的估计值及假设检验结果,即两个因素的交互作用是否有意义。其参数估计值为2.095,P0.05,认为胃溃疡类型和治疗结果两个因素之间存在交互作用,即不同胃溃疡类型有不同的治疗率。结合具体资料可以看出,一般类型胃溃疡治愈率高于特殊类型。输出的分别是4 个系数的协方差矩阵和相关系数矩阵。作为参照水平的参数(都赋值为0)没有列出。再次提醒:由于拟合的是饱和模型,故所有的残差均为0,因此没有输出与残差有关的图形。如果
12、选择Custom模型,分析group和result两个因素的Main effect,不包含两者的交互效应,结果会怎样?从模型的拟和优度检验可见,无论是似然比2 还是普通的Pearson 2,P值都是小于0.05 的,从饱和模型中去除交互项后所用的这个模型在拟合优度上和原饱和模型有统计学差异,即被去除的交互被去除的交互项实际项实际上是存在的上是存在的。也就是两变量间有关系,即不同类型胃溃疡病人的治愈率不同。这与饱和模型的分析结果是完全一致的。214 个单元格的观察频数、期望频数和校正残差的散点图矩阵散点图矩阵。上排中间的格子是指以期望频数横坐标、实际频数为纵坐标的散点图;第二排左边的散点图是以实
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 对数 线性 模型 SPSS 操作 讲解
限制150内