对数线性模型及SPSS操作ppt课件.pptx
《对数线性模型及SPSS操作ppt课件.pptx》由会员分享,可在线阅读,更多相关《对数线性模型及SPSS操作ppt课件.pptx(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。对数线性模型对数线性模型多项分布对数线性模型多项分布对数线性模型PoissonPoisson对数线性模型对数线性模型 “雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。2高维列联表和高维列联表和多项分布多项分布对数线性模型对数线性模型 前面例子原始数据是个三维列联表,对三维列联前面例子原始数据是个三维列联表,对三维列
2、联表的检验也类似。表的检验也类似。 但高维列联表在计算机软件的选项可有所不同,但高维列联表在计算机软件的选项可有所不同,而且可以构造一个所谓而且可以构造一个所谓(多项分布多项分布)对数线性模型对数线性模型(loglinear model)来进行分析。来进行分析。 利用对数线性模型的好处是不仅可以直接进行预利用对数线性模型的好处是不仅可以直接进行预测,而且可以增加测,而且可以增加定量变量作为模型的一部分。定量变量作为模型的一部分。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。3
3、多项分布对数线性模型多项分布对数线性模型 现在简单直观地通过二维表介绍一下对数线性模型,假定不同的行代表现在简单直观地通过二维表介绍一下对数线性模型,假定不同的行代表第一个变量的不同水平,而不同的列代表第二个变量的不同水平。第一个变量的不同水平,而不同的列代表第二个变量的不同水平。用用mij代表二维列联表第代表二维列联表第i行,第行,第j列的频数。列的频数。人们常假定这个频数可以用下面的人们常假定这个频数可以用下面的公式来确定:公式来确定:ln()ijijijm这就是所谓的这就是所谓的多项分布多项分布对数线性模型。这里对数线性模型。这里i为行变量的第为行变量的第i个水平对个水平对ln(mij)
4、的影响,而的影响,而j为列变量的第为列变量的第j个水平对个水平对ln(mij)的影响,这两个影响称的影响,这两个影响称为主效应(为主效应(main effect);ij代表随机误差。代表随机误差。 “雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。4多项分布对数线性模型多项分布对数线性模型 这个模型看上去和回归模型很象,但由于对于分布的假设不这个模型看上去和回归模型很象,但由于对于分布的假设不同,不能简单地用线性回归的方法来套用同,不能简单地用线性回归的方法来套用(和和Logis
5、tic回归类回归类似似);计算过程也很不一样。当然我们把这个留给计算机去操;计算过程也很不一样。当然我们把这个留给计算机去操心了。只要利用数据来拟合这个模型就可以得到对于参数心了。只要利用数据来拟合这个模型就可以得到对于参数m的的估计(没有意义),以及估计(没有意义),以及ai和和bj的的“估计估计”。 有了估计的参数,就可以预测出任何有了估计的参数,就可以预测出任何i,j水平组合的频数水平组合的频数mij了了(通过其对数)。(通过其对数)。 注意,这里的估计之所以打引号是因为一个变量的各个水平注意,这里的估计之所以打引号是因为一个变量的各个水平的影响是相对的的影响是相对的,因此因此,只有事先
6、固定一个参数值只有事先固定一个参数值(比如比如a1=0), ,或或者设定类似于者设定类似于S Sai=0=0这样的约束,才可能估计出各个的值。这样的约束,才可能估计出各个的值。没没有约束,则这些参数是估计不出来的。有约束,则这些参数是估计不出来的。 “雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。5多项分布对数线性模型多项分布对数线性模型 二维列联表的更完全的对数线性模型为二维列联表的更完全的对数线性模型为ln()()ijijijijm 这里的这里的()ij代表第一个变量的第代
7、表第一个变量的第i个水平和第二个变量个水平和第二个变量的第的第j个水平对个水平对ln(mij)的共同影响的共同影响(交叉效应交叉效应)。即当单独。即当单独作用时,每个变量的一个水平对作用时,每个变量的一个水平对ln(mij)的影响只有的影响只有i(或或j)大,但如果这两个变量一同影响就不仅是大,但如果这两个变量一同影响就不仅是i + j ,而,而且还多出一项。且还多出一项。 这里的交叉项的诸参数的大小也是相对的,也需要这里的交叉项的诸参数的大小也是相对的,也需要约束约束条件条件来得到其来得到其“估计估计”;涉及的变量和水平越多,约束;涉及的变量和水平越多,约束也越多。也越多。“雪亮工程是以区(
8、县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。6注意,无论你对模型假定了多少种效应,注意,无论你对模型假定了多少种效应,并并不见得都有意义不见得都有意义;有些可能是多余的。本来;有些可能是多余的。本来没有交叉影响,但如果写入,也没有关系,没有交叉影响,但如果写入,也没有关系,在分析过程中一般可以知道哪些影响是显著在分析过程中一般可以知道哪些影响是显著的,而那些是不显著的。的,而那些是不显著的。 “雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理
9、为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。Poisson分布简介分布简介 在某些固定的条件下在某些固定的条件下, 人们认为某些事件出现人们认为某些事件出现的次数服从的次数服从Poisson分布分布, 比如在某一个时间段内某比如在某一个时间段内某种疾病的发生病数种疾病的发生病数, 显微镜下的微生物数显微镜下的微生物数, 血球数血球数, 门诊病人数门诊病人数, 投保数投保数, 商店的顾客数商店的顾客数, 公共汽车到达公共汽车到达数数, 电话接通数等等电话接通数等等. 然而然而, 条件是不断变化的条件是不断变化的. 因此因此, 所涉及的所涉及的Poisson分布的参数也随着变
10、化分布的参数也随着变化.“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。8Poisson对数线性模型对数线性模型 假定哮喘发生服从假定哮喘发生服从Poisson分布;但是由于条件不同,分布;但是由于条件不同,Poisson分布的参数也应该随着条件的变化而改变。这里分布的参数也应该随着条件的变化而改变。这里的条件就是给出的性别、空气污染程度与年龄。当然,的条件就是给出的性别、空气污染程度与年龄。当然,如何影响以及这些条件影响是否显著则是我们所关心的。如何影响以及这些条件影响是否显
11、著则是我们所关心的。这个模型可以写成这个模型可以写成 这里这里为常数项,为常数项,i为性别为性别(i=1,2分别代表女性和男性分别代表女性和男性两个水平),两个水平),j为空气污染程度为空气污染程度(j=1,2,3代表低、中高代表低、中高三个污染水平),三个污染水平),x为连续变量年龄为连续变量年龄,而而为年龄前面为年龄前面的系数的系数,ij为为残差项残差项。 ln()ijijx“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 SPSS 中一共提供了对数线性模型的三个过程: G
12、eneral 过程、过程、Logit 过程过程和和Model Selection 过程过程,三者都应用对数线性模型的基本原理,但在具体的拟和方法和结果输出上有些不同,分别用于不同的研究情况。 General 过程适用于研究人员只对某些特定效应项某些特定效应项感兴趣的情况,属于证实证实性研究性研究。General 过程的另外一个特点是,分析中只考虑因素之间是否相关,不考虑谁是原因谁是结果,最后在结果解释时才由研究人员来做出判断。 如果因变量为两分类,就可以用Logit 过程提供的Logit 模型来分析。相比之下,它比另两个模型更像方差分析,明确分出了应变量和自变量明确分出了应变量和自变量,直接服
13、务于分类变量之间的因果关系。 Model Selection 过程拟合的是分层对数线性模型分层对数线性模型(Hierarchical Mode)。如果在探索性分析中研究人员只是设想若干分类变量之间可能有关系,但是并无明确假设,也没有具体分出哪个是因变量、哪个是自变量,此时比较适宜采用分层对数线性模型分析。9“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。对数线性模型- General模型 一般对数线性模型是对数线性模型中最简单的一种。 例:某医科大学附属医院用内科疗法治疗一般类
14、型胃溃病患者80 例,治愈63 例,治疗特殊类型胃溃病患者99 例,治愈31 例,试通过此资料比较用内科疗法治疗两种胃溃病病人所得的治愈率是否相同。 影响格子中频数大小的因素有两个:组别和治疗结果,根据前面的分析可知,要比较两种类型胃溃疡病的治愈率是否相同,就是分析组别和治疗结果两个因素对单元格频数的作用是否存在交互作用。10“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。可以认为用内科疗法治疗两种胃溃疡病人所得的治愈率是不同的。一般类型病人的治愈率高于特殊类型,或者可以说,治
15、愈率和组别与治疗结果两个因素有关,对单元格频数的作用存在交互作用。11“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。拟合Poisson回归模型时使用首先应当使用Weight Cases 过程,将count 指定为频数变量。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网
16、格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。结果分析:结果分析:17模型
17、迭代的基本情况:允许最大迭代次数为20 次,用于判断收敛的相对容忍度为0.001,本模型迭代4次后即成功收敛。表格下方的脚注给出了具体模型的信息:单元格内频数服从多项分布,具体的模型如下,即含交互作用项的饱含交互作用项的饱和模型和模型。abbaab)(ln“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。“雪亮工程是
18、以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。这里关心的是参数6 的估计值及假设检验结果,即两个因素的交互作用是否有意义。其参数估计值为2. 095 ,P0. 05 ,认为胃溃疡类型和治疗结果两个因素之间存在交互作用,即不同胃溃疡类型有不同的治疗率。结合具体资料可以看出,一般类型胃溃疡治愈率高于特殊类型。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 输出的分别是4 个
19、系数的协方差矩阵和相关系数矩阵。作为参照水平的参数(都赋值为0) 没有列出。 再次提醒:由于拟合的是饱和模型,故所有的残差均为0 ,因此没有输出与残差有关的图形。“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 如果选择Custom模型,分析group和result两个因素的Main effect,不包含两者的交互效应,结果会怎样?22从模型的拟和优度检验可见,无论是似然比2 还是普通的Pearson 2 , P值都是小于0.05 的,从饱和模型中去除交互项后所用的这个模型在拟
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 对数 线性 模型 SPSS 操作 ppt 课件
限制150内