【精品】Logistic回归分析及应用精品ppt课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《【精品】Logistic回归分析及应用精品ppt课件.ppt》由会员分享,可在线阅读,更多相关《【精品】Logistic回归分析及应用精品ppt课件.ppt(76页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Logistic回归分析及应用复习多元线性回归(multiple linear regression)在在医医学学实实践践中中,常常会会遇遇到到一一个个应应变变量量与与多多个个自自变变量量数数量量关关系系的的问问题题。如如医医院院住住院院人人数数不不仅仅与与门门诊诊人人数数有有关关,而而且且可可能能与与病病床床周周转转次次数数,床床位位数数等等有有关关;儿儿童童的的身身高高不不仅仅与与遗遗传传有有关关还还与与生生活活质质量量,性性别别,地地区区,国国别别等等有有关关;人人的的体体表表面面积积与与体体重重、身高等有关。身高等有关。2 表 多元线性回归分析的数据结构实验对象 y X1 X2 X3
2、.XP 1 y1 a11 a12 a13 a1p 2 y2 a21 a22 a23 a2p 3 y3 a31 a32 a33 a3p n yn an1 an2 an3 anp 其中:y取值是服从正态分布3多元线性回归模型多元线性回归模型 通通过过实实验验测测得得含含有有p p个个自自变变量量x1,x2,x3,xpx1,x2,x3,xp及及一一个个因因变变量量y y的的n n个个观观察察对对象象值值,利利用用最最小小二二乘乘法法原理原理,建立多元线性回归模型建立多元线性回归模型:其其中中b b0 0为为截截距距,b1 b1,b2,b2 bpbp称称为为偏偏回回归归系系数数.bibi表表示示当当将
3、将其其它它p-1p-1个个变变量量的的作作用用加加以以固固定定后后,XiXi改变改变1 1个单位时个单位时Y Y将改变将改变bibi个单位个单位.4 logistic regression analysis5 表2 LogisticLogistic回归模型的数据结构实验对象 y X1 X2 X3 .XP 1 y1 a11 a12 a13 a1p 2 y2 a21 a22 a23 a2p 3 y3 a31 a32 a33 a3p n yn an1 an2 an3 anp 其中:y取值是二值或多项分类8 表3 肺癌与危险因素的调查分析例号 是否患病 性别 吸烟 年龄 地区 1 1 1 0 30 0
4、 2 1 0 1 46 1 3 0 0 0 35 1 30 0 0 0 26 1 注:是否患病中,0代表否,1代表是。性别中1代表男,0代表女,吸烟中1代表吸烟,0代表不吸烟。地区中,1代表农村,0代表城市。9 表4 配对资料(1:1)对子号 病例 对照 x1 x2 x3 x1 x2 x3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0注:X1蛋白质摄入量,取值:0,1,2,3 X2不良饮食习惯,取值:0,1,2,3 X3精神状况,取值:0,1,2 10LogisticLogistic回归回归-Logistic-Logistic
5、回归与回归与多重多重线性回归联系与区别线性回归联系与区别联系联系:用于分析多个自变量与一个因变量的关用于分析多个自变量与一个因变量的关系,目的是矫正混杂因素、筛选自变量和更系,目的是矫正混杂因素、筛选自变量和更精确地对因变量作预测等。精确地对因变量作预测等。区别区别:线性模型中因变量为连续性随机变量,线性模型中因变量为连续性随机变量,且要求呈正态分布且要求呈正态分布.Logistic.Logistic回归因变量的回归因变量的取值仅有两个,不满足正态分布。取值仅有两个,不满足正态分布。113 3、Logistic回归模型l 令令:y=1 发病(阳性、死亡、治愈等)发病(阳性、死亡、治愈等)l y
6、=0 未发病(阴性、生存、未治愈等)未发病(阴性、生存、未治愈等)l 将发病的概率记为将发病的概率记为P,它与自变量它与自变量x x1 1,x x2 2,x xp p之间的之间的Logistic回归模型为:回归模型为:l可知,不发病的概率为:可知,不发病的概率为:l 12经数学变换得:定义:为Logistic变换,即:13 4、回归系数i的意义 流行病学的常用指标优势比(odds ratio,OR)或称比数比,定义为:暴露人群发病优势与非暴露人群发病优势之比。即Xi的优势比为:14故对于样本资料OR=exp()95%置信区间为:可见 是影响因素Xi增加一个单位所引起的对数优势的增量,反映了其对
7、Y作用大小。如果要比较不同因素对Y作用大小,需要消除变量量纲的影响,为此计算标准化回归系数155.假设检验(1)回归方程的假设检验 H0:所有 H1:某个 计算统计量为:G=-2lnL,服从自由度等于n-p的 分布 (2)回归系数的假设检验 H0:H1:计算统计量为:Wald,自由度等于1。16(二)Logistic回归类型及其实例分析 1、非条件Logistic回归 当研究设计为队列研究、横断面研究或成组病例对照研究时,可以用非条件Logistic回归。17实例1 某研讨究者调查了某研讨究者调查了3030名成年人,记录名成年人,记录了同肺癌发病的有关因素情况了同肺癌发病的有关因素情况,数据见
8、表数据见表4 4。其中是否患病中。其中是否患病中,0,0代表否代表否,11代表是;性别中代表是;性别中 1 1代表男代表男,00代表女;吸烟中代表女;吸烟中 1 1代表吸烟代表吸烟,00代表不吸烟;地区中代表不吸烟;地区中,1,1代表农代表农村村,0,0代表城市。试分析各因素与肺代表城市。试分析各因素与肺癌间的关系。癌间的关系。18 表5 肺癌与危险因素的调查分析例号 是否患病 性别 吸烟 年龄 地区 1 1 1 0 30 0 2 1 0 1 46 1 3 0 0 0 35 1 30 0 0 0 26 1 注:是否患病中,0代表否,1代表是。性别中1代表男,0代表女,吸烟中1代表吸烟,0代表不
9、吸烟。地区中,1代表农村,0代表城市。19SPSS操作步骤:Analyze-Regression-Binary Logistic-Dependent框(y)-Covariates框(x1,x2,)-ok非条件Logistic回归SPSS操作步骤:202122 结果表明,性别,吸烟,年龄三个因素都与肺癌有关.由于在对某一因素进行单因素分析时没有控制其它因素的干扰,因此结果不可靠.单因素分析的结果23多因素分析的结果2425 由上最大似然估计分析知因素X2(吸烟),X3(年龄)对肺癌的发生有影响。所得的回归方程为:Logit(P)=-9.7544+2.5152X1+3.9849X2+0.1884X
10、3-1.3037X4.262.条件logistic回归分析配对设计的类型:1:1、1:m、n:m(可采用分层COX模型来拟合)。例如:某市调查三种生活因素与胃癌的关系,资料见表5。27 表6 配对资料(1:1)对子号 病例 对照 x1 x2 x3 x1 x2 x3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0注:X1蛋白质摄入量,取值:0,1,2,3 X2不良饮食习惯,取值:0,1,2,3 X3精神状况,取值:0,1,228配对Logistic回归SPSS操作步骤:Analyze-Survival-COX Regression
11、-Time框(outcome)-Status框(Status)-Define Event:Single value 1:continue-Covariates框(x1、x2、x3)-Strata框(id)-Options-at last step-ok29303132333435363、逐步Logistic回归分析(1 1)向前法)向前法(forward selection)(forward selection)开始方程中没有变量,自变量由少到多一个一个引入回归方程。按自变量对因变量的贡献(P值的大小)由小到大依次挑选,变量入选的条件是其P值小于规定进入方程的P界值Enter,缺省值 P(0.
12、05)。37(2)后退法(backward selection)开始变量都在方程中,然后按自变量因变量的贡献(P值的大小)由大到小依次剔除,变量剔除的条件是其P值小于规定的剔除标准Remove,缺省值 p(0.10)。38(3)逐步回归法逐步引入-剔除法(stepwise selection)前进前进逐步引入-剔除法 是在前进法的思想下,考虑剔除变量,因此有两个p界值Enter,Remove。39 无论是条件还是非条件Logistic回归,在多变量分析时均可以采用逐步回归方法,实现的方法是:在 model后加选项:/selection=forward、backward或stepwise再给出S
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精品 Logistic 回归 分析 应用 ppt 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内