医学统计学logistic回归.ppt





《医学统计学logistic回归.ppt》由会员分享,可在线阅读,更多相关《医学统计学logistic回归.ppt(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、卫生统计学卫生统计学统计学第十五章第十五章 多因素对某定性指标多因素对某定性指标 的影响分析的影响分析 第一节第一节 Logistic回归分析回归分析一、基本概念一、基本概念 应变量是分类变量应变量是分类变量 1 出现阳性结果出现阳性结果(发病、有效、死亡等)(发病、有效、死亡等)Y=0 出现阴性结果出现阴性结果(未发病、无效、存活等)(未发病、无效、存活等)P:Y=1的率P/(1-P)称优势(比数)0 :表示暴露剂量为:表示暴露剂量为0时个体发病与不时个体发病与不 发病概率之比的自然对数发病概率之比的自然对数 i:表示在其它自变量不变的条件下,表示在其它自变量不变的条件下,Xi改变一个单位时
2、改变一个单位时logit P=的改变量。的改变量。第第一一节节 L Lo og gi is st ti ic c回回归归分分析析 Logistic 回归的特点回归的特点1、Logistic 回归方程中,各自变量回归方程中,各自变量Xi变化范围可以从变化范围可以从-到到+,Xi 可以可以是定量指标、等级指标或定性指标是定量指标、等级指标或定性指标(需经数量化),而应变量(需经数量化),而应变量P的变化的变化范围为范围为0到到1。Z时,时,P值渐近于值渐近于1 Z-时,时,P值渐近于值渐近于02、Logistic 回归系数和流行病学中反回归系数和流行病学中反映各危险因素对疾病作用大小的优势映各危险
3、因素对疾病作用大小的优势比有直接的联系,并把单因素两水平比有直接的联系,并把单因素两水平下的优势比的定义扩展到多因素任意下的优势比的定义扩展到多因素任意取值。取值。第第一一节节 L Lo og gi is st ti ic c回回归归分分析析 设在一组自变量取值设在一组自变量取值X0 下,某下,某病发病的概率为病发病的概率为P0,而在另外一组取值,而在另外一组取值X1 下,某病发病的概率为下,某病发病的概率为P1 变量变量Xi 由由 改变为改变为 而固定其它自而固定其它自 变量取值时,有变量取值时,有ORi =exp i()ORi 1,高水平(数据大)率大高水平(数据大)率大 特别当特别当 =
4、1=1 时,时,(Xi=1为暴露,为暴露,Xi=0为非暴露)为非暴露)ORi=exp i 3、对于流行病学两类调查研究方法、对于流行病学两类调查研究方法 前瞻性的队列研究和回顾性的病例对前瞻性的队列研究和回顾性的病例对 照研究,所建立的照研究,所建立的Logistic 回归方回归方 程,除常数项不同外,其它各回归系程,除常数项不同外,其它各回归系 数均相同。数均相同。第第一一节节 L Lo og gi is st ti ic c回回归归分分析析 二、二、Logistic 回归模型的配合回归模型的配合1.应变量为二分类的应变量为二分类的Logistic 回归模型回归模型参数估计采用最大似然函数估
5、计法参数估计采用最大似然函数估计法(maximum likelihood estimate),),即根据即根据n例实际观测数据建立一个样本例实际观测数据建立一个样本的似然函数:的似然函数:第第一一节节 L Lo og gi is st ti ic c回回归归分分析析 P Pi i:i:i例暴露条件下阳性率,例暴露条件下阳性率,Y Yi i=1=1阳性,阳性,Y Yi i=0=0 阴性。若某对象阳性,阴性。若某对象阳性,用迭代方法使以下目标函数用迭代方法使以下目标函数达极大值达极大值,估计出估计出b bj j(1)AIC检验法检验法(Akaike Information Criterion)L是
6、最大似然函数,是最大似然函数,g为应变量分类变量的分为应变量分类变量的分类数,类数,k为模型中包含的自变量个数。为模型中包含的自变量个数。AIC值值越小,模型拟合越好。用于同一组数据下的不越小,模型拟合越好。用于同一组数据下的不同模型间的比较。同模型间的比较。H H0 0:H H1 1:不全为不全为0 0(含全不为(含全不为0 0)(2 2)SCSC检验法检验法(Schwarte Schwarte CriterionCriterion)式中,L是最大似然函数,g为应变量分类变量的分类数,k为模型中包含的自变量个数,n是样本例数。和AIC一样,SC值越小,模型拟合越好。用于比较同一组数据下的不同
7、模型间的比较。(3 3)似然比检验法似然比检验法 服从自由度为服从自由度为k-p的的2分布,分布,p和和k是两个模型中包含的自变量个数。是两个模型中包含的自变量个数。P,则有统计学意义。则有统计学意义。(4 4)计分检验法(计分检验法(Score)公式很复杂,它服从公式很复杂,它服从2分布,用于检验模分布,用于检验模型中全部自变量对应变量的联合作用。型中全部自变量对应变量的联合作用。(5 5)WaldWald检验法检验法H0:H1:Wald 似然比检验法最可靠。似然比检验法最可靠。Somers D、Gamma、Tau-a 和和C,越接,越接近于近于1 说明模型拟合得的越好。说明模型拟合得的越好
8、。选项选项“LACKFIT”对模型进行拟合优度检验对模型进行拟合优度检验(Goodness of fit statistics),P越大则说越大则说明模型拟合的越好。明模型拟合的越好。例例15-1.为研究病情为研究病情x1(0表示不严重,表示不严重,1表表示严重)、年龄示严重)、年龄x2(岁)及不同治疗方法(岁)及不同治疗方法x3(0表示传统疗法,表示传统疗法,1表示新疗法)对某病疗表示新疗法)对某病疗效的影响,某研究者随机抽取效的影响,某研究者随机抽取40名某病的患名某病的患者,其中有者,其中有20名患者采用传统疗法,另名患者采用传统疗法,另20名名患者采用新疗法,经过一段治疗后记录下康患者
9、采用新疗法,经过一段治疗后记录下康复的情况复的情况y(0表示未康复,表示未康复,1表示康复),作表示康复),作logistic回归分析。回归分析。data ex15_1;input y x1-x3;cards;1 0 20 0 1 0 23 0 1 0 32 0 1 0 38 0 1 1 25 0 1 0 20 1 1 0 24 1 1 0 28 11 0 30 1 1 0 32 1 1 0 38 1 1 1 26 1 1 1 29 1 1 1 34 1 1 1 33 1 1 1 38 11 1 40 1 0 0 22 0 0 0 26 0 0 0 29 0 0 0 34 0 0 0 30 0
10、 0 0 38 0 0 0 37 00 1 24 0 0 1 25 0 0 1 29 0 0 1 32 0 0 1 34 0 0 1 37 0 0 1 40 0 0 1 40 00 0 33 1 0 0 36 1 0 1 24 1 0 1 34 1 0 1 32 1 0 1 36 1 0 1 38 1 0 0 39 1;proc logistic descending simple;model y=x1-x3/stb scale=none aggregate lackfit;units x2=10;run;Response Profile Ordered Total Value y Frequ
11、ency 1 1 17 2 0 23Deviance and Pearson Goodness-of-Fit StatisticsCriterion DF Value Value/DF Pr ChiSq Testing Global Null Hypothesis:BETA=0Test Chi-Square DF Pr ChiSq Analysis of Maximum Likelihood Estimates Standard StandardizedParameter DF Estimate Error Chi-Square Pr ChiSq Estimate Odds Ratio Est
12、imates Point 95%WaldEffect Estimate Confidence Limits Adjusted Odds Ratios Effect Unit Estimatedata ex15_1;input y x1-x3;cards;1 0 20 0 1 0 23 0 1 0 32 0 1 0 38 0 1 1 25 0 1 0 20 1 1 0 24 1 1 0 28 11 0 30 1 1 0 32 1 1 0 38 1 1 1 26 1 1 1 29 1 1 1 34 1 1 1 33 1 1 1 38 11 1 40 1 0 0 22 0 0 0 26 0 0 0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 logistic 回归

限制150内