医学统计学第十六章logistic.ppt
《医学统计学第十六章logistic.ppt》由会员分享,可在线阅读,更多相关《医学统计学第十六章logistic.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、问题提出:问题提出:医医学学研研究究中中常常研研究究某某因因素素存存在在条条件件下下某某结结果果是否发生?以及之间的关系如何?是否发生?以及之间的关系如何?因素(因素(X)疾病结果(疾病结果(Y)x1,x2,x3XK发生发生Y=1不发生不发生Y=0例:暴露因素例:暴露因素冠心病结果冠心病结果高血压史高血压史(x1):有有或无或无有有或或无无高血脂史高血脂史(x2):有有或或无无吸烟吸烟(x3):有或无有或无研究问题可否用多元线性回归方法?研究问题可否用多元线性回归方法?1.多元线性回归方法要求多元线性回归方法要求Y的取值为计量的取值为计量的连续性随机变量。的连续性随机变量。2.多元线性回归方程
2、要求多元线性回归方程要求Y与与X间关系为线间关系为线性关系。性关系。3.多元线性回归结果多元线性回归结果不能回答不能回答“发生与发生与否否”logistic回归方法补充多元线性回归的不足回归方法补充多元线性回归的不足Logistic回归方法该法研究是该法研究是当当y取某值(如取某值(如y=1)发生的概率(发生的概率(p)与某与某暴露因素(暴露因素(x)的关系。的关系。P(概率)的取值波动概率)的取值波动01范围。范围。基本原理基本原理:用一组观察数据拟合:用一组观察数据拟合Logistic模型,模型,揭示若干个揭示若干个x与一个因变量取值的关系,反映与一个因变量取值的关系,反映y对对x的依存关
3、系。的依存关系。第一节logistic回归一、基本概念一、基本概念 1.变量的取值变量的取值logistic回归要求应变量(回归要求应变量(Y)取值为分类变取值为分类变量(两分类或多个分类)量(两分类或多个分类)自变量(自变量(Xi)称为危险因素或暴露因素称为危险因素或暴露因素,可为可为连续变量、等级变量、分类变量。连续变量、等级变量、分类变量。可有可有m个自变量个自变量X1,X2,Xm 2.两值因变量的两值因变量的logistic回归模型方程回归模型方程n n一个自变量与一个自变量与Y关系的回归模型关系的回归模型如:如:y:发生发生=1,未发生未发生=0 x:有有=1,无,无=0,记为记为p
4、(y=1/x)表示某暴露因素状态下,结表示某暴露因素状态下,结果果y=1的概率(的概率(P)模型。模型。或或模型描述了应变量模型描述了应变量p与与x的关系的关系P概率概率10.5Z值值0123-1-2-3图图16-1Logistic回归函数的几何图形回归函数的几何图形为正值,为正值,x越越大,结果大,结果y=1发发生的可能性生的可能性(p)越大。越大。几个几个logistic回归模型方程回归模型方程logistic回归模型方程的线性表达回归模型方程的线性表达对对logistic回归模型的概率(回归模型的概率(p)做做logit变换,变换,截距(常数)截距(常数)回归系数回归系数Y(-至至+)线
5、形线形关系关系方程如下:方程如下:在有多个危险因素(在有多个危险因素(Xi)时时n n多个变量多个变量的logistic回归模型方程的线性表达:回归模型方程的线性表达:或或公式公式16-22.模型中参数的意义模型中参数的意义0(常数项)常数项):暴露因素:暴露因素Xi=0时,个体发病时,个体发病概率与不发病概率之比的自然对数比值。概率与不发病概率之比的自然对数比值。的含义:的含义:某危险因素,暴露水平变化时,即某危险因素,暴露水平变化时,即Xi=1与与Xi=0相比,发生某结果(如发病)优势比相比,发生某结果(如发病)优势比的对数值。的对数值。P1(y=1/x=1)的概率的概率P0(y=1/x=
6、0)的概率的概率危险因素危险因素Yx=1x=0发病发病=130(a)10(b)不发病不发病=070(c)90(d)a+cb+d危险因素危险因素Yx=1x=0发病发病=1p1p0不发病不发病=01-p11-p0有暴露因素人群中发病的比例有暴露因素人群中发病的比例反映了在其他变量固定后,反映了在其他变量固定后,X=1与与x=0相比发相比发生生Y事件的对数优势比。事件的对数优势比。回归系数回归系数与与ORX与与Y的关联的关联n n=0,OR=1,无关无关1,OR1,有关,危险因素有关,危险因素1,OR1,有关,保护因子有关,保护因子事件发生率很小,事件发生率很小,ORRR。多元回归模型的的概念二、l
7、ogistic回归模型的参数估计1.模型中的参数(模型中的参数(i)估计估计 通常用最大似然函数通常用最大似然函数(maximumlikelihoodestimate,MLE)估计估计,由统计软件由统计软件包完成。包完成。(讲义讲义259页)页),2.优势比优势比(OR)及可信区间的估计及可信区间的估计n n如如X=1,0两分类,则两分类,则OR的的1-可信区间估可信区间估计公式计公式为回归系数为回归系数的标准误的标准误(公式(公式16-10)例:讲义表例:讲义表16-1资料资料一一个个研研究究吸吸烟烟、饮饮酒酒与与食食道道癌癌关关系系的的病病例例对对照资料(照资料(886例),试作例),试作
8、logistic回归分析。回归分析。n n变量的赋值变量的赋值n n经logistic回归计算后得n nb0=-0.9099,b1=0.8856,b2=0.5261,方程表达方程表达:控制饮酒因素后,控制饮酒因素后,吸烟与不吸烟相比吸烟与不吸烟相比患食管癌的优势比患食管癌的优势比为为2.4倍倍OR的可信区间估计吸烟与不吸烟患食管癌吸烟与不吸烟患食管癌OR的的95%可信区间:可信区间:饮酒与不饮酒饮酒与不饮酒OR的的95%可信区间:可信区间:三、三、Logistic回归模型的假设检验回归模型的假设检验1.检验一:对建立的整个模型做检验。检验一:对建立的整个模型做检验。说明自变量对说明自变量对Y的
9、作用是否有统计意义。的作用是否有统计意义。检验方法(检验方法(讲义讲义260-261页)页)1)似然比检验似然比检验(likelihoodratiotest)2)Wald检验检验3)计分检验计分检验(scoretest)例表例表16-1吸烟、饮酒与食管癌资料吸烟、饮酒与食管癌资料(SAS软件计算)软件计算)1.对建立的整个模型做检验。对建立的整个模型做检验。Testing Global Null Hypothesis:BETA=0Test Chi-Square DF Pr似然比似然比 68.5457 2 .0001计分检验计分检验 67.0712 2 .0001Wald检验检验 64.2784
10、 2 .00012.检验二:检验二:检验模型中某检验模型中某是否对是否对Y有作用。有作用。检验假设:检验假设:检验统计量:主要为检验统计量:主要为Wald检验(检验(SAS软件)软件)n n例;例;n n在大样本时,三方法结果一致。在大样本时,三方法结果一致。公式公式16-13=1的的2例表例表16-1资料,对各资料,对各x的的做检验(做检验(wald检验)检验)参数参数 估计值估计值 标准误标准误 Chi-Squa Pr常数常数-0.9099 0.1358 44.8699 .0001吸烟吸烟 0.8856 0.1500 34.8625 .0001饮酒饮酒 0.5261 0.1572 11.2
11、069 .0008 Odds Ratio Estimates Point 95%WaldEffect Estimate Confidence Limits 吸烟吸烟x1 2.424 1.807 3.253 饮酒饮酒x2 1.692 1.244 2.303似然比检验(讲义)n n对某个对某个做检验,检验统计量(做检验,检验统计量(G)包括包括p个自变量的对个自变量的对数似然函数数似然函数包括包括l个自变量的个自变量的对数似然函数对数似然函数G服从自由度(服从自由度(d)=p-l的的2分布分布似然比检验对似然比检验对做检验做检验例:例:X1为吸烟,为吸烟,X2为饮酒,检验饮酒与食为饮酒,检验饮酒与
12、食管癌关系,管癌关系,H0:2=0,H1:20G3.84,p0.05,说明调整吸烟因素后,说明调整吸烟因素后,饮酒与食管癌有关系。饮酒与食管癌有关系。四、变量筛选四、变量筛选目的;将回归系数有显著意义的自变量选入目的;将回归系数有显著意义的自变量选入模型中,作用不显著的自变量则排除在外。模型中,作用不显著的自变量则排除在外。n n变量筛选算法有:前进法、后退法和变量筛选算法有:前进法、后退法和逐步法(逐步法(stepwise)。)。例:讲义例例:讲义例16-2,用逐步法,用逐步法选入变量的显著水准为选入变量的显著水准为0.10,变量保留在方程,变量保留在方程的水准为的水准为0.15例:例:16
13、-2讲义讲义261-263页页表表16-4进入方程的自变量及参数估计进入方程的自变量及参数估计变量变量变量变量S Sb bWaldWald2 2PP标准标准标准标准OROR常数常数常数常数-4.7051.549.300.0023-4.7051.549.300.0023年龄年龄年龄年龄0.9240.4773.760.05250.4012.520.9240.4773.760.05250.4012.52X51.4960.7444.040.04430.4064.46X51.4960.7444.040.04430.4064.46X63.1361.2496.300.01210.70323.06X63.13
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计学第十六章 logistic 医学 统计学 第十六
限制150内