《logistic回归分析》PPT课件.ppt
《《logistic回归分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《logistic回归分析》PPT课件.ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、logistic回归分析回归分析卫生统计学教研室卫生统计学教研室陆健陆健 副教授副教授10/25/2022表表1 吸烟、饮酒与食管癌关系的病例对照调查资料吸烟、饮酒与食管癌关系的病例对照调查资料分层分层吸烟吸烟 饮酒饮酒阳性例数阳性例数阴性例数阴性例数观察例数观察例数1否否否否 63 136 1992否否是是 63 107 1703是是否否 44 57 1014是是是是 265 151 416表表1 吸烟、饮酒与食管癌关系的病例对照调查资料吸烟、饮酒与食管癌关系的病例对照调查资料(收集资料的形式)(收集资料的形式)调查对象序号调查对象序号吸烟吸烟饮酒饮酒食管癌食管癌11012000875111
2、876010分类资料的影响因素分析方法分类资料的影响因素分析方法n如果采用线性回归分析,应变量不满足条件,如果采用线性回归分析,应变量不满足条件,预测值会超出预测值会超出0和和1的范围。的范围。n如果采用单变量的如果采用单变量的 2检验,则必然忽略其他检验,则必然忽略其他自变量对应变量的影响。自变量对应变量的影响。n如果采用如果采用Mantel-Haenszel分层分析,需要分层分析,需要较大的样本量,而且自变量不能太多。较大的样本量,而且自变量不能太多。nlogistic回归能较好地解决上述问题。回归能较好地解决上述问题。logistic回归模型回归模型n应变量应变量Y是一个二值变量,取值为
3、是一个二值变量,取值为n自变量自变量X1,X2,Xm。nP表示在表示在m个自变量作用下事件发生的概率。个自变量作用下事件发生的概率。logistic回归模型回归模型logistic回归模型回归模型PZlogit变换变换n事件发生概率与未发生概率之比的自然事件发生概率与未发生概率之比的自然对数,称为对数,称为P的的logit变换,记作变换,记作logit(P)。n概率概率P的取值范围在的取值范围在01之间,而之间,而logit(P)取值是没有界限的。取值是没有界限的。logit变换变换回归模型中参数的意义回归模型中参数的意义n 0(常数项):所有影响因素均为(常数项):所有影响因素均为 0 时时
4、(记作(记作X=0),个体发生事件概率与不发),个体发生事件概率与不发生事件的概率之比的自然对数值。生事件的概率之比的自然对数值。n j 的含义:某因素因素的含义:某因素因素 Xj 改变一个单位改变一个单位时,个体发生事件概率与不发生事件的时,个体发生事件概率与不发生事件的概率之比的自然对数变化值。概率之比的自然对数变化值。优势比(优势比(odds ratio,OR)n优势(优势(odds)是指某影响因素控制在某)是指某影响因素控制在某种水平时,事件发生率与事件不发生率种水平时,事件发生率与事件不发生率的比值,即的比值,即P/(1-P)。n某影响因素的两个不同水平的优势的比某影响因素的两个不同
5、水平的优势的比值称为优势比,如某影响因素的一个水值称为优势比,如某影响因素的一个水平为平为c1,另一个水平为,另一个水平为c0,则这两个水,则这两个水平的优势比为:平的优势比为:优势比(优势比(odds ratio,OR)nOR表示影响因素对事件发生的影响方表示影响因素对事件发生的影响方向和影响能力大小。向和影响能力大小。nOR1表示该因素取值越大,事件发生表示该因素取值越大,事件发生的概率越大,又称危险因素。的概率越大,又称危险因素。nOR 0,OR 1,影响因素的取值越大,影响因素的取值越大,事件的发生的概率越大。事件的发生的概率越大。n 0,OR 1,影响因素的取值越大,影响因素的取值越
6、大,事件的发生的概率越小。事件的发生的概率越小。logistic回归模型的参数估计回归模型的参数估计n通常采用最大似然估计(通常采用最大似然估计(maximum likeli-hood estimate,MLE)估计回归系数)估计回归系数,同同时得到回归系数的标准误时得到回归系数的标准误Sb。n根据最大似然原理,在一次抽样中获得现根据最大似然原理,在一次抽样中获得现有样本的概率应该最大。即似然函数取值有样本的概率应该最大。即似然函数取值最大。最大。n计算可以通过统计软件来完成。计算可以通过统计软件来完成。logistic回归模型的参数估计回归模型的参数估计n根据计算所得的根据计算所得的bj计算
7、计算OR值。值。nOR值的可信区间:可以利用值的可信区间:可以利用bj的抽样的抽样分布来估计,在样本含量较大的情况分布来估计,在样本含量较大的情况下,近似服从正态分布。当自变量只下,近似服从正态分布。当自变量只有两个水平时,可采用下列公式计算。有两个水平时,可采用下列公式计算。logistic回归模型的参数估计回归模型的参数估计n以表以表16-1的数据,计算吸烟和饮酒与食管癌关的数据,计算吸烟和饮酒与食管癌关系研究的系研究的logistic回归分析中各项参数估计值。回归分析中各项参数估计值。影响因素影响因素bSbOROR的的95%CI常数项常数项-0.90990.1358吸烟吸烟0.88560
8、.15002.421.813.25饮酒饮酒0.52610.15721.691.242.30logistic回归模型的假设检验回归模型的假设检验n根据样本得到的根据样本得到的logistic回归模型还需经过检回归模型还需经过检验才能说明影响因素对事件发生的影响是否验才能说明影响因素对事件发生的影响是否具有统计学意义。具有统计学意义。n假设检验的假设有两种:假设检验的假设有两种:nH0:1=2=m(将多个影响因素作为一(将多个影响因素作为一个整体考虑)个整体考虑)nH0:j=0(单独检验某个影响因素)(单独检验某个影响因素)logistic回归模型的假设检验回归模型的假设检验方法方法n似然比检验似
9、然比检验(likelihood ratio test):既适:既适合单个影响因素的假设检验,又适合多个合单个影响因素的假设检验,又适合多个影响因素的同时检验;影响因素的同时检验;nWald检验检验(Wald test):适合单个影响因素:适合单个影响因素的检验;的检验;n计分检验(计分检验(score test):与传统):与传统Mantel-Haenszel检验结果相同,小样本时比似然检验结果相同,小样本时比似然比检验跟接近比检验跟接近 2分布,犯分布,犯I型错误的可能型错误的可能性更小。性更小。似然比检验的基本思想似然比检验的基本思想n比较包含需检验影响因素的模型和不包含比较包含需检验影响
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- logistic回归分析 logistic 回归 分析 PPT 课件
限制150内