《Logistic回归》PPT课件.ppt
《《Logistic回归》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《Logistic回归》PPT课件.ppt(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Logistic回归回归Logistic Regression医学研究中的分类变量:医学研究中的分类变量:二分类变量:二分类变量:o生存与死亡生存与死亡o有病与无病有病与无病o有效与无效有效与无效o感染与未感染感染与未感染多分类有序变量:多分类有序变量:o疾病程度(轻度、中度、重度)疾病程度(轻度、中度、重度)o治愈效果(治愈、显效、好转、无效)治愈效果(治愈、显效、好转、无效)多分类无序变量:多分类无序变量:o手术方法(手术方法(A、B、C)o就诊医院(甲、乙、丙、丁)就诊医院(甲、乙、丙、丁)医学研究者经常关心的问题诸如医学研究者经常关心的问题诸如:哪些因素导致了人群中有的人患胃癌而哪些因
2、素导致了人群中有的人患胃癌而有的人不患胃癌有的人不患胃癌?哪些因素导致了手术后有的人感染,而哪些因素导致了手术后有的人感染,而有的人不感染?有的人不感染?哪些因素导致了某种治疗方法出现治愈、哪些因素导致了某种治疗方法出现治愈、显效、好转、无效等不同的效果显效、好转、无效等不同的效果?是回归分析的问题吗?是回归分析的问题吗?因变量因变量因变量因变量y y 连续型连续型连续型连续型 服从正态分布服从正态分布服从正态分布服从正态分布舒张压舒张压舒张压舒张压年龄年龄年龄年龄胆固醇含量胆固醇含量胆固醇含量胆固醇含量自变量自变量自变量自变量x x数值型数值型数值型数值型 与与与与Y Y呈线性关系呈线性关系
3、呈线性关系呈线性关系例如:例如:例如:例如:回忆:回忆:线性回归分析对因变量的要求线性回归分析对因变量的要求YES!“问题如何解决?问题如何解决?”y=f(x)p=p(y=1|x)=p(x)不能直接不能直接分析分析变量变量y与与x的关系的关系转换为转换为分析分析y取某取某个值的概率变量个值的概率变量 p与与x的关系的关系y=1,0 x任意任意0p1,x任意任意Logistic回归模型回归模型不存在不存在不存在不存在Logistic回归回归 一.Logistic回归的概念:在医学研究中经常遇到应变量为互斥的二项分类资料。如治愈与未愈,生存与死亡等。同时有许多自变量可能岁结果产生影响,而这种影响不
4、一定是线性的,可采用Logistic回归分析。Logistic回归是一种用于多因素分析的曲线模型,特别适用于应变量为离散型多项分类的资料。Logistic回归回归二二.Logistic回归的概率公式:回归的概率公式:对概率P取logit变换,则Logistic回归模型变成:Logistic回归回归即:变量logit(P)关于x的线性函数。P/Q表示了某事件发生的比数比(odds)。Logistic回归模型的解释:相对危险度(RR):暴露下发病率与不暴露发病率的比值。比数比(OR):病例组的暴露的优势与对照组暴露的优势之比。当发病率很低时,OR RR。即:可以用OR作为RR的估计值。Logist
5、ic回归回归Logistic回归模型的解释:l当偏回归系数为正时,x增加,OR增加,为危险因素。l当偏回归系数为负时,x增加导致OR减小,为保护因素。l比较暴露因素对应变量的影响大小,用标准化偏回归系数。Logistic回归回归Logistic回归对变量的要求:应变量为二分类或多分类变量自变量为数值变量、等级或二分类变量多分类的计数资料需进行变量转换,形成一组哑变量(dummy variable)Logistic回归回归自变量只有一个时自变量只有一个时,模型中回归系模型中回归系数的意义数的意义0(常数项)(常数项):暴露因素:暴露因素xi=0时,个体发病概时,个体发病概率与不发病概率之比的自然
6、对数比值。率与不发病概率之比的自然对数比值。模型中回归系数的意义模型中回归系数的意义回归系数回归系数的含义:危险因素的含义:危险因素x x增增加一个单位时,即加一个单位时,即x xi i=1=1与与x xi i=0=0相比,相比,发生结果(发生结果(y=1y=1)优势比的对数值。)优势比的对数值。回归系数回归系数与与OR X与与Y的关联的关联 =0,OR=1 无关无关 0,OR1 有关,危险因素有关,危险因素 0,OR1 有关,保护因子有关,保护因子Logistic回归模型中回归系数的意义回归模型中回归系数的意义Logistic 回归分析中回归系数的意义回归分析中回归系数的意义 的意义:的意义
7、:在在Logistic回归模型回归模型(Logit P=+x)中中,表示表示自变量变化一个单位,导致自变量变化一个单位,导致的因变量的变化值,的因变量的变化值,在这里,因变量在这里,因变量是是Logit(P),即比数的对数。即比数的对数。Logistic 回归中回归系数的意义回归中回归系数的意义1)当暴露因素(危险因素)当暴露因素(危险因素)只有两个水平只有两个水平时时,且暴露时为且暴露时为1,不暴露时为,不暴露时为0,则模型中该暴露变量前的系数就是则模型中该暴露变量前的系数就是暴露与暴露与不暴露的比数比的对数值。不暴露的比数比的对数值。也即也即:Ln(OR)=或或 OR =exp()2)当暴
8、露因素为当暴露因素为等级变量等级变量时,如收入水平,时,如收入水平,x 的取值为:的取值为:1、2、3、4表示不同的等级。表示不同的等级。的意义就是表示每相差一的意义就是表示每相差一个等级时的比数比的对数,而个等级时的比数比的对数,而Exp()表示每增加一个等级表示每增加一个等级时的比数比时的比数比。3)当暴露因素为当暴露因素为连续变量连续变量(如年龄)时,(如年龄)时,就表示年龄每增就表示年龄每增加一岁时比数比的对数。加一岁时比数比的对数。Exp(Exp()表示年龄增加一岁时比数)表示年龄增加一岁时比数比。比。Logistic 回归中参数的意义回归中参数的意义 例例1:MI MI MI MI
9、 非非非非MIMIMIMI 合计合计合计合计 服服服服OC OC OC OC 39 24 6339 24 63 未服未服未服未服OC OC OC OC 114 154114 154 268 268 合计合计合计合计 153 153 178 331 178 331 拟合的拟合的拟合的拟合的LogisticLogistic回归模型为:回归模型为:回归模型为:回归模型为:logit logit P P OR ORexpexp()()()()即:服用口服避孕药者发生心肌梗塞的概率是不即:服用口服避孕药者发生心肌梗塞的概率是不即:服用口服避孕药者发生心肌梗塞的概率是不即:服用口服避孕药者发生心肌梗塞的概
10、率是不服者的倍。服者的倍。服者的倍。服者的倍。例例2 2、自变量是分类型变量自变量是分类型变量 为了了解冠心病与种族的关系,某研究所为了了解冠心病与种族的关系,某研究所调查了调查了100100个样本,数据列在下表中。试估计各个样本,数据列在下表中。试估计各种族间患冠心病的相对危险度。种族间患冠心病的相对危险度。设设y=1表示患冠心病,表示患冠心病,y=0表示未患冠心病。把种表示未患冠心病。把种族转换为两个哑变量族转换为两个哑变量,x(1)=1表示黑人,表示黑人,x(2)=1表表示其它种族示其它种族,两个哑变量都为两个哑变量都为0时表示白人时表示白人.Logistic 回归中参数的意义回归中参数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Logistic回归 Logistic 回归 PPT 课件
限制150内