Logistic回归分析重点、难点 .ppt
《Logistic回归分析重点、难点 .ppt》由会员分享,可在线阅读,更多相关《Logistic回归分析重点、难点 .ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三军医大学军事预防医学院卫生统计学教研室第三军医大学军事预防医学院卫生统计学教研室Department of Health statistics,TMMU Department of Health statistics,TMMU TelTel:68752343 68752343 1399647836413996478364授课对象:授课对象:20102010级研究生级研究生 任课教员:张彦琦任课教员:张彦琦 讲师讲师医学统计学医学统计学Medical Statistics第十六章第十六章 Logistic回归分析回归分析 Logistic Regression Analysis 第一节第一节
2、第一节第一节 非条件非条件非条件非条件LogisticLogisticLogisticLogistic回归分析回归分析回归分析回归分析第二节第二节第二节第二节 条件条件条件条件LogisticLogisticLogisticLogistic回归分析回归分析回归分析回归分析教学内容教学内容第三节第三节第三节第三节 LogisticLogisticLogisticLogistic回归分析的应用回归分析的应用回归分析的应用回归分析的应用 及注意事项及注意事项及注意事项及注意事项流行病学概念回顾流行病学概念回顾流行病学概念回顾流行病学概念回顾Department ofHealth Statistics
3、卫生统计学教研室卫生统计学教研室 张彦琦张彦琦掌握掌握了解了解1.Logistic1.Logistic1.Logistic1.Logistic回归参数估计的基本思想回归参数估计的基本思想回归参数估计的基本思想回归参数估计的基本思想2.Logistic2.Logistic2.Logistic2.Logistic回归系数的假设检验和区间估计方法回归系数的假设检验和区间估计方法回归系数的假设检验和区间估计方法回归系数的假设检验和区间估计方法教学目标教学目标1.Logistic1.Logistic1.Logistic1.Logistic回归分析结果及解释回归分析结果及解释回归分析结果及解释回归分析结果
4、及解释2.Logistic2.Logistic2.Logistic2.Logistic回归变量筛选方法回归变量筛选方法回归变量筛选方法回归变量筛选方法3.Logistic3.Logistic3.Logistic3.Logistic回归系数的流行病学意义回归系数的流行病学意义回归系数的流行病学意义回归系数的流行病学意义4.Logistic4.Logistic4.Logistic4.Logistic回归的应用及注意事项回归的应用及注意事项回归的应用及注意事项回归的应用及注意事项理解理解非条件非条件非条件非条件LogisticLogisticLogisticLogistic回归和条件回归和条件回归和
5、条件回归和条件LogisticLogisticLogisticLogistic回归的回归的回归的回归的区别区别区别区别Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦几个重要的流行病学概念 病因分析病因分析病因分析病因分析(预后分析)的目的:找出影响疾(预后分析)的目的:找出影响疾(预后分析)的目的:找出影响疾(预后分析)的目的:找出影响疾病发生(或预后好坏)的影响因素及其影响的强病发生(或预后好坏)的影响因素及其影响的强病发生(或预后好坏)的影响因素及其影响的强病发生(或预后好坏)的影响因素及其影响的强度。度。度。度。如果某因素对疾病
6、发生有影响,就称该因素如果某因素对疾病发生有影响,就称该因素如果某因素对疾病发生有影响,就称该因素如果某因素对疾病发生有影响,就称该因素与疾病的发生有与疾病的发生有与疾病的发生有与疾病的发生有关联关联关联关联,关联的强度则反映其对疾,关联的强度则反映其对疾,关联的强度则反映其对疾,关联的强度则反映其对疾病发生影响的大小。病发生影响的大小。病发生影响的大小。病发生影响的大小。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦几个重要的流行病学概念几个重要的流行病学概念v队列研究(队列研究(cohort studycohort study)v
7、病例对照研究(病例对照研究(case-control studycase-control study)v危险度(危险度(riskrisk)v相对危险度(相对危险度(relative riskrelative risk,RRRR)v比数比或优势比(比数比或优势比(odds ratioodds ratio,OROR)Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦队列研究队列研究 队列研究(队列研究(队列研究(队列研究(cohort studycohort studycohort studycohort study):对对对对“因因因因”分
8、类上分类上分类上分类上的人群作追踪随访,观察其的人群作追踪随访,观察其的人群作追踪随访,观察其的人群作追踪随访,观察其“果果果果”,然后对资料,然后对资料,然后对资料,然后对资料进行比较分析,从而判断进行比较分析,从而判断进行比较分析,从而判断进行比较分析,从而判断“因因因因”与与与与“果果果果”之间有之间有之间有之间有无关联及关联的强度。无关联及关联的强度。无关联及关联的强度。无关联及关联的强度。患病患病患病患病 未患病未患病未患病未患病暴露组暴露组暴露组暴露组非暴露组非暴露组非暴露组非暴露组Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦
9、张彦琦病例对照研究病例对照研究 病病病病例例例例对对对对照照照照研研研研究究究究(case-control case-control case-control case-control studystudystudystudy):是是是是对对对对“果果果果”分分分分类类类类上上上上的的的的人人人人群群群群作作作作回回回回顾顾顾顾性性性性调调调调查查查查,观观观观察察察察其其其其“因因因因”,然然然然后后后后对对对对资资资资料料料料进进进进行行行行比比比比较较较较分分分分析析析析,从从从从而而而而判判判判断断断断“果果果果”与与与与“因因因因”间关联有无统计学意义及关联的强度。间关联有无统计学意
10、义及关联的强度。间关联有无统计学意义及关联的强度。间关联有无统计学意义及关联的强度。暴露暴露暴露暴露 未暴露未暴露未暴露未暴露病例病例病例病例对照对照对照对照Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦危险度危险度 危险度(危险度(危险度(危险度(riskrisk):通常指某个不幸事件发生的概:通常指某个不幸事件发生的概:通常指某个不幸事件发生的概:通常指某个不幸事件发生的概率。危险度大表示发生的可能性大。率。危险度大表示发生的可能性大。率。危险度大表示发生的可能性大。率。危险度大表示发生的可能性大。某病发病危险度某病发病危险度某病
11、发病危险度某病发病危险度:观察对象在观察期间内发生某:观察对象在观察期间内发生某:观察对象在观察期间内发生某:观察对象在观察期间内发生某病的概率,即某病病的概率,即某病病的概率,即某病病的概率,即某病发病率发病率发病率发病率。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦相对危险度相对危险度 RRRR1 1:表示该因素为危险因素,使发病危险度增大。:表示该因素为危险因素,使发病危险度增大。:表示该因素为危险因素,使发病危险度增大。:表示该因素为危险因素,使发病危险度增大。RRRR1 1:表示该因素为保护因素,使发病危险度减小。:表示该
12、因素为保护因素,使发病危险度减小。:表示该因素为保护因素,使发病危险度减小。:表示该因素为保护因素,使发病危险度减小。RR=1RR=1:表示该因素对疾病的发病无影响。:表示该因素对疾病的发病无影响。:表示该因素对疾病的发病无影响。:表示该因素对疾病的发病无影响。相对危险度(相对危险度(相对危险度(相对危险度(relative riskrelative risk,RRRR):暴露于某种:暴露于某种:暴露于某种:暴露于某种危险因子的发病率危险因子的发病率危险因子的发病率危险因子的发病率 p pe e 与不暴露于该种危险因子的与不暴露于该种危险因子的与不暴露于该种危险因子的与不暴露于该种危险因子的发
13、病率发病率发病率发病率 p p0 0 之比。之比。之比。之比。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦相对危险度相对危险度 患病患病患病患病 未患病未患病未患病未患病暴露组暴露组暴露组暴露组非暴露组非暴露组非暴露组非暴露组队列研究队列研究队列研究队列研究病例对照研究一般不能计算病例对照研究一般不能计算病例对照研究一般不能计算病例对照研究一般不能计算RRRR。病例对照研究病例对照研究病例对照研究病例对照研究Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦比数比数比数比数(o
14、dds)(odds):发生率与未发生率之比,即发生率与未发生率之比,即发生率与未发生率之比,即发生率与未发生率之比,即 p/(1-p)p/(1-p),即阳性率即阳性率即阳性率即阳性率/阴性率。阴性率。阴性率。阴性率。比数比比数比比数比比数比(odds ratioodds ratio,OROR):两个比数之比,:两个比数之比,:两个比数之比,:两个比数之比,即即即即 ,通常在流行病研究中,通常在流行病研究中,通常在流行病研究中,通常在流行病研究中p p1 1为病例组的暴露率,为病例组的暴露率,为病例组的暴露率,为病例组的暴露率,p p2 2为对照组的暴露率。为对照组的暴露率。为对照组的暴露率。为
15、对照组的暴露率。比数比比数比对发对发对发对发病率较低病率较低病率较低病率较低的疾病,一般有的疾病,一般有的疾病,一般有的疾病,一般有RRORRRORDepartment ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦比数比比数比患病患病患病患病 未患病未患病未患病未患病暴露组暴露组暴露组暴露组非暴露组非暴露组非暴露组非暴露组暴露暴露暴露暴露 未暴露未暴露未暴露未暴露病例病例病例病例对照对照对照对照 (对发对发对发对发病率病率病率病率较低较低较低较低的疾病的疾病的疾病的疾病)病例对照研究病例对照研究病例对照研究病例对照研究队列研究队列研究队列研究队列研究病例
16、对照研究一般用病例对照研究一般用病例对照研究一般用病例对照研究一般用OROR替代替代替代替代RRRR。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦一个病例对照研究资料一个病例对照研究资料ORORDepartment ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦 医学研究中常碰到医学研究中常碰到医学研究中常碰到医学研究中常碰到应变量应变量应变量应变量的可能取值仅有两的可能取值仅有两的可能取值仅有两的可能取值仅有两个(即个(即个(即个(即二分类变量二分类变量二分类变量二分类变量),如发病与未发病、
17、阳性与),如发病与未发病、阳性与),如发病与未发病、阳性与),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴阴性、死亡与生存、治愈与未治愈、暴露与未暴阴性、死亡与生存、治愈与未治愈、暴露与未暴阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多重回归的条件。露等,显然这类资料不满足多重回归的条件。露等,显然这类资料不满足多重回归的条件。露等,显然这类资料不满足多重回归的条件。什么情况下采用什么情况下采用LogisticLogistic回归回归目的:目的:目的:目的:作出以多个自变量(危险因素)估计应变量作出以多个自变量(危险因素)估计应变量作出以多个自变量(危
18、险因素)估计应变量作出以多个自变量(危险因素)估计应变量(结果因素)的(结果因素)的(结果因素)的(结果因素)的logisticlogisticlogisticlogistic回归方程。属于概率型非回归方程。属于概率型非回归方程。属于概率型非回归方程。属于概率型非线性回归。线性回归。线性回归。线性回归。资料:资料:资料:资料:1.1.1.1.应变量为反映某现象发生与不发生的二值应变量为反映某现象发生与不发生的二值应变量为反映某现象发生与不发生的二值应变量为反映某现象发生与不发生的二值变量;变量;变量;变量;2.2.2.2.自变量宜全部或大部分为分类变量,可有自变量宜全部或大部分为分类变量,可有
19、自变量宜全部或大部分为分类变量,可有自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。少数数值变量。分类变量要数量化。少数数值变量。分类变量要数量化。少数数值变量。分类变量要数量化。什么情况下采用什么情况下采用LogisticLogistic回归回归Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦用途:用途:研究某种疾病或现象发生和多个危险因素(或保研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。护因子)的数量关系。用用 检验(或检验(或u u检验)的检验)的局限性局限性:1.1.只能研究只能研究1 1个
20、危险因素;个危险因素;2.2.只能得出定性结论。只能得出定性结论。什么情况下采用什么情况下采用LogisticLogistic回归回归Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦 种类种类种类种类:1.1.1.1.成组(非条件)成组(非条件)成组(非条件)成组(非条件)logisticlogisticlogisticlogistic回归方程。回归方程。回归方程。回归方程。2.2.2.2.配对(条件)配对(条件)配对(条件)配对(条件)logisticlogisticlogisticlogistic回归方程。回归方程。回归方程。回归方
21、程。什么情况下采用什么情况下采用LogisticLogistic回归回归Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦第一节 Logistic回归分析 Logistic Regression实例实例表表表表16-1 16-1 膀胱癌患者及对照吸烟史资料膀胱癌患者及对照吸烟史资料膀胱癌患者及对照吸烟史资料膀胱癌患者及对照吸烟史资料Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦例例例例16-2 16-2 16-2 16-2 为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的
22、有关危险因素,对为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对26262626例冠心病病人和例冠心病病人和例冠心病病人和例冠心病病人和28282828例对照者进行病例例对照者进行病例例对照者进行病例例对照者进行病例 对照研究,对照研究,对照研究,对照研究,调查记录了调查记录了调查记录了调查记录了8 8 8 8个可能的危险因素,试用个可能的危险因素,试用个可能的危险因素,试用个可能的危险因素,试用LogisticLogistic逐步逐步逐步逐步回归分析方法筛选危险因素,并分析各自变量的作回归分析方法筛选危险因素,并分析各自变量的作回归分析方法筛选危险因素,并分析各自变量
23、的作回归分析方法筛选危险因素,并分析各自变量的作用大小。用大小。用大小。用大小。实例实例Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦表表表表16-2 16-2 16-2 16-2 冠心病冠心病冠心病冠心病8 8 8 8个可能的危险因素与编码说明个可能的危险因素与编码说明个可能的危险因素与编码说明个可能的危险因素与编码说明实例实例实例实例表表表表16-3 16-3 冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据Logistic回归模型回归模型在在
24、在在mm个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作:LogitLogit变换变换变换变换Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦Logistic回归模型回归模型这就摆脱了二值反应变量在一般线性回归分析中这就摆脱了二值反应变量在一般线性回归分析中这就摆脱了二值反应变量在一般线性回归分析中这就摆脱了二值反应变量在一般线性回归分析中可能出现的应变量值域的窘境。可能出现的应变量值域的窘境。可能出现的应变量值域的窘境。可能出现的应
25、变量值域的窘境。Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦Logistic曲线曲线Department ofHealth Statistics卫生统计学教研室卫生统计学教研室 张彦琦张彦琦常数项:常数项:常数项:常数项:表示暴露剂量表示暴露剂量表示暴露剂量表示暴露剂量 为为为为0 0 0 0时个体发病与不时个体发病与不时个体发病与不时个体发病与不发病概率之比的自然对数。发病概率之比的自然对数。发病概率之比的自然对数。发病概率之比的自然对数。回归系数:回归系数:回归系数:回归系数:表示自变量表示自变量表示自变量表示自变量 改变一个单
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Logistic回归分析重点、难点 Logistic 回归 分析 重点 难点
限制150内