欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    Logistic回归分析重点难点.pptx

    • 资源ID:72986658       资源大小:1.93MB        全文页数:65页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    Logistic回归分析重点难点.pptx

    第十六章 Logistic回归分析 Logistic Regression Analysis 第1页/共65页Department ofHealth Statistics第一节第一节 非条件非条件LogisticLogistic回归分析回归分析第二节第二节 条件条件LogisticLogistic回归分析回归分析教学内容第三节第三节 LogisticLogistic回归分析的应用回归分析的应用 及注意事项及注意事项流行病学概念回顾流行病学概念回顾第2页/共65页Department ofHealth Statistics1.Logistic1.Logistic回归参数估计的基本思想回归参数估计的基本思想2.Logistic2.Logistic回归系数的假设检验和区间估计方法回归系数的假设检验和区间估计方法教学目标1.Logistic1.Logistic回归分析结果及解释回归分析结果及解释2.Logistic2.Logistic回归变量筛选方法回归变量筛选方法3.Logistic3.Logistic回归系数的流行病学意义回归系数的流行病学意义4.Logistic4.Logistic回归的应用及注意事项回归的应用及注意事项非条件非条件LogisticLogistic回归和条件回归和条件LogisticLogistic回归的回归的区别区别第3页/共65页几个重要的流行病学概几个重要的流行病学概念念第4页/共65页Department ofHealth Statistics 病因分析病因分析病因分析病因分析(预后分析)的目的:找出影响疾病发生(或预后好坏)的影响因素及其影响的强度。(预后分析)的目的:找出影响疾病发生(或预后好坏)的影响因素及其影响的强度。(预后分析)的目的:找出影响疾病发生(或预后好坏)的影响因素及其影响的强度。(预后分析)的目的:找出影响疾病发生(或预后好坏)的影响因素及其影响的强度。如果某因素对疾病发生有影响,就称该因素与疾病的发生有如果某因素对疾病发生有影响,就称该因素与疾病的发生有如果某因素对疾病发生有影响,就称该因素与疾病的发生有如果某因素对疾病发生有影响,就称该因素与疾病的发生有关联关联关联关联,关联的强度则反映其对疾病发生影,关联的强度则反映其对疾病发生影,关联的强度则反映其对疾病发生影,关联的强度则反映其对疾病发生影响的大小。响的大小。响的大小。响的大小。第5页/共65页Department ofHealth Statistics几个重要的流行病学概念几个重要的流行病学概念队列研究(队列研究(cohort studycohort study)病例对照研究(病例对照研究(case-control studycase-control study)危险度(危险度(riskrisk)相对危险度(相对危险度(relative riskrelative risk,RRRR)比数比或优势比(比数比或优势比(odds ratioodds ratio,OROR)第6页/共65页Department ofHealth Statistics队列研究队列研究 队列研究(队列研究(队列研究(队列研究(cohort studycohort studycohort studycohort study):对对对对“因因因因”分类分类分类分类上的人群作追踪随访,观察其上的人群作追踪随访,观察其上的人群作追踪随访,观察其上的人群作追踪随访,观察其“果果果果”,然后对,然后对,然后对,然后对资料进行比较分析,从而判断资料进行比较分析,从而判断资料进行比较分析,从而判断资料进行比较分析,从而判断“因因因因”与与与与“果果果果”之间有无关联及关联的强度。之间有无关联及关联的强度。之间有无关联及关联的强度。之间有无关联及关联的强度。患病患病 未患病未患病暴露组暴露组非暴露组非暴露组第7页/共65页Department ofHealth Statistics病例对照研究病例对照研究 病病病病例例例例对对对对照照照照研研研研究究究究(case-control case-control case-control case-control studystudystudystudy):是是是是对对对对“果果果果”分分分分类类类类上上上上的的的的人人人人群群群群作作作作回回回回顾顾顾顾性性性性调调调调查查查查,观观观观察察察察其其其其“因因因因”,然然然然后后后后对对对对资资资资料料料料进进进进行行行行比比比比较较较较分分分分析析析析,从从从从而而而而判判判判断断断断“果果果果”与与与与“因因因因”间间间间关关关关联联联联有无统计学意义及关联的强度。有无统计学意义及关联的强度。有无统计学意义及关联的强度。有无统计学意义及关联的强度。暴露暴露 未暴露未暴露病例病例对照对照第8页/共65页Department ofHealth Statistics危险度危险度 危险度(危险度(riskrisk):通常指某个不幸事件发生的概率。危险度大表示发生的可:通常指某个不幸事件发生的概率。危险度大表示发生的可能性大。能性大。某病发病危险度某病发病危险度:观察对象在观察期间内发生某病的概率,即某病:观察对象在观察期间内发生某病的概率,即某病发病率发病率。第9页/共65页Department ofHealth Statistics相对危险度相对危险度 vRRRR1 1:表示该因素为危险因素,使发病危险度增:表示该因素为危险因素,使发病危险度增:表示该因素为危险因素,使发病危险度增:表示该因素为危险因素,使发病危险度增大。大。大。大。vRRRR1 1:表示该因素为保护因素,使发病危险度减:表示该因素为保护因素,使发病危险度减:表示该因素为保护因素,使发病危险度减:表示该因素为保护因素,使发病危险度减小。小。小。小。vRR=1RR=1:表示该因素对疾病的发病无影响。:表示该因素对疾病的发病无影响。:表示该因素对疾病的发病无影响。:表示该因素对疾病的发病无影响。相对危险度(相对危险度(relative riskrelative risk,RRRR):暴露于某种危险因子的发病率:暴露于某种危险因子的发病率 p pe e 与不暴与不暴露于该种危险因子的发病率露于该种危险因子的发病率 p p0 0 之比。之比。第10页/共65页Department ofHealth Statistics相对危险度相对危险度 患病患病 未患病未患病暴露组暴露组非暴露组非暴露组队列研究队列研究病例对照研究一般不能计算病例对照研究一般不能计算RRRR。病例对照研究病例对照研究第11页/共65页Department ofHealth Statistics比数比数(odds)(odds):发生率与未发生率之比,即发生率与未发生率之比,即 p/(1-p)p/(1-p),即阳性率即阳性率/阴性率。阴性率。比数比比数比(odds ratioodds ratio,OROR):两个比数之比,:两个比数之比,即即 ,通常在流行病研究中,通常在流行病研究中p p1 1为病例组的暴露率,为病例组的暴露率,p p2 2为对照组的暴露率。为对照组的暴露率。比数比比数比对发对发病率较低病率较低的疾病,一般有的疾病,一般有RRORRROR第12页/共65页Department ofHealth Statistics比数比比数比患病患病 未患病未患病暴露组暴露组非暴露组非暴露组暴露暴露 未暴露未暴露病例病例对照对照 (对发对发病率较病率较低低的疾病的疾病)病例对照研究病例对照研究队列研究队列研究病例对照研究一般用病例对照研究一般用OROR替代替代RRRR。第13页/共65页Department ofHealth Statistics一个病例对照研究资料一个病例对照研究资料OROR第14页/共65页Department ofHealth Statistics 医学研究中常碰到医学研究中常碰到应变量应变量的可能取值仅有两个(即的可能取值仅有两个(即二分类变量二分类变量),如发),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多重回归的条件。显然这类资料不满足多重回归的条件。什么情况下采用Logistic回归第15页/共65页Department ofHealth Statistics目的:目的:目的:目的:作出以多个自变量(危险因素)估计应变量作出以多个自变量(危险因素)估计应变量作出以多个自变量(危险因素)估计应变量作出以多个自变量(危险因素)估计应变量(结果因素)的(结果因素)的(结果因素)的(结果因素)的logisticlogisticlogisticlogistic回归方程。属于概率型非回归方程。属于概率型非回归方程。属于概率型非回归方程。属于概率型非线性回归。线性回归。线性回归。线性回归。资料:资料:资料:资料:1.1.1.1.应变量为反映某现象发生与不发生的二值应变量为反映某现象发生与不发生的二值应变量为反映某现象发生与不发生的二值应变量为反映某现象发生与不发生的二值变量;变量;变量;变量;2.2.2.2.自变量宜全部或大部分为分类变量,可有自变量宜全部或大部分为分类变量,可有自变量宜全部或大部分为分类变量,可有自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。少数数值变量。分类变量要数量化。少数数值变量。分类变量要数量化。少数数值变量。分类变量要数量化。什么情况下采用Logistic回归第16页/共65页Department ofHealth Statistics用途:用途:研究某种疾病或现象发生和多个危险因素(或保研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。护因子)的数量关系。用用 检验(或检验(或u u检验)的检验)的局限性局限性:1.1.只能研究只能研究1 1个危险因素;个危险因素;2.2.只能得出定性结论。只能得出定性结论。什么情况下采用Logistic回归第17页/共65页Department ofHealth Statistics 种类种类:1.1.成组(非条件)成组(非条件)logisticlogistic回归方程。回归方程。2.2.配对(条件)配对(条件)logisticlogistic回归方程。回归方程。什么情况下采用Logistic回归第18页/共65页第一节第一节 Logistic回归分析回归分析 Logistic Regression第19页/共65页Department ofHealth Statistics实例实例表表16-1 16-1 膀胱癌患者及对照吸烟史资料膀胱癌患者及对照吸烟史资料第20页/共65页Department ofHealth Statistics例例16-2 16-2 为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对2626例冠心病病人和例冠心病病人和2828例对照者例对照者进行病例进行病例 对照研究,调查记录了对照研究,调查记录了8 8个可能的危险因素,试用个可能的危险因素,试用LogisticLogistic逐步回归分逐步回归分析方法筛选危险因素,并分析各自变量的作用大小。析方法筛选危险因素,并分析各自变量的作用大小。实例实例第21页/共65页Department ofHealth Statistics表表表表16-2 16-2 16-2 16-2 冠心病冠心病冠心病冠心病8 8 8 8个可能的危险因素与编码说个可能的危险因素与编码说个可能的危险因素与编码说个可能的危险因素与编码说明明明明实例实例第22页/共65页Department ofHealth Statistics实例实例表表16-3 16-3 冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据第23页/共65页Department ofHealth StatisticsLogistic回归模型回归模型在在m m个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作:LogitLogit变换变换第24页/共65页Department ofHealth StatisticsLogistic回归模型回归模型这就摆脱了二值反应变量在一般线性回归分析中可能出现的应变量值域的窘境。这就摆脱了二值反应变量在一般线性回归分析中可能出现的应变量值域的窘境。第25页/共65页Department ofHealth StatisticsLogistic曲线曲线第26页/共65页Department ofHealth Statistics常数项:常数项:表示暴露剂量表示暴露剂量 为为0 0时个体发病与不发病概率之比的自然对数。时个体发病与不发病概率之比的自然对数。回归系数:回归系数:表示自变量表示自变量 改变一个单位时改变一个单位时LogitLogit(P P)的改变量。的改变量。模型参数的意义LogisticLogistic模型还有另一种线性化表达形式,称为模型还有另一种线性化表达形式,称为LogitLogit模型模型:第27页/共65页Department ofHealth Statistics 流行病学衡量危险因素作用大小的流行病学衡量危险因素作用大小的流行病学衡量危险因素作用大小的流行病学衡量危险因素作用大小的比数比比数比比数比比数比指标。指标。指标。指标。计算公式为:计算公式为:计算公式为:计算公式为:模型参数的意义模型参数的意义 比数比OR(odds ratio)第28页/共65页Department ofHealth Statistics模型参数的意义模型参数的意义 OR与 Logit(P)的关系 j j 表示表示 ORORj j 的自然对数值。的自然对数值。第29页/共65页Department ofHealth Statistics模型参数的意义模型参数的意义 第30页/共65页Department ofHealth Statistics模型参数的意义模型参数的意义 第31页/共65页Department ofHealth Statisticslogistic回归模型的参数估计 原理:最大似然原理:最大似然(likelihood)(likelihood)估计估计 参数估计第32页/共65页Department ofHealth Statistics可反映某一因素两个不同水平(可反映某一因素两个不同水平(c c1 1,c c0 0)的优势比)的优势比。优势比估计logistic回归模型的参数估计 第33页/共65页Department ofHealth Statisticslogistic回归模型的假设检验2.2.1.1.似然比检验似然比检验:-2ln-2lnL L近似服从近似服从 分布分布 G G=2(ln=2(lnL L1 1-ln-lnL L0 0)=2ln)=2ln(L L1 1/L L0 0)=p-l=p-l第34页/共65页Department ofHealth Statistics标准化回归系数标准化回归系数绝对值越大标准化回归系数绝对值越大,说明相应变量的作用越大说明相应变量的作用越大.第35页/共65页Department ofHealth Statistics实例分析实例分析第36页/共65页Department ofHealth Statistics 数据准备成数据准备成数据准备成数据准备成3 3列:例数、吸烟史(列:例数、吸烟史(列:例数、吸烟史(列:例数、吸烟史(1 1:有,:有,:有,:有,0 0:无),膀胱癌(:无),膀胱癌(:无),膀胱癌(:无),膀胱癌(1 1:有,:有,:有,:有,0 0:无):无):无):无)实例分析实例分析第37页/共65页Department ofHealth StatisticsDataWeight cases实例分析实例分析第38页/共65页Department ofHealth StatisticsAnalyzeRegressionBinary Logistic实例分析实例分析第39页/共65页Department ofHealth Statistics 应变量编码应变量编码应变量编码应变量编码vv模型拟合结果模型拟合结果模型拟合结果模型拟合结果实例分析实例分析第40页/共65页Department ofHealth Statistics方法:方法:方法:方法:前进法、后退法和逐步法。前进法、后退法和逐步法。前进法、后退法和逐步法。前进法、后退法和逐步法。检验统计量:检验统计量:检验统计量:检验统计量:不是不是不是不是 F F F F 统计量,而是似然比统计量、统计量,而是似然比统计量、统计量,而是似然比统计量、统计量,而是似然比统计量、Wald Wald Wald Wald 统计量和计分统计量之一。统计量和计分统计量之一。统计量和计分统计量之一。统计量和计分统计量之一。变量的筛选变量的筛选第41页/共65页Department ofHealth Statistics变量的筛选变量的筛选例例16-2 16-2 为了探讨冠心病发生的有关危险因素,对为了探讨冠心病发生的有关危险因素,对2626例冠心病病人和例冠心病病人和2828例对照例对照者进行病例者进行病例 对照研究,调查记录了对照研究,调查记录了8 8个可能的危险因素,试用个可能的危险因素,试用LogisticLogistic逐步回归逐步回归分析方法筛选危险因素,并分析各自变量的作用大小。分析方法筛选危险因素,并分析各自变量的作用大小。第42页/共65页Department ofHealth Statistics表表表表16-2 16-2 16-2 16-2 冠心病冠心病冠心病冠心病8 8 8 8个可能的危险因素与编码说个可能的危险因素与编码说个可能的危险因素与编码说个可能的危险因素与编码说明明明明实例分析实例分析第43页/共65页Department ofHealth Statistics实例分析实例分析表表16-3 16-3 冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据第44页/共65页Department ofHealth Statistics由标准化回归系数可以看出,选入的四个危险因素按其影响由标准化回归系数可以看出,选入的四个危险因素按其影响大小排列的顺序为大小排列的顺序为X X6 6、X X8 8、X X5 5、X X1 1,它们分别是动物脂肪摄它们分别是动物脂肪摄入量、入量、A A型性格、高血脂史和年龄增高。型性格、高血脂史和年龄增高。实例分析实例分析第45页/共65页第二节第二节 条件条件Logistic回归分回归分析析Conditional Logistic Regression第46页/共65页Department ofHealth Statistics条件条件Logistic回归的原理回归的原理 条件条件条件条件LogisticLogistic回归(回归(回归(回归(conditional Logistic regressionconditional Logistic regression)是针对)是针对)是针对)是针对配对或分层资料配对或分层资料配对或分层资料配对或分层资料分析分析分析分析的一种方法。的一种方法。的一种方法。的一种方法。为了控制一些重要的混杂因素(如性别和年龄等),流行病学常采用为了控制一些重要的混杂因素(如性别和年龄等),流行病学常采用为了控制一些重要的混杂因素(如性别和年龄等),流行病学常采用为了控制一些重要的混杂因素(如性别和年龄等),流行病学常采用1:1:MM配对配对配对配对的研的研的研的研究方法,即每一个病例与究方法,即每一个病例与究方法,即每一个病例与究方法,即每一个病例与MM个与它条件相一致的对照形成一个匹配组(每一匹配组个与它条件相一致的对照形成一个匹配组(每一匹配组个与它条件相一致的对照形成一个匹配组(每一匹配组个与它条件相一致的对照形成一个匹配组(每一匹配组为一个层)。为一个层)。为一个层)。为一个层)。条件条件条件条件LogisticLogistic回归,其实质是在构造似然函数时利用适当的回归,其实质是在构造似然函数时利用适当的回归,其实质是在构造似然函数时利用适当的回归,其实质是在构造似然函数时利用适当的条件分布条件分布条件分布条件分布,实现在各层,实现在各层,实现在各层,实现在各层中进行比较。中进行比较。中进行比较。中进行比较。第47页/共65页Department ofHealth Statistics表表16-5 1:M 条件条件logistic回归数据的格式回归数据的格式*t=0 为病例,其他为对照 1:M数据格式数据格式第48页/共65页Department ofHealth Statistics条件条件Logistic回归模型回归模型 第49页/共65页Department ofHealth Statistics实例分析实例分析 例例例例16-316-316-316-3 某市调查三种生活方式与胃癌发病的关系,采用某市调查三种生活方式与胃癌发病的关系,采用某市调查三种生活方式与胃癌发病的关系,采用某市调查三种生活方式与胃癌发病的关系,采用1:11:11:11:1配对的病例配对的病例配对的病例配对的病例 对照研究形式。按每个病例的性别、年龄和居住地选取一个健康作为对照。对照研究形式。按每个病例的性别、年龄和居住地选取一个健康作为对照。对照研究形式。按每个病例的性别、年龄和居住地选取一个健康作为对照。对照研究形式。按每个病例的性别、年龄和居住地选取一个健康作为对照。调查的三种生活方式取值见表调查的三种生活方式取值见表调查的三种生活方式取值见表调查的三种生活方式取值见表16-716-716-716-7,共调查了,共调查了,共调查了,共调查了50505050对病例与对照。试作条件对病例与对照。试作条件对病例与对照。试作条件对病例与对照。试作条件LogisticLogisticLogisticLogistic逐步回归分析。逐步回归分析。逐步回归分析。逐步回归分析。表表16-7 16-7 三种生活方式取值三种生活方式取值因素因素变量名变量名分级说明分级说明不良饮食习惯不良饮食习惯X X1 10 0、1 1、2 2、3 3、4 4表示程度(表示程度(0 0表示无,表示无,4 4表示最多)表示最多)喜吃卤食和盐喜吃卤食和盐渍食物渍食物X X2 20 0、1 1、2 2、3 3、4 4表示程度(表示程度(0 0表示不吃,表示不吃,4 4表示非常表示非常喜欢吃)喜欢吃)精神状况精神状况X X3 30 0表示差,表示差,1 1表示好表示好第50页/共65页Department ofHealth Statistics数据准备成4列:X1、X2、X3,配对号及疾病发生情况Y(1:病例,0:对照)。实例分析实例分析第51页/共65页Department ofHealth Statisticsv模型拟合结果v显然,存在不显著的变量,可以进行逐步回归分析。实例分析实例分析第52页/共65页Department ofHealth Statistics实例分析实例分析第53页/共65页第三节第三节 Logistic回归的应用回归的应用 及注意事项及注意事项第54页/共65页Department ofHealth Statistics logisticlogistic回归分析的特点之一是参数意义清楚,即得到某一因素的回归系数后,可回归分析的特点之一是参数意义清楚,即得到某一因素的回归系数后,可以很快估计出这一因素在不同水平下的优势比以很快估计出这一因素在不同水平下的优势比OROR或近似相对危险度或近似相对危险度RRRR,因此非,因此非常适合于流行病学研究。常适合于流行病学研究。logisticlogistic回归既适合于队列研究回归既适合于队列研究(cohort study)(cohort study),也适合于病例,也适合于病例-对照研究对照研究(case-(case-control study),control study),同样还可以用于横断面研究同样还可以用于横断面研究(cross-sectional study)(cross-sectional study)logistic回归的应用流行病学危险因素分析第55页/共65页Department ofHealth Statistics 临床试验的目的大多是为了评价某种药物或治疗方法临床试验的目的大多是为了评价某种药物或治疗方法的效果,如果有其他影响效果的非处理因素的效果,如果有其他影响效果的非处理因素(如年龄、病如年龄、病情等情等)在试验组和对照组中分布不均衡,就有可能夸大或在试验组和对照组中分布不均衡,就有可能夸大或掩盖试验组的治疗效果。掩盖试验组的治疗效果。当非处理因素过多时,可能会遇到各层样本量过小和当非处理因素过多时,可能会遇到各层样本量过小和非处理因素在试验组和对照组内的分布不均衡的问题。非处理因素在试验组和对照组内的分布不均衡的问题。用单因素分析很难保证对比组间的齐同性。用单因素分析很难保证对比组间的齐同性。当评价指标为当评价指标为二值二值变量时变量时(如有效和无效如有效和无效),可以利用,可以利用logisticlogistic回归分析得到调整后的药物评价结果。回归分析得到调整后的药物评价结果。临床试验数据分析logistic回归的应用第56页/共65页Department ofHealth Statistics在在一一些些药药物物或或毒毒物物效效价价的的剂剂量量-反反应应实实验验研研究究中中,每每一一只只动动物物药药物物耐耐受受量量可可能能有有很很大大的的不不同同,不不同同剂剂量量使使动动物物发发生生“阳阳性性反反应应”的的概概率率分分布布常常呈呈正正偏偏态态,将将剂剂量量取取对对数数后后则则概概率率分分布布接接近近正正态态分分布布。由由于于正正态态分分布布函函数数与与logisticlogistic分分布布函函数数十十分分接接近近,如如果果用用P P表表示示在在剂剂量量为为X X时时的的阳阳性性率率,可可用用下下述述模模型型表示它们之间的关系表示它们之间的关系用这一模型可以用这一模型可以求出任一剂量的求出任一剂量的阳性反应率阳性反应率传传统统的的一一些些方方法法往往往往对对实实验验设设计计有有严严格格的的要要求求,如如剂剂量量按按等等比比级级数数排排列列,各各剂剂量量组组的的例例数数必必须须相相同同等等,采采用用logisticlogistic回回归的方法则没有这些限制。归的方法则没有这些限制。分析药物或毒物的剂量反应logistic回归的应用第57页/共65页Department ofHealth Statisticslogisticlogistic回归是一个回归是一个概率型模型概率型模型,因此可以利用它预测某事件发生的概率。例,因此可以利用它预测某事件发生的概率。例如在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大。如在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大。logistic回归的应用预测与判别第58页/共65页Department ofHealth StatisticsLogistic回归的样本量回归的样本量 LogisticLogistic回归要求有足够的样本含量,样本含量愈大分析结果愈可靠。回归要求有足够的样本含量,样本含量愈大分析结果愈可靠。回归要求有足够的样本含量,样本含量愈大分析结果愈可靠。回归要求有足够的样本含量,样本含量愈大分析结果愈可靠。实际中病例和对照的人数应至少各有实际中病例和对照的人数应至少各有实际中病例和对照的人数应至少各有实际中病例和对照的人数应至少各有20203030例,方程中的变量个数愈多需要的例数也就愈大。例,方程中的变量个数愈多需要的例数也就愈大。例,方程中的变量个数愈多需要的例数也就愈大。例,方程中的变量个数愈多需要的例数也就愈大。对于配对资料,一般样本的匹配组数应为纳入方程中的自变量个数的对于配对资料,一般样本的匹配组数应为纳入方程中的自变量个数的对于配对资料,一般样本的匹配组数应为纳入方程中的自变量个数的对于配对资料,一般样本的匹配组数应为纳入方程中的自变量个数的2020倍以上。倍以上。倍以上。倍以上。第59页/共65页Department ofHealth Statisticslogistic回归变量的数量化回归变量的数量化v连续型变量连续型变量连续型变量连续型变量 以原始观察值或通过某种数据变换的形式出现,此时以原始观察值或通过某种数据变换的形式出现,此时以原始观察值或通过某种数据变换的形式出现,此时以原始观察值或通过某种数据变换的形式出现,此时expexpexpexp(b b b b)表示每增加)表示每增加)表示每增加)表示每增加1 1 1 1单位的相对危险度,不一定有实单位的相对危险度,不一定有实单位的相对危险度,不一定有实单位的相对危险度,不一定有实际意义;际意义;际意义;际意义;将连续变量按不同区间分成若干组,按将连续变量按不同区间分成若干组,按将连续变量按不同区间分成若干组,按将连续变量按不同区间分成若干组,按1,2,1,2,1,2,1,2,g g g g给分,给分,给分,给分,然后按连续变量进行处理。则然后按连续变量进行处理。则然后按连续变量进行处理。则然后按连续变量进行处理。则expexpexpexp(b b b b)表示平均增加一)表示平均增加一)表示平均增加一)表示平均增加一段的相对危险度。段的相对危险度。段的相对危险度。段的相对危险度。将连续变量按不同区间分成若干组后,化作哑变量处理。将连续变量按不同区间分成若干组后,化作哑变量处理。将连续变量按不同区间分成若干组后,化作哑变量处理。将连续变量按不同区间分成若干组后,化作哑变量处理。v无序分类变量无序分类变量无序分类变量无序分类变量:化成若干个哑变量化成若干个哑变量化成若干个哑变量化成若干个哑变量v有序分类变量有序分类变量有序分类变量有序分类变量:按连续变量的方式处理或哑变量按连续变量的方式处理或哑变量按连续变量的方式处理或哑变量按连续变量的方式处理或哑变量 第60页/共65页Department ofHealth Statistics j j j j 的值并不具有的值并不具有的值并不具有的值并不具有OROROROR或或或或RRRRRRRR的直接含义,它只是的直接含义,它只是的直接含义,它只是的直接含义,它只是OROROROR或或或或RRRRRRRR的自然对数值。的自然对数值。的自然对数值。的自然对数值。j j j j 的正负号与危险因素的赋值方式有密切联系,因此应结合的正负号与危险因素的赋值方式有密切联系,因此应结合的正负号与危险因素的赋值方式有密切联系,因此应结合的正负号与危险因素的赋值方式有密切联系,因此应结合X X X Xj j j j 具具具具体的赋值方式来理解体的赋值方式来理解体的赋值方式来理解体的赋值方式来理解X X X Xj j j j 对所研究疾病的影响。对所研究疾病的影响。对所研究疾病的影响。对所研究疾病的影响。各各各各j j j j 的绝对值大小并不直接表明各危险因素的绝对值大小并不直接表明各危险因素的绝对值大小并不直接表明各危险因素的绝对值大小并不直接表明各危险因素X X X Xj j j j 对疾病发生的相对对疾病发生的相对对疾病发生的相对对疾病发生的相对重要性,这是由于各重要性,这是由于各重要性,这是由于各重要性,这是由于各X X X Xj j j j 的量纲不同。如果要比较各危险因素对疾病的量纲不同。如果要比较各危险因素对疾病的量纲不同。如果要比较各危险因素对疾病的量纲不同。如果要比较各危险因素对疾病影响作用的相对大小,应使用标准化影响作用的相对大小,应使用标准化影响作用的相对大小,应使用标准化影响作用的相对大小,应使用标准化LogisticLogisticLogisticLogistic回归系数回归系数回归系数回归系数j j j j。由病例对照资料作由病例对照资料作由病例对照资料作由病例对照资料作LogisticLogisticLogisticLogistic回归得到的模型不能直接用于发病概率回归得到的模型不能直接用于发病概率回归得到的模型不能直接用于发病概率回归得到的模型不能直接用于发病概率的估计的估计的估计的估计(此时,得到的是暴露率此时,得到的是暴露率此时,得到的是暴露率此时,得到的是暴露率),而队列研究得到的,而队列研究得到的,而队列研究得到的,而队列研究得到的LogisticLogisticLogisticLogistic回归回归回归回归模型可以用于发病率估计。模型可以用于发病率估计。模型可以用于发病率估计。模型可以用于发病率估计。Logistic回归系数的理解回归系数的理解第61页/共65页Department ofHealth Statistics本章小结目的:目的:作出以多个自变量(危险因素)估计应变量(结果作出以多个自变量(危险因素)估计应变量(结果因素)的因素)的logistic回归方程。属于概率型非线性回归。回归方程。属于概率型非线性回归。资料:资料:1.应变量为反映某现象发生与不发生的二值变量;应变量为反映某现象发生与不发生的二值变量;2.自变量宜全部或大部分为分类变量,可有少数数自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。值变量。分类变量要数量化。用途:用途:研究某种疾病或现象发生和多个危险因素(或保研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。护因子)的数量关系。种类:1.成组(非条件)logistic回归方程。2.配对(条件)logistic回归方程。第62页/共65页Department ofHealth Statistics本章小结vv对队列研究资料,对队列研究资料,对队列研究资料,对队列研究资料,LogisticLogisticLogisticLogistic回归模型直接给出发回归模型直接给出发回归模型直接给出发回归模型直接给出发病概率估计,而对病例对照研究资料则不能给出病概率估计,而对病例对照研究资料则不能给出病概率估计,而对病例对照研究资料则不能给出病概率估计,而对病例对照研究资料则不能给出概率估计,但可提示可能存在的危险因素。概率估计,但可提示可能存在的危险因素。概率估计,但可提示可能存在的危险因素。概率估计,但可提示可能存在的危险因素。vv配对病例对照研究资料必须应用条件配对病例对照研究资料必须应用条件配对病例对照研究资料必须应用条件配对病例对照研究资料必须应用条件LogisticLogisticLogisticLogistic回回回回归分析。归分析。归分析。归分析。模型:Logistic回归模型是一个概率型的回归模型。应用:第63页/共65页Department ofHealth Statistics第64页/共65页Department ofHealth Statistics卫生统计学教研室 张彦琦感谢您的观看!第65页/共65页

    注意事项

    本文(Logistic回归分析重点难点.pptx)为本站会员(莉***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开