欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    《logistic回归》PPT课件.ppt

    • 资源ID:69912122       资源大小:1.65MB        全文页数:44页
    • 资源格式: PPT        下载积分:11.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要11.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《logistic回归》PPT课件.ppt

    LogisticLogistic 回归筛选影响因素校正混杂效应进行疾病预测医学研究线性回归因变量连续定量变量自变量与应变量为线性关系LogisticLogisticLogisticLogistic回归回归因变量为分类变量自变量与因变量为非线性关系目的:目的:作出以多个自变量(危险因素)估计应作出以多个自变量(危险因素)估计应 变量(结果因素)的变量(结果因素)的logisticlogistic回归方程。属于回归方程。属于概率型非线性回归。概率型非线性回归。LogisticLogistic回归适用范围资料:资料:1.1.应变量为反映某现象发生与不发生应变量为反映某现象发生与不发生的二值变量;的二值变量;2.2.自变量宜全部或大部分为分类变量,自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。可有少数数值变量。分类变量要数量化。LogisticLogistic回归适用范围用途:用途:研究某种疾病或现象发生和多个危险研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。因素(或保护因子)的数量关系。用用 检验(或检验(或u u检验)的检验)的局限性局限性:1.1.只能研究只能研究1 1个危险因素;个危险因素;2.2.只能得出定性结论。只能得出定性结论。分类LogisticLogistic回归多分类资料logistic回归:因变量多分类变量二分类资料logistic回归:因变量二分类变量多项分类logistic回归模型或有序分类logistic回归模型非条件logistic回归-非配比病例-对照研究或队列研究条件logistic回归-配对或配比资料统计学概念队列研究相对危险度(RR)病例对照研究危险度比数比或优势比(OR)队列研究也称前瞻性研究、随访研究等。是一种由因及果的研究,在研究开始时,根据以往有无暴露经历,将研究人群分为暴露人群和非暴露人群,在一定时期内,随访观察和比较两组人群的发病率或死亡率。如果两组人群发病率或死亡率差别有统计学意义,则认为暴露和疾病间存在联系。LogisticLogistic回归研究人群研究人群+-+-比较比较疾病疾病人数人数暴露暴露abcda a/(/(a+ba+b)c c/(/(c+d c+d)相对危险度LogisticLogistic回归RRRR(相对危险度(相对危险度relative riskrelative risk):):表示暴露组与非暴露组发病率(或死亡率)的比值。也称为危险比(risk ratio)。反映了暴露与疾病发生的关联强度。RR表明暴露组发病或死亡的危险是非暴露组的多少倍。相对危险度LogisticLogistic回归RRRR1 1:表示该因素为危险因素,使发病危险度增大:表示该因素为危险因素,使发病危险度增大RRRR1 1:表示该因素为保护因素,使发病危险度减小:表示该因素为保护因素,使发病危险度减小RR=1RR=1:表示该因素对疾病的发病无影响。:表示该因素对疾病的发病无影响。病例对照研究LogisticLogistic回归一种一种由果及因由果及因的回顾性研究,先按的回顾性研究,先按疾病状态疾病状态确定调查对确定调查对象,分为病例和对照两组,然后利用已有的记录、或采用象,分为病例和对照两组,然后利用已有的记录、或采用询问、填写调查表等方式,了解其询问、填写调查表等方式,了解其发病前发病前的的暴露情况暴露情况,并,并进行比较,推测疾病与暴露间的关系。进行比较,推测疾病与暴露间的关系。+-病例病例+-对照对照abcda/(a+b)c/(c+d)比较比较人数人数暴露暴露疾病疾病比数比LogisticLogistic回归比数比LogisticLogistic回归相对危险度相对危险度RRRR的本质是暴露组与非暴露组发病率之比或发病概率之的本质是暴露组与非暴露组发病率之比或发病概率之比。但病例对照研究不能计算发病率,只能计算比值比比。但病例对照研究不能计算发病率,只能计算比值比OROR值。值。OROR与与RRRR的含义是相同的,也是指暴露组的疾病危险性为非暴露组的多的含义是相同的,也是指暴露组的疾病危险性为非暴露组的多少倍。当疾病发病率小于少倍。当疾病发病率小于5%5%时,时,OROR是是RRRR的极好近似值。的极好近似值。OROR11,说明说明 该因素是疾病的危险性增加,为危险因素;该因素是疾病的危险性增加,为危险因素;OROR1,1,说明说明 该因素是疾病的危险性减小,为保护因素;该因素是疾病的危险性减小,为保护因素;举例LogisticLogistic回归例:例:为了探讨冠心病发生的有关危险因素,为了探讨冠心病发生的有关危险因素,对对2626例冠心病病人和例冠心病病人和2828例对照者进行病例例对照者进行病例 对照对照研究,调查记录了研究,调查记录了8 8个可能的危险因素,试用个可能的危险因素,试用LogisticLogistic逐步回归分析方法筛选危险因素,并分逐步回归分析方法筛选危险因素,并分析各自变量的作用大小。析各自变量的作用大小。举例LogisticLogistic回归冠心病冠心病8 8个可能的危险因素与编码说明个可能的危险因素与编码说明 举例LogisticLogistic回归冠心病危险因素病例对照研究原始数据冠心病危险因素病例对照研究原始数据 模型LogisticLogistic回归在在mm个自变量的作用下阳性结果发生的概率记作个自变量的作用下阳性结果发生的概率记作:LogitLogit变换变换 举例LogisticLogistic回归LogisticLogistic模型还有另一种线性化表达形式,称为模型还有另一种线性化表达形式,称为LogitLogit模型模型:模型LogisticLogistic回归常数项:常数项:表示暴露剂量表示暴露剂量 为为0 0时个体发病与不发病概率之时个体发病与不发病概率之比的自然对数。比的自然对数。回归系数:回归系数:表示表示自变量自变量 改变改变一个单位时一个单位时LogiticLogitic(P P)的改变量。的改变量。比数比(OR)LogisticLogistic回归 流行病学衡量危险因素作用大小的比数比指标。流行病学衡量危险因素作用大小的比数比指标。流行病学衡量危险因素作用大小的比数比指标。流行病学衡量危险因素作用大小的比数比指标。计算公式为:计算公式为:计算公式为:计算公式为:OR与与 Logitic(P)的关系的关系LogisticLogistic回归 j j j j 表示表示表示表示 ORORORORj j j j 的自然对数值。的自然对数值。的自然对数值。的自然对数值。模型意义LogisticLogistic回归 模型意义LogisticLogistic回归对于发病率很低的慢性疾病如心脑血管病、恶对于发病率很低的慢性疾病如心脑血管病、恶性肿瘤等,优势比可作为相对危险度(性肿瘤等,优势比可作为相对危险度(relative risk relative risk,RRRR)的近似估计。)的近似估计。即 假设检验LogisticLogistic回归检验假设为:H0:所有 H1:常用的检验方法有以下三种:似然比检验Wald检验记分检验似然比检验LogisticLogistic回归原理:最大似然原理:最大似然原理:最大似然原理:最大似然(likelihood)(likelihood)(likelihood)(likelihood)估计估计估计估计 -2ln-2lnL L近似服从近似服从 分布分布 G G=2(ln=2(lnL L1 1-ln-lnL L0 0)=2ln)=2ln(L L1 1/L L0 0)=p-l=p-l自变量X引入回归方程L0、L1若L0/L1=1,则接受H1,拒绝H0.似然比检验LogisticLogistic回归具体方法是:先拟合不包含待检验因素的logistic模型,求对数似然函数值;再拟合包含待检验因素的logistic模型,求另一个对数似然函数值;比较两个对数似然函数值差别的大小Wald检验LogisticLogistic回归记分检验LogisticLogistic回归以未包含某个或几个变量的模型计算保留模以未包含某个或几个变量的模型计算保留模型中参数的估计值,并假设新增参数为零,计型中参数的估计值,并假设新增参数为零,计算似然函数的一价偏导数及信息距阵,两者相算似然函数的一价偏导数及信息距阵,两者相乘便得比分检验的统计量乘便得比分检验的统计量S S。n n 较大时,较大时,S S近似近似服从自由度为待检因素个数的服从自由度为待检因素个数的 分布。分布。比较LogisticLogistic回归以上三种方法中,在多数情况下,以上三种方法中,在多数情况下,似然比似然比检验是最有效的检验检验是最有效的检验,记分检验一般与它相,记分检验一般与它相一致。但两者计算量均较大;一致。但两者计算量均较大;WaldWald检验检验主要用于对单个回归系数的检验,主要用于对单个回归系数的检验,但是但是WaldWald检验未考虑各因素间的综合作用,检验未考虑各因素间的综合作用,比较保守,在因素间有共线性存在时比较保守,在因素间有共线性存在时,结果不结果不像其它两者可靠像其它两者可靠。一般过程LogisticLogistic回归变量的选择变量的选择建立建立logisticlogistic回归模型时,要求进入模型的自变回归模型时,要求进入模型的自变量应对反应变量有解释能力。通常研究者根据量应对反应变量有解释能力。通常研究者根据专业知识和研究的问题,首先确定要研究的反专业知识和研究的问题,首先确定要研究的反应变量和自变量应变量和自变量单因素分析单因素分析(变量的粗略选择变量的粗略选择)用单因素分析对自变量进行筛选:卡方检验、用单因素分析对自变量进行筛选:卡方检验、t t检验或单因素的检验或单因素的logisticlogistic回归回归 一般过程LogisticLogistic回归 条件logistic回归LogisticLogistic回归病例与对照匹配病例与对照匹配即要求对照在即要求对照在某些因素或特征某些因素或特征上与病例上与病例保保持一致持一致,目的目的是对两组比较时是对两组比较时排除混杂因排除混杂因素素的干扰。匹配分为成组匹配和个体匹配。的干扰。匹配分为成组匹配和个体匹配。条件logistic回归LogisticLogistic回归1、成组匹配(category matching):匹配的因素所占的比例,在对照组和在病例组一致。如病例组中男女各半,65岁以上者占1/3,则对照组也是如此。2、个体匹配(individual matching):以病例和对照的个体为单位进行匹配叫个体匹配,每一个病例与M个与它条件相一致的对照形成一个匹配组。1:1匹配又叫配对(pair matching),1:2,1:m匹配时称为匹配。匹配的特征必须是已知的混杂因子,或者有充分的理由怀疑其为混杂因子,否则不应匹配。条件logistic回归LogisticLogistic回归 应用LogisticLogistic回归矫正混杂因素矫正混杂因素筛选影响因素筛选影响因素疾病预测和预后疾病预测和预后ROCROC曲线曲线涵义与起源ROCROC曲线曲线ROCROC【receiver(relative)operating characteristicreceiver(relative)operating characteristic的缩的缩写,译为写,译为“接受者工作特征接受者工作特征”】ROCROC曲线研究历史曲线研究历史1950s 1950s 雷达信号观测能力评价雷达信号观测能力评价1960s1960s中期中期 实验心理学、心理物理学实验心理学、心理物理学1970s1970s末与末与1980s1980s初初 诊断医学诊断医学诊断试验评价四格表ROCROC曲线曲线待评价的诊断方待评价的诊断方法法标准诊断方法标准诊断方法合计合计有病(阳性)有病(阳性)无病(阴性)无病(阴性)有病(阳性)有病(阳性)a a(真阳性)(真阳性)b b(假阳性)(假阳性)a+ba+b无病(阴性)无病(阴性)c c(假阳性)(假阳性)d d(真阴性)(真阴性)c+dc+d合计合计a+ca+cb+db+dn n(=a+b+c+d=a+b+c+d)灵敏度:真阳性率灵敏度:真阳性率,表示实际患病者且被待评价的诊断方法,表示实际患病者且被待评价的诊断方法诊断为患者的概率,反映了待评价的诊断方法检出患者能力诊断为患者的概率,反映了待评价的诊断方法检出患者能力Se=a/(a+c)Se=a/(a+c)特异度:真阴性率特异度:真阴性率,表示实际未患病患者且被待评价的诊断,表示实际未患病患者且被待评价的诊断方法诊断为非患者的概率,反映了待评价的诊断方法检出非患者方法诊断为非患者的概率,反映了待评价的诊断方法检出非患者的能力的能力Sp=d/(b+d)Sp=d/(b+d)ROC曲线ROCROC曲线曲线1-1-特异度特异度灵灵敏敏度度ROC曲线分析中将不同诊断分界点下的灵敏度和(1-特异度)确定为曲线上的一个操作点,灵敏度为纵坐标,(1-特异度)为横坐标。参考线参考线曲线下面积ROCROC曲线曲线ROC曲线下面积(AUC):用于定量地反应诊断试验的准确性大小。取值范围0.51.ROC曲曲线下面下面积(Area)与)与诊断准确度高低断准确度高低高 0.90-1.00=excellent(A)中 0.80-0.90=good(B)0.70-0.80=fair(C)低 0.60-0.70=poor(D)0.50-0.60=fail(F)举例ROCROC曲线曲线例:为评价放射科医生的诊断能力,某医生对60分肺结节(病理结果良性19例,恶性41例)的CT图像进行诊断。诊断结果为肯定良性,可疑良性、难以确定、可疑恶性、肯定恶性5个等级,分别用评分15表示,结果如表所示,试评价该医生利用CT影像诊断肺结节的能力。病理结果医生诊断评分合计12345良性7363019恶性005251141谢谢!

    注意事项

    本文(《logistic回归》PPT课件.ppt)为本站会员(wuy****n92)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开