Ch生存分析实用.pptx
Chapter 21 生存分析第1页/共34页例 1:为了解结局与潜在的危险因素关系,在1992 年1月1日至2001 年12月31日之间的10年中收集了346 例肠癌患者。Table 1 手术后生存时间第2页/共34页21.1 生存时间的特征生存时间(Survival time)失效时间(Failure time)t:从起点开始到终点事件发生为止的时间长度.生存时间通常不服从正态分布!第3页/共34页21.2 生存率的估计生存率(survival rate)的点估计(Point estimate)乘积极限法(Product-limit method)Kaplan and Meier(1958),也称K-M法例 1 21 例乳癌,10例手术,11 例手术+化疗。试分别估计两种治疗的生存率和生存曲线。第4页/共34页Table 3 生存率的 K-M 估计(乳癌)第5页/共34页生存率的区间估计(Interval estimation)上述第8列是点估计。生存率的标准误(Greenwood 1926)生存率的(1-)置信区间:第6页/共34页生存曲线和中位生存期生存曲线(Survival curve)中位生存期(Median survival time):生存时间的中位数.第7页/共34页21.3 生存曲线间的比较 -时序检验(log-rank test)例2 检验单纯手术患者的生存曲线和手术+化疗患者的生存曲线之间的差异是否具有统计学意义。第8页/共34页Table 4 时序检验 第9页/共34页第10页/共34页例 3 从肠癌数据库中随机抽取 30 例来介绍方法21.4 Cox 回归dtime:被耽误的时间(从诊断到手术)第11页/共34页21.4 Cox 回归log-rank test属于单变量方法:要求两组除处理不同外其他都相同.然而,实践中这一点不容易 满足,于是需要采用多变量方法.生存时间是随机变量,不服从正态分布,所以前面学过的多重线性回归不适用.能否用logistic 回归分析生存时间资料?-生存时间的长度没法分析.多重线性回归和logistic 回归都不能用于生存时间资料的分析.第12页/共34页Cox 回归模型 Cox(1972)比例危险率回归模型(Proportional hazards regression model)-Cox回归或或第13页/共34页 的估计第14页/共34页第15页/共34页第16页/共34页参数的意义第17页/共34页 回到例 3第18页/共34页Cox 回归(-2lnL=104.501)危险因素:dtime 和 age诊断时间耽误 1 个月,死亡风险 增加到 1.238 倍;患者年长一岁,死亡风险 增加到 1.243 倍。结论:早诊断和年轻 会有较好预后。第19页/共34页模型比较 1 个变量:dtime 最好2个变量:age+dtime最好age+dtime 比 dtime 好吗?3个变量比 age+dtime好吗?第20页/共34页比例风险 假定成立吗?比例风险 假定(Proportional Hazards,PH)变量 X 满足 PH 假定吗?根据该变量的数值,将个体分成2组(或多组);(1)分别作这2个组的 K-M 曲线 ;若这2条曲线彼此交叉,则关于 PH的假定不成立.(2)分别作这2个组的曲线 和 若这两条曲线看似平行,则关于 PH的假定成立.第21页/共34页第22页/共34页第23页/共34页 关于 Cox 回归的注意事项:样本:良好设计、代表性抽样、足够的样本量.删失:太多删失会带来偏倚(bias).变量筛选:先用简单的方法(例如,单变量方法)筛去一些变量,然后才把少数几个变量放到模型里去筛选,免得太多变量参与多变量方法的筛选.结论:单变量筛选的结果仅供参考,不要按照单变量筛选的结果下结论.变量选择:一定要和专业知识相结合.第24页/共34页 想一想 Cox 回归和 logistic回归区别何在?第25页/共34页第26页/共34页第27页/共34页第28页/共34页小 结1.生存时间资料的特征 正值 不服从正态分布 有删失2.生存函数(生存曲线)-假定所有个体的寿命服从同一个分布乘积-极限法(Kaplan-Meier 1958)第29页/共34页第30页/共34页第31页/共34页5.logistic 回归和 回归的区别Cox 用于队列研究,不能用于 横断面研究和病例-对照研究,而 logistic 回归既可以用于 横断面研究和病例-对照研究,也可以用于队列研究。Cox 回归分析的反应变量包含两个内容:状态(两个类别,生或死)和生存时间,而 logistic 回归分析的反应变量仅仅是状态(生或死).第32页/共34页第33页/共34页感谢您的欣赏!第34页/共34页