生存分析1学习.pptx
《生存分析1学习.pptx》由会员分享,可在线阅读,更多相关《生存分析1学习.pptx(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节生存时间资料的特点第二节小样本生存率的kaplan-Meier估计第三节大样本生存率的寿命表法估计第四节生存曲线比较的假设检验第1页/共44页第一节生存时间资料的特点一、数据结构二、统计描述指标三、资料要求第2页/共44页一、数据结构一、数据结构在临床医学中,对病人疗效考查:1.治疗结局?2.生存时间?第3页/共44页 “生存时间生存时间”的概念的概念 开始事件开始事件 终点事件终点事件 生物生存生物生存 死亡死亡 生存时间生存时间电脑开始使用正常 出现故障 疾病产生 治愈疾病治愈 复发 阴性 阳性第4页/共44页生存时间的三个要点生存时间的三个要点一、起始事件二、终点事件三、生存时间第
2、5页/共44页医学例子:起始事件医学例子:起始事件 随访时间随访时间 终点事件终点事件疾病确诊死亡治疗开始 死亡治疗开始 痊愈接触危险物 出现反应治愈出院 复发广义的广义的“生存时间生存时间”也可为医也可为医疗费用(元)、疗费用(元)、医疗设备使用次数、车辆行驶总医疗设备使用次数、车辆行驶总里程里程(公里公里)等等 第6页/共44页随访(随访(follow-up)资料的记录资料的记录生存资料一般通过随访收集,记录的项目:(起始与终止)随访事件生存时间(开始观察日期与终止观察日期)(年、月、天、小时、分、秒等)分组变量(处理方法)和其它协变量(性别、年龄、职业、文化程度等)第7页/共44页月 份
3、(2000年)图12-1 生存时间原始记录示意(+截尾)天 数图12-2 生存时间排序整理数据示意01167第8页/共44页生存时间资料的特点生存时间资料的特点 2个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等)删失(截尾)数据:在规定的观察期内,对某些观察对象由于某种原因未能观察到死亡结局,并不知道确切的生存时间,称为生存时间的删失数据(censoreddata)。如表12-1中的1号和3号病人未观察到底,不知他们究竟能活多长时间。产生结尾原因:(1)迁移(2)死于其他原因(3)因其他客观原因中途退出(4)研究结束时终点事件尚未发生分布类型复杂:生存时间分布不服从正态分布
4、,常常呈正偏态分布、Weibull分布、Gamma分布或更为复杂的分布,因此要用特殊的统计方法。第9页/共44页2个效应变量(1)生存时间(天数),(2)结局(死亡与否、是否阳性等)错误1:忽略生存时间,采用Logistic回归分析死亡率错误2:忽略结局,采用t检验、线性回归分析生存时间第10页/共44页得不到确切的生存时间,但它们提供的生存时间长于观察期的时间,这种数据为不完全数据。或截尾数据、删失数据或终检值。(如有确切的生存时间,则这种数据称为完全数据。)两种错误的做法:错误1:丢弃截尾数据,只考虑确切数据。(损失了信息)错误2:将截尾数据当作确切数据处理。(低估了生存时间的平均水平)。
5、截尾截尾(删失删失)数据或终检值数据或终检值(censored data)(censored data)第11页/共44页两种错误的做法:错误1:采用平均生存时间而不是采用中位生存时间来表示生存时间的平均水平。错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间)正偏正偏态态(positive skewnesspositive skewness)数据数据第12页/共44页二、生存分析的统计描述指二、生存分析的统计描述指标标1.死亡概率、生存概率死亡概率、生存概率2.生存率及其标准误生存率及其标准误3.半数生存期(中位数)半数生存期(中位数)及四分位数间距及
6、四分位数间距第13页/共44页例1手术治疗60例肺癌病人,术后每年死亡10例,无删失。试求基本生存分析指标。N=60;术后 年内 年内 年初 年 死亡死亡 死亡死亡 生存生存 (t+1)年年 年 死亡 截尾 观察 平均 率率 概率概率 概率概率 生存率生存率 数 例数 例数 例数 例数 p=1-q t d c n0 n=no-d/2 m=d/n q=d/n0(n0-d)/n0 (n0-d)/N(1)(2)(3)(4)(5)(6)(7)(8)(9)0 10 0 60 55 .181 .167 .833 .833 1 10 0 50 45 .222 .200 .800 .667 2 10 0 40
7、 35 .286 .250 .750 .500 3 10 0 30 25 .400 .333 .667 .333 4 10 0 20 15 .667 .500 .500 .167第14页/共44页1.死亡率、死亡概率、生存概率(1)死亡率(mortalityrate,deathrate)表示某单位时间内的死亡强度。年平均人口数=(年初人口数+年末人口数)/2第15页/共44页(2)死亡概率(mortalityprobability)是指单位时段开始时存活的个体到该时段结束时死亡的可能性,即死于某时段tt+n内的概率。d/n0年内有删失,分母用校正人口数:校正人口数=年初人口数删失例数/2n0c
8、/2第16页/共44页(3)生存概率(survivalprobability)指某单位时段开始时存活的个体到该时段结束时仍存活的可能性的大小。(n0-d)/n0分子为年末尚存人数,若年内有删失,分母用校正人口数。第17页/共44页生存率(survival rate)(累积生存概率 cumulative probability of survival)指病人经历t个单位时间后仍存活的概率。生存概率指单个时段的概率,生存率指从0t多个时段的积累概率。2.生存率及其生存率及其标准误标准误第18页/共44页生存率与生存概率仅一字之差,含义却是不同的。生存概率是针对单位时间而言的,生存率是针对某个较长时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生存 分析 学习
限制150内