生存时间的非参数分析方法.ppt
《生存时间的非参数分析方法.ppt》由会员分享,可在线阅读,更多相关《生存时间的非参数分析方法.ppt(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、华华科科大大同同济济医医学学院院公公卫卫流流统统系系生存时间资料的非参数分析方法 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望华华科科大大同同济济医医学学院院公公卫卫流流统统系系目录目录第一节生存时间资料的特点第一节生存时间资料的特点第二节小样本生存率的第二节小样本生存率的kaplan-Meier估计估计第三节大样本生存率的寿命表法估计第三节大样本生存率的寿命表法估计第四节第四节生存曲线比较的假设检验生存曲线比较的假设检验华华科科大大同同济济医医学学院院公公卫卫
2、流流统统系系第一节生存时间资料的特点第一节生存时间资料的特点一、数据结构一、数据结构二、统计描述指标二、统计描述指标三、资料要求三、资料要求华华科科大大同同济济医医学学院院公公卫卫流流统统系系一、数据结构在临床医学中在临床医学中,对病人疗效考查:对病人疗效考查:1.治疗结局?治疗结局?2.生存时间?生存时间?华华科科大大同同济济医医学学院院公公卫卫流流统统系系 “生存时间生存时间”的概念的概念 开始事件开始事件 终点事件终点事件 生物生存生物生存 死亡死亡 生存时间生存时间电脑开始使用正常 出现故障 疾病产生 治愈疾病治愈 复发 阴性 阳性华华科科大大同同济济医医学学院院公公卫卫流流统统系系生
3、存时间的三个要点一、起始事件二、终点事件三、生存时间 华华科科大大同同济济医医学学院院公公卫卫流流统统系系医学例子:起始事件 随访时间 终点事件疾病确诊疾病确诊死亡死亡治疗开始 死亡治疗开始 痊愈接触危险物 出现反应治愈出院 复发广义的广义的“生存时间生存时间”也可为医疗费用(元)、也可为医疗费用(元)、医疗设备使用次数、车辆行驶总里程医疗设备使用次数、车辆行驶总里程(公里公里)等等 华华科科大大同同济济医医学学院院公公卫卫流流统统系系随访(follow-up)资料的记录生存资料一般通过随访收集,生存资料一般通过随访收集,记录的项目:记录的项目:(起始与终止)随访事件(起始与终止)随访事件生存
4、时间(开始观察日期与终止观察日期)(年、月、生存时间(开始观察日期与终止观察日期)(年、月、天、小时、分、秒等)天、小时、分、秒等)分组变量(处理方法)分组变量(处理方法)和其它协变量(性别、年龄、职业、文化程度等)和其它协变量(性别、年龄、职业、文化程度等)华华科科大大同同济济医医学学院院公公卫卫流流统统系系月 份(2000年)图12-1 生存时间原始记录示意(+截尾)天 数图12-2 生存时间排序整理数据示意01167华华科科大大同同济济医医学学院院公公卫卫流流统统系系生存时间资料的特点生存时间资料的特点2个效应变量个效应变量(1)生存时间)生存时间(天数天数),(,(2)结局)结局(死亡
5、与否、死亡与否、是否阳性等是否阳性等)截尾数据截尾数据:如表:如表12-1中的中的1号和号和3号病人未观察到底,不知他们究号病人未观察到底,不知他们究竟能活多长时间。竟能活多长时间。产生结尾原因:产生结尾原因:(1)迁移迁移(2)死于其他原因死于其他原因(3)因其他客观原因中途退出因其他客观原因中途退出(4)预定终止结果迟迟不发生预定终止结果迟迟不发生分布类型复杂分布类型复杂:生存时间分布常呈正偏态分布:生存时间分布常呈正偏态分布华华科科大大同同济济医医学学院院公公卫卫流流统统系系2个效应变量个效应变量(1)生存时间)生存时间(天数天数),(,(2)结局结局(死亡与否、是否阳性等死亡与否、是否
6、阳性等)错误错误1:忽略生存时间,采用:忽略生存时间,采用Logistic回归分析死亡率回归分析死亡率错误错误2:忽略结局,采用:忽略结局,采用t检验、线性回归分析生存时间检验、线性回归分析生存时间华华科科大大同同济济医医学学院院公公卫卫流流统统系系What is Censoring?(截尾问题)Follow-up TimeSubject1001011021031041051234567 x x xTrialStopped x o oX indicates event0 indicates loss to follow-up华华科科大大同同济济医医学学院院公公卫卫流流统统系系得不到确切的生存时
7、间,但它们提供的生存时间长于得不到确切的生存时间,但它们提供的生存时间长于观察期的时间,这种数据为观察期的时间,这种数据为不完全数据不完全数据。或截尾数据、删失。或截尾数据、删失数据或终检值。数据或终检值。(如有确切的生存时间,则这种数据称为(如有确切的生存时间,则这种数据称为完全数据完全数据。)。)两种错误的做法:错误错误1:丢弃截尾数据,只考虑确切数据。(损失了信息)错误错误2:将截尾数据当作确切数据处理。(低估了生存时间的平均水平)。截尾(删失删失)数据或终检值(censored data)华华科科大大同同济济医医学学院院公公卫卫流流统统系系两种错误的做法:错误错误1:采用平均生存时间而
8、不是采用中位生存时中位生存时间间来表示生存时间的平均水平。错误错误2:采用常规t检验或方差分析进行组间比较。(应采用log-rank检验比较几组生存时间)正偏态(positive skewness)数据华华科科大大同同济济医医学学院院公公卫卫流流统统系系二、生存分析的统计描述指标二、生存分析的统计描述指标1.死亡概率、生存概率2.生存率及其标准误3.半数生存期(中位数)及四分位数间距华华科科大大同同济济医医学学院院公公卫卫流流统统系系例1 手术治疗60例肺癌病人,术后每年死亡10例,无删失。试求基本生存分析指标。N=60注意:死亡率与死亡概率的分子相同,但分母不同;生存概率与生存率的分子相同,
9、但分母不同术后 年内 年内 年初 年 死亡 死亡 生存 (t+1)年 年 死亡 截尾 观察 平均 率 概率 概率 生存率 数 例数 例数 例数 例数 p=1-q t d c n0 n=no-d/2 m=d/n q=d/n0(n0-d)/n0 (n0-d)/N(1)(2)(3)(4)(5)(6)(7)(8)(9)0 10 0 60 55 .185 .167 .833 .833 1 10 0 50 45 .222 .200 .800 .667 2 10 0 40 35 .286 .250 .750 .500 3 10 0 30 25 .400 .333 .667 .333 4 10 0 20 15
10、 .667 .500 .500 .167华华科科大大同同济济医医学学院院公公卫卫流流统统系系1.死亡率、死亡概率、生存概率死亡率、死亡概率、生存概率(1)死亡率 (mortality rate,death rate)表示某单位时间内的死亡强度。年平均人口数=(年初人口数+年末人 口数)华华科科大大同同济济医医学学院院公公卫卫流流统统系系(2)死亡概率(mortality probability)指死于某时段内的可能性大小。d/n0 年内有删失,分母用校正人口数:校正人口数=年初人口数删失例数/2 n0c/2 华华科科大大同同济济医医学学院院公公卫卫流流统统系系(3)生存概率(survival
11、probability)指某单位时段开始时存活的个体到该时段结束时仍存活的可能性的大小。(n0-d)/n0 分子为年末尚存人数,若年内有删失,分母用校正人口数。华华科科大大同同济济医医学学院院公公卫卫流流统统系系生存率(survival rate)(累积生存概率 cumulative probability of survival)指病人经历t个单位时间后仍存活的概率。生存概率指单个时段的概率,生存率指从0t多个时段的积累概率。2.生存率及其标准误华华科科大大同同济济医医学学院院公公卫卫流流统统系系公式1 用于完全数据(n0-d)/N公式2用于 删失数据以及完全数据S(t)=P(T tk)=p
12、1 p2 pk 华华科科大大同同济济医医学学院院公公卫卫流流统统系系例如手术治疗50例肺癌病人,术后1,2,3年的 死亡数分别为10,10,10例,无截尾数据。试求各年的 生存概率和3年生存率。解:各年生存概率 p1=(50 10)/50,p2=(40 10)/40,p3=(30 10)/30 3 年生存率 S(3)=P(T 3)(n0-d)/N=(50 30)/50=0.0004 或 S(3)=p1 p2 p3 =0.4000 华华科科大大同同济济医医学学院院公公卫卫流流统统系系生存率的标准误 生存率置信区间 华华科科大大同同济济医医学学院院公公卫卫流流统统系系生存曲线 以生存时间为横轴,生
13、存率为纵轴绘制的曲线 (a)研究终止在475天 (b)研究终止在474天图12-3 乘积极限法生存曲线(阶梯形阶梯形)及其半数生存期(Md=158天)图12-4 寿命表法生存曲线(折线折线)及其半数生存期(Md=1.7年)华华科科大大同同济济医医学学院院公公卫卫流流统统系系生存曲线给我们的信息阶梯状;每一级阶梯代表一个死亡时间点阶梯状;每一级阶梯代表一个死亡时间点(在截尾时间点无阶在截尾时间点无阶梯梯);如果最大时间点是截尾则生存曲线不与曲线相交(见下;如果最大时间点是截尾则生存曲线不与曲线相交(见下图),否则与横轴相交。图),否则与横轴相交。DeathCensored华华科科大大同同济济医医
14、学学院院公公卫卫流流统统系系MedianSurvival1.8 Years生存曲线给我们的信息华华科科大大同同济济医医学学院院公公卫卫流流统统系系Source:SEER 1992-2000,from Patel et al,Gynecologic Oncology.May 2005;97(2):550-558.56%(A-A)68%(Non-H)71%(H)5-year Survival生存曲线给我们的信息华华科科大大同同济济医医学学院院公公卫卫流流统统系系3.半数生存期及四分位数间距半数生存期也称中位生存期(median survival time)即生存时间中位数,表示50%的个体可存活的
15、时间即生存率为时对应的生存时间(集中趋势指标)。生存期的四分位数间距,反映离散程度大小华华科科大大同同济济医医学学院院公公卫卫流流统统系系三、资料的基本要求三、资料的基本要求1.死亡例数(或死亡比例)不宜太少,否则宜出现偏性;2.截尾原因无偏性;3.生存时间尽可能记录精确 华华科科大大同同济济医医学学院院公公卫卫流流统统系系生存率估计生存率估计常用的两种方法:1.乘积极限法,即kaplan-Meier法(小样本时)2.寿命表法 (大样本时)华华科科大大同同济济医医学学院院公公卫卫流流统统系系第二节小样本生存率的第二节小样本生存率的kaplan-Meier估计估计华华科科大大同同济济医医学学院院
16、公公卫卫流流统统系系乘积极限法又又称称Kaplan-Meier法法适适用用于于小样本资料。小样本资料。基基本本思思想想:将将生生存存时时间间由由小小到到大大依依次次排排列列,在在每每个个死死亡亡点点上上,计计算算其其期期初初人人数数、死死亡亡人人数数、死死亡亡概概率率、生生存存概概率率和生存率。和生存率。华华科科大大同同济济医医学学院院公公卫卫流流统统系系华华科科大大同同济济医医学学院院公公卫卫流流统统系系 (a)研究终止在475天 (b)研究终止在474天图12-3 乘积极限法生存曲线(阶梯形阶梯形)及其半数生存期(Md=158天)00华华科科大大同同济济医医学学院院公公卫卫流流统统系系第三
17、节第三节大样本生存率的大样本生存率的寿命表法估计寿命表法估计寿命表法寿命表法(life-tablemethod)的应用早的应用早于于KaplanMeier法,它是法,它是KaplanMeier法的近似方法法的近似方法(频数表法频数表法)华华科科大大同同济济医医学学院院公公卫卫流流统统系系华华科科大大同同济济医医学学院院公公卫卫流流统统系系图图12-4寿命表法生存曲线寿命表法生存曲线(折线折线)及其半数生存期(及其半数生存期(Md=1.7年)年)寿命表法只估计时段右端点的生右端点的生存率存率,省略了时段内的生存率估计 华华科科大大同同济济医医学学院院公公卫卫流流统统系系第四节第四节生存曲线比较的
18、生存曲线比较的假设检验假设检验1.Logrank(时序时序)检验检验(也称为(也称为Cox-Mantel检验)检验)2.Breslow检验检验(也称(也称Breslow广义广义Wilcoxon检验检验)华华科科大大同同济济医医学学院院公公卫卫流流统统系系共19例(其中大细胞肺癌10例),其中有两个42天通过KaplanMeier方法得到:大细胞肺癌组中位生存时间为115天天,95置信区间为42186天;鳞状细胞肺癌组为254天天,95置信区间为165458 华华科科大大同同济济医医学学院院公公卫卫流流统统系系期初人数华华科科大大同同济济医医学学院院公公卫卫流流统统系系华华科科大大同同济济医医学
19、学院院公公卫卫流流统统系系图 Kaplan-Meier生存曲线 华华科科大大同同济济医医学学院院公公卫卫流流统统系系绘制绘制Kaplan-Meier生存曲生存曲线的常见错误:线的常见错误:在图中不标记删失的数据点。在图中不标记删失的数据点。华华科科大大同同济济医医学学院院公公卫卫流流统统系系实现实现KaplanMeier方法与方法与log-rank检验检验PROCLIFETESTMETHOD=kmPLOTS=(S);TIMEtime*censor(1);STRATAgroup;RUN;华华科科大大同同济济医医学学院院公公卫卫流流统统系系data a;input time group censo
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生存 时间 参数 分析 方法
限制150内