多元统计分析方法讲稿.ppt
《多元统计分析方法讲稿.ppt》由会员分享,可在线阅读,更多相关《多元统计分析方法讲稿.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元统计分析方法第一页,讲稿共四十九页哦生存分析生存分析Survival Analysis第十章第十章第二页,讲稿共四十九页哦主要内容主要内容 什么是生存分析?什么是生存分析?生存分析的基本概念生存分析的基本概念 生存分析的基本方法生存分析的基本方法 非参数分析方法非参数分析方法 Cox Cox比例风险回归分析方法比例风险回归分析方法 生存分析的注意事项生存分析的注意事项第三页,讲稿共四十九页哦数据的收集方式:数据的收集方式:横断面数据横断面数据(cross-sectional data)在同一个时间点上收集的数据;在同一个时间点上收集的数据;纵断面数据纵断面数据(longitudinal d
2、ata)在连续的若干个时间点上收集的数据。在连续的若干个时间点上收集的数据。-随防数据:随防数据:50个人的术后存活时间个人的术后存活时间 -时间序列数据:近时间序列数据:近20年每年的肺癌死亡率年每年的肺癌死亡率第四页,讲稿共四十九页哦 在医学研究中,常常用追踪在医学研究中,常常用追踪(follow up)的的 方式来研究方式来研究事物发展的规律。例如:事物发展的规律。例如:了解某药物的疗效了解某药物的疗效 了解手术后的存活时间了解手术后的存活时间 了解某医疗仪器设备的使用寿命了解某医疗仪器设备的使用寿命 这种研究的特点是追踪研究的现象都要经过一段这种研究的特点是追踪研究的现象都要经过一段时
3、间,统计学上将这段时间称为生存时间。时间,统计学上将这段时间称为生存时间。第五页,讲稿共四十九页哦 生存分析就是用来研究生存时间的分布规律以及生生存分析就是用来研究生存时间的分布规律以及生存时间和相关因素之间关系的一种统计分析方法。存时间和相关因素之间关系的一种统计分析方法。一、什么是生存分析?一、什么是生存分析?第六页,讲稿共四十九页哦二、生存分析的基本概念二、生存分析的基本概念A)生存时间生存时间B)生存时间数据的类型生存时间数据的类型C)生存时间数据的特点生存时间数据的特点D)生存分析资料的收集方法生存分析资料的收集方法E)描述生存时间分布规律的函数描述生存时间分布规律的函数F)生存分析
4、的主要研究内容生存分析的主要研究内容第七页,讲稿共四十九页哦A)生存时间生存时间(survival time):从某起始事件起到某终止事件止所经历的时间跨度称从某起始事件起到某终止事件止所经历的时间跨度称为生存时间。例如,为生存时间。例如,o在临床研究中,急性白血病患者从骨髓移植治疗开始到在临床研究中,急性白血病患者从骨髓移植治疗开始到复发为止之间的时间间隔。复发为止之间的时间间隔。o冠心病患者在两次发作之间的时间间隔。冠心病患者在两次发作之间的时间间隔。o在流行病学研究中,从开始接触某危险因素到发病所经历的在流行病学研究中,从开始接触某危险因素到发病所经历的时间。时间。o在动物实验研究中,从
5、开始给药到发生死亡所经历的时在动物实验研究中,从开始给药到发生死亡所经历的时间。间。第八页,讲稿共四十九页哦B)生存时间数据的类型生存时间数据的类型1)完全数据完全数据(complete data):它准确地度量:它准确地度量了观察对象实际生存的时间。了观察对象实际生存的时间。2)截尾数据截尾数据(censored data):它没有准确地度:它没有准确地度量观察对象实际生存的时间。例如,量观察对象实际生存的时间。例如,o在随访过程中某些观察对象失访;在随访过程中某些观察对象失访;o或死于其它原因;或死于其它原因;o或在规定的研究过程结束时观察对象的终止事或在规定的研究过程结束时观察对象的终止
6、事件还未发生。件还未发生。第九页,讲稿共四十九页哦C)生存时间数据的特点:生存时间数据的特点:1)所有观察值取值非负)所有观察值取值非负 2)存在截尾数据)存在截尾数据D)生存分析资料的收集方法:生存分析资料的收集方法:1)确定随访内容(指标变量)确定随访内容(指标变量)2)确定随访人数(样本数)确定随访人数(样本数)3)确定随访的起始和终止时间)确定随访的起始和终止时间o同时开始,同时结束同时开始,同时结束o不同时间开始,同时结束不同时间开始,同时结束o不同时间开始,不同时间结束不同时间开始,不同时间结束第十页,讲稿共四十九页哦E)描述生存时间分布规律的函数:描述生存时间分布规律的函数:1、
7、生存函数、生存函数 2、死亡函数死亡函数 3、死亡密度函数死亡密度函数 4、风险函数风险函数第十一页,讲稿共四十九页哦1.生存函数生存函数S(t):观察对象的生存时间:观察对象的生存时间T大于某时刻大于某时刻 t 的的概率称为生存函数概率称为生存函数(survival function)。S(t)满足条件:满足条件:S(0)=1,S()=0,且,且0S(t)1。2.死亡函数死亡函数F(t):观察对象的生存时间:观察对象的生存时间T不大于某时刻不大于某时刻 t 的概率称为死亡函数的概率称为死亡函数(failure function)。F(t)满足满足条件:条件:F(0)=0,F()=1,且,且0
8、F(t)1。第十二页,讲稿共四十九页哦3.死亡密度函数死亡密度函数f(t):观察对象在某时刻:观察对象在某时刻t 的瞬时死亡的瞬时死亡率称为死亡密度函数率称为死亡密度函数(failure density function)。4.风险函数风险函数h(t):生存到时刻:生存到时刻 t 的观察对象在时刻的观察对象在时刻t 的瞬时的瞬时死亡率称为风险函数死亡率称为风险函数(hazard function)。第十三页,讲稿共四十九页哦F)生存分析的主要研究内容:生存分析的主要研究内容:1、描述生存过程、描述生存过程2、比较生存过程、比较生存过程3、分析危险因素、分析危险因素4、建立数学模型、建立数学模型
9、第十四页,讲稿共四十九页哦1、描述法、描述法2、非参数分析法、非参数分析法3、参数分析法、参数分析法4、半参数分析法、半参数分析法三、生存分析的基本方法三、生存分析的基本方法第十五页,讲稿共四十九页哦1、描述法、描述法:根据样本观察值提供的信息,直接用公式计算出:根据样本观察值提供的信息,直接用公式计算出每一时间点或每一个时间区间上的生存函数、死亡函数、每一时间点或每一个时间区间上的生存函数、死亡函数、风险函数等,并采用列表或绘图的形式来显示生存时间的风险函数等,并采用列表或绘图的形式来显示生存时间的分布规律。分布规律。o优点:方法简单,且对数据的分布无要求。优点:方法简单,且对数据的分布无要
10、求。o缺点:缺点:1)不能比较两组或多组生存时间分布函数的区别;不能比较两组或多组生存时间分布函数的区别;2)不能分析危险因素对生存时间的影响;不能分析危险因素对生存时间的影响;3)不能建立生存时间与危险因素之间的关系模型。不能建立生存时间与危险因素之间的关系模型。第十六页,讲稿共四十九页哦例例1、某研究者收集了两组急性淋巴细胞性白血病患者治疗后的随、某研究者收集了两组急性淋巴细胞性白血病患者治疗后的随访资料,其中,有淋巴结浸润组访资料,其中,有淋巴结浸润组(LA)18人,无淋巴结浸润组人,无淋巴结浸润组(NLA)25人。生存时间人。生存时间T(月月)的数据如下。的数据如下。协变量为淋巴结状态
11、协变量为淋巴结状态(SLN),负数代表截尾数据。,负数代表截尾数据。LA组:组:1,2,3,4,5,7,8,9,10,11,13,14,15,18,-19,-20,-21,23NLA组:组:1,2,3,4,5,7,8,9,10,11,13,14,15,18,19,-20,21,23,26,28,31,37,66,73,-124第十七页,讲稿共四十九页哦 Standard Number Number Standard Number Number T Survival Failure Error Failed Left T Survival Failure Error Failed Left 0.
12、000 1.0000 0 0 0 18 0.000 1.0000 0 0 0 18 1.000 0.9444 0.0556 0.0540 1 17 1.000 0.9444 0.0556 0.0540 1 17 2.000 0.8889 0.1111 0.0741 2 16 2.000 0.8889 0.1111 0.0741 2 16 3.000 0.8333 0.1667 0.0878 3 15 3.000 0.8333 0.1667 0.0878 3 15 4.000 0.7778 0.2222 0.0980 4 14 4.000 0.7778 0.2222 0.0980 4 14 5.
13、000 0.7222 0.2778 0.1056 5 13 5.000 0.7222 0.2778 0.1056 5 13 7.000 0.6667 0.3333 0.1111 6 12 7.000 0.6667 0.3333 0.1111 6 12 8.000 0.6111 0.3889 0.1149 7 11 8.000 0.6111 0.3889 0.1149 7 11 9.000 0.5556 0.4444 0.1171 8 10 9.000 0.5556 0.4444 0.1171 8 10 10.000 0.5000 0.5000 0.1179 9 9 10.000 0.5000
14、0.5000 0.1179 9 9 11.000 0.4444 0.5556 0.1171 10 8 11.000 0.4444 0.5556 0.1171 10 8 13.000 0.3889 0.6111 0.1149 11 7 13.000 0.3889 0.6111 0.1149 11 7 14.000 0.3333 0.6667 0.1111 12 6 14.000 0.3333 0.6667 0.1111 12 6 15.000 0.2778 0.7222 0.1056 13 5 15.000 0.2778 0.7222 0.1056 13 5 18.000 0.2222 0.77
15、78 0.0980 14 4 18.000 0.2222 0.7778 0.0980 14 4 19.000*.14 3 19.000*.14 3 20.000*.14 2 20.000*.14 2 21.000*.14 1 21.000*.14 1 23.000 0 1.0000 0 15 0 23.000 0 1.0000 0 15 0LA组生存时间分布规律组生存时间分布规律第十八页,讲稿共四十九页哦 Standard Number Number Standard Number Number T Survival Failure Error Failed Left T Survival F
16、ailure Error Failed Left 0.000 1.0000 0 0 0 25 0.000 1.0000 0 0 0 25 1.000 0.9600 0.0400 0.0392 1 24 1.000 0.9600 0.0400 0.0392 1 24 2.000 0.9200 0.0800 0.0543 2 23 2.000 0.9200 0.0800 0.0543 2 23 3.000 0.8800 0.1200 0.0650 3 22 3.000 0.8800 0.1200 0.0650 3 22 4.000 0.8400 0.1600 0.0733 4 21 4.000 0
17、.8400 0.1600 0.0733 4 21 5.000 0.8000 0.2000 0.0800 5 20 5.000 0.8000 0.2000 0.0800 5 20 7.000 0.7600 0.2400 0.0854 6 19 7.000 0.7600 0.2400 0.0854 6 19 8.000 0.7200 0.2800 0.0898 7 18 8.000 0.7200 0.2800 0.0898 7 18 9.000 0.6800 0.3200 0.0933 8 17 9.000 0.6800 0.3200 0.0933 8 17 10.000 0.6400 0.360
18、0 0.0960 9 16 10.000 0.6400 0.3600 0.0960 9 16 11.000 0.6000 0.4000 0.0980 10 15 11.000 0.6000 0.4000 0.0980 10 15 13.000 0.5600 0.4400 0.0993 11 14 13.000 0.5600 0.4400 0.0993 11 14NLA组生存时间分布规律组生存时间分布规律第十九页,讲稿共四十九页哦 Standard Number Number Standard Number Number T Survival Failure Error Failed Left
19、T Survival Failure Error Failed Left 14.000 0.5200 0.4800 0.0999 12 13 14.000 0.5200 0.4800 0.0999 12 13 15.000 0.4800 0.5200 0.0999 13 12 15.000 0.4800 0.5200 0.0999 13 12 18.000 0.4400 0.5600 0.0993 14 11 18.000 0.4400 0.5600 0.0993 14 11 19.000 0.4000 0.6000 0.0980 15 10 19.000 0.4000 0.6000 0.09
20、80 15 10 20.000*.15 9 20.000*.15 9 21.000 0.3556 0.6444 0.0966 16 8 21.000 0.3556 0.6444 0.0966 16 8 23.000 0.3111 0.6889 0.0942 17 7 23.000 0.3111 0.6889 0.0942 17 7 26.000 0.2667 0.7333 0.0906 18 6 26.000 0.2667 0.7333 0.0906 18 6 28.000 0.2222 0.7778 0.0857 19 5 28.000 0.2222 0.7778 0.0857 19 5 3
21、1.000 0.1778 0.8222 0.0793 20 4 31.000 0.1778 0.8222 0.0793 20 4 37.000 0.1333 0.8667 0.0708 21 3 37.000 0.1333 0.8667 0.0708 21 3 66.000 0.0889 0.9111 0.0596 22 2 66.000 0.0889 0.9111 0.0596 22 2 73.000 0.0444 0.9556 0.0433 23 1 73.000 0.0444 0.9556 0.0433 23 1 124.000*.23 0 124.000*.23 0NLA组生存时间分布
22、规律(续)组生存时间分布规律(续)第二十页,讲稿共四十九页哦Survival Function EstimatesSurvival Function Estimates 1.0+*1.0+*|*|*SDF|*N SDF|*N|L*N|L*N|L*NN|L*NN 0.5+LLNNN 0.5+LLNNN|LL NNNN|LL NNNN|LLL NNN|LLL NNN|L-L N-N-N|L-L N-N-N|N-N-N|N-N-N 0.0+L N 0.0+L N -+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-0 10 20 30 40 50 60 70 8
23、0 90 100 0 10 20 30 40 50 60 70 80 90 100 Time Time无淋巴结浸润患者无淋巴结浸润患者(N)比比有淋巴结浸润患者有淋巴结浸润患者(L)的的平均生存时间长。平均生存时间长。两组急性淋巴细胞性白血病患者治疗后的生存时间比较两组急性淋巴细胞性白血病患者治疗后的生存时间比较第二十一页,讲稿共四十九页哦2、非参数法、非参数法:估计生存函数时对生存时间的分布没有:估计生存函数时对生存时间的分布没有要求,并且检验危险因素对生存时间的影响时采用要求,并且检验危险因素对生存时间的影响时采用的是非参数检验方法。例如,乘积极限法和寿命表的是非参数检验方法。例如,乘积极
24、限法和寿命表法。法。o优点:优点:1)可以估计生存函数;可以估计生存函数;2)可以比较两组或多组生存布函数;可以比较两组或多组生存布函数;3)可以分析危险因素对生存时间的影响;可以分析危险因素对生存时间的影响;4)对生存时间的分布没有要求。对生存时间的分布没有要求。o缺点:不能建立生存时间与危险因素之间缺点:不能建立生存时间与危险因素之间依存关系的数学模型。依存关系的数学模型。第二十二页,讲稿共四十九页哦两种非参数生存分析方法两种非参数生存分析方法乘积极限法(乘积极限法(PL法)法):适用于离散数据,它用于建立时刻:适用于离散数据,它用于建立时刻 t 上的生存上的生存函数。函数。PL法是根据法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 方法 讲稿
限制150内