基于非参数分析法研究某型淋巴癌患者生存时间的影响因素.doc
《基于非参数分析法研究某型淋巴癌患者生存时间的影响因素.doc》由会员分享,可在线阅读,更多相关《基于非参数分析法研究某型淋巴癌患者生存时间的影响因素.doc(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、各专业全套优秀毕业设计图纸基于非参数分析法研究某型淋巴癌患者生存时间的影响因素摘要探讨某淋巴肿瘤的手术治疗疗效影响因素。对两组来自某医学论坛的某淋巴肿瘤病人两年内生存时间的观察数据进行生存分析。其中,实验组26例,对照组14例。本文通过SAS软件来实现非参数分析法中乘积极限法拟合给定数据的生存曲线、生存率、死亡率、生存率的标准误、死亡例数和该时间点前的生存例数等数值;以及关于生存时间的描述性统计量,包括75%,50%和25%分位数以及相应的95%的可信区间,还有均数和标准误,从结果可以看出平均生存时间为144.428和95.929天;列出了完全数据,截尾数据的例数,以及截尾数据占全部数据的百分
2、比;以及两组的生存曲线图。用Kaplan-Meier法计算两组的生存率并作生存率曲线图,从两组的生存率曲线可以发现两条样本估计的生存率曲线大约在40天处交叉,在40天之前对照组的患者生存率高于实验组,而40天之后则实验组生存率高于对照组,并且两条生存曲线的差异是比较明显的,这两条交叉生存曲线提示对照组治疗有可能不会很快死亡,但实验组手术不太成功者很快死亡,而实验组手术成功能够存活35天以上的对象可能生存期会较长。log-rank检验是一种假设检验来比较存活两个样品的分布,它是一种非参数检验。本文通过对已知实验数据进行log-rank检验通过对两组生存曲线的比较,得知两组实验中病人的生存时间有很
3、大差异。cox模型用于研究各种因素(称为协变量,或伴随变量等)对于生存期长短的关系,进行多因素分析。本例中sex和age两个变量对生存时间的影响都显著。关键词:淋巴肿瘤 生存分析 log-rank检验 cox模型一、数据来源本文收集了2期的某型淋巴瘤患者的生存时间(天)。分别是:实验组:198,165,105,36,24,64,38,69,84,109,148,176,126,96,192,159,120+,240+,730+,730+,730+,730+,730+,730+,730+,730+,对照组:126,109,76,58,69,63,59,88,65,210+,730+,730+,7
4、30+,730+。以及两组生存时间的影响因素:sex及age。其中sex分为1,2两组,男性为1,女性为2;age分为两个年龄层,小于40岁为1,大于等于40岁为2。二、模型解释生存分析主要包括三种分析方法:非参数分析、半参数分析和参数分析。非参数方法不引入任何的外生变量,仅和确诊后存活时间有关;半参数分析方法,一部分和确诊后存活时间有关,另外一部分和某些外生变量有关,但不依赖于特定的分布假设;而参数分析方法则依赖于特定分布的假设。用表示生存时间,即确诊后存活的时间,则的分布函数为:生存函数定义为生存时间大于给定时间t的概率,其数学表达式为:式中为生存函数或生存率,本文中指的是确诊后存活的时间
5、大于t的概率。生存函数的估计量为:该统计量称为K-M估计量(Kaplan-Meierestimator)。累积风险函数估计量(Nelson-Arden estimator)为:另外一个重要的概念是风险函数,它是指当确诊后存活的时间达到的条件下,在时刻瞬间存活的概率,即:考虑一个离散的情况,设为样本可观察的离散寿命时间。定义是确诊后存活时间在时刻结束的样本个数。在随访时间结束时某些个体还没有发生确诊后存活的称为审查数据。定义是在区间发生右审查的样本个数。定义是在时刻之前处在可能迁移风险中的样本个数,即设是在时刻发生迁移的瞬时概率,一个明显的估计是用确诊后存活时间在时刻结束的样本个数除以时刻之前处
6、在可能发生确诊后存活的样本个数,即:在以上非参数分析方法中,迁移的风险函数只和时间有关,但是在现实生活中影响迁移的因素还有很多,因此还需要考虑其他变量对迁移的影响。可用半参数模型(也称为Cox比例风险模型)进行分析。cox模型假定自变量具有参数形式,而允许基准风险函数不具备特定的形式,常被用来说明变量对生存时间的影响效果。一般形式为:各参数意义:为基准风险函数,表示时点t的本底死亡率,是不确定的;是时点t的死亡率;为回归系数,X为自变量向量。如反映因素x1的作用,使死亡率由增加到。是总体回归系数的估计值,若x1对生存无影响,则理论上=0,=1。(假设:风险率不随时间变化)Kaplan-Meie
7、r估计是常用来估计存活曲线的方法,其乃是用每一事件发生时间点及设限点来设定区间,较适用于一般临床相关研究。三、SAS程序1.非参数法data example1_1;input t c;if t26 then group=2; else group=1;cards;198 1 165 1 105 1 36 1 24 1 64 1 38 1 69 1 84 1 109 1 148 1 176 1 126 1 96 1 192 1 159 1 120 0 240 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 126 1 109 1 76 1 58
8、 1 69 1 63 1 59 1 88 1 65 1 210 0 730 0 730 0 730 0 730 0 ;proc lifetest plots=(s);time t*c(0);strata group;run;2.Kaplan-Meier估计proc lifetest plots=(s) method=pl;time t*c(0);strata group;run;3.log-rank检验data example1_1;do c=1 to 2;input n;do i=1 to n;input time censor ;output;end;end;cards;26198 1 1
9、65 1 105 1 36 1 24 1 64 1 38 1 69 1 84 1 109 1 148 1 176 1 126 1 96 1 192 1 159 1 120 0 240 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 730 0 14126 1 109 1 76 1 58 1 69 1 63 1 59 1 88 1 65 1 210 0 730 0 730 0 730 0 730 0 ;proc lifetest plots=(s);time time*censor(0);strata c;run;4.cox模型data example1_
10、1;do c=1 to 2;input n;do i=1 to n;input time censor sex age ;output;end;end;cards;26198 1 1 1 165 1 1 1 105 1 2 1 36 1 2 2 24 1 2 2 64 1 2 1 38 1 2 2 69 1 1 2 84 1 1 2 109 1 2 1 148 1 1 2 176 1 1 1 126 1 2 1 96 1 1 2 192 1 1 1 159 1 1 1 120 0 1 2 240 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730
11、 0 1 1 730 0 1 1 730 0 1 1 730 0 1 114126 1 1 1 109 1 2 1 76 1 1 2 58 1 2 1 69 1 2 1 63 1 1 2 59 1 1 2 88 1 1 1 65 1 1 2 210 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1 730 0 1 1;proc phreg plots=(s);model time*censor(0)=sex age;strata c;run;四、输出结果及分析1.用乘积极限法估计了生存率(Survival);死亡率(Failure),生存率的标准误(Survival St
12、andard Error),死亡例数(Number Failed)和该时间点前的生存例数(Number Left)。其中带有*号的表示截尾。给出了关于生存时间的描述性统计量,包括75%,50%和25%分位数以及相应的95%的可信区间(95% Confidence Interval),还有均数(Mean)和标准误(Standard Error)从结果可以看出平均生存时间为144.428和95.929天;LIFETEST 过程层 1: c = 1乘积极限生存估计值time生存失效生存标准误差失败数目剩余数目0.0001.00000002624.0000.96150.03850.037712536.
13、0000.92310.07690.052322438.0000.88460.11540.062732364.0000.84620.15380.070842269.0000.80770.19230.077352184.0000.76920.23080.082662096.0000.73080.26920.0870719105.0000.69230.30770.0905818109.0000.65380.34620.0933917120.000*.916126.0000.61300.38700.09601015148.0000.57210.42790.09791114159.0000.53120.
14、46880.09911213165.0000.49040.50960.09951312176.0000.44950.55050.09931411192.0000.40870.59130.09831510198.0000.36780.63220.0966169240.000*.168730.000*.167730.000*.166730.000*.165730.000*.164730.000*.163730.000*.162730.000*.161730.000*0.36780.6322.160时间变量“time”的汇总统计量四分位数估计值百分比点 估计值95% 置信区间变换下限上限)75.LO
15、GLOG192.000.50165.000LOGLOG105.000.2596.000LOGLOG36.000148.000均值标准误差144.42812.183LIFETEST 过程层 2: c = 2乘积极限生存估计值time生存失效生存标准误差失败数目剩余数目0.0001.00000001458.0000.92860.07140.068811359.0000.85710.14290.093521263.0000.78570.21430.109731165.0000.71430.28570.120741069.0000.64290.35710.12815976.0000.57140.428
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 参数 分析 研究 淋巴癌 患者 生存 时间 影响 因素
限制150内