生存分析及其R程序学习教案.pptx
《生存分析及其R程序学习教案.pptx》由会员分享,可在线阅读,更多相关《生存分析及其R程序学习教案.pptx(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1生存分析生存分析(fnx)及其及其R程序程序第一页,共42页。n n生存(shngcn)资料共同特点n n1.蕴含有结局和时间两个方面的信息n n2.结局为两分类互斥事件n n3.一般是通过随访收集得到,随访观察往往是从某统一时间点(如确、入院或实施手术等某种处理措施后)开始,观察到某规定时间点截止。n n4.常因失访等原因造成研究对象的生存(shngcn)时间数据不完整,分布类型复杂,不能简单地套用以前的方法第1页/共42页第二页,共42页。n n生存分析:既考虑结果又考虑生存时间的一种统计方法,并可充分利用截尾(ji wi)数据所提供的不完全信息,对生存时间的分布特征进行描述,对影
2、响生存时间的主要因素进行分析。第2页/共42页第三页,共42页。n n生存分析对资料的基本要求n n1.样本由随机抽样方法获得,要有一定的数量,死亡例数和比例不能太少n n2.完整数据所占的比例不能太少,即截尾值不宜太多n n3.截尾值出现(chxin)的原因无偏性,为防止偏性常常对被截尾的研究对象的年龄、职业、地区、病情轻重等情况进行分析n n4生存时间尽可能精确n n5.缺项要尽量补齐第3页/共42页第四页,共42页。n n生存分析的研究内容n n1.描述生存过程 研究生存时间(shjin)的分布特点,估计生存率及其标准误。常用方法有乘积极限法和寿命表法n n2.比较生存过程 获得生存率及
3、其标准误的估计后,可进行两组或多组生存曲线(生存过程)的比较。常用方法为对数秩检验。n n3 生存过程的影响因素分析 常用的分析方法为Cox比例风险回归模型。第4页/共42页第五页,共42页。几个几个(j)基本概念基本概念n n1.1.死亡事件:又称失效事件或终点事件,指标志某种处理措施失败死亡事件:又称失效事件或终点事件,指标志某种处理措施失败(shbi)(shbi)或失效的或失效的特征事件。特征事件。n n2.2.生存时间:广义上指某个起点事件开始到某个终点事件发生所经历的时间,常用生存时间:广义上指某个起点事件开始到某个终点事件发生所经历的时间,常用符号符号t t表示。表示。n n分布类
4、型不易确定。一般不服从正态分布,少数情况下近似服从指数分布、分布类型不易确定。一般不服从正态分布,少数情况下近似服从指数分布、WeibullWeibull分布、分布、GompertzGompertz分布等,多数情况下往往是不服从任何规则的分布类型。分布等,多数情况下往往是不服从任何规则的分布类型。n n影响因素多而复杂且不易控制。影响因素多而复杂且不易控制。n n根据研究对象的结局,生存时间数据可分为两种类型:根据研究对象的结局,生存时间数据可分为两种类型:n n 完全数据完全数据(complete data)(complete data)n n 截尾数据截尾数据(截尾值、删失数据,截尾值、删
5、失数据,censored data)censored data)第5页/共42页第六页,共42页。几个几个(j)基本概念基本概念n n(1 1)完全数据:从观察起点到发生)完全数据:从观察起点到发生(fshng)(fshng)死亡事件所经历的时间死亡事件所经历的时间n n(2 2)截尾数据:生存时间观察过程的截止不是由于死亡事件,而是由其他原因引)截尾数据:生存时间观察过程的截止不是由于死亡事件,而是由其他原因引起的起的n n主要原因主要原因n nA.A.失访:指失去联系失访:指失去联系n nB.B.退出:死于非研究因素或非处理因素而退出研究。退出:死于非研究因素或非处理因素而退出研究。n n
6、C.C.终止:设计时规定的研究时间已到而终止观察,但研究对象仍然存活。终止:设计时规定的研究时间已到而终止观察,但研究对象仍然存活。第6页/共42页第七页,共42页。几个几个(j)基本概念基本概念n n3.3.死亡概率死亡概率 记为记为q q,指在某单位时段开始时存活的个体在该时段内死亡的可能,指在某单位时段开始时存活的个体在该时段内死亡的可能性大小。性大小。n n q=q=某年内死亡数某年内死亡数/某年年初观察例数某年年初观察例数n n 若年内有截尾,则分母用校正人口数:若年内有截尾,则分母用校正人口数:n n 校正人口数校正人口数=年初观察例数年初观察例数-1/2-1/2截尾例数截尾例数n
7、 n4.4.生存概率:记为生存概率:记为p p,与死亡概率相对立,表示在单位时间段开始时存活的个,与死亡概率相对立,表示在单位时间段开始时存活的个体到该时段结束体到该时段结束(jish)(jish)时仍存活的可能性大小。时仍存活的可能性大小。n n p=1-q=p=1-q=某年活满一年的人数某年活满一年的人数/某年年初观察例数某年年初观察例数第7页/共42页第八页,共42页。几个几个(j)基本概念基本概念n n5.5.生存生存(shngcn)(shngcn)函数函数 又称累积生存又称累积生存(shngcn)(shngcn)函数,观察对象经历函数,观察对象经历t t个时段后仍存活的可个时段后仍存
8、活的可能性,记为能性,记为S S(t t),),0 S0 S(t t)11。如资料中无删失数据,直接法计算生存。如资料中无删失数据,直接法计算生存(shngcn)(shngcn)率率的公式为:的公式为:n n S S(t t)=P=P(Tt)-tTt)-t时刻仍存活的例数时刻仍存活的例数/观察总例数观察总例数 (S(t)(S(t)为单调下降为单调下降)。n n 若含有删失数据,须分时段计算生存若含有删失数据,须分时段计算生存(shngcn)(shngcn)概率。假定观察对象在各个时段的生概率。假定观察对象在各个时段的生存存(shngcn)(shngcn)时间独立,应用概率乘法定理将分时段的生存
9、时间独立,应用概率乘法定理将分时段的生存(shngcn)(shngcn)概率相乘得到生存概率相乘得到生存(shngcn)(shngcn)率。率。n n S S(k k)=P(T tk)=p1p2p3pk=P(T tk)=p1p2p3pk第8页/共42页第九页,共42页。几个几个(j)基本概念基本概念n n死亡密度函数:观察对象在某时刻死亡密度函数:观察对象在某时刻t t的瞬时死亡率,又称为死亡概率密度函数。常用的瞬时死亡率,又称为死亡概率密度函数。常用f(t)f(t)表示:表示:n n在实际工作在实际工作(gngzu)(gngzu)中,他在中,他在t t时刻的取值可用下式估计时刻的取值可用下式
10、估计第9页/共42页第十页,共42页。几个几个(j)基本概念基本概念6.6.危险率函数(危险率函数(hazard functionhazard function)定义:指定义:指t t 时刻尚存活的研究对象死于时刻尚存活的研究对象死于t t时刻之后一瞬间的概率。为条件概率,即活到时刻之后一瞬间的概率。为条件概率,即活到了了t t时刻的条件下在时刻的条件下在tt+tt+t t这一微小时段内死亡的概率,用这一微小时段内死亡的概率,用h(t)h(t)表示。表示。式中,式中,T T为观察对象的生存为观察对象的生存(shngcn)(shngcn)时间,时间,n(t)n(t)为为t t时刻的生存时刻的生存
11、(shngcn)(shngcn)人数,人数,n(t+n(t+t)t)为为t+t+t t时刻的生存时刻的生存(shngcn)(shngcn)人数。人数。危险率函数也称为死亡力危险率函数也称为死亡力(force of mortality)(force of mortality)、瞬时死亡率、瞬时死亡率(instantaneous failure rate)(instantaneous failure rate)等等第10页/共42页第十一页,共42页。几个几个(j)基本概念基本概念nh1(t)是一种上升的曲线,表示危险率随时间变化而增加,如急性白血病患者治疗(zhlio)无效其危险率随时间呈增加趋
12、势;nh2(t)的曲线为下降趋势,表示危险率逐渐减小,如意外事故造成的外伤经有效治疗(zhlio)后死亡的危险性逐渐减小;nh3(t)为一种稳定的危险率函数,如某些慢性病患者在稳定期,其危险率基本不变。n 第11页/共42页第十二页,共42页。几个几个(j)基本概念基本概念n n接上一张n nh4(t):U型风险函数,又称为“浴盆”曲线,开始时死亡风险较大(jio d),并逐渐减少,随后进入一稳定的较低风险水平,但最后风险逐渐加大。如人类一生所经受的死亡风险就是这样的n nh5(t):是山峰型风险函数。开始时逐渐增大,到最大风险后逐渐降低。第12页/共42页第十三页,共42页。几个几个(j)基
13、本概念基本概念n n2、危险率函数与生存函数的关系n n危险率函数是生存分析(fnx)的基本函数,它反映研究对象在某时点的死亡风险大小。生存函数与危险率函数的关系可表示为:n n不同人群的危险率模型不同,危险率函数可以表现为递增、递减、恒定或其它波动形式。第13页/共42页第十四页,共42页。第14页/共42页第十五页,共42页。n n风险函数(hnsh),生存函数(hnsh),死亡密度函数(hnsh)的关系第15页/共42页第十六页,共42页。几个几个(j)基本概念基本概念n n7.7.半数生存时间:又称为中位生存时间,指生存率为半数生存时间:又称为中位生存时间,指生存率为0.50.5时时
14、对应的生存时间,表示有对应的生存时间,表示有50%50%的观察对象可以活这么长时间。一般采用的观察对象可以活这么长时间。一般采用(c(c iyng)iyng)内插法进行估计。内插法进行估计。n n8.8.风险比:指同一时点两组的风险函数之比,这个比即为相对危险度。风险比:指同一时点两组的风险函数之比,这个比即为相对危险度。n n 风险比风险比=第一组个体的第一组个体的h1(t)/h1(t)/第二组个体的第二组个体的h2(t)h2(t)如果(rgu)风险比与时间无关,及任何时刻,两组的风险比值是相等的,则称为比例风险(PH),否则称为非比例风险。第16页/共42页第十七页,共42页。生存分析生存
15、分析(fnx)的基本方法的基本方法n n1 1 描述法:不对所分析的数据作出任何统计推断,用上述公式计算出生存函数、死亡函描述法:不对所分析的数据作出任何统计推断,用上述公式计算出生存函数、死亡函描述法:不对所分析的数据作出任何统计推断,用上述公式计算出生存函数、死亡函描述法:不对所分析的数据作出任何统计推断,用上述公式计算出生存函数、死亡函数、风险函数、半数生存时间等,并采用列表或绘图的形式来显示生存时间的分布规律。数、风险函数、半数生存时间等,并采用列表或绘图的形式来显示生存时间的分布规律。数、风险函数、半数生存时间等,并采用列表或绘图的形式来显示生存时间的分布规律。数、风险函数、半数生存
16、时间等,并采用列表或绘图的形式来显示生存时间的分布规律。n n2 2 非参数法:非参数法:非参数法:非参数法:n n是指估计生存函数时对生存时间的分布没有要求,并且检验危险是指估计生存函数时对生存时间的分布没有要求,并且检验危险是指估计生存函数时对生存时间的分布没有要求,并且检验危险是指估计生存函数时对生存时间的分布没有要求,并且检验危险(wixi(wixi n)n)因素对生存因素对生存因素对生存因素对生存时间的影响时采用的是非参数检验方法。时间的影响时采用的是非参数检验方法。时间的影响时采用的是非参数检验方法。时间的影响时采用的是非参数检验方法。n n作用:作用:作用:作用:n n估计生存函
17、数估计生存函数估计生存函数估计生存函数n n比较两组或多组生存函数比较两组或多组生存函数比较两组或多组生存函数比较两组或多组生存函数n n分析危险分析危险分析危险分析危险(wixi(wixi n)n)因素对生存时间的影响因素对生存时间的影响因素对生存时间的影响因素对生存时间的影响n n常用的方法有:乘积极限法,寿命表法常用的方法有:乘积极限法,寿命表法常用的方法有:乘积极限法,寿命表法常用的方法有:乘积极限法,寿命表法第17页/共42页第十八页,共42页。n n3 3参数法参数法参数法参数法n n 根据样本观察根据样本观察根据样本观察根据样本观察(gunch)(gunch)值来估计假定的分布模
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生存 分析 及其 程序 学习 教案
限制150内