最新卫生统计学logistic1精品课件.ppt
进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。记想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。记忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着“怎么这么热怎么这么热”,于是三,于是三五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到“强子,别跑强子,别跑了,快来我给你扇扇了,快来我给你扇扇”。孩子们才不听这一套,跑个没完,直到累气喘吁吁,。孩子们才不听这一套,跑个没完,直到累气喘吁吁,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边训,“你你看热的,跑什么?看热的,跑什么?”此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲的味道!蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材的味道!蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的扇。蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧道,袅道,袅 第一节第一节 LogisticLogistic回归分析回归分析一一、基本概念基本概念lLogisticLogistic回归模型回归模型/ /回归方程回归方程lLogisticLogistic函数图形函数图形lLogisticLogistic回归方程的特点回归方程的特点二二、Logistic Logistic 回归模型的配合回归模型的配合 (一)应变量为二分类的(一)应变量为二分类的Logistic Logistic 回归模型回归模型 l应变量为两分类变量l自变量可以是无序分类变量、有序分类变量,也可以是数值变量,注意非数值变量值要数量化。 例题例题l例14-1. 为研究病情x1(0表示不严重,1表示严重)、年龄x2(岁)及不同治疗方法x3(0表示传统疗法,1表示新疗法)对某病疗效的影响,某研究者随机抽取40名某病的患者,其中有20名患者采用传统疗法,另20名患者采用新疗法,经过一段治疗后记录下康复的情况y(0表示未康复,1表示康复),结果如下表:病情(病情(x1x1)、年龄()、年龄(x2x2)及不同治疗方法)及不同治疗方法(x3x3)对某病疗效影响的单因素分析结果)对某病疗效影响的单因素分析结果 单因素分析的缺陷单因素分析的缺陷l由于受到混杂因素的影响,有时单因素估计暴露与结局之间的关系不能真实地反映两者之间的联系,可能是一种虚假的联系;l所以在统计分析策略上,如果混杂因子较少,可以用Mantel-Haenszel 分层分析的方法(其缺点是最多调整2层)lproc freq; tables x1*x3*y/chisq cmh;run;(调整x1)OR=5.29(95%CI:1.2622.25) 引入多因素引入多因素Logistic回归分析方法回归分析方法l可克服Mantel-Haenszel 分层分析方法的缺点l也就是说,如果调整了其它混杂因素后,主研究因素仍有统计学意义,说明某因素与结局之间关联是独立的。Logistic Logistic 回归模型参数估计方法回归模型参数估计方法l最大似然函数估计法(maximum likelihood estimate) lSAS软件采用迭代重加权最小二乘法(Iteratively reweighted least squares algorithm)对式(14-11)求极大值,解得各回归系数值、估计值的方差、标准误、OR值及95CI等,并进行各种假设检验。标准回归系数可在程序过程语句中加入选择项“STBSTB”获得,用来比较各因素的相对重要性 Logistic Logistic 回归模型的相关假设检验回归模型的相关假设检验l整个模型的检验: AIC检验法(Akaike Information Criterion) 、SC检验法、(Schwarte Criterion)似然比检验法(最可靠)、计分检验法(Score) 和Wald检验法 l各个回归系数的检验: Wald-2检验法 l拟合优度检验( Goodness of fit statistics)Hosmer and Lemeshow 法程序说明程序说明proc logistic descending simple;model y=x1-x3 /stb lackfit;run;模型中默认以应变量的低值为反应变量,如果加Descending,则以高值为反应变量。结果解释结果解释LogisticLogistic逐步回归逐步回归proc logistic descending simple; model y=x1-x3/selection=stepwise sle=0.1 sls=0.1 details stb lackfit;units x2=-5;run; (二)应变量为有序分类变量的二)应变量为有序分类变量的 LogisticLogistic回归模回归模型型l分析各种因素自变量对有序分类变量(k2)的影响 例14-2 某医院外科采用两种不同绷带(X1=0为第一种绷带,X1=1为第二种绷带)和两种不同的包扎方式(X2=0为第一种包扎方式,X2=1为第二种包扎方式)进行腿部溃疡处理。治疗效果分为三个等级:不愈、有效、痊愈(Y=0为不愈,Y=1为有效、Y=2为痊愈)。治疗结果如表14-3 所示。试分析不同的治疗方式对治疗效果的影响。程序运行结果及解释程序运行结果及解释(三)应变量为无序多分类变量的(三)应变量为无序多分类变量的 LogisticLogistic回归模型回归模型l应变量的水平数大于2,各水平之间又不存在等级大小次序先后的关系 lAndeson 1972年提出了多分类变量的logistic回归模型,是通过拟合广义Logit模型的方法进行的。若应变量有K个水平,其中有一个水平为对照水平,可以用其它K-1个水平与对照水平相比较,拟合出K-1个广义Logit函数lCATMOD(CATegorical data MODeling)过程模块进行分析 第二节第二节 条件条件LogisticLogistic回归回归l在研究设计阶段,为控制混杂干扰因素常按干扰因素的不同取值设置相匹配的配比组,病例与对照之比为1:1或1:M。在统计分析阶段应把这种配对的对子或匹配的配比组看成一个整体进行处理与分析。 一、一、1 1:1 1的配对设计的条件的配对设计的条件 Logistic Logistic 回归模型回归模型程序及结果解释程序及结果解释ldrop:在数据中最后不保留id1, gall1, hyper1;lRetain:初始值为0,如变量值以后改变,将保持改变后的值直至再改变l条件logistic回归,差值为病例对照,则反应变量为病例用用phregphreg过程拟合过程拟合1 1:1 1条件条件logistic logistic 模型模型lTime 定义:病例为0,对照为1;l括号中的数值代表对照的定义值;lStrata为配对号变量;lties=discrete表示拟合离散的Logistic回归模型 l基本程序格式: proc phreg; model time*y(0)=Gall hyper/ties=discrete; strata id; run;二、二、1 1:MM的匹配设计条件的匹配设计条件Logistic Logistic 回归模型回归模型第三节第三节 Logistic Logistic 回归模型的医学应用回归模型的医学应用 及其注意事及其注意事项项 医学应用l分析流行病学的研究中进行危险因子的筛选。分析流行病学的研究中进行危险因子的筛选。l校正混杂因子校正混杂因子lLogistic 曲线拟合可用于分析药物或毒物的剂量反应。医学中曲线拟合可用于分析药物或毒物的剂量反应。医学中不少指标之间呈不少指标之间呈S型曲线形状的剂量反应关系,拟合成型曲线形状的剂量反应关系,拟合成Logistic 曲线可以对有效剂量、半数致死量等指标进行确定,并可对剂量曲线可以对有效剂量、半数致死量等指标进行确定,并可对剂量反应的趋势做出分析。反应的趋势做出分析。l判别分析与预测。判别分析与预测。Logistic 回归模型是概率模型,它对数据的回归模型是概率模型,它对数据的分布没有严格的要求,可以根据历史上已经获得的经騐资料拟合分布没有严格的要求,可以根据历史上已经获得的经騐资料拟合出的回归方程很方便地进行判别分析及对未发生的事件进行预测。出的回归方程很方便地进行判别分析及对未发生的事件进行预测。 注意事项注意事项l注意变量的类型。应变量是分类变量,自变量可为各种类型变量。与线性回归分析时一样,当为分类变量时注意变量的数量化。l要有足够的样本量。一般应多于多重线性回归分析时所需的样本,样本量大于自变量个数的20倍,配比组设计时,配比组数宜大于50。l因素间的交互作用。Logistic 回归模型可以分析处理因素间的交互作用,但是交互作用的模型为“乘法模型”。在用SAS软件处理时,应在数据步中将考察交互作用的自变量相乘产生一个新的自变量后参加计算分析过程。l 一般先做单因素卡方检验,尽量将回归效果显著的自变量选入回归方程中,作用不显著的自变量排除在外。l 专业上比较关心的因素(虽然无显著意义)l年龄、文化程度等一般要作为调整因素进入模型l 要避免相关性较高的因素(r0.7)一起进入模型,否则易引起多重共线性l 具体程序也可用:逐步回归法(但现在不提倡)l注意:要注意应变量的赋值,SAS默认低值为反应变量或你所认为的阳性值;要改变反应变量的顺序可用descending,改变此顺序。l应变量也是以低值为参比组