应用统计学回归模型幻灯片.ppt
《应用统计学回归模型幻灯片.ppt》由会员分享,可在线阅读,更多相关《应用统计学回归模型幻灯片.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计学回归模型第1页,共55页,编辑于2022年,星期六 内内容容提提要要非条件非条件logistic回归回归模型简介模型简介简单分析实例简单分析实例哑变量设置哑变量设置自变量的筛选方法与逐步回归自变量的筛选方法与逐步回归模型拟合效果与拟合优度检验模型拟合效果与拟合优度检验模型的诊断与修正模型的诊断与修正条件条件logistic回归回归第2页,共55页,编辑于2022年,星期六对对分分类类变变量量的的分分析析,当当考考察察的的影影响响因因素素较较少少,且且也也为为分分类类变变量量时时,常常用用列列联联表表(Contingency Table)进进行行整整理理,并并用用 2检检验验或分层或分
2、层 2检验进行分析,但存在以下局限性:检验进行分析,但存在以下局限性:无无法法描描述述其其作作用用大大小小和和方方向向,更更不不能能考考察察各各因因素素间间是是否否有有交互作用;交互作用;当控制的分层因素较多时,将导致检验结果不可靠;当控制的分层因素较多时,将导致检验结果不可靠;2检验无法对连续性自变量进行分析检验无法对连续性自变量进行分析(致命缺陷)(致命缺陷)。模型简介模型简介第3页,共55页,编辑于2022年,星期六logistic回回归归模模型型适适合合于于应应变变量量为为二二项项分分类类的的资资料料,在在医医学学研研究究领领域域中中的的应应用用广广泛泛。如如流流行行病病病病因因学学研
3、研究究(包包括括队队列列研研究究、病病例例对对照照研研究究、横横断断面面研研究究等等)、临临床床疗疗效效研研究究(如如疗疗效效与与治治疗疗方方法法、患患病病轻轻中中重重等等因因素素关关系系)、卫卫生生服服务务研研究究(如如是是否就诊与性别、年龄、文化程度的关系)等等。否就诊与性别、年龄、文化程度的关系)等等。模型简介模型简介第4页,共55页,编辑于2022年,星期六模型简介模型简介 logistic回归模型:回归模型:第5页,共55页,编辑于2022年,星期六 反应变量为二分类变量或某事件的发生率;反应变量为二分类变量或某事件的发生率;自变量与自变量与logit(P)之间为线性关系;)之间为线
4、性关系;残差合计为残差合计为0,且服从二项分布;,且服从二项分布;各观测间相互独立。各观测间相互独立。模型简介模型简介适用条件适用条件 logistic logistic回归模型应该使用最大似然法来解决方程的估计和检回归模型应该使用最大似然法来解决方程的估计和检验问题,不应当使用以前的最小二乘法进行参数估计。验问题,不应当使用以前的最小二乘法进行参数估计。第6页,共55页,编辑于2022年,星期六例例1 某某医医师师希希望望研研究究病病人人的的年年龄龄age、性性别别sex(0为为女女性性、1为为男男性性)、心心电电图图检检验验是是否否异异常常ecg(ST段段压压低低、0为为正正常常、1为为轻
5、轻度度异异常常、2为为重重度度异异常常)与与冠冠心病心病ca是否有关,数据见是否有关,数据见logistic_binary.sav。简单分析实例简单分析实例第7页,共55页,编辑于2022年,星期六简单分析实例简单分析实例第8页,共55页,编辑于2022年,星期六选入应变量选入应变量选入自选入自变量变量简单分析实例简单分析实例第9页,共55页,编辑于2022年,星期六简单分析实例简单分析实例结果分析结果分析 此表为应变量取值水平编码,此表为应变量取值水平编码,SPSSSPSS默认取值水平高的为阳默认取值水平高的为阳性结果。性结果。第10页,共55页,编辑于2022年,星期六简单分析实例简单分析
6、实例结果分析结果分析 本本表表输输出出当当前前模模型型的的-2log-2log(似似然然值值)和和两两个个伪伪决决定定系系数数,但但对对于于logisticlogistic回回归归而而言言,通通常常看看见见的的伪伪决决定定系系数数不不像像线性回归模型中的决定系数那么大。线性回归模型中的决定系数那么大。第11页,共55页,编辑于2022年,星期六简单分析实例简单分析实例结果分析结果分析 此此表表输输出出模模型型中中的的各各自自变变量量的的偏偏回回归归系系数数及及其其标标准准误误、Wald Wald 2 2、自由度、自由度、P P 值、值、OROR值(即值(即expexp(B B)。)。第12页,
7、共55页,编辑于2022年,星期六哑变量设置哑变量设置在在回回归归模模型型中中,回回归归系系数数b b表表示示其其他他自自变变量量不不变变,x x每每改改变变一一个个单单位位时时,所所预预测测的的y y的的平平均均变变化化量量,当当x x为为连连续续性性变变量量时时,这这样样解解释释没没有有问问题题,二二分分类类变变量量由由于于只只存存在在两两个个类类别别间间的的比比较较,也也可可以以对对系系数数得得到到很很好好的的解解释释。但但是是当当x x为为多多分分类类变变量量时时,仅仅拟拟合合一一个个回回归归系系数数就就不不太太合合适适了了,此此时时需需要使用要使用哑变量哑变量(dummy varia
8、bledummy variable)方式对模型进行定义。)方式对模型进行定义。第13页,共55页,编辑于2022年,星期六例例2 Hosmer 和和Lemeshow于于1989年研究了低出生体重婴儿年研究了低出生体重婴儿的影响因素,结果变量为是否娩出低出生体重儿(变量名为的影响因素,结果变量为是否娩出低出生体重儿(变量名为LOW,1表示低出生体重儿,表示低出生体重儿,0表示非低出生体重儿),表示非低出生体重儿),考虑的自变量有产妇妊娠前体重、产妇年龄、种族、是否考虑的自变量有产妇妊娠前体重、产妇年龄、种族、是否吸烟、早产次数、是否患高血压等。(数据文件见:吸烟、早产次数、是否患高血压等。(数据
9、文件见:logistic_step.sav。)。)哑变量设置哑变量设置第14页,共55页,编辑于2022年,星期六哑变量设置哑变量设置第15页,共55页,编辑于2022年,星期六哑变量设置哑变量设置第16页,共55页,编辑于2022年,星期六选入无序多分选入无序多分类变量类变量设置参照水平设置参照水平哑变量设置哑变量设置第17页,共55页,编辑于2022年,星期六哑变量设置哑变量设置结果分析结果分析 哑变量(种族)的设置情况哑变量(种族)的设置情况第18页,共55页,编辑于2022年,星期六哑变量设置哑变量设置 白人低出生体重的风险较低,而黑人风险较高。白人低出生体重的风险较低,而黑人风险较高
10、。结果分析结果分析第19页,共55页,编辑于2022年,星期六 参照水平最好要有实际意义,不推荐使用其他作为参照;参照水平最好要有实际意义,不推荐使用其他作为参照;参照水平组要有一定的频数作保证,应不少于参照水平组要有一定的频数作保证,应不少于30或或50例;例;对有序自变量的分析:对有序自变量的分析:从专业出发确定;从专业出发确定;分别以哑变量和连续性变量的方式引入模型进行比较后确定。分别以哑变量和连续性变量的方式引入模型进行比较后确定。哑变量设置哑变量设置 哑变量设置应该注意的问题哑变量设置应该注意的问题第20页,共55页,编辑于2022年,星期六 Forward:Conditional
11、(最可靠)(最可靠)Forward:LR Forward:Wald (应当慎用)(应当慎用)Backward:Conditional(最可靠)(最可靠)Backward:LR Backward:Wald(应当慎用)(应当慎用)6 6 种筛选自变量的方法种筛选自变量的方法逐步回归逐步回归第21页,共55页,编辑于2022年,星期六例例3 仍仍以以例例2的的数数据据为为例例,演演示示如如何何在在SPSS中中实实现现逐逐步步logistic回回归归分析。分析。逐步回归逐步回归第22页,共55页,编辑于2022年,星期六选择其中一种选择其中一种逐步法逐步法逐步回归逐步回归第23页,共55页,编辑于20
12、22年,星期六逐步回归逐步回归 给出了模型拟合过程中每一步的给出了模型拟合过程中每一步的-2log-2log(L L)及两个)及两个伪决定系数。伪决定系数。结果分析结果分析第24页,共55页,编辑于2022年,星期六逐步回归逐步回归结果分析结果分析第25页,共55页,编辑于2022年,星期六逐步回归逐步回归结果分析结果分析 输出了尚不在模型中的自变量是否能被引入的输出了尚不在模型中的自变量是否能被引入的ScoreScore检验结果,检验结果,这里只给出第一步的结果。这里只给出第一步的结果。第26页,共55页,编辑于2022年,星期六对数似然值与伪决定系数对数似然值与伪决定系数模型预测正确率模型
13、预测正确率ROCROC曲线曲线模型拟合效果检验模型拟合效果检验 拟合效果判断指标:拟合效果判断指标:第27页,共55页,编辑于2022年,星期六对数似然值与伪决定系数:对数似然值与伪决定系数:对数似然值与伪决定系数:对数似然值与伪决定系数:-2 倍对数似然值表示模型的拟合效果,其值越小,越接近于倍对数似然值表示模型的拟合效果,其值越小,越接近于0,说明,说明模型拟合效果越好。模型拟合效果越好。但是,当自变量中存在缺失值时,因为一般统计软件在进行计算时会把但是,当自变量中存在缺失值时,因为一般统计软件在进行计算时会把含有缺失值的记录予以剔除,不参与统计分析,此时不能用含有缺失值的记录予以剔除,不
14、参与统计分析,此时不能用-2log likelihood 对不同模型的拟合效果进行比较。对不同模型的拟合效果进行比较。模型拟合效果检验模型拟合效果检验第28页,共55页,编辑于2022年,星期六模型预测正确率:模型预测正确率:模型预测正确率:模型预测正确率:例例3进行逐步回归的第三步(进行逐步回归的第三步(step3)输出以上结果,预测正确)输出以上结果,预测正确的记录占的记录占71.4。模型拟合效果检验模型拟合效果检验第29页,共55页,编辑于2022年,星期六ROC曲线:曲线:Save子对话框子对话框模型拟合效果检验模型拟合效果检验先先保保存存研研究究对对象象的预测概率。的预测概率。第30
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 回归 模型 幻灯片
限制150内