统计分析与方法-第七章回归分析5-罗吉斯蒂克回归.ppt
-
资源ID:65764056
资源大小:749KB
全文页数:26页
- 资源格式: PPT
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
统计分析与方法-第七章回归分析5-罗吉斯蒂克回归.ppt
第七章 回归分析6罗吉斯蒂克回归回归分析的类型回归分析的类型w因变量与自变量都是定量变量的回归分析因变量与自变量都是定量变量的回归分析即我们常做的回归分析即我们常做的回归分析w因变量是定量变量,自变量中有定性变量因变量是定量变量,自变量中有定性变量的回归分析的回归分析即含有哑变量的回归分析即含有哑变量的回归分析w因变量是定性变量的回归分析因变量是定性变量的回归分析Logistic回归分析回归分析因变量是定性变量因变量是定性变量的回归分析的回归分析LogisticLogistic回归分析回归分析从多元线性回归到从多元线性回归到Logistic 回归回归w例例7.4 7.4 这是这是200200个不同年龄和性别的人对个不同年龄和性别的人对某项服务产品的认可的数据某项服务产品的认可的数据(logi.sav).(logi.sav).w其中:其中:年龄年龄是是连续连续变量变量,性别性别是有男和女是有男和女(分别用分别用1 1和和0 0表示表示)两个水平的两个水平的定性定性变量变量,而变量而变量“观点观点”则为包含认可则为包含认可(用用1 1表示表示)和不认可和不认可(用用0 0表示表示)两个水平的两个水平的定性定性变量。变量。从这张图可以看出什么呢从这张图可以看出什么呢?从这张图又可以看出什么呢从这张图又可以看出什么呢?从多元线性回归到从多元线性回归到Logistic 回归回归w这里这里观点是因变量观点是因变量,只有两个值只有两个值;所所以可以把它看作成功概率为以可以把它看作成功概率为p p的的BernoulliBernoulli试验的结果试验的结果.w但是和单纯的但是和单纯的BernoulliBernoulli试验不同试验不同,这里的概率这里的概率p p为年龄和性别的为年龄和性别的函数函数.w必须应用必须应用LogisticLogistic回归。回归。多元线性回归不能应用于定性因多元线性回归不能应用于定性因变量的原因变量的原因w首先,多元线性回归中使用定性因变量严首先,多元线性回归中使用定性因变量严重违反本身假设条件,即:重违反本身假设条件,即:w因变量只能取两个值时,对于任何给定的因变量只能取两个值时,对于任何给定的自变量值,自变量值,e本身也只能取两个值。这必本身也只能取两个值。这必然会违背线性回归中关于误差项然会违背线性回归中关于误差项e的假设的假设条件。条件。w其次,线性概率概型及其问题其次,线性概率概型及其问题:w由于因变量只有两个值由于因变量只有两个值;所以可以把它看所以可以把它看作成功概率作成功概率p p,取值范围必然限制在取值范围必然限制在0 01 1的区间中,然而线性回归方程不能做到。的区间中,然而线性回归方程不能做到。w另外概率发生的情况也不是线性的。另外概率发生的情况也不是线性的。Logistic函数函数wLogistic的概率函数定义为:的概率函数定义为:我们将多元线性组合表示为:我们将多元线性组合表示为:Logistic函数函数w于是,于是,Logistic概率函数表示为:概率函数表示为:经过变形,可得到线性函数:经过变形,可得到线性函数:w这里,事件发生概率=P (y=1)w 事件不发生概率=1-P (y=0)w 发生比:w 对数发生比:w这样,就可将这样,就可将logistic曲线线性化为:曲线线性化为:w从从P到到logit P经历了两个步骤变换过程经历了两个步骤变换过程:w第一步:将转换成发生比,其第一步:将转换成发生比,其值域为值域为0到无穷到无穷w第二步:将发生比换成对数发生比,其值域科第二步:将发生比换成对数发生比,其值域科为为w经过转换,经过转换,将将P logit P,在将其作为回归因变在将其作为回归因变量来解释就不再有任何值域方面的限制了,即量来解释就不再有任何值域方面的限制了,即可线性化!可线性化!Logistic回归系数的意义回归系数的意义w以以logit P方程的线性表达式来解释回归系方程的线性表达式来解释回归系数,即:数,即:w在在logistic回归的实际研究中,通常不是报回归的实际研究中,通常不是报告自变量对告自变量对P的作用,而是报告自变量对的作用,而是报告自变量对logit P的作用。的作用。Logistic回归系数的意义回归系数的意义w以发生比以发生比 的指数表达式来解释回归系的指数表达式来解释回归系数数w与与logit P不同,发生比不同,发生比 具有一定的实际具有一定的实际意义,意义,代表一种相对风险代表一种相对风险。w因此对因此对logistic回归系数的解释通常是从发回归系数的解释通常是从发生比的指数表达式出发的。生比的指数表达式出发的。Logistic回归系数的意义回归系数的意义w例如:在取得了例如:在取得了logistic回归系数的各回归系数的各bi 的的解以后,将其带入解以后,将其带入 函数,函数,w如果分析如果分析x 变化一个单位对于变化一个单位对于 的影响的影响幅度,可以用(幅度,可以用(x+1)表示,并将其待入)表示,并将其待入上式,得到新的发生比上式,得到新的发生比Logistic回归系数的意义回归系数的意义w将两个发生比集中在一起有:将两个发生比集中在一起有:w将此称为发生比率,它可测量自变量一个将此称为发生比率,它可测量自变量一个单位的增加给原来的发生比所带来的变化,单位的增加给原来的发生比所带来的变化,w一般表达式为:一般表达式为:w说明在其他情况不变的情况下,说明在其他情况不变的情况下,x一个单一个单位的变化使原来的发生比扩大位的变化使原来的发生比扩大 倍。倍。Logistic回归系数的意义回归系数的意义w比如,原来的比如,原来的 为为6:4(比值为比值为1.5),如果,如果一个自变量变化一个单位导致的发生比率一个自变量变化一个单位导致的发生比率为为exp(0.693)=2,即表示这一变化将会导,即表示这一变化将会导致新发生比值致新发生比值 为原来的为原来的2倍,即新发倍,即新发生比将是生比将是12:4(比值为比值为3)。w我们也可用我们也可用发生比率减发生比率减1的差来表示发生的差来表示发生比的增长率,比的增长率,如发生比率为如发生比率为2.3,就可以说,就可以说自变量一个单位的变化会使原发生比增加自变量一个单位的变化会使原发生比增加1.3倍倍(2.3-1=1.3).Logistic回归系数的意义回归系数的意义w当当logistic回归系数为负数时,发生比率小回归系数为负数时,发生比率小于于1。这时的表达要特别小心。这时的表达要特别小心。w比如发生比率为比如发生比率为0.8时,表示新发生比只有时,表示新发生比只有原来的原来的80%,那么下降的倍数则是,那么下降的倍数则是(1-0.8=)0.2.Logistic回归应用回归应用w以例以例7.47.4为例,说明为例,说明logisticlogistic回归分析回归分析wSPSSSPSS选项:选项:wAnalyze RegressionBinary logisticLogistic回归的回归的SPSSSPSS输出结果输出结果Logistic模型的检验与评价模型的检验与评价w对于整体模型的检验对于整体模型的检验wLogistic回归方程求解参数是采用最大似回归方程求解参数是采用最大似然估计方法,因此其回归方程的整体检验然估计方法,因此其回归方程的整体检验通过似然函数值,表示为:通过似然函数值,表示为:-2 Log Likelihoodw该值越大,意味着回归方程的似然值越小,该值越大,意味着回归方程的似然值越小,模型的拟和程度越差。反之,拟和程度越模型的拟和程度越差。反之,拟和程度越好。好。Logistic模型的检验与评价模型的检验与评价w在评价或检验一个含有自变量的在评价或检验一个含有自变量的Logistic回归模型时,通常是将其含有自变量的回归模型时,通常是将其含有自变量的Logistic的的-2 Log Likelihood与截距模型的与截距模型的相比较。两者之差服从卡方分布,进行卡相比较。两者之差服从卡方分布,进行卡方检验。方检验。w所谓截距模型,就是将所有自变量删除后所谓截距模型,就是将所有自变量删除后只剩一个截距系数的模型。只剩一个截距系数的模型。Logistic模型的检验与评价模型的检验与评价Logistic模型的检验与评价模型的检验与评价w对于回归系数的检验对于回归系数的检验wLogistic回归系数的检验是用回归系数的检验是用Wald统计量统计量进行的。进行的。