统计分析与方法-第七章 回归分析5-罗吉斯蒂克回归.ppt
《统计分析与方法-第七章 回归分析5-罗吉斯蒂克回归.ppt》由会员分享,可在线阅读,更多相关《统计分析与方法-第七章 回归分析5-罗吉斯蒂克回归.ppt(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章 回归分析6罗吉斯蒂克回归回归分析的类型回归分析的类型w因变量与自变量都是定量变量的回归分析因变量与自变量都是定量变量的回归分析即我们常做的回归分析即我们常做的回归分析w因变量是定量变量,自变量中有定性变量因变量是定量变量,自变量中有定性变量的回归分析的回归分析即含有哑变量的回归分析即含有哑变量的回归分析w因变量是定性变量的回归分析因变量是定性变量的回归分析Logistic回归分析回归分析因变量是定性变量因变量是定性变量的回归分析的回归分析LogisticLogistic回归分析回归分析从多元线性回归到从多元线性回归到Logistic 回归回归w例例7.4 7.4 这是这是200200个
2、不同年龄和性别的人对个不同年龄和性别的人对某项服务产品的认可的数据某项服务产品的认可的数据(logi.sav).(logi.sav).w其中:其中:年龄年龄是是连续连续变量变量,性别性别是有男和女是有男和女(分别用分别用1 1和和0 0表示表示)两个水平的两个水平的定性定性变量变量,而变量而变量“观点观点”则为包含认可则为包含认可(用用1 1表示表示)和不认可和不认可(用用0 0表示表示)两个水平的两个水平的定性定性变量。变量。从这张图可以看出什么呢从这张图可以看出什么呢?从这张图又可以看出什么呢从这张图又可以看出什么呢?从多元线性回归到从多元线性回归到Logistic 回归回归w这里这里观点
3、是因变量观点是因变量,只有两个值只有两个值;所所以可以把它看作成功概率为以可以把它看作成功概率为p p的的BernoulliBernoulli试验的结果试验的结果.w但是和单纯的但是和单纯的BernoulliBernoulli试验不同试验不同,这里的概率这里的概率p p为年龄和性别的为年龄和性别的函数函数.w必须应用必须应用LogisticLogistic回归。回归。多元线性回归不能应用于定性因多元线性回归不能应用于定性因变量的原因变量的原因w首先,多元线性回归中使用定性因变量严首先,多元线性回归中使用定性因变量严重违反本身假设条件,即:重违反本身假设条件,即:w因变量只能取两个值时,对于任何
4、给定的因变量只能取两个值时,对于任何给定的自变量值,自变量值,e本身也只能取两个值。这必本身也只能取两个值。这必然会违背线性回归中关于误差项然会违背线性回归中关于误差项e的假设的假设条件。条件。w其次,线性概率概型及其问题其次,线性概率概型及其问题:w由于因变量只有两个值由于因变量只有两个值;所以可以把它看所以可以把它看作成功概率作成功概率p p,取值范围必然限制在取值范围必然限制在0 01 1的区间中,然而线性回归方程不能做到。的区间中,然而线性回归方程不能做到。w另外概率发生的情况也不是线性的。另外概率发生的情况也不是线性的。Logistic函数函数wLogistic的概率函数定义为:的概
5、率函数定义为:我们将多元线性组合表示为:我们将多元线性组合表示为:Logistic函数函数w于是,于是,Logistic概率函数表示为:概率函数表示为:经过变形,可得到线性函数:经过变形,可得到线性函数:w这里,事件发生概率=P (y=1)w 事件不发生概率=1-P (y=0)w 发生比:w 对数发生比:w这样,就可将这样,就可将logistic曲线线性化为:曲线线性化为:w从从P到到logit P经历了两个步骤变换过程经历了两个步骤变换过程:w第一步:将转换成发生比,其第一步:将转换成发生比,其值域为值域为0到无穷到无穷w第二步:将发生比换成对数发生比,其值域科第二步:将发生比换成对数发生比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析与方法-第七章 回归分析5-罗吉斯蒂克回归 统计分析 方法 第七 回归 分析 罗吉斯蒂克
限制150内