逻辑斯蒂回归模型课件.ppt





《逻辑斯蒂回归模型课件.ppt》由会员分享,可在线阅读,更多相关《逻辑斯蒂回归模型课件.ppt(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、逻辑斯蒂回归模型第1页,此课件共28页哦Logistic回归模型对列联表的分析,独立性检验可以初步了解属性之间是否相互独立,或是否相关;通过列联表的相合性检验,可以进一步知道属性之间的相合情况,包括方向和程度;Logistic模型可以更进一步拟合属性变量之间的函数关系,以描述变量之间的相互影响。列联表中的数据是以概率的形式把属性变量联系起来的,而概率p的取值在0与1之间,因此,要把概率 与 之间直接建立起函数关系是不合适的。即第2页,此课件共28页哦Logistic回归模型实践中,通常随着 连续增长或连续下降,其直观的曲线形态是S型。一般有这种形状的数学函数 有以下形式:称作logistic回
2、归函数。把以上函数线性化可以得到:第3页,此课件共28页哦Logistic回归模型因此,人们通常把p的某个函数f(p)假设为变量的函数形式,取称之为logit函数,也叫逻辑斯蒂变换。因此,逻辑斯蒂变换是取列联表中优势的对数。当概率在0-1取值时,Logit可以取任意实数,避免了线性概率模型的结构缺陷。类似的处理还有probit变换和双对数变换。其中probit变换是将概率变换为标准正态分布的 值,形式为:第4页,此课件共28页哦Logistic回归模型双对数变换的形式为:以上变换中以logit变换应最为广泛。假设响应变量Y是二分变量,令 ,影响Y的因素有k个 ,则称:为二分数据的逻辑斯蒂回归模
3、型,简称逻辑斯蒂回归模型。其中的k个因素称为逻辑斯蒂回归模型的协变量。第5页,此课件共28页哦Logistic回归模型最重要的逻辑斯蒂回归模型是logistic线性回归模型,多元logit模型的形式为:其中,是待估参数。根据上式可以得到优势的值:可以看出,参数 是控制其它 时 每增加一个单位对优势产生的乘积效应。概率p的值:第6页,此课件共28页哦Logistic回归模型最简单的logit线性模型为:则优势为:以上指数关系说明:每增加1个单位,优势变为原来的 倍;此时的概率应为:第7页,此课件共28页哦Logistic回归模型多元logistic模型参数的估计采用极大似然估计方法假设n次观测中
4、,对应 的观测有 个,其中观测值为1的有 个,观测值为0的有 个,则参数 的似然函数:可以使用迭代法求出参数的ML估计由于计算的复杂性,可以利用统计软件得到。第8页,此课件共28页哦Logistic回归模型【例6.1】一般认为,体质指数越大(BMI25),表示某人越肥胖。根据3983人的体检结果有388人肥胖,肥胖组中患心血管病的数据见表6.1,试建立体质指数与患心血管病概率的logistic回归模型。【解】根据题目知道是一元逻辑斯蒂回归问题。运用统计软件可以对参数进行估计得到:于是logit模型为:第9页,此课件共28页哦Logistic回归模型由得到的模型可知,患病概率为:当体质指数BMI
5、变化1单位时,对数优势比将增加0.2570,优势比将增加 即:第10页,此课件共28页哦含有名义数据的logit前例中的协变量为定量数据,logistic回归模型的协变量可以是定性名义数据。这就需要对名义数据进行赋值。通常某个名义数据有k个状态,则定义个变量 代表前面的k-1状态,最后令k-1变量均为0或-1来代表第k个状态。如婚姻状况有四种状态:未婚、有配偶、丧偶和离婚,则可以定义三个指示变量M1、M2、M3,用(1,0,0)、(0,1,0)、(0,0,1)、(0,0,0)或(-1,-1,-1)来对以上四种状态赋值。第11页,此课件共28页哦含有名义数据的logit例:某地25岁及以上人中各
6、类婚姻状况居民的死亡情况见表6.2,试建立死亡率关于年龄和婚姻状况的logit模型。其中,A表示年龄,M1、M2、M3表示婚姻状况于是,估计的logit方程为:第12页,此课件共28页哦含有有序数据的logitLogit模型的协变量也可以是有序数据对有序数据的赋值可以按顺序用数0,1,2,3,4分别表示【例5.8】某地某年各类文化程度的死亡人数见表5.33,试建立logit模型。建立死亡率关于年龄和文化程度的logit模型其中A为年龄,E为文化程度第13页,此课件共28页哦含有有序数据的logit于是,估计的logit方程为:其中,年龄的系数0.124,说明年龄越大死亡率会越高;文化程度的系数
7、-0.164,说明文化程度与死亡率呈负相关,文化程度越高,死亡率越低。第14页,此课件共28页哦Logistic回归的推断效应的置信区间指的是参数的置信区间估计一般可以采用 的区间形式通过上述区间端点的指数变换得到 的区间,它是 每增加1个单位对优势的乘积效应当n很小或拟合概率趋近0或1时,可以采用似然比检验来构造区间,该区间包含所有使原假设成立的可能值通常可以借助软件得到这种区间第15页,此课件共28页哦Logistic回归的推断参数显著性检验指的是参数的显著性检验原假设为:检验统计量为:同样可以采用似然比检验,甚至功效更好。该检验统计量比较了在 时对数似然函数的极大值 和不限定 时对数似然
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 逻辑 回归 模型 课件

限制150内