有序多分类逻辑斯蒂回归模型精选PPT.ppt
《有序多分类逻辑斯蒂回归模型精选PPT.ppt》由会员分享,可在线阅读,更多相关《有序多分类逻辑斯蒂回归模型精选PPT.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于有序多分类逻辑斯蒂回归模型关于有序多分类逻辑斯蒂回归模型第1页,讲稿共32张,创作于星期二Logistic回归回归因变量因变量二项二项Logistic回归回归多项多项Logistic回归回归有序回归有序回归Probit回归回归第2页,讲稿共32张,创作于星期二第第14章章 有序回归有序回归(有序多分类因变量(有序多分类因变量Logistic回归)回归)14.1 有序回归的基本思想有序回归的基本思想14.2 有序回归的案例分析有序回归的案例分析第3页,讲稿共32张,创作于星期二研究中常遇到反应变量为有序多分类(研究中常遇到反应变量为有序多分类(k2)的资料,如城市综合)的资料,如城市综合竞争
2、力等级、满意度等可以划分为低、中、高。竞争力等级、满意度等可以划分为低、中、高。与名义多分类因变量有所不同,定性有序多分类因变量采用与名义多分类因变量有所不同,定性有序多分类因变量采用累积累积logit模型模型,该模型可利用有序这一特点,得到比基线,该模型可利用有序这一特点,得到比基线-类别有更简单类别有更简单解释的模型。解释的模型。Y的累积概率是指的累积概率是指Y落在一个特定点的概率,对结果为类别落在一个特定点的概率,对结果为类别j时,时,其累积概率为:其累积概率为:累积概率满足:累积概率满足:累积概率的模型并不利用最后一个概率,因为它必然等于累积概率的模型并不利用最后一个概率,因为它必然等
3、于114.1 有序回归的基本思想有序回归的基本思想第4页,讲稿共32张,创作于星期二pj=p(yj|x),它表示,它表示 y 取前取前 j 个值的累积概率个值的累积概率。累积概率函数:累积概率函数:14.1 有序回归的基本思想有序回归的基本思想 J等级分为两类:等级分为两类:1,j 与与 j+1,k在这两类的基础上定义的在这两类的基础上定义的 logit 表示表示:属于后属于后 k-j 个等级的累积概率与个等级的累积概率与前前j个等级的累积概率的优势的对数,故该模型称为累积优势模个等级的累积概率的优势的对数,故该模型称为累积优势模型型(cumulative odds model)。第5页,讲稿
4、共32张,创作于星期二第一个模型表示了第一个模型表示了y 取第一个值的概率取第一个值的概率p1与与x的关系;第二个模型表示的关系;第二个模型表示了了y 取前两个值的累积概率取前两个值的累积概率p2与与x的关系。这两个模型的的关系。这两个模型的常数项不同常数项不同,回归系数完全相同的回归系数完全相同的。y 取第一个值的概率取第一个值的概率p(1)=p1,y 取第二个值的概率取第二个值的概率p(2)=p2-p1,y 取第三个值的概率取第三个值的概率p(3)=1-p2。它们的截距不同,斜率相同,。它们的截距不同,斜率相同,所以是所以是J-1条平行直线族条平行直线族。多值因变量多值因变量logisti
5、c回归模型要求进行数据的平回归模型要求进行数据的平行性检验行性检验。第6页,讲稿共32张,创作于星期二平行性检验(平行性检验(只适用于位置模型只适用于位置模型/位置参数位置参数/斜率系数)斜率系数)当因变量维多值变量时,模型包含多个回归方程。当因变量维多值变量时,模型包含多个回归方程。Logistic回归分回归分析要求这多个回归方程中自变量的系数是相等的。因此需要做析要求这多个回归方程中自变量的系数是相等的。因此需要做平行行检验,也称为比例比数假设检验(平行行检验,也称为比例比数假设检验(test fo the proportional odds assumption),使用的方法是计分检验法
6、。当),使用的方法是计分检验法。当Pa时,接受平行时,接受平行的原假设。否则,应该的原假设。否则,应该将因变量的某些值进行合并,减少因变量的将因变量的某些值进行合并,减少因变量的取值个数取值个数,使得多值变量,使得多值变量logistic回归模型平行性成立。还可以回归模型平行性成立。还可以尝尝试其他链接函数试其他链接函数。如果各种连接函数都无法满足平行性假定,则需要考虑回归系数是否如果各种连接函数都无法满足平行性假定,则需要考虑回归系数是否会随着分割点而发生改变。此时最好会随着分割点而发生改变。此时最好使用无序多分类的使用无序多分类的Logistic 回回归归进行模型拟合,然后再根据系数估计值
7、考虑如何进行处理。进行模型拟合,然后再根据系数估计值考虑如何进行处理。第7页,讲稿共32张,创作于星期二以以4 水平的反应变量为例,假设反应变量的取值为水平的反应变量为例,假设反应变量的取值为1、2、3、4,相应取值水平的概率为,相应取值水平的概率为p1、p2、p3、p4,则则此时进行此时进行Logit 变变换的分别为换的分别为p1、p1+p2、p1+p2+p3,对,对k 个自变量拟合三个模型如下个自变量拟合三个模型如下:常数项不同常数项不同,回归系回归系数完全相同的数完全相同的张文彤版本的常数项前均张文彤版本的常数项前均为负号为负号第8页,讲稿共32张,创作于星期二根据上述公式,可以分别求出
8、:根据上述公式,可以分别求出:第9页,讲稿共32张,创作于星期二由上述建立的模型可以看出,这种模型实际上是依次将反应变由上述建立的模型可以看出,这种模型实际上是依次将反应变量按不同的取值水平分割成两个等级,对这两个等级建立反应量按不同的取值水平分割成两个等级,对这两个等级建立反应变量为二分类的变量为二分类的Logistic 回归模型。回归模型。不管模型中反应变量不管模型中反应变量的分割点在什么位置,模型中各自变量的系数都保持不的分割点在什么位置,模型中各自变量的系数都保持不变,所改变的只是常数项变,所改变的只是常数项。此时求出的。此时求出的OR 值表示自变量每值表示自变量每改变一个单位,反应变
9、量提高一个及一个以上等级的比数比改变一个单位,反应变量提高一个及一个以上等级的比数比。张文彤认为,这里拟合的模型中常数项之前的符号应当是张文彤认为,这里拟合的模型中常数项之前的符号应当是“负负号号”,原因在于此处的常数项正好表示低级别和高级别相比的,原因在于此处的常数项正好表示低级别和高级别相比的情况,且必然有情况,且必然有 ,但由于研究者主要关心的是各参数但由于研究者主要关心的是各参数(系数)的大小,因此这种差异影响不大。并且由(系数)的大小,因此这种差异影响不大。并且由SPSS给出的给出的系数无需再添加符号。系数无需再添加符号。第10页,讲稿共32张,创作于星期二某大学医院外科采用两种不同
10、的绷带和两种不同的包扎某大学医院外科采用两种不同的绷带和两种不同的包扎方式进行腿溃疡的治疗处理。治疗的结果分三种:不愈、方式进行腿溃疡的治疗处理。治疗的结果分三种:不愈、有效和痊愈。试分析治疗方法对治疗效果的影响。有效和痊愈。试分析治疗方法对治疗效果的影响。设因变量设因变量 y 表示治疗效果,表示治疗效果,0=不愈、不愈、1=有效、有效、2=痊愈。痊愈。设自变量设自变量x1表示绷带种类,自变量表示绷带种类,自变量 x2 表示包扎方式。表示包扎方式。对于多值因变量模型,平行性假设决定了每个自变量的对于多值因变量模型,平行性假设决定了每个自变量的OR值对于前值对于前k-1个模型是相同的。例如,变量
11、个模型是相同的。例如,变量x1的的OR=5.172,它,它表示使用第一种绷带治愈腿溃疡的可能性表示使用第一种绷带治愈腿溃疡的可能性是使用第二种绷带的是使用第二种绷带的5.172倍倍;它;它也表示使用第一种绷带也表示使用第一种绷带至少有效的可能性是使用第二种绷带的至少有效的可能性是使用第二种绷带的5.172倍倍。第11页,讲稿共32张,创作于星期二14.1 有序回归的基本思想有序回归的基本思想有序回归模型的类型:有序回归模型的类型:当定性因变量当定性因变量y取取k个顺序类别时,记为个顺序类别时,记为1,2,k,这里的数字,这里的数字1,2,k仅表示顺序的大小。仅表示顺序的大小。因变量因变量y取值
12、于每个类别的概率仍与一组自变量取值于每个类别的概率仍与一组自变量x1,x2,xk 有关,有关,对于样本数据对于样本数据(xi1,xi2,xip;yi),i=1,2,n,顺序类别回归模型有两,顺序类别回归模型有两种主要类型,种主要类型,位置结构(位置结构(Location component)模型,位置模型,定位模型)模型,位置模型,定位模型规模结构(规模结构(Scale component)模型,尺度模型,定量模型)模型,尺度模型,定量模型第12页,讲稿共32张,创作于星期二l 位置结构模型(位置模型位置结构模型(位置模型/定位模型):定位模型):(1)l 规模结构模型规模结构模型(尺度模型尺
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 有序 分类 逻辑 回归 模型 精选 PPT
限制150内