Logistic回归参数的估计通常采用最大似然法.ppt
Logistic regressionLogistic回归回归Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022 第一节第一节.非条件非条件logisticlogistic回归回归第二节第二节.条件条件logisticlogistic回归回归第三节第三节.应用及其注意事项应用及其注意事项Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022 医学研究中常碰到应变量应变量的可能取值仅有两个(即二分类变量二分类变量),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多重回归的条件 什么情况下采用什么情况下采用LogisticLogistic回归回归Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022 Brown(1980)在术前检查了53例前列腺癌患者,拟用年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量与手术探查结果变量NODES(1、0分别表示癌症的淋巴结转移与未转移)建立淋巴结转移的预报模型。实例Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,202220222022202253例接受手术的前列腺癌患者情况 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,202220222022202226例冠心病病人和28例对照者进行病例对照研究 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,202220222022202226例冠心病病人和28例对照者进行病例对照研究 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022一、logistic回归模型 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022概率预报模型概率预报模型 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022二、模型的参数估计参数估计 Logistic回归参数的估计通常采用最大似然法最大似然法(maximum likelihood,ML)。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022参数估计的公式参数估计的公式 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022三、回归三、回归参数的假设检验参数的假设检验 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022优势比及其可信区间优势比及其可信区间 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022标准化回归标准化回归参数参数Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022P262表表16-3资料计算的资料计算的SAS程序程序Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022 The LOGISTIC ProcedureAnalysis of Maximum Likelihood EstimatesSaturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022 预报模型预报模型Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022四、回归四、回归参数的意义参数的意义 当只有一个自变量时,以相应的预报概率为纵轴,自变量 为横轴,可绘制出一条S形曲线。回归参数的正负符号与绝对值大小,分别决定了S形曲线的形状与方向 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022五、整个回归模型五、整个回归模型的假设检验的假设检验 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022似然比检验(似然比检验(likelihood ratio test)Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022六、六、logistic逐步回归(变量筛选)逐步回归(变量筛选)MODEL语句加入选项“SELECTION=STEPWISE SLE=SLS=;”常采用似然比检验:决定自变量是否引入或剔除。Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022模型中有模型中有X5、X6、X8,看是否引入看是否引入X1模型含X5、X6、X8的模型的负二倍对数似然为:模型含X1、X5、X6、X8的模型的负二倍对数似然为:Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022第二节第二节.条件条件logistic回归回归 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022条件似然函数条件似然函数 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,20222022202220221:3配对的例子配对的例子 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,20222022202220221:2配对的例子配对的例子 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022表表16-7条件条件logistic回归的回归的SAS程序程序 Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022结果结果Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022 第三节第三节 应用及其注意事项应用及其注意事项应变量为(二项)分类的资料应变量为(二项)分类的资料(预测、判别、危险因素分析等等)(预测、判别、危险因素分析等等)Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022 注意事项注意事项1.分类自变量的哑变量编码 2.为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或较严重情况。如果对二项分类变量按+1与-1编码,那么所得的 ,容易造成错误的解释。Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022西、中西、中三种疗法哑变量化 原资料原资料姓名姓名性性别别年年龄龄 疗疗法法张张山山150中西中西李四李四120西西王五王五018中中刘六刘六070中中赵赵七七135中西中西孙孙八八029西西哑变量化哑变量化姓名姓名性性别别年年龄龄X1X2张张山山15001李四李四12010王五王五01800刘六刘六07000赵赵七七13501孙孙八八02910Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022 注意事项注意事项2.自变量的筛选 不同的筛选方法有时会产生不同的模型。实际工作中可同时采用这些方法,然后根据专业的可解释性、模型的节约性和资料采集的方便性等,决定采用何种方法的计算结果。Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022 注意事项注意事项3.交互作用 交互作用的分析十分复杂,应根据临床意义与实际情况酌情使用。Saturday,Saturday,Saturday,Saturday,October 29,October 29,October 29,October 29,2022202220222022 注意事项注意事项4.多分类logistic回归 心理疾病分为精神分裂症、抑郁症、神经官能症等(名义变量名义变量nominal variables);疗效评价分为无效、好转、显效、痊愈(有序变量有序变量ordinal variables)。参见“余松林主编。医学统计学(七年制全国规划教材,第17章,2002年3月)”