第十五章多重线性回归分析课件.ppt
《第十五章多重线性回归分析课件.ppt》由会员分享,可在线阅读,更多相关《第十五章多重线性回归分析课件.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、11MultipleLinearRegressionAnalysis多重线性回归分析多重线性回归分析content第一节第一节 多重线性回归的概念与统计推断多重线性回归的概念与统计推断第二节 假设检验及其评价第三节第三节 复相关系数与偏相关系数复相关系数与偏相关系数第四节自变量筛选第五节第五节 多元线性回归的应用与注意事项多元线性回归的应用与注意事项34目的:作出以多个自变量估计应变量的多重线性回归方程。资料:应变量为定量指标;自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换。用途:解释和预报。更精确意义:由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响
2、,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。多重线性回归分析多重线性回归分析概念概念用线性方程表达一个因变量(用线性方程表达一个因变量(dependent dependent variablevariable)与多个自变量()与多个自变量(independent independent variablevariable)的数量关系的方法,称多重线)的数量关系的方法,称多重线性回归分析性回归分析7多重线性回归模型多重回归模型:含两个以上解释变量的回归模型多重回归模型:含两个以上解释变量的回归模型多多重重线线性性回回归归模模型型:一一个个因因变变量
3、量与与多多个个解解释释变变量量之间设定的是线性关系之间设定的是线性关系涉及涉及 k k 个自变量的多重回归模型可表示为个自变量的多重回归模型可表示为9 b b0 ,b b1 1,b b2 2,b bm是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量 y 是是x1,,x2 ,xm 的线性函数加上误差项的线性函数加上误差项 包包含含在在y里里面面但但不不能能被被k个个自自变变量量的的线线性性关关系系所所解解释释的的变异性变异性多重线性回归方程方程描描述述因因变变量量 y 的的平平均均值值或或期期望望值值如如何何依依赖赖于自于自变变量量 x1,x2,xk的方程的方程形式:形式:为为 y
4、 的的估估计计值值或或预预测测值值(y hat),表表示示给给定定各各自自变变量的值时,因变量量的值时,因变量y的估计值;的估计值;b0为为截截距距,也也称称为为常常数数项项(constant),表表示示各各自自变变量量均均为为0时时y的估计值;的估计值;bi 称称偏偏回回归归系系数数(partial regression coefficient),表表示示假假定定其其他他自自变变量量不不变变时时,当当 xi 每每变变动动一一个个单单位位,y 的的估估计计值的变化量值的变化量例:根据某地29名13岁男童身高x1(cm),体重x2(kg)和肺活量y(L)建立的方程该方程中,b1=0.005017
5、(L/cm),表示在体重不变的前提下,身高每增加1cm,肺活量平均增加0.005017L;b2=0.05406(L/kg),表示在身高不变的情况下,体重每增加1公斤,肺活量平均增加0.05406(L)是根据方程估算出来的值,例如,当x1=150,x2=32时,=1.9168,表示对所有身高为150cm,体重为32kg的13岁男童,估计平均肺活量为1.9168(L)11多重线性回归必须满足的假定条件多重线性回归必须满足的假定条件1、自、自变变量和因量和因变变量的关系是量的关系是线线性的(性的(linear)2、各残差、各残差间间相互独立(相互独立(independence)3、误误差差项项是是一
6、一个个服服从从正正态态分分布布的的随随机机变变量量,即即N(0,2)(normality)4、对对于于自自变变量量x1,x2,xk的的所所有有值值,的的方方差差 2都相同,即方差都相同,即方差齐齐性(性(equal variance)这这些条件些条件简简写写为为LINE,是,是线线性回性回归归方程的核心方程的核心12多重线性回归的应用1、推算:用较易获得的指标推算不易测得的指标2、预测预报:用较易获得的指标预测不易测得的指标3、辅助诊断:先根据诊断明确的病人和非病人的临床症状、体征以及化验检查资料,建立回归方程。然后把需要诊断的疑似病人的资料回代到回归方程,根据结果判断是否患病4、影响因素筛选
7、:在众多的危险因素中,筛选与Y关系密切的因素13 14多重回归分析步骤(1)(1)求回归方程求回归方程-最小二乘原则最小二乘原则(2)(2)假设检验假设检验-检验回归方程是否具有统计学意义检验回归方程是否具有统计学意义(3)(3)变量选择变量选择-以尽量少的自变量以尽量少的自变量,达到较好地解达到较好地解释释Y Y的目的的目的一一般般步步骤骤建立回归方程建立回归方程(样本样本)(2)检验并评价回归方程及各自变量的作用大小 17求偏导数(一阶)求偏导数(一阶)原原 理理最小二乘法最小二乘法统计软件包统计软件包 19 20多重线性回归方程的假设检验及评价 对回归方程及偏回归系数的假设检验1、对回归
8、方程的假设检验F检验2、对偏回归系数的假设检F检验和t检验3、标准化回归系数211.1.方差分析法:方差分析法:(一)(一)对回归方程的假设检验对回归方程的假设检验 2324(二)对偏回归系数的假设检验F检验和t检验回归方程成立只能认为总的来说自变量和因变量间存在线性关系,但是否每一个自变量都与因变量间存在线性关系,须对其偏回归系数进行假设检验 方差分析法 t检验法25 261、方差分析法:计算、方差分析法:计算xi的的偏回归平方和偏回归平方和它表示模型中含有其它它表示模型中含有其它m-1个自变量的条件个自变量的条件下该自变量对下该自变量对Y的回归贡献。的回归贡献。相当于从回归方程中剔除相当于
9、从回归方程中剔除xi后所引起的回归后所引起的回归平方和的减少量。平方和的减少量。其值愈大说明相应的自变量愈重要。其值愈大说明相应的自变量愈重要。27 280.6129+11.9627+20.0635+27.7939133.7107 29胰岛素胰岛素(X3)与糖化血红蛋白与糖化血红蛋白(X4)与血糖与血糖(Y)有有线性回归关系。线性回归关系。302 2、t t检验法检验法 31胰岛素胰岛素(X3)与糖化血红蛋白与糖化血红蛋白(X4)与血糖与血糖(Y)有线性回归关系。有线性回归关系。3.标准化回归系数多重线性回归方程中,各自变量的单位不同,其偏回归系数之间是无法直接比较的,需要对偏回归系数标准化,
10、以消除量纲的影响标准化偏回归系数绝对值的大小,可以衡量自变量对因变量贡献的大小,即说明各自变量在多元回归方程中的重要性32 33标准化回归系数标准化回归系数bj 的绝对值用来比较各个的绝对值用来比较各个自变量自变量xj 对对Y的影响程度大小;绝对值越的影响程度大小;绝对值越大影响越大。标准化回归方程的截距为大影响越大。标准化回归方程的截距为0。p标准化回归系数与一般回归方程的回归系标准化回归系数与一般回归方程的回归系 数的关系:数的关系:标准化回归方程标准化回归方程p 34对血糖影响大小的顺序依次为糖化血红蛋对血糖影响大小的顺序依次为糖化血红蛋白白(X(X4 4)、胰岛素、胰岛素(X(X3 3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十五 多重 线性 回归 分析 课件
限制150内