第12章 多重线性回归分析.ppt





《第12章 多重线性回归分析.ppt》由会员分享,可在线阅读,更多相关《第12章 多重线性回归分析.ppt(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十二章第十二章 多重线性回归分析多重线性回归分析1复习简单线性回归 回归模型的建立 回归系数的假设检验和区间估计21 概述 Y 因变量 (dependent variable,response variable)X 自变量 (independent variable)简单回归的形式:简单回归是回归分析中最基本、最简单的一种,又称直线回归。3给定X时,Y是正态分布、等方差示意图xy42 回归模型的前提假设线性(linear)独立(independent)正态(normal)等方差(equal variance)恰好为“LINE”。5(1)a 为回归直线在为回归直线在 Y 轴上的截轴上的截距。距
2、。a 0,表表示示直直线线与与纵纵轴轴的的交交点点在在原点的上方;原点的上方;a 0,直线从左下方走向右上方,直线从左下方走向右上方,Y 随随 X 增大而增大;增大而增大;b0,直线从左上方走向右下方,直线从左上方走向右下方,Y 随随 X 增大而减小;增大而减小;b=0,表示直线与表示直线与 X 轴平行,轴平行,X 与与Y 无直线关系无直线关系。b 的统计学意义是:的统计学意义是:X 每增加每增加(减减)一个一个单位,单位,Y 平均改变平均改变b个单位。个单位。7回归方程的 方差分析86 因变量总变异的分解X P(X,Y)Y9Y的总变异分解的总变异分解总变异SS总回归平方和SS回剩余平方和SS
3、剩10Y的总变异分解 11方差分析表变异来源变异来源 SS v MS F 回回 归归 SS回回 1 SS回回/1 MS回回/MS剩剩 剩剩 余余 SS剩剩 n-2 SS剩剩/n-2 总变异总变异 SS总总 n-112决定系数对于两变量,对于两变量,R2=r2决定系数反映了回归贡献的相对程度,也就是在Y的总变异中回归能解释的百分比。因此,R2越接近1,说明应用相关分析的意义越大,即贡献越大;相反的意义亦成立。13回归系数的 t 检验14回归系数与相关系数的假设检验结果等价结果等价:15直线回归中三种假设检验间的关系在直线回归中,相关系数的假设检验,回归系数的假设检验,以及回归方程的方差分析结果等
4、价。16线性回归的应用估计置信区间(可信区间)总体回归线的95%置信带估计参考值范围(预测区间)个体Y 95%的预测区间17 的可信区间与Y的预测区间可信区间是针对条件均数的,而预测区间是针对个可信区间是针对条件均数的,而预测区间是针对个体体Y的取值范围的。的取值范围的。前者表示在固定的前者表示在固定的Xp处(处(X=Xp),按照(),按照(1-)的)的置信度估计的置信度估计的Y的总体均数可信区间。的总体均数可信区间。后者表示在固定的后者表示在固定的Xp处(处(X=Xp),(),(1-)的个体)的个体Y值在预测范围内。值在预测范围内。18如何建立回归模型?Y糖尿病人的血糖糖尿病人的血糖X1胰岛
5、素胰岛素X2糖化血红蛋白糖化血红蛋白X3血清总胆固醇血清总胆固醇X4甘油三脂甘油三脂19outline多重线性回归模型的建立多重线性回归的假设检验自变量筛选 多重线性回归20多重线性回归Yx1x2x3.xm211.1 多元线性回归模型简介因变量 Y自变量为X1,X2,Xkb0为截距(intercept),表示各自变量均为0时y的的估计值。bi称为偏回归系数(partial regression coefficient),是i的估计值,表示当方程中其他自变量保持常量时,自变量Xi变化一个计量单位,反应变量Y的平均变化量。称为 X=(X1,X2,Xk)时,反应变量Y的估计值。221.2 回归模型的
6、前提假设线性(linear)独立性(independent)正态性(normal)等方差性(equal variance)恰好为“LINE”。23最小二乘法(least square estimation,LSE)基本思想:使各实测值Y与对应的估计值 之差的平方和 为最小。1.3 估计回归参数,建立回归模型24只有一个自变量25两个自变量26例例12-1 为了研究有关糖尿病患者体内脂联素水平的影响因素,某医师测定30例患者的BMI、病程、瘦素、空腹血糖,数据如表12-1所示。回归模型?271.3 估计回归参数,建立回归模型变量变量变量变量自由度自由度自由度自由度 回归系数回归系数回归系数回归系
7、数截距截距截距截距1 158.19958.199X X1 11 1-1.030-1.030X X2 21 1-0.132-0.132X X3 31 1-0.811-0.811X X4 41 1-0.579-0.579282.多重线性回归的假设检验整体回归效应的假设检验-方差分析偏回归系数的假设检验-t检验29Y的总变异分解总变异SS总:剩余平方和SS剩或残差平方和:回归的贡献,回归平方和SS回:2.1整体回归效应的假设检验-方差分析30Y的总变异分解 31回归方程的方差分析表 变变异来源异来源SS自由度自由度MSF回回归归模型模型SS回回m(自自变变量个数)量个数)SS回回/m剩余剩余(残差残
8、差)SS剩剩n-m-1SS剩剩/(n-m-1)总变总变异异SS总总n-1决定系数 复相关系数32回归方程的方差分析1 建立假设,确定检验水准 H 0:,即总体中各偏回归系数均为0;H 1:总体中各偏回归系数不为0或不全为0;=0.05。2 计算检验统计量:3 确定P值,作出推断结论。拒绝H0,说明从整体上而言,用这四个自变量构成的回归方程解释糖尿病患者体内脂联素的变化是有统计学意义的。33回归方程的方差分析表R表示脂联素水平与体重指数、病程DY、瘦素LEP与空腹血糖这四个自变量总的线性相关的密切程度。R2用包含体重指数、病程DY、瘦素LEP与空腹血糖这四个自变量的回归方程可解释脂联素水平变异性
9、的73.12%。34扣除其他变量的影响后,Y和X的相关,称为Y与X的偏相关系数。2.2 偏相关系数partial correlation coefficient35方差分析和决定系数检验所有自变量整体对应变量的相关程度。未指明方程中的每一个自变量对Y的影响。而在实际工作中往往会关心的是每个变量的解释。2.3 各自变量的假设检验与评价362.3.1.偏回归平方和 37382.3.2偏回归系数的假设检验-t检验检验假设:H0:i=0 H1:i0 =0.05。检验统计量:392.3.2偏回归系数的假设检验-t检验做出统计推断:这四个变量中,变量X1、X2和X4的偏回归系数无统计学意义,而X3对脂联素
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第12章 多重线性回归分析 12 多重 线性 回归 分析

限制150内