《第十二章_简单回归分析(讲).ppt》由会员分享,可在线阅读,更多相关《第十二章_简单回归分析(讲).ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十二章 简单回归分析概述简单线性回归线性回归的应用残差分析非线性回归概述回归分析 因变量Y 随自变量X的变化而变化。相关分析 因变量Y 与自变量X间的彼此关系。在医学研究中,常要分析变量间的数量规律。回归则是研究这种关系的统计方法。线性回归则是较简单的一种。简单线性回归函数关系:确定的。如,y=2r回归关系:不确定的。Y随着X的变化而变化,但不具有一一对应性。例如成年人的胸围随着体重的增大而增大,但不能讲体重60公斤的人,胸围一定是多少。回归描述的是通过自变量的数值反应因变量的平均水平。因此可以通过可测或易测的变量估计难测或不可测变量的状态。例如:通过体重估计体表面积;通过身高、体重、肺活量
2、估计心室血输出 量、体循环总血量;本章只涉及一个自变量的回归问题!简单线性回归 回归系数b的意义 直线回归的概念主要是通过直线回归系数b的概念体现的。当X增加一个单位时,Y相应地平均改变b个单位。例如,由年龄X推算小儿体重Y的回归方程为 它表示年龄增加l岁,体重平均增加2公斤。显然,回归系数b可以很好地反映X与Y之间的数量规律(以上方程适用于212岁儿童)。简单线性回归 一般表达式:(linear regression equation)直线回归方程中只有两个待定的常量a和b,所以求回归方程的目的就是求出a和b。a:称为截距(intercept),当X可以取零时a才有意义。b:称为回归系数(r
3、egression coefficient),它就是回归直线的斜率。b0,Y随X的增加而增大;b0,Y随X的增加而减小;b=0,直线与X轴平行,X与Y无直线关系。|b|越大,表示Y随X变化越快,直线越陡峭。简单线性回归简单线性回归回归方程参数的计算:根据样本观察值(x,y),计算a,b的过程最小二乘原则使各实际散点(Y)到直线()的纵向距离的平方和最小也即 最小简单线性回归 为残差:点到直线的纵向距离。1112131415165.05.56.06.5最小二乘(Least squares)法图解Yi (Y的估计值)=a+bXi Yi估计值残差i=Yi 估计值寻找使S(残差i)2 最小的直线 简单
4、线性回归由最小二乘法得到由最小二乘法得到a,b的计算公式为:的计算公式为:例:随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间,数据如下:简单线性回归例:凝血酶浓度与凝血时间计算得到:a21.77393b6.98直线回归方程的图示在X的实测范围内,任取两值带入方程,求得Y的估计值,从而画出回归直线。回归直线的有关性质(1)直线通过均点(2)直线上方各点到直线的纵向距离之和 =直线下方各点到直线的纵向距离之和即:(3)各点到该回归线纵向距离平方和较到其它任何直线者为小。回归系数的假设检验方程的统计学意义:方程有无统计学意义通俗地讲是方程的真伪、方程能不能用的问题。直线回归方程
5、只有一个自变量,所以回归系数的统计学意义与方程的统计学意义是等价的。回归系数是否有统计学意义,可以用方差分析和t检验。回归系数的假设检验方差分析引起Y变异的因素有:1.自变量X的线性影响2.其他因素及测量误差1、建立假设 H0:=0 H1:0 =0.052、计算统计量 F值X X回归系数的假设检验回归系数的假设检验回归系数的假设检验回归系数的假设检验总体回归系数 的假设检验t 检验1、建立假设 H0:=0 H1:0 =0.052、计算统计量总体回归系数 的统计推断样本回归系数b的标准误总体回归系数 的统计推断总体回归系数 的置信区间LINE 假定xy标准差相等标准差相等 EQUAL STAND
6、ARD DEVIATION 对于任何X值,随机变量Y的方差相等独立独立 INDEPENDENCE 任意两个观察值之间彼此独立y|X=+x线性性 LINEARITY 反应变量y的均数与X间呈线性关系回归模型的四个假定回归模型的四个假定正态正态 NORMALITY 指线性模型的误差项服从正态分布线性回归的应用总体回归线的95置信带线性回归的应用线性回归的应用线性回归的应用个体Y预测值的区间估计线性回归的应用线性回归的应用非线性回归非线性回归变换自变量实现线性回归的步骤1、首先将观测数据作散点图,观察散点的分布与何种函数类型类似2、对照所选函数进行相应的变量变换3、使用最小二乘法作线性模型的参数估计
7、直线回归与相关的区别与联系区别lr 没有单位,b有单位;所以,相关系数与单位无关,回归系数与单位有关;l相关表示两变量关系的方向和密切程度。而回归则用函数方程表示应变量随自变量变化的数量关系;l对资料的要求不同:当X和Y都是随机的,可以进行相关和回归分析;当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析直线回归与相关的区别与联系联系l均表示线性关系;l 符号相同:共变方向一致;l 假设检验结果相同:是否存在共变关系;l决定系数 表示由X导致Y的变异在总变异中所占的比重,越接近1越好。开方便是相关系数回归分析的正确应用要有实际意义;充分利用散点图,判断:l(1)线性趋势 (2)离群值回归系数是有单位的,不能根据 b 的大小判断回归关系的密切程度自变量的选择:l 原因l 容易测量的l 变异小的l 年龄、身高、体重、体表面积回归分析的正确应用应用条件(LINE):l(1)线性(linear)l(2)独立(independent)l(3)给定X时,Y正态分布(normal)l(4)等方差(equal variance)
限制150内