简单回归分析-沈晓丽-精品文档资料整理.ppt
《简单回归分析-沈晓丽-精品文档资料整理.ppt》由会员分享,可在线阅读,更多相关《简单回归分析-沈晓丽-精品文档资料整理.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十章 简单回归分析线性相关分析 linear correlation analysis 回归回归(regression)和)和相关相关(correlation)分析分析 :研究两个或多个变量间相互关系的统计方法。:研究两个或多个变量间相互关系的统计方法。简单线性回归分析 simple linear regression analysis:研究两个变量间的数量依存关系的统计方法。:研究两个变量间的数量依存关系的统计方法。:研究两个或多个变量之间关联性或关联程度的一研究两个或多个变量之间关联性或关联程度的一种统计分析方法。种统计分析方法。 1.是否有线性联系?是否有线性联系? 2. 正向的还是负
2、向的?正向的还是负向的? 3. 联系的程度?联系的程度?矮个子的父代:矮个子的父代:64英寸英寸而它子代:而它子代:67英寸英寸1.父代的总均数父代的总均数=68英寸英寸 子代的总均数子代的总均数=69英寸英寸2.高个子的父代:高个子的父代:72英寸英寸 而它子代:而它子代:71英寸英寸调查了调查了1087对父子对父子:1.1 线性回归的概念线性回归的概念高个子父子高个子父子矮个子父子矮个子父子简单回归分析简单回归分析1.1 1.1 线性回归的概念线性回归的概念1.2 1.2 线性回归模型的适用线性回归模型的适用条件条件1.31.3 回归参数的估计回归参数的估计1.4 1.4 总体回归系数总体
3、回归系数的统计推断的统计推断1.5 1.5 线性回归的应用线性回归的应用线性回归线性回归(linear regression )又称)又称简单回归简单回归(simple regression ) :讨论讨论两个变量间的数量依存关两个变量间的数量依存关系的统计方法,即研究一个变量如何随另一个变量变化系的统计方法,即研究一个变量如何随另一个变量变化的常用方法。的常用方法。因变量因变量dependent variable 反应变量反应变量 response variable:非独立的、受其它变量影响的变量,非独立的、受其它变量影响的变量,常用常用“Y”表表示。示。自变量自变量 independent
4、 variable或或预测因子预测因子 predictor 或或 解释变量解释变量explanatory variable :能独立自由变化的变量能独立自由变化的变量,常用,常用“X”表示。表示。两个变量:两个变量:例例10-1:对:对14名名40-60岁健康妇女的基础代谢(岁健康妇女的基础代谢(Y)与体重(与体重(X)的相关系数)的相关系数r =0.964,现问基础代谢,现问基础代谢(Y)是如何依存体重()是如何依存体重(X)变化而变化的?)变化而变化的?编号编号基础代谢基础代谢(kj/d) 体重体重(kg)编号编号基础代谢基础代谢(kj/d) 体重体重(kg)14175.650.7 839
5、70.648.624435.053.7 93983.244.633460.237.1105050.158.644020.851.7115355.571.053987.447.8124560.659.764970.662.8134874.462.175359.767.3145029.261.5表表10-1 14名健康中年妇女的基础代谢与体重的测量值名健康中年妇女的基础代谢与体重的测量值图图10-1 14名健康中年妇女的基础代谢与体重的散点图名健康中年妇女的基础代谢与体重的散点图由散点图看基础代谢与体重可能是直线关系由散点图看基础代谢与体重可能是直线关系 Y X= +X上述直线方程称为上述直线方程
6、称为线性回归模型线性回归模型 linear regression model 可以假定固定基础代谢的总体均数可以假定固定基础代谢的总体均数 Y X与体重与体重X 的关系可能是直线关系,即有:的关系可能是直线关系,即有:回归直线的截距参数(回归直线的截距参数(intercept),即),即X取取0时,时,根据方程估算出的根据方程估算出的Y的平均水平。的平均水平。回归直线的斜率参数(回归直线的斜率参数(slope),又称回归系数),又称回归系数(regression coefficient),即),即X每增加一个单位,每增加一个单位,Y平均改变平均改变个单位。个单位。 通常情况下,研究者只能获得一
7、定数量的样本数通常情况下,研究者只能获得一定数量的样本数据,用样本数据建立的有关据,用样本数据建立的有关Y Y依从依从X X变化的线性表达变化的线性表达式称为回归方程(式称为回归方程(regression equation),记为:),记为:Ya bx 称称 为为Y 的预测值;其意义为固定的预测值;其意义为固定 x时,时,Y 的总体均数的总体均数 Y X 的估计值。的估计值。 a与与b分别为回归模型参数分别为回归模型参数和和的估计值。的估计值。 利用回归方程,只要给定一个利用回归方程,只要给定一个40-60岁的健康妇女的体重值,岁的健康妇女的体重值,就可估计出该体重个体的基础代谢值的平均值。就
8、可估计出该体重个体的基础代谢值的平均值。 以样本数据,可算出以样本数据,可算出和和的估计值的估计值a 和和 b。后在。后在直角坐标系以直角坐标系以X为横坐标,为横坐标,Y 为纵坐标作图,图为纵坐标作图,图形是一条直线,斜率为形是一条直线,斜率为b,截距为,截距为a。Ya bx 线性回归关系的特点:线性回归关系的特点:u一个变量的取值不能由另一个变量唯一确定。一个变量的取值不能由另一个变量唯一确定。u当变量当变量 X 取某个值时,变量取某个值时,变量Y取值可能有几个。取值可能有几个。u各观测点分布在直线周围各观测点分布在直线周围 线性回归线性回归的分类:的分类:I 型回归型回归 :因变量因变量(
9、Y)是随机变化的,但自变量)是随机变化的,但自变量(X)可以不随机)可以不随机 ,当,当它是能够精确测量和严密控制它是能够精确测量和严密控制的量时,叫的量时,叫Y 关于关于X 的的I型型回归回归。II型回归型回归 :因变量(因变量(Y)和自变量()和自变量(X)都是随机)都是随机变化的,叫变化的,叫Y 关于关于X 的的II型回归型回归。表表12-1 不同不同IgG浓度下的沉淀环数据浓度下的沉淀环数据IgG浓度(浓度(IU/ml)X12345沉淀环直径(沉淀环直径(mm)Y4.05.56.27.78.5小结:小结:回归分析回归分析(Regression analysis)1. 从一组样本数据出发
10、,确定变量之间的数学关从一组样本数据出发,确定变量之间的数学关系式;系式;2. 对这些关系式的可信程度进行各种统计检验,对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出具有并从影响某一特定变量的诸多变量中找出具有统计学意义的变量;统计学意义的变量;3. 利用所求的关系式,根据一个或几个变量的取利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。出这种预测或控制的精确程度。1.2 线性回归模型的适用条件线性回归模型的适用条件l i n enormal正态性正态性equal
11、variance等方差性等方差性因变量因变量Y 的总的总体平均值与体平均值与自变量自变量X呈线呈线性关系性关系在一定范围内任在一定范围内任意给定值,则意给定值,则对应的随机变量对应的随机变量服从正态分布服从正态分布在一定范围内,在一定范围内,不同不同X值所对应值所对应的随机变量的随机变量Y的的方差相同方差相同linear线性线性independent独立性独立性指任意两指任意两个观察值个观察值互相独立互相独立误差误差 与与残差残差|Y XYxY 称为随机误差(总体)称为随机误差(总体) 称为残差称为残差(residual)(样本)(样本) 根据上述,直线回归分析要求资料满足根据上述,直线回归分
12、析要求资料满足固定固定X,则则Y 服从正态分布服从正态分布等价于等价于残差服从正态分布残差服从正态分布。YYYabx直线回归原理示意图:直线回归原理示意图:所以如果固定所以如果固定X,Y 服从正态分布,其服从正态分布,其散点图呈直线带状分布散点图呈直线带状分布回归分析的主要步骤回归分析的主要步骤绘制散点图绘制散点图回归参数的估计:求回归系数回归参数的估计:求回归系数和常数项和常数项回归系数回归系数和常数项和常数项的假设检验的假设检验列出回归方程,并进行假设检验列出回归方程,并进行假设检验回归方程的解释回归方程的解释(一)(一)绘制散点图:绘制散点图: 从散点图可见:基础代从散点图可见:基础代谢
13、(谢()和体重()和体重()有线性关系,可以考虑有线性关系,可以考虑做线性回归分析。做线性回归分析。图图11-1 14名健康中年妇女的基础代谢与体名健康中年妇女的基础代谢与体重的散点图重的散点图1.3 回归参数的估计回归参数的估计(二)(二)回归参数的估计:回归参数的估计:iiiYY让所有点的让所有点的 的平方和最小的平方和最小iiYYv用最小二乘法拟合直线,选择用最小二乘法拟合直线,选择a和和b使其残差(样本点到使其残差(样本点到直线的竖直距离直线的竖直距离)平方和达到最小。平方和达到最小。最小二乘法原则的文字描述:最小二乘法原则的文字描述:回归参数的估计方法:回归参数的估计方法:),.,2
14、 , 1( ,)()(21niLLXXYYXXbxxxyiniii()按照最小二乘法原则,可得到:按照最小二乘法原则,可得到:XbYa()Yabx回归方程:回归方程:例例10-1:对:对14名名40-60岁健康妇女的基础代谢(岁健康妇女的基础代谢(Y)与体重(与体重(X)的相关系数)的相关系数r =0.964,现问基础代谢,现问基础代谢(Y)是如何依存体重()是如何依存体重(X)变化而变化的?)变化而变化的?编号编号基础代谢基础代谢(kg/d) 体重体重(kg)编号编号基础代谢基础代谢(kg/d) 体重体重(kg)14175.650.7 83970.648.624435.053.7 93983
15、.244.633460.237.1105050.158.644020.851.7115355.571.053987.447.8124560.659.764970.662.8134874.462.175359.767.3145029.261.5表表10-1 14名健康中年妇女的基础代谢与体重的测量值名健康中年妇女的基础代谢与体重的测量值解:解:回归方程的两个参数分别为回归方程的两个参数分别为42.61)()(21()XXYYXXbiniii79.1061142 .7774229.61149 .23263()XbYa得回归方程:得回归方程:XY12. 179.1106作回归直线图作回归直线图回归系
16、数回归系数的意义:的意义:1.由总体回归方程可知由总体回归方程可知 Y X= + x,参数参数 的意义:若自变量的意义:若自变量X增加增加1个单位,反应变量个单位,反应变量Y的的 平均值便增加平均值便增加 个单位。个单位。 。2.由于由于 是是 Y X= +X 的估计表达式,的估计表达式,所以(样本)回归系数所以(样本)回归系数b 表示表示 X 增加一个单位,样本观增加一个单位,样本观察值察值Y 平均增加平均增加 b 个单位。个单位。Ya bx 假设检验假设检验回归模型的假设检验回归模型的假设检验(model test):):回归系数的假设检验:回归系数的假设检验:目的:检验求得的回归方程在总
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简单 回归 分析 沈晓丽 精品 文档 资料 整理
限制150内