《一元线性回归方程检验.ppt》由会员分享,可在线阅读,更多相关《一元线性回归方程检验.ppt(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章 相关与回归分析相关与回归分析本章教学目的本章教学目的:相关分析是研究变量之间相互关相关分析是研究变量之间相互关系的一种重要的统计方法,通过本章的学习,使系的一种重要的统计方法,通过本章的学习,使学生:了解相关分析的意义,相关的种类、回归学生:了解相关分析的意义,相关的种类、回归分析的概念,掌握相关系数的计算和简单线性回分析的概念,掌握相关系数的计算和简单线性回归分析。归分析。本章教学重点:本章教学重点:相关分析、回归分析相关分析、回归分析本章教学难点:本章教学难点:回归分析回归分析本章教学学时:本章教学学时:6学时学时11/15/2022第一节第一节 相关分析的意义和内容相关分析
2、的意义和内容 一、相关分析的涵义一、相关分析的涵义 (一)变量间依存关系(一)变量间依存关系 1.函数关系函数关系 存在严格的数量依存关系。存在严格的数量依存关系。2.相关关系相关关系 存在不确定性的依存关系。存在不确定性的依存关系。(二)相关分析(二)相关分析 研究两个或两个以上变量之间的相关方向和相研究两个或两个以上变量之间的相关方向和相关程度的统计分析方法。关程度的统计分析方法。11/15/2022二、相关关系的种类二、相关关系的种类(一)按变量之间相关的程度(一)按变量之间相关的程度 1 1、完全相关、完全相关 如销售额与销售量之间的关系(价格不变)如销售额与销售量之间的关系(价格不变
3、)2 2、完全不相关、完全不相关 注意:虚假相关。如天气与股票价格的关系注意:虚假相关。如天气与股票价格的关系 3 3、不完全相关、不完全相关 如居民的收入与支出水平如居民的收入与支出水平11/15/2022(二)按相关关系涉及变量的多少(二)按相关关系涉及变量的多少 1 1、单相关:一个变量对另一个变量的相关关、单相关:一个变量对另一个变量的相关关系。系。如只研究农物产量与施肥量间的关系。如只研究农物产量与施肥量间的关系。2 2、复相关:一个变量对两个或多个变量的相、复相关:一个变量对两个或多个变量的相关关系,称复相关。关关系,称复相关。如研究农物产量与施肥量、降雨量间的关如研究农物产量与施
4、肥量、降雨量间的关系。系。3 3、偏相关:一个变量与多个变量相关时,假、偏相关:一个变量与多个变量相关时,假定其他变量不变,只研究其中两个变量之间的相定其他变量不变,只研究其中两个变量之间的相关关系,称偏相关。关关系,称偏相关。11/15/2022(三)按变量之间相关关系的表现形态(三)按变量之间相关关系的表现形态 1 1、线性相关:两种变量之间大致呈线性关系。、线性相关:两种变量之间大致呈线性关系。2 2、非线性相关(或曲线相关):两种变量之、非线性相关(或曲线相关):两种变量之间不呈线性关系,近似某种曲线方程的关系。间不呈线性关系,近似某种曲线方程的关系。11/15/2022(四)对线性相
5、关,按相关变量变化的方向(四)对线性相关,按相关变量变化的方向 1 1、正相关、正相关 如工人工资与劳动生产率;人均消费水平与人如工人工资与劳动生产率;人均消费水平与人均收入水平等。均收入水平等。2 2、负相关、负相关 如商品流转额与流通费用。如商品流转额与流通费用。11/15/2022第二节第二节 线性相关的测定线性相关的测定一、相关表一、相关表(一)简单相关表(一)简单相关表机床机床1 12 23 34 45 56 67 78 89 910101111使用年限使用年限2 22 23 34 44 45 55 56 66 66 68 8年维修费年维修费用(元)用(元)4004005405405
6、2052064064074074060060080080070070076076090090084084011/15/2022(二)单变量分组相关表(二)单变量分组相关表使用年限使用年限机床数机床数(台台)平均维修费用平均维修费用2 22 24704703 31 15205204 42 26906905 52 27007006 63 37877878 81 18408409 91 110801080合计合计1212-11/15/2022(三三)双变量分组相关表双变量分组相关表年维修费用年维修费用(元)(元)机床使用年限机床使用年限(年年)合合计计2 23 34 45 56 68 89 9100
7、01100100011000 00 00 00 00 00 01 11 1900100090010000 00 00 00 01 10 00 01 18009008009000 00 00 01 10 01 10 02 27008007008000 00 01 10 02 20 00 03 36007006007000 00 01 11 10 00 00 02 25006005006001 11 10 00 00 00 00 02 24005004005001 10 00 00 00 00 00 01 1合计合计2 21 12 22 23 31 11 1121211/15/2022二、相关图二
8、、相关图使使用用年年限限11/15/2022三、相关系数三、相关系数(一)基本公式(一)基本公式:最先由卡尔:最先由卡尔.皮尔逊提出衡量一元皮尔逊提出衡量一元线性相关的密切程度。线性相关的密切程度。11/15/202211/15/2022(二)性质:(二)性质:(1 1)相关系数)相关系数r r的取值范围:的取值范围:-1r1-1r1(2)方向、类别)方向、类别 r0 为为正相关,正相关,r 0 为负相关;为负相关;r=0 表示不存在线性关系;表示不存在线性关系;|r|1 表示完全线性相关;表示完全线性相关;(3)程度)程度 0|r|1表示存在不同程度线性相关:表示存在不同程度线性相关:|r|
9、0.3为不存在线性相关为不存在线性相关 0.3|r|0.5 为低度线性相关;为低度线性相关;0.5|r|0.8为显著线性相关;为显著线性相关;|r|0.8为高度线性相关。为高度线性相关。11/15/2022例:例:P254 某地区居民货币收入和社会商品零售额资料某地区居民货币收入和社会商品零售额资料如下,试计算其相关系数,并作相关判别?如下,试计算其相关系数,并作相关判别?单位:亿元单位:亿元 年份年份12345678居民货币收入居民货币收入1213141514161820社会商品零售额社会商品零售额101212131314151711/15/202211/15/202211/15/20221
10、1/15/2022第三节第三节 回归分析回归分析一、回归分析的概念一、回归分析的概念 指在相关分析的基础上,根据相关关系的数指在相关分析的基础上,根据相关关系的数量表达式(回归方程式)与给定的量表达式(回归方程式)与给定的自变量自变量x x,揭示,揭示因变量因变量y y在数量上的平均变化,并据以进行因变量在数量上的平均变化,并据以进行因变量的估计或预测的统计分析方法。的估计或预测的统计分析方法。二、二、相关分析与回归分析的关系相关分析与回归分析的关系区别:区别:1 1、相关分析中相关分析中x与与y对等,回归分析中对等,回归分析中x与与y要确定自变量和因变量(随机变量);要确定自变量和因变量(随
11、机变量);11/15/2022 2 2、相关分析测定相关程度和方向,回归分析用、相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制;回归模型进行预测和控制;3 3、相关分析只有一个结果、相关分析只有一个结果 ;而在回归;而在回归分析中,自变量与因变量互换可以拟合两个独立分析中,自变量与因变量互换可以拟合两个独立的回归方程。的回归方程。联系:联系:1 1、相关分析是回归分析的基础和前提;、相关分析是回归分析的基础和前提;2 2、回归分析是相关分析的继续和深化。、回归分析是相关分析的继续和深化。11/15/2022三、简单线性回归三、简单线性回归1.回归分析的种类回归分析的种类按自变量的
12、按自变量的 个数分个数分(1)一元回归一元回归(简单回归)(简单回归)多元回归多元回归(复回归复回归)按回归曲线按回归曲线的形态分的形态分(2)线性回归线性回归非线性回归非线性回归一一 元元线线性性回回归归11/15/20222.一元线性回归模型一元线性回归模型11/15/20223.一元线性回归方程的几何意义一元线性回归方程的几何意义一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为0截距截距斜率斜率11/15/2022总体一元线性总体一元线性回归方程回归方程:样本一元线性回归方程:样本一元线性回归方程:斜率(回归系数)斜率(回归系数)截距截距 截距截距a a 表
13、示在没有自变量表示在没有自变量x x的影响时,其它各种的影响时,其它各种因素对因变量因素对因变量y y的平均影响;回归系数的平均影响;回归系数b b 表明自变表明自变量量x x每变动一个单位,因变量每变动一个单位,因变量y y平均变动平均变动b b个单位。个单位。11/15/20224.一元线性回归方程一元线性回归方程中参数中参数a、b的确定:的确定:基本数学要求:基本数学要求:最小平方法最小平方法11/15/2022例:例:某地区居民货币某地区居民货币收入和社会商品零收入和社会商品零售额资料如下,试售额资料如下,试拟合社会商品零售拟合社会商品零售额依居民货币收入额依居民货币收入变动的线性方程
14、?变动的线性方程?(单位:亿元(单位:亿元)年份年份收入收入x零售额零售额y112102131231412415135141361614718158201711/15/2022 当居民货币收入每增加当居民货币收入每增加1 1亿元时,社会商亿元时,社会商品零售额平均增加品零售额平均增加0.77780.7778亿元。亿元。11/15/202211/15/20225.5.回归系数回归系数b b与相关系数与相关系数r r的关系:的关系:四、一元线性回归方程检验四、一元线性回归方程检验(一)离差平方和的分解(一)离差平方和的分解 1.1.总平方和总平方和(SST)(SST)2.2.回归平方和回归平方和(
15、SSR)(SSR)反反映映由由于于x x 与与y y 之之间间的的线线性性关关系系引引起起的的y y的的取值变化,也称为可解释的平方和。取值变化,也称为可解释的平方和。3.3.残差平方和残差平方和(SSE)(SSE)反反映映除除x x以以外外的的其其他他因因素素对对y y 取取值值的的影影响响,也称为不可解释的平方和或剩余平方和。也称为不可解释的平方和或剩余平方和。11/15/2022剩余平方和剩余平方和回归平方和回归平方和总离差平方和总离差平方和11/15/2022(二)可决系数(二)可决系数(r r2 2)回归平方和占总离差平方和的比例。回归平方和占总离差平方和的比例。1.取值范围在取值范
16、围在 0,1 之间;之间;r2 1,说明回归,说明回归方程拟合的越好;方程拟合的越好;r20,说明回归方程拟合,说明回归方程拟合的越差;的越差;2.判定系数等于相关系数的平方,即判定系数等于相关系数的平方,即r2(r)211/15/2022 实际分析中,只有相关系数实际分析中,只有相关系数 大到一定程度大到一定程度时,才认为两变量的线性相关关系显著,回归方时,才认为两变量的线性相关关系显著,回归方程才有意义,因此有必要进行相关系数检验。程才有意义,因此有必要进行相关系数检验。r 检验步骤:检验步骤:据公式计算相关系数据公式计算相关系数r;根据给定的显著水平查相关系数表根据给定的显著水平查相关系
17、数表(见见p316),得临界值得临界值 判别:若判别:若 表明表明x与与y线性关系显著,线性关系显著,检验通过;反之表明检验通过;反之表明x与与y线性相关关系不显著。线性相关关系不显著。11/15/2022(三)(三)估计标准误差估计标准误差 是因变量各实际值与其估计值之间的平均差是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值代表性的强。异程度,表明其估计值对各实际值代表性的强。其值越小,回归方程的代表性越强,用回归方其值越小,回归方程的代表性越强,用回归方程估计或预测的结果越准确。可从一方面反映程估计或预测的结果越准确。可从一方面反映回归模型拟合的优劣状况。回归模型拟合
18、的优劣状况。11/15/2022(四)回归方程的显著性检验(四)回归方程的显著性检验FF检验检验 (线性关系的检验(线性关系的检验 )检验自变量和因变量之间的线性关系是否检验自变量和因变量之间的线性关系是否显著。显著。具体方法是将回归离差平方和具体方法是将回归离差平方和(SSR)同剩余同剩余离差平方和离差平方和(SSE)加以比较,应用加以比较,应用F检验来分析检验来分析二者之间的差别是否显著:二者之间的差别是否显著:如果是显著的,两个变量之间存在线性关如果是显著的,两个变量之间存在线性关系;系;如果不显著,两个变量之间不存在线性关如果不显著,两个变量之间不存在线性关系。系。11/15/2022
19、1.提出假设提出假设H0:线性关系不显著线性关系不显著2.计算检验统计量计算检验统计量F3.确定显著性水平确定显著性水平,并根据分子自由度,并根据分子自由度1和分和分母自由度母自由度n-2找出临界值找出临界值F 4.作出决策:若作出决策:若F F ,拒绝拒绝H0;若若FF ,接受接受H0回归方程的显著性检验:回归方程的显著性检验:p311:表:表F分布临界值分布临界值11/15/2022例题:例题:检验上面例题回归检验上面例题回归方程是否具有显著性?方程是否具有显著性?11/15/2022五、应用相关与回归分析注意的问题五、应用相关与回归分析注意的问题1.1.在定性分析的基础上进行定量分析;在
20、定性分析的基础上进行定量分析;2.2.要注意现象质的界限及相关关系作用的范围;要注意现象质的界限及相关关系作用的范围;3.3.要将各种分析指标结合应用;要将各种分析指标结合应用;4.4.要尽可能使用大样本。要尽可能使用大样本。11/15/2022本章作业教材P289练习711/15/2022本章练习一、填空1.1.回归系数表示回归系数表示 每增减一个单位时每增减一个单位时,平均增减的倍数。平均增减的倍数。2.2.是建立直线回归方程最有效的方法之一。是建立直线回归方程最有效的方法之一。3.3.一个回归方程只能作一种推算,即给出一个回归方程只能作一种推算,即给出 的数的数值,估计值,估计 的可能值
21、。的可能值。4.4.,说明两变量,说明两变量 。5.A5.A与与B B变量之间的相关系数变量之间的相关系数r=-0.95r=-0.95,C C与与D D之间的之间的相关系数相关系数r=0.85,r=0.85,则相关程度高的变量是则相关程度高的变量是 。11/15/2022二、选择二、选择1.1.下列哪两个变量之间的相关程度高(下列哪两个变量之间的相关程度高().商品销售额和商品销售量的相关系数是商品销售额和商品销售量的相关系数是0.90.9 .商品销售额和商业利润率的相关系数是商品销售额和商业利润率的相关系数是0.760.76 .流通费用率与商业利润率的相关系数是流通费用率与商业利润率的相关系
22、数是-0.94-0.94 .商品销售价格与销售量的相关系数是商品销售价格与销售量的相关系数是-0.91-0.912.2.直线回归分析中(直线回归分析中().自变量是可控制量,因变量是随机的自变量是可控制量,因变量是随机的 .两个变量不是对等的关系两个变量不是对等的关系 .利用一个回归方程,两个变量可以互相推算利用一个回归方程,两个变量可以互相推算 .根据回归系数可判定相关的方向根据回归系数可判定相关的方向11/15/20223.3.工工人人的的薪薪酬酬(元元)依依劳劳动动生生产产率率(千千元元)的的回回归归方程为方程为6060100100A.A.如如果果劳劳动动生生产产率率等等于于100010
23、00元元,则则工工人人薪薪酬酬为为160160元;元;B.B.如如果果劳劳动动生生产产率率每每增增加加10001000元元,则则工工人人的的薪薪酬酬平均提高平均提高100100元;元;C.C.如如果果劳劳动动生生产产率率每每增增加加10001000元元,则则工工人人薪薪酬酬增增加加160160元;元;D.D.如如果果工工人人薪薪酬酬为为260260元元,则则劳劳动动生生产产率率等等于于20002000元;元;E.劳劳动动生生产产率率每每下下降降10001000元元,则则工工人人薪薪酬酬平平均均减减少少100100元。元。11/15/20224.下列回归方程中,肯定错误的是(下列回归方程中,肯定错误的是()A.=10+2x r=0.52 A.=10+2x r=0.52 B.=500+0.1x r=0.75B.=500+0.1x r=0.75C.=-100+9x r=-0.86 C.=-100+9x r=-0.86 D.=-8+3.2x r=-0.93D.=-8+3.2x r=-0.93E.=140-1.8x r=0.85E.=140-1.8x r=0.8511/15/2022
限制150内