《(8)第7章 相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《(8)第7章 相关与回归分析.ppt(104页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章 回归分析与相关分析回归分析与相关分析相关和回归分析是研究事物的相互关系、测定它相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的具体形式和规们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。构分析、政策评价、预测和控制的重要工具。学习目的和要求:通过本章学习,要掌握相关与回归分析的基本概念;掌握一元线性回归模型的估计、检验及预测;理解多元线性回归模型;掌握单相关系数的计算及分析。第七章第七章 回归分析与相关分析回归分析与相关分析7.17.1相关
2、分析相关分析7.27.2一元线性回归分析一元线性回归分析一、相关分析概述一、相关分析概述二、相关关系的测定二、相关关系的测定7.17.1相关分析相关分析 出租汽车费用与行驶里程:出租汽车费用与行驶里程:总费用总费用=行驶里程行驶里程 每公里单价每公里单价 家庭收入与恩格尔系数:家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。函数关系函数关系函数关系函数关系(确定性关系)(确定性关系)(确定性关系)(确定性关系)相关关系相关关系(非确定性关系)(非确定性关系)(非确定性关系)(非确定性关系)比较下面两种现象间的依存关系比较下面两种现象间的依存关系(一)、函数关系与相
3、关关系(一)、函数关系与相关关系现象间的依存关系大致可以分成两种类型:现象间的依存关系大致可以分成两种类型:函数关系函数关系指指指指现象间所具有的严格的确定性的依现象间所具有的严格的确定性的依现象间所具有的严格的确定性的依现象间所具有的严格的确定性的依存关系存关系存关系存关系相关关系相关关系指指指指客观现象间确实存在,但数量上不客观现象间确实存在,但数量上不客观现象间确实存在,但数量上不客观现象间确实存在,但数量上不是严格对应的依存关系是严格对应的依存关系是严格对应的依存关系是严格对应的依存关系函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并
4、无严格的界限:函数关系与相关关系之间并无严格的界限:有函数关系的有函数关系的有函数关系的有函数关系的变量间,由于有测量误差及各种随机因素的干扰,可表现变量间,由于有测量误差及各种随机因素的干扰,可表现变量间,由于有测量误差及各种随机因素的干扰,可表现变量间,由于有测量误差及各种随机因素的干扰,可表现为相关关系;对具有相关关系的变量有深刻了解之后,相为相关关系;对具有相关关系的变量有深刻了解之后,相为相关关系;对具有相关关系的变量有深刻了解之后,相为相关关系;对具有相关关系的变量有深刻了解之后,相关关系有可能转化为或借助函数关系来描述。关关系有可能转化为或借助函数关系来描述。关关系有可能转化为或
5、借助函数关系来描述。关关系有可能转化为或借助函数关系来描述。即:函数关即:函数关即:函数关即:函数关系往往通过相关关系表现出来;函数关系是经常用作相关系往往通过相关关系表现出来;函数关系是经常用作相关系往往通过相关关系表现出来;函数关系是经常用作相关系往往通过相关关系表现出来;函数关系是经常用作相关分析的工具。但相关关系的范围比函数关系的范围要大。分析的工具。但相关关系的范围比函数关系的范围要大。分析的工具。但相关关系的范围比函数关系的范围要大。分析的工具。但相关关系的范围比函数关系的范围要大。按涉及变量的多少分为按涉及变量的多少分为相相关关关关系系的的种种类类按照表现形式不同分为按照表现形式
6、不同分为按照变化方向不同分为按照变化方向不同分为一元相关一元相关多元相关多元相关直线相关直线相关曲线相关曲线相关负相关负相关正相关正相关(二)、相关关系的种类(二)、相关关系的种类4。按相关程度不同分为。按相关程度不同分为不不相关相关完全相关完全相关不完全相关不完全相关一、相关分析概述一、相关分析概述二、相关关系的测定二、相关关系的测定7.17.1相关分析相关分析定性分析定性分析是是依据研究者的理论知识和实践经依据研究者的理论知识和实践经验,对客观现象之间是否存在相关验,对客观现象之间是否存在相关关系,以及何种关系作出判断关系,以及何种关系作出判断定量分析定量分析在在在在定性分析的基础上,通过
7、编制定性分析的基础上,通过编制定性分析的基础上,通过编制定性分析的基础上,通过编制相关表相关表相关表相关表、绘制绘制绘制绘制相关图相关图相关图相关图、计算、计算、计算、计算相关系数相关系数相关系数相关系数与与与与判定系数判定系数判定系数判定系数等方法,来判断现象之间相关的方向、等方法,来判断现象之间相关的方向、等方法,来判断现象之间相关的方向、等方法,来判断现象之间相关的方向、形态及密切程度形态及密切程度形态及密切程度形态及密切程度(一)、相关关系的测定(即:相关分析)(一)、相关关系的测定(即:相关分析)相关分析是研究现象在数量上依存关系的密切程度和相关方向的方法。分为定性分析和定量分析两种
8、:简单简单相关表相关表适用于所观察的样本单位数适用于所观察的样本单位数较少,不需要分组的情况较少,不需要分组的情况分组分组相关表相关表适用于所观察的样本单位数较适用于所观察的样本单位数较多标志变异又较复杂,需要分多标志变异又较复杂,需要分组的情况组的情况将现象之间的相互关系,用将现象之间的相互关系,用表格的形式来反映。表格的形式来反映。(二)、相关表(二)、相关表(二)、相关表(二)、相关表正正 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关xyxyxyxy又称又称散点图散点图,用直角坐标系的,用直角坐标系的x轴代表自变量,轴代表自变量,y轴轴代表因变量,将两个变量间相对应的变量代
9、表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。点分布状况的图形。(三)、相关图(三)、相关图在在直线相关直线相关的条件下,用以反映的条件下,用以反映两变量两变量间间线线性相关性相关密切程度的统计指标,用密切程度的统计指标,用r表示表示(四)、相关系数(四)、相关系数相关系数相关系数r r的取值的取值范围:范围:-1r1-1r1r0 为为正相关正相关,r 0 为为负相关负相关;|r|=0 表示不存在表示不存在线性线性关系;关系;|r|1 表示表示完全完全线性线性相关相关;0|r|1表示存在表示存在不同程度线性相关不
10、同程度线性相关:|r|0.4 为低度线性相关;为低度线性相关;0.4|r|0.7为显著性线性相关;为显著性线性相关;0.7|r|1.0为为高度高度显著性线性相关。显著性线性相关。结论:结论:工业总产值与能源消耗量之间存工业总产值与能源消耗量之间存在高度的线性正相关关系。在高度的线性正相关关系。【例例】计算工业总产值与能源消耗量之间的相计算工业总产值与能源消耗量之间的相关系数。关系数。资料资料相关系数的检验相关系数的检验主要是显著性检验。检验步骤是:1)H0:r=0(不相关)H1:r0(相关)2)构造检验统计量:t(n-2)3)给定a,查T分布得临界值ta/2(n-2);4)(根据样本)计算5)
11、比较判断,当|t|ta/2(n-2)时,接受H0;当|t|ta/2(n-2)时,接受H1。第七章第七章 回归分析与相关分析回归分析与相关分析7.17.1相关分析相关分析7.27.2一元线性回归分析一元线性回归分析一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测7.27.2一元线性回归分析一元线性回归分析回归分析回归分析指根据相关关系的数量表达指根据相关关系的数量表达式(回归方程式)与给定的式(回归方程式)与给定的自变量自变量x x,揭示揭示因变量因变量
12、y y在数在数量上的平均变化和求得因变量上的平均变化和求得因变量的预测值的统计分析方法量的预测值的统计分析方法回归:退回回归:退回regression(一)、回归分析含义(二)、回归分析与相关分析的区别与联系(二)、回归分析与相关分析的区别与联系q理论和方法具有一致性;理论和方法具有一致性;q无相关就无回归,相关程度越高,回无相关就无回归,相关程度越高,回归越好;归越好;q 相关系数和回归系数方向一致,可相关系数和回归系数方向一致,可以互相推算。以互相推算。联系:联系:q相关分析中相关分析中x与与y对等,回归分析中对等,回归分析中x与与y要要确定自变量和因变量;确定自变量和因变量;q相关分析中
13、相关分析中x、y均为随机变量,回归分析均为随机变量,回归分析中只有中只有y为随机变量;为随机变量;q相关分析测定相关程度和方向,回归分析相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。用回归模型进行预测和控制。(二)、回归分析与相关分析的区别与联系(二)、回归分析与相关分析的区别与联系区别:区别:注意注意 我们不能把回归分析看作是在变我们不能把回归分析看作是在变量间建立一个因果关系的过程。量间建立一个因果关系的过程。回归分析只能表明,变量是如何回归分析只能表明,变量是如何或者是以怎样的程度彼此联系在或者是以怎样的程度彼此联系在一起的。有关因果关系的任何结一起的。有关因果关系的任何
14、结论,必须建立在理论分析的基础论,必须建立在理论分析的基础之上。之上。(三)、回归分析的种类(三)、回归分析的种类一元回归一元回归(简单回归)(简单回归)多元回归多元回归(复回归复回归)线性回归线性回归非线性回归非线性回归一一 元元线线性性回回归归Simple Linear regression按自变量的按自变量的 个数分个数分按回归曲线按回归曲线的形态分的形态分一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测7.27.2一元线性回归分析一元线性回归分
15、析(一)、一元线性回归模型(一)、一元线性回归模型对于经判断具有线性关系的两个变量对于经判断具有线性关系的两个变量y y与与x x,构造一元线性回归模型为:构造一元线性回归模型为:假定假定E()=0,有,有总体一元线性回归方程总体一元线性回归方程:(二)、一元线性回归方程的几何意义(二)、一元线性回归方程的几何意义截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为0总体一元线性总体一元线性回归方程回归方程:样本一元线性回归方程样本一元线性回归方程:以样本统计量估计总体参数以样本统计量估计总体参数斜率(回归系数)斜率(回归系数)截距截距截距截距a 表示
16、在没有自变量表示在没有自变量x的影响时,其它各种因素对因变的影响时,其它各种因素对因变量量y的平均影响;的平均影响;回归系数回归系数b 表明自变量表明自变量x每变动一个单位,每变动一个单位,因变量因变量y平均变动平均变动b个单位。个单位。(估计的回归方程估计的回归方程)(一元线性回归方程)(一元线性回归方程)(三)总体与样本的回归方程随机干扰:随机干扰:各种偶然各种偶然因素、观察误差和其因素、观察误差和其他被忽视因素的影响他被忽视因素的影响X对对y的线性影响而形的线性影响而形成的系统部分,反映两成的系统部分,反映两变量的平均变动关系,变量的平均变动关系,即本质特征。即本质特征。残差残差(Res
17、idual):(四)、一元线性回归方程(四)、一元线性回归方程(四)、一元线性回归方程(四)、一元线性回归方程中参数中参数中参数中参数a a、b b的确定:的确定:的确定:的确定:最小平方法最小平方法基本数学要求:基本数学要求:整理得到由两个关于整理得到由两个关于a、b的二元一次的二元一次方程组成的方程组:方程组成的方程组:进一步整理,有:进一步整理,有:【分析分析】因为工业总产值与能源消耗量之间存因为工业总产值与能源消耗量之间存在高度正相关关系(在高度正相关关系(),),所以可以拟合工业总产值对能源消耗量的线性所以可以拟合工业总产值对能源消耗量的线性回归方程。回归方程。【例例】建立工业总产值
18、对能源消耗量的线建立工业总产值对能源消耗量的线性回归方程性回归方程 资料见资料见解:设解:设线性回归方程为线性回归方程为即线性回归方程为:线性回归方程为:计算结果表明,在其他条件不变时,能源消耗计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将量每增加一个单位(十万吨),工业总产值将增加增加0.79610.7961个单位(亿元)。个单位(亿元)。补:最小二乘法估计的优良性质补:最小二乘法估计的优良性质q残差之和为零残差之和为零q所拟合直线通过样本散点图的重心所拟合直线通过样本散点图的重心q误差项与解释变量不相关误差项与解释变量不相关qa a与与b b分别是总体回归
19、系数的无偏估计量分别是总体回归系数的无偏估计量qa a与与b b均为服从正态分布的随机变量均为服从正态分布的随机变量一元线性回归模型的一元线性回归模型的假定假定是相关系数的平方,用是相关系数的平方,用 表表示;用来衡量回归方程对示;用来衡量回归方程对y y的的解释程度。解释程度。判定系数取判定系数取值值范围:范围:越接近于越接近于1 1,表明,表明x x与与y y之间之间的相关性越强;的相关性越强;越接近于越接近于0 0,表明两个变量之间几乎没有直,表明两个变量之间几乎没有直线相关关系线相关关系.(五)、判定系数(五)、判定系数结论:结论:工业总产值与能源消耗量之间存工业总产值与能源消耗量之间
20、存在高度的线性正相关关系;能源消耗量在高度的线性正相关关系;能源消耗量x的变化能够解释工业总产值的变化能够解释工业总产值y变化的变化的95.2。【例例】计算工业总产值与能源消耗量之间的相计算工业总产值与能源消耗量之间的相关系数及判定系数关系数及判定系数 资料资料1、b与与r的关系:的关系:r0 r0 r=0b0 b0 b=0说明:2、判定系数与相关系数的关系、判定系数与相关系数的关系3、判定系数与相关系数的区别:、判定系数与相关系数的区别:q判定系数无方向性,相关系数则有方向,判定系数无方向性,相关系数则有方向,其方向与样本回归系数其方向与样本回归系数 b 相同;相同;q判定系数说明变量值的总
21、离差平方和中判定系数说明变量值的总离差平方和中可以用回归线来解释的比例,相关系数可以用回归线来解释的比例,相关系数只说明两变量间关联程度及方向;只说明两变量间关联程度及方向;q相关系数有夸大变量间相关程度的倾向,相关系数有夸大变量间相关程度的倾向,因而判定系数是更好的度量值。因而判定系数是更好的度量值。补:一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测7.27.2一元线性回归分析一元线性回归分析1、回归估计标准差、回归估计标准差是是因变量各实际值与其
22、估计值之间的因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实平均差异程度,表明其估计值对各实际值代表性的强弱;其值越小,回归际值代表性的强弱;其值越小,回归方程的代表性越强,用回归方程估计方程的代表性越强,用回归方程估计或预测的结果越准确。或预测的结果越准确。在在大样本条件下,可用公式计算:大样本条件下,可用公式计算:【例例】计算前面拟合的工业总产值对能源消耗量回计算前面拟合的工业总产值对能源消耗量回归方程的回归标准差归方程的回归标准差 资料资料即:表明实际工业总产值与估计的工业总产值之间平均相差2.457亿元。剩余离差平方和剩余离差平方和回归离差回归离差平方和平方和总离差平方和
23、总离差平方和2、总离差平方和的分解、总离差平方和的分解Lyy=U+Q总离差平方和总离差平方和回归离差平方和回归离差平方和剩余离差平方和剩余离差平方和估计标准差越小,则变量间相关程度估计标准差越小,则变量间相关程度越高,回归线对越高,回归线对Y的解释程度越高。的解释程度越高。3、判定系数与估计标准差的关系:、判定系数与估计标准差的关系:一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测7.27.2一元线性回归分析一元线性回归分析样本相关系数样本相关系数r
24、r的显著性检验(的显著性检验(t t检验法)检验法)提出假设:提出假设:目的目的检验检验总体总体两变量间线性相关性是否显著两变量间线性相关性是否显著步步骤骤构造检验统计量:构造检验统计量:相关系数的显著性检验(相关系数的显著性检验(t t检验法)检验法)根据给定的显著性水平根据给定的显著性水平,确定临确定临界值界值 ;计算检验统计量并做出决策。计算检验统计量并做出决策。确定原假设的拒绝规则确定原假设的拒绝规则:若若 ,则接受,则接受H H0 0,表示总体两表示总体两变量间线性相关性不显著变量间线性相关性不显著;若若 ,则拒绝,则拒绝H H0 0,表示总体两表示总体两变量间线性相关性显著变量间线
25、性相关性显著步步骤骤【例例】检验工业总产值与能源消耗量之间检验工业总产值与能源消耗量之间的线性相关性是否显著的线性相关性是否显著 资料资料当当 成立时,则统计量成立时,则统计量一、回归分析概述一、回归分析概述二、一元线性回归模型二、一元线性回归模型三、回归估计标准差三、回归估计标准差四、线性相关的显著性检验四、线性相关的显著性检验五、回归估计与预测五、回归估计与预测7.27.2一元线性回归分析一元线性回归分析回归方程的估计与预测回归方程的估计与预测估计的前提:估计的前提:回归方程经过检验,证明回归方程经过检验,证明 X 和和 Y 的关系在统计上是显著相关的。的关系在统计上是显著相关的。对于给定
26、的对于给定的 X X 值,求出值,求出 Y Y 平均值的一平均值的一个估计值或个估计值或 Y Y 的一个个别值的预测值。的一个个别值的预测值。对于给定的对于给定的 X X 值,求出值,求出 Y Y 的平均值的平均值的的置信区间置信区间或或 Y Y 的一个个别值的的一个个别值的预测预测区间区间。点估计点估计区间估计区间估计点估计点估计若若 x=80(十万吨)十万吨),则:则:区间估计区间估计对于给定的对于给定的 x=x0,Y 的的1-置信区间为:置信区间为:自由度为自由度为n-2的的 t 分布分布的的 水平双侧分位数水平双侧分位数即:即:在大样本条件下,近似有:在大样本条件下,近似有:因变量的区
27、间预测的特点(1)个别值的预测区间大于平均值的预测区间个别值的预测区间大于平均值的预测区间:y平均值的预测值与真实平均值有误差,主要是受抽样波动影响;y个别值的预测值与真实个别值的差异不仅受抽样波动影响,而且还受随机扰动项的影响(2)对对 预测区间随预测区间随 变化而变化变化而变化:时,=0,此时预测区间最窄,越是远离 ,越大,预测区间越宽。因变量的区间预测的特点(续)(3)预测区间与样本容量有关预测区间与样本容量有关:样本容量n越 大,越大,预测误差的方差越小,预测区间也越窄。(4)当样本容量趋于无穷大(即n)时,不存在抽样误差,平均值预测误差趋于0,此时个别值的预测误差只决定于随机扰动的方
28、差。SPSS输出结果(一)输出结果(一)方差分析表方差分析表SPSS输出结果(二)输出结果(二)SPSS输出结果(三)输出结果(三)35.0024.0021.34872-1.6755718.71588 23.9815738.0025.0023.73710-1.4496521.36539 26.1088140.0024.0025.32935-1.2990423.12509 27.5336042.0028.0026.92160-1.1484224.87796 28.9652349.0032.0032.49447-.6212830.92932 34.0596252.0031.0034.88284-.
29、3953633.45997 36.3057254.0037.0036.47509-.2447535.11637 37.8338259.0040.0040.45572.1317939.12628 41.7851662.0041.0042.84409.3577141.43978 44.2484164.0040.0044.43634.5083242.94855 45.9241365.0047.0045.23247.5836343.69437 46.7705668.0050.0047.62084.8095545.90378 49.3379169.0049.0048.41697.8848546.6324
30、5 50.2014871.0051.0050.00922 1.0354748.08053 51.9379072.0048.0050.80534 1.1107748.80060 52.8100876.0058.0053.98984 1.4120051.66055 56.31912非标准预测值非标准预测值标准预测值标准预测值下限下限上限上限企业编号企业编号月产量(千吨)月产量(千吨)X生产费用(万元)生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个八个同类工业企业的月产量与生产费用同类工业企业的月产量与生产费用简单相关
31、表简单相关表平均每昼平均每昼夜产量夜产量 固定资产原值固定资产原值35404045455050555560606565706006501 15506001235005502134505001517400450224350400030035022223543120(百万元)(百万元)(吨)(吨)20个同类工业企业固定资产原值与平均每昼夜产量个同类工业企业固定资产原值与平均每昼夜产量分组相关表分组相关表序号序号能源消耗量能源消耗量(十万吨(十万吨)x工业总产值工业总产值(亿元)(亿元)yx2y2xy12345678910111213141516353840424952545962646568697
32、17276242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合计合计916625550862617537887单选题单选题下面现象间的关系属于相关关系的是下面现象间的关系属于相关关系的是()()。A A.圆的周长和它的
33、半径之间的关系圆的周长和它的半径之间的关系B.B.价格不变条件下价格不变条件下,商品销售额与销售量之间商品销售额与销售量之间的关系的关系C.C.家庭收入愈多家庭收入愈多,其消费支出也有增长的趋势其消费支出也有增长的趋势D.D.正方形面积和它的边长之间的关系正方形面积和它的边长之间的关系答案:C(A、B、D时函数关系)多选题多选题下列哪些关系是相关关系下列哪些关系是相关关系()()A.A.球的半径长度和体积的关系球的半径长度和体积的关系B.B.农作物收获和施肥量的关系农作物收获和施肥量的关系C.C.商品销售额和利润率的关系商品销售额和利润率的关系D.D.产品产量与单位成品成本的关系产品产量与单位
34、成品成本的关系E.E.家庭收入多少与消费支出增长的关系家庭收入多少与消费支出增长的关系答案:B C D E A是函数关系 填空题填空题当变量当变量x x值增加,变量值增加,变量y y值也增加,这值也增加,这是是 相关关系;当变量相关关系;当变量x x值减少,变值减少,变量量y y值也减少,这是值也减少,这是 相关关系。相关关系。答案:正 正判断题判断题施肥量与收获率是正相关关系。施肥量与收获率是正相关关系。()答案:施肥量与收获率有相关关系,但不是正相关。单选题单选题若若物物价价上上涨涨,商商品品的的需需求求量量相相应应减减少少,则则物物价价与与商商品品需需求求量量之之间间的的关关系系为为()
35、。A.A.不相关不相关 B.B.负相关负相关 C.C.正相关正相关 D.D.复相关复相关答案:B多选题多选题下列属于正相关的现象是下列属于正相关的现象是()()A.A.家庭收入越多家庭收入越多,其消费支出也越多其消费支出也越多B.B.某产品产量随工人劳动生产率提高而增加某产品产量随工人劳动生产率提高而增加C.C.流通费用率随商品销售额的增加而减少流通费用率随商品销售额的增加而减少D.D.生生产产单单位位产产品品所所耗耗工工时时随随劳劳动动生生产产率率的的提提高高而而减少减少E.E.产品产量随生产用固定资产价值的减少而减少产品产量随生产用固定资产价值的减少而减少答案:A B E多选题多选题下列属
36、于负相关的现象是下列属于负相关的现象是()()A.A.商品流转的规模愈大商品流转的规模愈大,流通费用水平越低流通费用水平越低B.B.流通费用率随商品销售额的增加而减少流通费用率随商品销售额的增加而减少C.C.国民收入随投资额的增加而增长国民收入随投资额的增加而增长D.D.生生产产单单位位产产品品所所耗耗工工时时随随劳劳动动生生产产率率的的提提高高而减少而减少E.E.某产品产量随工人劳动生产率的提高而增加某产品产量随工人劳动生产率的提高而增加答案:A B D练习练习:判断题判断题计算相关系数的两个变量都是随机计算相关系数的两个变量都是随机变量(变量()答案:填空题填空题相关系数绝对值的大小反映相
37、关的相关系数绝对值的大小反映相关的 ,相关系数的正负反映相关的,相关系数的正负反映相关的 。答案:相关的密切程度 相关的方向多选题多选题相相关关系系数数是是零零,说说明明两两个个变变量量之之间间的的关系关系()()A.A.完全不相关完全不相关 B.B.高度相关高度相关 C.C.低度相关低度相关D.D.不相关不相关 E.E.显著相关显著相关答案:A D多选题多选题若若两两个个变变量量之之间间的的相相关关系系数数为为-1,-1,则则这两个变量是这两个变量是()()A.A.负相关关系负相关关系 B.B.正相关关系正相关关系 C.C.不相关不相关 D.D.完全相关关系完全相关关系 E.E.不完全相关关
38、系不完全相关关系答案:A D单选题单选题配合回归直线方程对资料的要求是配合回归直线方程对资料的要求是()()。A.A.因变量是给定的数值因变量是给定的数值,自变量是随机的自变量是随机的 B.B.自变量是给定的数值自变量是给定的数值,因变量是随机的因变量是随机的 C.C.自变量和因变量都是随机的自变量和因变量都是随机的 D.D.自变量和因变量都不是随机自变量和因变量都不是随机的的答案:B多选题多选题直线回归方程直线回归方程y yc c=a+bx=a+bx 中的中的b b 称为回归系数称为回归系数,回归系数的作用是回归系数的作用是()()A A可确定两变量之间因果的数量关系可确定两变量之间因果的数
39、量关系B.B.可确定两变量的相关方向可确定两变量的相关方向C.C.可确定两变量相关的密切程度可确定两变量相关的密切程度D.D.可确定因变量的实际值与估计值的变异程度可确定因变量的实际值与估计值的变异程度E.E.可确定当自变量增加一个单位时可确定当自变量增加一个单位时,因变量的因变量的平均增加量平均增加量答案:A B E单选题单选题在回归直线方程在回归直线方程y yc ca+bxa+bx中中,b,b表示表示()()。A.A.当当x x增加一个单位时增加一个单位时,y,y增加增加a a的数量的数量 B.B.当当y y增加一个单位时增加一个单位时,x,x增加增加b b的数量的数量 C.C.当当x x
40、增加一个单位增加一个单位时时,y,y的平均增加量的平均增加量 D.D.当当y y增加一个单位增加一个单位时时,x,x的平均增加的平均增加量量答案:C单选题单选题某校对学生的考试成绩和学习时间的关系进某校对学生的考试成绩和学习时间的关系进行测定行测定,建立了考试成绩倚学习时间的直线回建立了考试成绩倚学习时间的直线回归方程为归方程为:y:yc c=180-5x,=180-5x,该方程明显有误该方程明显有误,错误在错误在于于()()。A.aA.a值的计算有误值的计算有误,b,b值是对的值是对的B.bB.b值的计算有误值的计算有误,a,a值是对值是对的的C.aC.a值和值和b b值的计算值的计算都有误
41、都有误D.D.自变量和因变量的关系搞错了自变量和因变量的关系搞错了答案:C多选题多选题回归分析的特点有回归分析的特点有()()A.A.两个变量是不对等的两个变量是不对等的 B.B.必须区分自变量和因变量必须区分自变量和因变量 C.C.两上变量都是随机的两上变量都是随机的 D.D.因变量是随机的因变量是随机的 E.E.自变量是可以控制的量自变量是可以控制的量 F.F.回归系数只有一个回归系数只有一个答案:A B D E 判断题判断题利用一个回归方程,两个变量可以利用一个回归方程,两个变量可以互相推算(互相推算()答案:只能用自变量推算因变量多选题多选题直线回归分析中直线回归分析中()()A.A.
42、自变量是可控制量自变量是可控制量,因变量是随机的因变量是随机的B.B.两个变量不是对等的关系两个变量不是对等的关系C.C.利用一个回归方程利用一个回归方程,两个变量可以互相推算两个变量可以互相推算D.D.根据回归系数可判定相关的方向根据回归系数可判定相关的方向E.E.对对于于没没有有明明显显因因果果关关系系的的两两个个线线性性相相关关变变量量可求得两个回归方程可求得两个回归方程答案:A B D E多选题多选题 在直线回归方程在直线回归方程y yc c=a+bx=a+bx 中中()()A.A.必必须须确确定定自自变变量量和和因因变变量量,即即自自变变量量是是给给定定 的的,因变量是随机的因变量是
43、随机的B.B.回归系数既可以是正值回归系数既可以是正值,也可以是负值也可以是负值C.C.一一个个回回归归方方程程既既可可以以由由自自变变量量推推算算因因变变量量的的估计值估计值,也可以由因变量的值计算自变量的值也可以由因变量的值计算自变量的值D.D.两个变量都是随机的两个变量都是随机的E.E.两两个个变变量量存存在在线线性性相相关关关关系系,而而且且相相关关程程度度显显著著答案:A B E判断题判断题估计标准误指的就是实际估计标准误指的就是实际值值y y与估计与估计值值y yc c 的平均误差程度(的平均误差程度()答案:7.3 多元线性相关与回归分析多元线性相关与回归分析*一、多元线性回归模
44、型及假定多元线性回归模型及假定二、多元线性回归模型的估计多元线性回归模型的估计三、多元线性回归模型的检验三、多元线性回归模型的检验 一、多元线性回归模型及假定一、多元线性回归模型及假定 多元总体线性回归函数一般形式 条件均值形式 多元线性样本回归函数:一般形式条件均值形式 多元线性回归模型的矩阵多元线性回归模型的矩阵表示表示多元总体线性回归模型的矩阵表示多元总体线性回归模型的矩阵表示 Y=Y=X+UX+U多元线性样本回归函数的矩阵表示 Y=X+e 偏回归系数:多元线性回归模型中,回归系数表示当控制其它自变量不变的条件下,第j个自变量的单位变动对因变量均值的影响,这样的回归系数称为偏回归系数。二
45、、多元线性回归模型的估计多元线性回归模型的估计 多元回归模型的假定多元回归模型的假定 相同的假定:零均值、同方差、无自相关、随机扰动项与自变量不相关、U正态性增加的假定:各自变量之间不存在线性关系。在此条件下,自变量观测值矩阵X X列满秩 Rank(X )=k方阵满秩 Rank()=k 意义:可逆,存在 多元回归参数的最小二乘估计多元回归参数的最小二乘估计使残差平方和达到最小,其充分必要条件 正规方程组 -多元线性回归的最小二乘估计式正规方程组可简记为矩阵形式 存在 参数向量的最小二乘估计为参数最小二乘估计的性质参数最小二乘估计的性质可以证明:多元线性回归的最小二乘估计也是最佳线性无偏估计。随
46、机误差项方差的估计随机误差项方差的估计方差 未知,需要利用样本回归的残差平方和去估计。可以证明,是随机扰动项方差的无偏估计 三、多元线性回归模型的检验三、多元线性回归模型的检验拟合优度检验拟合优度检验多元线性回归离差平方和的分解式多元线性回归离差平方和的分解式 变差变差 TSS =RSS +ESS (总离差平方和)(残差平方和)(回归平方和)自由度自由度 n-1 =n-k +k-1多重可决系数:多重可决系数:修正的可决系数修正的可决系数 为什么要修正?可决系数是自变量个数的不减函数,比较因变量相同而自变量个数不同的两个模型的拟合程度时,不能简单地对比多重可决系数。需要用自由度去修正多重可决系数
47、中的残差平方和与回归平方和 相互关系:回归参数的显著性检验回归参数的显著性检验 t t 检验检验 在多元回归中可以证明 其中:是矩阵第 j 行第 j 列的元素。因为未知,故也未知。现用代替对原假设 分别作 t 检验 ,可构造统计量 :回归方程的显著性检验回归方程的显著性检验 F F 检验检验目的:检验多个变量联合对因变量是否有显著影响方法:在方差分析的基础上利用F检验进行假定:不全为零方方差差分分析析表表离差来源平方和自由度方差源于回归源于残差k-1n-kESS/(k-1)RSS/(n-k)总离差n-1 F检验的方法 给定显著性水平,在F分布表中查出自由度为k-1和n-k 的临界值 F服从自由
48、度为 k-1 和 n-k 的 F 分布。F F检验:检验:在成立的条件下,统计量:若 ,则拒绝 ,说明回归方程中所有自变量联合起来对因变量有显著影响 若 ,则接受 ,说明回归方程中所有自变量联合起来对因变量影响不显著 本章小结本章小结1、各种变量相互之间的依存关系:确定性的函数关系、不确定性的相关关系 2、变量间的相关关系的程度用相关系数去度量 3、现代意义的回归是关于一个变量对另一个或另外多个变量依存关系的研究。回归分析的目的是要用样本回归函数去估计总体回归函数。4、线性回归的各项基本假定 5、简单线性回归和多元线性回归的最小二乘估计 6、可决系数或修正的可决系数去度量回归的拟合优度 本章小
49、结(续)本章小结(续)7 7 7 7、各个回归系数显著性的、各个回归系数显著性的、各个回归系数显著性的、各个回归系数显著性的t t t t检验或检验或检验或检验或P P P P值检验值检验值检验值检验8 8 8 8、回归方程的显著性检验:在方差分析基础上的、回归方程的显著性检验:在方差分析基础上的、回归方程的显著性检验:在方差分析基础上的、回归方程的显著性检验:在方差分析基础上的F F F F检检检检验验验验 9 9 9 9、利用估计的线性回归模型对因变量作点预测和区、利用估计的线性回归模型对因变量作点预测和区、利用估计的线性回归模型对因变量作点预测和区、利用估计的线性回归模型对因变量作点预测和区间预测间预测间预测间预测 1010、应用、应用ExcelExcel去实现去实现 相关分析和回归分析的实际计相关分析和回归分析的实际计算和图形描绘算和图形描绘 第七章重要公式1、总体相关系数2、样本相关系数3、总体回归函数(PRF)4、样本回归函数(SRF)第七章重要公式(续1)5、最小二乘估计6、的无偏估计7、可决系数 第七章重要公式(续2)8、修正可决系数 9、t检验统计量10、F检验统计量第第7 7章结束了章结束了!
限制150内