第六章相关与回归分析.ppt
6-1统计学统计学STATISTICSSTATISTICS第六章第六章 相关与回归分析相关与回归分析6-2统计学统计学STATISTICSSTATISTICS内容提要内容提要1、相关关系的概念与种类、相关关系的概念与种类 2、相关分析相关分析3、一元线性回归分析一元线性回归分析4、多元线性回归分析多元线性回归分析5、曲线回归分析曲线回归分析6-3统计学统计学STATISTICSSTATISTICS学习目标学习目标1、理解相关关系的概念、理解相关关系的概念2、掌握一元线性回归的基本原理和参数估、掌握一元线性回归的基本原理和参数估计及模型检验的基本方法计及模型检验的基本方法3、了解多元线性与曲线回归的分析方法、了解多元线性与曲线回归的分析方法4、利用回归方程进行估计和预测、利用回归方程进行估计和预测5、用、用 Excel 进行回归分析进行回归分析6-4统计学统计学STATISTICSSTATISTICS第一节相关关系概述第一节相关关系概述6-5统计学统计学STATISTICSSTATISTICS一、变量间的关系一、变量间的关系6-6统计学统计学STATISTICSSTATISTICS(一)函数关系(一)函数关系1 1、反反映映变变量量之之间间一一一一对对应应的的确确定关系。定关系。2 2、设设有有两两个个变变量量 x x 和和 y y,变变量量 y y 随随变变量量 x x 一一起起变变化化,并并完完全全依依赖赖于于 x x ,当当变变量量 x x 取取某某个个数数值值时时,y y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y y =f f(x x),其其中中 x x 称为自变量,称为自变量,y y 称为因变量称为因变量3 3、各、各观测点落在一条线上观测点落在一条线上 x xy y6-7统计学统计学STATISTICSSTATISTICS函数关系函数关系(几个例子几个例子)函数关系的例子函数关系的例子某某种种商商品品的的销销售售额额y y与与销销售售量量x x之之间间的的关关系系可可表表示为示为 y y=px px(p p 为单价为单价)圆的面积圆的面积S S与半径之间的关系可表示为与半径之间的关系可表示为S S=R R2 2 企企业业的的原原材材料料消消耗耗额额y y与与产产量量x x1 1 、单单位位产产量量消消耗耗x x2 2 、原材料价格、原材料价格x x3 3之间的关系可表示为之间的关系可表示为 y y=x x1 1 x x2 2 x x3 3 6-8统计学统计学STATISTICSSTATISTICS(二)相关关系(二)相关关系(correlation)1.变变量量间间之之间间不不严严格格的的数数量量依存关系。依存关系。2.一一个个变变量量的的取取值值不不能能由由另另一个变量唯一确定。一个变量唯一确定。3.当当变变量量 x x 取取某某个个值值时时,变变量量 y y 的取值可能有几个。的取值可能有几个。4.各观测各观测点不在一条线上。点不在一条线上。x xy y6-9统计学统计学STATISTICSSTATISTICS相关关系相关关系(几个例子几个例子)相关关系的例子相关关系的例子父亲身高父亲身高y y与子女身高与子女身高x x之间的关系之间的关系收入水平收入水平y y与受教育程度与受教育程度x x之间的关系之间的关系居民消费支出居民消费支出y y与收入与收入x x之间的关系之间的关系商品销售额商品销售额y y与广告费支出与广告费支出x x之间的关系之间的关系居民储蓄余额居民储蓄余额y y与收入与收入x x之间的关系之间的关系6-10统计学统计学STATISTICSSTATISTICS 二、相关关系的种类二、相关关系的种类单相关1、按相关的形式分为:线性相关非线性相关2、按所研究的变量多少分为:复相关3、按相关的方向分为:正相关负相关4、按相关的程度分为:完全相关不完全相关不相关6-11统计学统计学STATISTICSSTATISTICS不同相关形式散点图不同相关形式散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 6-12统计学统计学STATISTICSSTATISTICS三、相关关系分析的方法三、相关关系分析的方法6-13统计学统计学STATISTICSSTATISTICS(一)相关分析(一)相关分析1.相关分析主要用于测定具有相关关系的变量之间相互关系的密切程度。2.是回归分析的基础。3.分析方法主要有:绘制散点图、编制相关表、计算相关系数或相关指数等。6-14统计学统计学STATISTICSSTATISTICS(二)回归分析(二)回归分析(Regression)1.研究具有相关关系的变量值之间一般的数量变动关系,即自变量发生变化时,因变量平均会发生多大的变化。2.通过建立回归方程进行分析。3.回归方程除可用于研究相关变量之间的一般数量变动关系外,还常用于进行预测。6-15统计学统计学STATISTICSSTATISTICS回归模型的类型回归模型的类型6-16统计学统计学STATISTICSSTATISTICS第二节相关分析第二节相关分析6-17统计学统计学STATISTICSSTATISTICS一、相关表和相关图一、相关表和相关图6-18统计学统计学STATISTICSSTATISTICS相关表与相关图相关表与相关图(概念要点)(概念要点)1、相关表和相关图是研究相关关系的直观工相关表和相关图是研究相关关系的直观工具。具。一般在进行详细的定量分析之前,可一般在进行详细的定量分析之前,可以利用它们对现象之间存在的相关关系的以利用它们对现象之间存在的相关关系的方向、形式和密切程度做大致的判断。方向、形式和密切程度做大致的判断。2、相关表相关表是一种反映变量之间相关关系的统是一种反映变量之间相关关系的统计表。计表。3、相关图又称散点图相关图又称散点图:用来反映变量之间相用来反映变量之间相关关系的图形关关系的图形。6-19统计学统计学STATISTICSSTATISTICS相关表相关表(例(例6.1)家庭编号家庭编号1 12 23 34 45 56 67 78 89 91010可支配收入可支配收入 2525 1818 6060 45456262 8888 9292 999975759898可支配收入可支配收入 1818 2525 4545 60606262 7575 8888 929298989999 10各家庭收入和消费的原始资料 计量单位:百元 消费和收入相关表 计量单位:百元消费支出消费支出2020 1515 4040 30304242 6060 6565 707053537878消费支出消费支出1515 2020 3030 40404242 5353 6060 6565787870706-20统计学统计学STATISTICSSTATISTICS 散点图散点图 (例例6.2)6-21统计学统计学STATISTICSSTATISTICS二、相关系数及其检验二、相关系数及其检验6-22统计学统计学STATISTICSSTATISTICS(一)相关系数及其计算(一)相关系数及其计算6-23统计学统计学STATISTICSSTATISTICS 相关系数相关系数(correlation coefficient)1.用于测度变量之间线性相关关系密切程度的度量值(指标)。2.对两两个个变变量量之间线性相关程度的度量称为单单相相关系数关系数。3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 ,若是根据样本数据计算的,则称为样本相关系数,记为 r 6-24统计学统计学STATISTICSSTATISTICS相关系数相关系数(计算公式计算公式)样本相关系数的计算公式或化简为6-25统计学统计学STATISTICSSTATISTICS相关系数相关系数(取值及其意义取值及其意义)1.r r 的取值范围的取值范围是是 -1,1-1,12.|r r|=|=1 1,为完全相关为完全相关n nr r=1 1,为完全正相关,为完全正相关n nr r=-1-1,为完全负正相关,为完全负正相关3.r r=0=0,不存在不存在线性线性线性线性相关相关关系关系4.-1-1 r r 0 0,为负相关为负相关5.0 0 t t,拒绝,拒绝H H0 0 若若 t t =4.921t t(10-2)=2.306(10-2)=2.306,拒拒绝绝H H0 0,智智商商值值与与劳动生产率之间存在着显著的正线性相关关系劳动生产率之间存在着显著的正线性相关关系 6-37统计学统计学STATISTICSSTATISTICS第三节第三节 一元线性回归一元线性回归6-38统计学统计学STATISTICSSTATISTICS一、一元线性回归函数与模型一、一元线性回归函数与模型6-39统计学统计学STATISTICSSTATISTICS一元线性回归函数一元线性回归模型总体样本(一)一元线性回归函数与(一)一元线性回归函数与模型的数学表达式模型的数学表达式 式中:式中:0是回归直线在是回归直线在 y 轴上的截距,是当轴上的截距,是当 x=0 时时 y 的期的期望值。望值。1是直线的斜率,称为回归系数,表示当是直线的斜率,称为回归系数,表示当 x 每变动一个每变动一个单位时,单位时,y 的平均变动值。的平均变动值。6-40统计学统计学STATISTICSSTATISTICSXYX1X2X3X4(二)一元线性回归函数与(二)一元线性回归函数与模型意义的图形解释模型意义的图形解释6-41统计学统计学STATISTICSSTATISTICS(三)一元线性回归模型的(三)一元线性回归模型的(三)一元线性回归模型的(三)一元线性回归模型的基本假定基本假定基本假定基本假定 1.1.误误差差项项u u是是一一个个期期望望值值为为0 0的的正正态态分分布布随随机机变变量量,即即2.2.对对于所有的于所有的 x x 值,值,u u的方差的方差 2 2 都相同,即都相同,即3.3.对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的u u与与其其他他 x x 值值所所对应的对应的u u不相关。即不相关。即4.4.对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 y y 值值与与其其他他 x x 所所对应的对应的 y y 值也不相关值也不相关6-42统计学统计学STATISTICSSTATISTICSXYX1X2X3X4回归模型基本假定的图形解释回归模型基本假定的图形解释6-43统计学统计学STATISTICSSTATISTICS(四)样本回归方程与总体回归方(四)样本回归方程与总体回归方程的联系与区别程的联系与区别联联系系:样样本本回回归归方方程程与与总总体体回回归归方方程程具具有有相相同同的的形形式式,且且样样本回归模型是作为总体回归模型的估计而存在的。本回归模型是作为总体回归模型的估计而存在的。区别:区别:1 1、总总体体回回归归线线是是未未知知的的,且且只只有有一一条条。而而样样本本回回归归线线则则是是根根据据样样本本数数据据拟拟合合的的,每每抽抽取取一一个个样样本本,便便可可以以拟拟合合一一条条回回归线。归线。2 2、总总体体回回归归方方程程中中的的参参数数是是未未知知的的,但但它它是是确确定定的的。而而样样本回归方程中的参数是随机变量,随样本的不同而不同。本回归方程中的参数是随机变量,随样本的不同而不同。3 3、总总体体回回归归模模型型中中的的ui是是(因因变变量量实实际际观观测测值值)Yi与与总总体体回回归归线线之之间间的的纵纵向向距距离离,它它是是不不可可直直接接观观测测的的。而而样样本本回回归归模模型型中中ei是是Yi与与样样本本回回归归线线之之间间的的纵纵向向距距离离,当当根根据据样样本本数数据据拟合出样本回归线之后,可以计算出拟合出样本回归线之后,可以计算出ei的具体数值。的具体数值。6-44统计学统计学STATISTICSSTATISTICS二、模型参数的估计二、模型参数的估计6-45统计学统计学STATISTICSSTATISTICS(一)回归系数的估计(一)回归系数的估计 最小二乘估计最小二乘估计1.使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即2.用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小6-46统计学统计学STATISTICSSTATISTICS最小二乘估计最小二乘估计(图示图示)x xy y(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i6-47统计学统计学STATISTICSSTATISTICS最小二乘法最小二乘法(和和 的计算公式的计算公式)根据最小二乘法的要求,可得求解 和 的公式如下6-48统计学统计学STATISTICSSTATISTICS最小二乘法最小二乘法(例题分析例题分析)【例例例例6.46.4】一一一一项项项项调调调调查查查查得得得得到到到到9 9个个个个家家家家庭庭庭庭的的的的月月月月收收收收入入入入和和和和存存存存款款款款数数数数据如据如据如据如表表表表7-47-4,用最小而乘法建立回归方程如下:,用最小而乘法建立回归方程如下:,用最小而乘法建立回归方程如下:,用最小而乘法建立回归方程如下:回归方程为:回归方程为:回回归归系系数数为为0.1017,0.1017,表表示示收收入入每每增增加加1 1千千元元,家庭存款额平均增加家庭存款额平均增加0.10170.1017千元千元 6-49统计学统计学STATISTICSSTATISTICS6-50统计学统计学STATISTICSSTATISTICS用用Excel绘制绘制回归直线回归直线6-51统计学统计学STATISTICSSTATISTICS(二)总体方差的估计(二)总体方差的估计 此外,此外,S S2 2 的正平方根也叫做回归的正平方根也叫做回归估计的标准差估计的标准差。S S越小,回归线的代表性越强,否则相反。越小,回归线的代表性越强,否则相反。总总体体方方差差(2)是是检检验验模模型型时时,必必须须利利用用的的一一个个重重要要参参数数,可可以以反反映映理理论论模模型型误误差差的的大大小小。由由于于2 2本本身身不不能能直直接观测,因而需要用接观测,因而需要用e et t2 2(最小二乘残差)来估计(最小二乘残差)来估计2 2。可以证明可以证明2 2的无偏估计为:的无偏估计为:6-52统计学统计学STATISTICSSTATISTICS三、回归模型的检验三、回归模型的检验6-53统计学统计学STATISTICSSTATISTICS1 1、经济理论检验、经济理论检验经济理论检验主要涉及估计值的符号和取值区间。经济理论检验主要涉及估计值的符号和取值区间。2 2、统计检验(一级检验)、统计检验(一级检验)统统计计检检验验是是利利用用统统计计学学中中的的抽抽样样理理论论检检验验样样本本回回归归方程的可靠性,包括拟合优度检验和显著性检验。方程的可靠性,包括拟合优度检验和显著性检验。3 3、计量经济学检验(二级检验)、计量经济学检验(二级检验)计量经济学检验是对标准回归方程的假定条件能否得到满足进行检验。(一)模型检验的内容(一)模型检验的内容6-54统计学统计学STATISTICSSTATISTICS(二)模型拟合优度检验(二)模型拟合优度检验6-55统计学统计学STATISTICSSTATISTICS 拟拟合合优优度度检检验验是是检检验验样样本本回回归归方方程程对对样样本本观观测测值值代代表表性性大大小小。衡衡量量这这一一问问题题的的指指标标称称为为可可决决系系数数(决决定定系系数数),其公式为:其公式为:(Regression Sum of Square)(Residual Sum of Square)(Total Deviation Sum of Square)1、概念及公式、概念及公式6-56统计学统计学STATISTICSSTATISTICS变差的分解变差的分解(图示图示)x xy yy y 6-57统计学统计学STATISTICSSTATISTICS离差平方和的分解离差平方和的分解(三个平方和的关系三个平方和的关系)SST=SSR+SSE总平方和总平方和总平方和总平方和(SSTSST)回归平方和回归平方和回归平方和回归平方和(SSRSSR)残差平方和残差平方和残差平方和残差平方和(SSESSE)6-58统计学统计学STATISTICSSTATISTICS离差平方和的分解离差平方和的分解(三个平方和的意义三个平方和的意义)1.总平方和总平方和(SST)n n反映因变量的反映因变量的 n n 个观察值与其均值的总离差个观察值与其均值的总离差2.回归平方和回归平方和(SSR)n n反反映映自自变变量量 x x 的的变变化化对对因因变变量量 y y 取取值值变变化化的的影影响响,或或者者说说,是是由由于于 x x 与与 y y 之之间间的的线线性性关关系系引引起的起的 y y 的取值变化,也称为可解释的平方和的取值变化,也称为可解释的平方和3.残差平方和残差平方和(SSE)n n反反映映除除 x x 以以外外的的其其他他因因素素对对 y y 取取值值的的影影响响,也也称为不可解释的平方和或剩余平方和称为不可解释的平方和或剩余平方和6-59统计学统计学STATISTICSSTATISTICS2、可决系数、可决系数r2 的特性的特性(1 1)具有非负性)具有非负性(2 2)r r2 2的值越接近的值越接近1 1,SSRSSR越接近越接近SST,SST,即即 说说明明回回归归方方程程对对实实际际观观测测值值的的拟拟合合程程度度愈愈好好,否否则则相反。相反。(3 3)可可决决系系数数是是样样本本观观测测值值的的函函数数,它它也也是是一一个个随随机变量。机变量。(4 4)可决系数的平方根为相关系数,用公式表示为:)可决系数的平方根为相关系数,用公式表示为:6-60统计学统计学STATISTICSSTATISTICS可决系数可决系数r2 (例例题题分析分析)根椐根椐【例例6.4】计算月收入与存款额回归的判定系数,并解释其意义 计算结果表明,存款额的总变差中,有96.6%可以由家庭月收入与存款额之间的关系来解释,只有3%属于随机因素的影响。因此,上述拟合的 是合适的。6-61统计学统计学STATISTICSSTATISTICS(三)(三)显著性检验显著性检验6-62统计学统计学STATISTICSSTATISTICS显著性检验显著性检验(概念要点)(概念要点)回回归归分分析析中中的的显显著著性性检检验验包包括括两两方方面面的的内容:内容:一一是是对对各各回回归归系系数数的的显显著著性性检检验验;对对于于回归系数的显著性检验通常采用回归系数的显著性检验通常采用t t检验。检验。二二是是对对整整个个回回归归方方程程的的显显著著性性检检验验。对对回回归归方方程程的的显显著著性性检检验验则则是是在在方方差差分分析析的的基基础上采用础上采用F F检验。检验。6-63统计学统计学STATISTICSSTATISTICS回归系数的检验回归系数的检验(概念要点)(概念要点)2.检验 x 与 y 之间是否具有线性关系,或者说,检验自变量 x 对因变量 y 的影响是否显著 3.理论基础是回归系数 的抽样分布,1.就是根据样本估计的结果对总体回归系数的是否为0进行假设检验。6-64统计学统计学STATISTICSSTATISTICS回归系数的检验回归系数的检验(的分布的分布)1.1.1.是是是根根根据据据最最最小小小二二二乘乘乘法法法求求求出出出的的的样样样本本本统统统计计计量量量,它它它是是是一一一个个个随机变量随机变量随机变量,有自己的分布有自己的分布有自己的分布2.2.2.的的的分布具有如下性质分布具有如下性质分布具有如下性质 分布形式:正态分布分布形式:正态分布分布形式:正态分布 数学期望:数学期望:数学期望:标准差:标准差:标准差:由由由于于于 未未未知知知,需需需用用用其其其估估估计计计量量量s s sy yy来来来代代代替替替得得得到到到 的的的估估估计计计标标标准差准差准差6-65统计学统计学STATISTICSSTATISTICS回归系数的检验回归系数的检验(检验步骤检验步骤)1.提出假设提出假设n nH H0 0:b b1 1=0(=0(没有线性关系没有线性关系)n nH H1 1:b b1 1 0(0(有线性关系有线性关系)2.计算检验的统计量计算检验的统计量3.确定显著性水平确定显著性水平,并进行决策,并进行决策 t t t t,拒绝,拒绝H H0 0;t t =14.956t t=2.365=2.365,拒拒绝绝H H0 0,表表明明家家庭庭月月收收入入与与存存款款额额之之间间有有线线性性关关系系,收收入入是是影影响响存存款款的的显著因素。显著因素。6-67统计学统计学STATISTICSSTATISTICS四、利用样本回归方程进行预测6-68统计学统计学STATISTICSSTATISTICS利用样本回归方程进行预测利用样本回归方程进行预测1.根据自变量 x 的取值估计或预测因变量 y的取值2.估计或预测的类型n n点估计点估计l ly y 的平均值的点估计的平均值的点估计l ly y 的个别值的点估计的个别值的点估计n n区间估计区间估计l ly y 的平均值的的平均值的置信区间置信区间置信区间置信区间估计估计l ly y 的个别值的的个别值的预测区间预测区间预测区间预测区间估计估计6-69统计学统计学STATISTICSSTATISTICS(一)点估计(一)点估计6-70统计学统计学STATISTICSSTATISTICS点估计点估计(概念要点)(概念要点)2.点估计值有n ny y 的的平均值平均值平均值平均值的点估计的点估计n ny y 的的个别值个别值个别值个别值的点估计的点估计3.在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同1.对于自变量 x 的一个给定值x0,根据回归方程得到因变量 y 的一个估计值6-71统计学统计学STATISTICSSTATISTICS y 的平均值的点估计的平均值的点估计 利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的平均值的一个估计值E(y0),就是平均值的点估计n n在在前前面面的的例例子子中中,假假如如我我们们要要估估计计收收入入为为2525千千元元时时,所所有有家家庭庭存存款款额额的的平平均均值值,就就是是平平均均值值的的点点估估计计 。根根据据估估计计的的回回归归方方程程得得6-72统计学统计学STATISTICSSTATISTICSy 的个别值的点估计的个别值的点估计 利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计值 ,就是个别值的点估计n n例例如如,如如果果我我们们只只是是想想知知道道月月收收入入为为2020千千元元的的那那个个家家庭庭(这这里里是是编编号号为为9 9的的那那个个家家庭庭)的的存存款款额额是是多多少少,则则属属于于个个别别值值的的点点估估计计 。根据估计的回归方程得。根据估计的回归方程得6-73统计学统计学STATISTICSSTATISTICS(二)区间估计(二)区间估计6-74统计学统计学STATISTICSSTATISTICS区间估计与预测区间估计与预测1.点点估估计计不不能能给给出出估估计计的的精精度度,点点估估计计值值与与实实际际值值之间是有误差的,因此需要进行区间估计之间是有误差的,因此需要进行区间估计2.对对于于自自变变量量 x x 的的一一个个给给定定值值 x x0 0,根根据据回回归归方方程程得得到因变量到因变量 y y 的一个估计区间的一个估计区间3.区间估计有两种类型区间估计有两种类型n n均值的预测区间均值的预测区间(confidence interval estimateconfidence interval estimate)n n个别值的预测区间个别值的预测区间(prediction(prediction interval estimate interval estimate)6-75统计学统计学STATISTICSSTATISTICS均值的区间估计均值的区间估计1.利用利用样本回归函数方程,对于自变量样本回归函数方程,对于自变量 x x 的一个给的一个给定值定值 x x0 0 ,求出因变量,求出因变量 y y 的平均值的估计区间的平均值的估计区间 ,这一估计区间称为这一估计区间称为置信区间置信区间置信区间置信区间(confidence intervalconfidence interval)2.E E(y y0 0)在在1-1-置信置信水平下的置信区间为水平下的置信区间为式中:式中:s sy y为估计标准误差为估计标准误差6-76统计学统计学STATISTICSSTATISTICS均值的区间估计均值的区间估计(例题分析例题分析)【例例例例6.56.5】求求出出月月收收入入为为2525千千元元时时,存存款款额额95%95%置置信信水平下的置信区间水平下的置信区间 解:解:根据前面的计算结果,已知根据前面的计算结果,已知n n=9=9,s sy y=0.053=0.053,t t(9-2)=2.365(9-2)=2.365 置信区间为置信区间为当当月月为为2525千千元元时时,家家庭庭存存款款额额的的平平均均值值在在0.10650.1065千千元到元到2.52712.5271千元之间千元之间 6-77统计学统计学STATISTICSSTATISTICS个别值的预测区间个别值的预测区间1.利用估计利用估计的回归方程,对于自变量的回归方程,对于自变量 x x 的一个给的一个给定值定值 x x0 0 ,求出因变量,求出因变量 y y 的一个个别值的估计区的一个个别值的估计区间,这一区间称为间,这一区间称为预测区间预测区间预测区间预测区间(prediction(prediction interval interval)2.y y0 0在在1-1-置信水平下的预测区间为置信水平下的预测区间为注意!注意!6-78统计学统计学STATISTICSSTATISTICS预测区间估计预测区间估计(例题分析例题分析)【例例例例6.66.6】求出月收入为求出月收入为2020千元时,家庭存款额千元时,家庭存款额95%95%置信水平下的预测区间置信水平下的预测区间 解:解:根据前面的计算结果,已知根据前面的计算结果,已知n n=9=9,s sy y=0.053=0.053,t t(9-2)=2.356(9-2)=2.356 置信区间为置信区间为家家庭庭月月收收入入为为2020千千元元的的那那个个家家庭庭,其其存存款款额额的的预测区间在预测区间在0.60580.6058千元到千元到0.95310.9531千元之间千元之间 6-79统计学统计学STATISTICSSTATISTICS影响区间宽度的因素影响区间宽度的因素1.置信水平(1-)n n区间区间宽度随置信水平的增大而增大宽度随置信水平的增大而增大2.数据的离散程度sn n区间宽度随离散程度的增大而增大区间宽度随离散程度的增大而增大3.样本容量n n区间宽度随样本容量的增大而减小区间宽度随样本容量的增大而减小4.用于预测的 xp与x的差异程度n n区间宽度随区间宽度随 x xp p与与 x x 的差异程度的增大而增大的差异程度的增大而增大6-80统计学统计学STATISTICSSTATISTICS置信区间、预测区间、回归方程置信区间、预测区间、回归方程x0 0yx x预测上限置信上限预测下限置信下限6-81统计学统计学STATISTICSSTATISTICS第四节用计算机完成相第四节用计算机完成相关与回归分析关与回归分析6-82统计学统计学STATISTICSSTATISTICS用用Excel进行相关分析进行相关分析方法一:绘制散点图。方法一:绘制散点图。方法一:绘制散点图。方法一:绘制散点图。方法二:计算相关系数。方法二:计算相关系数。方法二:计算相关系数。方法二:计算相关系数。第第第第1 1步:步:步:步:选择选择“工具工具工具工具”下拉菜单下拉菜单第第第第2 2步:步:步:步:选择选择“数据分析数据分析数据分析数据分析”选项选项第第第第3 3步:步:步:步:在分析工具中选择在分析工具中选择“相关系数相关系数相关系数相关系数”,然后选择,然后选择“确定确定确定确定”第第第第4 4步:步:步:步:当对话框出现时当对话框出现时 在在“Y Y值输入区域值输入区域值输入区域值输入区域”设置框内键入设置框内键入Y Y的数据区域的数据区域 在在“X X值输入区域值输入区域值输入区域值输入区域”设置框内键入设置框内键入X X的数据区域的数据区域 在在“置信度置信度置信度置信度”选项中给出所需的数值选项中给出所需的数值 在在“输出选项输出选项输出选项输出选项”中选择输出区域中选择输出区域 6-83统计学统计学STATISTICSSTATISTICS用用Excel进行回归分析进行回归分析第第第第1 1步:步:步:步:选择选择“工具工具工具工具”下拉菜单下拉菜单第第第第2 2步:步:步:步:选择选择“数据分析数据分析数据分析数据分析”选项选项第第第第3 3步步步步:在在分分析析工工具具中中选选择择“回回回回归归归归”,然然后后选选择择“确确确确定定定定”第第第第4 4步:步:步:步:当对话框出现时当对话框出现时 在在“Y Y值输入区域值输入区域值输入区域值输入区域”设置框内键入设置框内键入Y Y的数据区域的数据区域 在在“X X值输入区域值输入区域值输入区域值输入区域”设置框内键入设置框内键入X X的数据区域的数据区域 在在“置信度置信度置信度置信度”选项中给出所需的数值选项中给出所需的数值 在在“输出选项输出选项输出选项输出选项”中选择输出区域中选择输出区域 在在“残差残差残差残差”分析选项中选择所需的选项分析选项中选择所需的选项 用用用用ExcelExcel进行回归分析进行回归分析进行回归分析进行回归分析6-84统计学统计学STATISTICSSTATISTICS本章小结本章小结1 1、相关关系是变量之间相互关系的一种形式。、相关关系是变量之间相互关系的一种形式。、相关关系是变量之间相互关系的一种形式。、相关关系是变量之间相互关系的一种形式。2 2、相相相相关关关关关关关关系系系系的的的的分分分分析析析析方方方方法法法法有有有有:相相相相关关关关分分分分析析析析和和和和回回回回归归归归分分分分析析析析两种。两种。两种。两种。4 4、相相相相关关关关分分分分析析析析在在在在于于于于测测测测定定定定相相相相关关关关程程程程度度度度,需需需需要要要要计计计计算算算算相相相相关关关关系系系系数或相关指数。数或相关指数。数或相关指数。数或相关指数。5 5、回回回回归归归归分分分分析析析析在在在在于于于于测测测测定定定定相相相相关关关关变变变变量量量量之之之之间间间间的的的的数数数数量量量量变变变变动动动动关关关关系,需要建立回归方程。系,需要建立回归方程。系,需要建立回归方程。系,需要建立回归方程。6 6、相相相相关关关关与与与与回回回回归归归归分分分分析析析析可可可可借借借借助助助助ExcelExcel等等等等数数数数据据据据分分分分析析析析软软软软件件件件快快快快速完成。速完成。速完成。速完成。6-85统计学统计学STATISTICSSTATISTICSEnd of Chapter 6