统计学原理与技能训练 第9章相关分析与回归分析.ppt
《统计学原理与技能训练 第9章相关分析与回归分析.ppt》由会员分享,可在线阅读,更多相关《统计学原理与技能训练 第9章相关分析与回归分析.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章第九章 相关分析与回归分析相关分析与回归分析1学习目标:学习目标:1.1.掌握相关分析的概念、分类及与函数关系的区掌握相关分析的概念、分类及与函数关系的区别;别;2.2.能够利用相关系数对相关关系进行测定,并且能够利用相关系数对相关关系进行测定,并且掌握相关函数的性质;掌握相关函数的性质;3.3.明确相关分析与回归分析各自特点以及它们的明确相关分析与回归分析各自特点以及它们的区别与联系;区别与联系;4.4.掌握回归分析基本理论和方法。掌握回归分析基本理论和方法。2第一节第一节 相关分析的一般问题相关分析的一般问题一、变量之间的关系一、变量之间的关系(一一)函数关系(确定性关系)函数关系(
2、确定性关系)函数关系指现象间在数量上存在着确定的、严函数关系指现象间在数量上存在着确定的、严格对应的依存关系。格对应的依存关系。特点:对于某一变量的每一个数值,都有另一特点:对于某一变量的每一个数值,都有另一个变量的确定的值与之相对应,并且这种关系可以个变量的确定的值与之相对应,并且这种关系可以用精确的数学函数式表示出来,因此称为函数关系。用精确的数学函数式表示出来,因此称为函数关系。3(1 1)是一一对应的确定关系;)是一一对应的确定关系;(2 2)设设有有两两个个变变量量 x 和和 y,变变量量 y 随随变变量量 x 一一起起变变化化,并并完完全全依依赖赖于于 x,当当变变量量 x 取取某
3、某个个数数值值时时,y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y 是是 x 的的函函数数,记记为为 y=f(x),其其中中 x 称称为为自自变变量,量,y 称为因变量;称为因变量;(3 3)各观测点落在一条线上。)各观测点落在一条线上。x xy y4 函数关系的例子函数关系的例子某某种种商商品品的的销销售售额额(y)与与销销售售量量(x)之之间间的的关系可表示为关系可表示为 y=p x(p 为单价为单价);圆圆的的面面积积(S)与与半半径径之之间间的的关关系系可可表表示示为为S=r2;企企业业的的原原材材料料消消耗耗额额(y)与与产产量量(x1)、单单位位产产量量消消耗耗(x
4、2)、原原材材料料价价格格(x3)之之间间的的关关系系可表示为可表示为y=x1 x2 x3。5 (二二)相关关系相关关系(非确定型关系)非确定型关系)指事物之间的关系数值存在着一定的依存关指事物之间的关系数值存在着一定的依存关系,但它们不是确定的和严格依存的,某一现象系,但它们不是确定的和严格依存的,某一现象在其发展变化中,当数量上为一确定值时,与之在其发展变化中,当数量上为一确定值时,与之有联系的其他现象可以有若干个数值与之对应,有联系的其他现象可以有若干个数值与之对应,在这些数值之间表现出一定的波动性,但这些值在这些数值之间表现出一定的波动性,但这些值按某种规律在一定范围内变化。按某种规律
5、在一定范围内变化。6(1 1)变变量量间间关关系系不不能能用用函函数关系精确表达;数关系精确表达;(2 2)一一个个变变量量的的取取值值不不能能由另一个变量唯一确定;由另一个变量唯一确定;(3 3)当当变变量量 x 取取某某个个值值时时,变变量量 y 的的取取值值可可能能有有几几个;个;(4 4)各各观观测测点点分分布布在在直直线线周围。周围。x xy y7相关关系的特点:相关关系的特点:相关关系表现为数量相互依存关系;相关关系表现为数量相互依存关系;相关关系在数量上表现为非确定性的相互相关关系在数量上表现为非确定性的相互依存关系。依存关系。8 相关关系的例子相关关系的例子商商品品的的消消费费
6、量量(y)与与居居民民收收入入(x)之之间间的的关关系系商品的消费量商品的消费量(y)与物价与物价(x)之间的关系之间的关系商商品品销销售售额额(y)与与广广告告费费支支出出(x)之之间间的的关关系系粮粮食食亩亩产产量量(y)与与施施肥肥量量(x1)、降降雨雨量量(x2)、温度温度(x3)之间的关系之间的关系收入水平收入水平(y)与受教育程度与受教育程度(x)之间的关系之间的关系父亲身高父亲身高(y)与子女身高与子女身高(x)之间的关系之间的关系9相关关系的两种情形:相关关系的两种情形:1.1.现象之间的关系多体现为因果关系,即现象之间的关系多体现为因果关系,即某个现象的变化是由另一个或几个现
7、象变化引某个现象的变化是由另一个或几个现象变化引起的。起的。在数量表现上,把起主动作用的因素称为在数量表现上,把起主动作用的因素称为自变量,一般用自变量,一般用x表示;而把因主动因素的变化表示;而把因主动因素的变化而引起变化的因素称为因变量,用而引起变化的因素称为因变量,用y表示。表示。10 2.两个变量之间有时只存在相互联系而并两个变量之间有时只存在相互联系而并不存在因果关系。难以指出哪一个是原因,哪不存在因果关系。难以指出哪一个是原因,哪一个是结果。在这种情况下,需要根据不同的一个是结果。在这种情况下,需要根据不同的问题和研究目的来确定哪一个为因变量,哪一问题和研究目的来确定哪一个为因变量
8、,哪一个为自变量。个为自变量。11相关关系与函数关系既有区别,也有一定的联系。相关关系与函数关系既有区别,也有一定的联系。有些函数关系由于在实际观察时出现误差,常有些函数关系由于在实际观察时出现误差,常常表现为相关关系。常表现为相关关系。而在研究相关关系时,为了寻求相关关系及数而在研究相关关系时,为了寻求相关关系及数量关系的一般表现形式,又往往运用函数关系的形量关系的一般表现形式,又往往运用函数关系的形式加以描述。式加以描述。12二、相关关系的种类二、相关关系的种类(一一)按相关形式不同按相关形式不同 线性相关线性相关非线性相关非线性相关(二二)根据相关反向划分(在直线相关中)根据相关反向划分
9、(在直线相关中)正相关正相关负相关负相关13(三)按相关的程度(三)按相关的程度完全相关完全相关不完全相关不完全相关不不相关(零相关)相关(零相关)(五)按相关的程度(五)按相关的程度虚假相关虚假相关真实相关真实相关(四)根据相关关系涉及变量的多少(四)根据相关关系涉及变量的多少单相关单相关复相关复相关偏相关偏相关14xy直线负相关15直线正相关xy16曲线相关xy17完全直线相关xy18不相关xy19完全曲线相关xy20 不相关xy21第二节第二节 简单线性相关分析简单线性相关分析一、相关关系的一般判断一、相关关系的一般判断定性分析定性分析是是依据研究者的理论知识和实践经验,对客观依据研究者
10、的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作现象之间是否存在相关关系,以及何种关系作出判断。出判断。定量分析定量分析在在定性分析的基础上,通过编制定性分析的基础上,通过编制相关表相关表、绘制、绘制相关图相关图、计算、计算相关系数相关系数等方法,来判断现象之等方法,来判断现象之间相关的方向、形态及密切程度。间相关的方向、形态及密切程度。22相关表相关表将自变量将自变量x的数值按照从小到大的顺序,并配合的数值按照从小到大的顺序,并配合因变量因变量y的数值一一对应而平行排列的表。的数值一一对应而平行排列的表。例:为了研究分析某种劳务产品完成量与其单位产品成本之间的例:为了研究
11、分析某种劳务产品完成量与其单位产品成本之间的关系,调查关系,调查30个同类服务公司得到的原始数据如表。个同类服务公司得到的原始数据如表。整理后有整理后有23相关图相关图又称散点图。将又称散点图。将x置于横轴上,置于横轴上,y置于纵轴上,置于纵轴上,将(将(x,y)绘于坐标图上。绘于坐标图上。用来反映两变量之间用来反映两变量之间相关关系的图形。相关关系的图形。24 二、相关系数二、相关系数 1.1.简单线性相关系数的计算简单线性相关系数的计算 对两个变量之间线性相关程度的度量称为简对两个变量之间线性相关程度的度量称为简单相关系数,用单相关系数,用r表示。而对于曲线相关来说,是表示。而对于曲线相关
12、来说,是用相关指数来衡量其相关程度的。用相关指数来衡量其相关程度的。25公式中:公式中:协方差协方差变量变量x的标准差的标准差变量变量y的标准差的标准差262728可化简可化简为:为:29从公式中可以看出:从公式中可以看出:r取正值或负值决定于分子取正值或负值决定于分子30r值的意义是:值的意义是:r愈接近愈接近0,x与与y之间的直线相关程度愈之间的直线相关程度愈小,反之,小,反之,r的值愈接近的值愈接近1,x与与y之间的相关之间的相关程度愈高。程度愈高。但需要注意的是但需要注意的是r只表示只表示x与与y的直线相关密切的直线相关密切程度。当程度。当r值很小甚至等于值很小甚至等于0时,并不一定表
13、时,并不一定表示示x与与y之间就不存在其他类型的关系。之间就不存在其他类型的关系。31例:例:以下表的数据为例,计算以下表的数据为例,计算12个企业产量与生产个企业产量与生产费用之间的简单相关系数。费用之间的简单相关系数。企业编号企业编号产量产量x生产费用生产费用y123456789101112404250556578841001161251301401301501551401501541561701671801751851 6001 7642 5003 0254 2256 0847 05610 00013 45615 62516 90019 60016 90022 50024 02519 6
14、0022 50023 71627 22528 90027 88932 40030 62534 2255 2006 3007 7507 7009 75012 01213 86017 00019 37222 50022 75025 900合计合计1 0251 921101 835310 505170 09432根据表中资料:根据表中资料:33即产量与生产费用之间的相关系数即产量与生产费用之间的相关系数r+0+092029202,说说明二者之间存在高度正线性相关关系。明二者之间存在高度正线性相关关系。342.2.相关系数的意义相关系数的意义相关系数的取值范围是:相关系数的取值范围是:-1-1r11(
15、r11)r越接近越接近1 1,表示相关程度越高;,表示相关程度越高;r越接近越接近0 0,表示相关程度越低;,表示相关程度越低;r0 0表示两个变量之间不存在直线相关;表示两个变量之间不存在直线相关;r1 1表示存在着完全正相关;表示存在着完全正相关;r-1-1表示存在着完全负相关。表示存在着完全负相关。35 用相关系数表示的相关程度的等级有如下几用相关系数表示的相关程度的等级有如下几种情形:种情形:r0 0:不相关;:不相关;r0.30.3:极低度相关;:极低度相关;0.3 0.3 r0.50.5:低度相关;:低度相关;0.5 0.5 r0.80.8:中度相关;:中度相关;r0.80.8:高
16、度相关;:高度相关;r1 1:完全相关。:完全相关。36 需注意:变量之间的非线性相关程度较大可能导需注意:变量之间的非线性相关程度较大可能导致致r0 0,当,当r0 0或或r很小时,不能得出变量无关的结论。很小时,不能得出变量无关的结论。-1.0+1.00-0.5+0.5完全负相关完全负相关完全负相关完全负相关无线性相关无线性相关无线性相关无线性相关完全正相关完全正相关完全正相关完全正相关负负负负相关程度增加相关程度增加相关程度增加相关程度增加r正相关程度增加正相关程度增加正相关程度增加正相关程度增加37三、简单线性相关分析的特点三、简单线性相关分析的特点(一)两个变量是对等关系(一)两个变
17、量是对等关系 直线相关分析所研究的两个变量不分彼此不反映直线相关分析所研究的两个变量不分彼此不反映任何自变量和因变量的关系,而是完全对等的。任何自变量和因变量的关系,而是完全对等的。(二)只能算出一个相关系数(二)只能算出一个相关系数 相关系数是一个绝对值在相关系数是一个绝对值在0 0与与1 1之间的系数,其值之间的系数,其值大小反映两变量间相关的密切程度。由于两变量的关大小反映两变量间相关的密切程度。由于两变量的关系是对等的,改变两者的地位不影响相关系数的数值,系是对等的,改变两者的地位不影响相关系数的数值,所以只有一个相关系数。所以只有一个相关系数。38(三)相关系数有正负号,表示正相关或
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学原理与技能训练 第9章 相关分析与回归分析 统计学 原理 技能 训练 相关 分析 回归
限制150内