统计学相关与回归分析.ppt
《统计学相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《统计学相关与回归分析.ppt(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 相关分析与回归分析 本章内容 第一节 相关分析 第二节 一元线性回归分析 1第一节 相关分析本节内容一、相关关系的概念二、相关关系的种类三、相关关系的测定四、相关分析中应注意的问题 21.函数关系函数关系当一个或几个变量取一定的值时,另一个变量有确当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数定值与之相对应,我们称这种关系为确定性的函数关系。关系。例例:某种商品的销售额某种商品的销售额(y y)与销售量与销售量(x x)之间的关系可表示为之间的关系可表示为:y y=p x p x (p p 为单价为单价)圆的面积圆的面积(S)S)与半径之间的关
2、系可表示为与半径之间的关系可表示为:S S=r r2 2 企企业业的的原原材材料料消消耗耗额额(y y)与与产产量量(x x1 1)、单单位位产产量量消消耗耗(x x2 2)、原材料价格原材料价格(x x3 3)之间的关系可表示为之间的关系可表示为:y y=x x1 1 x x2 2 x x3 3 一、相关关系的概念3 x xy y(1)变量之间是一一对应的确定关系;(2)设有两个变量x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称y 是 x 的函数,记为y y =f f(x x),其中x 称为自变量,y 称为因变量;(3
3、)各观测点落在一条线上.函数关系的特点:42.相关关系相关关系指变量之间保持着不确定的数量依存关系。即变量间指变量之间保持着不确定的数量依存关系。即变量间关系不能用函数关系精确表达,一个变量的取值不能关系不能用函数关系精确表达,一个变量的取值不能由另一个变量唯一确定,当变量由另一个变量唯一确定,当变量x取某个值时,变量取某个值时,变量y的取值可能有几个。的取值可能有几个。例:商品的消费量例:商品的消费量(y)y)与居民收入与居民收入(x)x)之间的关系;之间的关系;商品的消费量商品的消费量(y)y)与物价与物价(x)x)之间的关系;之间的关系;商品销售额商品销售额(y)y)与广告费支出与广告费
4、支出(x)x)之间的关系;之间的关系;粮粮食食亩亩产产量量(y)y)与与施施肥肥量量(x x1 1)、降降雨雨量量(x x2 2)、温温度度(x x3 3)之之间的关系;间的关系;收入水平收入水平(y)y)与受教育程度与受教育程度(x)x)之间的关系。之间的关系。5相关关系的特点:x xy y(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;(3)当变量 x 取某个值时,变量 y 的取值可能有几个;(4)各观测点分布在直线周围。6具有相关关系的某些现象可表现为因果关系。自变量:是引起某种结果变化的原因,它是可以控制、给定的值,常用x表示;因变量:是自变量变化
5、的引起结果量,它是不确定的值,常用y表示。它们的表现形式有多种:一种原因引起一种结果;多种原因引起一种结果;还有变量之间是互为因果的关系。相关分析时,一般不区分原因和结果。7二、相关关系的种类 1.1.按相关的程度可分为完全相关、不完全相关和不相关按相关的程度可分为完全相关、不完全相关和不相关n完全相关:当一个变量的变化完全由另一个变量所决定时,称变量间的这种关系为为完全相关关系,这种严格的依存关系实际上就是函数关系。n不相关:当两个变量的变化相互独立、互不影响时,称这两个变量不相关(或零相关)。n不完全相关:当变量之间存在不严格的依存关系时,称为不完全相关。不完全相关关系是现实当中相关关系的
6、主要表现形式,是相关分析的主要研究对象。82.2.按相关的方向可分为正相关和负相关按相关的方向可分为正相关和负相关正相关:当一个变量随着另一个变量的增加(减少)而增加(减少),即两者同向变化时,称为正相关。如家庭收入与家庭支出之间的关系。负相关:当一个变量随着另一个变量的增加(减少)而减少(增加),即两者反向变化时,称为负相关。如产品产量与单位成本之间的关系,单位成本会随着产量的增加而减少。93、按相关的形式可分为线性相关和非线性相按相关的形式可分为线性相关和非线性相关关线性相关:当变量之间的依存关系大致呈现为线性形式,即当一个变量变动一个单位时,另一个变量也按一个大致固定的增(减)量变动,就
7、称为线性相关。非线性相关:当变量间的关系不按固定比例变化时,就称之为非线性相关。104.4.按研究变量的多少可分为单相关、偏相关和复按研究变量的多少可分为单相关、偏相关和复相关相关单相关:两个变量之间的相关,称为单相关。复相关:一个变量与两个或两个以上其他变量之间的相关,称为复相关。偏相关:在复相关的研究中,假定其他变量不变,专门研究其中两个变量之间的相关关系时称其为偏相关。11三、相关关系的测定 注意:并非所有的变量之间都存在相关关系,因此需要用相关分析方法来识别和判断。相关分析就是借助于图表和分析指标对变量之间的依存关系的密切程度进行测定的过程。定性分析定性分析是依据研究者的理论知识和实践
8、经验,对是依据研究者的理论知识和实践经验,对是依据研究者的理论知识和实践经验,对是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何客观现象之间是否存在相关关系,以及何客观现象之间是否存在相关关系,以及何客观现象之间是否存在相关关系,以及何种关系作出判断。种关系作出判断。种关系作出判断。种关系作出判断。定量分析定量分析在定性分析的基础上,通过编制在定性分析的基础上,通过编制在定性分析的基础上,通过编制在定性分析的基础上,通过编制相关表相关表相关表相关表、绘制绘制绘制绘制相关图相关图相关图相关图、计算、计算、计算、计算相关系数相关系数相关系数相关系数等方法,来判等方法,来判等
9、方法,来判等方法,来判断现象之间相关的方向、形态及密切程度。断现象之间相关的方向、形态及密切程度。断现象之间相关的方向、形态及密切程度。断现象之间相关的方向、形态及密切程度。12(一)相关表:(一)相关表:将自变量将自变量x x的数值按照从小到大的的数值按照从小到大的顺序,并配合因变量顺序,并配合因变量y y的数值一一对应而平行排的数值一一对应而平行排列的表。列的表。(二)相关图(散点图)(二)相关图(散点图)识别变量间相关关系最简单的方法是散点图法。识别变量间相关关系最简单的方法是散点图法。所谓散点图法,就是将所研究变量的观察值以散所谓散点图法,就是将所研究变量的观察值以散点的形式绘制在相应
10、的坐标系中,通过它们呈现点的形式绘制在相应的坐标系中,通过它们呈现出的特征,来判断变量之间是否存在相关关系,出的特征,来判断变量之间是否存在相关关系,以及相关的形式、相关的方向和相关的程度等。以及相关的形式、相关的方向和相关的程度等。13【例】在研究我国人均消费水平的问题时,把全国人均消费记为y,把人均国内生产总值(人均GDP)记为x。我国人均国内生产总值与人均消费金额数据 单位:元 年份人均国内生产总值X人均消费金额Y1995199619971998199920002001200220034854557660546308655170867651821491012236264128342972
11、31383397360938184089从上表可以看出从上表可以看出X X和和Y Y这两个变量之间存在什么样的相关关系?这两个变量之间存在什么样的相关关系?将上表资料绘制散点图如下:将上表资料绘制散点图如下:14所绘制的散点图呈现出从左至右的上升趋势,它表明x与y之间存在着一定的正相关关系,即随着人均GDP的上升,人均消费金额也会增加。有时也可通过表格来直接观察变量之间是否存大相关关系。将上表资料绘制散点图如下:将上表资料绘制散点图如下:15(a)正相关直线相关(b)负相关直线相关(c)正相关曲线相关x与y关系散点图的主要类型16(d)负相关曲线关系(e)负相关直线相关(相关程度较小)(f)不
12、相关17(二)相关系数相关图表可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。统计学家卡尔皮尔逊设计了统计指标 相关系数。简单相关系数:在线性条件下说明两个变量之简单相关系数:在线性条件下说明两个变量之间相关关系密切程度的统计分析指标,简称相间相关关系密切程度的统计分析指标,简称相关系数。关系数。根根据据总总体体全全部部数数据据计计算算的的,称称为为总总体体相相关关系系数数,记记为为;根据样本数据计算的,则称为样本相关系数,记为根据样本数据计算的,则称为样本相关系数,记为 r。将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 相关 回归 分析
限制150内