第四章相关与回归优秀PPT.ppt
《第四章相关与回归优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章相关与回归优秀PPT.ppt(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章相关与回归第四章相关与回归第一页,本课件共有60页一、函数关系与相关关系一、函数关系与相关关系1.函数关系函数关系当一个或几个变量取一定的值时,当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关我们称这种关系为确定性的函数关系。系。第一节第一节 相关关系和相关分析的内容相关关系和相关分析的内容第二页,本课件共有60页(函数关系)(函数关系)(1)是一一对应的确定关系)是一一对应的确定关系(2)设设有有两两个个变变量量 x 和和 y,变变量量 y 随随变变量量 x 一一起起变变化化,并并完完全全依依赖赖于于 x,当当变变
2、量量 x 取取某某个个数数值值时时,y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y 是是 x 的的函函数数,记记为为 y=f(x),其其中中 x 称称为为自自变变量量,y 称为因变量称为因变量(3)各观测点落在一条线上)各观测点落在一条线上 x xy y第三页,本课件共有60页变量间的关系变量间的关系(函数关系)(函数关系)函数关系的例子函数关系的例子n某某种种商商品品的的销销售售额额(y)与与销销售售量量(x)之之间间的的关关系系可可表示为表示为 y=p x(p 为单价为单价)n圆圆的的面面积积(S)与与半半径径之之间间的的关关系系可可表表示示为为S=r2 n企企业业的的原原
3、材材料料消消耗耗额额(y)与与产产量量(x1)、单单位位产产量量消消耗耗(x2)、原原材材料料价价格格(x3)之之间间的的关关系系可可表表示为示为y=x1 x2 x3 第四页,本课件共有60页2.相关关系:相关关系:当一个或几个相互联系的变量当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定值虽然不确定,但它仍按某种规律在一定的范围内变化。的范围内变化。现象之间客观存在的不严格、不确定现象之间客观存在的不严格、不确定的数量依存关系。的数量依存关系。第五页,本课件共有60页变量间的关系变量间的关系(相关关系)(相
4、关关系)(1)变变量量间间关关系系不不能能用用函函数数关关系系精确表达;精确表达;(2)一一个个变变量量的的取取值值不不能能由由另另一个变量唯一确定;一个变量唯一确定;(3)当当变变量量 x 取取某某个个值值时时,变变量量 y 的取值可能有几个;的取值可能有几个;(4)各观测点分布在直线周围。)各观测点分布在直线周围。x xy y第六页,本课件共有60页(相关关系)(相关关系)相关关系的例子相关关系的例子n商品的消费量商品的消费量(y)与居民收入与居民收入(x)之间的关系之间的关系n商品的消费量商品的消费量(y)与物价与物价(x)之间的关系之间的关系n粮粮食食亩亩产产量量(y)与与施施肥肥量量
5、(x1)、降降雨雨量量(x2)、温度温度(x3)之间的关系之间的关系n收入水平收入水平(y)与受教育程度与受教育程度(x)之间的关系之间的关系n父亲身高父亲身高(y)与子女身高与子女身高(x)之间的关系之间的关系第七页,本课件共有60页n相关关系也具有某种变动规律性,所以,相关相关关系也具有某种变动规律性,所以,相关关系经常可以用一定的函数形式去近似地描关系经常可以用一定的函数形式去近似地描述。述。n客观现象的函数关系可以用数学分析的方法去客观现象的函数关系可以用数学分析的方法去研究,而研究客观现象的相关关系则是借助研究,而研究客观现象的相关关系则是借助于统计学中的相关与回归分析方法。于统计学
6、中的相关与回归分析方法。第八页,本课件共有60页n指出下列现象之间属于相关关系还是函数关系?指出下列现象之间属于相关关系还是函数关系?n1.商品流转规模越大,流通费用率越低。商品流转规模越大,流通费用率越低。n2.秤砣的误差越大,所权衡的误差也越大。秤砣的误差越大,所权衡的误差也越大。n3.测量次数越多,其平均长度越接近于实际长度。测量次数越多,其平均长度越接近于实际长度。n4.物体体积随着温度升高而膨胀,随着压力加大而收缩。物体体积随着温度升高而膨胀,随着压力加大而收缩。n5.车辆使用年限越长,修理费用增长越快。车辆使用年限越长,修理费用增长越快。n6.圆的半径越大,其面积也越大。圆的半径越
7、大,其面积也越大。n7.广告费用支出越多,商品销售额也有增长倾向。广告费用支出越多,商品销售额也有增长倾向。n8.机械化程度越高,劳动生产率一般也越高。机械化程度越高,劳动生产率一般也越高。第九页,本课件共有60页二、相关关系的种类二、相关关系的种类1.按相关的程度可分为完全相关、不完全相关和不相按相关的程度可分为完全相关、不完全相关和不相关。关。当一种现象的数量变化完全由另一个现象的数量当一种现象的数量变化完全由另一个现象的数量变化所确定时,称这两种现象间的关系为完全相关。变化所确定时,称这两种现象间的关系为完全相关。在这种场合,相关关系便成为函数关系。因此也可在这种场合,相关关系便成为函数
8、关系。因此也可以说函数关系是相关关系的一个特例。以说函数关系是相关关系的一个特例。当两个现象彼此互不影响,其数量变化各自独当两个现象彼此互不影响,其数量变化各自独立时,称为不相关现象。立时,称为不相关现象。两个现象之间的关系介于完全相关和不相关之间,两个现象之间的关系介于完全相关和不相关之间,称为不完全相关,一般的相关现象都是指这种不完全相称为不完全相关,一般的相关现象都是指这种不完全相关。关。第十页,本课件共有60页 2.按相关形式划分可以分为线性相关和非线性相关。按相关形式划分可以分为线性相关和非线性相关。图中(图中(1)、()、(2)为线性相关,()为线性相关,(3)、()、(4)为非线
9、性相关)为非线性相关第十一页,本课件共有60页 3.按相关的方向划分可分为正相关和负相关。按相关的方向划分可分为正相关和负相关。n(1)正相关:两个相关现象间,当一个变量的数)正相关:两个相关现象间,当一个变量的数值增加(或减少)时,另一个变量的数值也随之值增加(或减少)时,另一个变量的数值也随之增加(或减少),即同方向变化。增加(或减少),即同方向变化。例如收入与消费的关系。例如收入与消费的关系。n(2)负相关:当一个变量的数值增加(或减少)负相关:当一个变量的数值增加(或减少)时,而另一个变量的数值相反地呈减少(或增加)时,而另一个变量的数值相反地呈减少(或增加)趋势变化,即反方向变化。趋
10、势变化,即反方向变化。例如物价与消费的关系。例如物价与消费的关系。第十二页,本课件共有60页n4.按相关关系涉及的因素多少划分分为单相关、复相关和按相关关系涉及的因素多少划分分为单相关、复相关和偏相关。偏相关。n两个变量之间的相关,称为单相关。两个变量之间的相关,称为单相关。n当所研究的是一个变量对两个或两个以上其他变当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。量的相关关系时,称为复相关。n在某一现象与多种现象相关的场合,假定其他变在某一现象与多种现象相关的场合,假定其他变量不变,专门考察其中两个变量的相关关系称为量不变,专门考察其中两个变量的相关关系称为偏相关。例如
11、,在假定人们的收入水平不变的条偏相关。例如,在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是件下,某种商品的需求与其价格水平的关系就是一种偏相关。一种偏相关。第十三页,本课件共有60页三、相关分析的内容三、相关分析的内容n1.确定相关关系的存在,相关关系呈现的的形态和确定相关关系的存在,相关关系呈现的的形态和方向,相关的密切程度。方向,相关的密切程度。n绘制相关图表,计算相关系数。绘制相关图表,计算相关系数。n2.确定相关系数的数学表达式确定相关系数的数学表达式回归分析。回归分析。n3.确定因变量估计值误差的程度。确定因变量估计值误差的程度。n拟合程度的评价拟合程度的评价
12、n计算估计标准误计算估计标准误第十四页,本课件共有60页第二节第二节 相关图表和简单相关系数相关图表和简单相关系数n 一、相关表一、相关表n1.简单相关表:将自变量简单相关表:将自变量x的数值按照从小到大的顺序,并配合因变量的数值按照从小到大的顺序,并配合因变量y的的数值一一对应而平行排列的表。数值一一对应而平行排列的表。n例:为了研究分析某种劳务产品完成量与其单位产品成本之间的关系,调例:为了研究分析某种劳务产品完成量与其单位产品成本之间的关系,调查查30个同类服务公司得到的原始数据如表。个同类服务公司得到的原始数据如表。整理后有整理后有第十五页,本课件共有60页n2.分组相关表:按自变量分
13、组相关表:按自变量x分组,并计算次数分组,并计算次数f,对应的因变,对应的因变量量y不分组,计算其平均数。不分组,计算其平均数。第十六页,本课件共有60页n二、相关图:又称散点图。将二、相关图:又称散点图。将x置于横轴上,置于横轴上,y置于纵置于纵轴上,将(轴上,将(x,y)绘于坐标图上。)绘于坐标图上。第十七页,本课件共有60页三、简单相关系数的计算三、简单相关系数的计算n 1.简单相关系数:在线性条件下说明两个变量之间相简单相关系数:在线性条件下说明两个变量之间相关关系密切程度的统计分析指标关关系密切程度的统计分析指标,简称相关系数,通常简称相关系数,通常用用 表示。表示。n 2.计算:计
14、算:第十八页,本课件共有60页计算相关系数的计算相关系数的“积差法积差法”第十九页,本课件共有60页3.相关系数的特点相关系数的特点(1)的取值介于与之间,的取值介于与之间,r 的取值范围是的取值范围是-1,1(2)在大多数情况下,在大多数情况下,|,即,即与与的样本观的样本观测值之间存在着一定的线性关系,当测值之间存在着一定的线性关系,当时,与时,与为正相关,当为正相关,当时,时,与与为负相关。为负相关。|的数值愈接近于的数值愈接近于1,表示,表示x与与y直线相关程度愈高;反直线相关程度愈高;反之,之,|的数值愈接近于的数值愈接近于0,表示,表示x与与y直线相关程度直线相关程度愈低。通常判断
15、的标准是愈低。通常判断的标准是:|0.3称为微弱相关,称为微弱相关,0.3|0.5称为低度相关,称为低度相关,0.|0.8称称为显著相关为显著相关,0.8|1称为高度相关或强相关。称为高度相关或强相关。第二十页,本课件共有60页(3)如果)如果|=1,则表明,则表明与与完全线性相完全线性相关,当关,当=1时,称为完全正相关,时,称为完全正相关,而而=-1时,称为完全负相关。时,称为完全负相关。(4)是对变量之间线性相关关系的度量。是对变量之间线性相关关系的度量。=0只是表明两个变量之间不存在线性关系,只是表明两个变量之间不存在线性关系,它并不意味着它并不意味着与与之间不存在其他类型的之间不存在
16、其他类型的关系。关系。第二十一页,本课件共有60页相关关系的测度相关关系的测度(相关系数取值及其意义)(相关系数取值及其意义)-1.0+1.00-0.5+0.5完全负相关完全负相关无线性相关无线性相关完全正相关完全正相关负相关程度增加负相关程度增加r正相关程度增加正相关程度增加第二十二页,本课件共有60页n相关系数只度量变量间的线性关系,因此,弱相关相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系;不一定表明变量间没有关系;n极端值可能影响相关系数。极端值可能影响相关系数。n警惕伪相关。警惕伪相关。n相关关系可能是伪相关,即两变量的相关只是表面相关关系可能是伪相关,即两变量
17、的相关只是表面上的上的,它实际上由第三变量引起,当第三变量消它实际上由第三变量引起,当第三变量消失时失时,相关关系亦随之消失。相关关系亦随之消失。n请看下例。请看下例。第二十三页,本课件共有60页伪相关的例子:教堂数与监狱服刑人数同步增长伪相关的例子:教堂数与监狱服刑人数同步增长n美国印第安美国印第安纳纳州的地区教会想要筹款州的地区教会想要筹款兴兴建新教堂,建新教堂,提出教堂能提出教堂能洁净洁净人人们们的心灵,减少犯罪,降低的心灵,减少犯罪,降低监狱监狱服刑人数的口号。服刑人数的口号。n为为了增了增进进民众参与的民众参与的热诚热诚和信心,教会的神父收集和信心,教会的神父收集了近了近15年的教堂
18、数与在年的教堂数与在监狱监狱服刑的人数服刑的人数进进行行统计统计分析。分析。n结结果却令教会大吃一惊。最近果却令教会大吃一惊。最近15年教堂数与年教堂数与监狱监狱服刑服刑人数呈人数呈显显著的正相关。著的正相关。n那么是否可以由此得出,教堂建得越多,就可能那么是否可以由此得出,教堂建得越多,就可能带带来更多的犯罪呢?来更多的犯罪呢?2022/12/624第二十四页,本课件共有60页n经过统计学家和教会神父深入讨论,并进一步收经过统计学家和教会神父深入讨论,并进一步收集近集近15年的当地人口变动资料和犯罪率等资料作进一年的当地人口变动资料和犯罪率等资料作进一步分析,发现:步分析,发现:n监狱服刑人
19、数的增加和教堂数的增加都与人口的增监狱服刑人数的增加和教堂数的增加都与人口的增加有关。加有关。n教堂数的增加并非监狱服刑人数增加的原因。教堂数的增加并非监狱服刑人数增加的原因。n至此,教会人士总算松了一口气至此,教会人士总算松了一口气。2022/12/625第二十五页,本课件共有60页第二十六页,本课件共有60页还可以有:还可以有:第二十七页,本课件共有60页1234第三节第三节 简单简单线性回归分析线性回归分析相关分析与回归分析的关系相关分析与回归分析的关系一元线性回归模型一元线性回归模型拟合程度的评价拟合程度的评价估计标准误估计标准误2022/12/628第二十八页,本课件共有60页n18
20、77年年 弗朗弗朗西斯西斯高尔顿爵高尔顿爵士士 在遗传学研在遗传学研究过程中测量究过程中测量了了1078个父个父亲及成年儿子亲及成年儿子的身高,它们的身高,它们之间的数量关之间的数量关系如图系如图1:2022/12/629“回归回归”一词的由来:一词的由来:n多数点子位于角平多数点子位于角平分斜线的两侧椭圆分斜线的两侧椭圆形面积之内,落在形面积之内,落在斜线上的点子极少,斜线上的点子极少,即儿子与父亲身高即儿子与父亲身高完全相同的极少。完全相同的极少。由点子落在斜线周由点子落在斜线周围还说明,高个子围还说明,高个子的父亲有着较高身的父亲有着较高身材的儿子,而矮个材的儿子,而矮个子父亲的儿子身材
21、子父亲的儿子身材也比较矮。也比较矮。同时,我们也看到同时,我们也看到一些远离斜线的点一些远离斜线的点子,这些点子反映子,这些点子反映的是父亲的身高与的是父亲的身高与儿子的身高相差甚儿子的身高相差甚远的情况。比如高远的情况。比如高个子的父亲有矮儿个子的父亲有矮儿子的情况,或者矮子的情况,或者矮父亲有高个儿子的父亲有高个儿子的情况。情况。45线第二十九页,本课件共有60页n作作相关分析相关分析知道,父亲身高和儿子身高的相关系数为知道,父亲身高和儿子身高的相关系数为0.501,表明,表明高个子的父亲会有较高的儿子,而低个子父亲的儿子也比较低,高个子的父亲会有较高的儿子,而低个子父亲的儿子也比较低,但
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 相关 回归 优秀 PPT
限制150内