相关回归分析 (2)精选课件.ppt
《相关回归分析 (2)精选课件.ppt》由会员分享,可在线阅读,更多相关《相关回归分析 (2)精选课件.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、StatisticsStatistics关于相关回归分析(2)第一页,本课件共有79页第一节第一节 相关分析的基本问题相关分析的基本问题一、相关关系与函数关系一、相关关系与函数关系 二、相关关系的种类二、相关关系的种类三、相关分析的主要内容三、相关分析的主要内容 第二页,本课件共有79页寻找变量间的关系是科学研究的首要目的。寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即变量间的关系最简单的划分即:有关与无有关与无关。关。在统计学上,我们通常这样判断变量之间在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变是否有关:如果一个变量的取值发生变化,另外一个变量的
2、取值也相应发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。变化不引起另一个变量的变化则二者无关。第三页,本课件共有79页现象之间的相互关系,可以概括为两种现象之间的相互关系,可以概括为两种不同的类型:不同的类型:(一)函数关系(一)函数关系(二)相关关系(二)相关关系第四页,本课件共有79页 函数关系是指现象之间存在确定性的数函数关系是指现象之间存在确定性的数量依存关系。在这种关系中,当某一变量或量依存关系。在这种关系中,当某一变量或某些变量取任意一个值时,另一变量都会有某些变量取任意一个值时
3、,另一变量都会有一个确定值与之严格对应,并且这种对应关一个确定值与之严格对应,并且这种对应关系可以用一个数学表达式来反映。系可以用一个数学表达式来反映。两个变量两个变量x x与与y y之间的函数关系一般之间的函数关系一般可以表示为:可以表示为:一、相关关系与函数关系一、相关关系与函数关系 第五页,本课件共有79页函数关系函数关系:1、是一一对应的确定关系、是一一对应的确定关系2、设设设设有有有有两两两两个个个个变变变变量量量量 x 和和和和 y,变变量量 y 随随随随变变变变量量量量 x x 一一一一起起起起变变变变化化化化,并并并并完完完完全全全全依依依依赖赖赖赖于于于于 x x,当当当当变
4、变变变量量量量 x 取取某某个个数数值值时时,y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y 是是 x x 的的的的函函函函数数数数,记记记记为为为为 y y=f f(x)(x),其其中中 x x 称称称称为为为为自自自自变变变变量量量量,y y 称称称称为为为为因因因因变量变量变量变量3 3、各观测点落在一条线上、各观测点落在一条线上 x xy y第六页,本课件共有79页某某种种商商品品的的销销售售额额(y)与与销销售售量量(x)之之间间的的关关系系可可表表示示为为 y=p x(p 为为单价单价)圆圆的的面面积积(S)与与半半径径之之间间的的关关系系可可表表示为示为S=R2
5、例例 第七页,本课件共有79页 相关关系,也称统计相关,是指现象之间存在的非确定性相关关系,也称统计相关,是指现象之间存在的非确定性的数量依存关系。即现象之间虽然存在着数量依存关系,一的数量依存关系。即现象之间虽然存在着数量依存关系,一个现象数量上发生变化时,另一个现象数量水平也会相应地个现象数量上发生变化时,另一个现象数量水平也会相应地发生变化。但这种数量变化关系并不是严格一一对应的,当发生变化。但这种数量变化关系并不是严格一一对应的,当一个变量数值确定时,另一个变量数值确定时,另个变量可能有许多个可能的取值与个变量可能有许多个可能的取值与之相对应,这些数值围绕着它们的平均数上下波动。之相对
6、应,这些数值围绕着它们的平均数上下波动。相关关系的数学相关关系的数学般形式为:般形式为:(为随机误差项,用于反映随机因素对为随机误差项,用于反映随机因素对y y的影响的影响)一、相关关系与函数关系一、相关关系与函数关系 第八页,本课件共有79页相关关系相关关系1、变变量量间间关关系系不不能能用用函函数关系精确表达数关系精确表达2、一一个个变变量量的的取取值值不不能能由由另另一一个个变变量量唯唯一一确确定定3、当当变变量量 x 取取某某个个值值时时,变变量量 y 的的取取值值可可能能有有几个几个4、各各观观测测点点分分布布在在直直线线周围周围 x xy y第九页,本课件共有79页商品的消费量商品
7、的消费量(y)与居民收入与居民收入(x)之间的关系之间的关系商品销售额商品销售额(y)与广告费支出与广告费支出(x)之间的关系之间的关系粮粮食食亩亩产产量量(y)与与施施肥肥量量(x1)、降降雨雨量量(x2)、温温度度(x3)之间的关系之间的关系收入水平收入水平(y)与受教育程度与受教育程度(x)之间的关系之间的关系父亲身高父亲身高(y)与子女身高与子女身高(x)之间的关系之间的关系例例第十页,本课件共有79页按相关关系涉及的变量(或因素)的多少按相关关系涉及的变量(或因素)的多少 按变量之间相互关系的表现形式按变量之间相互关系的表现形式按变量之间的相互关系的方法或性质不同按变量之间的相互关系
8、的方法或性质不同 按变量之间的相关程度不同按变量之间的相关程度不同 单相关复相关线性相关非线性相关正相关负相关完全相关不相关不完全相关二、相关关系的种类二、相关关系的种类第十一页,本课件共有79页是一个因变量与一个自变量的相关,是一个因变量与一个自变量的相关,也称为也称为一元相关一元相关。单相关单相关是一个因变量与两个或更多个自是一个因变量与两个或更多个自变量之间的相关,变量之间的相关,也称为也称为多元相多元相关关。复相关复相关第十二页,本课件共有79页变量之间的关系为变量之间的关系为线性关系。线性关系。线性相关线性相关变量之间的关系为变量之间的关系为非线性关系非线性关系 。非线性相关非线性相
9、关第十三页,本课件共有79页当自变量当自变量X值增加,因变量值增加,因变量Y值也值也随之增加,这样的相关关系就是随之增加,这样的相关关系就是正正相关相关。当自变量当自变量X的值增加时,因变量的值增加时,因变量Y的值随之而减少,这样的相关关系的值随之而减少,这样的相关关系就是就是负相关负相关。正正相相关关负相关负相关第十四页,本课件共有79页完全相关完全相关完全相关完全相关当一个现象的数量变化完全当一个现象的数量变化完全由另一个现象的数量变化所由另一个现象的数量变化所确定时,称这两种现象的关确定时,称这两种现象的关系为系为完全相关完全相关完全相关完全相关不相关不相关当两个现象彼此互不影响,其当两
10、个现象彼此互不影响,其数量变化各自独立时,称为数量变化各自独立时,称为不不相关相关现象。现象。不完全相关不完全相关两个现象之间的关系介于完全相关两个现象之间的关系介于完全相关两个现象之间的关系介于完全相关两个现象之间的关系介于完全相关和不相关之间,称为和不相关之间,称为和不相关之间,称为和不相关之间,称为不完全相关不完全相关不完全相关不完全相关。它是相关关系的主要表现形式。它是相关关系的主要表现形式。它是相关关系的主要表现形式。它是相关关系的主要表现形式。第十五页,本课件共有79页 完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关
11、非线性相关非线性相关非线性相关非线性相关正线性相关正线性相关正线性相关正线性相关负线性相关负线性相关负线性相关负线性相关 不相关不相关不相关不相关第十六页,本课件共有79页广义上讲,对两个或两个以上现象之间数量上广义上讲,对两个或两个以上现象之间数量上的不确定性依存关系进行的统计分析,即为的不确定性依存关系进行的统计分析,即为相关分析相关分析。具体来说,具体来说,相关分析的内容相关分析的内容有:有:(一)判断确定现象之间有无关系以及相关关(一)判断确定现象之间有无关系以及相关关系的具体表现形式。系的具体表现形式。(二)确定相关关系的密切程度:根据变量数(二)确定相关关系的密切程度:根据变量数据
12、的类型,选择适当的方法,计算出相关系据的类型,选择适当的方法,计算出相关系数。数。三、相关分析的主要内容三、相关分析的主要内容 第十七页,本课件共有79页(三)检验现象统计相关的显著性,包括检验(三)检验现象统计相关的显著性,包括检验相关关系的存在性、检验相关关系强度是否相关关系的存在性、检验相关关系强度是否达到一定水平,检验两对现象相关程度的差达到一定水平,检验两对现象相关程度的差异性,估计相关系数的取值。异性,估计相关系数的取值。(四)广义地说,相关关系分析还包括对相关(四)广义地说,相关关系分析还包括对相关关系的数学形式加以描述,即拟合回归方程,关系的数学形式加以描述,即拟合回归方程,检
13、验回归方程的合理性,并且应用回归模型检验回归方程的合理性,并且应用回归模型进行统计分析与预测和控制。进行统计分析与预测和控制。三、相关分析的主要内容三、相关分析的主要内容 第十八页,本课件共有79页第二节第二节 相关关系的测度相关关系的测度 一、相关关系一般判断一、相关关系一般判断 二、相关系数的测定二、相关系数的测定 第十九页,本课件共有79页 判断现象之间有没有相关关系,是进行相关判断现象之间有没有相关关系,是进行相关分析的前提和出发点。分析的前提和出发点。(一)定性分析(一)定性分析 在研究相关关系时,应根据一定的经济理在研究相关关系时,应根据一定的经济理论和实践经验的总结,对社会经济现
14、象进行科学论和实践经验的总结,对社会经济现象进行科学的定性分析,以判断它们之间是否具有相关关系的定性分析,以判断它们之间是否具有相关关系以及相关关系的类型。只有在定性分析的基础上,以及相关关系的类型。只有在定性分析的基础上,才能进一步从数量上来测定现象之间的相关关系才能进一步从数量上来测定现象之间的相关关系及相关的密切程度。这是判断相关关系的一种重及相关的密切程度。这是判断相关关系的一种重要方法,也是相关分析的重要前提。要方法,也是相关分析的重要前提。一、相关关系一般判断一、相关关系一般判断第二十页,本课件共有79页(二)相关表和相关图(二)相关表和相关图 若经过调查已获得现象的数据资料,若经
15、过调查已获得现象的数据资料,可通过编制相关表和绘制相关图来分析可通过编制相关表和绘制相关图来分析数据变动的规律,判断现象之间的相关数据变动的规律,判断现象之间的相关性。具体方法如下:性。具体方法如下:一、相关关系一般判断一、相关关系一般判断第二十一页,本课件共有79页1 1、简单相关表、简单相关表 利用未分组的原始资料,将两个现象的变量值一一对利用未分组的原始资料,将两个现象的变量值一一对应地填列在同一张表格上,这种表就叫简单相关表,简单应地填列在同一张表格上,这种表就叫简单相关表,简单相关表适用于资料的项数较少的情况。相关表适用于资料的项数较少的情况。年份 销售额(万元)流通费用(万元)19
16、98199920002001200220032004200520061016324074120197246345 1.83.15.27.710.413.318.821.228.3 表表7-1 7-1 销售额与流通费用相关表销售额与流通费用相关表图图7-27-2某企业销售额与流通费用的散点图某企业销售额与流通费用的散点图第二十二页,本课件共有79页分析:分析:从表从表7-17-1可以直观地看出,随着企可以直观地看出,随着企业销售额的增加,流通费用呈现增长的业销售额的增加,流通费用呈现增长的趋势。显然,该企业销售额与流通费用趋势。显然,该企业销售额与流通费用之间存在着相关关系。之间存在着相关关系。
17、从图从图7-27-2可以看到,图中各个点虽可以看到,图中各个点虽不完全在一条直线上,但可以认为,该不完全在一条直线上,但可以认为,该企业的销售额和流通费用之间有较强的企业的销售额和流通费用之间有较强的直线相关关系。直线相关关系。第二十三页,本课件共有79页2 2、分组相关表、分组相关表 当原始资料较多,不再适合采用当原始资料较多,不再适合采用简单相关表时,可以编制分组相关表。简单相关表时,可以编制分组相关表。分组相关表就是将原始资料进行分组分组相关表就是将原始资料进行分组而编制的相关表。它又可分为单变量而编制的相关表。它又可分为单变量分组相关表和双变量分组相关表两种。分组相关表和双变量分组相关
18、表两种。第二十四页,本课件共有79页(1 1)单变量分组表)单变量分组表 只对自变量进行分组,因变量不分组,只是计算出其次数只对自变量进行分组,因变量不分组,只是计算出其次数和平均数,这种表称为单变量分组表。和平均数,这种表称为单变量分组表。家庭月收入(元)家庭户数(户)家庭月平均支出(元)8000以上700080006000700050006000400050003000400020003000100020001000以下 336983420116 3025282026522486225519601536976662 表表7-27-2某市家庭收入与消费支出相关表某市家庭收入与消费支出相关表图
19、图7-37-3家庭收入与家庭消费支出的相关图家庭收入与家庭消费支出的相关图第二十五页,本课件共有79页分析:分析:从表从表7-27-2和图和图7-37-3可以清楚的看到,家庭收入与可以清楚的看到,家庭收入与家庭消费支出之间存在相关关系,家庭消费支出随着家庭消费支出之间存在相关关系,家庭消费支出随着家庭收入的增加而增加,并且基本呈现出直线相关的家庭收入的增加而增加,并且基本呈现出直线相关的形态。形态。(2 2)双变量分组表)双变量分组表 将自变量和因变量都进行分组制成的表称为将自变量和因变量都进行分组制成的表称为双变量分组表。双变量分组表适用于对大量复杂双变量分组表。双变量分组表适用于对大量复杂
20、数据的处理和分析。如下表:数据的处理和分析。如下表:第二十六页,本课件共有79页家庭月收入(元)家庭月支出(元)合计500以下5001000100015001500200020002500250030003000以上8000以上700080006000700050006000400050003000400020003000100020001000以下23145316942114713551321221111336983420116合 计51320242783100 从表从表7-37-3也可以看出,也可以看出,100100户家庭分布在不同的收入和支出区间内,在户家庭分布在不同的收入和支出区间内,
21、在表中形成一个大致向右上方倾斜的数据分布带,可见家庭收入与消费支出表中形成一个大致向右上方倾斜的数据分布带,可见家庭收入与消费支出之间有较强的正相关关系。之间有较强的正相关关系。第二十七页,本课件共有79页 对于单相关情况,相关系数测定方法与对于单相关情况,相关系数测定方法与相关指标量化级别有关。对于定距变量或定相关指标量化级别有关。对于定距变量或定比变量,通常采用皮尔逊线性相关系数公式比变量,通常采用皮尔逊线性相关系数公式测量相关密切程度,对于定序变量,通常采测量相关密切程度,对于定序变量,通常采用斯皮尔曼等级相关或肯特尔等级相关系数用斯皮尔曼等级相关或肯特尔等级相关系数公式测量相关密切程度
22、,对于定类变量,则公式测量相关密切程度,对于定类变量,则常常采用列联系数等来测量相关密切程度。常常采用列联系数等来测量相关密切程度。二、相关系数的测定二、相关系数的测定第二十八页,本课件共有79页本节主要介绍常用的皮尔逊直线相关系数的具体本节主要介绍常用的皮尔逊直线相关系数的具体计算。计算。通过相关图表可以了解现象之间是否具有通过相关图表可以了解现象之间是否具有相关关系,但要想更具体地了解现象之间的相相关关系,但要想更具体地了解现象之间的相关密切程度,必须进一步测定相关系数。关密切程度,必须进一步测定相关系数。第二十九页,本课件共有79页相关系数概念概念 、是度量变量之間关系強度的、是度量变量
23、之間关系強度的一統計量。一統計量。、度量两个变量是否线性相关且、度量两个变量是否线性相关且相关关系相关关系 密切程度的指标,称为简密切程度的指标,称为简单相关系数。单相关系数。、若相关系数是根据总体全部、若相关系数是根据总体全部数据计算的,称为总体相关系数,数据计算的,称为总体相关系数,记为记为p、若相关系数是根据样本数据计、若相关系数是根据样本数据计算的,则称为样本相关系数,记为算的,则称为样本相关系数,记为r第三十页,本课件共有79页(一)直线相关系数的计算(一)直线相关系数的计算 对于定距尺度的连续变量对于定距尺度的连续变量x x和和y y,测定它们之间的线性相关关系最常,测定它们之间的
24、线性相关关系最常用的方法是采用皮尔逊(用的方法是采用皮尔逊(PearsonPearson)相关系数。根据资料情况不同,有相关系数。根据资料情况不同,有不同的计算形式。其中的积差法是不同的计算形式。其中的积差法是最基本表达式。最基本表达式。第三十一页,本课件共有79页1 1、积差法、积差法Pearsonearson相关系数的基本公式可定义为:相关系数的基本公式可定义为:式中,式中,直线相关系数;直线相关系数;变量数列变量数列x x的标准差;的标准差;变量数列变量数列y y的标准差;的标准差;变量数列变量数列x x与与y y的协方差。的协方差。(7-3)据此,式(据此,式(7-37-3)可写成下式
25、:)可写成下式:第三十二页,本课件共有79页(7-4)第三十三页,本课件共有79页2 2、相关系数、相关系数r r的简捷计算方法的简捷计算方法积差法在计算过程中要使用两个数列的平均数,积差法在计算过程中要使用两个数列的平均数,当平均数的小数位很多或除不尽时,计算会比当平均数的小数位很多或除不尽时,计算会比较繁杂且影响最终结果的精确性。因此,计算较繁杂且影响最终结果的精确性。因此,计算相关系数常常采用其简捷公式:相关系数常常采用其简捷公式:(7-5)第三十四页,本课件共有79页r r的取值有一定的范围,在的取值有一定的范围,在1 1和和1 1之间。之间。r r的正负号只表示相关的方向,不表示相关
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关回归分析 2精选课件 相关 回归 分析 精选 课件
限制150内