相关回归分析 (2)精选PPT.ppt
《相关回归分析 (2)精选PPT.ppt》由会员分享,可在线阅读,更多相关《相关回归分析 (2)精选PPT.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、StatisticsStatistics关于相关回归分析(2)第1页,讲稿共79张,创作于星期二第一节第一节 相关分析的基本问题相关分析的基本问题一、相关关系与函数关系一、相关关系与函数关系 二、相关关系的种类二、相关关系的种类三、相关分析的主要内容三、相关分析的主要内容 第2页,讲稿共79张,创作于星期二寻找变量间的关系是科学研究的首要目的。寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即变量间的关系最简单的划分即:有关与无有关与无关。关。在统计学上,我们通常这样判断变量之间在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变是否有关:如果一个变量的取值发生
2、变化,另外一个变量的取值也相应发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。变化不引起另一个变量的变化则二者无关。第3页,讲稿共79张,创作于星期二现象之间的相互关系,可以概括为两种现象之间的相互关系,可以概括为两种不同的类型:不同的类型:(一)函数关系(一)函数关系(二)相关关系(二)相关关系第4页,讲稿共79张,创作于星期二 函数关系是指现象之间存在确定性的数函数关系是指现象之间存在确定性的数量依存关系。在这种关系中,当某一变量或量依存关系。在这种关系中,当某一变量或某些变量取任意一个值
3、时,另一变量都会有某些变量取任意一个值时,另一变量都会有一个确定值与之严格对应,并且这种对应关一个确定值与之严格对应,并且这种对应关系可以用一个数学表达式来反映。系可以用一个数学表达式来反映。两个变量两个变量x x与与y y之间的函数关系一般之间的函数关系一般可以表示为:可以表示为:一、相关关系与函数关系一、相关关系与函数关系 第5页,讲稿共79张,创作于星期二函数关系函数关系:1 1、是一一对应的确定关系、是一一对应的确定关系、是一一对应的确定关系、是一一对应的确定关系2 2、设设设设有有有有两两两两个个个个变变变变量量量量 x x 和和和和 y y,变变变变量量量量 y y 随随随随变变变
4、变量量量量 x x 一一一一起起起起变变变变化化化化,并并并并完完完完全全全全依依依依赖赖赖赖于于于于 x x,当当当当变变变变量量量量 x x 取取取取某某某某个个个个数数数数值值值值时时时时,y y 依依依依确确确确定定定定的的的的关关关关系系系系取取取取相相相相应应应应的的的的值值值值,则则则则称称称称 y y 是是是是 x x 的的的的函函函函数数数数,记记记记为为为为 y y=f f(x)(x),其其其其中中中中 x x 称称称称为为为为自自自自变变变变量量量量,y y 称称称称为为为为因因因因变变变变量量量量3 3、各观测点落在一条线上、各观测点落在一条线上、各观测点落在一条线上、
5、各观测点落在一条线上 x xy y第6页,讲稿共79张,创作于星期二某某种种商商品品的的销销售售额额(y)与与销销售售量量(x)之之间间的的关关系系可可表表示示为为 y=p x(p 为为单价单价)圆圆的的面面积积(S)与与半半径径之之间间的的关关系系可可表表示为示为S=R2 例例 第7页,讲稿共79张,创作于星期二 相关关系,也称统计相关,是指现象之间存在的非确定性的数量依相关关系,也称统计相关,是指现象之间存在的非确定性的数量依存关系。即现象之间虽然存在着数量依存关系,一个现象数量上发生存关系。即现象之间虽然存在着数量依存关系,一个现象数量上发生变化时,另一个现象数量水平也会相应地发生变化。
6、但这种数量变化变化时,另一个现象数量水平也会相应地发生变化。但这种数量变化关系并不是严格一一对应的,当一个变量数值确定时,另关系并不是严格一一对应的,当一个变量数值确定时,另个变量可个变量可能有许多个可能的取值与之相对应,这些数值围绕着它们的平均数能有许多个可能的取值与之相对应,这些数值围绕着它们的平均数上下波动。上下波动。相关关系的数学相关关系的数学般形式为:般形式为:(为随机误差项,用于反映随机因素对为随机误差项,用于反映随机因素对y y的影响的影响)一、相关关系与函数关系一、相关关系与函数关系 第8页,讲稿共79张,创作于星期二相关关系相关关系1、变变量量间间关关系系不不能能用用函函数数
7、关系精确表达关系精确表达2、一一个个变变量量的的取取值值不不能能由由另一个变量唯一确定另一个变量唯一确定3、当当变变量量 x 取取某某个个值值时时,变变量量 y 的的取取值值可可能能有有几个几个4、各各观观测测点点分分布布在在直直线线周周围围 x xy y第9页,讲稿共79张,创作于星期二商品的消费量商品的消费量(y)与居民收入与居民收入(x)之间的关系之间的关系商品销售额商品销售额(y)与广告费支出与广告费支出(x)之间的关系之间的关系粮粮食食亩亩产产量量(y)与与施施肥肥量量(x1)、降降雨雨量量(x2)、温温度度(x3)之间的关系之间的关系收入水平收入水平(y)与受教育程度与受教育程度(
8、x)之间的关系之间的关系父亲身高父亲身高(y)与子女身高与子女身高(x)之间的关系之间的关系例例第10页,讲稿共79张,创作于星期二按相关关系涉及的变量(或因素)的多少按相关关系涉及的变量(或因素)的多少 按变量之间相互关系的表现形式按变量之间相互关系的表现形式按变量之间的相互关系的方法或性质不同按变量之间的相互关系的方法或性质不同 按变量之间的相关程度不同按变量之间的相关程度不同 单相关复相关线性相关非线性相关正相关负相关完全相关不相关不完全相关二、相关关系的种类二、相关关系的种类第11页,讲稿共79张,创作于星期二是一个因变量与一个自变量的相关,是一个因变量与一个自变量的相关,也称为也称为
9、一元相关一元相关。单相关单相关是一个因变量与两个或更多个自变量是一个因变量与两个或更多个自变量之间的相关,之间的相关,也称为也称为多元相关多元相关。复相关复相关第12页,讲稿共79张,创作于星期二变量之间的关系为变量之间的关系为线性关系。线性关系。线性相关线性相关变量之间的关系为变量之间的关系为非线性关系非线性关系 。非线性相关非线性相关第13页,讲稿共79张,创作于星期二当自变量当自变量X值增加,因变量值增加,因变量Y值也值也随之增加,这样的相关关系就是随之增加,这样的相关关系就是正相关正相关。当自变量当自变量X的值增加时,因变量的值增加时,因变量Y的的值随之而减少,这样的相关关系就值随之而
10、减少,这样的相关关系就是是负相关负相关。正正相相关关负相关负相关第14页,讲稿共79张,创作于星期二完全相关完全相关完全相关完全相关当一个现象的数量变化完全由当一个现象的数量变化完全由当一个现象的数量变化完全由当一个现象的数量变化完全由另一个现象的数量变化所确定另一个现象的数量变化所确定另一个现象的数量变化所确定另一个现象的数量变化所确定时,称这两种现象的关系为时,称这两种现象的关系为时,称这两种现象的关系为时,称这两种现象的关系为完完完完全相关全相关全相关全相关不相关不相关当两个现象彼此互不影响,其当两个现象彼此互不影响,其数量变化各自独立时,称为数量变化各自独立时,称为不不相关相关现象。现
11、象。不完全相关不完全相关不完全相关不完全相关两个现象之间的关系介于完全相关和两个现象之间的关系介于完全相关和两个现象之间的关系介于完全相关和两个现象之间的关系介于完全相关和不相关之间,称为不相关之间,称为不相关之间,称为不相关之间,称为不完全相关不完全相关不完全相关不完全相关。它它它它是相关关系的主要表现形式。是相关关系的主要表现形式。是相关关系的主要表现形式。是相关关系的主要表现形式。第15页,讲稿共79张,创作于星期二 完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关非线性相关非线性相关非线性相关非线性相关正线性相关正线性相关
12、正线性相关正线性相关负线性相关负线性相关负线性相关负线性相关 不相关不相关不相关不相关第16页,讲稿共79张,创作于星期二广义上讲,对两个或两个以上现象之间数量上广义上讲,对两个或两个以上现象之间数量上的不确定性依存关系进行的统计分析,即为的不确定性依存关系进行的统计分析,即为相关分析相关分析。具体来说,具体来说,相关分析的内容相关分析的内容有:有:(一)判断确定现象之间有无关系以及相关关(一)判断确定现象之间有无关系以及相关关系的具体表现形式。系的具体表现形式。(二)确定相关关系的密切程度:根据变量数(二)确定相关关系的密切程度:根据变量数据的类型,选择适当的方法,计算出相关系据的类型,选择
13、适当的方法,计算出相关系数。数。三、相关分析的主要内容三、相关分析的主要内容 第17页,讲稿共79张,创作于星期二(三)检验现象统计相关的显著性,包括检验(三)检验现象统计相关的显著性,包括检验相关关系的存在性、检验相关关系强度是否相关关系的存在性、检验相关关系强度是否达到一定水平,检验两对现象相关程度的差达到一定水平,检验两对现象相关程度的差异性,估计相关系数的取值。异性,估计相关系数的取值。(四)广义地说,相关关系分析还包括对相关(四)广义地说,相关关系分析还包括对相关关系的数学形式加以描述,即拟合回归方程,关系的数学形式加以描述,即拟合回归方程,检验回归方程的合理性,并且应用回归模型检验
14、回归方程的合理性,并且应用回归模型进行统计分析与预测和控制。进行统计分析与预测和控制。三、相关分析的主要内容三、相关分析的主要内容 第18页,讲稿共79张,创作于星期二第二节第二节 相关关系的测度相关关系的测度 一、相关关系一般判断一、相关关系一般判断 二、相关系数的测定二、相关系数的测定 第19页,讲稿共79张,创作于星期二 判断现象之间有没有相关关系,是进行相关分判断现象之间有没有相关关系,是进行相关分析的前提和出发点。析的前提和出发点。(一)定性分析(一)定性分析 在研究相关关系时,应根据一定的经济理论和在研究相关关系时,应根据一定的经济理论和实践经验的总结,对社会经济现象进行科学的定性
15、实践经验的总结,对社会经济现象进行科学的定性分析,以判断它们之间是否具有相关关系以及相关分析,以判断它们之间是否具有相关关系以及相关关系的类型。只有在定性分析的基础上,才能进一关系的类型。只有在定性分析的基础上,才能进一步从数量上来测定现象之间的相关关系及相关的密步从数量上来测定现象之间的相关关系及相关的密切程度。这是判断相关关系的一种重要方法,也是切程度。这是判断相关关系的一种重要方法,也是相关分析的重要前提。相关分析的重要前提。一、相关关系一般判断一、相关关系一般判断第20页,讲稿共79张,创作于星期二(二)相关表和相关图(二)相关表和相关图 若经过调查已获得现象的数据资料,若经过调查已获
16、得现象的数据资料,可通过编制相关表和绘制相关图来分析可通过编制相关表和绘制相关图来分析数据变动的规律,判断现象之间的相关数据变动的规律,判断现象之间的相关性。具体方法如下:性。具体方法如下:一、相关关系一般判断一、相关关系一般判断第21页,讲稿共79张,创作于星期二1 1、简单相关表、简单相关表 利用未分组的原始资料,将两个现象的变量值一一对应地利用未分组的原始资料,将两个现象的变量值一一对应地填列在同一张表格上,这种表就叫简单相关表,简单相关表适用填列在同一张表格上,这种表就叫简单相关表,简单相关表适用于资料的项数较少的情况。于资料的项数较少的情况。年份 销售额(万元)流通费用(万元)199
17、8199920002001200220032004200520061016324074120197246345 1.83.15.27.710.413.318.821.228.3 表表7-1 7-1 销售额与流通费用相关表销售额与流通费用相关表图图7-27-2某企业销售额与流通费用的散点图某企业销售额与流通费用的散点图第22页,讲稿共79张,创作于星期二分析:分析:从表从表7-17-1可以直观地看出,随着企可以直观地看出,随着企业销售额的增加,流通费用呈现增长的业销售额的增加,流通费用呈现增长的趋势。显然,该企业销售额与流通费用趋势。显然,该企业销售额与流通费用之间存在着相关关系。之间存在着相关
18、关系。从图从图7-27-2可以看到,图中各个点虽可以看到,图中各个点虽不完全在一条直线上,但可以认为,该不完全在一条直线上,但可以认为,该企业的销售额和流通费用之间有较强的企业的销售额和流通费用之间有较强的直线相关关系。直线相关关系。第23页,讲稿共79张,创作于星期二2 2、分组相关表、分组相关表 当原始资料较多,不再适合采用当原始资料较多,不再适合采用简单相关表时,可以编制分组相关表。简单相关表时,可以编制分组相关表。分组相关表就是将原始资料进行分组分组相关表就是将原始资料进行分组而编制的相关表。它又可分为单变量而编制的相关表。它又可分为单变量分组相关表和双变量分组相关表两种。分组相关表和
19、双变量分组相关表两种。第24页,讲稿共79张,创作于星期二(1 1)单变量分组表)单变量分组表 只对自变量进行分组,因变量不分组,只是计算出其次数和只对自变量进行分组,因变量不分组,只是计算出其次数和平均数,这种表称为单变量分组表。平均数,这种表称为单变量分组表。家庭月收入(元)家庭户数(户)家庭月平均支出(元)8000以上700080006000700050006000400050003000400020003000100020001000以下 336983420116 3025282026522486225519601536976662 表表7-27-2某市家庭收入与消费支出相关表某市家庭
20、收入与消费支出相关表图图7-37-3家庭收入与家庭消费支出的相关图家庭收入与家庭消费支出的相关图第25页,讲稿共79张,创作于星期二分析:分析:从表从表7-27-2和图和图7-37-3可以清楚的看到,家庭收入可以清楚的看到,家庭收入与家庭消费支出之间存在相关关系,家庭消费支与家庭消费支出之间存在相关关系,家庭消费支出随着家庭收入的增加而增加,并且基本呈现出出随着家庭收入的增加而增加,并且基本呈现出直线相关的形态。直线相关的形态。(2 2)双变量分组表)双变量分组表 将自变量和因变量都进行分组制成的表称为将自变量和因变量都进行分组制成的表称为双变量分组表。双变量分组表适用于对大量复杂双变量分组表
21、。双变量分组表适用于对大量复杂数据的处理和分析。如下表:数据的处理和分析。如下表:第26页,讲稿共79张,创作于星期二家庭月收入(元)家庭月支出(元)合计500以下5001000100015001500200020002500250030003000以上8000以上700080006000700050006000400050003000400020003000100020001000以下23145316942114713551321221111336983420116合 计51320242783100 从表从表7-37-3也可以看出,也可以看出,100100户家庭分布在不同的收入和支出区间内,
22、在表中形成一个大致户家庭分布在不同的收入和支出区间内,在表中形成一个大致向右上方倾斜的数据分布带,可见家庭收入与消费支出之间有较强的正相关关系。向右上方倾斜的数据分布带,可见家庭收入与消费支出之间有较强的正相关关系。第27页,讲稿共79张,创作于星期二 对于单相关情况,相关系数测定方法与对于单相关情况,相关系数测定方法与相关指标量化级别有关。对于定距变量或定相关指标量化级别有关。对于定距变量或定比变量,通常采用皮尔逊线性相关系数公式比变量,通常采用皮尔逊线性相关系数公式测量相关密切程度,对于定序变量,通常采测量相关密切程度,对于定序变量,通常采用斯皮尔曼等级相关或肯特尔等级相关系数用斯皮尔曼等
23、级相关或肯特尔等级相关系数公式测量相关密切程度,对于定类变量,则公式测量相关密切程度,对于定类变量,则常常采用列联系数等来测量相关密切程度。常常采用列联系数等来测量相关密切程度。二、相关系数的测定二、相关系数的测定第28页,讲稿共79张,创作于星期二本节主要介绍常用的皮尔逊直线相关系数的具体本节主要介绍常用的皮尔逊直线相关系数的具体计算。计算。通过相关图表可以了解现象之间是否具有通过相关图表可以了解现象之间是否具有相关关系,但要想更具体地了解现象之间的相相关关系,但要想更具体地了解现象之间的相关密切程度,必须进一步测定相关系数。关密切程度,必须进一步测定相关系数。第29页,讲稿共79张,创作于
24、星期二相关系数概念概念 、是度量变量之間关系強度的一統、是度量变量之間关系強度的一統計量。計量。、度量两个变量是否线性相关、度量两个变量是否线性相关且相关关系且相关关系 密切程度的指标,称密切程度的指标,称为简单相关系数。为简单相关系数。、若相关系数是根据总体全部数、若相关系数是根据总体全部数据计算的,称为总体相关系数,记据计算的,称为总体相关系数,记为为p、若相关系数是根据样本数据、若相关系数是根据样本数据计算的,则称为样本相关系数,计算的,则称为样本相关系数,记为记为r第30页,讲稿共79张,创作于星期二(一)直线相关系数的计算(一)直线相关系数的计算 对于定距尺度的连续变量对于定距尺度的
25、连续变量x x和和y y,测定它们之间的线性相关关系最常用测定它们之间的线性相关关系最常用的方法是采用皮尔逊(的方法是采用皮尔逊(PearsonPearson)相)相关系数。根据资料情况不同,有不同关系数。根据资料情况不同,有不同的计算形式。其中的积差法是最基本的计算形式。其中的积差法是最基本表达式。表达式。第31页,讲稿共79张,创作于星期二1 1、积差法、积差法Pearsonearson相关系数的基本公式可定义为:相关系数的基本公式可定义为:式中,式中,直线相关系数;直线相关系数;变量数列变量数列x x的标准差;的标准差;变量数列变量数列y y的标准差;的标准差;变量数列变量数列x x与与
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关回归分析 2精选PPT 相关 回归 分析 精选 PPT
限制150内