相关回归分析精选PPT.ppt
《相关回归分析精选PPT.ppt》由会员分享,可在线阅读,更多相关《相关回归分析精选PPT.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、StatisticsStatistics关于相关回归分析第1页,讲稿共37张,创作于星期二第一节 相关分析的基本问题一、相关关系与函数关系一、相关关系与函数关系 二、相关关系的种类二、相关关系的种类三、相关分析的主要内容三、相关分析的主要内容 第2页,讲稿共37张,创作于星期二 函数关系是指现象之间存在确定性的数量依存关系。在这种函数关系是指现象之间存在确定性的数量依存关系。在这种关系中,当某一变量或某些变量取任意一个值时,另一变量都关系中,当某一变量或某些变量取任意一个值时,另一变量都会有一个确定值与之严格对应,并且这种对应关系可以用一个会有一个确定值与之严格对应,并且这种对应关系可以用一个
2、数学表达式来反映。数学表达式来反映。相关关系,也称统计相关,是指现象之间存在的非确定性的数相关关系,也称统计相关,是指现象之间存在的非确定性的数量依存关系。即现象之间虽然存在着数量依存关系,一个现象发生量依存关系。即现象之间虽然存在着数量依存关系,一个现象发生数量上发生变化时,另一个现象数量水平也会相应地发生变化。但数量上发生变化时,另一个现象数量水平也会相应地发生变化。但这种数量变化关系并不是严格一一对应的,当一个变量数值确定时,这种数量变化关系并不是严格一一对应的,当一个变量数值确定时,另另个变量可能有许多个可能的取值与之相对应,这些数值围绕着它个变量可能有许多个可能的取值与之相对应,这些
3、数值围绕着它们的平均数上下波动。们的平均数上下波动。相关关系的数学相关关系的数学般形式为:般形式为:(为随机误差项,为随机误差项,用于反映随机因素对用于反映随机因素对y y的影响的影响 )一、相关关系与函数关系 第3页,讲稿共37张,创作于星期二按相关关系涉及的变量(或因素)的多少 按变量之间相互关系的表现形式按变量之间的相互关系的方法或性质不同 按变量之间的相关程度不同 单相关复相关线性相关非线性相关正相关负相关完全相关不相关不完全相关二、相关关系的种类第4页,讲稿共37张,创作于星期二广义上讲,对两个或两个以上现象之间数量上的不确定性依存关系进行的统计分广义上讲,对两个或两个以上现象之间数
4、量上的不确定性依存关系进行的统计分析,即为相关分析。析,即为相关分析。具体来说,相关分析的内容有:具体来说,相关分析的内容有:(一)判断确定现象之间有无关系以及相关关系的具体表现形式。(一)判断确定现象之间有无关系以及相关关系的具体表现形式。(二)确定相关关系的密切程度:根据变量数据的类型,选择适当的方法,计算(二)确定相关关系的密切程度:根据变量数据的类型,选择适当的方法,计算出相关系数。出相关系数。(三)检验现象统计相关的显著性,包括检验相关关系的存在性、检验(三)检验现象统计相关的显著性,包括检验相关关系的存在性、检验相关关系强度是否达到一定水平,检验两对现象相关程度的差异性,相关关系强
5、度是否达到一定水平,检验两对现象相关程度的差异性,估计相关系数的取值。估计相关系数的取值。(四)广义地说,相关关系分析还包括对相关关系的数学形式加以描述,即拟合回归(四)广义地说,相关关系分析还包括对相关关系的数学形式加以描述,即拟合回归方程,检验回归方程的合理性,并且应用回归模型进行统计分析与预测和控制方程,检验回归方程的合理性,并且应用回归模型进行统计分析与预测和控制。三、相关分析的主要内容 第5页,讲稿共37张,创作于星期二第二节 相关关系的测度 一、相关关系一般判断一、相关关系一般判断 二、相关系数的测定二、相关系数的测定 第6页,讲稿共37张,创作于星期二 判断现象之间有没有相关关系
6、,是进行相关分析的前提和判断现象之间有没有相关关系,是进行相关分析的前提和出发点。出发点。(一)定性分析(一)定性分析 在研究相关关系时,应根据一定的经济理论和实践经在研究相关关系时,应根据一定的经济理论和实践经验的总结,对社会经济现象进行科学的定性分析,以判断验的总结,对社会经济现象进行科学的定性分析,以判断它们之间是否具有相关关系以及相关关系的类型。只有在它们之间是否具有相关关系以及相关关系的类型。只有在定性分析的基础上,才能进一步从数量上来测定现象之间定性分析的基础上,才能进一步从数量上来测定现象之间的相关关系及相关的密切程度。这是判断相关关系的一种的相关关系及相关的密切程度。这是判断相
7、关关系的一种重要方法,也是相关分析的重要前提。重要方法,也是相关分析的重要前提。(二)相关表和相关图(二)相关表和相关图 若经过调查已获得现象的数据资料,可通过编制相关若经过调查已获得现象的数据资料,可通过编制相关表和绘制相关图来分析数据变动的规律,判断现象之间的表和绘制相关图来分析数据变动的规律,判断现象之间的相关性。具体方法如下:相关性。具体方法如下:一、相关关系一般判断第7页,讲稿共37张,创作于星期二1 1、简单相关表、简单相关表 利用未分组的原始资料,将两个现象的变量值一一对应地填列在同一张表格上,这种表就叫简单相关表,简单相关表适用于资料的项数较少的情况。表表7-1 销售额与流通费
8、用相关表销售额与流通费用相关表图图7-2某企业销售额与流通费用的散点图某企业销售额与流通费用的散点图第8页,讲稿共37张,创作于星期二分析:从表7-1可以直观地看出,随着企业销售额的增加,流通费用呈现增长的趋势。显然,该企业销售额与流通费用之间存在着相关关系。从图7-2可以看到,图中各个点虽不完全在一条直线上,但可以认为,该企业的销售额和流通费用之间有较强的直线相关关系。2 2、分组相关表、分组相关表 当原始资料较多,不再适合采用简单相关表时,可以编制分组相关表。分组相关表就是将原始资料进行分组而编制的相关表。它又可分为单变量分组相关表和双变量分组相关表两种。第9页,讲稿共37张,创作于星期二
9、(1 1)单变量分组表)单变量分组表 只对自变量进行分组,因变量不分组,只是计算出其次数和平均数,这种表称为单变量分组表。表表7-2某市家庭收入与消费支出相关表某市家庭收入与消费支出相关表图图7-3家庭收入与家庭消费支出的相关图家庭收入与家庭消费支出的相关图第10页,讲稿共37张,创作于星期二分析:从表7-2和图7-3可以清楚的看到,家庭收入与家庭消费支出之间存在相关关系,家庭消费支出随着家庭收入的增加而增加,并且基本呈现出直线相关的形态。(2 2)双变量分组表)双变量分组表 将自变量和因变量都进行分组制成的表称为双变量分组表。双变量分组表适用于对大量复杂数据的处理和分析。如下表:第11页,讲
10、稿共37张,创作于星期二 从表7-3也可以看出,100户家庭分布在不同的收入和支出区间内,在表中形成一个大致向右上方倾斜的数据分布带,可见家庭收入与消费支出之间有较强的正相关关系。第12页,讲稿共37张,创作于星期二 对于单相关情况,相关系数测定方法与相关指标量化级别有关。对于定距变量或定比变量,通常采用皮尔逊线性相关系数公式测量相关密切程度,对于定序变量,通常采用斯皮尔曼等级相关或肯特尔等级相关系数公式测量相关密切程度,对于定类变量,则常常采用列联系数等来测量相关密切程度。本节主要介绍常用的皮尔逊直线相关系数、斯皮尔曼等级相关系数和肯特尔等级相关系数的具体计算。通过相关图表可以了解现象之间是
11、否具有相关关系,但要想更具体地了解现象之间的相关密切程度,必须进一步测定相关系数。相关系数就是描述两个变量之间线性相关密切程度和相关方向的统计分析指标。二、相关系数的测定第13页,讲稿共37张,创作于星期二(一)直线相关系数的计算(一)直线相关系数的计算 对于定距尺度的连续变量x和y,测定它们之间的线性相关关系最常用的方法是采用皮尔逊(Pearson)相关系数。根据资料情况不同,有不同的计算形式。其中的积差法是最基本表达式。1 1、积差法、积差法Pearson相关系数的基本公式可定义为:式中,直线相关系数;变量数列x的标准差;变量数列y的标准差;变量数列x与y的协方差。(7-3)据此,式(7-
12、3)可写成下式:第14页,讲稿共37张,创作于星期二(7-4)2 2、相关系数、相关系数r r的简捷计算方法的简捷计算方法积差法在计算过程中要使用两个数列的平均数,当平均数的小数位很多或除不尽时,计算会比较繁杂且影响最终结果的精确性。因此,计算相关系数常常采用其简捷公式:(7-5)第15页,讲稿共37张,创作于星期二3 3、利用分组资料计算相关系数、利用分组资料计算相关系数(1)根据单变量分组表计算相关系数,可以在简单相关的基本公式基础上,以每组的次数为权数进行加权计算,公式如下:(2)根据双变量分组表,也能计算相关系数,但一般很少采用。计算公式为:式中,x组的次数;y组的次数;x与y交叉组的
13、次数。(7-6)(7-7)第16页,讲稿共37张,创作于星期二4 4、直线相关系数、直线相关系数r r的统计检验的统计检验 上述相关系数是基于样本计算的,是对总体相关系数的估计。因此需要对相关系数的显著性进行统计检验。检验的内容包括两部分:一是总体线性相关的存在性检验,即检验总体线性相关系数是否为零;二是总体线性相关差异性检验,检验某一总体线性相关程度是否等于(或者单侧检验大于或小于)某一指定值,以及检验两个相关系数是否来自同一相关总体。本节只讨论第一种情况。第17页,讲稿共37张,创作于星期二 设随机变量(X,Y)服从于正态分布。总体相关系数记为。则对于由样本资料计算的皮尔逊相关系数r,需要
14、检验以下原假设与备择假设:在成立情况之下,有以下t 统计量:在给定显著性水平之下,当,即表示总体线性相关系数显著不等于零,即线性相关关系(在一定程度上)是存在的。第18页,讲稿共37张,创作于星期二5 5、皮尔逊直线相关系数、皮尔逊直线相关系数r r的取值含义的取值含义(1)r的取值有一定的范围,在1和1之间。(2)r的正负号只表示相关的方向,不表示相关程度的大小,即表示正相关,表示负相关。(3)相关程度的大小要看相关系数绝对值的大小。越接近于1,表示相关密切程度越强,越接近于0,表示相关密切程度越弱,当时,就表示变量之间为完全相关。则表示完全不相关。(4)为了使判断有一定的标准,一般将相关程
15、度设为以下几个强弱不同的等级:相关系数在0.3以下为无相关,0.30.5为低度相关,0.50.8为中度相关,0.8以上是高度相关。(5)皮尔逊直线相关系数是一种线性(直线)相关程度的度量。第19页,讲稿共37张,创作于星期二(二)等级相关系数的测定方法(二)等级相关系数的测定方法 皮尔逊相关系数一般适用于连续变量,且要求总体分布服从或近似服从正态分布。但在统计实践中,数据资料可能不能满足上述的条件,有些数据还是属性数据(如测定品质的优劣、爱好程度、信念、态度等)。对于这种以等级或次序进行衡量的定序尺度数据,或不满足正态分布假设的定距尺度数据,需要采用等级相关(Rank Correlation)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关 回归 分析 精选 PPT
限制150内