10相关与回归分析.ppt
《10相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《10相关与回归分析.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1第十章第十章 相关分析与回归分析相关分析与回归分析n n相关分析与回归分析的基本概念n n线性相关分析n n一元线性回归分析2第一节第一节 基本概念基本概念一、函数关系与相关关系n函数关系:当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,称为确定性的函数关系。n函数关系的特点1.是一一对应的确定关系2.设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量 3第一节第一节 基本概念基本概念一、函数关系与相关关系n相关关系:当
2、一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量之间的这种关系称为相关关系。n相关关系的特点1.变量间关系不能用函数关系精确表达;2.一个变量的取值不能由另一个变量唯一确定;3.当变量 x 取某个值时,变量 y 的取值可能有几个。4二、相关关系的种类二、相关关系的种类n n按相关关系的程度划分按相关关系的程度划分n n完全相关:完全相关:n n当一个现象的数量变化完全由另一个现象的数量变化所确当一个现象的数量变化完全由另一个现象的数量变化所确定时,称这两种现象间的关系为完全相关。定时,称这两种现象间的关系为完全相关。n n不相关
3、:不相关:n n当两种现象彼此互不影响,其数量变化各自独立时,称为当两种现象彼此互不影响,其数量变化各自独立时,称为不相关现象。不相关现象。n n不完全相关:不完全相关:n n两个现象之间的关系介于相关和不相关之间,称为不完全两个现象之间的关系介于相关和不相关之间,称为不完全相关。相关。5二、相关关系的种类二、相关关系的种类n n按相关形式划分n n线性相关:线性相关:n n当两种相关现象之间的关系大致呈现为线性关系当两种相关现象之间的关系大致呈现为线性关系时,称之为线性关关。时,称之为线性关关。n n非线性相关:非线性相关:n n如果两种相关现象之间,并不表现为直线的关系,如果两种相关现象之
4、间,并不表现为直线的关系,而是近似于某种曲线方程的关系,则这种相关关而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关。系称为非线性相关。6n按相关的方向划分n正相关:n两个相关现象间,当一个变量的数值增加(或减少)时,另一个变量的数值也随之增加(或减少),即同方向变化。n负相关:n当一个变量的数值增加(或减少)时,而另一个变量的数值相反地呈减少(或增加)趋势变化,即反方向变化。二、相关关系的种类二、相关关系的种类7n按研究的变量划分n单相关:n两个变量之间的相关,称为单相关n复相关:n当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。n偏相关:n在某一现象与多种现
5、象相关的场合,假定其他变量不变,专门考察其中两个变量的相关关系称为偏相关。二、相关关系的种类二、相关关系的种类8三、相关分析与回归分析三、相关分析与回归分析(一)概念:n相关分析:n就是用一个指标来表明现象间相互依存关系的密切程度。n回归分析:n是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。9(二)相关分析与回归分析的相关分析与回归分析的区别区别 n n在相关分析中,不必确定自变量和因变量;而在回归分析中,必在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为
6、因变量,而且只能从自变量去须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。推测因变量,而不能从因变量去推断自变量。n n相关分析不能指出变量间相互关系的具体形式;而回归分析能确相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。知量估计和预测未知量。n n相关分析所涉及的变量一般都是随机变量,而回归分析中因变量相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
7、是随机的,自变量则作为研究时给定的非随机变量。10(三)相关分析与回归分析的联系(三)相关分析与回归分析的联系n相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。n简单说:n1、相关分析是回归分析的基础和前提;n2、回归分析是相关分析的深入和继续。11第二节第二节 线性相关分析线性相关分析n定性分析n n依据研究者的理论知识和实践经验,对客观现象之间依据研究者的理
8、论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。是否存在相关关系,以及何种关系作出判断。n定量分析n n在定性分析的基础上,通过编制相关表、绘制相关图、在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。形态及密切程度。12一、相关表一、相关表n n相关表:将自变量相关表:将自变量x x的数值按照从小到大的顺序,并配合的数值按照从小到大的顺序,并配合因变量因变量y y的数值一一对应而平行排列的表。的数值一一对应而平行排列的表。n例:为了研究分析某种劳务产品完成量与其单
9、位产品成本之间的关系,调查30个同类服务公司得到的原始数据如表。13 整理后整理后14二、相关图二、相关图n n相关图相关图/散点图:以直角坐标系的横轴代表变量散点图:以直角坐标系的横轴代表变量x x,纵轴代表变量,纵轴代表变量y y,将两个变量间相对应的变量值,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间用坐标点的形式描绘出来,用来反映两变量之间的相关关系的图形。的相关关系的图形。n n例:例:15相关图相关图16三、相关系数三、相关系数(一)相关系数的定义(一)相关系数的定义:n n在线性条件下说明两个变量之间相关关系密切程度的统在线性条件下说明两个变量之间相关关系
10、密切程度的统计分析指标。计分析指标。n n总体相关系数:相关系数是根据总体全部数据计算的,记为总体相关系数:相关系数是根据总体全部数据计算的,记为 n n样本相关系数:根据样本数据计算的,记为样本相关系数:根据样本数据计算的,记为 r r17(二)相关系数的特点(二)相关系数的特点n n的取值介于与之间;的取值介于与之间;n n在大多数情况下,在大多数情况下,|,即,即与与的样本观测值之间存在着的样本观测值之间存在着一定的线性关系,当一定的线性关系,当时,与为正相关,当时,与为正相关,当时,时,与与为负相关。为负相关。n n|的数值愈接近于的数值愈接近于1 1,表示,表示x x与与y y直线相
11、关程度愈高;反之,直线相关程度愈高;反之,|的数值的数值愈接近于愈接近于0 0,表示,表示x x与与y y直线相关程度愈低。直线相关程度愈低。n n通常判断的标准是通常判断的标准是:|:|0.30.3称为微弱相关,称为微弱相关,0.3|0.3|0.50.5称为低度相关,称为低度相关,0.5|0.5|0.80.8称为显著相关称为显著相关 ,0.8|0.8|1 1称为高度相关或强相关。称为高度相关或强相关。n n如果如果|=1|=1,则表明,则表明与与完全线性相关,当完全线性相关,当=1=1时,称为完全正相时,称为完全正相关,而关,而=-1=-1时,称为完全负相关。时,称为完全负相关。n n是对变
12、量之间线性相关关系的度量。是对变量之间线性相关关系的度量。n n=0 0只是表明两个变量之间不存在线性关系,它并不意味着只是表明两个变量之间不存在线性关系,它并不意味着与与之间不之间不存在其他类型的关系。存在其他类型的关系。18(三)相关系数的计算(三)相关系数的计算19 例:下表是有关例:下表是有关15个地区某种食物需求量和地区人口增个地区某种食物需求量和地区人口增加量的资料。加量的资料。2021(四)相关系数的显著性检验(四)相关系数的显著性检验 n n检验两个变量之间是否存在线性相关关系检验两个变量之间是否存在线性相关关系n n采用采用 t t 检验检验n n检验的步骤为检验的步骤为n
13、n提出假设:提出假设:HH0 0:;HH1 1:0 0n n计算检验的统计量:计算检验的统计量:n确定显著性水平,并作出决策 若 t t,拒绝 H0 若 t =48.385t t(15-2)=2.160(15-2)=2.160,拒绝拒绝H H0 0,该,该种食物需求量和地区人口增加量之间的相之间的相关关系显著。关关系显著。23第三节第三节 一元线性回归一元线性回归一、回归函数n n总体回归函数:总体回归函数:t t 0 0 1 1t tu ut tnu t是随机误差项,又称随机干扰项,它是一个特殊的随机变量,反映未列入方程式的其他各种因素对的影响。n n样本回归函数:样本回归函数:n nt t
14、称为残差,在概念上,称为残差,在概念上,t t与总体误差项与总体误差项u ut t相互对相互对应;是样本的容量。应;是样本的容量。24样本回归函数与总体回归函数区别样本回归函数与总体回归函数区别1.1.总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的,每抽取一总体回归线是未知的,只有一条。样本回归线是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归线。组样本,便可以拟合一条样本回归线。2.2.总体回归函数中的总体回归函数中的 1 1和和 2 2是未知的参数,表现为常数。而样本回归函数中的是未知的参数,表现为常数。而样本回归函数中的 是随机变量,其具体数值随所抽取的样本观测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 10 相关 回归 分析
限制150内