第十章--相关与回归分析ppt课件.ppt
《第十章--相关与回归分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第十章--相关与回归分析ppt课件.ppt(73页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十章第十章 相关与回归分析相关与回归分析有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。弗朗西斯高尔顿先生被誉为现代相关和回归的弗朗西斯高尔顿先生被誉为现代相关和回归的创始人创始人1875年,他利用豌豆试验来确定尺寸的遗传规律。年,他利用豌豆试验来确定尺寸的遗传规律。他挑选他挑选7组不同尺寸的豌豆,说服他的朋友每一组组不同尺寸的豌豆,说服他的朋友每一组种植种植10粒种子,最后把原始的豌豆种子与新长的粒种子,最后把原始的豌豆种子与新长的豌豆种子进行尺寸比较豌豆种子进行尺寸比较当结果被绘制出来之后,他发
2、现并非每一个子代都与父代一样,当结果被绘制出来之后,他发现并非每一个子代都与父代一样,相同的是,尺寸小的豌豆会得到更大的子代,而尺寸大的豌豆相同的是,尺寸小的豌豆会得到更大的子代,而尺寸大的豌豆却得到较小的子代却得到较小的子代高尔顿将此方法用到人类身上,他将父母和孩子的身高高尔顿将此方法用到人类身上,他将父母和孩子的身高转换成转换成z值,对比父母的身高与他们孩子的身高。他并值,对比父母的身高与他们孩子的身高。他并发现孩子们的发现孩子们的z值偏离均值的程度小于父母的偏离程度,值偏离均值的程度小于父母的偏离程度,即非常矮小的父母倾向于有偏高的孩子;而非常高大的即非常矮小的父母倾向于有偏高的孩子;而
3、非常高大的父母则倾向于有偏矮的孩子。它把这叫做对均值的父母则倾向于有偏矮的孩子。它把这叫做对均值的“回回归归”,这一发现构成了回归分析的基础,这一发现构成了回归分析的基础第一节第一节 相关与回归概述相关与回归概述有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。一、变量间的关系及分类一、变量间的关系及分类统计变量之间的关系,存在着两种不同的类型,统计变量之间的关系,存在着两种不同的类型,一种是函数关系,另一种是相关关系一种是函数关系,另一种是相关关系函数关系是指变量之间存在着的一种固定的、严格函数关系是
4、指变量之间存在着的一种固定的、严格的数量依存关系,即一个变量数值的变动,都会有的数量依存关系,即一个变量数值的变动,都会有另一个变量的数值与之完全对应另一个变量的数值与之完全对应相关关系是指变量之间存在着的一种非确定性的数相关关系是指变量之间存在着的一种非确定性的数量依存关系,即一个变量发生数值变化时,另一变量依存关系,即一个变量发生数值变化时,另一变量也相应地发生数值变化,但其数值是不固定的量也相应地发生数值变化,但其数值是不固定的太阳和地球的运动就是函数太阳和地球的运动就是函数你和你父亲之间就是相关你和你父亲之间就是相关不可能是函数,如是函数,他动一下胳膊,你就要动一下腿不可能是函数,如是
5、函数,他动一下胳膊,你就要动一下腿有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。二、相关分析的主要内容二、相关分析的主要内容相关分析是研究两个或两个以上的变量相关分析是研究两个或两个以上的变量之间相关程度及大小的一种统计方法之间相关程度及大小的一种统计方法其主要内容包括:其主要内容包括:1.确定现象之间是否存在相关关系,以及相确定现象之间是否存在相关关系,以及相关关系呈现的形态关关系呈现的形态2.确定相关关系的密切程度确定相关关系的密切程度3.相关系数的检验相关系数的检验有利于学习和创新的组织管理机
6、制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。三、回归分析的主要内容三、回归分析的主要内容回归分析是寻找存在相关关系的变量间的数学回归分析是寻找存在相关关系的变量间的数学表达式,并进行统计推断的一种统计方法表达式,并进行统计推断的一种统计方法主要内容包括:主要内容包括:.进行参数估计。即如何根据样本数据对回归模型进行参数估计。即如何根据样本数据对回归模型的参数进行估计,求出具体的回归方程的参数进行估计,求出具体的回归方程.进行显著性检验。即对回归方程、参数估计值进进行显著性检验。即对回归方程、参数估计值进行显著性检验与校正,以
7、便使回归方程或参数更加行显著性检验与校正,以便使回归方程或参数更加优良优良.进行预测和控制进行预测和控制四、相关与回归四、相关与回归相关仅判定变量之间是否存在关系相关仅判定变量之间是否存在关系(存在性)(存在性)这关系的大小、正确与否都是回归分析的内容这关系的大小、正确与否都是回归分析的内容(关系的具体表现)(关系的具体表现)有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。五、回归分析的分类五、回归分析的分类在对回归分析进行分类时,主要有两种分类方在对回归分析进行分类时,主要有两种分类方式式第一,根据
8、变量的数目,可以分类一元回归、多元第一,根据变量的数目,可以分类一元回归、多元回归回归第二,根据自变量与因变量的表现形式,分为线性第二,根据自变量与因变量的表现形式,分为线性与非线性与非线性所以,回归分析包括四个方向:一元线性回归分析、多元所以,回归分析包括四个方向:一元线性回归分析、多元线性回归分析、一元非线性回归分析、多元非线性回归分线性回归分析、一元非线性回归分析、多元非线性回归分析析我们把一元非线性回归分析和多元非线性回归分析合并为我们把一元非线性回归分析和多元非线性回归分析合并为曲线回归分析曲线回归分析第二节第二节 相关分析相关分析有利于学习和创新的组织管理机制,创造充满活力的创新激
9、励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。一、相关关系的分类一、相关关系的分类.按相关关系涉及因素的多少按相关关系涉及因素的多少单相关与复相关单相关与复相关.按相关关系的表现形式按相关关系的表现形式线性相关和非线性相关线性相关和非线性相关.按相关的方向按相关的方向正相关和负相关正相关和负相关4.按相关程度来分按相关程度来分完全相关、不完全相关和不相关(完全不相关)完全相关、不完全相关和不相关(完全不相关)对立、反义词对立、反义词有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放
10、又相互信任的合作环境。二、相关关系的度量二、相关关系的度量在进行相关分析时,可通过在进行相关分析时,可通过相关表相关表散点图散点图计算相关系数计算相关系数有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。相关表是根据现象变动样本资料编制出相关表是根据现象变动样本资料编制出来的反映变量间相关关系的统计表来的反映变量间相关关系的统计表散点图,是利用坐标系,将两变量相对散点图,是利用坐标系,将两变量相对应的变量值用坐标点形式描绘出来的二应的变量值用坐标点形式描绘出来的二维数据图维数据图有利于学习和创新的组织管
11、理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。三、相关系数三、相关系数相关表与散点图只能粗略的反映变量间相关表与散点图只能粗略的反映变量间相关关系的方向、形式和密切程度,要相关关系的方向、形式和密切程度,要确切地反映相关关系的密切程度,还需确切地反映相关关系的密切程度,还需计算相关系数计算相关系数相关系数有很多种形式,常用由卡尔相关系数有很多种形式,常用由卡尔.皮尔皮尔逊提出的相关系数逊提出的相关系数有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相
12、互信任的合作环境。1.相关系数的计算相关系数的计算相关系数用来度量的两个变量,设为相关系数用来度量的两个变量,设为x与与y根据总体数据计算的两个变量之间线性相关强根据总体数据计算的两个变量之间线性相关强度的统计量,叫做总体相关系数,用度的统计量,叫做总体相关系数,用表示表示根据样本计算的两个变量之间线性相关强度的根据样本计算的两个变量之间线性相关强度的统计量,叫做样本相关系数,简称相关系数,统计量,叫做样本相关系数,简称相关系数,用用r表示表示相关系数相关系数r的测定方法有两种,第一种称积差法,的测定方法有两种,第一种称积差法,第二种称简捷法第二种称简捷法r是是的一个估计量,得到的一个估计量,
13、得到是不可能的,需要是不可能的,需要用用r来估计来估计。另外,估计得到的值需要进行另外,估计得到的值需要进行检验检验有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。用积差法计算线性相关系数的公式为:用积差法计算线性相关系数的公式为: nyynxxnyyxxryxxy222)()()( 用简捷法计算相关系数的公式为:用简捷法计算相关系数的公式为: 2222)()(yynxxnyxxynr 在上式中,在上式中,r r 称为相关系数,称为相关系数,2xy称为协方称为协方差;差;x是变量是变量 x x 的标准
14、差;的标准差;y是变量是变量 y y 的标准的标准差。差。 可以看到,简捷法是积差法的简化、变形。可以看到,简捷法是积差法的简化、变形。 有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。【例【例10-1】根据抽样知,某企业销售额】根据抽样知,某企业销售额与流通费用的相关情况,如表与流通费用的相关情况,如表10-1,根,根据积差法与简捷法分别计算相关系数据积差法与简捷法分别计算相关系数r。年份(年)年份(年)销售额(万元)销售额(万元)流通费用(万元)流通费用(万元)199819981999199920
15、002000200120012002200220032003200420042005200520062006101016163232404074741201201971972462463453451.81.83.13.15.25.27.77.710.410.413.313.318.818.821.221.228.328.3有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。9891. 0944.648911160699 .8413)()()(222nyynxxnyyxxryxxy9891. 0)8 .10
16、9(19889)1080(24120698 .10910809 .215899)()(222222yynxxnyxxynr有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。2.相关系数的性质相关系数的性质第一、相关系数介于第一、相关系数介于1到到1之间之间第二、第二、r具有对称性,具有对称性,x与与y的相关系数和的相关系数和y与与x的相关系数相等的相关系数相等第三、第三、r的数值大小与的数值大小与x和和y的原点及尺度的原点及尺度无关无关有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为
17、导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。3.3.线性相关系数的分类线性相关系数的分类第一、根据第一、根据r r的数值分为正相关、负相关的数值分为正相关、负相关第二、根据第二、根据r r数值,分为完全相关、不完数值,分为完全相关、不完全相关、完全不相关全相关、完全不相关第三、根据第三、根据r r的数值,分为低度相关、中的数值,分为低度相关、中度相关、高度相关度相关、高度相关有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。四、相关系数显著性检验四、相关系数显著性检验相关系
18、数是根据样本数据计算出来的,相关系数是根据样本数据计算出来的,两个不相关的变量,其样本相关系数也两个不相关的变量,其样本相关系数也可能较高可能较高两个相关性很高的变量,其样本相关系两个相关性很高的变量,其样本相关系数也可能较低数也可能较低要从样本相关系数判断总体是否也具有这样要从样本相关系数判断总体是否也具有这样的关系,需要对相关系数进行假设检验的关系,需要对相关系数进行假设检验有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。在相关系数的显著性检验中,通常不采用正态在相关系数的显著性检验中,通常不采用
19、正态检验,而采用检验,而采用 t t 分布进行检验。假设检验的步分布进行检验。假设检验的步骤与第九章相同,但统计量采用骤与第九章相同,但统计量采用212rnrt,临,临界值为界值为)2(2nt,其中,其中 n n 为变量值的对数为变量值的对数 有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。【例【例10-2】某银行】某银行25个月的不良贷款与个月的不良贷款与贷款余额之间的相关系数贷款余额之间的相关系数r为为0.8436,在在0.05的显著性水平下,检验不良贷款的显著性水平下,检验不良贷款与贷款余额之间
20、的相关系数是否显著与贷款余额之间的相关系数是否显著有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。提出假设提出假设 0:0:10HH 给定显著性水平给定显著性水平 0.050.05 计算统计量计算统计量 5344. 78436. 012258436. 01222rnrt 求临界值求临界值 0687. 2)2(2nt 做出决策做出决策 02)2(Hntt拒绝原假设 所以,在所以,在 0.050.05 的显著性水平下,不良贷的显著性水平下,不良贷款与贷款余额之间高度相关款与贷款余额之间高度相关 第三节第三
21、节 一元线性回归分析一元线性回归分析有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。一、一元线性回归模型一、一元线性回归模型1.回归模型的一般形式回归模型的一般形式对于具有线性关系的两个变量,可以用一个对于具有线性关系的两个变量,可以用一个方程来表示它们之间的线性关系方程来表示它们之间的线性关系描述因变量描述因变量y如何依赖于自变量如何依赖于自变量x和误差项和误差项的方程称为回归模型。对于只涉及一个自变的方程称为回归模型。对于只涉及一个自变量的一元线性回归模型可表示为量的一元线性回归模型可表示为xy1
22、0有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。y叫做因变量或被解释变量,叫做因变量或被解释变量,x叫做自变量叫做自变量或解释变量,或解释变量,0表示截距,表示截距,1表示斜率,表示斜率,10、都被称作总体参数,都被称作总体参数,表示误差项,反表示误差项,反映除映除 x x 和和 y y 之间的线性关系之外的随机因素对之间的线性关系之外的随机因素对y y 的影响,是不能由的影响,是不能由 x x 和和 y y 之间的线性关系所之间的线性关系所解释的变异性。解释的变异性。 有利于学习和创新的组织管理机
23、制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。3.回归方程回归方程描述因变量描述因变量y的期望值如何依赖于自变量的期望值如何依赖于自变量x的方程称为回归方程。根据对一元线性回归的方程称为回归方程。根据对一元线性回归模型的假设,可以得到它的回归方程为模型的假设,可以得到它的回归方程为xyE10)(有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。4.估计的回归方程估计的回归方程如果回归方程中的参数已知,对于一个给定如果回归方程中的参数已知
24、,对于一个给定的的x值,利用回归方程就能计算出值,利用回归方程就能计算出y的期望的期望值值用样本统计量代替回归方程中的未知参数用样本统计量代替回归方程中的未知参数 ,就得到估计的回归方程,简称回归直线就得到估计的回归方程,简称回归直线xy10有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。二、参数估计与预测二、参数估计与预测1.参数的最小二乘法估计参数的最小二乘法估计对于回归直线,关键在于求解参数对于回归直线,关键在于求解参数常用高斯提出的最小二乘法,也叫做最小平常用高斯提出的最小二乘法,也叫做最小平
25、方法,它是使因变量的观察值方法,它是使因变量的观察值y与估计值之与估计值之间的离差平方和达到最小来求解间的离差平方和达到最小来求解2102)() (xyyyQy2221010221202xyxxnyQ展开,21010yyxxxxnxyxxnxxn10221)(yy有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。根据统计,根据统计,70年代世界制造业总产量与世界制成年代世界制造业总产量与世界制成品总出口量的变化关系如表品总出口量的变化关系如表10-2。求回归直线。求回归直线年年 度度总产量年增长率总产量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 相关 回归 分析 ppt 课件
限制150内