统计学-相关分析与回归分析.ppt
第第6章章 相关分析与回归分析相关分析与回归分析第第6章章 相关分析与回归分析相关分析与回归分析主要内容主要内容:6.1 6.1 相关分析概述相关分析概述6.2 6.2 相关关系的测度相关关系的测度6.3 6.3 回归分析的基本问题回归分析的基本问题6.4 6.4 简单线性回归分析简单线性回归分析6.5 6.5 多元线性回归分析多元线性回归分析6.6 6.6 非线性回归分析非线性回归分析6.7 6.7 使用使用SPSSSPSS进行相关分析和回归分析举例进行相关分析和回归分析举例 第第6章章 相关分析与回归分析相关分析与回归分析 6.1 相关分析概述相关分析概述1.函数关系函数关系2.相关关系相关关系 (1)相关关系是指现象之间确实存在数量上的)相关关系是指现象之间确实存在数量上的相互依存关系。相互依存关系。(2)现象之间数量依存关系的具体关系值不是)现象之间数量依存关系的具体关系值不是固定的。固定的。6.1.1 变量之间的关系变量之间的关系第第6章章 相关分析与回归分析相关分析与回归分析 6.1 相关分析概述相关分析概述1、按相关关系的程度划分,可分为完全相关、按相关关系的程度划分,可分为完全相关、不完全相关和不相关不完全相关和不相关 2、按相关形式划分,可以分为线性相关和非线、按相关形式划分,可以分为线性相关和非线性相关性相关3、按相关的方向划分,可分为正相关和负相关、按相关的方向划分,可分为正相关和负相关4、按相关关系涉及的因素多少划分,分为单相、按相关关系涉及的因素多少划分,分为单相关、复相关和偏相关关、复相关和偏相关6.1.2 相关关系的分类相关关系的分类第第6章章 相关分析与回归分析相关分析与回归分析 6.1 相关分析概述相关分析概述6.1.2 相关关系的分类相关关系的分类表表6.1 6.1 销售额与流通费用相关销售额与流通费用相关第第6章章 相关分析与回归分析相关分析与回归分析 6.2 相关关系的测度相关关系的测度6.2.1 相关表相关表年份(年)年份(年)销销售售额额(万元)(万元)流通流通费费用(万元)用(万元)1998199810101.81.81999199916163.13.12000200032325.25.22001200140407.77.720022002747410.410.42003200312012013.313.32004200419719718.818.82005200524624621.221.22006200634534528.328.3第第6章章 相关分析与回归分析相关分析与回归分析 6.2 相关关系的测度相关关系的测度6.2.2 相关图相关图 相关系数是用来说明变量之间在线性相关条件下相关系数是用来说明变量之间在线性相关条件下相关关系密切程度和方向的统计分析指标。相关相关关系密切程度和方向的统计分析指标。相关程度的大小与计量单位无关,所以相关系数是无程度的大小与计量单位无关,所以相关系数是无量纲的数量。量纲的数量。第第6章章 相关分析与回归分析相关分析与回归分析 6.2 相关关系的测度相关关系的测度6.2.3 相关系数相关系数 设变量设变量x,y的的n对观测值为对观测值为(x1,y1),(xn,yn),皮尔,皮尔逊逊相关系数为相关系数为6章章 相关分析与回归分析相关分析与回归分析 6.2 相关关系的测度相关关系的测度 6.2.3 相关系数相关系数1、简单线性相关系数、简单线性相关系数皮尔逊相关系数计算皮尔逊相关系数计算6章章 相关分析与回归分析相关分析与回归分析 6.2 相关关系的测度相关关系的测度 6.2.3 相关系数相关系数1、简单线性相关系数简单线性相关系数皮尔逊相关系数例皮尔逊相关系数例 销售额销售额Pearson Correlation1.989Sig.(2-tailed).000N99流通费用流通费用Pearson Correlation.9891Sig.(2-tailed).000N996章章 相关分析与回归分析相关分析与回归分析 6.2 相关关系的测度相关关系的测度 6.2.3 相关系数相关系数1、简单线性相关系数简单线性相关系数皮尔逊相关系数的意义皮尔逊相关系数的意义 6章章 相关分析与回归分析相关分析与回归分析 6.2 相关关系的测度相关关系的测度 6.2.3 相关系数相关系数1、简单线性相关系数简单线性相关系数相关系数的显著性检验相关系数的显著性检验 6章章 相关分析与回归分析相关分析与回归分析 6.2 相关关系的测度相关关系的测度 6.2.3 相关系数相关系数1、简单线性相关系数简单线性相关系数相关系数的显著性检验相关系数的显著性检验 提出假提出假设设:计计算算检验检验的的统计统计量:量:作出决策:作出决策:第一步:定等级。将变量第一步:定等级。将变量x,y的观测值按照顺序定出等级,形的观测值按照顺序定出等级,形成两个序数数列,如果有相等的数值时,则按原有的等级成两个序数数列,如果有相等的数值时,则按原有的等级求其平均数,作为这些观测值的等级。求其平均数,作为这些观测值的等级。例如,某公司例如,某公司6位员工按学历高低排列分别为:硕士、本位员工按学历高低排列分别为:硕士、本科、本科、本科、专科、专科。科、本科、本科、专科、专科。其中其中3个本科原来应该列为第个本科原来应该列为第2、3、4等级,平均数为等级,平均数为3,2个专科原来应该列为第个专科原来应该列为第5、6等级,平均数为等级,平均数为5.5,因此这,因此这6个人的学历等级可以定为:个人的学历等级可以定为:1、3、3、3、5.5、5.5。6章章 相关分析与回归分析相关分析与回归分析 6.2 相关关系的测度相关关系的测度 6.2.3 相关系数相关系数2、等级相关系数、等级相关系数斯皮尔曼相关系数斯皮尔曼相关系数 计算步骤:计算步骤:第二步:计算第二步:计算x和和y两个序数数列的每对观测值的等两个序数数列的每对观测值的等级之差,记作级之差,记作D,D=x-y;第三步:按下述公式计算相关系数:第三步:按下述公式计算相关系数:6章章 相关分析与回归分析相关分析与回归分析 6.2 相关关系的测度相关关系的测度 6.2.3 相关系数相关系数2、等级相关系数、等级相关系数斯皮尔曼相关系数斯皮尔曼相关系数 计算步骤:计算步骤:6章章 相关分析与回归分析相关分析与回归分析 6.2 相关关系的测度相关关系的测度 6.2.3 相关系数相关系数2、等级相关系数、等级相关系数斯皮尔曼相关系数斯皮尔曼相关系数 例题:例题:员员工工序序号号学学历历等等级级x能能力力考考核核等等级级yD=D=x x-y yD21 1硕硕士士1 1良良好好2.2.5 5-1 1.5 52.2.2 25 52 2本本科科3 3良良好好2.2.5 50.0.5 50.0.2 25 53 3本本科科3 3优优秀秀1 12 24 44 4本本科科3 3一一般般4.4.5 5-1 1.5 52.2.2 25 55 5专专科科5.5.5 5一一般般4.4.5 51 11 16 6专专科科5.5.5 5较较差差6 6-0 0.5 50.0.2 25 5合合计计 212121210 01 10 06.3.1 回归分析的概念与分类回归分析的概念与分类 回归分析的特点回归分析的特点回归分析的类型回归分析的类型 相关分析与回归分析相关分析与回归分析 (1)描述的方式不同)描述的方式不同 (2)变量的地位不同)变量的地位不同 (3)描述的内容不同)描述的内容不同 (4)变量的性质不同)变量的性质不同第第6章章 相关分析与回归分析相关分析与回归分析 6.3 回归分析的基本问题回归分析的基本问题6.3.1 回归分析的概念与分类回归分析的概念与分类 回归分析,是指在相关分析的基础上,把变量之间的具体变回归分析,是指在相关分析的基础上,把变量之间的具体变动关系模型化,求出关系方程式,就是找出一个能够反映动关系模型化,求出关系方程式,就是找出一个能够反映变量间变化关系的函数关系式,并据此进行估计和推算。变量间变化关系的函数关系式,并据此进行估计和推算。通过回归分析,可以将相关变量之间不确定、不规则的数通过回归分析,可以将相关变量之间不确定、不规则的数量关系一般化、规范化。从而可以根据自变量的某一个给量关系一般化、规范化。从而可以根据自变量的某一个给定值推断出因变量的可能值(或估计值)。定值推断出因变量的可能值(或估计值)。回归分析包括多种类型,可分为简单回归和多元回归回归分析包括多种类型,可分为简单回归和多元回归,也可,也可分为线性回归和非线性回归。分为线性回归和非线性回归。第第6章章 相关分析与回归分析相关分析与回归分析 6.3 回归分析的基本问题回归分析的基本问题6.3.2 相关分析与回归分析相关分析与回归分析第第6章章 相关分析与回归分析相关分析与回归分析 6.3 回归分析的基本问题回归分析的基本问题(1)描述的方式不同)描述的方式不同(2)变量的地位不同)变量的地位不同(3)描述的内容不同)描述的内容不同(4)变量的性质不同)变量的性质不同第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析6.4.1 总体回归模型总体回归模型例:某城市某月家庭可支配收入和消费支出数据如下表(元)例:某城市某月家庭可支配收入和消费支出数据如下表(元)可支配收入可支配收入x15002000250030003500各家庭各家庭消消费费支出支出y10201220142015901810105012001390158017709801180140016201800990119013701610178010101210141016001820平均支出平均支出10001200140016001800第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析6.4.1 总体回归模型总体回归模型某城市某月家庭可支配收入和消费支出数据散点图某城市某月家庭可支配收入和消费支出数据散点图第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析6.4.1 总体回归模型总体回归模型xx1x2x3x4x515002000250030003500E(y/x)E(y/x1)E(y/x2)E(y/x3)E(y/x4)E(y/x5)10001200140016001800表6.4 不同收入下平均消费支出的数据 第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析6.4.1 总体回归模型总体回归模型第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析6.4.1 总体回归模型总体回归模型条件期望表现形式:条件期望表现形式:个别值表现形式:个别值表现形式:6.4.2 样本回归模型和基本假设样本回归模型和基本假设第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析样本回归模型:样本回归模型:基本假设:基本假设:6.4.2 样本回归模型和基本假设样本回归模型和基本假设第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析图图6.4 6.4 总体回归函数和样本回归函数关系图总体回归函数和样本回归函数关系图6.4.3 回归模型的参数估计回归模型的参数估计 第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析设变量设变量x,y的的n对观测值为对观测值为(x1,y1),(xn,yn).参数的估计通常采用最小二乘法参数的估计通常采用最小二乘法 6.4.3 回归模型的参数估计回归模型的参数估计 第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析图图6.5 6.5 回归参数估计中偏差回归参数估计中偏差第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析例例下表是家庭收入和消费支出的样本数据,试建立简单线下表是家庭收入和消费支出的样本数据,试建立简单线性回归模型。性回归模型。家庭收入家庭收入15002000250030003500消消费费支出支出10201190141016201810第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析例中数据散点图例中数据散点图CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd.ErrorBeta1(Constant)405.00023.04317.576.000X.402.009.99945.324.000a.Dependent Variable:Y第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析参数估计结果:参数估计结果:第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析一元线性回归模型为:一元线性回归模型为:以上模型表明,家庭收入每增加以上模型表明,家庭收入每增加1千元,千元,消费支出平均增加消费支出平均增加0.402千元。千元。第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析6.4.4 回归模型的检验回归模型的检验1、拟合优度的度量、拟合优度的度量 可决系数(判定系数)可决系数(判定系数)第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析6.4.4 回归模型的检验回归模型的检验1、拟合优度的度量、拟合优度的度量 可决系数(判定系数)可决系数(判定系数)判定系数是指回归离差平方和占总离差平方和的比重,即:判定系数是指回归离差平方和占总离差平方和的比重,即:第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析6.4.4 回归模型的检验回归模型的检验2、回归方程的显著性检验、回归方程的显著性检验第一步:提出假设第一步:提出假设 第二步:计算检验统计量第二步:计算检验统计量F 第三步:确定显著性水平以及临界值第三步:确定显著性水平以及临界值F 第四步:做出判断第四步:做出判断 ANOVAbModelSum of SquaresdfMean quareFSig.1Regression4040101404010.2.054E3.000aResidual5903196.667Total4046004a.Predictors:(Constant),Xb.Dependent Variable:Y第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析6.4.4 回归模型的检验回归模型的检验2、回归方程的显著性检验回归方程的显著性检验表表6.6 6.6 回归方程显著性检验分析表回归方程显著性检验分析表第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析简单线性回归的应用之一简单线性回归的应用之一预测预测个别值的预测区间为:个别值的预测区间为:第第6章章 相关分析与回归分析相关分析与回归分析 6.4 简单线性回归分析简单线性回归分析简单线性回归的应用之一简单线性回归的应用之一预测预测第第6章章 相关分析与回归分析相关分析与回归分析 6.多元线性回归分析多元线性回归分析6.5.1 6.5.1 总体回归模型和样本回归函数总体回归模型和样本回归函数 第第6章章 相关分析与回归分析相关分析与回归分析 6.多元线性回归分析多元线性回归分析6.5.1 6.5.1 总体回归模型和样本回归函数总体回归模型和样本回归函数 6.5.2 多元线性回归的基本假设和参数估计多元线性回归的基本假设和参数估计第第6章章 相关分析与回归分析相关分析与回归分析 6.多元线性回归分析多元线性回归分析参数的估计仍采用最小二乘法,具体地:参数的估计仍采用最小二乘法,具体地:6.5.2 多元线性回归的基本假设和参数估计多元线性回归的基本假设和参数估计第第6章章 相关分析与回归分析相关分析与回归分析 6.多元线性回归分析多元线性回归分析6.5.3 多元线性回归模型的检验多元线性回归模型的检验第第6章章 相关分析与回归分析相关分析与回归分析 6.多元线性回归分析多元线性回归分析1 1、拟合优度检验、拟合优度检验SST=SSE+SSR 可决系数:可决系数:调整可决系数:调整可决系数:6.5.3 多元线性回归模型的检验多元线性回归模型的检验第第6章章 相关分析与回归分析相关分析与回归分析 6.多元线性回归分析多元线性回归分析2、回归方程的显著性检验、回归方程的显著性检验F检验检验差异来源差异来源平方和平方和自由度自由度均方均方F统计统计量量F临临界界值值Sig.(P)回回归归SSRmMSR MSR/MSE剩余剩余SSEn-m-1 MSE总总和和SSTn-16.5.3 多元线性回归模型的检验多元线性回归模型的检验第第6章章 相关分析与回归分析相关分析与回归分析 6.多元线性回归分析多元线性回归分析3.3.回归参数的显著性检验回归参数的显著性检验tt检验检验是是 的主对角线元素的主对角线元素 6.5.4 多元线性回归预测模型多元线性回归预测模型第第6章章 相关分析与回归分析相关分析与回归分析 6.多元线性回归分析多元线性回归分析6.5.5 多元线性回归变量的筛选多元线性回归变量的筛选第第6章章 相关分析与回归分析相关分析与回归分析 6.多元线性回归分析多元线性回归分析1、向前筛选策略、向前筛选策略2、向后筛选策略、向后筛选策略3、逐步筛选策略、逐步筛选策略第第6章章 相关分析与回归分析相关分析与回归分析 6.6 非线性回归分析非线性回归分析6.6.1 6.6.1 非线性回归分析的一般问题非线性回归分析的一般问题表示双变量间关系的曲线种类很多,但许多曲线类表示双变量间关系的曲线种类很多,但许多曲线类型都可以通过变量转换化成直线形式,先利用直线型都可以通过变量转换化成直线形式,先利用直线回归的方法配合直线回归方程,然后再还原成曲线回归的方法配合直线回归方程,然后再还原成曲线回归方程。回归方程。第第6章章 相关分析与回归分析相关分析与回归分析 6.6 非线性回归分析非线性回归分析6.6.1 6.6.1 非线性回归分析的一般问题非线性回归分析的一般问题例例双曲线函数双曲线函数:图6.8 双曲线函数图形第第6章章 相关分析与回归分析相关分析与回归分析 6.6 非线性回归分析非线性回归分析6.6.2 举例举例:人均消费支出与教育支出数据表人均消费支出与教育支出数据表 年份年份人均消费性支出(元)人均消费性支出(元)教育支出(元)教育支出(元)19901627.6438.2419911854.2247.9119922203.657.5619933138.5671.0019944442.09153.9819955565.68194.6219966544.73307.9519977188.71419.1919987911.94542.7819997493.31556.9320007997.37656.2820019463.071091.8520029396.451062.13第第6章章 相关分析与回归分析相关分析与回归分析 6.6 非线性回归分析非线性回归分析举例举例第第6章章 相关分析与回归分析相关分析与回归分析 6.6 非线性回归分析非线性回归分析举例举例选择经验函数为复合函数:选择经验函数为复合函数: