统计学第7章相关与回归分析幻灯片.ppt
统计学第统计学第7 7章相关与回归分析章相关与回归分析第1页,共94页,编辑于2022年,星期二第第7章章 相关与回归分析相关与回归分析7.17.1 变量间关系的度量变量间关系的度量变量间关系的度量变量间关系的度量 7.2 一元线性回归一元线性回归一元线性回归一元线性回归7.3 7.3 利用回归方程进行估计和预测利用回归方程进行估计和预测利用回归方程进行估计和预测利用回归方程进行估计和预测7.4 7.4 多元线性回归分析多元线性回归分析第2页,共94页,编辑于2022年,星期二学习目标学习目标1.相关系数的分析方法相关系数的分析方法2.线性回归的基本原理和参数的最小二乘线性回归的基本原理和参数的最小二乘估计估计3.回归直线的拟合优度回归直线的拟合优度4.回归方程的显著性检验回归方程的显著性检验5.利用回归方程进行估计和预测利用回归方程进行估计和预测6.用用 Excel 进行回归进行回归第3页,共94页,编辑于2022年,星期二7.1 变量间关系的度量变量间关系的度量一一.变量间的关系变量间的关系二二.相关关系的描述与测度相关关系的描述与测度第4页,共94页,编辑于2022年,星期二变量间的关系变量间的关系第5页,共94页,编辑于2022年,星期二函数关系函数关系1.是一一对应的确定关系对应的确定关系2.2.设设有两个变量 x 和和 y y,变变量量 y y 随变量 x x 一一起起变变化化,并并完完全全依依赖赖于于 x ,当当变变量量 x x 取取某某个个数数值值时时,y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y y =f(x x),其其中中 x x 称称为为自自变变量量,y y 称为因变量称为因变量3.3.各各观测点落在一条线上观测点落在一条线上 x xy y第6页,共94页,编辑于2022年,星期二函数关系函数关系(几个例子几个例子)函数关系的例子函数关系的例子 某某种种商商品品的的销销售售额额(y y)与与销销售售量量(x x)之之间间的的关关系系可可表表示示为为 y=px px(p p 为单价为单价)圆的面积圆的面积(S)(S)与半径之间的关系可表示为与半径之间的关系可表示为S S=R R2 2 企企业业的的原原材材料料消消耗耗额额(y y)与产量(x x1 1)、单单位位产产量量消消耗耗(x x2 2)、原材料价格(x x3 3)之之间间的的关关系系可可表表示示为为y y=x x1 1 x x2 2 x x3 第7页,共94页,编辑于2022年,星期二相关关系相关关系(correlation)1.1.变变量量间间关关系系不不能能用用函函数数关关系系精确表达精确表达2.一个变量的取值不能由另一个变量唯一确定3.当变量 x x 取取某某个个值值时时,变变量量 y 的取值可能有几个的取值可能有几个4.4.各观测各观测点分布在直线周围点分布在直线周围 x xy y第8页,共94页,编辑于2022年,星期二相关关系相关关系(几个例子几个例子)相关关系的例子相关关系的例子 父亲身高父亲身高(y y)与子女身高与子女身高(x x)之间的关系 收入水平收入水平(y y)与受教育程度与受教育程度(x x)之间的关系之间的关系 粮粮食食亩亩产产量量(y y)与与施施肥肥量量(x1 1)、降降雨雨量量(x x2 2)、温温度度(x x3 3)之间的关系之间的关系 商品的消费量商品的消费量(y y)与居民收入(x x)之间的关系 商品销售额商品销售额(y y)与广告费支出(x x)之间的关系之间的关系第9页,共94页,编辑于2022年,星期二相关关系相关关系(类型类型)第10页,共94页,编辑于2022年,星期二相关关系的描述与测度相关关系的描述与测度(散点图散点图)第11页,共94页,编辑于2022年,星期二散点图散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 第12页,共94页,编辑于2022年,星期二散点图散点图(例题分析例题分析)【例例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增加,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行20022002年的有关业务数据 第13页,共94页,编辑于2022年,星期二散点图散点图(例题分析例题分析)第14页,共94页,编辑于2022年,星期二散点图散点图(例题分析例题分析)第15页,共94页,编辑于2022年,星期二相关关系的描述与测度相关关系的描述与测度(相关系数相关系数)第16页,共94页,编辑于2022年,星期二相关系数相关系数(correlation coefficient)1.对变量之间关系密切程度的度量2.对两个变量之间线性相关程度的度量称为简单相关系数3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4.若是根据样本数据计算的,则称为样本相关系数,记为 r第17页,共94页,编辑于2022年,星期二相关系数相关系数 (计算公式计算公式)样本相关系数的计算公式第18页,共94页,编辑于2022年,星期二相关系数相关系数(取值及其意义取值及其意义)1.1.r r 的取值范围的取值范围是-1,12.2.|r r|=|=1 1,为完全相关n nr r=1 1,为完全正相关,为完全正相关n nr r=-1-1,为完全负相关,为完全负相关3.3.r r=0=0,不存在不存在线性线性线性线性相关相关关系相关关系相关4.-1 r r 0 0,为负相关为负相关5.5.0 F F,拒绝H H0;若FF,拒绝H0 0,线性关系显著第51页,共94页,编辑于2022年,星期二线性关系检验线性关系检验(方差分析表方差分析表)Excel 输出的方差分析表输出的方差分析表第52页,共94页,编辑于2022年,星期二回归系数检验回归系数检验3.在一元线性回归中,等价于线性关系的显著性检验1.检验 x 与 y 之间是否具有线性关系,或者说,检验自变量 x 对因变量 y 的影响是否显著2.理论基础是回归系数 的抽样分布第53页,共94页,编辑于2022年,星期二回归系数检验回归系数检验(检验步骤检验步骤)1.1.提出假设提出假设n nH H0 0:1 1=0(=0(没有线性关系没有线性关系)n nH H1 1:1 1 0(0(有线性关系有线性关系)2.2.计算检验的统计量计算检验的统计量3.3.确定显著性水平确定显著性水平,并进行决策,并进行决策 t t t t,拒绝,拒绝H H0 0;t t =7.533515t t=2.201,拒绝H H0 0,表明不不良良贷贷款款与与贷款余额之间有线性关系贷款余额之间有线性关系第55页,共94页,编辑于2022年,星期二回归系数检验回归系数检验(例题分析例题分析)P 值的应用值的应用P P=0.000000=0.000000 F F ,拒绝,拒绝H H0Excel Excel 输出结输出结输出结输出结果的分析果的分析果的分析果的分析第88页,共94页,编辑于2022年,星期二回归系数检验和推断回归系数检验和推断第89页,共94页,编辑于2022年,星期二回归系数的检验回归系数的检验1.线线性性关关系系检检验验通通过过后后,对对各各个个回回归归系系数数有有选选择择地地进进行一次或多次检验行一次或多次检验2.究竟要对哪几个回归系数进行检验,通常需要在建立模型之前作出决定3.对回归系数检验的个数进行限制,以避免犯过多的第一类错误(弃真错误弃真错误)4.对每一个自变量都要单独进行检验对每一个自变量都要单独进行检验5.应用 t t 检验统计量第90页,共94页,编辑于2022年,星期二回归系数的检验回归系数的检验(步骤步骤)1.提出假设提出假设n nH H0 0:i i=0 (=0 (自变量自变量 x xi i 与与 因变量因变量 y y 没有线性关系没有线性关系)n nH H1 1:i i 0 (0 (自变量自变量 x xi i 与与 因变量因变量 y y有线性关系有线性关系)2.计算检验的统计量计算检验的统计量 t3.确定显著性水平,并进行决策,并进行决策 t t t t,拒绝,拒绝H H0 0;t t t t,不能拒绝,不能拒绝H H0 0Excel Excel 输出结输出结输出结输出结果的分析果的分析果的分析果的分析第91页,共94页,编辑于2022年,星期二回归系数的推断回归系数的推断 (置信区间置信区间)回归系数在(1-)%置信水平下的置信区间为 回归系数的抽回归系数的抽样标准差样标准差Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析第92页,共94页,编辑于2022年,星期二本章小结本章小结1.变量间关系的度量变量间关系的度量2.回归模型、回归方程与估计的回归方程回归模型、回归方程与估计的回归方程3.回归方程的拟合优度回归方程的拟合优度4.回归分析中的显著性检验回归分析中的显著性检验5.估计和预测估计和预测6.用用Excel 进行回归分析进行回归分析第93页,共94页,编辑于2022年,星期二结结 束束第94页,共94页,编辑于2022年,星期二