决策与预测精选PPT.ppt
《决策与预测精选PPT.ppt》由会员分享,可在线阅读,更多相关《决策与预测精选PPT.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、决策与预测课件第1页,此课件共54页哦一、一、回归的由来1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式下图是根据1078个家庭的调查所作的散点图(略图)第2页,此课件共54页哦160165170175180185140150160170180190200YX儿子们身高向着平均身高“回归”,以保持种族的稳定第3页,此课件共54页哦“回归”一词的由来v从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下:v如此以来,高的越来越
2、高,矮的越来越矮。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”见1889年F.Gallton的论文普用回归定律。v后人将此种方法普遍用于寻找变量之间的规律 第4页,此课件共54页哦二、回归的定义 回归是研究自变量与因变量之间的关系形式的分析方法,其目的在于根据已知自变量值来估计因变量的总体平均值。在研究某一社会经济现象的发展变化规律时,经过分析可以找到影响这一现象变化的原因。在回归分析中,把某一现象称为因变量,它是预测的对象,把引起这一现象变化的因素称为自变量,它是引起这一现象变化的原因。而因变量则反映了自变量变化的结果
3、。第5页,此课件共54页哦回归自变量与因变量之间的因果关系可以通过函数形式来表现,用数学模型来体现两者之间的数量关系。自变量的值是确定的,而因变量的值是随机的。回归函数中,确定的自变量值所对应的是随机的因变量值的总体平均值。第6页,此课件共54页哦三、回归模型的分类三、回归模型的分类1.按模型中自变量的多少,分为一元回归模型和多元回归模型。一元回归模型是指只包含一个自变量的回归模型;多元回归模型是指包含两个或两个以上自变量的回归模型。第7页,此课件共54页哦2.按模型中自变量与因变量之间是否线性v分为线性回归模型和非线性回归模型。线性回归模型是指自变量与因变量之间呈线性关系;v非线性回归模型是
4、指自变量与因变量之间呈非线性关系。第8页,此课件共54页哦3.按模型中方程数目的多少v分为单一方程模型和联立方程模型。v单一方程模型是指只包含一个方程的回归模型;联立方程模型是指包含两个或两个以上方程的回归模型。v单一方程的一元线性回归分析是其它回归分析的基础,本章将主要介绍一元线性回归预测法。第9页,此课件共54页哦第二节第二节 一元线性回归预测法一元线性回归预测法一元线性回归预测法是根据一元线性回归模型中单一自变量的变动来预测因变量平均发展趋势的方法。第10页,此课件共54页哦一、一元线性回归模型一、一元线性回归模型v若用X代表自变量,Y代表因变量。则给定一个自变量的值Xi时,对于一元线性
5、回归模型就有一个因变量的总体平均值E(Yi)与它对应,其函数关系可写成E(Yi)=f(Xi),它表明Y的总体平均值是随着X的变化而变化的。该函数亦称为总体回归函数。第11页,此课件共54页哦一元线性回归模型的基本形式为:一元线性回归模型的基本形式为:vE(Yi)=0+1Xi (3-1)v或 Yi=E(Yi)+ui=0+1Xi+ui (3-2)v其中0、1是未知而固定的参数,称为回归系数,ui称为随机扰动项。v在回归分析中,我们要根据Y和X的观测值来估计未知的0和1的值,进而建立回归模型。第12页,此课件共54页哦回归模型回归模型v通常我们是通过Y和X的样本观测值建立样本回归函数来估计参数的。第
6、13页,此课件共54页哦一元线性回归样本函数第14页,此课件共54页哦回归模型回归模型v对于样本中每一个与Xi相对的观测值Yi与由样本回归函数得到的估计值有一随机偏差,这个偏差称为样本剩余,记为ei。第15页,此课件共54页哦样本回归函数第16页,此课件共54页哦回归模型回归模型v回归分析就是要根据样本回归函数来估计总体回归函数。v在这里需要解决的问题主要有两个:v其一是估计参数;v其二是“接近”的程度有多大。第17页,此课件共54页哦二、最小二乘估计二、最小二乘估计v建立样本回归函数的方法有许多,其中最流行的是最小二乘法(OLS)。v1.最小二乘准则v2.最小二乘估计式第18页,此课件共54
7、页哦1.最小二乘准则v当给定样本X和Y的N对观测值时,我们希望据此建立的样本回归函数值应尽可能接近观测值Yi,使其样本剩余的平方和尽可能地小,即ei2min。这一准则就是最小二乘准则。第19页,此课件共54页哦 Y Yi e .0 Xi X 第20页,此课件共54页哦2.最小二乘估计式v根据最小二乘准则建立样本回归函数的过程为最小二乘估计,简记OLS估计。v由此得到的估计值得计算式称为最小二乘估计式。第21页,此课件共54页哦双变量线性回归模型的最小二乘估计第22页,此课件共54页哦双变量线性回归模型的最小二乘估计v由最小二乘准则:ei2minv有:第23页,此课件共54页哦第24页,此课件共
8、54页哦双变量线性回归模型的最小二乘估计式第25页,此课件共54页哦记 X,Y的平均数则得第26页,此课件共54页哦或 记:记:三、相关系数 1离差平方和的分解 在一元线性回归模型中,观察值yi的取值大小是上下波动的,这种波动现象称为变差。变差的产生是由两方面原因引起的:(1)受自变量变动的影响,即x取值的不同;(2)其他因素(包括观察和实践中产生的误差)影响。为了分析这两方面的影响,需要对总变差进行分解。第27页,此课件共54页哦三、相关系数一、总离差平方和分解 回归直线 =+X =回归直线解释的部分 Yi =ei 实际与回归值之残差 Yi =(Yi )+()越大,ei 越小说明回归直线与样
9、本点拟合得好。YYiiYY O Xi Xie=来自残差(YiY)=总离差 来自回归第28页,此课件共54页哦三、相关系数 对每一个观察值来说,变差的大小可以通过该观察值yi与其算术平均数y y-的离差yi-y y-来表示,而全部n次观察值的总变差可由这些离差的平方和来表示:即:总变差剩余变差回归变差(可记为TSS=RSS+ESS)等式右边的第二项Q2称为回归变差(或称回归平方和),它是通过x与y的线性关系由自变量x的变动而引起的;等式右边的第一项Q1称为剩余变差(或称残差平方和),它是由观察和实验中产生的误差以及其他未加控制的因素引起的。第29页,此课件共54页哦2.可决系数R2=ESS/TS
10、S 可决系数护的大小表明了在Y的总变差中由自变量x变动所引起的百分比,它是评价两个变量之间线性相关关系强弱的一个重要指标。根据上述定义,有:第30页,此课件共54页哦3相关系数R 相关系数是可决系数的平方根,它是一元线性回归模型中用来衡量两个变量之间相关程度的重要指标。相关系数有两种定义方法:(1)根据总变差定义:(2)根据积差法定义:所以,根据积差法定义的相关系数为第31页,此课件共54页哦3相关系数R 由于根据积差法定义的相关系数不需要先求回归模型的剩余变差,可以直接从样本数据中计算得到,所以在实际工作中用得较为广泛。用积差法计算相关系数计算量比较大,因此,根据平均数的数学性质可将其简化为
11、:从上述定义可以看出,相关系数的取值范围为一1R 1,相关系数为正值表示两变量之间为正相关;相关系数为负值表示两变量之间为负相关。相关系数R的绝对值的大小表示相关程度的高低。当R=0时,说明回归变差为0,自变量x的变动对总变差毫无影响,这种情况称为零相关。当R1时,说明回归变差等于总变差,总变差的变化完全由自变量x的变化所引起,这种情况称为完全相关。这时自变量x与因变量y的关系已转化为函数关系。当0 R 1时,说明自变量x的变动对总变差有部分影响,这种情况称为普通相关。其中,R的绝对值愈大,表示相关程度愈高。一般情况下,当R0.7,即R20.49时,说明自变量x的变动对总变差的影响占一半以上,
12、故称为高度相关;当R 0.3,即R2 0.09时,说明自变量x的变动对总变差的影响少于9%,故称为低度相关;当0.3 R2 R 0.7时,说明自变量x的变动对总变差的影响程度在9%一50%之间,故称为中度相关。第32页,此课件共54页哦例1:某地区某企业近8年产品广告投入费和月平均销售额相关情况如表1所示 表1 广告投入费和月平均销售额相关表年份 199719981999200020012002200320041.22.03.13.85.06.17.28.062086080011001150132013501600第33页,此课件共54页哦v I wish vyou all have a ha
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 决策 预测 精选 PPT
限制150内