第四章回归技术与需求估计精选PPT.ppt
《第四章回归技术与需求估计精选PPT.ppt》由会员分享,可在线阅读,更多相关《第四章回归技术与需求估计精选PPT.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章回归技术与需求估计第1页,此课件共65页哦 一、回归技术一、回归技术1.估计系数估计系数表表4-1 4-1 假设的总成本和总产量数据假设的总成本和总产量数据生产期生产期总成本(总成本(YiYi)总产量(总产量(XiXi)1100 02150 531608424010523015637023741025第2页,此课件共65页哦总成本、总产量和估计的回归方程总成本、总产量和估计的回归方程第3页,此课件共65页哦 统计学家告诉我们,对现行函数的最佳估计,就是让拟合的统计学家告诉我们,对现行函数的最佳估计,就是让拟合的直线从各数据点中通过,使每一点到该直线的垂直距离的平方直线从各数据点中通过,使
2、每一点到该直线的垂直距离的平方和最小。这种技术成为和最小。这种技术成为最小乘回归估计最小乘回归估计(least-square regression estimation),根据表中产量和成本数据,可根据表中产量和成本数据,可求得最小二乘回归方程如下:求得最小二乘回归方程如下:的实际值和预测值之间的离差(即这些点与直线之间的垂直距离),称为残值(residual)或预测误差(prediction error)第4页,此课件共65页哦 有很多数字可选为有很多数字可选为a a和和b b的估计值,但只有的估计值,但只有其中的一组所规定的直线能使其中的一组所规定的直线能使离差的平方和离差的平方和最小最小
3、 即使即使 最小最小。计算最小二乘估计。计算最小二乘估计值值 和和 的公式为:的公式为:和和式中,式中,和和 分别为分别为X和和Y变量的均值变量的均值(4-2)(4-1)第5页,此课件共65页哦 根据例子中基本的成本和产量数据,进行根据例子中基本的成本和产量数据,进行必要的运算如表(必要的运算如表(4-24-2)把相关的值代入式)把相关的值代入式(4-14-1)和式()和式(4-24-2),可算得),可算得 和和 的估的估计值为:计值为:第6页,此课件共65页哦成本成本 产量产量 1000-137.14-12.29151.041685.451505-87.14-7.2953.14635.251
4、608-77.14-4.2918.40330.93240102.86-2.295.24-6.5523015-7.142.717.34-19.3537023132.9610.71114.701422.9341025172.8612.71161.542197.05表4-2第7页,此课件共65页哦 因而,总成本函数的估计方程为:因而,总成本函数的估计方程为:系数系数 的估计值为的估计值为87.08,是固定成本的是固定成本的估计值。估计值。的值是对产量变化的值是对产量变化1个单位引起的总个单位引起的总成本的变化(即边际成本)做出的估计。成本的变化(即边际成本)做出的估计。美元,意思是产量变化美元,意思
5、是产量变化1个单位,平均个单位,平均导致总成本变化导致总成本变化12.21美元,因而美元,因而 是边际成本是边际成本的估计值。的估计值。第8页,此课件共65页哦小结一小结一n最小二乘回归技术是用来估计函数的系数的,方最小二乘回归技术是用来估计函数的系数的,方法是让一条拟合的直线通过数据点,以使离差的法是让一条拟合的直线通过数据点,以使离差的平方和平方和 即即 最小。最小。n估计函数估计函数 的系数的值可用下列方程:的系数的值可用下列方程:n 的值是垂直截距的估计值,或当的值是垂直截距的估计值,或当X=0X=0时时Y Y的估计的估计值。值。的值是的值是X X变化变化1 1个单位引起的个单位引起的
6、Y Y变化的估计值。变化的估计值。第9页,此课件共65页哦 参数估计出来之后,因变量和自变量之间参数估计出来之后,因变量和自变量之间的关系强度可以用两种方法来度量。的关系强度可以用两种方法来度量。第一种方法是使用第一种方法是使用可决系数可决系数,即用,即用R2来度来度量量整个方程整个方程是否很好地解释因变量的变化。是否很好地解释因变量的变化。第二种方法是只用第二种方法是只用 以检验以检验因变量和因变量和一个自变量一个自变量之间的关系强度。之间的关系强度。2.检验回归估计检验回归估计第10页,此课件共65页哦 检验总的解释能力检验总的解释能力 我们把任一个我们把任一个 和和 的均值之间离差的平方
7、的均值之间离差的平方 即即 定义为的定义为的变差变差。总变差就等于所。总变差就等于所有因变量的值的离差平方之和。有因变量的值的离差平方之和。即:即:(4-3)第11页,此课件共65页哦 总变差可以分为两部分:总变差可以分为两部分:已解释变差和未解释变差。已解释变差和未解释变差。两两个概念可以解释如下。对每一个个概念可以解释如下。对每一个 的值来说,把的值来说,把 代入估代入估计出来的回归方程,就可以算出计出来的回归方程,就可以算出 的预测值(用的预测值(用 表示):表示):预测值预测值 和均值和均值 的差的平方的差的平方即即 就定义为就定义为已解释已解释变差变差(explained varia
8、tion)。“已解释已解释”的意思是的意思是 对均值对均值 的偏离是由的偏离是由 的变化所引起的(即可由的变化所引起的(即可由 的变化来解的变化来解释)。释)。这些离差的平方和就是全部已解释变差:这些离差的平方和就是全部已解释变差:全部已解释变差全部已解释变差=(4-4)第12页,此课件共65页哦 未解释变差未解释变差(unexplained variation)是指是指 和和 之之间间的差的差额额。即在。即在 与均与均值值 之之间间的离差,有一部的离差,有一部分已分已经经被自被自变变量量 所解所解释释。余下的离差,。余下的离差,就是未被解就是未被解释释的。的。这这些差些差额额的平方和就是全部
9、未解的平方和就是全部未解释变释变差:差:全部未解释变差全部未解释变差=(4-5)第13页,此课件共65页哦回归模型中变差的来源回归模型中变差的来源第14页,此课件共65页哦(4-6)可决系数可决系数(coefficient of determination)(R2)度度量在因变量的总变差中,已由回归方程解释的量在因变量的总变差中,已由回归方程解释的部分所占的比重,即:部分所占的比重,即:第15页,此课件共65页哦 R2值的范围是从值的范围是从0到到1。如果回归方程一点也。如果回归方程一点也不解释不解释Y的变差(即自变量和因变量之间没有联的变差(即自变量和因变量之间没有联系),系),R2就为就为
10、0。如果方程能解释全部变差(即全。如果方程能解释全部变差(即全部已解释变差部已解释变差=总变差),总变差),R2就等于就等于1。一般地,。一般地,R2的值越大,回归方程就的值越大,回归方程就“越好越好”。拟合拟合(fit)这个词常用来表示回归方程的解释能力。这个词常用来表示回归方程的解释能力。如果如果R2的值大,就说方程对数据拟合得较好;如的值大,就说方程对数据拟合得较好;如果果R2的值小,就说明拟合得不好。的值小,就说明拟合得不好。第16页,此课件共65页哦 根据已估计的总成本和产量的回归方程,即根据已估计的总成本和产量的回归方程,即 就可使用表就可使用表4-34-3中不同来源的变差数据,计
11、算可决系数:中不同来源的变差数据,计算可决系数:R2的值为的值为0.954,意思是在总成本中有,意思是在总成本中有95%以上的以上的变差是有产量的变化来解释的。因而,这个方程对数变差是有产量的变化来解释的。因而,这个方程对数据拟合得很好。据拟合得很好。第17页,此课件共65页哦表表4-3 4-3 计算一个回归模型的各种来源的变差计算一个回归模型的各种来源的变差第18页,此课件共65页哦我们用我们用 (t-test)来确定因变量和每个自变量之来确定因变量和每个自变量之间是否存在显著的关系。这个检验要求计算被估计的间是否存在显著的关系。这个检验要求计算被估计的回归系数的标准离差(或标准差)。回归系
12、数的标准离差(或标准差)。因变量和一个自变量之间的关系不是固定的,因为对不同因变量和一个自变量之间的关系不是固定的,因为对不同的数据样本来说,的数据样本来说,的估计值会是不同的。从其中一个回的估计值会是不同的。从其中一个回归方程中得出的归方程中得出的 的标准差是对的标准差是对 的变动性的估计。计的变动性的估计。计算这个标准的方程为:算这个标准的方程为:评价单个自变量的解释能力评价单个自变量的解释能力第19页,此课件共65页哦式中,式中,n n为观察次数。对本节的为观察次数。对本节的成本成本-产量产量的例子来说,的例子来说,n=7n=7,因此,因此,的标准差为:的标准差为:第20页,此课件共65
13、页哦 由于由于 具有变动性,有时候就需要确定一个区间或范围来估具有变动性,有时候就需要确定一个区间或范围来估计参数计参数 的真正的值。根据统计学原理,可以用一下方程来的真正的值。根据统计学原理,可以用一下方程来估计估计 的的95%的置信区间:的置信区间:式中,式中,为一种特定的概率分布,即为一种特定的概率分布,即 学生的学生的 分分布布(Students t distribution)的的值值。下。下标标 是自由度是自由度数,其中数,其中n为观为观察次数或数据点数;察次数或数据点数;k为为方程中自方程中自变变量的数量的数目。目。第21页,此课件共65页哦在这个例子中,在这个例子中,95%的置信
14、区间为:的置信区间为:或或9.1515.27。意思。意思是,成本是,成本产量之间真正的边际关系(即产量之间真正的边际关系(即 的值)落在这的值)落在这个区间的概率为个区间的概率为95%表4-4 供估计供估计95%置信区间用的简化的学生的置信区间用的简化的学生的t分布表分布表第22页,此课件共65页哦 如果自变量和因变量之间没有关系,参数如果自变量和因变量之间没有关系,参数b将为将为0。在统。在统计学上,检验计学上,检验Y和和X之间的关系是否很强的方法是:之间的关系是否很强的方法是:检查在检查在95%的置信区间内是否包括零值。的置信区间内是否包括零值。如果不包括如果不包括零零,我们就说由,我们就
15、说由 所度量的所度量的X和和Y之间的关系在统计上之间的关系在统计上显显著著(significant);如果包括零如果包括零,就说,就说 不显著不显著(nonsignificant),意意思是两个变量之间并不存在较强的联系。思是两个变量之间并不存在较强的联系。第23页,此课件共65页哦 这种检验的另一种方法是把估计的系数这种检验的另一种方法是把估计的系数 除以标准差。除以标准差。这一比率的概率分布与这一比率的概率分布与t分布一样,因而被称为分布一样,因而被称为 。如果这一比率的绝对值等于或大于表上的自由度为如果这一比率的绝对值等于或大于表上的自由度为 的的 ,我们就说,我们就说 在统计上显著。根
16、据产量在统计上显著。根据产量成本数据,成本数据,可计算如下:可计算如下:一般来说,如果一般来说,如果 比率的绝对值大于表上的自由度比率的绝对值大于表上的自由度 的值,我们就说系数的值,我们就说系数 在统计上显著。在统计上显著。第24页,此课件共65页哦小结二小结二 可决系数可决系数R2,是用来度量在因变量的总变差中,有多大部,是用来度量在因变量的总变差中,有多大部分是由回归方程分是由回归方程“解释解释”的。的。参数参数 的的95%95%置信区间估计值等于置信区间估计值等于 。如果这。如果这以区间不包括零,我们说,以区间不包括零,我们说,在统计上显著,意思是因在统计上显著,意思是因变量和自变量之
17、间存在较强的关系。变量和自变量之间存在较强的关系。回归系数的估计值与它的标准差之间的比率(回归系数的估计值与它的标准差之间的比率(统计量)统计量)也能用来检验一个自变量的统计显著性。也能用来检验一个自变量的统计显著性。第25页,此课件共65页哦3.利用回归方程进行预测利用回归方程进行预测估计值的标准差估计值的标准差 就是对预测的可能误差的度量。这就是对预测的可能误差的度量。这一标准差的计算公式为:一标准差的计算公式为:4-7预测值预测值 称为因变量值的称为因变量值的点估计点估计(point estimate),以区别于以区别于对置信区间的估计。例如,已知因变量的预测值对置信区间的估计。例如,已
18、知因变量的预测值 ,95%95%的置信区间估计为:的置信区间估计为:第26页,此课件共65页哦4.多元回归多元回归 对具有一个以上自变量的方程的参数进行估计称为对具有一个以上自变量的方程的参数进行估计称为多元回归多元回归(multipleregression)。由于大多数经济关系涉及的不仅仅是一个因变量和由于大多数经济关系涉及的不仅仅是一个因变量和一个自变量之间简单的关系,多元回归技术在经济学一个自变量之间简单的关系,多元回归技术在经济学中得到了广泛的应用。中得到了广泛的应用。第27页,此课件共65页哦小结三小结三 回归方程可用来预测因变量的值,如果自变量的回归方程可用来预测因变量的值,如果自
19、变量的值是给定的。值是给定的。估计值的标准是对预测中的误差的度量。估计值的标准是对预测中的误差的度量。在多元回归中,假定其他变量的影响不变,每一个在多元回归中,假定其他变量的影响不变,每一个估计出来的系数是对一个变量对因变量的影响的度量。估计出来的系数是对一个变量对因变量的影响的度量。第28页,此课件共65页哦二、二、需求估计需求估计 回归分析的过程很复杂,但通常包括四个步骤:回归分析的过程很复杂,但通常包括四个步骤:(1)建立理论模型;建立理论模型;(2)收集数据;收集数据;(3)选择函数形式;选择函数形式;(4)估计和解释结果。估计和解释结果。本节就结合需求方程的估计来讨论这些步骤。本节就
20、结合需求方程的估计来讨论这些步骤。第29页,此课件共65页哦1.建立理论模型建立理论模型 在使用回归技术时,分析者必须建立有关经济关系的理论在使用回归技术时,分析者必须建立有关经济关系的理论模型。这一模型必须建立在正确的经济理论基础上,并用数学模型。这一模型必须建立在正确的经济理论基础上,并用数学式子来表示。建立模型的过程包括确定在分析中应包括哪些变式子来表示。建立模型的过程包括确定在分析中应包括哪些变量和是否有一种理论可以用来预测变量之间的性质和大小。量和是否有一种理论可以用来预测变量之间的性质和大小。第30页,此课件共65页哦2.数据的收集数据的收集 为了估计需求,必须首先取得影响需求的每
21、个为了估计需求,必须首先取得影响需求的每个变量的数据。这些数据可以来自调查、市场实验变量的数据。这些数据可以来自调查、市场实验或各种现成的来源。可用时间序列数据,也可以或各种现成的来源。可用时间序列数据,也可以用横断面数据。时间序列数据是由影响需求的每用横断面数据。时间序列数据是由影响需求的每个变量在特定市场上逐期的观察数据所组成。个变量在特定市场上逐期的观察数据所组成。横断面数据是建立在同一时点上许多市场的基础横断面数据是建立在同一时点上许多市场的基础上的。例如,横断面数据可能包括:在最近一年中,上的。例如,横断面数据可能包括:在最近一年中,在在100100个不同市场上的,关于需求量、收入、
22、价格以个不同市场上的,关于需求量、收入、价格以及爱好和偏好的数据。及爱好和偏好的数据。第31页,此课件共65页哦n一、德尔菲法(专家意见法)一、德尔菲法(专家意见法)(Delphi technique)n(一)背景(一)背景n 德尔菲法最早出现于德尔菲法最早出现于20世纪世纪50年代末,是当时美国为年代末,是当时美国为了预测在其了预测在其“遭受原子弹轰炸后,可能出现的结果遭受原子弹轰炸后,可能出现的结果”而发而发明的一种方法。明的一种方法。1964年美国兰德年美国兰德(RAND)公司的赫尔默公司的赫尔默(Helmer)和戈登和戈登(Gordon)发表了发表了“长远预测研究报告长远预测研究报告”
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 章回 技术 需求 估计 精选 PPT
限制150内