计量经济模型与经济预测.pptx
计量经济模型与经济预测计量经济模型与经济预测(美)丹(美)丹尼尔尼尔L等著等著学习要求:学习要求:一、参考著作及文献一、参考著作及文献:1、计量经济学基础、计量经济学基础 上册上册 【美美】达摩达尔达摩达尔N古扎拉蒂古扎拉蒂/著。著。2、经济计量分析经济计量分析 【美美】威廉威廉H格林格林/著。著。3、计量经济学基础、计量经济学基础 张晓峒张晓峒/著。著。4、计量经济学方法和应用计量经济学方法和应用 李子奈李子奈/著。著。5、计量经济学、计量经济学 张寿等张寿等 /著。著。6、经济研究、统计研究、数量经济技术及应用等杂志。、经济研究、统计研究、数量经济技术及应用等杂志。二、课时二、课时40。三、考核方式:期末闭卷考试、完成学习要求(作业、论文三、考核方式:期末闭卷考试、完成学习要求(作业、论文撰写、读文献)。撰写、读文献)。表3、 学生的平均成绩和家庭收入Y 平均成绩X 家庭收入/1000美元4.021.03.015.03.515.02.09.03.012.03.518.02.56.02.512.0例例3.1 学生平均成绩学生平均成绩平均成绩平均成绩Y与家庭收入与家庭收入X之间的关系估计为:之间的关系估计为:XY12.0375.1学生平均成绩的计算学生平均成绩的计算(1)x i(2)y i(3)(4)(5)(6)7.51.00.900.100.010056.251.500.180.180.03242.251.50.50.180.320.10242.254.51.00.540.460.211620.251.500.180.180.03242.254.50.50.540.040.001620.257.50.50.900.400.160056.251.50.50.180.320.10242.25iiiyyiixy 2i2ix6528. 02i00.1622ix33. 0109. 066528. 0222SNSi确定确定S2的计算如上表所示。在此例中,回归标准差的计算如上表所示。在此例中,回归标准差s等等于于0.33,代表平均成绩均值的,代表平均成绩均值的11%(s与因变量均值的与因变量均值的比值越低,回归直线对数据拟合得就越好)。由于比值越低,回归直线对数据拟合得就越好)。由于x2i=162,容易计算的标准差为容易计算的标准差为0259. 0162109. 0S正态分布。的、标准差为服从均值为的正态分布,、标准差为服从均值为,则假设误差服从正态分布。的标准差为计算类似的,可用369. 0375. 1026. 012. 03688. 0 xNXSS2i2i22为了对学生平均成绩例题中斜率的参数估计进为了对学生平均成绩例题中斜率的参数估计进行检验,可以用例行检验,可以用例31最初讨论中的计算结果。先最初讨论中的计算结果。先选择显著性水平如选择显著性水平如5%,然后找到自由度为,然后找到自由度为6(共(共有有8个观测值,个观测值,2个被估计参数)、相对于概率为个被估计参数)、相对于概率为0.05的的t分布的临界值,即分布的临界值,即tc2.447,则斜率参数估则斜率参数估计的计的95%的置信区间为:的置信区间为:6 . 4026. 012. 0/18. 006. 006. 012. 0)026. 0)(447. 2(12. 0ststc另外或例例3.1(接上例)学生平均成绩(接上例)学生平均成绩我们发现我们发现 0 在在的的 95% 的置信区间之外,因此的置信区间之外,因此可以可以 5% 的显著性水平拒绝的显著性水平拒绝 0 的原的原假设。同样,假设。同样,计算出的计算出的 t 值(值(4.6)大于临界值)大于临界值 2.45,因此也拒绝,因此也拒绝原假设原假设。 希望建立一个一元线性模型来解释总消费支出希望建立一个一元线性模型来解释总消费支出C的的值(单位:十亿美元,已经经过季节调整)。采用个值(单位:十亿美元,已经经过季节调整)。采用个人可支配总收入人可支配总收入Y(单位:十亿美元,经过季节调整单位:十亿美元,经过季节调整)作为解释变量。用)作为解释变量。用1959年第一季度到年第一季度到1993年第二季年第二季度的季度数据用度的季度数据用C对对Y进行回归,有如下结论(括号进行回归,有如下结论(括号中是标准差)中是标准差)C27.53 0.93Y (4.45) (0.0018)例例3.2 消费支出消费支出 截距截距27.53在在5%的水平上显著(的水平上显著(t统计值为统计值为6.18(27.53/4.45)。可支配收入系数的)。可支配收入系数的 t 统计值为统计值为517(0.93/0.0018),很明显要拒绝斜率为很明显要拒绝斜率为 0 的原假的原假设,而选择斜率不为设,而选择斜率不为 0 的备择假设。对原假设的拒的备择假设。对原假设的拒绝使我们可以接受绝使我们可以接受至少是暂时接受至少是暂时接受一元线一元线性回归模型。进一步研究也许会发现比上述模型更性回归模型。进一步研究也许会发现比上述模型更好的总消费支出模型。好的总消费支出模型。 研究汽车零售额(因变量)和收入总水平(自研究汽车零售额(因变量)和收入总水平(自变量)之间的关系。认为较高的收入水平会引起汽车变量)之间的关系。认为较高的收入水平会引起汽车零售额的增长。下面是一个零售额对收入的回归,采零售额的增长。下面是一个零售额对收入的回归,采用季度时间序列数据。用季度时间序列数据。 估计方程为:估计方程为: SW S 取取1959年第年第1季度季度1995年第年第2季度的汽车零售额季度的汽车零售额(单位:十亿美元),(单位:十亿美元),W是同时期的季度工资(以十是同时期的季度工资(以十亿美元为单位)。拟合回归直线如下式所列,括号中亿美元为单位)。拟合回归直线如下式所列,括号中为为t统计值统计值。1378)1.37()96.6(91.00308.048.92FRWS例例3.3汽车零售额汽车零售额 常数项为正,说明若某季度没有工资收入,人们常数项为正,说明若某季度没有工资收入,人们仍然会购买汽车。工资变量的系数可解释为每增加十仍然会购买汽车。工资变量的系数可解释为每增加十亿美元的工资会导致汽车销售额增长亿美元的工资会导致汽车销售额增长0.308亿美元。亿美元。(这个模型可用于在已知未来工资水平下,预测汽车(这个模型可用于在已知未来工资水平下,预测汽车未来的销售水平)。注意,斜率系数经常被看作是自未来的销售水平)。注意,斜率系数经常被看作是自变量的微小变动所引起的因变量的变化量(实际上在变量的微小变动所引起的因变量的变化量(实际上在线性模型中,适于所有的线性模型中,适于所有的W)。)。dWdS / 系数的估计不是无量纲的,它们的值直接与系数的估计不是无量纲的,它们的值直接与因变量因变量 S(以十亿美元为单位)和自变量以十亿美元为单位)和自变量 W(以以十亿美元为单位)的度量单位有关。在括号中写十亿美元为单位)的度量单位有关。在括号中写出出 t 统计值而不是标准差的估计。用统计值而不是标准差的估计。用 t 统计量可统计量可在在1%以及以及5%的显著性水平上分别拒绝截距与斜的显著性水平上分别拒绝截距与斜率为率为0的原假设。的原假设。R2为为0.91说明回归方程解释了因说明回归方程解释了因变量总变差的变量总变差的91%。F统计量为统计量为1378可以拒绝汽可以拒绝汽车零售额与工资没有关系的原假设(在车零售额与工资没有关系的原假设(在1%的水的水平下)。平下)。 尽管尽管 t 统计量使之拒绝了原假设,去掉显著的截统计量使之拒绝了原假设,去掉显著的截距项降低了方程解释功能。还是采用带有截距项的距项降低了方程解释功能。还是采用带有截距项的回归方程。只有在有充分理由认为方程通过原点时,回归方程。只有在有充分理由认为方程通过原点时,才能够让截距等于才能够让截距等于0。 尽管已经拒绝了截距为零的原假设,但是如果尽管已经拒绝了截距为零的原假设,但是如果有充分的理由相信汽车零售额与工资的关系图应该有充分的理由相信汽车零售额与工资的关系图应该通过原点,那么进行一次无截距的回归,用同样的通过原点,那么进行一次无截距的回归,用同样的样本回归结果如下:样本回归结果如下:)6.62( 0354.0WS 例例3.4学生平均成绩问题学生平均成绩问题统计量值:统计量值: R20.78F1.621.57家庭收入变量可以解释学生平均成绩变差的家庭收入变量可以解释学生平均成绩变差的78%。 用用F统计量对学生平均成绩与家庭收入之间没有统计量对学生平均成绩与家庭收入之间没有关系的原假设进行检验。以显著性水平为关系的原假设进行检验。以显著性水平为5%以及分子以及分子和分母自由度分别为和分母自由度分别为1和和6的的F分布表来确定临界值分布表来确定临界值(分子的自由度为(分子的自由度为1是因为模型只包含是因为模型只包含1个解释变量,个解释变量,而分母的自由度为而分母的自由度为6是因为有是因为有8个观测值和个观测值和2个需要估计个需要估计的参数),此例中,显著性水平为的参数),此例中,显著性水平为5%的的F分布的临界分布的临界值为值为5.99。计算出的。计算出的F值为值为21.57,大于临界值,故以,大于临界值,故以5%的显著性水平拒绝原假设。的显著性水平拒绝原假设。前面描述的前面描述的2个变量,分别是美国各州高等教育个变量,分别是美国各州高等教育中每千人注册进入公立(中每千人注册进入公立(PUBLIC)和私立和私立(PRIVATE)学校人数的水平。学校人数的水平。私立学校注册人数高的州与注册人数低的州相比,私立学校注册人数高的州与注册人数低的州相比,其公共教育系统的发展不如后者快。下列截面回归其公共教育系统的发展不如后者快。下列截面回归可以说明这个关系,回归模型是可以说明这个关系,回归模型是50个州公立入学人个州公立入学人数对私立入学人数的回归:数对私立入学人数的回归:PUBLIC 43.97 0.444PRIVATER20.20 F12.04 (25.80) (-3.47)例例3.5公立和私立学校的入学人数公立和私立学校的入学人数公立和私立注册人数之间有一个统计上显著的负相关关系。公立和私立注册人数之间有一个统计上显著的负相关关系。这个回归方程说明一个州的私立注册人数每增长这个回归方程说明一个州的私立注册人数每增长1个单位(每千个单位(每千人)该公立注册人数就下降半个。单位。人)该公立注册人数就下降半个。单位。t统计值为统计值为3.47及及F统计值为统计值为12.04都说明负的都说明负的PRIVATE的系数与的系数与0在在5%的显著性的显著性水平下有显著差别。水平下有显著差别。为评价一元回归模型的有效性,下图画出了残差的直方图。为评价一元回归模型的有效性,下图画出了残差的直方图。由于最小二乘的残差和等于由于最小二乘的残差和等于0,残差以,残差以0为中心是很自然的。但为中心是很自然的。但其他与残差的分布有关的属性也能说明很多信息。它们包括以其他与残差的分布有关的属性也能说明很多信息。它们包括以下几项:下几项:中位数中位数 0.63最小值最小值15.4最大值最大值 19.6标准差标准差7.31偏偏 度度 0.21峰度峰度2.79Jarque-Bera 0.47024681012-1001020 每千每千人中公立学校注册人数的均值为人中公立学校注册人数的均值为39.3,从这个角,从这个角度看,残差由度看,残差由15.419.6是相当高的,再加上比较高的标准是相当高的,再加上比较高的标准差,因此差,因此R2值比较低,仅为值比较低,仅为20%。建立一个解释公立学校注。建立一个解释公立学校注册人数的模型还有很大的改进余地。册人数的模型还有很大的改进余地。误差服从正态分布这一假设是否合理?残差的形式提供了误差服从正态分布这一假设是否合理?残差的形式提供了有用的信息。中位数有用的信息。中位数0.63及偏度及偏度0.21说明分布的右侧尾端比说明分布的右侧尾端比较粗,比左侧尾端具有更多的观测值,峰度较粗,比左侧尾端具有更多的观测值,峰度2.79稍低于稍低于3.00,说明分布的尾端比正态分布稍细。最后,说明分布的尾端比正态分布稍细。最后,Jarque-Bera统计统计量量0.47大大小于自由度为大大小于自由度为2的的2分布的临界值分布的临界值5.99因此我们不因此我们不能拒绝残差为正态分布的原假设,从而可以下结论说,前面能拒绝残差为正态分布的原假设,从而可以下结论说,前面的的t检验和检验和F检验是有意义的。检验是有意义的。例例4.1汽车销售额汽车销售额为了用单方程模型来预测各季度汽车销售额,可为了用单方程模型来预测各季度汽车销售额,可以用以用3个解释变量。一般认为销售额与可支配收入正个解释变量。一般认为销售额与可支配收入正相关,但与贷款购车的成本负相关,因此模型需要以相关,但与贷款购车的成本负相关,因此模型需要以下的数据:下的数据:S各季度个人新车消费,以十亿美元当前价值为单位各季度个人新车消费,以十亿美元当前价值为单位YP各季度个人收入,以十亿美元当前价值为单位各季度个人收入,以十亿美元当前价值为单位R3个月国债年利率个月国债年利率CPI各季度消费价格指数(各季度消费价格指数(1983100)销售额、收入和利率变量用销售额、收入和利率变量用CPI进行减值以反进行减值以反映真实情况(即映真实情况(即SRS/CPI,YPRYP/CPI,RRR/CPI)。)。要估计的方程为要估计的方程为SRt12YPRt3RRtt用从用从1975年年1995年第二季度的数据,估计回归年第二季度的数据,估计回归式为:式为:SRt0.600.0070YPRt1.366RRt系数说明:在其他变量不变的情况下,实际可系数说明:在其他变量不变的情况下,实际可支配收入每增加支配收入每增加10亿美元,将使实际汽车销售额增亿美元,将使实际汽车销售额增加加700万美元。同样,利率上升一个百分点,万美元。同样,利率上升一个百分点,在下一在下一季度季度汽车销售额将下降汽车销售额将下降13.66亿美元。亿美元。例例4.1(接上例)汽车销售额(接上例)汽车销售额在在前面汽车销售额的例子中,完整的回归结果前面汽车销售额的例子中,完整的回归结果如下:如下:系数系数值值标准误差标准误差t 统计值统计值 10.600.144.22 20.00700.00282.4631.3660.6881.98变量数;变量数;3(包括常数项);观测值个数(包括常数项);观测值个数82;自由;自由度度79;R20.42;F(2,79)F2,7928.1;回归标准差(回归标准差(s)0.118;误差平方和误差平方和ESS1.10540. 02R由于由于t统计量的绝对值都大于或等于统计量的绝对值都大于或等于1.98,即所,即所有系数的估计都在有系数的估计都在5%的水平上显著(利率变量接近的水平上显著(利率变量接近显著)。因此,不应从回归模型中去掉任何变量。显著)。因此,不应从回归模型中去掉任何变量。由于模型的自由度很大,可以想见,由于模型的自由度很大,可以想见,R2和和 的值的值很接近。自由度为很接近。自由度为 2 和和 79 的的 F 统计量高度显著,故统计量高度显著,故拒绝解释变量的系数全为拒绝解释变量的系数全为0的原假设。的原假设。2R例例4.2利率利率在在这个例子中用最小二乘法估计一个模型,来这个例子中用最小二乘法估计一个模型,来解释解释1960年年1月月1995年年8月间的月利率的变动。月间的月利率的变动。利率被认为是由流动资产的总需求和总供给决利率被认为是由流动资产的总需求和总供给决定的。回归模型中包含的变量如下:定的。回归模型中包含的变量如下:R3月期美国国债利率,为年利率的某一百分比月期美国国债利率,为年利率的某一百分比IP联邦储备委员会的工业生产指数(联邦储备委员会的工业生产指数(1987100)M2名义货币供给,以十亿美元为单位名义货币供给,以十亿美元为单位PW所有商品的生产价格指数(所有商品的生产价格指数(1982100)工业生产指数是衡量流动资产需求的一个很有用的量;工业生产指数是衡量流动资产需求的一个很有用的量;一般认为生产的增长将意味着需求的增长,需求的增长会引一般认为生产的增长将意味着需求的增长,需求的增长会引起利率的提高。货币供给很明显应放入模型,因为引起货币起利率的提高。货币供给很明显应放入模型,因为引起货币供给变化的联邦储备政策直接影响利率。同样的情况适用于供给变化的联邦储备政策直接影响利率。同样的情况适用于价格的变化,因为通货膨胀率的上升将引起利率的上升。价格的变化,因为通货膨胀率的上升将引起利率的上升。用于回归模型的货币与价格变量是用于回归模型的货币与价格变量是GM2t(M2tM2t1)/ M2t1;GPWt(PWtPWt1)/ PWt1;估计的方程是(括号中为估计的方程是(括号中为t统计值)统计值)158.104233.1400484. 0214. 1ttttGPWGMIPR(2.20) (8.79) (3.89) (6.00)R20.22s2.481和预想的一样,工业生产对利率有很强的显和预想的一样,工业生产对利率有很强的显著的正的影响。具有一个月滞后期的通货膨胀变著的正的影响。具有一个月滞后期的通货膨胀变量也具有正的符号,而且也是显著的。但是,货量也具有正的符号,而且也是显著的。但是,货币增长变量币增长变量GM的正号地与我们的预期相反。更进的正号地与我们的预期相反。更进一步的问题是相对较低的一步的问题是相对较低的R2和相对较高的回归模和相对较高的回归模型标准差。标准差型标准差。标准差2.481约为均值的约为均值的40%,这个比,这个比例在这类宏观经济模型中是很高的。例在这类宏观经济模型中是很高的。例例4.3消费函数消费函数可以用三个方程来说明对简单总消费函数进行估计时出现可以用三个方程来说明对简单总消费函数进行估计时出现的一些经济计量问题。这些方程包含个人消费(的一些经济计量问题。这些方程包含个人消费(C),),储蓄(储蓄(S)和可支配个人收入(和可支配个人收入(Y)。)。三个模型如下(采用三个模型如下(采用1954年第年第1季度季度1995年第年第2季度的季度数据,按美元的当前值计算):季度的季度数据,按美元的当前值计算):Ct11Yt1tCt22Yt2Ct12t St33Yt3tStYt Ct回归结果如下表所列:回归结果如下表所列:模型模型系数系数值值t 统计值统计值21.610.935.75562.5s31.680.0660.180.810.0478.5835.44s10.7721.610.075.7544.37s31.689995. 0211R9999. 02222R9230. 0233R模型模型是消费函数最简单的形式,其中消费量仅依赖于同时是消费函数最简单的形式,其中消费量仅依赖于同时期可支配收入。可支配收入变量的系数度量了消费的边际倾向。期可支配收入。可支配收入变量的系数度量了消费的边际倾向。在模型在模型中增加了前期消费对当前消费的作用。引入前期消费项中增加了前期消费对当前消费的作用。引入前期消费项使当前消费依赖于近期的消费行为和收入。模型使当前消费依赖于近期的消费行为和收入。模型可支配收入项可支配收入项系数的解释与模型系数的解释与模型的不同。模型的不同。模型中可支配收入系数中可支配收入系数0.18表示,表示,在前期消费保持不变的假设下,可支配收入变化一个单位所引起在前期消费保持不变的假设下,可支配收入变化一个单位所引起的当前消费的变化量。注意可支配收入对消费的总影响将随时间的当前消费的变化量。注意可支配收入对消费的总影响将随时间的推移发生作用,而且只能在消费长期不变的假设下通过计算长的推移发生作用,而且只能在消费长期不变的假设下通过计算长期边际消费倾向来衡量。解期边际消费倾向来衡量。解CtCt1,我们发现模型我们发现模型中隐含中隐含的长期边际消费偏好为:的长期边际消费偏好为:0.18/(10.18)0.95。 注意模型注意模型中的中的R2比模型比模型中略高。由于模型中略高。由于模型中的中的R2已已经很高了,所以人们或许会认为增加变量不大会增加的解释经很高了,所以人们或许会认为增加变量不大会增加的解释能力了。但是模型能力了。但是模型中滞后消费的中滞后消费的 t 统计量显著,说明情况统计量显著,说明情况并非如此。并非如此。 模型模型是一个储蓄函数,不是消费函数。但是简单查是一个储蓄函数,不是消费函数。但是简单查看一下回归结果,可知两者密切相关。这并不奇怪,因为储看一下回归结果,可知两者密切相关。这并不奇怪,因为储蓄是可支配收入和消费的差。注意系数估计之间的关系十分蓄是可支配收入和消费的差。注意系数估计之间的关系十分密切。密切。模型模型和模型和模型的截距仅是符号不同,而且斜率系数之的截距仅是符号不同,而且斜率系数之和等于和等于1。将模型。将模型中的中的St用用Yt Ct替换,且与模型替换,且与模型的结果的结果相比较,就会发现结果为什么会如此。另外,两个模型的回相比较,就会发现结果为什么会如此。另外,两个模型的回归平方和、回归标准差以及残差均相等。归平方和、回归标准差以及残差均相等。一开始令人奇怪的是从模型一开始令人奇怪的是从模型到模型到模型 的的 R2 减小很多。减小很多。减小的原因可以从减小的原因可以从R21ESS/TSS看出。由于两个方程残差看出。由于两个方程残差相等,残差平方和也相等。但是由于因变量的不同,总偏差相等,残差平方和也相等。但是由于因变量的不同,总偏差平方和不同。所以,模型几乎在所有方面都一样,但平方和不同。所以,模型几乎在所有方面都一样,但R2有很有很大的不同。大的不同。例例4.4黑市足球票价格黑市足球票价格在在1978到到1979赛季亚拉巴马大学足球队正为争夺全国冠赛季亚拉巴马大学足球队正为争夺全国冠军而努力。平价的赛季球票已售完,黑市球票的市场慢慢活跃军而努力。平价的赛季球票已售完,黑市球票的市场慢慢活跃起来。亚拉巴马与许多其他州不同,重新出售体育比赛的票是起来。亚拉巴马与许多其他州不同,重新出售体育比赛的票是合法的。这个时期每张球票的标价是合法的。这个时期每张球票的标价是10美元,但是根据没有赛美元,但是根据没有赛季球票的人对球票的需求和有赛季球票的人重新出售球票的供季球票的人对球票的需求和有赛季球票的人重新出售球票的供给量的变化,实际价格波动很大。用两个赛季共给量的变化,实际价格波动很大。用两个赛季共22场比赛重新场比赛重新出售球票的平均价格对一些需求和供给变量进行回归出售球票的平均价格对一些需求和供给变量进行回归。黑市球票方程是:黑市球票方程是:Pi12SECi3TVi4RANKi5LWINi6WINi7HOMEii其中其中P黑市球票平均价格黑市球票平均价格1;如果对手是亚拉巴马东南联合会的成员;如果对手是亚拉巴马东南联合会的成员SEC0;如果不是如果不是1;如果电视台转播比赛;如果电视台转播比赛 TV0;如果不转播如果不转播RANK亚拉巴马大学上周在全国足球排行榜的名次亚拉巴马大学上周在全国足球排行榜的名次LWIN对手上一年的赢输比例对手上一年的赢输比例WIN对手当年的赢输比例对手当年的赢输比例 1;如果是主场比赛;如果是主场比赛HOME 0;如果不是如果不是包括一般和标准化系数的回归结果列表如下:包括一般和标准化系数的回归结果列表如下:变量变量系数系数标准化系标准化系数数t 统计量统计量(对标准化系数)(对标准化系数)常数项常数项4.6419.771.83SEC5.5913.052.03TV9.2118.102.03RANK1.2013.872.05LWIN0.3022.102.68WIN0.069.571.41HOME4.9711.281.96第二列中系数表明了每个自变量一个单位的变化对因变第二列中系数表明了每个自变量一个单位的变化对因变量的影响。从自变量对确定黑市票价的重要性来看,第三列的量的影响。从自变量对确定黑市票价的重要性来看,第三列的标准化系数更适用于这个目的。确定黑市票价最重要的决定因标准化系数更适用于这个目的。确定黑市票价最重要的决定因素是对手在上一季的赢输比例(它的标准化系数在所有自变量素是对手在上一季的赢输比例(它的标准化系数在所有自变量中是最高的),即对手成绩越好,票价越高。中是最高的),即对手成绩越好,票价越高。 其余变量也具有预期的符号。从重要性的顺序来看,亚拉其余变量也具有预期的符号。从重要性的顺序来看,亚拉巴马大学的排名越高,球票价格越贵(排名高意味着巴马大学的排名越高,球票价格越贵(排名高意味着RANK变变量的值低),电视转播降低了球票价格(因为观众可以在家观量的值低),电视转播降低了球票价格(因为观众可以在家观看比赛),东南联合会成员间的看比赛),东南联合会成员间的 比赛比非成员比赛的票价贵,比赛比非成员比赛的票价贵,主场比赛比客场比赛的票价贵,对手当年的成绩越好,球票价主场比赛比客场比赛的票价贵,对手当年的成绩越好,球票价格越贵。格越贵。例例4.5耐用商品的销售额耐用商品的销售额用线性回归模型预测每月耐用商品的销售额,样本数据:用线性回归模型预测每月耐用商品的销售额,样本数据:从从1967年年7月月1995年年8月。月。1.因变量因变量SD 耐用商品的每月零售额(以百万美元为单位)耐用商品的每月零售额(以百万美元为单位)2.自变量自变量DI 百货商店耐用商品的零售库存(以百万美元为单百货商店耐用商品的零售库存(以百万美元为单 位)位)IS零售店所有耐用商品库存销售比例零售店所有耐用商品库存销售比例I 头头6个月个月商业报告中开放市场的比例(百分比)商业报告中开放市场的比例(百分比)E 工人的平均小时总收入(以美元为单位)工人的平均小时总收入(以美元为单位)P 耐用商品的消费价格指数(耐用商品的消费价格指数(1983100)回归方程确认为:回归方程确认为:SDt12DIt-63ISt-14It-15Et-16Pt-1t回归结果如下:回归结果如下:系数系数值值标准差标准差t 统计量统计量226320.415-12716-120.51530-7.4617750.018102353.872650.612.722.9-12.4-2.22.15-0.15654321系数系数偏偏相关系数相关系数 标准化系数标准化系数弹性系数弹性系数 0.780.120.11 0.310.01 0.840.090.02 0.210.01 0.860.770.03 0.320.0265432990. 022049Rs所有的自变量至少有一个时间段的滞后,这是因为反应需所有的自变量至少有一个时间段的滞后,这是因为反应需要一定的滞后,同时使预测容易一些。如果需要预测时刻要一定的滞后,同时使预测容易一些。如果需要预测时刻 t 的耐的耐用商品月零售额,只需用回归方程即可。用商品月零售额,只需用回归方程即可。SDt22632 0.415DIt-612716ISt-1 120.5It-1 1530Et-1 7.46Pt-1 t为了估计为了估计SD在时刻在时刻t1的值,只需代入的值,只需代入6个月前的个月前的DI值,值,1个月前的个月前的IS值等等。如果自变量没有滞后,在预测因变量之前值等等。如果自变量没有滞后,在预测因变量之前就需要用一些外推过程来对它们的值进行预测。就需要用一些外推过程来对它们的值进行预测。这里这里 t 统计量绝对值最大的自变量系数具有最大的标准化统计量绝对值最大的自变量系数具有最大的标准化系数和偏相关系数。滞后收入的标准化系数系数和偏相关系数。滞后收入的标准化系数0.21意味着前期收入意味着前期收入增加增加1个标准差将引起耐用商品的零售额增加个标准差将引起耐用商品的零售额增加0.21个标准差。个标准差。 收入变量的偏相关系数收入变量的偏相关系数0.31意味着意味着SD的方差中不能被其他自的方差中不能被其他自变量解释的部分中有变量解释的部分中有9.4%(0.312)可以被滞后收入解释。)可以被滞后收入解释。 弹性系数表明,耐用商品的零售额对工人总收入的变化很敏感,弹性系数表明,耐用商品的零售额对工人总收入的变化很敏感,但对耐用商品的消费价格指数不敏感。如果收入增长但对耐用商品的消费价格指数不敏感。如果收入增长1%,零售,零售额的增长略多于额的增长略多于 0.3%。如果耐用商品的消费价格指数增长。如果耐用商品的消费价格指数增长1%,零售额只下降约零售额只下降约0.02%。例例5.1信贷行业的费用函数信贷行业的费用函数了解信贷行业中的收益与业务规模之间关系对于了解信贷行业中的收益与业务规模之间关系对于法规制定者来说是十分重要的,因为他们需要决定并法规制定者来说是十分重要的,因为他们需要决定并购或者接管是否合乎大众的利益,这一点对于需要对购或者接管是否合乎大众的利益,这一点对于需要对经营的有效规模作出内部决定的经理人也是十分重要经营的有效规模作出内部决定的经理人也是十分重要的。无论是哪种情况,费用函数的经验估计都会是十的。无论是哪种情况,费用函数的经验估计都会是十分有用的。分有用的。输出输出Q是每一信贷机构的总资产(百万美元)。是每一信贷机构的总资产(百万美元)。平均年经营支出(百万美元)占总资产的百分比作为平均年经营支出(百万美元)占总资产的百分比作为长期平均经营支出长期平均经营支出LAC。用。用86个信贷机构的数据得到个信贷机构的数据得到以下回归关系:以下回归关系:LAC2380.615Q0.00054Q2LAC的拟合函数呈的拟合函数呈U字形,并且在信贷机字形,并且在信贷机构的总资产达到构的总资产达到5.69亿美元时达到最小值。由亿美元时达到最小值。由于大多数信贷机构的总资产都远远小于于大多数信贷机构的总资产都远远小于5.69亿亿美元,费用函数的分析说明信贷机构应当通过美元,费用函数的分析说明信贷机构应当通过成长或并购得到发展。成长或并购得到发展。例例5.2葡萄酒价格预测葡萄酒价格预测对新对新葡萄酒质量的评价过去一直是由葡萄酒品尝葡萄酒质量的评价过去一直是由葡萄酒品尝专家来完成的,而近来一系列关于葡萄酒价格的经济专家来完成的,而近来一系列关于葡萄酒价格的经济计量分析大大动摇了这计量分析大大动摇了这 一做法的传统地位。这些研究一做法的传统地位。这些研究显示,任何一年葡萄酒的未来价格可以用天气情况来显示,任何一年葡萄酒的未来价格可以用天气情况来预测。一个非常有趣的研究是关于法国预测。一个非常有趣的研究是关于法国Bordeaux地区地区各葡萄种植园的葡萄酒价格的研究。各葡萄种植园的葡萄酒价格的研究。用同一葡萄种植园但不同时间的葡萄酿造的葡萄用同一葡萄种植园但不同时间的葡萄酿造的葡萄酒的市场价格变化会非常大,这一点在葡萄酒行业中酒的市场价格变化会非常大,这一点在葡萄酒行业中是大家都知道的常识。例如,用是大家都知道的常识。例如,用60年代各年年代各年Lafitte种种植园的葡萄酿造的一打啤酒在植园的葡萄酿造的一打啤酒在19901991年伦敦拍卖会年伦敦拍卖会上的价格从上的价格从1968年葡萄酒的最低价年葡萄酒的最低价223美元到美元到1961年的年的最高价最高价4335美元之间变化。引起价格变化的原因有两美元之间变化。引起价格变化的原因有两个,其一是葡萄酒在投入市场之前保存时间越长,就个,其一是葡萄酒在投入市场之前保存时间越长,就会要求越高的经济回报(价格越高),因为这样才能会要求越高的经济回报(价格越高),因为这样才能反映出保存期长的机会成本。原因之二是造酒所用的反映出保存期长的机会成本。原因之二是造酒所用的葡萄具有非常不同的质量,而葡萄的质量与天气有很葡萄具有非常不同的质量,而葡萄的质量与天气有很密切的关系。密切的关系。Orley Ashenfelter和他的同事们在他们的一项计和他的同事们在他们的一项计量经济学方面的研究中,研究了量经济学方面的研究中,研究了1952年年1980年间年间10批用批用6个葡萄种植场的葡萄酿造的个葡萄种植场的葡萄酿造的60种不同的葡萄酒种不同的葡萄酒的价格,其统计结论支持以上的两个说法。他们用的价格,其统计结论支持以上的两个说法。他们用12瓶(一打)葡萄酒价格的自然对数作为被解释变量瓶(一打)葡萄酒价格的自然对数作为被解释变量(PRICE),),并对常数项(没有明确写出)、葡萄酒并对常数项(没有明确写出)、葡萄酒年数(年数(AGE)、)、葡萄生长期的平均气温(葡萄生长期的平均气温(TEMP),),8、9月份的降雨量(月份的降雨量(RAIN),),以及葡萄生长期前一以及葡萄生长期前一年年10月到第二年月到第二年3月的降雨量(月的降雨量(WRAINi)进行截面回进行截面回归,得到以下结果(括号里是标准误差):归,得到以下结果(括号里是标准误差):PRICEi0.0240 AGEi0.608 TEMPi0.0038 RAINi (0.0075) (0.116) (0.00095) 0.00115 WRINi (0.00051) R20.828 s0.287用用显著性水平显著性水平0.05对回归参数进行对回归参数进行t检验,每一个检验,每一个自变量与其他自变量之间的相关程度都不高,因此不自变量与其他自变量之间的相关程度都不高,因此不存在多重共线问题。年数存在多重共线问题。年数AGE的系数是长期保存的系数是长期保存Boreaux葡萄酒回报的度量:每多保留一年,酒的价格葡萄酒回报的度量:每多保留一年,酒的价格便会增加便会增加2.4%。气温系数的符号正如葡萄酒专家所预。气温系数的符号正如葡萄酒专家所预料料的:在其他条件不变的情况下,气温越高收获的葡的:在其他条件不变的情况下,气温越高收获的葡萄质量越好。气温变量萄质量越好。气温变量TEMP还反映气温的另一个现还反映气温的另一个现象:收获季节前夕的温暖气温对于当年葡萄质量特别象:收获季节前夕的温暖气温对于当年葡萄质量特别重要。最后,生长期前的降雨量对于葡萄质量也有显重要。最后,生长期前的降雨量对于葡萄质量也有显著的正面作用,而收获期前夕的降雨量对葡萄质量有著的正面作用,而收获期前夕的降雨量对葡萄质量有很显著的反面作用。很显著的反面作用。围绕酿酒厂使用回归分析预测葡萄酒价格有一些围绕酿酒厂使用回归分析预测葡萄酒价格有一些争议,因为酒的质量在葡萄收获之前就能够预测,因争议,因为酒的质量在葡萄收获之前就能够预测,因此,在被实际品尝之前,酒的质量就已经预测出来了。此,在被实际品尝之前,酒的质量就已经预测出来了。葡萄酒评论家罗伯特葡萄酒评论家罗伯特. 帕克把这种评酒的方法称做帕克把这种评酒的方法称做“古人的评酒法古人的评酒法”,他的说法并不奇怪。计量经济们,他的说法并不奇怪。计量经济们都知道,任何不完全拟合的回归模型都会产生出许多都知道,任何不完全拟合的回归模型都会产生出许多高于或低于实际值的预测值。高于或低于实际值的预测值。例例5.3工资差别工资差别用美国统计局的用美国统计局的“当前人口调查当前人口调查”中的截面数据研究男女工资有中的截面数据研究男女工资有 没有差没有差别,用到的变量有:别,用到的变量有:W雇员的工资率(美元雇员的工资率(美元/小时)小时)1;若;雇员为妇女;若;雇员为妇女SEX0;其他其他ED受教育的年数受教育的年数AGE雇员的年龄雇员的年龄1;若雇员不是西班牙裔也不是白人;若雇员不是西班牙裔也不是白人NONWH0;其他其他 1;若雇员西班牙裔;若雇员西班牙裔HISP 0;其他其他对对206名雇员的样本进行的回归结果为(括号内是名雇员的样本进行的回归结果为(括号内是t统统计量的值):计量的值):9 .14)204, 1 (068.073.293.102)86.3()10.22(FRSEXW反映雇员性别的虚拟变量反映雇员性别的虚拟变量SEX在显著性水平在显著性水平5%下显著。因为工资率的总平均是下显著。因为工资率的总平均是W=9.60美元,该虚美元,该虚拟变量告诉我们,妇女的平均工资率拟变量告诉我们,妇女的平均工资率=9.60-2.73=6.87美元,或比总平均低美元,或比总平均低2.73美元。美元。在模型中加入年龄在模型中加入年龄AGE和受教育年数和受教育年数