《应用回归分析》课后题答案.pdf
《《应用回归分析》课后题答案.pdf》由会员分享,可在线阅读,更多相关《《应用回归分析》课后题答案.pdf(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 .下载可编辑.应用回归分析部分课后习题答案 第一章 回归分析概述 1.1 变量间统计关系和函数关系的区别是什么?答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。1.2 回归分析与相关分析的联系与区别是什么?答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有 a.在回归分析中,变量 y 称为因变量,处在被解释的特殊地位。在相关分析中,变量 x 和变量 y 处于平等的地位,即研究变量 y 与变量 x 的密切程度与研究变量 x与变量 y 的密切程度是一回事。b.相关分析
2、中所涉及的变量 y 与变量 x 全是随机变量。而在回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量也可以是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制。1.3 回归模型中随机误差项的意义是什么?答:为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y 与 x1,x2.xp 的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的
3、局限而没有考虑的种种偶然因素。1.4 线性回归模型的基本假设是什么?答:线性回归模型的基本假设有:1.解释变量 x1.x2.xp是非随机的,观测值xi1.xi2.xip 是常数。2.等方差及不相关的假定条件为E(i)=0 i=1,2.Cov(i,j)=2 3.正态分布的假定条件为相互独立。4.样本容量的个数要多于解释变量的个数,即 np.1.5 回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题?答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。应注意的问题有:在选择变量时要注意与一些专门领域的专家合
4、作,不要认为一个回归模型所涉及的变量越多越好,回归变量的确定工作并不能一次完成,需要反复试算,最终找出最合适的一些变量。.下载可编辑.1.6 收集,整理数据包括哪些内容?答;常用的样本数据分为时间序列数据和横截面数据,因而数据收集的方法主要有按时间顺序统计数据和在同一时间截面上统计数据,在数据的收集中,样本容量的多少一般要与设置的解释变量数目相配套。而数据的整理不仅要把一些变量数据进行折算差分甚至把数据对数化,标准化等有时还需注意剔除个别特别大或特别小的“野值”。1.7 构造回归理论模型的基本依据是什么?答:选择模型的数学形式的主要依据是经济行为理论,根据变量的样本数据作出解释变量与被解释变量
5、之间关系的散点图,并将由散点图显示的变量间的函数关系作为理论模型的数学形式。对同一问题我们可以采用不同的形式进行计算机模拟,对不同的模拟结果,选择较好的一个作为理论模型。1.8 为什么要对回归模型进行检验?答:我们建立回归模型的目的是为了应用它来研究经济问题,但如果马上就用这个模型去预测,控制,分析,显然是不够慎重的,所以我们必须通过检验才能确定这个模型是否真正揭示了被解释变量和解释变量之间的关系。1.9 回归模型有那几个方面的应用?答:回归模型的应用方面主要有:经济变量的因素分析和进行经济预测。1.10 为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合?答:在回归模型的运用中,我
6、们还强调定性分析和定量分析相结合。这是因为数理统计方法只是从事物外在的数量表面上去研究问题,不涉及事物质的规定性,单纯的表面上的数量关系是否反映事物的本质?这本质究竟如何?必须依靠专门的学科研究才能下定论,所以,在经济问题的研究中,我们不能仅凭样本数据估计的结果就不加分析地说长道短,必须把参数估计的结果和具体经济问题以及现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确应用。.下载可编辑.第二章 一元线性回归 2.14 解答:(1)散点图为:(2)x 与 y 之间大致呈线性关系。(3)设回归方程为01yx 1=12217()niiiniix ynx yxn x 01207 31yx
7、17yx 可得回归方程为(4)22ni=11()n-2iiyy 2n01i=11()n-2iyx =2222213(10-(-1+71)(10-(-1+72)(20-(-1+73)(20-(-1+74)(40-(-1+75)1169049363110/3 .下载可编辑.13306.13(5)由于211(,)xxNL 1112()/xxxxLtL 服从自由度为 n-2 的 t 分布。因而 1/2()|(2)1xxLPtn 也即:1/211/2()xxxxpttLL=1 可得11195%333333的置信度为的置信区间为(7-2.353,7+2.353)即为:(2.49,11.5)22001()(
8、,()xxxNnL 00002221()1()()xxxxtxxnLnL 服从自由度为 n-2 的 t 分布。因而 00/22|(2)11()xxPtnxnL 即220/200/21()1()()1xxxxxxpttnLnL 可得195%7.77,5.77的置信度为的置信区间为()(6)x 与 y 的决定系数22121()490/6000.817()niiniiyyryy .下载可编辑.(7)ANOVA x 平方和 df 均方 F 显著性 组间(组合)9.000 2 4.500 9.000.100 线性项 加权的 8.167 1 8.167 16.333.056 偏差.833 1.833 1.
9、667.326 组内 1.000 2.500 总数 10.000 4 由于(1,3)FF,拒绝0H,说明回归方程显著,x 与 y 有显著的线性关系。(8)112/xxxxLtL 其中2221111()22nniiiiieyynn 710213.661333303/22.353t/23.66tt 接受原假设01:0,H认为1显著不为 0,因变量 y 对自变量 x 的一元线性回归成立。(9)相关系数 1211()()()()niixyinnxxyyiiiixxyyLrL Lxxyy =7070.90410 60060 r小于表中1%的相应值同时大于表中5%的相应值,x 与 y 有显著的线性关系.(
10、10)序号 x y y e 1 1 10 6 4 2 2 10 13-3 3 3 20 20 0 4 4 20 27-7 5 5 40 34 6 残差图为:.下载可编辑.从图上看,残差是围绕 e=0 随机波动,从而模型的基本假定是满足的。(11)当广告费0 x=4.2 万元时,销售收入028.4y 万元,95%置信度为的 置信区间 y 2近似为,即(17.1,39.7)2.15 解答:(1)散点图为:(2)x .下载可编辑.与 y 之间大致呈线性关系。(3)设回归方程为01yx 1=1221(2637021717)0.0036(71043005806440)()niiiniix ynx yxn
11、 x 012.850.00367620.1068yx 0.10680.0036yx可得回归方程为(4)22ni=11()n-2iiyy 2n01i=11()n-2iyx=0.2305 0.4801(5)由于211(,)xxNL 1112()/xxxxLtL 服从自由度为 n-2 的 t 分布。因而 1/2()|(2)1xxLPtn 也即:1/211/2()xxxxpttLL=1 可得195%的置信度为的置信区间为 0.4801/12978600.4801/1297860(0.0036-1.860,0.0036+1.860)即为:(0.0028,0.0044)22001()(,()xxxNnL
12、.下载可编辑.00002221()1()()xxxxtxxnLnL 服从自由度为 n-2 的 t 分布。因而 00/22|(2)11()xxPtnxnL 即220/200/21()1()()1xxxxxxpttnLnL 可得195%0.3567,0.5703的置信度为的置信区间为()(6)x 与 y 的决定系数 22121()()niiniiyyryy16.8202718.525=0.908(7)ANOVA x 平方和 df 均方 F 显著性 组间(组合)1231497.500 7 175928.214 5.302.168 线性项 加权的 1168713.036 1 1168713.036 3
13、5.222.027 偏差 62784.464 6 10464.077.315.885 组内 66362.500 2 33181.250 总数 1297860.000 9 由于(1,9)FF,拒绝0H,说明回归方程显著,x 与 y 有显著的线性关系。(8)112/xxxxLtL 其中2221111()22nniiiiieyynn 0.003612978608.5420.04801/21.895t/28.542tt .下载可编辑.接受原假设01:0,H认为1显著不为 0,因变量 y 对自变量 x 的一元线性回归成立。(9)相关系数 1211()()()()niixyinnxxyyiiiixxyyL
14、rL Lxxyy =46530.94891297860 18.525 r小于表中1%的相应值同时大于表中5%的相应值,x 与 y 有显著的线性关系.(10)序号 x y y e 1 825 35 3.0768 0.4232 2 215 1 0.8808 0.1192 3 1070 4 3.9588 0.0412 4 550 2 2.0868-0.0868 5 480 1 1.8348-0.8348 6 920 3 3.4188-0.4188 7 1350 4.5 4.9688-0.4668 8 325 1.5 1.2768 0.2232 9 670 3 2.5188 0.4812 10 121
15、5 5 4.4808 0.5192 从图上看,残差是围绕 e=0 随机波动,从而模型的基本假定是满足的。(11)0010003.7x新保单时,需要加班的时间为 y小时。(12)00/200y(2)1ytnh的置信概率为1-的置信区间精确为,即为(2.7,4.7)近似置信区间为:02y,即(2.74,4.66).下载可编辑.(13)可得置信水平为1-的置信区间为0/200(2)ytnh,即为(3.33,4.07).2.16(1)散点图为:可以用直线回归描述y 与 x 之间的关系.(2)回归方程为:12112.6293.314yx(3).下载可编辑.从图上可看出,检验误差项服从正态分布。.下载可编
16、辑.第三章 多元线性回归 3.11 解:(1)用 SPSS 算出 y,x1,x2,x3 相关系数矩阵:相关性 y x1 x2 x3 Pearson 相关性 y 1.000.556.731.724 x1.556 1.000.113.398 x2.731.113 1.000.547 x3.724.398.547 1.000 y.048.008.009 x1.048.378.127 x2.008.378.051 x3.009.127.051.N y 10 10 10 10 x1 10 10 10 10 x2 10 10 10 10 x3 10 10 10 10 所以r=(2)所以三元线性回归方程为3
17、447.122101.71754.328.348xxxy 系数a 模型 非标准化系数 标准系数 t Sig.B 的 95.0%置信区间 相关性 共线性统计量 B 标准 误差 试用版 下限 上限 零阶 偏 部分 容差 VIF 1(常量)-348.280 176.459 -1.974.096-780.060 83.500 x1 3.754 1.933.385 1.942.100-.977 8.485.556.621.350.825 1.211 x2 7.101 2.880.535 2.465.049.053 14.149.731.709.444.687 1.455 x3 12.447 10.569
18、.277 1.178.284-13.415 38.310.724.433.212.586 1.708 a.因变量:y 模型汇总 .下载可编辑.(3)由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高(4)Anovab 模型 平方和 df 均方 F Sig.1 回归 13655.370 3 4551.790 8.283.015a 残差 3297.130 6 549.522 总计 16952.500 9 a.预测变量:(常量),x3,x1,x2。b.因变量:y 因为 F=8.283 P=0.01515,这是因为如果样本再小,利用残差就很难对自相关的存在性作出比较正确的判断;DW 检
19、验不适合随机项具有高阶序列相关的检验。4.13 解:(1)系数a 模型 非标准化系数 标准系数 t Sig.B 标准 误差 试用版 1(常量)-1.435.242 -5.930.000 x.176.002.999 107.928.000 a.因变量:y y=-1.435+0.176x(2)模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1.999a.998.998.09744.663 a.预测变量:(常量),x。b.因变量:y .下载可编辑.DW=0.663 查 DW 分布表知:Ld=0.95 所以 DWLd,故误差项存在正相关。残差图为:te随 t
20、的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。(3)=1-0.5*DW=0.6685 计算得:Y x 7.39 44.90 7.65 45.80 6.84 40.69 8.00 48.50 7.79 46.85 8.26 49.45 7.96 48.47 8.28 50.04 7.90 48.03 Y X 8.49 51.17 7.88 47.26 8.77 52.33 8.93 52.69 9.32 54.95 9.29 55.54 9.48 56.77 9.38 55.83 9.67 58.00 9.90 59.22 模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差
21、Durbin-Watson 1.996a.993.993.07395 1.344 a.预测变量:(常量),xx。b.因变量:yy .下载可编辑.系数a 模型 非标准化系数 标准系数 t Sig.B 标准 误差 试用版 1(常量)-.303.180 -1.684.110 xx.173.004.996 49.011.000 a.因变量:yy 得回归方程 y=-0.303+0.173x 即:ty=-0.303+0.66851ty+0.173(tx0.66851tx)(4)模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1.978a.957.955.07449
22、 1.480 a.预测变量:(常量),x3。b.因变量:y3 系数a 模型 非标准化系数 标准系数 t Sig.B 标准 误差 试用版 1(常量).033.026 1.273.220 x3.161.008.978 19.528.000 a.因变量:y3 ty=0.033+0.161tx 即:ty=0.033+1ty+0.161(tx-1tx)(5)差分法的 DW 值最大为 1.48 消除相关性最彻底,但是迭代法的值最小为0.07395,拟合的较好。4.14 解:(1)模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1.541a.293.264 329.
23、69302.745 a.预测变量:(常量),x2,x1。b.因变量:y .下载可编辑.系数a 模型 非标准化系数 标准系数 t Sig.B 标准 误差 试用版 1(常量)-574.062 349.271 -1.644.107 x1 191.098 73.309.345 2.607.012 x2 2.045.911.297 2.246.029 a.因变量:y 回归方程为:y=-574.062+191.098x1+2.045x2 DW=0.7450),那么 XX+kI 接近奇异的程度小得多,考虑到变量的量纲问题,先对数据作标准化,为了计算方便,标准化后的设计阵仍然用 X 表示,定义为 1X XIX
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用回归分析 应用 回归 分析 课后 答案
限制150内