《应用回归分析课后答案(43页).doc》由会员分享,可在线阅读,更多相关《应用回归分析课后答案(43页).doc(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-应用回归分析课后答案第二章 一元线性回归 2.14 解答:EXCEL结果:SUMMARY OUTPUT回归统计Multiple R0.944911R Square0.892857Adjusted R Square0.857143标准误差0.597614观测值5方差分析dfSSMSFSignificance F回归分析18.9285718.928571250.015392残差31.0714290.357143总计410Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept-0.214290.6962-0.
2、307790.778371-2.42992.001332-2.42992.001332X Variable 10.1785710.03571450.0153920.0649130.292230.0649130.29223RESIDUAL OUTPUT观测值预测 Y残差11.571429-0.5714321.5714290.42857133.357143-0.3571443.3571430.64285755.142857-0.14286SPSS结果:(1)散点图为: (2)x与y之间大致呈线性关系。 (3)设回归方程为 =(4) = (5)由于服从自由度为n-2的t分布。因而也即:=可得即为:(
3、2.49,11.5) 服从自由度为n-2的t分布。因而即可得(6)x与y的决定系数(7)ANOVAx平方和df均方F显著性组间(组合)9.00024.5009.000.100线性项加权的8.16718.16716.333.056偏差.8331.8331.667.326组内1.0002.500总数10.0004由于,拒绝,说明回归方程显著,x与y有显著的线性关系。(8) 其中 接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。(9)相关系数 =小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.(10) 序号111064221013-33320200442027-7554
4、0346残差图为:从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。(11)当广告费=4.2万元时,销售收入,即(17.1,39.7)2.15 解答:(1) 散点图为:(2)x与y之间大致呈线性关系。(3)设回归方程为 =(4) =0.23050.4801(5) 由于服从自由度为n-2的t分布。因而也即:=可得即为:(0.0028,0.0044) 服从自由度为n-2的t分布。因而即可得(6)x与y的决定系数 =0.908(7) ANOVAx平方和df均方F显著性组间(组合)1231497.5007175928.2145.302.168线性项加权的1168713.036111687
5、13.03635.222.027偏差62784.464610464.077.315.885组内66362.500233181.250总数1297860.0009由于,拒绝,说明回归方程显著,x与y有显著的线性关系。(8) 其中 接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。(9) 相关系数 =小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.(10)序号1825353.07680.4232221510.88080.11923107043.95880.0412455022.0868-0.0868548011.8348-0.8348692033.4188-0.4188
6、713504.54.9688-0.466883251.51.27680.2232967032.51880.481210121554.48080.5192从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。(11)(12),即为(2.7,4.7)近似置信区间为:,即(2.74,4.66)(13)可得置信水平为为,即为(3.33,4.07).2.16 (1)散点图为:可以用直线回归描述y与x之间的关系.(2)回归方程为:(3) 从图上可看出,检验误差项服从正态分布。第三章 多元线性回归3.11 初始数据:编号yx1x2x3116070351226075402.4321065402426
7、574423524072381.2622068451.5727578424816066362927570443.21025065423解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵:相关性yx1x2x3Pearson 相关性y1.000.556.731.724x1.5561.000.113.398x2.731.1131.000.547x3.724.398.5471.000 y.048.008.009x1.048.378.127x2.008.378.051x3.009.127.051.Ny10101010x110101010x210101010x310101010所以=系数a模型非标准
8、化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485.556.621.350.8251.211x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455x312.44710.569.2771.178.284-13.41538.310.724.433.212.5861.708a. 因变量: y (2) 所以三元线性回归方程为
9、模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.898a.806.70823.44188.8068.28336.015a. 预测变量: (常量), x3, x1, x2。(3)由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高(4)Anovab模型平方和df均方FSig.1回归13655.37034551.7908.283.015a残差3297.1306549.522总计16952.5009a. 预测变量: (常量), x3, x1, x2。b. 因变量: y因为F=8.283 P=0.0150.05所以认为回归方程
10、在整体上拟合的好(5)系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485.556.621.350.8251.211x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455x312.44710.569.2771.178.284-13.41538.310.724.433.212.5861.708a. 因变量
11、: y(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。去除x3后作F检验,得:Anovab模型平方和df均方FSig.1回归12893.19926446.60011.117.007a残差4059.3017579.900总计16952.5009a. 预测变量: (常量), x2, x1。b. 因变量: y由表知通过F检验继续做回归系数检验系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-459.624153.058-3.003.020-821.547-97.700
12、x14.6761.816.4792.575.037.3818.970.556.697.476.9871.013x28.9712.468.6763.634.0083.13414.808.731.808.672.9871.013a. 因变量: y此时,我们发现x1,x2的显著性大大提高。(7)x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)(8)(9) 残差统计量a极小值极大值均值标准 偏差N预测值175.4748292.5545231.500038.9520610标准 预测值-1.4381.567.0001.00010预测值的标准误差
13、10.46620.19114.5263.12710调整的预测值188.3515318.1067240.183549.8391410残差-25.1975933.22549.0000019.1402210标准 残差-1.0751.417.000.81610Student 化 残差-2.1161.754-.1231.18810已删除的残差-97.6152350.88274-8.6834843.4322010Student 化 已删除的残差-3.8322.294-.2551.65810Mahal。 距离.8945.7772.7001.55510Cook 的距离.0003.216.486.97610居中
14、杠杆值.099.642.300.17310a. 因变量: y所以置信区间为(175.4748,292.5545)(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好3.12 解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产业每增加一个单位,GDP就增加0.607个单位。 在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,GDP就增加1.709个单位。第四章 违背基本假设的情况4.9 初始数据:用户序号xy16790.7922920.44310120.5644930.7955822.76115
15、63.6479974.73821899.5910975.341020786.851118185.841217005.21137473.251420304.431516433.16164140.5173540.171812761.88197450.77204351.39215400.56228741.562315435.282410290.642571042614340.31278374.22817484.882913813.483014287.583112552.633217774.99333700.593423168.193511304.79364630.51377701.74387244.
16、1398083.94407900.96417833.29424060.444312423.24446582.144517465.71464680.644711141.9484130.514917878.3350356014.945114955.115222213.855315263.93解:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-.831.442-1.882.065x.004.000.83911.030.000a. 因变量: y由SPSS计算得:=-0.831+0.004x残差散点图为:(2)由残差散点图可知存在异方差性再用等级相关系数分析:相关系数xtSpear
17、man 的 rhox相关系数1.000.318*Sig.(双侧).021N5353t相关系数.318*1.000Sig.(双侧).021.N5353*. 在置信度(双测)为 0.05 时,相关性是显著的。P=0.021 所以方差与自变量的相关性是显著的。(3)模型描述因变量y自变量1x权重源x幂值1.500模型: MOD_1.M=1.5时可以建立最优权函数,此时得到:ANOVA平方和df均方FSig.回归.0061.00698.604.000残差.00351.000总计.00952系数未标准化系数标准化系数tSig.B标准误试用版标准误(常数)-.683.298-2.296.026x.004.
18、000.812.0829.930.000所以:-0.683+0.004x(4)系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量).582.1304.481.000x.001.000.8059.699.000a. 因变量: yy4.13初始数据:序号xy1127.320.96213021.43132.721.964129.421.52513522.396137.122.767141.123.488142.823.669145.524.110145.324.0111148.324.5412146.424.2813150.22514153.125.6415157.326.46161
19、60.726.9817164.227.5218165.627.7819168.728.242017228.78 解:(1)系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-1.435.242-5.930.000x.176.002.999107.928.000a. 因变量: y=-1.435+0.176x(2) 模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.999a.998.998.09744.663a. 预测变量: (常量), x。b. 因变量: yDW=0.663 查DW分布表知:=0.95所以DW,故误差项存在正相关。残差图为:随t的变
20、化逐次变化并不频繁的改变符号,说明误差项存在正相关。(3)=1-0.5*DW=0.6685 计算得:Y x7.3944.907.6545.806.8440.698.0048.507.7946.858.2649.457.9648.478.2850.047.9048.038.4951.177.8847.268.7752.338.9352.699.3254.959.2955.549.4856.779.3855.839.6758.009.9059.22模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.996a.993.993.073951.344a. 预测变量: (常量)
21、, xx。b. 因变量: yy系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-.303.180-1.684.110xx.173.004.99649.011.000a. 因变量: yy得回归方程 =-0.303+0.173x即:=-0.303+0.6685+0.173(0.6685)(4)模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.978a.957.955.074491.480a. 预测变量: (常量), x3。b. 因变量: y3系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量).033.0261.273.220x3.
22、161.008.97819.528.000a. 因变量: y3=0.033+0.161即:=0.033+0.161(-)(5)差分法的DW值最大为1.48消除相关性最彻底,但是迭代法的值最小为0.07395,拟合的较好。4.14解:(1)模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.541a.293.264329.69302.745a. 预测变量: (常量), x2, x1。b. 因变量: y系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-574.062349.271-1.644.107x1191.09873.309.3452.607.0
23、12x22.045.911.2972.246.029a. 因变量: y回归方程为:=-574.062+191.098x1+2.045x2DW=0.745Dl 所以误差项存在正相关残差图为:(2)=1-0.5*DW=0.6275模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.688a.474.452257.670641.716a. 预测变量: (常量), x22, x12。b. 因变量: y2系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-179.66890.337-1.989.052x12211.77047.778.5224.432.000
24、x221.434.628.2692.283.027a. 因变量: y2此时得方程:=-179.668+211.77x1+1.434x2所以回归方程为:(3)模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson1.715a.511.490283.791022.042a. 预测变量: (常量), x23, x13。b. 因变量: y3系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)7.69839.754.194.847x13209.89144.143.5444.755.000x231.399.583.2742.400.020a. 因变量: y3此时得方程
25、:所以回归方程为:第五章 自变量选择与逐步回归5.9 初始数据:年份农业x1工业x2建筑业x3人口x4最终消费x5受灾面积x6财政收入y19781018.4 1607.0 138.2 962592239.1 507601132.3 19791258.9 1769.7 143.8 975422619.4 393701146.4 19801359.4 1996.5 195.5 987052976.1 445301159.9 19811545.6 2048.4 207.1 1000723309.1 397901175.8 19821761.6 2162.3 220.7 1016543637.9 33
26、1301212.3 19831960.8 2375.6 270.6 1030084020.5 347101367.0 19842295.5 2789.0 316.7 1043574694.5 318901642.9 19852541.6 3448.7 417.9 1058515773.0 443702004.8 19862763.9 3967.0 525.7 1075076542.0 471402122.0 19873204.3 4585.8 665.8 1093007451.2 420902199.4 19883831.0 5777.2 810.0 1110269360.1 50870235
27、7.2 19894228.0 6484.0 794.0 11270410556.5 469902664.9 19905017.0 6858.0 859.4 11433311365.2 384702937.1 19915288.6 8087.1 1015.1 11582313145.9 554703149.5 19925800.0 10284.5 1415.0 11717115952.1 513303483.4 19936882.1 14143.8 2284.7 11851720182.1 488304349.0 19949457.2 19359.6 3012.6 11985026796.0 5
28、50405218.1 199511993.0 24718.3 3819.6 12112133635.0 458216242.2 199613844.2 29082.6 4530.5 12238940003.9 469897408.0 199714211.2 32412.1 4810.6 12362643579.4 534298651.1 199814599.6 33429.8 5262.0 12481046405.9 501459876.0 解:后退法:输出结果系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)1438.1202252.472.638.533农业x1-.626
29、.168-1.098-3.720.002工业x2-.328.207-1.352-1.587.135建筑业x3-.383.555-.251-.691.501人口x4-.004.025-.014-.161.875最终消费x5.672.1303.7105.178.000受灾面积x6-.006.008-.015-.695.4992(常量)1079.754299.7593.602.003农业x1-.642.130-1.126-4.925.000工业x2-.303.131-1.249-2.314.035建筑业x3-.402.525-.263-.765.456最终消费x5.658.0953.6366.905
30、.000受灾面积x6-.006.007-.017-.849.4093(常量)1083.150295.8163.662.002农业x1-.624.127-1.095-4.931.000工业x2-.373.093-1.535-3.998.001最终消费x5.657.0943.6276.981.000受灾面积x6-.005.007-.015-.758.4604(常量)874.604106.8698.184.000农业x1-.611.124-1.073-4.936.000工业x2-.353.088-1.454-3.994.001最终消费x5.637.0893.5167.142.000a. 因变量: 财
31、政收入yAnovae模型平方和df均方FSig.1回归1.365E862.274E7602.127.000a残差528793.3191437770.951总计1.370E8202回归1.365E852.729E7772.734.000b残差529767.8521535317.857总计1.370E8203回归1.364E843.411E7991.468.000c残差550440.1031634402.506总计1.370E8204回归1.364E834.547E71355.753.000d残差570180.9311733540.055总计1.370E820a. 预测变量: (常量), 受灾面积
32、x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。e. 因变量: 财政收入y模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.998a.996.994194.34750.996602.127614.0002.998b.996.995187.93046.000.0261
33、14.8753.998c.996.995185.47913.000.585115.4564.998d.996.995183.13944.000.574116.460a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。回归方程为: 逐步回归法:输出结果模型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.994a.989.988285.68373.9891659.441119.0002.996b.992.991247.77768.0037.258118.0153.998c.996.995183.13944.00415.948117.001a. 预测变量: (常量), 最终消费x5。b. 预测变量: (常量), 最终消费x5, 农业x1。c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。Anovad模型平方和df
限制150内