应用回归分析作业.doc
《应用回归分析作业.doc》由会员分享,可在线阅读,更多相关《应用回归分析作业.doc(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用回归分析课后答案第二章 一元线性回归 2.14 解答:EXCEL结果:SUMMARY OUTPUT回归统计Multiple R0.944911R Square0.892857Adjusted R Square0.857143标准误差0.597614观测值5方差分析dfSSMSFSignificance F回归分析18.9285718.928571250.015392残差31.0714290.357143总计410Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept-0.214290.6962-0.3
2、07790.778371-2.42992.001332-2.42992.001332X Variable 10.1785710.03571450.0153920.0649130.292230.0649130.29223RESIDUAL OUTPUT观测值预测 Y残差11.571429-0.5714321.5714290.42857133.357143-0.3571443.3571430.64285755.142857-0.14286SPSS结果:(1)散点图为: (2)x与y之间大致呈线性关系。 (3)设回归方程为 =(4) = (5)由于服从自由度为n-2的t分布。因而也即:=可得即为:(2
3、.49,11.5) 服从自由度为n-2的t分布。因而即可得(6)x与y的决定系数(7)ANOVAx平方和df均方F显著性组间(组合)9.00024.5009.000.100线性项加权的8.16718.16716.333.056偏差.8331.8331.667.326组内1.0002.500总数10.0004由于,拒绝,说明回归方程显著,x与y有显著的线性关系。(8) 其中 接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。(9)相关系数 =小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.(10) 序号111064221013-33320200442027-75540
4、346残差图为:从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。(11)当广告费=4.2万元时,销售收入,即(17.1,39.7)2.15 解答:(1) 散点图为:(2)x与y之间大致呈线性关系。(3)设回归方程为 =(4) =0.23050.4801(5) 由于服从自由度为n-2的t分布。因而也即:=可得即为:(0.0028,0.0044) 服从自由度为n-2的t分布。因而即可得(6)x与y的决定系数 =0.908(7) ANOVAx平方和df均方F显著性组间(组合)1231497.5007175928.2145.302.168线性项加权的1168713.0361116871
5、3.03635.222.027偏差62784.464610464.077.315.885组内66362.500233181.250总数1297860.0009由于,拒绝,说明回归方程显著,x与y有显著的线性关系。(8) 其中 接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。(9) 相关系数 =小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.(10)序号1825353.07680.4232221510.88080.11923107043.95880.0412455022.0868-0.0868548011.8348-0.8348692033.4188-0.41887
6、13504.54.9688-0.466883251.51.27680.2232967032.51880.481210121554.48080.5192从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。(11)(12),即为(2.7,4.7)近似置信区间为:,即(2.74,4.66)(13)可得置信水平为为,即为(3.33,4.07).2.16 (1)散点图为:可以用直线回归描述y与x之间的关系.(2)回归方程为:(3) 从图上可看出,检验误差项服从正态分布。第三章 多元线性回归3.11 初始数据:编号yx1x2x3116070351226075402.43210654024265
7、74423524072381.2622068451.5727578424816066362927570443.21025065423解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵:相关性yx1x2x3Pearson 相关性y1.000.556.731.724x1.5561.000.113.398x2.731.1131.000.547x3.724.398.5471.000 y.048.008.009x1.048.378.127x2.008.378.051x3.009.127.051.Ny10101010x110101010x210101010x310101010所以=系数a模型非标准化
8、系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485.556.621.350.8251.211x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455x312.44710.569.2771.178.284-13.41538.310.724.433.212.5861.708a. 因变量: y (2) 所以三元线性回归方程为模
9、型汇总模型RR 方调整 R 方标准 估计的误差更改统计量R 方更改F 更改df1df2Sig. F 更改1.898a.806.70823.44188.8068.28336.015a. 预测变量: (常量), x3, x1, x2。(3)由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高(4)Anovab模型平方和df均方FSig.1回归13655.37034551.7908.283.015a残差3297.1306549.522总计16952.5009a. 预测变量: (常量), x3, x1, x2。b. 因变量: y因为F=8.283 P=0.0150.05所以认为回归方程在
10、整体上拟合的好(5)系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-348.280176.459-1.974.096-780.06083.500x13.7541.933.3851.942.100-.9778.485.556.621.350.8251.211x27.1012.880.5352.465.049.05314.149.731.709.444.6871.455x312.44710.569.2771.178.284-13.41538.310.724.433.212.5861.708a. 因变量:
11、 y(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。去除x3后作F检验,得:Anovab模型平方和df均方FSig.1回归12893.19926446.60011.117.007a残差4059.3017579.900总计16952.5009a. 预测变量: (常量), x2, x1。b. 因变量: y由表知通过F检验继续做回归系数检验系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间相关性共线性统计量B标准 误差试用版下限上限零阶偏部分容差VIF1(常量)-459.624153.058-3.003.020-821.547-97.700x
12、14.6761.816.4792.575.037.3818.970.556.697.476.9871.013x28.9712.468.6763.634.0083.13414.808.731.808.672.9871.013a. 因变量: y此时,我们发现x1,x2的显著性大大提高。(7)x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)(8)(9) 残差统计量a极小值极大值均值标准 偏差N预测值175.4748292.5545231.500038.9520610标准 预测值-1.4381.567.0001.00010预测值的标准误差1
13、0.46620.19114.5263.12710调整的预测值188.3515318.1067240.183549.8391410残差-25.1975933.22549.0000019.1402210标准 残差-1.0751.417.000.81610Student 化 残差-2.1161.754-.1231.18810已删除的残差-97.6152350.88274-8.6834843.4322010Student 化 已删除的残差-3.8322.294-.2551.65810Mahal。 距离.8945.7772.7001.55510Cook 的距离.0003.216.486.97610居中杠
14、杆值.099.642.300.17310a. 因变量: y所以置信区间为(175.4748,292.5545)(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好3.12 解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产业每增加一个单位,GDP就增加0.607个单位。 在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,GDP就增加1.709个单位。第四章 违背基本假设的情况4.9 初始数据:用户序号xy16790.7922920.44310120.5644930.7955822.761156
15、3.6479974.73821899.5910975.341020786.851118185.841217005.21137473.251420304.431516433.16164140.5173540.171812761.88197450.77204351.39215400.56228741.562315435.282410290.642571042614340.31278374.22817484.882913813.483014287.583112552.633217774.99333700.593423168.193511304.79364630.51377701.74387244.1
16、398083.94407900.96417833.29424060.444312423.24446582.144517465.71464680.644711141.9484130.514917878.3350356014.945114955.115222213.855315263.93解:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-.831.442-1.882.065x.004.000.83911.030.000a. 因变量: y由SPSS计算得:=-0.831+0.004x残差散点图为:(2)由残差散点图可知存在异方差性再用等级相关系数分析:相关系数xtSpearm
17、an 的 rhox相关系数1.000.318*Sig.(双侧).021N5353t相关系数.318*1.000Sig.(双侧).021.N5353*. 在置信度(双测)为 0.05 时,相关性是显著的。P=0.021 所以方差与自变量的相关性是显著的。(3)模型描述因变量y自变量1x权重源x幂值1.500模型: MOD_1.M=1.5时可以建立最优权函数,此时得到:ANOVA平方和df均方FSig.回归.0061.00698.604.000残差.00351.000总计.00952系数未标准化系数标准化系数tSig.B标准误试用版标准误(常数)-.683.298-2.296.026x.004.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 回归 分析 作业
限制150内