统计学第五版贾俊平课后思考题和练习题复习资料最终完整版.docx
统计学(第五版)贾俊平课后思索题和练习题答案(最终完整版)整理 by_kiss-ahuang第一部分思索题 第一章思索题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,说明来自 各个领域的数据并从中得出结论。1. 2说明描述统计和推断统计描述统计;它探讨的是数据收集,处理,汇总,图表描述,概括 及分析等统计方法。推断统计;它是探讨如何利用样本数据来推断总体特征的统计方 法。1. 3统计学的类型和不同类型的特点统计数据;按所采纳的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它 是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。(定量数据)数值型数据:按数字尺度测量的视察值,其结果表 现为具体的数值。统计数据;按统计数据都收集方法分;6. 1统计量:设XI, X2-, Xn是从总体X中抽取的容量为n的一个样本,假如由此样本构造一个函数T (Xl,X2-,Xn),不依靠于任何未知参数,则称函数T(X1, X2-, Xn)是一个统计量。缘由:为了使统计推断成为可能。6.2 T1 和 T2 是P1596. 4统计量加工过程中一点信息都不损失的统计量为充分统计 量6. 5自由度:独立变量的个数名三06.6 2分布:设酸;项产力方分布:设若为听从自由度为功的2分布,即疗2 (ni), 夕为听从自由度为功的2分布,即广2(加,且和 ,相互独立,则称尸为听从自由度外和2的尸分布,记为抽样分布:样本统计量的概率分布是一种理论概率分布随 机变量是样本统计量6.7 中心极限定理:设从均值为,方差为2的一个随意总体中抽取容量为的样本,当充分大时,样本均值的抽样分 布近似听从均值为U,方差为的正态分布第七章思索题7.1估计量:用于估计总体参数的随机变量估计值:估计参数时计算出来的统计量的具体值(6)存在多重共线性,模型不相宜采纳线性模型。12.11 一家货物运输公司想探讨运输费用及货物类型的关系, 并建立运输费用及货物类型的回来模型,以此对运输费用作出预 料。该运输公司所运输的货物分为两种类型:易碎品和非易碎品。 下表给出了 15个路程大致相同,而货物类型不同的运输费用数 据。每件产品的运输费用y (元)货物类型xl17. 2易碎品111. 1易碎品112. 0易碎品110. 9易砰品113. 8易砰品16. 5易碎品110. 0易碎品111. 5易碎品17. 0非易碎品08. 5非易碎品02. 1非易碎品0lo 3非易碎品03. 4非易碎品07. 5非易碎品0要求:2. 0非易碎品0(1)写出运输费用及货物类型之间的线性方程。(2)对模型中的回来系数进行说明。(3)检验模型的线性关系是否显著(a=0. 05) 0解:Signifidf SS MS F cance F 回来分 187. 251 187. 2510. 00060析199 20.22291120.372 9.25939残差1316总计14307.624Coeffi 标准 t P-val Lower Upper 下限 上限cients 误差 Stat ue 95%95%95.0% 95.0%Inter 4. 5428 1. 1503. 9490. 001 2. 0581 7. 02752. 058177. 02753cept571189066627935957. 0821 1. 5744. 4960. 000 3. 6798 10. 4843. 6798510. 4844xl43864988601574373(1)回来方程为:9 = 4.54 + 7.08%(2)非易碎品的平均运费为4.54元,易碎品的平均运费为11. 62元,易碎品及非易碎品的平均运费差为7. 08元。(3)回来方程的显著性检验:假设:Ho: /?=0 Hi:分不等于0SSR=187. 25195, SSE=120. 3721,=20. 22p_ SSR/p _ 6724.125/1SSE/n-p- 507.75/15-1-1P=0. 00060K0. 05,或者加5(1,13)=4. 67, F> ,O5(l,13),认为线 性关系显著。或者,回来系数的显著性检验:假设:Ho:夕=0Hi:4W0t=A=Z=4,5S, 1.57PlP=0. 00060K0. 05,或者%2(p1)二九025 03)=2. 16, |r| >rOO25(13), 认为y及x线性关系显著。12.12为分析某行业中的薪水有无性别卑视,从该行业中随机抽取15名员工,有关数据如下:月薪y(元)工龄X1性别(1=男,0 =女)X21 5483. 211 6293. 811 0112. 701 2293. 401 7463. 611 5284. 111 0183. 801 1903. 401 5513. 319853. 201 6103. 511 4322. 911 2153. 309902. 801 5853. 51要求:用Excel进行回来,并对结果进行分析。解:回来统计0. 943Multiple R 3910. 889R Square987AdjustedRO. 871Square65296. 79标准误差158观测值15方差分析Significdf SS MS F ance F回来分 909488. 454744. 48. 5391析24241.77E-06112423.残差123 9368.61总计14Coeffi 标准t P-val Lower Upper 下限上限cients 误差 Stat ue 95%95% 95.0% 95.0%732. 06 235. 53. 1070. 009 218. 76 1245. 3218. 7661245. 35Intercept06844425064645545111.22 72. 08 1. 542 0. 148 -45. 83 268. 27-45. 836268. 276工龄 xl02342937796616515575.160性别(1二男,0 458. 68 53.458. 5801.82E 342.20 575. 16=女)*2418519 -06801342.2081拟合优度良好,方程线性显著,工龄线性不显著,性别线性显著。13. 1下表是1981年一1999年国家财政用于农业的支出额数据年份支出额(亿 元)年份支出额(亿 元)1981110.211991347. 571982120. 491992376. 021983132. 871993440. 451984141. 291994532. 981985153. 621995574. 931986184. 21996700. 431987195. 721997766. 391988214.0719981154. 761989265. 9419991085. 761990307. 84(1)绘制时间序列图描述其形态。(2)计算年平均增长率。(3)依据年平均增长率预料2000年的支出额。具体答案:(1)时间序列图如下:年份从时间序列图可以看出,国家财政用于农业的支出额 大体上呈指数上升趋势。(2)年平均增长率为:G =-l = J085,76 -1 = 113.55%-1 = 13.55%丫织 V 110.21O(3)2ooo = 1085.76 x (1 +13.55%) = 1232.88 o 13.2下表是1981年一2000年我国油彩油菜籽单位面积产量数据(单位:kg / hm2)年份单位面积 产量1981145119821372年份单位面积产199112151992128119831168199313091984123219941296198512451995141619861200199613671987126019971479198810201998127219891095199914691990126020001519(1)绘制时间序列图描述其形态。(2)用5期移动平均法预料2001年的单位面积产量。(3)采纳指数平滑法,分别用平滑系数a=0. 3和a=0. 5预料2001年的单位面积产量,分析预料误差,说明用哪一个平滑系数预料更合适?具体答案:(1)时间序列图如下:1600140012001000 产800 量600400200 01600140012001000 产800 量600400200 0(2) 2001年的预料值为:1367 + 1479 + 1272 + 1469 + 1519 7106 0小、2001 =2001 = 1421.2(3)由Excel输出的指数平滑预料值如下表:年份单位面积 产量指数平滑 预料 a=0. 3误差平 方指数平滑 预料 a=0. 5误差平方19811451198213721451.06241. 01451.06241. 0198311681427. 367236. 51411.559292. 3198412321349. 513808.61289. 83335. 1198512451314. 34796. 51260. 9252.0198612001293. 58738. 51252. 92802. 4198712601265.429. 51226. 51124. 3198810201263.859441. 01243. 249833. 6198910951190.79151. 51131. 61340. 8199012601162.09611.01113.321518.4199112151191.4558. 11186.7803. 5199212811198.56812.41200. 86427. 7199313091223. 27357. 61240. 94635. 8199412961249.02213. 11275. 0442.8199514161263. 123387. 71285. 517035. 9199613671308. 93369. 91350. 7264.4199714791326. 423297. 71358. 914431. 3199812721372. 210031. 01418. 921589.8199914691342. 116101. 51345. 515260. 3200015191380. 219272. 11407. 212491. 7合计291455.2239123.02001年a=0. 3时的预料值为:玛001 =吟+(1 - 仪)片=0.3x1519 + (1-0.3)x1380,2 = 1421.8a=0. 5时的预料值为:正如01 =*+(1-a)耳=0.5x1519 + (1-0.5)x1407,1 = 1463.1比较误差平方可知,a=0.5更合适。13.3下面是一家旅馆过去18个月的营业额数据营业额(万 营业额(万月份 元) 月份 元)295295104732评价估计量的标准:无偏性:估计量抽样分布的数学期望等于被估计的总体参数有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效一样性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数置信区间:由样本统计量所构造的总体参数的估计区间7.3 95%的置信区间指用某种方法构造的全部区间中有95%的区间包含总体参数的真值。1.1 5含义:Za/2是标准正态分布上侧面积为a/2的z值,公式是统计总体均值时的边际误差。7.6 独立样本:假如两个样本是从两个总体中独立抽取的,即一个样本中的元素及另一个样本中的元素相互独立。匹配样本:一个样本中的数据及另一个样本中的数据相对应。7.7 (1),两个总体都听从正态分布(2),两个随即样本独立地分别抽自两个总体 7. 8样本量越大置信水平越高,总体方差和边际误差越小第8章思索题8.1假设检验和参数估计有什么相同点和不同点?答:参数估计和假设检验是统计推断的两个组成部分,它们都是 利用样本对总体进行某种推断,然而推断的角度不同。参数估计 探讨的是用样本统计量估计总体参数的方法,总体参数u在估计228311470332212481435513449528614544637915601738116587843117644942418660(1)用3期移动平均法预料第19个月的营业额。(2)采纳指数平滑法,分别用平滑系数a=0.3,a=0.4 和a=0. 5预料各月的营业额,分析预料误差,说明用哪一 个平滑系数预料更合适?(3)建立一个趋势方程预料各月的营业额,计算出估计标 准误差。具体答案:(1)第19个月的3期移动平均预料值为:沟+ 644+ 66。=%= 630.33(2) 月份营业预料误差平预料误差平预料误差平额a=0.3方a=0.4方a=0.5方12952283295.0144.0295.0144.0295.0144.03322291.4936.4290.21011.2289.01089. 04355300.62961. 5302.92712. 3305.52450. 35286316.9955.2323.81425. 2330.31958. 16379307.65093. 1308.74949. 0308.15023. 37381329.02699. 4336.81954. 5343.61401.68431344.67459. 6354.55856. 2362.34722. 39424370.52857. 8385.11514.4396.6748. 510473386.7468. 6400.5234. 4410.3928. 767311470412.53305. 6429.61632. 9441.7803. 112481429.82626. 2445.81242. 3455.8633. 513449445.115.0459.9117.8468.4376.914544446.39547. 4455.57830. 2458.77274. 815601475.615724.5490.912120.5501.49929. 416587513.25443. 2534.92709. 8551.21283. 317644535.411803.7555.87785. 2569.15611. 718660567.98473. 4591.14752. 7606.52857. 5合计87514.762992.550236由Excel输出的指数平滑预料值如下表:a=0. 3时的预料值:用9 =0.3x660 + (1-03x567.9 = 595.5,误差均方= 87514. 7。a二0.4时的预料值:用9 = 0.4x660 + (1-0.4)x591.1 = 618.7 ,误差均方= 62992. 5.。a二0. 5时的预料值:4=0.5x 660 + (1-0.5)x 606.5 = 633.3 ,误差均方= 50236。比较各误差平方可知,a=0.5更合适。(3)依据最小二乘法,利用Excel输出的回来结果如下:回来统计Multiple R0. 9673R Square0. 9356Adjusted RSquare0. 9316标准误差31.6628观测值18方差分析dfSSMSFSignifiedg = 239.73+21.92瞅。估计标准误差 sy = 3L6628。nee F回来分析1232982.5232982.5232. 39445. 99E-11残差1616040.491002. 53总计17249022.9Coefficients标准误差t StatP-valueLower 95%Upper95%Intercept239. 7320315. 5705515. 39655. 16E-11206.7239272. 7401X Variable 121.9287931. 43847415. 244495. 99E-1118. 8793624. 9782213.4下表是1981年一2000年我国财政用于文教,科技,卫生事业费指出额数据年份支出(万元)年份支出(万元)1981171. 361991708. 001982196. 961992792. 961983223. 541993957. 771984263. 1719941278. 181985316. 7019951467. 061986379. 9319961704. 251987402. 7519971903. 591988486. 1019982154. 381989553. 3319992408. 061990617. 2920002736. 88(1)绘制时间序列图描述其趋势。(2)选择一条适合的趋势线拟合数据,并依据趋势线预料2001年的支出额。具体答案:(1)趋势图如下:年份(2)从趋势图可以看出,我国财政用于文教, 科技,卫生事业费指出额呈现指数增长趋势,因此,选择指数曲线。经线性变换后,利用Excel输出的回来结果如下:回来统计Multiple R0. 998423R Square0. 996849Adjusted RSquare0. 996674标准误差0.022125观测值20方差分析dfSSMSFSignifica nee F回来分析12. 7876162. 7876165694. 8855. 68E-24残差180. 0088110. 000489总计192. 796427Coeffici ents标准误差t StatP-valueLower 95%Upper95%Intercept2.1636990.010278210. 52695. 55E-322.1421062. 185291X Variable 10.0647450. 00085875. 464465. 68E-240. 0629420. 066547log(Z>0) = 2.163699 ,综=145.78 . log(4) = 0.064745 ,瓦=1.1608 o 所以,指数曲线方程为: = 145.78x1.16082001 年的预料值为:绘1 = 145.78x1.160821 = 3338.9。13. 5我国1964年1999年的纱产量数据如下(单位:万吨):年份纱产量年份纱产量年份纱产量196497.01976196.01988465. 71965130. 01977223.01989476. 71966156. 51978238. 21990462.61967135. 21979263. 51991460.81968137. 71980292.61992501.81969180. 51981317.01993501. 51970205. 21982335.41994489. 51971190. 01983327.01995542. 31972188. 61984321.91996512. 21973196. 71985353. 51997559.81974180. 31986397.81998542.01975210.81987436.81999567.0(1)绘制时间序列图描述其趋势。(2)选择一条适合的趋势线拟合数据,并依据趋势线预料2000年的产量。具体答案:(1)趋势图如下:1964 96197Q 973 97Q 979 983 985 983 991994997年份(2)从图中可以看出,纱产量具有明显的线性趋势。用Excel求得的线性趋势方程为:7 = 69.5202 + 13.9495/ 2000年预料值为:Zooo = 69.5202 + 13.9495x37 = 585.65二585. 65 (万吨)。13.6对下面的数据分别拟合线性趋势线名=&。+”,二阶 曲线£ = 6。+卬和阶次曲线8 = % +卬+.£ +83。并对结果 进行比较。时间t观测值F时间t观测值F1372193602370203573374213564375223525377233486377243537374253568372263569373273561037228359前是未知的。而在参数假设检验中,则是先对口的值提出一个假 设,然后利用样本信息去检验这个假设是否成立。8. 2什么是假设检验中的显著性水平?统计显著是什么意思? 答:显著性水平是一个统计专出名词,在假设检验中,它的含义 是当原假设正确时却被拒绝的概率和风险。统计显著等价拒绝 H。,指求出的值落在小概率的区间上,一般是落在0. 05或比0. 05 更小的显著水平上。8. 3什么是假设检验中的两类错误?答:假设检验的结果可能是错误的,所犯的错误有两种类型,一 类错误是原假设H。为真却被我们拒绝了,犯这种错误的概率用 。表示,所以也称a错误或弃真错误;另一类错误是原假设为 伪我们却没有拒绝,犯这种错误的概论用B表示,所以也称B 错误或取伪错误。8. 4两类错误之间存在什么样的数量关系?答:在假设检验中,a及B是此消彼长的关系。假如减小a 错误,就会增大犯B错误的机会,若减小B错误,也会增大犯a错误的机会。8. 5说明假设检验中的P值答:P值就是当原假设为真时所得到的样本视察结果或更极端结 果出现的概率。(它的大小取决于三个因素,一个是样本数据及 原假设之间的差异,一个是样本量,再一个是被假设参数的总体分布。)113692936012367303571336731357143653235515363333561635934363173583536518359具体答案:在求二阶曲线和三阶曲线时,首先将其线性化,然后用最 小二乘法按线性回来进行求解。用Excel求得的趋势直线, 二阶曲线和三阶曲线的系数如下:直线二阶曲线三阶曲线Intercept374. 1613Intercept381.6442Intercept372. 5617XVariable1-0. 6137XVariable1-1.8272XVariable11. 0030X0.0337X-0. 1601Variable2Variable2XVariable30. 0036各趋势方程为:线性趋势:Y = 374.1613-0.6137/二阶 曲线:/ = 381.6442-1.8272/ + 0.0337”三阶 曲线:f = 372,5617 + 1.0030Z-0.1601Z2 +0.0036/。依据趋势方程求得的预料值和预料误差如下表:时间t观测值Y直线二阶曲线三阶曲线预料误差平 方预料误差平 方预料误差平 方1372373. 52. 4379.961.6373.42.02370372.98. 6378. 166.0374.015. 63374372. 32. 8376.56. 1374.20. 14375371. 710.8374.90. 0374.20.65377371. 134.9373.413.3374.08.96377370. 542.5371.926. 1373.611. 67374369.917. 1370.512.2373.01. 18372369. 37. 6369.27. 9372.20.09373368.619.0367.925.7371.23. 110372368.015.8366.727.6370.23. 311369367.42. 5365.611.4369.00.012367366.80. 0364.65. 9367.70.613367366. 20. 7363.611.6366.40. 314365365.60. 3362.75. 4365. 10.015363365.03. 8361.81. 4363.70. 516359364. 328.5361.04. 2362.311. 117358363. 732.8360.35. 4361.08.918359363. 116.9359.70. 5359.70. 519360362. 56. 3359. 10. 8358.42.420357361.923.9358.62. 5357.30. 121356361. 327.8358. 14. 6356.30. 122352360. 775.0357.833.2355.411. 323348360.0145. 1357.589.3354.643. 724353359.441.4357.217.7354.01. 125356358.87. 9357.01.1353.75. 526356358. 24. 9356.90. 9353.56. 327356357.62. 5356.90. 8353.65.928359357.04. 1356.94. 4353.925. 829360356.413.2357.09. 0354.529. 830357355. 71. 6357.20. 0355.52. 331357355. 13. 5357.40. 2356.70. 132355354. 50. 2357.77. 2358.311. 033356353.94. 4358. 14. 2360.318.434363353. 394.2358.520.4362.70. 135365352. 7151.8359.036.2365.40.2合计854.91524.71232.1直线:出-如= 5.09n-m V 35- 2二阶曲线:Zd) 5247出=J2±ZZ = 4.05n-m V 35-3三阶曲线:n-m232 1= 2.7435-4不同趋势线预料的标准误差如下:比较各预料误差可知,直线的误差最大,三阶曲线的误差 最小。从不同趋势方程的预料图也可以看出,三阶曲线及原序列 的拟合最好。14710 13 16 19 22 25 28 31 34时间13. 7下表是1981 2000年我国的原煤产量数据年份原煤产量(亿吨)年份原煤产量(亿吨).19816. 22199110.8719826. 66199211. 1619837. 15199311. 5019847. 89199412. 4019858. 72199513.6119868.94199613.9719879.28199713. 7319889.80199812. 50198910. 54199910. 45199010. 8020009. 98(1)绘制时间序列图描述其趋势。(2)选择一条适合的趋势线拟合数据,并依据趋势线预料2001年的产量。具体答案:(1)原煤产量趋势图如下:年份从趋势图可以看出,拟合二阶曲线比较合适。(2)用Excel求得的二阶曲线趋势方程为:Y, = 4.5824 + 0.9674/ 0.0309?2001年的预料值为:1001 = 4.5824+ 0.9674x21-0.0309 x212 =11.2713.8 一家贸易公司主要经营产品的外销业务,为了合理地组织货源,须要了解外销订单的变化状况。下表是 19972001年各月份的外销定单金额(单位:万元)。年/月19971998199920002001154.349. 156.764.461. 1246.650.452.054.569.4362.659.361.768.076. 5458.258.561.471.971.6557.460.062.469.474.6656.655.663.667.769. 9756. 158.063.268.071.4852.955.863.966.372. 7954.655.863.267.869. 91051.359.863.471.574.21154.859.464