2022年统计学复习题ab .pdf
一、判断题1.数学研究的量是抽象的量,而统计学研究的量是具体的、实际现象的量。 2. 当 H0用单侧检验被拒绝时,用同样的显著性水平双侧检验,则可能会拒绝也可能不会拒绝。() 3. 计算综合指数时,同度量因素既起同度量作用又起权数作用。 () 4. 抽样误差的产生是由于破坏了随机抽样的原则所造成的。 抽样中,全及群数确实定取决于每群的大小,而与抽选间隔长短无关。( ) 6. 计量一个企业的利润的多少的计量尺度是定距尺度即间隔尺度。 ( ) 7. 某厂劳动生产率原计划在去年的基础上提高10,计划执行结果仅提高5,则该厂劳动生产率计划仅完成一半。8. 累计增长量等于相应各逐期增长量之和。 () 9. 权数的实质是各组单位数占总体单位数的比重。 () 10. 显著性水平越小,犯检验错误的可能性越小。 () 11. 在由三个指数构成的指数体系中,两个因素的指数的同度量因素指标是不同时期的。( ) 12. 按有关标志排队的机械抽样误差等同于简单纯随机抽样的抽样误差。13. 定基增长速度等于相应各环比增长速度的连乘积。14. 组中值是各组的实际平均数的近似代表值,因此,用组中值来计算总平均数,只是一个近似值。( ) 15. 方差分析中,组间方差既包括随机误差又包括系统误差。( ) 16. 在确定样本单位数目时,假设总体成数方差未知,则P可取 0.5 。( ) 17. 在年度时间数列中,不可能存在季节变动成分。 ( ) 18. 假设现象的发展都以大体相同速度呈递增或递减变动,则宜配合直线方程。( ) 19. 某地区 2001年农村居民家庭按纯收入分组后计算的偏态系数965.03。 这说明农村居民家庭纯收入的分布为左偏分布。 ( ) 20. 各个变量值与其平均数离差的平方之和可以等于0。 ( ) 二、选择题1. 甲、乙、丙三人的数学平均成绩为72分,加上丁后四人的平均成绩为78 分,则丁的数学成绩为 A 。A. 96 B. 90 C 8 位销售员一个月销售某产品的数量制作的茎叶图则销售的中位数为 C 。A. 5 B. 45 C 3.10 个翻译当中有 8 个人会英语, 7 个人会日语。从这 10 个人当中随机地抽取一个人,他既会英语又会日语的概率为 B 。308762 55654精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 10 页B.108 B. 105 C. 107 D. 1014. 当观察数据呈现右偏时,应该选用测度数据的集中趋势。5. 在以下表达中,错误的选项是 C 。C.参数是对总体的一种数量描述,它的值总是已知的6. 估计量是指 A7. 在假设检验中,犯第类错误的概率称为 B 8. 由最小二乘法得到的回归直线,要求满足因变量的9. 下表是进出口总额与国内生产总值GDP 回归的 Excel 估计结果:Coefficients 标准误差t Stat Pvalue Intercept GDP Variable 1 此结果说明显著性水平005. A GDP 对进出口总值的影响不显著 B 进出总值对 GDP 的影响不显著C GDP 对进出口总值的影响显著 D 进出总值对 GDP 的影响显著10. 由一组数据的最大值、最小值、中位数和两个四分位数绘制而成的反映原始数据分布的图形是 D 。A 茎叶图 B 直方图 C 饼图 D 箱形图11. 在因变量的总离差平方和中, 如果回归平方和所占比重大,剩余平方和所占比重小,则两变量之间 。 A 相关程度高 B 相关程度低 C 完全相关 D 完全不相关12从由 2,4 和 10组成的总体中,采取重复抽样的方法抽取样本容量为3 的样本,则抽到特定样本的概率为 。 A 1/9 B 无法确定 C 1/3 D 1/27 13在方差分析中,每个因子下得到的样本数据称为 D 。A 因素 B 方差 C 处理 D 观测值14. 如果分布是左偏的,则 B 。A 众数均值中位数 B 众数中位数均值 C 均值中位数众数D 均值众数中位数精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 10 页15. 假设无季节变动,则季节比率为 B 。 A 0 B 1 C 大于 1 D 小于 1 16. 美国 10家公司在电视广告上的花费如下百万美元:72,63.1,54.7, 54.3, 29, 26.9, 25, 23.9, 23, 20。以下图示法不宜用于描述这些数据的是 。A. 直方图 B.茎叶图 C. 散点图 D. 饼图17. 如果分布是左偏的,则 B 。A. 众数均值中位数 B. 众数中位数均值 C. 均值中位数众数D. 均值众数中位数18. 智商的得分服从均值为100,标准差为 16的正态分布。 从总体中抽取一个容量为n 的样本,样本均值的标准差为 2,样本容量为 B 。A. 16 B. 64 C. 8 D. 无法确定19. 以样本均值为估计量对总体均值进行区间估计,且总体方差已知,则如下说法正确的选项是 。A. 95%的置信区间比 90% 的置信区间宽 B. 样本容量较小的置信区间较小C. 相同置信水平下,样本量大的区间较大 D. 样本均值越小,区间越大=0.05,下面的表述正确的选项是 。A. 拒绝 H0的概率为 5% B. 不拒绝 H0的概率为 5% C. 与显著性水平的大小无关% D. H0为真时被拒绝的概率为5% 21. 当样本容量一定时,拒绝域的面积 。A. 与显著性水平的大小无关 B. 与显著性水平的大小成正比 C. 与显著性水平的大小成反比 D. 与样本观测值有关22. 方差分析中,检验统计量是 B 。A. 组间平方和除以组内平方和 B. 组间均方和除以组内均方C. 组间平方和除以总平方和 D. 组间均方和除以总均方23. 在因变量的总离差平方和中, 如果回归平方和所占比重大,剩余平方和所占比重小,则两变量之间 。 A. 相关程度高相关程度低完全相关完全不相关24. 已知相临几期的环比增长速度分别为8.12%, 6.42%, 5.91%, 5.13%, 则相应的定基增长速度为 。A. %6.42%5.91%5.13% B. 8.12%6.42%5.91%5.13%100% C. D. 1.0513100% 25. 以下指标中不属于统计指数的是 。A两期同一商品价格的比值 B 两地同一商品价格的比值C某校实际招生人数与计划招生人数的比值 D某校理工科招生人数与招生总数的比值f ,则方差 。 A变大 B不变 C变小 D无法确定27从由 2,4 和 10组成的总体中,采取重复抽样的方法抽取样本容量为3 的样本,则抽到特定样本的概率为 B 。 A 1/9 B无法确定 C1/3 D1/27 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 10 页28当正态总体的方差已知时,在小样本条件下,估计总体均值使用的分布是 A 。A正态分布 Bt 分布 C分布 DF分布29在一次假设检验中,当显著性水平=0.01 原假设被拒绝时,则用 =0.05 时 。A一定会被拒绝 B一定不会被拒绝 C需要重新检验 D有可能拒绝原假设30在方差分析中,每个因子下得到的样本数据称为 D A因素 B方差 C处理 D观测值三、简答题1.1解释总体与样本、参数和统计量的含义。答:总体: 所研究的全部个体 (元素) 的集合。样本: 从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。参数: 研究者想要了解的总体的某种特征值,参数通常是一个未知的常数。统计量: 根据样本数据计算出来的一个量。由于样本是我们所已经抽出来的,所以统计量总是知道的。2解释总体分布、样本分布和抽样分布的含义。抽样分布就是由样本n 个观察值计算的统计量的概率分布。3. 甲企业近四年产品销售量分别增长了9% 、7% 、8% 、6% ;乙企业这四年产品的次品率也正好是9% 、7% 、8% 、6% 。这两个企业这四年的平均增长率和平均次品率的计算是否一样?为什么?4解释置信水平、置信区间、显著性水平的含义,它们有什么联系。答:置信水平是指总体参数值落在样本统计值某以正负区间内的概率。而置信区间是指在某以置信水平下,样本统计值与总体参数值的误差范围。5样本统计量的分布和总体分布的关系是什么?6. 简述假设检验的一般步骤。答:(1) 陈述原假设 H0和备择假设 H1 ;(2) 从所研究的总体中抽了不起一个随机样本;(3) 确定一个适当的检验统计量,并利用样本数据算出来具体数值;(4) 确定一个适当的显著性水平a,并计算出其临界值,指定拒绝域; (5) 将统计量的值与临界值进行比较,并做出决策:假设统计量的值落在拒绝域内,拒绝原假设H0 ,否则不拒绝原假设H0 。7简述第类错误和第类错误的概念,它们发生的概率之间存在怎样的关系?答:当原假设为真时拒绝原假设,所犯的错误称为第类错误,又称为弃真错误,犯第类错误的概率通常记为 a。当原假设为假时没有拒绝原假设,所犯的错误称为第类错误,又称为取伪错误,犯第类错误的概率通常记为 b。两者的关系:当 a 增大时, b 减小;当 b 增大时, a 减小。8简述众数、中位数和均值的特点和应用场合。答:众数是一种位置代表值,它的应用场合比较有限;中位数具有稳健性,数据值与中位数之差的绝对值之和最小;均值就是算术平均数,是数据集中趋势的最主要测度值。众数最容易计算,但不是永远存在,同时作为集中趋势代表值应用的场合很少;中位数很容易理解、很直观,它不受极端值的影响,这既是它有价值的方面,也是它数据信息利用不够充分的地方;均值是对所有数据平均后计算的一般水平代表值,数据信息提取得最充分。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 10 页9. 简述移动平均法的基本原理和特点。答:移动平均法的 基本原理 ,是通过移动平均消除时间序列中的不规则变动和其他变动,从而揭示出时间序列的长期趋势。移动平均具有如下特点:当时间数列的变动趋势为线性状态时,可采用移动平均法进行描述和分析。该方法是通过扩大原时间数列的时间间隔,并按一定的间隔长度逐期移动,分别计算一系列移动平均数,由这些平均数形成的新的时间数列对原时间数列的波动起到一定的修匀作用,削弱了原数列中短期偶然因素的影响,从而呈现出现象发展的变动趋势。10简述加权平均指数的基本编制原理。答:(1) 为了对复杂现象总体进行比照分析,首先对构成总体的个别元素计算个体指数,所得到的无量纲化的相对数是编制总指数的基础;(2) 为了反映个别元素在总体中的重要性的差异,必须以相应的总值指标作为权数对个体指数进行加权平均,就得到说明总表达象数量比照关系的总指数。11. 简述编制总指数的两种方法的区别与联系。答:编制总指数的两种基本形式是综合指数和平均指数。区别主要表现在三个方面:(1) 解决复杂总体不能直接同度量问题的基本思路不同。综合指数的特点是 “先综合, 后比照” ;而平均数指数的特点是 “先比照,后综合” 。(2) 运用资料的条件不同。综合指数要求全面调查的资料;而平均指数既可以用于全面调查资料的情况,也可以用于非全面调查资料的情况。(3) 在经济分析中的作用不同。平均指数除作为综合指数变形加以应用的情况外,主要是用以反映复杂总体的变动方向和程度,一般不用于因素分析;而综合指数则由于用以比照的问题指标有明确的经济内容,因此,在经济分析中,不仅用以说明复杂总体的变动方向和程度,而且用以进行因素分析,且能说明因素变动对对象变动影响的绝对量。联系的表现: 在一定的权数条件下,两类指数之间有变形关系,即平均指数可作为综合指数的变形形式加以应用。12简述样本容量与置信水平、总体方差、允许误差的关系。答:样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与允许误差成反比,可以接受的允许误差越大,所需的样本容量就越小。13比较单侧检验和双侧检验的区别。14简述方差分析的基本思想。答:方差分析的基本思想是,将观察值之间的总变异分解为由所研究的因素引起的变差和由随机误差项引起的变差,然后计算这两类变差的均值分别除以其自由度得到组间方差和组内方差。如果所研究的因素对因变量无显著影响,这两个方差会趋于一致。因素的影响越显著,二者的差异越大。在零假设成立时组间方差与组内方差的比值服从F 分布。因此我们可以设定一个显著性水平,通过对这个F 统计量的检验做出接受或拒绝原假设的决策。15解释因子和处理的含义。答:在方差分析中,所要检验的对象称为因子,因子的不同表现称为处理。四、计算题1第四章例题。 2第五章习题的第2、4、6 题3 第六章一个总体均值的检验相关例题。4第七章习题的第1、3、5、7 题。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 10 页5 第八章:简单线形回归及其方差分析表。6第九章习题的第1、3、5、7 题。7第十章习题的第1、3、6、7 题。一、(20 分) 一种产品需要人工组装,现有三种可供选择的组装方法。为比较哪种方法更好,随机抽取10 个工人,让他们分别用三种方法组装。 下面是 10 个工人分别用三种方法在相同时间内组装产品数量单位:个的描述统计量:方法 1 方法 2 方法 3 平均平均平均中位数165 中位数129 中位数众数164 众数129 众数126 标准差标准差标准差峰值峰值峰值偏斜度偏斜度偏斜度极差8 极差4 极差3 最小值162 最小值127 最小值125 最大值170 最大值131 最大值128 (1) 你准备采用什么方法来评价组装方法的优劣?试说明理由;(2) 如果让你选择一种方法,你会作出怎样的选择?试说明理由。答: 1用离散系数。因为标准差不能用于比较不同组别数据的离散程度。2三种组装方法的离散系数分别为:015.0Av,009. 0Bv,007.0Cv。虽然方法 A 的离散程度要大于其他两种方法,但其组装产品的平均数量远远高于其他两种方法。所以还是应该选择方法A。二、 (20 分)从一批零件中随机抽取36个,测得其平均长度为,标准差为。(1)试确定该种零件平均长度95%的置信区间。(2)假设要求该种零件的标准长度应为150cm,用假设检验的方法和步骤检验该批零件符合标准要求?05.0 。(3)在上面的估计和检验中,你使用了统计中的哪一个重要定理?请简要解释这一定理。163.05.1493693. 196. 15 .1492nszx148.87 ,150.13 2150:0H,150:1H。检验统计量55. 13693. 11505.149z,由于96. 155.12zz。不拒绝原假设。符合要求。3使用了中心极限定理。从均值为、方差为2的总体中,抽取容量为n的随机样本,当 n充分大时通常要求30n ,样本均值x的抽样分布近似服从均值为、方差为n2的正态分布。三、(20 分)一家产品销售公司在30 个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 10 页x1 、各地区的年人均收入 (x2)、广告费用 (x3)之间的关系,搜集到30 个地区的有关数据。利用Excel得到下面的回归结果05.0 :方差分析表变差来源df SS MS F Significance F 回归残差总计29 参数估计表Coefficients 标准误差t Stat P-value Intercept X Variable 1 X Variable 2 X Variable 3 (1) 将方差分析表中的所缺数值补齐。2 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。3 检验回归方程的线性关系是否显著?4 检验各回归系数是否显著?5 计算判定系数2R,并解释它的实际意义。6 计算估计标准误差ys,并解释它的实际意义。1变差来源df SS MS F Significance F 回归3 残差26 总计29 23215012.06107.808861.1171025.7589?xxxy回归系数8861.117?1表示:在年人均收入和广告费用不变的条件下,销售价格每增加1 元,销售量平均减少 117.8861个单位;6107.80?1表示:在年销售价格和广告费用不变的条件下,人均收入每增加 1 元,销售量平均增加80.6107 个单位;5012.0?3表示:在年销售价格和人均收入不变的条件下,广告费用增加 1元,销售量平均增加0.5012个单位。3由于 Significance F=0.05。拒绝原假设,线性关系显著。4各回归系数检验的P值分别为:、 、 ,均小于 0.05 ,说明各回归系数均显著。5%36.897.134585861.120267742R。它表示在销售量的总变差中,被销售价格、年人均收入、广告费用精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 10 页与销售量之间的线性关系所解释的比例为89.36%。667.23413306.1431812ys。它表示销售价格、年人均收入和广告费用预测销售量时的平均预测误差为234.67元。一、 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100 克。现从某天生产的一批产品中按重复抽样随机抽取50 包进行检查,测得每包重量(克)如下:每包重量克包数9698 2 98100 3 100102 34 102104 7 104106 4 合计50 已知食品包重服从正态分布,要求:(1)确定该种食品平均重量95%的置信区间;(2)如果规定食品重量低于100克属于不合格,确定该批食品合格率95%的置信区间;(3)采用假设检验方法检验该批食品的重量是否符合标准要求?写出检验的具体步骤。注:96. 1025.02zz132.101x,63.1s。45.032.1015063.196.132.1012nszx100.87 ,101.77 210.0505p。08.010. 050)10.01 (10.096.110. 0)1(2nppzp2%,18% 3100:0H,100:1H。检验统计量73.55063.110032.101z,由于96.173.52zz。拒绝原假设。不符合要求。二、 15 分)随着零售业市场竞争的日益加剧,各零售商不断推出新的促销策略。物通百货公司准备利用五一假日黄金周采取部分商品的大幅度降价策略,旨在通过降价赢得顾客、提高商品的销售额,同时也可以进一步调整商品的结构。为分析降价对销售额带来的影响,公司收集的降价前一周和降价后一周集中主要商品的有关销售数据,如下表:几种主要商品一周的销售数据精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 10 页商品名称计量单位价格元销售量降价前降价后降价前降价后甲台3200 2560 50 70 乙套860 516 120 180 丙件180 126 240 336 (1) 降价后与降价前相比,三种商品的总销售额增长的百分比是多少?销售额增长的绝对值是多少?(2) 以降价后的销售量为权数,计算三种商品的平均降价幅度是多少?由于降价而减少的销售额是多少?(3) 以降价前的价格为权数,计算三种商品的销售量平均增长幅度是多少?由于销售量增长而增加的销售额是多少?(4) 说明你在分析上述问题时采用的是什么统计方法?采用该方法的理由是什么?1三种商品的总销售额增长的百分比:%62.21%62.1021306400314416124018012086050320033612618051670256010011qpqp销 售 额 增 长 的 绝 对 值 (元)80163064003144160011qpqp2三种商品的平均降价幅度:%42.281%58.71143928031441613361801808607032003361261805167025601101101qpqpp由 于 降 价 而 减 少 的 销 售 额 (元)1248644392803144161011qpqp3三种商品的销售量平均增长幅度:%37.431%37.143130640043928012401801208605032003361801808607032001001001qpqpq由于销售量增长而增加的销售额(元)1328803064004392800010qpqp4采用的是统计指数方法。由于所要分析的是三种不同商品销售额、价格和销售量的综合变动。要进行综合并进行比照,通常要采用指数的方法。课后习题答案71:0215.86574.401. 0FF(或01.00409.0valueP),不能拒绝原假设。73 方差分析表中所缺的数值如下表:差异源SS df MS F P 值F 临界值组间420 2 210 组内3836 27 总计4256 29 554131. 3478. 105. 0FF(或05.0245946.0valueP),不能拒绝原假设。9443.60727.005. 0FF地区(或05.09311.0valueP),不能拒绝原假设。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 10 页9443.61273. 305. 0FF包装方法(或05.01522.0valueP),不能拒绝原假设。9.1 13031.0621.05= 30万辆299(30 2)/(301.078)12/1.07817.11%3设按 7.4%的增长速度 n 年可翻一番则有1.07460 /302n所以n年故能提前年到达翻一番的预定目标。9.31发展总速度%12.259%)81(%)101(%)121(343平均增长速度 =%9892. 91%12.2591028 .561%)61(5002亿元3平均数415.142457041jjyy亿元 , 2002 年一季度的计划任务:625.1495.142%105亿元 。10.1 1%73.1072.20398.2196,%16.1042.2039212400010001qpqpLpqpqLpq;2%39.10721242281,%83.1038.2196228110111011qpqpPpqpqPpq。3 略。10.31%27.93125550117100,%83.921018009450010111011pqpqPzqzqPqq。2略。10.6 2.43%12360;0.24%67.6360,%67.106%105%112;2.19%5%67.106360;2.432.190.24,%112%105%67.106。10.7 3483.220904908,6967.220905636,3816.21960466810假定xxx3816.26967.23483.26967.23816.23483.2,%23.113%84.114%60.983816.26967.21960209046685636%23.113%63.106%74.120,6.6586.309968精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 10 页,共 10 页