《统计学考试试卷A及答案解析.doc》由会员分享,可在线阅读,更多相关《统计学考试试卷A及答案解析.doc(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、,20122013学年第二学期闽江学院考试试卷考试课程: 统计学试卷类别:A卷 B卷 考试形式:闭卷 开卷适用专业年级:2011级金融学、国际贸易学、保险学专业注明:试卷答案请做在答题纸上。一、单选题(每题1分,共30分,30%)1. 下列不属于描述统计问题的是( )A根据样本信息对总体进行的推断B了解数据分布的特征C分析感兴趣的总体特征D利用图,表或其他数据汇总工具分析数据2. 根据样本计算的用于推断总体特征的概括性度量值称作( )A 参数 B. 总体C样本 D. 统计量3. 通过调查或观测而收集到的数据称为( )A 观测数据 B. 实验数据C 时间序列数据 D. 截面数据4. 从总体中抽取
2、一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为( )。A.重复抽样 B.不重复抽样C.分层抽样 D.整群抽样5. 调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这样的调查方式称为( )。A 系统抽样 B 整群抽样C 滚雪球抽样 D 判断抽样6. 下面的哪一个图形最适合于描述结构性问题( ) A.条形图 B.饼图 C.雷达图 D.直方图7. 对于大批量的数据,最适合描述其分布的图形是( ) A.条形图 B.茎叶图 C.直方图 D.饼图8. 将某企业职工的月收入依次分
3、为2000元以下、2000元3000元,3000元4000元、4000元5000元、5000元以上几个组。最后一组的组中值近似为( ) A.5000 B.7500 C.5500 D.65009. 下列关于众数的叙述,不正确的是( )A.一组数据可能存在多个众数 B.众数主要适用于分类数据C.一组数据的众数是唯一的 D.众数不熟极端值的影响 10. 一组数据的最大值与最小值之差称为( )A. 平均数 B.规范差 C.极差 D.四分位差11.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k3,其意义是()A.至少有75%的数据落在平均数加减3个规范差的范围之内B. 至少有89%的数据落在平均
4、数加减3个规范差的范围之内C至少有94%的数据落在平均数加减3个规范差的范围之内D. 至少有99%的数据落在平均数加减3个规范差的范围之内12. 下列不是次序统计量的是()。A. 中位数 B. 均值C. 四分位数 D. 极差13. 根据中心极限定理可知,当样本容量无限大时,样本均值的抽样分布服从正态分布,其分布的方差为()。A.B. C. D.14. 大样本的样本比例之差的抽样分布服从( )A正态分布Bt分布CF分布D开方分布15. 在参数估计中,要求通过样本的统计量来估总体参数,评价统计量的规范之一是使它与总体参数的离差越小越好。这种评价规范称为( )A无偏性B有效性C一致性D充分性16.
5、当正态总体的方差未知时,在小样本条件下,估计总体均值使用的分布是( )A.正态分布 B.t分布 C.分布 D.F分布17. 对于非正态总体,使用统计量估计总体均值的条件是()A.小样本 B.总体方差已知 C. 总体方差未知 D.大样本18. 从一个正态总体中随机抽取一个容量为n的样本,其均值和规范差分别为33和4.当n=5时,构造总体均值U的95%的置信区间为( )A334.97 B. 332.22 C. 331.65 D. 331.9619. 在假设检验中,不拒绝原假设意味着( )A、原假设肯定是正确的B、原假设肯定是错误的C、没有证据证明原假设是正确的D、没有证据证明原假设是错误的20.
6、指出下列假设检验那一个属于右侧检验( )A、H0:= 0,H1:0B、H0:0,H1:0D、H0:0,H1:021. 从正态总体中随机抽取一个n=25的随机样本,计算得到=231.7,s=15.5,假定=50,在=0.05的显著性水平下,检验假设:20,20,得到的结论是( )A.拒绝B.不拒绝C.可以拒绝也可以不拒绝D.可能拒绝也可能不拒绝22. 检验两个总体的方差比时所使用的分布为( )。A.正态分布 B.t分布 C. 2分布 D.F分布23.列联分析是利用列联表来研究( )。A两个分类变量的关系B两个数值型变量的关系C一个分类变量和一个数值型变量的关系D两个数值型变量的分布24. 组间误
7、差是衡量不同水平下各样本数据之间的误差,它( )A只包括随机误差B只包括系统误差C既包括随机误差,也包括系统误差D有时包括随机误差,有时包括系统误差25. 有交互作用的双因素方差分析是指用于检验的两个因素( )。A对因变量的影响是独立的B对因变量的影响是有交互作用的C对自变量的影响是独立的D对自变量的影响是有交互作用的26. 下面的陈述哪一个是错误的( )A 相关系数是度量两个变量之间线性关系强度的统计量B 相关系数是一个随机变量C 相关系数的绝对值不会大于1 D 相关系数不会取负值27. 由最小二乘法得到的回归直线,要求满足因变量的( )A.平均值与其估计值的离差平方和最小B.实际值与其平均
8、值的离差平方和最小C.实际值与其估算值的离差和为0D.实际值与其估计值的离差平方和最小28.时间序列在一年内重复出现的周期性波动称为( )。A趋势 B季节性 C周期性 D. 随机性29. 移动平均法适合于预测( )A平稳序列 B.非平稳序列C.有趋势成分的序列 D.有季节成分的序列30. 一种新产品在刚刚问世时,初期的市场需求量增长很快,当社会拥有量接近饱和时,需求量逐渐趋于某一稳定水平。你认为描述这种新产品的发展趋势采用下列哪种趋势线比较合适( )A. 趋势直线 B. 修正指数曲线C. Gompertz曲线 D. 二次曲线二、判断题(每题1分,共10分,10 %。 正确的打,错误的打1. 总
9、体回归函数中的回归系数是常数,样本回归函数中的回归系数的估计量是随机变量。( )2. 在假设检验中如显著性水平降低,意味着拒绝域扩大化。( )3. 假设检验中,犯第类错误的真实概率就是P值(P-value)。( )4. 某班学生的年龄分布是右偏的,均值为22,规范差为4.45.如果采取重复抽样的方法从该班抽取容量为100的样本,则样本均值的抽样分布是正态分布,均值为22,规范差为0.445。( )5. 一组数据的众数是唯一的。( )6. 为了调查某校学生的购书费用支出,将全校学生名单按拼音顺序排列后,每隔50个名学生抽取一名学生进行抽查,这种调查方法是整群抽样。( )7.进行方差分析时,对数据
10、有4个基本的假定,即正态性、方差齐性、独立性和一致性。( )8.在一元线性回归分析中,估计规范误差是残差平方和的均方根。( )9. 经验法则表明,当一组数据对称分布时,在平均数加减2个标注差的范围之内大约有95的数据。( )10.假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布也服从均匀分布。( )三、名词解释(每题3分,共15分,15%)1. 比率(ratio)2. 分层抽样(stratified sampling)3. 方差(variance)4. 区间估计(interval estimate)5. 原假设(null hypothesis)四、简答题(每题5分,共
11、20分,20 %)1.鉴别图表优劣的准则有哪些?2. 什么是假设检验中的第一类和第二类错误?是否有可能同时降低两类错误的可能性?3.什么是回归分析中的随机误差项和残差?它们之间的区别是什么?4.简述时间序列的构成要素。五、计算题(1、2、3题各5分,第4题10分,共25分,25 %)1. 从一个规范差为5的总体中采用重复抽样方法抽出一个样本为40的样本,样本均值为25。(1)样本均值的规范差等于多少?(2分)(2)在95%的置信水平下,估计差是多少?(3分)2. 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合规范的比例超过5
12、%就不得出厂,问该批食品能否出厂(a=0.05)?3. 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果: 方差分析表差异源SSdfMSFP-valueF crit组间组内总计( )3836( )( )( )29210( )( )0.2459463.354131要求:(1)完成上面的方差分析表。(3分)(2)若显著水平=0.05,检验三种方法组装的产品数量之间是否有显著差异。(2分)4. 根据下面的数据:x 15819125y4736564421我们可以通过E
13、xcel获得:回归统计Multiple R0.968167R Square0.937348Adjusted R Square0.916463规范误差3.809241观测值5方差分析dfSSMSFSignificance F回归分析( )651.2691( )44.883180.006785216残差( )43.53094( )总计4694.8Coefficients规范误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept13.625414.3994283.0970860.053417-0.37553522227.62635-0.3
14、755427.62635X Variable 12.3029320.3437476.6994910.0067851.2089744243.3968891.2089743.396889请完成(1)写出Excel的基本步骤并完成上述表内的df,MS的值。(3分)(2)建立回归方程,并解读该方程。(3分)(3)计算残差、判定系数R2、估计规范误差Se ,并分析回归方程的拟合程度。(4分)20122013学年第二学期闽江学院考试试卷答题纸考试课程: 统计学试卷类别:A卷 B卷 考试形式:闭卷 开卷适用专业年级:2011级金融学、国际贸易学、保险学专业 装 订 线班级 姓名 学号题号一二三四五总分得分一
15、、单项选择题(每题1 分,共 30分,30%)得分评分规范:每小题1分,多选、少选、错选均不得分。 123456789101112131415161718192021222324252627282930二、判断题(每题 1分,共 10分,10%)得分评分规范:每小题1分,不选择不得分,判断错误扣0.5分。12345678910三、 名词解释(每题3分,共15分,15%)得分1. 比率(ratio):2. 分层抽样(stratified sampling):3. 方差(variance):4. 区间估计(interval estimate):5. 原假设(null hypothesis):四、简
16、答题(每题 4分,共20分,20%)得分1.鉴别图表优劣的准则有哪些?2. 什么是假设检验中的第一类和第二类错误?是否有可能同时降低两类错误的可能性?3.什么是回归分析中的随机误差项和残差?它们之间的区别是什么?4.简述时间序列的构成要素。五、 计算题(1、2、3题各5分,第4题10分,共25分,25 %)得分2.20122013学年第二学期闽江学院考试试卷参考答案及评分规范考试课程:统计学试卷类别:A卷 B卷考试形式:闭卷 开卷适用专业年级:2011级金融学、国际贸易学、保险学专业一、单项选择题(每题1 分,共 30分,30%)得分评分规范:每小题1分,多选、少选、错选均不得分。 12345
17、678910ADAACBCCCC11121314151617181920BBDABBDADC21222324252627282930BDACBDDBAB二、判断题(每题 1分,共 10分,10%)得分评分规范:每小题1分,不选择不得分,判断错误扣0.5分。12345678910三、 名词解释(每题3分,共15分,15%)得分1. 比率(ratio):一个样本(或总体)中各不同类别数据之间的比值。2. 分层抽样(stratified sampling):也称分类抽样,在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。3. 方差(variance):各数据与
18、其平均数离差平方的平均数。4. 区间估计(interval estimate):在点估计的基础上,给出总体参数估计的一个估计区间,该区间通常由样本统计量加减估计误差组成。5. 原假设(null hypothesis):又称零假设,研究者想收集证据予以推翻的假设,用H0 表示,它所表达的是参数没有变化或变量之间没有关系。四、简答题(每题 4分,共20分,20%)得分1.鉴别图表优劣的准则有哪些?答:(1)精心设计,有助于洞察问题的实质;(1分)(2)使复杂的观点得到简明、确切、高效的阐述;(1分)(3)能在最短的时间内,以最少的笔墨给读者提供最大的信息;(1分)(4)是多维的;(1分)(5)表述
19、数据的真实情况。(1分)2. 什么是假设检验中的第一类和第二类错误?是否有可能同时降低两类错误的可能性?答:在统计检验中:原假设是真实的,却拒绝原假设称作假设检验的“第一类错误”(1.5分)。原假设是不真实的,判断结论却接受原假设,这是“第二类错误”(1.5分)。在样本一定条件下,犯第二类错误的概率与犯第一类错误的概率相互之间呈反向变动关系。但是通过增大样本容量,减小抽样分布的离散性,有可能同时降低两种错误的概率(2分)。3.什么是回归分析中的随机误差项和残差?它们之间的区别是什么?答:随机误差项t反映除自变量外其他各种微小因素对因变量的影响。它是t与未知的总体回归线之间的纵向距离,是不可直接
20、观测的。(2.5 分)。残差t是t与按照回归方程计算的的差额,它是t与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算出t的具体数值。利用残差可以对随机误差项的方差进行估计。(2.5分)4.简述时间序列的构成要素。答:时间序列构成要素有四种,它们是趋势(T)、季节变动(S)、周期性或循环波动(C)和不规则波动(I)(2分)。(1)趋势也称为长期趋势,是指时间序列在长时期内呈现出来的某种持续向上或持续下降的变动。它是由某种固定性的因素作用于序列而形成的。它可以是线性的,也可以是非线性的。(1分)(2)季节变动是指时间序列在一年内重复出现的周期性波动。(1分)(3)循环波动
21、或周期性波动是指时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。它不同于趋势变动,不是朝着单一的方向持续运动,也不同于季节变动,季节变动有比较固定的规律,且变动周期为一年,而循环波动则无固定的规律,变动周期多为一年以上,且周期长短不一。周期性通常是由于经济环境的变化而引起的。随机性或不规则波动是由于一些偶然性的因素产生的。(1分)五、 计算题(每题5分,共25分,25%)得分1. 从一个规范差为5的总体中采用重复抽样方法抽出一个样本为40的样本,样本均值为25。(1)样本均值的规范差等于多少?(2)在95%的置信水平下,估计差是多少?解:已知,n=40,.(1分)(1)样本均值的抽样
22、规范差 (2分)(2)边际误差E=1.96=1.55 (2分)2. 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合规范的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)?解: (1分)假设:(1分) (2分)拒绝原假设,该批食品不能出厂。(1分)3. 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果: 方差分析表差异源SSdfMSFP-valueF crit组间组内总计( )383
23、6( )( )( )29210( )( )0.2459463.354131要求:(1)完成上面的方差分析表。(3分)(2)若显著水平=0.05,检验三种方法组装的产品数量之间是否有显著差异。(2分)解:(1)方差分析表中所缺的数值如下表:差异源SSdfMSFP-valueF crit组间组内总计4203836425622729210142.071.4780.2459463.354131(2)由方差分析表分析可知:P-value=0.246946=0.05(或F=1.478=3.354131,不能拒绝原假设。即没有证据表明3种方法组装的产品数量之间有显著差异。4. 根据下面的数据:x 15819
24、125y4736564421我们可以通过Excel获得:方差分析dfSSMSFSignificance F回归分析( )651.2691( )44.883180.006785216残差( )( )( )总计4694.8Coefficients规范误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept13.625414.3994283.0970860.053417-0.37553522227.62635-0.3755427.62635X Variable 12.3029320.3437476.6994910.0067851.20897
25、44243.3968891.2089743.396889回归统计Multiple R0.968167R Square0.937348Adjusted R Square0.916463规范误差3.809241观测值5请完成(1)写出Excel的基本步骤并完成上述表内的df,MS的值。(3分)(2)建立回归方程,并解读该方程。(3分)(3)计算残差平方和、判定系数R2、估计规范误差Se ,并分析回归方程的拟合程度。(4分)解:(1)Excel的步骤第一步,选择Excel中【工具】下拉菜单,并选择【数据分析】选项。第二步,在分析工具中选择【回归】,然后单击【确定】。第三部,当对话框出现时:输入X、Y值的区域位置,在输出区域选择输出区域在残差项中选择残差、规范残差。单击【确定】回归分析的df=1,MS=651.27,残差的df=3,MS=14.5 (2)由Excel结果我们可建立回归方程为,回归系数表明,x每增加1个单位,y平均增加2.3029个单位;(3)残差平方和=43.53094,判定系数R2=93.74%,表明回归方程的拟合度较高;估计规范误差Se=3.8092,表明用x来预测y时平均的预测误差为3.8092。
限制150内