《2023秋社会统计学期末复习训练题.docx》由会员分享,可在线阅读,更多相关《2023秋社会统计学期末复习训练题.docx(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023秋社会统计学期末复习训练一、单项选择题1 .为了解IT行业从业者收入水平,某探讨机构从全市IT行业从业者随机抽 取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回 答他们每月用于消遣消费在1000元以上。此处800人是()A.样本B.总体C.统计量D.变量2 .在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为 ( )A.频率8 .累积频数C.累积频率D.比率3.离散系数的主要目的是()A.反映一组数据的平均水平B.比较多组数据的平均水平C.反映一组数据的离散程度D.比较多组数据的离散程度4 .阅历法则表明,当一组数据正态分布时,在平均数加减1个标
2、准差的范 围之内大约有()A. 50%的数据B. 68%的数据C. 95%的数据D. 99%的数据5 .在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、 63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这 10 家企业50.对消费的回来分析中,学历、年龄、户口、性别、收入都是因变量,其 中收入的回来系数为0.8,这表明()A.收入每增加1元,消费增加0.8元B.消费每增加1元,收入增加0. 8元C.收入与消费的相关系数为0.8D.收入对消费影响的显著性为0.851 .先将总体按某标记分为不同的类别或层次,然后在各个类别中采纳简洁
3、 随机抽样或系统抽样的方式抽取子样本,最终将全部子样本合起来作为总样本, 这样的抽样方式称为()A.简洁随机抽样B.系统抽样C.整群抽样D.分层抽样52 .在频数分布表中,某一小组中数据个数占总数据个数的比例称为()A.频率B.频数C.频次D.频谱53 .某专业共8名同学,他们的统计课成果分别为86、77、97、94、82、 90、83、92,那么该班考试成果的中位数是()A. 86B. 77C. 90D. 8854.阅历法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有()A. 50%的数据B. 68%的数据C. 95%的数据D. 99%的数据55.残差平方和(SSE)反
4、映了 y的总变差中()A.由于x与y之间的线性关系引起的y的改变部分B.除了 x对y的现有影响之外的其他因素对y变差的影响C.由于x与y之间的非线性关系引起的y的改变部分D.由于x与y之间的函数关系引起的y的改变部分56 .某项探讨中欲分析受教化年限每增长一年,收入如何改变,下列哪种方 法最合适()A.回来分析B.方差分析C.卡方检验D.列联表分析57 .用样本统计量的值构造一个置信区间,作为总体参数的估计,这种方法 称为()A.点估计B.区间估计C.有效估计D.无偏估计58 .在假设检验中,虚无假设和备择假设()A.都有可能成立B.都不行能成立C.有且只有一个成立D.备择假设确定成立,虚无假
5、设不确定成立59 .方差分析的目的是()A.比较不同总体的方差是否相等B.推断总体是否存在方差C.分析各样本数据之间是否存在显著差异D.探讨各分类自变量对数值型因变量的影响是否显著60 .用于说明回来方程中拟合优度的统计量主要是()A.相关系数B.离散系数C.回来系数D.判定系数61 .为了解某地区的消费,从该地区随机抽取5000户进行调查,其中30%回 答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300 元以上。此处5000户是()A.变量B.总体C.样本D.统计量62 .当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形 ( )A.环形图B.饼图C.直
6、方图D.条形图63 .假如一组数据中某一个数值的标准分值为1.8,这表明该数值()A.是平均数的1.8倍B.比平均数多1.8C.等于标准差的1.8倍D.比平均数高出1.8个标准差64.离散系数的主要目的是()A.反映一组数据的平均水平B.比较多组数据的平均水平C.反映一组数据的离散程度D.比较多组数据的离散程度65.某班级学生期末统计学考试平均成果为82分,标准差为5分。假如已 知这个班学生的考试分数听从正态分布,可以推断成果在77-87之间的学生大约 占全班学生的()A. 68%B. 89%C. 90%D. 95%66.已知某单位平均月收入标准差为700元,离散系数为0.2,那么他们月 收入
7、的均值为()A. 700B. 0. 2C. 3500D. 14067.依据一个详细的样本求出的总体均值95%的置信区间()A.以95%的概率包含总体均值B. 5%的可能性包含总体均值C.确定包含总体均值D.确定不包含总体均值68 .在因变量的总离差平方和中,假如回来平方和所占的比例越小,则自变量和因变量之间(A.相关程度越高B.相关程度越低C.完全相关D.没有任何关系69 .从两个总体中共选取了 8个视察值,得到组间平方和为432,组内平方 和为426,则组间均方和组内均方分别为()A. 432, 71B. 216, 71C. 432, 426D. 216, 42670 .对于线性回来,在因变
8、量的总离差平方和中,假如残差平方和所占比例 越大,那么两个变量之间()A.相关程度越大B.相关程度越小C.完全相关D.完全不相关71 .某班级有100名学生,为了了解学生消费水平,将全部学生依据学习成 果排序后,在前十名学生中随机抽出成果为第3名的学生,后面依次选出第13、 23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于()A.简洁随机抽样B.整群抽样C.分层抽样D.系统抽样72 .某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2) 1-2小时;3) 2-3小时;4) 3-4小时;5) 4-5小时;6) 5小时及以上,则5小 时及以上这一组的组
9、中值近似为()A. 5小时B. 6小时C. 5. 5小时D. 6. 5小时73 .对于左偏分布,平均数、中位数和众数之间的关系是()A.平均数中位数众数74 中位数平均数众数C.众数中位数平均数D.众数平均数中位数74. 一班学生的平均体重均为55千克,二班学生的平均体重为52千克,两 个班级学生体重的标准差均为5千克。那么()A. 一班学生体重的离散程度大B.二班学生体重的离散程度大C.两个班学生体重的离散程度相同D.无法推断75 .在假设检验中,假如所计算出的P值越大,那么检验的结果()A.越不显著B.越显著C.越不真实D.越真实76 .假如收入与支出之间的线性相关系数为0.92,而且二者
10、之间具有统计 显著性,那么二者之间存在着()A.高度相关77 中度相关C.低度相关D.极弱相关77.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单 位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为 ( )A. 39B. 45. 2C. 23. 5D. 6578.在假设检验中,不拒绝虚无假设意味着()A.虚无假设是确定正确的B.虚无假设确定是错误的C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的79 .某单位对该厂第一加工车间残品率估计高达13%,而该车间主任认为该 比例()偏高。假如要检验该说法是否正确,则假设形式应当为()A
11、. %:% 20/3;乩:7r0.13C. Ho : 7i=0. 13; H : 7i 0. 13D. Ho: 0.13; 口:4 WO. 1380 .下列哪种状况不适合用方差分析()A.性别对收入的影响81 专业对收入的影响C.年龄对收入的影响D.行业对收入的影响二、名词说明1 .抽样单位与抽样框2 .普查与抽样调查3 .参数与统计量4 .方差与标准差5 .独立样本与配对样本6 .总体与样本7 .抽样分布8 .二维表9 .相关系数10 .组内均方11 .普查12 .误差削减比例13 .散点图14 .正态分布15 .最小二乘法16 .概率抽样17 .中位数18 .相关系数19 .区间估计20
12、.中心极限定理21 .假设检验22 .均值23 .虚无假设与替换假设24 .置信水平25 .离散系数26 .离散变量与连续变量27 .众数三、简答题1 .推断以下随机变量是定性变量还是定量变量,假如是定量变量,确定是 离散变量还是连续变量。(1)网络供应商的姓名(2)每月的网络服务费(3)每月上网时间(4)上网的主要目的(5)上周收到的电子邮件数量(6)每月用于网上购物的金额(7)上月网上购物的次数(8)运用的电脑的品牌(9)上网是否玩嬉戏(10)电脑是否带有光盘刻录机2 .调查方法主要包括哪几种?简要说明各种方法的优缺点。3 .什么是简洁一元线性回来分析?其作用是什么?4 .举例简要说明社会
13、探讨过程。5 .按测度水平,变量可分为哪几类?并举例说明。6 .简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区分。7 .等距分组和不等距分组有什么区分?请举例说明。8 .举例说明什么是自变量和因变量,二者之间是什么关系?9 .简要说明卡方的拟合优度检验和独立性检验的含义。10 .条形图和直方图有什么区分?11 .简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类 型。13 .简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区分。14 .举例说明什么是离散变量和连续变量。15 . SPSS主要有哪些功能?16 .在SPSS中如何定义变量属性?17 .统计表主要由哪几
14、部分构成?18 .简述相关系数的取值与意义。19 .概率抽样方法主要包括哪几种?20 .简要说明卡方的拟合优度检验和独立性检验的含义。21 .数据分析中的归纳法和演绎法分别是什么?22 .什么是简洁回来分析?其作用是什么?23 . 一元线性回来模型中有哪些基本假定?24 .推断以下随机变量是定性变量还是定量变量,假如是定量变量,确定是 离散变量还是连续变量。(1)考研辅导班参与者的姓名(2)家庭月消费(3)温度(4)上个月外出吃饭的次数(5)产品等级25 .简述定类变量、定序变量和数值型变量集中趋势测量的方法。26 .如何对配对样本进行t检验。四、计算题(每题15分,共30分)1 .某校社会学
15、专业同学统计课成果如下表所示。.社会学专业同学统计课成果表学号成果学号成果学号成果1010237610103775101052701010249110103870101053881010258710103976101054931010267810104090101055621010278510104176101056951010289610104286101057951010298710104397101058661010308610104493101059821010319010104592101060791010329110104682101061761010338010104780101
16、06276101034811010489010106368101035801010498810106494101036831010507710106583要求:(1)对考试成果按由低到高进行排序,求出众数、中位数和平均数。(2)对考试成果进行适当分组,编制频数分布表,并计算累计频数和累计频率。7月份利润额均值为(A. 39. 19B. 28. 90C. 19. 54D. 27. 956.用样本统计量的值干脆作为总体参数的估计值,这种方法称为()A.点估计B.区间估计C.有效估计D.无偏估计7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为 该比例(万)偏高。假如要检验该说法是
17、否正确,则假设形式应当为()A. 乃20.1; H:0.1C. o: 7T-0.1;: n 70. 1D. %: tt0. 1; H:万 W0.18.下面哪一项不是方差分析中的假定()A.每个总体都听从正态分布B.视察值是相互独立的C.各总体的方差相等D.各总体的方差等于09 .推断下列哪一个不行能是相关系数()A. -0.9B. 0C. 0.5D. 1.210 .用于说明回来方程中拟合优度的统计量主要是()A.相关系数2.为探讨某种商品的价格(x)对其销售量(y)的影响,收集了 12个地区 的有关数据。通过分析得到以下结果:方差分析表变差来源SSdfMSFSig.回来ABCD0. 000残差
18、205158. 07EF总计1642866. 6711要求:(1)计算上面方差分析表中A、B、C、D、E、F处的值。(2)商品销售量的变差中有多少是由价格的差异引起的?(3)销售量与价格之间的相关系数是多少?3,某公司聘请职员时,要求对职员进行两项基本实力测试。已知,A项测试 中平均分数为90分,标准差是12分;B考试中平均分数为200分,标准差为25 分。一位应试者在A项测试中得了 102分,在B项测试中得了 215分。若两项测 试的成果均听从正太分布,该位应试者哪一项测试更志向?4 .某公司欲了解广告费用x对销售量y的影响,收集了 20个地区的数据, 并对X、y进行线性回来分析,得到:方程
19、的截距为364,回来系数为1.42,回 来平方和SSR=1602708. 6,残差平方和SSE=40158. 07。要求:(1)写出广告费用y与销售量程x之间的线性回来方程。(2)假如广告费用投入50000元,依据回来方程估计商品销售量。(3)计算判定系数R2,并说明它的意义。5 .为估计每个网络用户每天上网的平均时间是多少,抽取了 225个网络用 户的简洁随机样本,得到样本均值为6. 5个小时,样本标准差为2. 5个小时。(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以 95%的置信水平,计算年龄在20
20、岁以下的网络用户比例的置信区间。注:Zo.o25 = 1%6 .某企业运用3种方法组装一种新的产品,为确定哪种方法生产效率最高, 随机抽取30名工人,并指定每人运用其中的一种方法。通过对每个工人生产的产品数进行分析得到下面的方差分析表。请完成方差分析表。变差来源SSdfMSFSig.组间2100. 000组内3836总计29一7 .甲单位人均月收入4500元,标准差1200元。乙单位月收入分布如下所示。乙单位月收入分布表按收入分组(元)人数(个)3000分以下1203000-40004204000-5000540500060004206000以上300合计1800要求:(1)计算乙单位员工月收
21、入的均值和标准差。(2)比较甲单位和乙单位哪个单位员工月收入的离散程度更大?(提示: 运用离散系数)8 .某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响。收集了 过去12年的有关数据,通过分析得到:方程的截距为363,回来系数为1.42, 回来平方和SSR=1600,残差平方和SSE=450。要求:(1)写出销售量y与广告费用x之间的线性回来方程。(2)假如明年安排投入广告费用为25万元,依据回来方程估计明年汽车销 售量。(3)计算判定系数R2,并说明它的意义。9 .某行业管理局所属40个企业2023年产品销售额数据如下所示。40个企业2023年产品销售额企业编 号销售额企业编 号销售
22、额企业编 号销售额企业编 号销售额115211105211033113621051212322103321463117131162313733127497141152413834135512415110259135117611916115261183611371081710027120371048881887281123812591291910729953910810115201193014240126要求:(1)对2023年销售额按由低到高进行排序,求出众数、中位数和平均数。(2)假如依据规定,销售额在125万元以上的为先进企业,115万-125万 之间的为良好企业,105万T15万之间的为
23、一般企业,105万以下的为落后企业, 请按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并 计算累积频数和累积频率。10 .某单位为探讨其商品的广告费用(X)对其销售量(y)的影响,收集了 过去12年的有关数据。通过分析得到以下结果:方差分析表变差来源SSdfMSFSig.回来1602708.6BDF0. 000残差40158.08CE总计A11要求:(1)计算上面方差分析表中A、B、C、D、E、F处的值。(2)商品销售量的变差中有多少是由广告费用的差异引起的?(3)销售量与广告费用之间的相关系数是多少?11 .一项关于高校生体重状况的探讨发觉,男生的平均体重为60千克,标准
24、差为5千克;女生的平均体重为50千克,标准差为5千克。请问:(1)是男生体重差异大还是女生体重差异大?为什么?(2)男生中有多少比重的人体重在55千克-65千克之间?(3)女生中有多少比重的人体重在40千克-60千克之间?12 .某公司欲了解广告费用x对销售量y的影响,收集了 16个地区的数据, 并对x、y进行线性回来分析,得到:方程的截距为280,回来系数为1.6,回来 平方和SSR=1503000,残差平方和SSE=38000。要求:13 )写出广告费用y与销售量x之间的线性回来方程。(2)假如广告费用投入80000元,依据回来方程估计商品的销售量。14 )计算判定系数R2,并说明它的意义
25、。13 .为估计某地区每个家庭日均生活用水量为多少,抽取了 450个家庭的简 洁随机样本,得到样本均值为200升,样本标准差为50升。(1)试用95%的置信水平,计算该地区家庭日均用水量的置信区间。(2)在所调查的450个家庭中,女性为户主的为180个。以95%的置信水 平,计算女性为户主的家庭比例的置信区间。注:Zo 025 = 1.9614 .某农科院运用4种方法培育稻米,为确定哪种方法生产效率最高,随机 划出40块试验田,并指定每块试验田运用其中的一种方法。通过对每块试验田 的产量进行分析得到下面的方差分析表。请完成方差分析表。变差来源SSdfMSFSig.组间3200. 000组内60
26、48总计39B.离散系数C.回来系数D.判定系数11 .某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000 户家庭进行调查,以推断全部家庭的年均收入水平。这项探讨的总体是()A. 332. 1万户家庭B. 3000户家庭C. 332. 1户家庭的年均收入D. 3000户家庭的年均收入12 .下列变量属于数值型变量的是()A.工资收入B.产品等级C.学生对考试改革的看法D.企业的类型13 .假如用一个图形描述比较两个或多个样本或总体的结构性问题时,适合 选用哪种图形()A.环形图B.饼图C.直方图D.条形图14 .在频数分布表中,频率是指()A.各组频数与上一组频数之比B.各组
27、频数与下一组频数之比C.各组频数与总频数之比D.各组频数与最大一组频数之比15 .两个定类变量之间的相关分析可以运用()A. 4系数B.夕系数C. r系数D. Gamma 系数16 .依据一个样本均值求出的90%的置信区间表明()A.总体均值确定落入该区间内B.总体均值有90%的概率不会落入该区间内C.总体均值有90%的概率会落入该区间内D.总体均值有10%的概率会落入该区间内17.已知某单位职工平均每月工资为3000元,标准差为500元。假如职工 的月收入是正态分布,可以推断月收入在2500元一3500元之间的职工人数大约 占总体的()A. 95%B. 68%C. 89%D. 90%18 .
28、方差分析的目的是()A.比较不同总体的方差是否相等B.推断总体是否存在方差C.分析各样本数据之间是否存在显著差异D.探讨各分类自变量对数值型因变量的影响是否显著19 .对于线性回来,在因变量的总离差平方和中,假如回来平方和所占比例 越大,那么两个变量之间()A.相关程度越大B.相关程度越小C.完全相关D.完全不相关20 .正态分布中,o值越小,则()A.离散趋势越小B.离散趋势越大C.曲线越低平D,变量值越分散21 .从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每 个元素都有相同的机会入选样本,这样的抽样方式称为()A.简洁随机抽样B.系统抽样C.整群抽样D.分层抽样22 .某
29、地区2023-2024年人口总量(单位:万人)分别为98, 102, 103, 106, 108, 109, 110, 111, 114, 115,下列哪种图形最适合描述这些数据()A.茎叶图B.环形图c.饼图D.线图23 .假如一组数据中某一个数值的标准分值为T. 5,这表明该数值()A.是平均数的T. 5倍B.比平均数少1. 5C.等于T. 5倍标准差D.比平均数低1.5个标准差24.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、 88、90、92、72,那么该班考试成果的中位数是()A. 89B. 72C. 88D. 9525.某班级学生期末英语考试平均成果
30、为75分,标准差为10分。假如已知 这个班学生的考试分数听从正态分布,可以推断成果在65-85之间的学生大约占 全班学生的()A. 68%B. 89%C. 90%D. 95%26.已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入 的标准差为()A. 700B. 0.2C. 3500D. 17500027 .在假设检验中,不拒绝虚无假设意味着(A.虚无假设是确定正确的B.虚无假设确定是错误的C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的28 .在因变量的总离差平方和中,假如回来平方和所占的比例越大,则两变 量之间()A.相关程度越高B.相关程度越低C.完全相关
31、D.没有任何关系29 .从两个总体中各选取了 6个视察值,得到组间平方和为234,组内平方 和为484,则组间方差和组内方差分别为()A. 234, 121B. 117, 121C. 234, 48.4D. 117, 8130 .在回来方程中,若回来系数等于0,这表明()A.因变量y对自变量x的影响是不显著的31 自变量x对因变量y的影响是不显著的C.因变量y对自变量x的影响是显著的D.自变量x对因变量y的影响是显著的31.某班级有60名男生,40名女生,为了 了解学生购书支出,从男生中抽 取12名学生,从女生中抽取8名学生进行调查。这种调查方法属于()A.简洁随机抽样B.整群抽样C.分层抽样
32、D.系统抽样32.某企业职工的月收入水平分为以下五组:1) 1500元及以下;2)1500-2000 元;3) 2000-2500元;4) 2500-3000元;5) 3000元及以上,则3000元及以上 这一组的组中值近似为()A. 3000 元B. 3500 元C. 2500 元D. 3250 元33.对于右偏分布,平均数、中位数和众数之间的关系是()A.平均数中位数众数B.中位数平均数众数C.众数中位数平均数D.众数平均数中位数34.两组数据的平均数不相等,但是标准差相等。那么()A.平均数小的,离散程度小B.平均数大的,离散程度大C.平均数大的,离散程度小D.两组数据离散程度相同35.
33、在假设检验中,假如所计算出的P值越小,那么检验的结果()A.越显著B.越不显著C.越真实D.越不真实36.假如物价与销售量之间的线性相关系数为-0. 87,而且二者之间具有统 计显著性,那么二者之间存在着()A.高度相关B.中度相关C.低度相关D.极弱相关37.回来平方和(SSR)反映了 y的总变差中()A.由于x与y之间的线性关系引起的y的改变部分B.除了 x对y的现有影响之外的其他因素对y变差的影响C.由于x与y之间的非线性关系引起的y的改变部分D.由于x与y之间的函数关系引起的y的改变部分38.依据一个详细的样本求出的总体均值90%的置信区间()A.以90%的概率包含总体均值B.确定包含
34、总体均值C. 10%的可能性包含总体均值D.确定不包含总体均值39 .在假设检验中,虚无假设和备择假设(A.都有可能成立B.都不行能成立C.有且只有一个成立D.备择假设确定成立,虚无假设不确定成立40 .在方差分析中,某一水平下样本数据之间的误差称为()A.组内误差B.组间误差C.组内平方D.组间平方41 .学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200 名学生进行调查,以推断全部学生的每月生活费用水平。这项探讨的总体是 ( )A. 22000名学生B. 2200名学生C. 22000名学生的每月生活费用D. 2200名学生的每月生活费用42.从变量分类看,下列变量属于定
35、序变量的是()A.专业B.性别C.产品等级D.收入43.在频数分布表中,比率是指()A.各组频数与上一组频数之比B.各组频数与下一组频数之比C.各组频数与总频数之比D.不同小组的频数之比44.某地区2023-2024年人口总量(单位:万人)分别为98, 102, 103, 106, 108, 109, 110, 111, 114, 115,下列哪种图形最适合描述这些数据()A.茎叶图B.环形图C.饼图D.线图45.依据一个样本均值求出的90%的置信区间表明()A.总体均值确定落入该区间内B.总体均值有90%的概率不会落入该区间内C.总体均值有90%的概率会落入该区间内D.总体均值有10%的概率会落入该区间内46.推断下列哪一个不行能是相关系数()A. -0. 89B. 0. 34C. 1. 32D. 047.期中考试中,某班级学生统计学平均成果为80分,标准差为4分。假 如学生的成果是正太分布,可以推断成果在72分-88分之间的学生大约占总体 的()A. 95%B. 68%C. 89%D. 90%48.正态分布中,o值越小,则()A.离散趋势越小B.离散趋势越大C.曲线越低平D.变量值越分散49.下面哪一项不是方差分析中的假定()A.每个总体都听从正态分布B.视察值是相互独立的C.各总体的方差相等D.各总体的方差等于0
限制150内