最新国家开放大学电大本科《社会统计学》期末标准题库及答案(试卷号:1318).docx
最新国家开放大学电大本科社会统计学期末标准题库及答案(试卷号:1318) 最新国家开放大学电大本科社会统计学期末标准题库及答案(试卷号:1318)考试说明:本人汇总了历年来该科所有的试题及答案,形成了一个完整的标准考试题库,对考生的复习和考试起着非常重要的作用,会给您节省大量的时间。内容包含:单项选择题、名词解释题、简答题、计算题。做考题时,利用本文档中的查找工具(Ctrl+F),把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库还有其他网核、机考及教学考一体化试题答案,敬请查看。 一、单项选择题1某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面以10为间隔依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于()。 A简单随机抽样B整群抽样C分层抽样D系统抽样2以下关于因变量与自变量的表述不正确的是()。 A自变量是引起其他变量变化的变量B因变量是由于其他变量的变化而导致自身发生变化的变量C自变量的变化是以因变量的变化为前提D因变量的变化不以自变量的变化为前提3某地区2021-2021年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据?()A茎叶图B环形图C饼图D线图4以下关于条形图的表述,不正确的是()。 A条形图中条形的宽度是固定的B条形图中条形的长度(或高度)表示各类别频数的多少C条形图的矩形通常是紧密排列的D条形图通常是适用于所有类型数据5某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生()的成绩考得更好。 A数学B语文c两门课程一样D无法判断6有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2; 乙平均每靶9环,标准差为3,以下关于甲、乙两人打靶的稳定性水平表述正确的是()。 A甲的离散程度小,稳定性水平低B甲的离散程度小,稳定性水平高C乙的离散程度小,稳定性水平低D乙的离散程度大,稳定性水平高7下表是某单位工作人员年龄分布表,该组数据的中位数出现在第()组。 A第3组B第4组C第5组D第6组8对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间()。 A相关程度越大B相关程度越小C完全相关D完全不相关9回归平方和(SSR)反映了y的总变差中()。 A.由于x与y之间的线性关系引起的y的变化部分B除了x对y的现有影响之外的其他因素对y变差的影响C由于x与y之间的非线性关系引起的y的变化部分D由于x与y之间的函数关系引起的y的变化部分10下列哪种情况不适合用方差分析?()A性别对收入的影响B专业对收入的影响C年龄对收入的影响D行业对收入的影响11.某班级有100名学生,为了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种抽样方法属于()。 A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样12.以下关于因变量与自变量的表述不正确的是()。 A.自变量是引起其他变量变化的变量B.因变量是由于其他变量的变化而导致自身发生变化的变量C.自变量的变化是以因变量的变化为前提D.因变量的变化不以自变量的变化为前提13.某地区2021-2021年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据?()A.茎叶图B.环形图C.饼图D.折线图14.以下关于条形图的表述,不正确的是()。 A.条形图中条形的宽度是固定的B.条形图中条形的长度(或高度)表示各类别频数的多少C.条形图的矩形通常是紧密排列的D.条形图通常是适用于所有类型数15某校期末考试,全校语文平均成绩为80分,标准差为3分; 数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生()的成绩考得更好。 A数学B语文C两门课程一样D无法判断16有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2; 乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是()。 A甲的离散程度小,稳定性水平低B甲的离散程度小,稳定性水平高C乙的离散程度小,稳定性水平低D乙的离散程度大,稳定性水平高17下表是某单位工作人员年龄分布表,该组数据的中位数出现在第()组。 A第3组B第4组C第5组D第6组18对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间()。 A相关程度越大B相关程度越小C完全相关D完全不相关19回归平方和(SSR)反映了y的总变差中()。 A由于x与y之间的线性关系引起的y的变化部分B除了x对y的现有影响之外的其他因素对y变差的影响C由于x与y之间的非线性关系引起的y的变化部分D由于x与y之间的函数关系引起的y的变化部分20下列哪种情况不适合用方差分析?()A性别对收入的影响B专业对收入的影响C年龄对收入的影响D行业对收入的影响21以下关于因变量与自变量的表述不正确的是()。 A自变量的变化是以因变量的变化为前提B因变量是由于其他变量的变化而导致自身发生变化的变量C自变量是引起其他变量变化的变量D因变量的变化不以自变量的变化为前提22某班级学生平均每天上网时间可以分为以下六组:(1)1小时及以下; (2)1-2小时; (3)2-3小时; (4)3-4小时; (5)4-5小时; (6)5小时及以上,则5小时及以上这一组的组中值近似为()。 A5小时B6小时C5.5小时D6.5小时23以下关于条形图的表述,不正确的是()。 A条形图中条形的宽度是固定的B条形图的矩形通常是紧密排列的C条形图中条形的长度(或高度)表示各类别频数的多少D条形图通常是适用于所有类型数24下表是某单位工作人员年龄分布表,该组数据的中位数出现在第()组。 A第3组B第4组C第5组D第6组25某校期末考试,全校语文平均成绩为80分,标准差为3分; 数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生()的成绩考得更好。 A数学B语文C两门课程一样D无法判断散26在假设检验中,不拒绝虚无假设意味着()。 A虚无假设是肯定正确的B虚无假设肯定是错误的C没有证据证明虚无假设是正确的D没有证据证明虚无假设是错误的27根据一个样本均值求出的90%的置信区间表明()。 A总体均值一定落人该区间内B总体均值有90%的概率不会落入该区间内C总体均值有90%的概率会落人该区间内D总体均值有10%的概率会落入该区间内28在回归方程中,若回归系数等于0,这表明()。 A因变量y对自变量x的影响是不显著的B自变量x对因变量y的影响是不显著的C因变量y对自变量x的影响是显著的D自变量x对因变量y的影响是显著的29.中心极限定理认为不论总体分布是否服从正态分布,从均值为、方差为?的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n30),样本均值的抽样分布近似服从均值为()、方差为()的正态分布。 A.,2B./n,2/nC.,o2/nD./n,o?30.下列哪种情况不适合使用方差分析?()A.性别对收人的影响B.年龄对收人的影响C.专业对收人的影响D.行业对收人的影响31.为了解某地区的消费,从该地区随机抽取8000户进行调查,其中80%回答他们的月消费在3000元以上,20%回答他们每月用于通讯、网络的费用在300元以上。此处8000户是()。 A.样本B.总体C.变量D.统计量32.某地区家庭年均收人可以分为以下六组:1)1500元及以下; 2)1500一2500元; 3)xxxx元; 4)3500-4500元; 5)4500-5500元; 6)5500元及以上,则该分组的组距近似为()。 A.500元B.1500元C.1250元D.1000元33.先将总体按某种特征或标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为()。 A.简单随机抽样B.系统抽样C.整群抽样D.分层抽样34.正态分布中,值越小,则()。 A.离散趋势越小B.离散趋势越大C.曲线越低平D.变量值越分散35.对于左偏分布,平均数、中位数和众数之间的关系是()。 A.平均数>中位数>众数B.中位数>平均数>众数C.众数>中位数>平均数D.众数>平均数>中位数36.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是()。 A.甲的离散程度小,稳定性水平低B.甲的离散程度小,稳定性水平高.C.乙的离散程度小,稳定性水平低D.乙的离散程度大,稳定性水平高37下列哪种情况不适合用方差分析?()A性别对收入的影响B专业对收入的影响C年龄对收入的影响D行业对收入的影响38.某单位认为该厂第一加工车间残品率估计高于13%,而该车间主任认为该比例偏高,如果要检验该说法是否正确,则假设形式应该为()。 A.Ho:r0.13; H:x0.13C.Ho:r=0.13; H:0.13D.Ho:r>0.13; H:0.13.39.残差平方和(SSE)反映了y的总变差中()。 A.由于x与y之间的线性关系引起的y的变化部分B.除了x对y的现有影响之外的其他因索对y变差的影响C.由于x与y之间的非线性关系引起的y的变化部分D.由于x与y之间的函数关系引起的y的变化部分40.从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为()。 A.432.71B.216.71C.432.426D.216.426二、名词解释题1非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。 2二维表:二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。 3置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。 4卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。 5非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。 6二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。 7置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。 8卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。 9整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。 10Z值:Z值:Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据在总体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公式为:Z=(X-)/11二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。 12误差减少比例:在预测变量Y的值时,知道变量x的值时所减少的误差(E-Ez)与总误差E,的比值称为误差减少比例,简称PRE。 13散点图:在坐标系中,用X轴表示自变量x,用Y轴表示因变量y,而变量组(x,y)则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形成的二维图就是散点图。 14中心极限定理:中心极限定理具体内容为:不论总体分布是否服从正态分布,从均值为肛、方差为-2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n30),样本均值的抽样分布近似服从均值为队方差为aZ/n的正态分布。 15置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。 16离散系数:离散系数是一组数据的标准差与该数据均值之比,也称为变异系数。 三、简答题1.等距分组和不等距分组有什么区别?请举例说明。 答:(1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。例如:性别。(0.5分)(2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。例如:学历。(0.5分)(3)定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量。例如:智商。(0.5分)(4)定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。例如:收入。(0.5分)2简述相关系数的取值与意义。 答:相关系数的取值在一11之间;相关系数的正负号表示两个变量相关关系的方向,“十”表示正相关,“一”表示负相关;相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1;反之,绝对值越小,及r越接近0,相关程度越弱;相关系数r=0时,只能说变量之间不存在线性相关,而不能说它们之间不相关。 3简述什么是回归分析?其作用是什么?答:(1)回归分析是通过-定的数学表达式将变量间的关系进行描述,确定-一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。 (2)回归分析的作用包括:从已知数据出发,确定变量之间的数学关系式;对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。 4.简述按照测量水平区分的四类变量,并举例说明。 答:(1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。例如:性别(0.5分)。 (2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。例如:学历(0.5分)。 (3)定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量。例如:智商(0.5分)。 (4)定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。例如:收入(0.5分)。 5.简述相关系数的取值与意义。 答:相关系数的取值在一11之间;相关系数的正负号表示两个变量相关关系的方向,“+”表示正相关,“-”表示负相关;相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1;反之,绝对值越小,及r越接近0,相关程度越弱;相关系数r=0时,只能说变量之间不存在线性相关,而不能说它们之间不相关。 6简述什么是简单回归分析?其作用是什么?答:(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定-个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。 (2)回归分析的作用包括:从已知数据出发,确定变量之间的数学关系式;对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。 7.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。 (1)网络供应商的姓名;(2)每月的网络服务费;(3)每月上网时间;(4).上网的目的;(5).上月网购次数。 答:(1)网络供应商的姓名:定性(2)每月的网络服务费:定量、连续变量(3)每月上网时间:定量、连续变量(4)_上网的目的:定性(5).上月网购次数:定量、离散变量8.简述什么是简单回归分析?其作用是什么?答:(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定-一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一-种方法,侧重于考察变量之间的数量伴随关系。 (2)回归分析的作用包括:从已知数据出发,确定变量之间的数学关系式;对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;利用所求出的关系式,根据-一个变量或多个变量的取值估计或预测另一个特定变量的取值。 9.如何对配对样本进行t检验。 答:配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的t检验用于检验两个相关的样本是否来自具有相同均值的总体。在对配对样本进行t检验时,首先计算两个样本中每个对应变量之间的差值;然后再检验其差值的均值是否为零,如果差值的均值接近零(在给定的置信区间内),说明两个总体均值在给定的置信水平上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差异。 10简述按照测量水平区分的四类变量,并举例说明。 答:(1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。例如:性别(0.5分)。 (2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。例如:学历(0.5分)。 (3)定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量。例如:智商(0.5分)。 (4)定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。例如:收入(0.5分)。 11简述相关系数的取值与意义。 答:相关系数的取值在-11之间; 相关系数的正负号表示两个变量相关关系的方向,“+”表示正相关,“一”表示负相关; 相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1; 反之,绝对值越小,及r越接近O,相关程度越弱; 相关系数r-0时,只能说变量之间不存在线性相关,而不能说它们之间不相关12简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。 答:分析双变量关系时,t检验和卡方检验都是主要用于检验这两个变量之间是否存在显著关系。(2分)t检验主要用于对一个为数值型变量、另一个为分类变量且只有两个类别的变量的双变量关系的统计显著性检验。卡方检验主要用于对两个分类变量之间的相关性进行统计检验,判断变量之间是否存在显著关系。 例如,我们想考察收入与性别是否存在关系,或者两性的收入是否存在显著差异,可以用两独立样本t检验。如果我们想考察职业与性别是否存在关系,而职业和性别都是分类变量,那么可以用卡方检验考察不同性别之间职业是否存在显著差异。 四、计算题18.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克; 女生的平均体重为50千克,标准差为5千克。请问; (1)是男生体重差异大还是女生体重差异大?为什么?(2)男生中有多少比重的人体重在55千克-65千克之间?答: 答: 18.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克; 女生的平均体重为50千克,标准差为5千克。请问: (1)是男生体重差异大还是女生体重差异大?为什么?(2)男生中有多少比重的人体重在55千克-65千克之间?(3)女生中有多少比重的人体重在40千克-60千克之间?答: 答: 18.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。 (1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。 (2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。注:Zo.025=1.96答: 19某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试验田,并指定每块试验田使用其中的一种方法。通过对每块试验田的产量进行分析得到下面的方差分析表: 要求: 计算上面方差分析表中A、B、C、D、E、F处的值答: (1)对2021年销售额按由低到高进行排序,求出众数、中位数和平均数。 (2)如果按照规定,销售额在125万元以上的为先进企业,115万-125万之间的为良好企业,105万-115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。 答: 19.某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响。收集了过去12年的有关数据,通过分析得到:方程的截距为363,回归系数为1.42,回归平方和SSR-1600,残差平方和SSE-450。 要求: (1)写出销售量y与广告费用x之间的线性回归方程。 (2)假如明年计划投入广告费用为50万,根据回归方程估计明年汽车销售量。 (3)计算判定系数R2,并解释它的意义。 答: 12