《社会统计学》形考三 作业.docx
社会统计学形考三一、单项选择题(每题2分,共20分)1.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于( D ) 。A.简单随机抽样B.整群抽样 C.分层抽样D.系统抽样2.以下关于因变量与自变量的表述不正确的是(C )A.自变量是引起其他变量变化的变量B.因变量是由于其他变量的变化而导致自身发生变化的变量C.自变量的变化是以因变量的变化为前提D.因变量的变化不以自变量的变化为前提3.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据( D)。A.茎叶图B.环形图C.饼图D.线图4.以下关于条形图的表述,不正确的是( C )A.条形图中条形的宽度是固定的B.条形图中条形的长度(或高度)表示各类别频数的多少C.条形图的矩形通常是紧密排列的D.条形图通常是适用于所有类型数据5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生( A)的成绩考得更好。A.数学B.语文C.两门课程一样D.无法判断6.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是(B )A.甲的离散程度小,稳定性水平低B.甲的离散程度小,稳定性水平高C.乙的离散程度小,稳定性水平低 D.乙的离散程度大,稳定性水平高7.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第( C )组。.组别按年龄分组(岁)工作人员数(人)120246225291433034244353918540441264549187505414855596 合计112A.第3组B.第4组 C.第5组D.第6组8.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间( B ) A.相关程度越大B.相关程度越小 C.完全相关D.完全不相关9.回归平方和(SSR)反映了y的总变差中(A )A.由于x与y之间的线性关系引起的y的变化部分B.除了x对y的现有影响之外的其他因素对y变差的影响C.由于x与y之间的非线性关系引起的y的变化部分D.由于x与y之间的函数关系引起的y的变化部分10.下列哪种情况不适合用方差分析( C )A.性别对收入的影响B.专业对收入的影响C.年龄对收入的影响D.行业对收入的影响6二、名词解释(每题5分,共20分)11.非概率抽样称为不等概率抽样或非随机抽样,就是调查者根据自己的方便或主观判断抽取样本的方法。12.二维表二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。13.置信水平参考答案置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。14.卡方检验卡方检验是用于分析定性数据(以计数方式表示的数据)分类变量之间的相依性(与相 依相反的是独立性)。通过列联表中期望次数和观察到的次数的差别计算 值,如果变量之间相 互独立的假设成立,这个检验统计量服从卡方分布,故称卡方检验三、简答题(每题10分,共30分)15.等距分组和不等距分组有什么区别?请举例说明在对数据进行分组时,如果各组组距相等,则称为等距分组,例如:分析某同学期末统计可成绩,假如最低分为73分,最高分为98分,以5分为组距进行分组,分为70-75分,75-80分,80-部分,85-90分,90-95分,95-100分。如果各组组距不相等,则称不等距分组。例如,在分析人口时,往往将人口分为婴幼儿组(0-6岁),少年组(7-11岁),中青年组(18-59岁),老年人组(60岁以上)该分类中各组组距不相等。16.简述相关系数的取值与意义相关系数相关系数就是对变量之间相关关系程度和方向的度量。当研究两个变量之间的相关关系时我们称之为简单相关系数。总体相关系数用p表示样本相关系数一般用表示。1、符号:如果为正号,则表示正相关,如果为负号,则表示负相关。通俗点说,正相关就是变量会与参照数同方向变动,相关就是变量与参照数反向变动;2、取值为0,这是极端,表示不相关;3、取值为1,表示完全正相关,而且呈同向变动的幅度是一样的;4、如为-1,表示完全负相关,以同样的幅度反向变动;5、取值范围:1,1相关系数的绝对值越大,相关程度越强,相关系数的绝对值越小,相关程度越弱。17.简述什么是简单回归分析?其作用是什么(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定-个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。(2)回归分析的作用包括:从已知数据出发,确定变量之间的数学关系式:对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。四、计算题(共30分)18.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克。请问:(1)是男生体重差异大还是女生体重差异大?为什么?(2)男生中有多少比重的人体重在55千克-65千克之间?(3)女生中有多少比重的人体重在40千克-60千克之间?备注:(1)=0.8413,(2)=0.977219.为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过分析得到以下方差分析表:变差来源SSdfMSFSig回归6BDF0.000残差40158.08CE总计A11要求:(1)计算上面方差分析表中A、B、C、D、E、F处的值。(2)商品销售量的变差中有多少是由价格的差异引起的?答:(1)A=1642866.68B=1C=10D=1602708.6E=4015.808F=399.1(2)1602708.6÷1642866.68=0.9756=97.56%是由广告费用引起的。