国家开放大学《社会统计学》形考任务1-4参考答案.docx
-
资源ID:79285274
资源大小:318.48KB
全文页数:12页
- 资源格式: DOCX
下载积分:20金币
快捷下载

会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
国家开放大学《社会统计学》形考任务1-4参考答案.docx
国家开放大学社会统计学形考任务1-4参考答案形考任务1表1是某大学二年级135个同学的社会统计学课程的期末考试成绩,请将数据输入SPSS软件,并(1)对考试成绩进行排序和分组(40分),(2)制作频数分布表(30分)并绘制频数分析统计图(30分)。请注意分组时按照下列标准:等级AA-B+BB-C+CC-D+DF分数90-10086-8983-8580-8276-7973-7570-7266-6963-6560-620-59表1 某专业二年级同学社会统计学期末考试成绩(百分制)学生成绩学生成绩学生成绩学生成绩学生成绩186283455888270109712602965569383881108036530305785848811187428317858838568112665853286599386871138468733846095878811483770348761718891115858643585629089761167895136936386908711781105837966489918111881119038826589926111971125039786683937212086138740806784948612191148241746844952912266156542726968963712358166843737089978212468178644867184988212580188045857286998212677198146907379100851275520704769747810178128542180488675871028012962224949867688103901305423805084778210482131652470518178831057213274255952907992106861337026805334808610780134722752548481861088213573(1)排序和分组步骤:排序:DateSort CasesSort by成绩(Ascending)分组:TransformRecode into different variables成绩out put成绩分组1为90-100,2为8689,3为83-85以此类推。详见作业1.sav。(2)频数分布表如下图步骤:AnalyzeDescriptive StatisticsFrequencies成绩分组(3)频数分布图如下:步骤:AnalyzeDescriptive StatisticsFrequencies成绩分组ChartsHistograms(With normal curve)。形考任务2形考任务3形考任务4形考任务2表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS软件:(1)计算学生上网时间的中心趋势测量各指标(9分)和离散趋势测量各指标(12分)。 (2)计算学生上网时间的标准分(Z值)及其均值和标准差。(8分) (3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。(6分) 表1 某专业一年级同学一周上网时间(小时)学生上网时间学生上网时间学生上网时间学生上网时间学生上网时间1132118411461881102922224276219821038232243963248320412241044864138421582513451065218516626261046186621861071327124726671087108528224814681388219329194986920891910183010501070219010113312251137112913212103230522872159271320338531273269328141934205410742094191515351755975179515168361456107619961017837857127799720181538125824782198819203915592679179914202240136020801610018(1)集中趋势各指标:均数为15.2、中位数为14.0、众数为10。离散趋势:四分位数分别为P25为10、P50为14、P75为20、方差为39.515、标准差为6.286、极差为29。步骤:AnalyzeDescriptive StatisticsFrequencies上网时间(勾选集中趋势指标:mean,median,mode,minimum,maximun离散趋势指标:quartiles,Variance,Std.deviation,Range)(2)标准分Z值(详见作业2.sav)。步骤AnalyzeDescriptive StatisticsDescriptiveSave standardized values as varianles即可。均数位15.2,标准差6.286步骤AnalyzeDescriptive StatisticsDescriptiveOptions勾选(mean,Std.deviation)(3)一周上网时间超过20小时的学生所占比例21%。步骤1:AnalyzeSelect Casesif 上网时间>20h步骤2:AnalyzeDescriptive StatisticsDescriptive上网时间超过20h。得出上网时间超过20h人数为21人,占总人数的21%。形考任务3一、单项选择题(每题2分,共20分)1.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于()。A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样2.以下关于因变量与自变量的表述不正确的是( )A.自变量的变化是以因变量的变化为前提B.因变量是由于其他变量的变化而导致自身发生变化的变量C.自变量是引起其他变量变化的变量D.因变量的变化不以自变量的变化为前提3.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据( )。A.茎叶图B.环形图C.饼图D.折线图4.以下关于条形图的表述,不正确的是( )A.条形图中条形的宽度是固定的B.条形图中条形的长度(或高度)表示各类别频数的多少C.条形图的矩形通常是紧密排列的D.条形图通常是适用于所有类型数据5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生( )的成绩考得更好。A.数学B.语文C.两门课程一样D.无法判断6.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是( )A.甲的离散程度小,稳定性水平低B.甲的离散程度小,稳定性水平高C.乙的离散程度小,稳定性水平低D.乙的离散程度大,稳定性水平高7.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第( )组。组别按年龄分组(岁)工作人员数(人)120-246225-2914330-3424435-3918540-4412645-4918750-5414855-596合计112A.第3组B.第4组C.第5组D.第6组8.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间()A.相关程度越大B.相关程度越小C.完全相关D.完全不相关9.回归平方和(SSR)反映了y的总变差中( )A.由于x与y之间的线性关系引起的y的变化部分B.除了x对y的线性影响之外的其他因素对y变差的影响C.由于x与y之间的非线性关系引起的y的变化部分D.由于x与y之间的函数关系引起的y的变化部分10.下列哪种情况不适合用方差分析()A.性别对收入的影响B.专业对收入的影响C.年龄对收入的影响D.行业对收入的影响二、名词解释(每题5分,共20分)11.非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。12.二维表:二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。13.置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。14.卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。三、简答题(每题10分,共30分)15.等距分组和不等距分组有什么区别?请举例说明。答:(1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其它特征时,这种变量称为定类变量。例如:性别(2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度等序次差异时,这种变量称为定序变量。例如:学历(3)定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同类别之间的数量差别和间隔差距时,这样的变量称为定距变量。例如:智商(4)定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这样的变量称为定比变量。例如:收入16.简述相关系数的取值与意义答:相关系数的取值在-11之间;相关系数的正负号表示两个变量相关关系的方向,“+”表示正相关,“-”表示负相关;相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1;反之,绝对值越小,及r越接近0,相关程度越弱;相关系数r=0时,只能说变量之间不存在线性相关,而不能说它们之间不相关17.简述什么是简单回归分析?其作用是什么。答:(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。(2)回归分析的作用包括:从已知数据出发,确定变量之间的数学关系式;对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。四、计算题(共30分)18.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克;女生的平均体重为50千克,标准差为5千克。请问:(1)是男生体重差异大还是女生体重差异大?为什么?(2)男生中有多少比重的人体重在55千克-65千克之间?(3)女生中有多少比重的人体重在40千克-60千克之间?备注:(1)=0.8413,(2)=0.9772答:19.为研究某种商品的价格(x)对其销售量(y)的影响,收集了12个地区的有关数据。通过分析得到以下方差分析表:变差来源SSdfMSFSig回归1602708.6BDF0.000残差40158.08CE-总计A11-要求:(1)计算上面方差分析表中A、B、C、D、E、F处的值。(2)商品销售量的变差中有多少是由价格的差异引起的?答:形考任务4一、单项选择题(每题2分,共20分)1.以下关于因变量与自变量的表述不正确的是( )A.自变量的变化是以因变量的变化为前提B.因变量是由于其他变量的变化而导致自身发生变化的变量C.自变量是引起其他变量变化的变量D.因变量的变化不以自变量的变化为前提2.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为( )A. 5小时B. 6小时C. 5.5小时D. 6.5小时3.以下关于条形图的表述,不正确的是( )A.条形图中条形的宽度是固定的B.条形图的矩形通常是紧密排列的C.条形图中条形的长度(或高度)表示各类别频数的多少D.条形图通常是适用于所有数据类型4.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第( )组组别按年龄分组(岁)工作人员数(人)120-246225-2914330-3424435-3918540-4412645-4918750-5414855-596合计112A.第3组B.第4组C.第5组D.第6组5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生( )的成绩考得更好。A.数学B.语文C.两门课程一样D.无法判断6.在假设检验中,不拒绝虚无假设意味着( )A.虚无假设是肯定正确的B.虚无假设肯定是错误的C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的7.根据一个样本均值求出的90%的置信区间表明( )A.总体均值一定落人该区间内B.总体均值有90%的概率不会落入该区间内C.总体均值有90%的概率会落人该区间内D.总体均值有10%的概率会落入该区间内8.在回归方程中,若回归系数等于0,这表明( )A.因变量y对自变量x的影响是不显著的B.自变量x对因变量y的影响是不显著的C.因变量y对自变量x的影响是显著的D.自变量x对因变量y的影响是显著的9.中心极限定理认为不论总体分布是否服从正态分布,从均值为、方差为2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n30),样本均值的抽样分布近似服从均值为( )、方差为( )的正态分布。A. , 2B. /n, 2/nC. , 2/nD. /n, 210.下列哪种情况不适合用方差分析( )A.性别对收人的影响B.年龄对收人的影响C.专业对收人的影响D.行业对收入的影响二、名词解释(每题5分,共20分)11.整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。12.Z值:Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据在总体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公式为:Z=(X)/13.二维表:二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。14.误差减少比例:在预测变量Y的值时,知道变量X的值时所减少的误差()与总误差的比值称为误差减少比例,简称PRE。三、简答题(每题10分,共30分)15.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。(1)网络供应商的姓名(2)每月的网络服务费(3)每月上网时间(4)上网的目的(5)上月网购次数答:(1)网络供应商的姓名:定性(2)每月的网络服务费:定量、连续变量(3)每月上网时间:定量、连续变量(4)上网的目的:定性(5)上月网购次数:定量、离散变量16.简述什么是简单回归分析?其作用是什么?答:(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。(2)回归分析的作用包括:从已知数据出发,确定变量之间的数学关系式;对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变量;17.如何对配对样本进行t检验。答:配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的t检验用于检验两个相关的样本是否来自具有相同均值的总体。在对配对样本进行t检验时,首先计算两个样本中每个对应变量之间的差值;然后再检验其差值的均值是否为零,如果差值的均值接近零(在给定的置信区间内),说明两个总体均值在给定的置信水平上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差异。四、计算题(共30分)18.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,计算年龄在20岁以下的网络用户比例的置信区间。注:Z0.025=1.96答:19.某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试验田,并指定每块试验田使用其中的一种方法。通过对每块试验田的产量进行分析得到下面的方差分析表。请完成方差分析表。变差来源SSdfMSFSig组间AC320F0.000组内6048DE-总计B39-答: 12 / 12