社会统计学复习题(有答案)复习资料重点.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《社会统计学复习题(有答案)复习资料重点.docx》由会员分享,可在线阅读,更多相关《社会统计学复习题(有答案)复习资料重点.docx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数)1、第五次人口普查南京市和上海市的人口总数之比为一比较 相对指标;某企业男女职工人数之比为一比例 相对指标;某产品的废品率为一结构 相对指标;某地区福利机构网点密度为 强度 相对指标。2、各变量值与其算术平均数离差之和为零;各变量值与其算术平均数离 差的平方和为 最小值。3、在回归分析中,各实际观测值y与估计值亍的离差平方和称为 剩余 变差。4、平均增长速度=平均发展速度 1 (或100%)。5、正J形反J形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多;曲线的特征是变量值分布的次数随变量值的增大而逐步减少。6、调查宝钢、鞍
2、钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属 于重点 调查。7、要了解某市大学多媒体教学设备情况,则总体是该市大学中的全部多媒体教学设 备;总体单位是该市大学中的每一套多媒体教学设备;o8、若某厂计划规定A产品单位成本较上年降低6%,实际降低了 7%,则A产品单位成 本 计 划 超 额 完 成 程 度为A产品单位成本计划超额完成程度= 100%-幽如坐= 1.06%;若某厂计划规定B100%-6%产品产量较上年增长5%,实际增长了 10%,则B产品产量计划超额完成程度 为 B产品产量计划超额完成程度=峥 +:% -100% = 4.76%。100% + 5%9、按照标志表现
3、划分,学生的民族、性别、籍贯属于品质 标志;学生的体重、年龄、成绩属于 数量标志。10、从内容上看,统计表由主词 和宾词 两个部分组成;从格式上看,统计表由总标题、横行标题、纵栏标题 和指标数值(或统计数值);四个部分组成。11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单 位产品原材料消耗量的相关关系属于正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。12、按指标所反映的数量性质不同划分,国民生产总值属于 数量指标;单位成本属于 质量 指标。13、如果相关系数r=0, 则表明两个变量之间 不存在线性相关关系 O年份
4、时间编号t产值(万元)199617519972113199831281999412120005136合计1557320016152200271892022818420229190202210212合计40927设* =a + bt4一-一3- 40 2 _573= = 8 y.=V v 927= 114.60 芟=右上=一 = 185.40“n 5n 515-n5114.60 = + 3b代入公式可得解得。= 72.12 b =14.16185.40 = 4 + 8则直线趋势方程为=72.12 + 14.16/当f = U时 92006 =72.12 + 14.16x1 1 = 227.88(
5、万元)答:以半数平均法拟合直线趋势方程为$,=72.12 + 14.16/; 2022年的产值约为227.88万元。统计学问答题1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是门收集、整理、显示和分析统计数据的科学、其目的是探索数据内在的数量规律性。统 计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研 究,目的也在于对统计 数据的研究,离开了统计数据,统计方法乃至统计学就失去了其存在意义。3 .简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各有关环节工作失误造 成的,从理论上看,这类误差是可以避免的。抽样误差
6、是利用样本推断总体时所产生的误差,它是丕 可避免的,但可以计量和控制的。4 (先分为集中趋势与分散程度,再继续细分,即综述7、8)一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、分布形状(偏态和峰度)几方面来测度O分布集中趋势的测度有众数、中位数、分位数、均值、几何平均数、切尾均值;分布离散程度的测度有 极差、内距、方差和标准差、离散系数。7 .简述众数、中位数和均值的特点和应用场合。答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度 来考虑的,而均值是对所有数据计算后得到的。众数一组数据分布的峰值,容易计算,但不
7、是总是存在,众数只有在数据量较多时才有意义,数据 量较少时不宜使用。主要适合作为分类数据的集中趋势测度值,应用场合较少:中位数是一组数据中间位置上的代表值,直观,不受极端数据的影响,但数据信息利用不够充分,当 数据的分布偏斜较大时,使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。;均值数据对数值型数据计算的,而且利用了全部数据信息,提取的信息最充分,当数据呈对称分布 或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但受极端数据的影响,对于偏态 分布的数据,平均数的代表性较差,此时应考虑中位数或众数。8 .标准差和方差反映数据的什么特征反映数据离散程度的特征.标准差反应数据的
8、变化幅度,即上下左右波动的剧烈程度。在统计中可以 用来计算某变量值的区间范围(即置信区间)。方差:即标准差的平方。所以,标准差和方差两者没有本质区别。5怎样理解均值在统计中的地位?答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质, 是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此 均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。10为什么要计算离散系数?答:在比较二组数据的差异程度时,由于方差和标准差是以均值为中心计算出来的,有时直接比较标 准差是不准确的,需要剔除均值大小不等的影响,计
9、算并比较离散系数1怎样理解频率与概率的关系?频率的极限是概率吗?频率在一定程度 上反映了事件发生的可能性大小.尽管每进行一连串(n次)试验,所得到的频率可以 各不相同,但只要n相当大,频率与概率是会非常接近的.因此,概率是可以通过频率来“测量”的,频 率是概率的一个近似.概率是频率稳定性的依据,是随机事件规律的一个体现.实际中,当概率不易求 出时,人们常通过作大量试验,用事件出现的频率去近似概率.当实验次数趋向于无穷时,频率的极限 就是概率。2概率的三种定义各有什么应用场合和局限性古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;要求样本空间是有限并且是 已知的。机会游戏的很多问题
10、可以满足这些条件:但现实生活的实际问题样本空间或者出现的结果 无限或者未知,因此具有较强的局限性 统计概率历史上同类事物发生的稳定频率。在日常生活与工作中,应用较为普遍;统计概率通常是 计算大量重复试验111该事件出现次数的频率,但一些试验是不能重复的主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频 率来估计,但决策者又必须对其进行估计从而做出相应决策。具有主观随意性3概率密度函数和分布函数的联系与区别表现在哪些方面一元函数下.概率分布函数是概率密度函数的变上限积分,就是原函数.概率密度函数是概率分布函数的一阶导函数.多元函数下.联合分布函数是联合密度函数
11、的重积分.联合密度函数是联合分布函数关于每个变量的偏导.6随机变量的数学期望和方差与第二章所讲的均值和方差有何区别,联系数学期望又称均值,实质上是随机变量所有可能取值的一个加权平均,其权数就是取值的概率,方差 一样12解释总体分布、样本分布和抽样分布的含义总体分布:所有元素出现概率的分布样本分布:样本n个观察值的概率分布。抽样分布:由样本n个观察值计算的统计量的概率分布.简述评价估计量好坏的标准1、无偏性:估计量抽样分布的数学期望等于被估计的总体参数2、有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效3、一致性:随着样本量的增大时,点估计量的值越来越接近被估总体的参数。举例
12、答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。设总体参数8的估计量有4和“,如果=称自是无偏估计屈:如果&和包是无偏估计属,且。(&)小于o(a),则a比。更有效;如果当样本容量-s, a.e,则&是相合估计量。1 .说明区间估计的基本原理答:总体参数的区间估计是在一定的置信水平於根据样本统计最的抽样分布计算出用样本统计量加减 抽样误差表示的估计区间。3解释置信水平的含义(画图)置信区间中包含总体参数真值的次数所占的比率称为置信水平;而置信区间是指由样本统计量所构成的总 体参数的估计区间。置信区间越大,置信水平越高。4 .解释置信水平为95%的置信区间的含义答:总体参数是固定的,未知
13、的,置信区间是一个随机区间。置信水平为95%的置信区间的含义是指, 在相同条件下多次抽样下,在所食构造的置信区间里大约有95%包含总体参数的真值。5 .简述样本容量与置信水平、总体方差、允许误差的关系,答:以估计总体均值时样本容量的确定公式为例:_(二.2)一。2样本容量与置信水平成正比、与总 体方差成正比、与允许误差成反比。二 彦附加题:简(综)述述置信区间和显著性水平的关系显著性水平为a检验的拒绝域,与置信水平为1,的置信区间互为补集的,也即:求接受域就是求置信 区间,所以假设检验和区间估计本质是一回事。1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则.答:原假设
14、通常是研究者想收集证据予以反对的假设:而备择假设通常是研究者想收集证据予以支持的 假设。建立两个假设的原则有:(1)原假设和备择假设是一个完备事件组,而且相互对立。(2) 一般先确定备择假设。再确定原假设。(3)等号“=,总是放在原假设上.(4)假设的确定带有一定的主观色彩。(5)假设检验的目的主要 是收集证据来拒绝原假设。3 .什么是显著性水平?它对于假设检验决策的意义是什么?答:假设检验中犯第一类错误的概率被称为显著性水平。显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率, 对检验结果的可靠性起一种度量作用4 .什么是p值? p值
15、检验和统计量检验有什么不同?答:P值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的 概率。P值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显著性水平, 来控制犯第一类错误的上限,P值可以有效地补充提供地关于检验可靠性的有限信息。P值检验的优点 在于,它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。6比较单侧检验和双侧检验的区别(1)问题的提法不同,双侧检验研究的是新方法与旧方法是否有差异:单侧检验研究的是新方法明显 好于旧方法还是新方法明显不如旧方法。2建立假设的形式不同,双侧检验的假设是IIO: u=u
16、0 Hl: u 和0;单侧检验的假设是HO: uu()或HO: uu() Hl: u Z a/2;单侧检验的否定区域是ZZa1什么是方差分析?它研究的是什么?方差分析是检验多个总体均值是否相等的统计方法,来判断分类型自变量对数值型因变量是否有显著影 响。它所研究的是分类型自变量对数值型因变量的影响。2方差分析中有哪些基本假定每个总体都应服从正态分布;每个总体的方差必须相同;观测值是独立的3简述方差分析的基本思想通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小7解释水平项平方和、误差项平方和的含义水平项误差平方和简记为SSA,它是各组平均值与总平均值的误差平方
17、和,反映各总体的样本均值之间 的差异程度,是对随机误差和系统误差的大小的度量,因此又称为组间平方和误差项平方和,简记为SSE,它是每个水平或的各样本数据与其组平均值误差的平方和,反映了每个 样本各观测值的离散状况,是对随机误差的大小的度量,因此又称为组内平方和或残差平方和 1.相关分析与回归分析的区别与联系是什么?答:相关与回归分析是研究变量之间不确定性统计关系的重要方法相关分析主要是判断两个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程 度。回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。具有共同的研究对象,都是对变量间相关关系的分析,二者可以相互补充。相关
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会 统计学 复习题 答案 复习资料 重点
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内