《2022年统计学名词解释与简答题答案.docx》由会员分享,可在线阅读,更多相关《2022年统计学名词解释与简答题答案.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 优秀学习资料 欢迎下载1. 分类数据是只能归于某一类别的非数字型数据,1 分 它是对事物进行分类的结果,1 分 数据表现为类别,使用文字来表述的;1 分 2. 四分位数 quartile 也称四分位点, 他是一组数据排序后处于 25%和 75%位置上的值;1 分 四分位数是通过 3 个点将全部数据等分为 4 部分, 1 分 其中每部分包括 25%的数据;1 分 3. 方差分析( analysis of variance, ANOVA)就是通过检验各总体的均值是否相等,1 分 来判定分类型自变量对数值型因变量是否有显著影响;2 分 4. 相关系数
2、( correlation coefficient)是依据样本数据运算的,1 分 度量两个变 量之间线性关系强度的统计量;2 分 5. 居民消费价格指数(consumer price index , CPI )是度量居民消费品和服务项目价 格水平随时间变动的相对数,1 分 反映居民家庭购买的消费品和服务价格水平的变动情 况; 2 分 五、简答题 6. 简述直方图和茎叶图的区分;答:(1)直方图虽然能很好地显示数据的分布,但不能保留原始的数值;茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,即保留了原始数据的信息;(3 分)( 2)在应用方面,直方
3、图通常用于大批量数据,茎叶图通常适用于小批量数据;(2 分)7. 回来分析主要解决那几个方面的问题?答:(1)从一组样本数据动身,确定出变量之间的数学关系式;(1 分)(2)对这些关系式的可信程度进行各种统计检验,并从中影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的;(2 分)(3)利用这些所求的关系式,依据一个或几个变量的取值来估量或猜测另一个特定变量的取值,并给出这种估量或猜测的牢靠程度;(2 分8. 简述概率抽样的定义及特点;答:概率抽样( probability sampling )也称随机抽样,是指遵循随机原就进行的抽样,总体中每个单位都有肯定的机会被选入样本
4、;( 2 分)它具有以下几个特点:第一,抽样时是按肯定的概率以随机原就抽取样本;(1 分)其次,每个单位被抽中的概率是已知的,或是可以运算出来的;(1 分)最终,当用样本对总体目标量进行估量时,要考虑到每个样本单位被抽中的概率;(1 分)9. 简述评判估量量好坏的标准;答:1 无偏性 ; (2 分)2 有效性 ; (2 分)3 一样性 . (1 分)1. 次序数据( ran k data)是只能归于某一有序类别的(1 分)非数字型数据; (2 分)2. 抽样误差( sampling error)是由于抽样的随机性引起的,(1 分)样本结果与总体真值之间的误差; (2 分)3. 离散系数也成为变
5、异系数(coefficient of variation),它是一组数据的标准差与其相应的平均数之比; (1 分)其运算公式为: (1 分)名师归纳总结 - - - - - - -第 1 页,共 8 页精选学习资料 - - - - - - - - - 优秀学习资料欢迎下载离vss主要是用于比较不同样本数据的离散程度;x离散系数是测度数据离散程度的相对统计量,散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小;(1 分)4. 置信区间( confidence interval)在区间估量中,有样本统计量所构造的总体参数的估计区间称为置信区间, (2 分)其中区间的最小值称为置信
6、下限;(1 分)5. 点估量;利用估量的回来方程,对于 x 的一个特定值 x ,求出 y 的一个估量值就是点估量;(1 分)点估量可分为两种:一是平均值的点估量;(1 分)五、简答题 6. 简述直方图与条形图的不同点 . (1 分)二是个别值的点估量;答:第一,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)就是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度就表示各组的组距,因此其高度与宽度均有意义;(2 分)其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图就是分开排列;(2 分)最终,条形图主要用于展现分类数据,而直
7、方图就主要用于展现数值型数据;(1 分)7. 简述一张好的图形应具有的基本特点;答:( 1)显示数据 ; (1 分)2 让读者把留意力集中在图形的内容上,而不是制作图形的程序上 ; (1 分)3 防止歪曲 ; (1 分)4 强调数据之间的比较; (1 分)(1 分)5 服务于一个明确的目的, 有对图形的统计描述和文字说明;8. 简述众数、中位数和平均数的关系;答:从分布的角度看, 众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置的值,而平均数就是全部数据算术平均;(2 分)因此,对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:假如数据的分布式对称的,众数
8、M 0 、中位数(M )和平均数(x )必定相等,即 M 0 = M = x ;(1 分)假如数据是左偏分布,说明数据存在微小值, 必定拉动平均数向微小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响, 因此三者之间的关系表现为:x M M ;(1 分)假如数据是右偏分布,说明数据存在极大值,必定拉动平均数向极大值一方靠,就 M 0 M x ;(1 分)9. 在多元线性回来中,挑选自变量的方法有哪些?答:变量挑选的方法主要有:向前挑选、子集等;(1 分)1. 系统抽样( systematic sampling(2 分)向后剔除、 (1 分)逐步回来、 (1 分)最优)将总体中的全部单位
9、(抽样单位)按肯定次序排列,名师归纳总结 (1 分)在规定的范畴内随机的抽取一个单位作为初始单位,(1 分)然后按事先规定好的规第 2 页,共 8 页就确定其他样本单位,这种抽样方法被称为系统抽样;(1 分)- - - - - - -精选学习资料 - - - - - - - - - 2. 中心极限定理(优秀学习资料欢迎下载、2 有限 的任意一个总体中抽central limit theorem):设从均值取样本量为 n 的样本,(1 分)当 n 充分大时,样本均值 X 的抽样分布近似听从均值为、2方差 /n 的正态分布;(2 分)3. 回来模型( regression model)对于具有线性
10、关系的两个变量,(1 分)可以用一个线性方程来表示他们之间的关系;( 1 分)描述因变量 y 如何依靠于自变量 x 和误差项 的方程称为回来模型; (1 分)4. 指数平滑法( exponential smoothing )是通过对过去的观看值加权平均进行猜测的一种方法,(1 分)该方法使t+1 期的猜测值等于t 期的实际观看值与t 期的猜测值的加权平均值;(2 分)5. 置信区间( confidence interval)在区间估量中,有样本统计量所构造的总体参数的估计区间称为置信区间, (2 分)其中区间的最小值称为置信上限;(1 分)五、简答题 6. 简述制作统计表应留意的几个问题 答:
11、第一,要合理支配统计表的结构,比如行标题、列标题、数字资料的位置应合理安 排;(2 分)其次,表头一般应包括表号、总标题和表中数据的单位等内容;(1 分)再次,表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清晰、醒目;(1 分)最终, 在使用统计表时,必要时可在表的下方加上注释,特殊要注明数据来源,以表示 对他人劳动成果的敬重,以备读者查阅使用;(1 分)7. 什么是假设检验中的两类错误?答:一类错误是原假设H 为真却被我们拒绝了,犯这种错误的概率用表示, 所以也称错误或弃真错误; (3 分)另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用表示,所以也称错误或取伪错
12、误; (2 分)8. 方差分析包括哪些类型?它们有何区分?答:依据所分析的分类型自变量的多少,方差分析可分为单因素方差分析和双因素方差分析(2 分);当方差分析中只涉及一个分类型自变量时称为单因素方差分析;在对实际问题的争论中,有时需要考虑对试验结果的影响;称为双因素方差分析; (1 分)9. 简述构建综合评判指数的步骤( 2 分)当方差分析中涉及两个分类型自变量时,名师归纳总结 答:1 建立综合评判指标体系;(2 分)第 3 页,共 8 页(2)评判指标的无量纲化处理;(1 分)(3)确定各项评判指标的权重;(1 分)- - - - - - -精选学习资料 - - - - - - - - -
13、 优秀学习资料 欢迎下载(4)运算综合评判指数; (1 分)1. 数值型数据( metric data )是按数字尺度测量的观看值,(1 分)( 2 分)其结果表现为详细的数;2. 非概率抽样( non-probability sampling )是相对于概率抽样而言的,指抽取样本时不是依据随机原就, ( 1 分)而是依据争论目的对数据的要求,抽出部分单位对其实施调查;(1 分)(1 分)实行某种方式从总体中3. 时间序列( time series)是同一现象在不同时间上的(2 分)相继观看值排列而成的序列;(1 分)4. 指数, 或称统计指数, 是分析社会经济现象数量变化的一种重要统计方法;
14、指数是测定多项内容数量综合变动的相对数;( 1 分)这个概念中包含两个重点:第一个要点是指数的实质是测定多项内容; (1 分)指数概念的其次个要点是其表现形式为动态相对数,既然 是动态相对数,就涉及指标的基期对比,不同要素基期的挑选就成为指数方法需要争论 的问题;(1 分)5. 显著性水平 significant level是一个统计专出名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,(1 分)其实这就是前面所说假设检验中犯弃真错误的概率,(1 分)它是由人们依据检验的要求确定的,通常取 0.05或 0.01,这说明,当做出接受原假设的打算时,其正确的概率为 五、简答题95%
15、或 99%;(1 分)6. 简述一组数据的分布特点可以从哪几方面进行测设 . 答:数据分布的特点可以从三方面进行测度和描述:( 1)是分布的集中趋势,反映各数据向其中心值靠拢或集合的程度;(2 分)( 2)是分布的离散程度,反映各数据远离其中心值的趋势;(2 分)( 3)是分布的外形,反映数据分布的偏态和峰态;(1 分)7. 简述古典概型的特点;答:(1)结果有上限; (2 分)(2)各个结果显现的可能行被认为是相同的;(3 分)SSA)占总平方和(SST)8. 说明2 R 的含义和作用;答:怎样度量它们之间的关系强度呢?可以用组间平方和(的比例大小来反映,这一比例记为2 R ,即R2SSA
16、组间SS SST 总SS 其平方根 R就可以用来测量两个变量之间的关系强度;(3 分)2 R 的平方根 类似于第 11 章中介绍的相关系数r 可以用来测量自变量与因变量之间的关系强度;依据上面的结果可以运算出 R=0.591404,这说明行业与投诉次数之间有中等以上的关系;( 2 分)9. 简述方差分析的基本步骤名师归纳总结 - - - - - - -第 4 页,共 8 页精选学习资料 - - - - - - - - - 优秀学习资料 欢迎下载答: 1 提出假设;(2 分)2 构造检验的统计量; (1 分)3 统计决策;(1 分)4 方差分析表; (1 分)1. 泊松分布( Poisson d
17、istribution)是用来描述在一指定时间范畴内或在指定的面积或体积之内( 2 分)某一大事显现的次数的分布;(1 分)2. 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观看系统的数据,(2 分)进行量化的分析、总结,并进而进行推断和猜测,为相关决策供应依据和参考;(1 分)3. . 标准差各数据偏离平均数的距离(离均差)的平均数,(1 分)它是离差平方和平均后的方根;(1 分)用 表示;因此,标准差也是一种平均数,标准差是方差的算术平方根;(1 分)4. 居民消费价格指数(consumer price index, CPI )是度量居民消费品和服务项目价格水平随时间
18、变动的相对数, ( 2 分)反映居民家庭购买的消费品和服务价格水平的变动情形;(1 分)5. 四分位数 quartile 也称四分位点, 他是一组数据排序后处于 25%和 75%位置上的值;(1分)四分位数是通过 3 个点将全部数据等分为 4 部分,(1 分)其中每部分包括 25%的数据;(1 分)五、简答题6. 简述假设检验的流程 . 答:第一提出原假设和备择假设;原假设和备择假设分别为:H0:3190 克 ( 1 分)H0:3190 克)(3 分)接下来,需要确定适当的检验统计量,并运算其数值;最终可以进行统计决策;(1 分)27. 说明运算统计量的步骤;答:步骤一:用观看值0f减去期望值
19、ef;(2 分)步骤二:将f0fe之差平方;(1 分)步骤三:将f0fe2的结果除以; (1 分)步骤四 ; 将步骤三的结果加总; (1 分)8. 简述时间序列的构成要素名师归纳总结 答:时间序列的成分可以分为四种,即趋势(T)、(2 分)季节性或季节变动(S)、(1第 5 页,共 8 页分)周期性或循环波动(C)、(1 分)随机性或不规章波动(I );(1 分)- - - - - - -精选学习资料 - - - - - - - - - 9. 简述假设检验中P 值的含义;优秀学习资料欢迎下载答:假如原假设 H0是正确的,(1 分)所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为 P
20、值;(2 分)P 值是假设检验中的另一个决策工具,对于给定的显著性水平,如 P,就拒绝原假设; (2 分)1非概率抽样(non-probability sampling)是相对于概率抽样而言的,指抽取样本时不是依据随机原就, (1 分)而是依据争论目的对数据的要求,实行某种方式从总体中抽出部分单位对其实施调查; (2 分)2置信区间( confidence interval)在区间估量中,有样本统计量所构造的总体参数的估计区间称为置信区间, (2 分)其中区间的最小值称为置信下限;(1 分)3. 方差分析( analysis of variance, ANOVA)就是通过检验各总体的均值是否相
21、等,(1分)来判定分类型自变量对数值型因变量是否有显著影响;(2 分)4股票价格指数,反映某一股票市场上多种股票价格变动趋势的一种相对数,(2 分)简称股价指数,其单位一般用“ 点” 表示;(1 分)5独立性检验,对两个分类型变量是否存在相依关系的检验;有必要对这种相关性进行进一步测定;(1 分)五、简答题(2 分)假如存在相依关系,26. 答:判定系数 R 测度了回来直线对观测数据的拟合程度;如全部观测点都落在直线上,2残差平方和 SSE=0, R =1,拟合是完全的; (2 分)假如 y 的变化与 x 无关, x 完全无助于说明 y 的变差,此时 .y y , 就 R =0. 可见 2R
22、的取值范畴是 0,1 2;R 越接近于 1,说明回 2归平方和占总平方和的比例越大,回来直线与各观看点越接近,用 x 的变化来说明 y 值变差2的部分就越多,回来直线的拟合程度就越好;(2 分)反之,R 越接近于 0,回来直线的拟合程度就越差; (1 分)7. 答:第一步:确定时间序列所包含的成分,也就是确定时间序列的类型;(2 分)其次步:找出适合此类时间序列的猜测方法;(1 分)第三步:对可能的猜测方法进行评估,以确定正确猜测方案;(1 分)第四步:利用正确猜测方案进行猜测;(1 分)8. 答:(1)条形图是用条形的长度或高度表示各类别频数的多少,其宽度就是固定的;直方图是用面积表示各组频
23、数的多少,矩形的高度表示每一组的频数或频率,宽度就表示各组的组距,因此其高度与宽度均有意义;(2 分)(2)直方图的各矩形通常是连续排列,而条形图就是分开排列;(1 分)(3)条形图主要用于展现分类数据,而直方图就主要用于展现数值型数据;(2 分)9. 答;在运算一组商品价格的综合指数时,把作为权数的销售量固定在基期运算的指数称为拉式价格指数; (3 分)在运算一组商品价格的综合指数时,把作为权数的销售量固定在报告期运算的指数称为帕式价格指数;(2 分)1. 参数:用来描述总体特点的概括性数字度量,征值;(1 分)(2 分)是争论者想要明白的总体的某种特2. 截面数据,在相同或近似相同的时点上
24、收集的数据,(2 分)它描述的是现象在某一时刻的变化情形; ( 1 分)名师归纳总结 3. 股票价格指数,反映某一股票市场上多种股票价格变动趋势的一种相对数,(2 分)简称第 6 页,共 8 页股价指数,其单位一般用“ 点” 表示;(1 分)- - - - - - -精选学习资料 - - - - - - - - - 4. 中心极限定理(优秀学习资料欢迎下载2有限 的任意一个总体中抽取样central limit theorem):设从均值、本量为 n 的样本,(2 分)当 n 充分大时,样本均值X 的抽样分布近似听从均值为、方差2/n 的正态分布; (1 分)5. 数值型数据( metric
25、data)是按数字尺度测量的观看值,值;(1 分)五、简答题(2 分)其结果表现为详细的数6. 答:指数平滑法是对过去的观看值加权平均进行猜测的一种方法,(2 分)该方法使得第t+1 期的猜测值等于 t 期的实际观看值与第 t 期猜测值的加权平均值; (2 分)一次指数平滑法是适合平稳序列的一种猜测方法,其模型为:Ft+1= Yt+1-Ft (1 分)7. 答:假如原假设 H为正确的,所得到的样本结果会像实际观测结果那么极端获更极端的概率, 称为 P 值;( 2 分) P值是假设检验中的另一个决策工具,如 P,就拒绝原假设; (3 分)8. 答:直方图虽然能显示数据的分布情形,但不能保留原始数
26、据;对于给定的显著性水平,( 2 分)茎叶图类似于横置的直方图, 与直方图相比茎叶图既能显示数据的分布情形,又能显示原始数据,既保留了原始数据的信息; (2 分)在应用方面,直方图适用于大批量的数据,茎叶图适用于小批量的数据;( 1 分)9. 答:确定时间序列所包含的成分,既确定时间序列的类型;(2 分)找出适合此类时间序列的猜测方法;(1 分)对可能的猜测方法进行评估,以确定正确方案;(1 分)利用正确方案进行猜测;(1 分)1. 错误,原假设为伪却在检验中未拒绝原假设, 表示其概率; (1 分)(2 分)又称取伪错误或第类错误,用2. 指数, 或称统计指数, 是分析社会经济现象数量变化的一
27、种重要统计方法;指数是测定多项内容数量综合变动的相对数;( 1 分)这个概念中包含两个重点:第一个要点是指数的实质是测定多项内容; (1 分)指数概念的其次个要点是其表现形式为动态相对数,既然是动态相对数,就涉及指标的基期对比,不同要素基期的挑选就成为指数方法需要争论的问题;(1 分)3方差分析( analysis of variance, ANOVA)就是通过检验各总体的均值是否相等,( ,2分)来判定分类型自变量对数值型因变量是否有显著影响;(1 分)4. 股票价格指数,反映某一股票市场上多种股票价格变动趋势的一种相对数,(2 分)简称股价指数,其单位一般用“ 点” 表示;(1 分)5.
28、回来模型( regression model)对于具有线性关系的两个变量,可以用一个线性方程来表示他们之间的关系; (2 分)描述因变量y 如何依靠于自变量x 和误差项的方程称为回来模型;(1 分)五、简答题6. 答:确定并分别季节成分;(2 分)建立猜测模型,并进行猜测;(2 分)运算出最终的猜测值; ( 1 分)名师归纳总结 7. 答:因变量余字变量之间有线性关系;(1 分)第 7 页,共 8 页- - - - - - -精选学习资料 - - - - - - - - - 优秀学习资料 欢迎下载在重复抽样中,自变量的取值是固定的,即假定x 是非随机的; (1 分)误差项 是一个期望值为 0
29、的随机变量,即 E 0;(1 分)对于全部的 x 值,的方差都相同; (1 分)误差项 是一个听从正态分布的随机变量,且独立,即 N(0,2)(1 分)8. 答:在运算一组商品价格的综合指数时,把作为权数的销售量固定在基期运算的指数称为拉氏价格指数; (3 分)在运算一组商品价格的综合指数时,把作为权数的销售量固定在报告期运算的指数称为帕氏价格指数;(2 分)9. 答:从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置的值,而平均数就是全部数据算术平均;(2 分)因此,对于具有单峰分布的大多数名师归纳总结 数据而言, 众数、中位数和平均数之间具有以下关系:假如数据的分布式对称的,众数 M0 、第 8 页,共 8 页中位数(M )和平均数(x )必定相等,即M0=M = x ;(1 分)假如数据是左偏分布,说明数据存在微小值, 必定拉动平均数向微小值一方靠,而众数和中位数由于是位置代表值,不受极值的影响, 因此三者之间的关系表现为:x M M ;(1 分)假如数据是右偏分布,说明数据存在极大值,必定拉动平均数向极大值一方靠,就M0M x ;(1 分)- - - - - - -
限制150内