《2023年统计学复习重点甘科夫.pdf》由会员分享,可在线阅读,更多相关《2023年统计学复习重点甘科夫.pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学习必备 欢迎下载 统计学复习重点 1.简要说明抽样误差和非抽样误差 非抽样误差是由于调查过程中各有关环节工作失误造成的,他包括调查方案中有关规定或解释不清所导致的填报错误,抄录错误,汇总错误及不完全抽样框导致的误差,调查中由于被调查者不回答产生的误差,理论上是可以避免的 抽样误差是利用样本推断总体时产生的误差,可被控制不可避免 2说明基尼系数的含义及用处 根据洛伦茨曲线给出的衡量收入分配平均程度的指标,即是基尼系数 基尼系数=A/A+B,A 表示实际收入 L 曲线和绝对平均线之间的面积,B 表示实际收入 L 曲线和绝对不平均线之间的面积,作用:反映收入分配的变化程度,衡量收入分配平均程度 3
2、,一组数据的分布特征可以从哪几个方面进行测度 分布集中趋势的测度 分布离散程度的测度 分布偏态与峰度的测度 4 简述众数,中位数和均值的特点和运用场合 众数:(1)一组数据中出现次数最多的变量值(2)分布最高峰点所对应的数值即众数(3)一种位置代表值,不受极端值的影响,应用场合有限,(4)一组数据可能没有众数或有几个众数(5)主要用于分类数据,也可用于顺序数据和数值型数据 中位数:(1)排序后处于中间位置上的数据(2)不受极端值的影响,具有稳健(稳定)性特点(3)主要用于顺序数据,也可用数值型数据,但不能用于分类数据 均值:(1)集中趋势的最常用、最重要的测度值(2)分子分母必须属于同一总体(
3、3)易受极端值的影响(4)有简单平均数和加权平均数之分 5 解释总体分布,样本分布和抽样分布的含义 总体分布:1总体中各元素的观察值所形成的分布 2分布通常是未知的 3可以假定它服从某种分布 样本分布:1一个样本中各观察值的分布 2也称经验分布 3当样本容量 n 逐渐增大时,样本分布逐渐接近总体的分布 抽样分布:1样本统计量的概率分布,是一种理论分布 学习必备 欢迎下载 2在重复选取容量为 n 的样本时,由该统计量的所有可能取值及出现的概率分布 样本统计量(样本均值,样本比例,样本方差等)是随机变量,它有若干可能取值,每个可能取值都有一定的可能性(即概率),从而形成它的概率分布,即统计上所谓的
4、抽样分布。3样本统计量是由 n 个随机变量构成的函数,故抽样分布属于随机变量函数的分布。4.结果来自容量相同的所有可能样本 6.简述评价估计量好坏的标准 无偏性:估计量抽样分布的数学期望等于被估计量的总体参数 有效性:对于同一总体参量的两个无偏点估计量,有更小标准差的估计量更有效 一致性:随样本量的增大,点估计量的值越来越接近总体的参量 7 说明区间估计的基本含义 在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 8 解释置信水平为 95%的置信区间 将构造置信区间的步骤重复很多
5、次,置信区间包含总体参数真值的次数所占的比例称为置信水平。由样本统计量所构造的总体参数的估计区间称为置信区间 95%的样本均值会落在 u 的 1.96 个标准误差的范围之内 9 简述样本量与置信水平,总体方差,允许误差之间的关系 其中:2(Enn222)zzE2 样本容量:与置信水平成正比 与总体方差成正比 与边际误差的平方成反比 与允许误差成反比 10 第一类错误和第二类错误分别指什么,他们发生的概率大小之间存在怎样的关系 第类错误(弃真错误):原假设为正确时拒绝原假设 第类错误的概率记为 被称为显著性水平 第类错误(取伪错误):原假设为错误时未拒绝原假设 第类错误的概率记为(Beta)和
6、的关系就像翘翘板,小 就大,大 就小 11 什么是显著性水平?他对于假设检验决策有什么意义?(1)我们可以在事先确定用于拒绝原假设 H0 的证据必须强到何种程度。这等于说我们要求多小的 P 值。而这个 P 值就叫显著性水平,用 表示 显著性水平表示总体中某一类数据出现的经常程度 调查中由于被调查者不回答产生的误差理论上是可以避免的抽样误差是实际收入曲线和绝对平均线之的面积表示实际收入曲线和绝对不平均线态与峰度的测度简述众数中位数和均值的特点和运用场合众数一组数据学习必备 欢迎下载 假如我们选择=0.05,样本数据能拒绝原假设的证据要强到:当 H0 正确时,这种样本结果发生的频率不超过 5%;如
7、果我们选择=0.01,就是要求拒绝 H0 的证据要更强,这种样本结果发生的频率只有 1%(2)如果 P 值小于或等于 ,我们称该组数据不利于原假设的证据有 的显著性水平 意义:确认了显著性水平就等于是控制了第一类错误的概率,但是无法确定第二类错误的概率 12 什么是方差分析?他研究的是什么?(1)检验多个总体均值是否相等 通过分析数据的误差判断各总体均值是否相等(2)研究分类型自变量对数值型因变量的影响 一个或多个分类型自变量 两个或多个(k 个)处理水平或分类 一个数值型因变量(3)有单因素方差分析和双因素方差分析 单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量
8、13 方差分析有那些基本假设?(1)每个总体都应服从正态分布 对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本 比如,每个行业被投诉的次数必须服从正态分布(2)各个总体的方差必须相同 各组观察数据是从具有相同方差的总体中抽取的 比如,4 个行业被投诉次数的方差都相等(3)观察值是独立的 比如,每个行业被投诉的次数与其他行业被投诉的次数独立 14 简述方差分析的基本思想 1.散点图观察不能提供充分的证据证明不同行业被投诉的次数之间有显著差异 这种差异可能是由于抽样的随机性造成的 2需要有更准确的方法来检验这种差异是否显著,也就是进行方差分析 所以叫方差分析,因为虽然我们感兴趣的
9、是均值,但在判断均值之间是否有差异时则需要借助于方差 这个名字也表示:它是通过对数据误差来源的分析判断不同总体的均值是否相等。因此,进行方差分析时,需要考察数据误差的来源 15 相关分析和回归分析的区别和联系是什么?区别:1 从研究目的上看:相关分析是研究变量间相互联系的方向和程度;回归分析是寻求变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测因变量的值。2 从对变量的处理来看:相关分析中的变量均为随机变量,不考虑两者的因果关系;回归分析是在变量因果关系的基础上研究自变量对因变量的具体影响,必须明确划分自变量和因变量,回归分析中通常假定自变量为非随机变量,因变量为随机变量。调查中由
10、于被调查者不回答产生的误差理论上是可以避免的抽样误差是实际收入曲线和绝对平均线之的面积表示实际收入曲线和绝对不平均线态与峰度的测度简述众数中位数和均值的特点和运用场合众数一组数据学习必备 欢迎下载 联系:共同的研究对象:都是对变量间相关关系的分析 只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义 相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析 16 测定长期趋势的移动平均法的特点 移动平均对数列具有平滑修匀作用,移动项数越多,平滑修匀作用越强;移动平均时距项数 N 为奇数时,只需一次移动平均,为偶数时,需要两次,中心化移动平均数
11、 当序列包含季节变动时,项数 N 应与季节变动长度一致,若包含周期变动,也应基本一致 由移动平均数组成的趋势值数列,较原数列的项数少 局限:不能完整地反映原数列的长期趋势,不便于直接根据修匀后的数列进行预测。17 测定季节变动的“趋势-循环剔除法”的基本步骤和原理是什么?原理:消除趋势因素,再用平均的方法消除不规则变动 方法步骤:(1)计算平均项数等于季节周期 L 的移动平均数,以消除季节变动 S(2)原数列各项数据除以移动平均序列对应时间的数据,得消除趋势和循环变动的序列 (3)将各年同月(或同季)的比率数据平均,以消除不规则变动 I,再分别除以总平均数,即得季节变动比率 S。(4)对季节比率的调整 18 总指数有哪两种基本的编制方式?他们有什么特点?1 先综合、后对比(综合指数法):2 先对比、后平均(平均指数法)oiipppI1oiiqqqI1nppIoiip1nqqIoiiq1调查中由于被调查者不回答产生的误差理论上是可以避免的抽样误差是实际收入曲线和绝对平均线之的面积表示实际收入曲线和绝对不平均线态与峰度的测度简述众数中位数和均值的特点和运用场合众数一组数据
限制150内