统计学之抽样与抽样估计概述3.pptx
《统计学之抽样与抽样估计概述3.pptx》由会员分享,可在线阅读,更多相关《统计学之抽样与抽样估计概述3.pptx(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、总体总体(Population) 研究对象的全体称为总体研究对象的全体称为总体样本(子样)样本(子样)(Sample) 从总体中抽取一部分个体进行试验或观察,这种从总体从总体中抽取一部分个体进行试验或观察,这种从总体中抽取个体的行为称为抽样。而从总体中抽样所得的一部分中抽取个体的行为称为抽样。而从总体中抽样所得的一部分个体叫样本个体叫样本总体参数总体参数(Population parameter) 描述总体分布特征的数值描述总体分布特征的数值样本统计量样本统计量(Sample statistic)重置抽样重置抽样(重复抽样)(Sampling with replacement) 要从总体N个单
2、位中随机抽取一个容量为n的样本,每次从总体中抽取一个单位,把顺序号登记下来之后,重新放回参加下一次抽选,连续反复抽取n次组成所要求容量的样本。 不重置抽样不重置抽样(不重复抽样)(Sampling without replacement) 要从总体N个单位中随机抽取一个容量为n的样本,每 次从总体中抽取一个单位,被抽中的单位不再放回参加下一次抽选,连续进行次便组成样本。 不重复抽样所得样本对总体的代表性较大,抽样误差较小,所以实践中通常采用不重复抽样。 简单随机抽样:从总体中抽取样本最常用的方法。从容量为N的总体中进行抽样,如果容量为n 的每个可能样本被抽到的可能性相等,则称容量为n的样本为简
3、单随机样本。 分层抽样:也称分类抽样或类型抽样,它是按某个主要标志对总体各单位进行分类,然后从各层中按随机原则分别抽取一定数目的单位构成样本。整群抽样:也称丛聚抽样或集团抽样。它是将总体分为若干部分(每一部分称为一个群),然后按随机原则从中一群一群地抽选,对抽中群内的所有单位进行全面调查。系统抽样也称机械抽样。它是先将总体单位按一定顺序排队,计算出抽样间隔(或抽样距离),然后按固定的顺序和间隔抽取样本单位。NXXNNPXXXXNXXXXiNN2212121)(1.一个样本中各观察值的分布 2.也称经验分布 3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 1)(2212121nxxsnn
4、pxxxxnxxxxiNN对统计量的所有可能取值及其对应概率的描述,就是统计量的抽样分布,即抽样分布抽样分布。抽样分布反映样本统计量的分布特征,根据抽样分布的规律,可揭示样本统计量与总体参数之间的关系,计算抽样误差,并说明抽样推断的可靠程度。 误 差登记性误差代表性误差系统性误差随机性误差登记性误差是指在调查和汇总过程中由于观察、测量、登记、计算等方法的差错或被调查者提供虚假资料而造成的误差。任何一种统计调查都可能产生登记性误差。代表性误差是指用样本指标推断总体指标时,由于样本结构与总体结构不一致、样本不能完全代表总体而产生的误差。系统性误差是指由于非随机因素引起的样本代表性不足而产生的误差,
5、表现为样本估计量的值系统偏低或偏高。随机性误差又称偶然性误差,是指遵循随机原则抽样,由于随机因素(偶然性因素)引起的误差。抽样估计中的所谓抽样误差,就是指的这种随机误差。登记性误差:存在于一切调查中代表性误差:仅产生于抽样调查,不可避免。代表性误差抽样误差在实际一次调查中是调查不出来的,但其平均值是可以推算的系统性误差:不随样本量增减而变化随机误差(抽样误差):随样本量增大而减小抽样平均误差:所有可能的样本指标与总体指标间的平均差异程度。mPpmXxpx22)(,)(抽样极限误差抽样极限误差 样本指标与总体指标之间允许的误差范围叫抽样极限样本指标与总体指标之间允许的误差范围叫抽样极限误差。也称
6、抽样允许误差。误差。也称抽样允许误差。 它是样本指标可允许变动的上限或下限与总体指标它是样本指标可允许变动的上限或下限与总体指标之差的绝对值。之差的绝对值。即:即:xpXpP 重复抽样:(1)总体是正态分布,样本必然是正态分布(2)样本平均数的平均数等于总体平均数(3)样本平均数的方差等于总体方差除以样本 容量n(4)n越大,样本平均数越趋近于正态分布nx225 . 21NXXNii25. 1)(122NXXNiiw3,4w3,3w3,2w3,1w3w2,4w2,3w2,2w2,1w2w4,4w4,3w4,2w4,1w4w1,4w4w1,3w3w2w1w1,2w1,1w1w第二个观察值第二个观
7、察值w第一个第一个w观察值观察值w所有可能的所有可能的n = 2 的样本(共的样本(共16个)个)w3.5w3.0w2.5w2.0w3w3.0w2.5w2.0w1.5w2w4.0w3.5w3.0w2.5w4w2.5w4w2.0w3w2w1w1.5w1.0w1w第二个观察值第二个观察值第一个第一个观察值观察值w16个样本的均值个样本的均值5 . 2X625. 0225. 12X不重复抽样:(1)总体是正态分布,样本必然是正态分布(2)样本平均数的平均数等于总体平均数(3)样本平均数的方差等于总体方差除以样本 容量n(4)n越大,样本平均数越趋近于正态分布122NnNnx抽样平均误差(1)均值重复
8、抽样:不重复抽样:nnx2112NnNnNnNnx抽样平均误差(1)比例重复抽样:不重复抽样:nppp)1 ( 1)1 (NnNnppp总体被研究标志的变异程度。 在其他条件不变的情况下,总体标志的变异程度愈小,则抽样误差也愈小;总体标志的变异程度愈大,则抽样误差也愈大。抽样单位数的多少。 在其他条件不变的情况下,抽样单位数愈多,抽样误差愈小;抽样单位数愈少,抽样误差愈大。抽样的方法。 在其他条件不变的情况下,重复抽样的抽样误差大于不重复抽样。抽样的组织形式。 抽样误差的大小与样本单位数的平方根成反比:如果抽样误差要减少二分之一,则样本单位数必须增大到4倍。例、从某校1000名学生中简单随机抽
9、取50名学生,称得平均体重为50千克,若已知总体标准差为10千克,计算重复抽样及不重复抽样下抽样平均误差。解:重复抽样条件下, 不重复抽样条件下, 在样本量相同的情况下,不重复抽样的平均误差要小于重复抽样的平均误差。41. 1225010)(22nnxVx38. 19 . 19 . 11100050100050101)(22xNnNnxV抽样估计必须包括三要素:1)估计值2)估计值的误差范围3)概率保证程度(置信度)一、点估计点估计(Point estimate) 点估计也称定值估计,常用点估计方法有矩估计,极大似然估计。样本均值是总体均值的点估计量,样本方差s2是总体方差2的点估计量,样本比
10、例p是总体比例P的点估计量。优良估计量的标准: 无偏性 有效性 一致性区间估计区间估计就是根据样本求出总体未知参数的估计区间,并使其可靠程度达到预定要求。(1 1) 总体方差总体方差2 2已知时已知时由于 ,所以对于给定的置信度1-,有即 可见,极限误差的计算公式为则总体均值的置信区间为221/xPzzn(0,1)/xzNn12/nzxPxxznz2/2/),(xxxx解:已知 =58,=10,z/2=1.96,n=100 =10/10=1(千克) =1.961=1.96(千克) 置信下限为58-1.96=57.04, 置信上限为58+1.96=59.96故所求置信区间为(57.04,59.9
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 抽样 估计 概述
限制150内