抽样调查之简单随机抽样18230.pptx
《抽样调查之简单随机抽样18230.pptx》由会员分享,可在线阅读,更多相关《抽样调查之简单随机抽样18230.pptx(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Chap 2 Chap 2 简单随机抽样简单随机抽样2.2 简单估计法(SE)2.1 定义与符号抽样调查 2.5 样本量的确定 2.6 其它相关问题 2.3 比率估计量 2.4 回归估计量3/27/20231抽样调查2.1 定义与符号一、定义与符号(一)定义上述抽样就称为不放回简单随机抽样 定义定义2.12.1:设有限总体共有N个单元,一次整批抽取 n个单元 使得每个单元被抽中的概率都相等,任何 n个不同单元的组合(样本)都有相同的概率被抽中,这种抽样方法称为简单随机抽样法,所抽到的样本为简单随机样本。3/27/20232抽样调查 定义定义2.2:(在具体实施过程中,)从总体中逐个等概率抽取单
2、元(每次抽取到尚未入样的任何一个单元的概率都相等),直到抽满 n个为止。如果每次抽中一个单元,然后放回总体,重新抽取。这样一个单元有可能被重复抽中,故又称重复抽样重复抽样。3/27/20233抽样调查 定义定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组合构造所有可能的 CNn 个样本,从CNn 个样本随机抽取一个样本,使每个样本被抽中的概率都等于 1/CNn.上述三中定义其实是完全等价的,而定义定义2.2在实际中容易实施。3/27/20234抽样调查例2.1 设总体有5个单元(1,2,3,4,5),按有放回简单随机抽样的方式抽取容量为2的样本,则所有可能样本为个,如表2.1。
3、表2.1 放回简单随机抽样所有可能样本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,53/27/20235抽样调查例2.2 上述总体按不放回简单随机抽样方式抽取容量为2的样本,则所有可能样本为个,如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2 不放回简单随机抽样所有可能样本3/27/20236抽样调查(二)样本分布与符号从总体抽样单元。假设顺序被抽中的样本单元的号码为(入样号码),则样本为,称为抽样比(Sampling fraction)。中逐个不放回抽取n个
4、作为随机变量样本有什么分布呢?3/27/20237抽样调查1 y1,yn同分布但不相互独立,其共同分布列为 2(yi,yj)的联合分布列均同(y1,y2)3/27/20238抽样调查表2.3符号总体参数样本统计量3/27/20239抽样调查二、抽样方法(一)抽签法 制作N个外形相同的签,将它们充分混合,然后一次抽取n个签,或一次抽取一个但不放回,抽取n次得到n个签。则这n个签上所对应号码表示入样的单元号。例如例如:某中学为了解学生身体素质的基本状况,从全校N1200人中抽取一个简单样本n100人进行检查。3/27/202310抽样调查1 随机数表(二)随机数法如上例,N1200,则在表中随机连
5、续取四列,顺序往下,选出前面100个不同(不放回抽样)的00011200之间的数字。如果不够100个,可随机再取四列,同样操作,直至抽取100个止。3/27/202311抽样调查Simple random sampling3/27/202312抽样调查Table of random numbers3/27/202313抽样调查2 随机数骰子 随机数骰子是由均匀材质制成的正20面体,每个面上刻有一个09的数字,且每个数字只出现在两个面上。要产生一个m位数的随机数(如m4,N1200),则将m(m=4)个颜色不同的骰子盒中,并规定每个颜色代表的位数,盖上盖子,充分摇动盒子后,打开读出各色骰子的数字
6、,即可得一个随机数。重复上述过程,直至产生了n个满足条件的随机数。3/27/202314抽样调查3 利用统计软件直接抽取法 大部分统计软件都有产生随机数的功能,快捷方便。不过产生的是伪随机数,有一定循环周期的。简单介绍一下利用EXCEL产生随机数的方法.3/27/202315抽样调查3/27/202316抽样调查3/27/202317抽样调查3/27/202318抽样调查2.2 简单估计法(SE)一、总体均值的估计(一)简单估计定义.(2.6)(二)简单估计量的性质 引理引理2.1 从大小为N的总体中抽取一个样本容量为n的简单随机样本,则总体中每个特定的单元入样的概率为n/N,两个特定单元入样
7、的概率为n(n1)/N(N-1)。3/27/202319抽样调查 引理引理2.2从大小为N的总体中抽取一个样本容量为n的简单随机样本。若令:则:3/27/202320抽样调查(二)简单估计量的性质 定理2.1上述简单估计是无偏的,即 定理2.2 上述简单估计的方差(均方误差)为:.(2.12/2.18)3/27/202321抽样调查证明(P35证法1对称证法):为0注意样本分布3/27/202322抽样调查推论2.7的无偏估计为.(2.25)证明:只须说明样本方差是总体方差的无偏估计即可。注意3/27/202323抽样调查 例2.3 从某个N100的总体重抽取一个容量n=10的简单随机样本,要
8、估计总体平均水平,并给出置信度为95的置信区间估计。如表2.4序号1 2 3 4 5 6 7 8 9 104 5 2 0 4 6 6 15 0 8表2.4 简单随机样本指标 3/27/202324抽样调查3/27/202325抽样调查(三)有放回简单随机抽样的简单估计量由于故有放回抽样的精度低于不放回抽样的精度。3/27/202326抽样调查说明:1 抽样调查中的估计量与传统数理统计中估计量的区别(见表2.5)表2.5 抽样理论与传统数理统计关于样本均值性质异同比较抽样理论数理统计理论假设样本之间不独立,所以可能样本最多 个,欲估计总体特征为 ,当nN时可以求出样本之间独立,所有可能样本最多为
9、无限多个;欲估计总体特征为总体(一般是随机变量X)期望,一般不能通过样本求出 符号、定义期望方差3/27/202327抽样调查2 总体方差一般也是未知的,故计算估计量方差(估计)值时总是用样本方差直接去估计它,因为该估计无偏,故这样做相对是合理的。3 对于无限总体的简单随机抽样(或有限总体有放回简单抽样)估计中由于N一般很大,即从有限总体抽样得到简单随机样本均值得方差是从无限总体抽样得的独立样本均值的方差的1f 倍,要小些,这意味着对同等样本量,不放回简单随机抽样的精度高于有放回的。由于样本点不会重复,样本量相同时所包含的有效样本点更多,因此信息更多,效果当然好些。1f又被称为有限总体校正系数
10、。3/27/202328抽样调查 4样本容量n越大,估计量方差越小。当样本容量一定时,总体方差越大,估计量方差越大。由于总体方差是固定的,因此在简单随机抽样的条件下,要提高估计量精度就只有增加样本容量了。但增加样本容量也会带来计算量骤增和成本增加,所以是矛盾的一对,需要找到合适的平衡点。3/27/202329抽样调查二、总体总量的估计(一)简单估计量.(2.7)(二)估计量性质 推论2.1 2.4 2.8 .(2.13).(2.19).(2.26)3/27/202330抽样调查例2.4(续例2.3)估计总体总量,并给出置信度为95条件下的估计相对误差。三、总体比例的估计 将总体分为两类,一类具
11、有该特征的单元A个,另一类不具有该特征的单元NA个。调查的目的是估计或A 若令则3/27/202331抽样调查(一)估计量的定义(二)估计量性质 推论2.2 2.5 2.9 对于简单随机抽样,p是P无偏估计。p的方差为 方差的无偏估计 (2.27)(2.20)3/27/202332抽样调查例2.5某超市开张一段时间后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。该超市与附近一个小区的居委会取得联系,在总体中按简单随机抽样抽取了一个大小为n=200人的样本。调查发现对购物表示满意或基本满意的居民有130人,估计对该超市购物环境持肯定态度的居民的比例,并在置信度95%条件下,给
12、出估计的绝对误差和置信区间,假设抽样比可以忽略。3/27/202333抽样调查(2)样本协方差是总体协方差的无偏估计.(2.22,2.23)(2.29)考虑二维总体3/27/202334抽样调查证明:仍采用对称法(P40证法1)(1)注意样本分布注意为03/27/202335抽样调查(1)证法2:(构造性)展开3/27/202336抽样调查(2)注意由(1)3/27/202337抽样调查一、概念与作用一、概念与作用 (一)概念(一)概念 比率(比率(Ratio)与比例()与比例(Proportion)区别)区别 (二)作用(二)作用2.3 比率估计量及其性质一种场合是待估的总体参数R是两个变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 简单 随机 抽样 18230
限制150内