抽样调查-2简单随机抽样.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《抽样调查-2简单随机抽样.pptx》由会员分享,可在线阅读,更多相关《抽样调查-2简单随机抽样.pptx(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Chap 2 Chap 2 简单随机抽样简单随机抽样2.2 简单估计法(SE) 2.1 定义与符号抽样调查 2.5 样本量的确定 2.6 其它相关问题 2.3 比率估计量 2.4 回归估计量4/24/20221抽样调查2.1 定义与符号一、定义与符号 (一)定义上述抽样就称为不放回简单随机抽样 定义定义2.12.1:设有限总体共有N个单元,一次整批抽取 n个单元 使得每个单元被抽中的概率都相等,任何 n个不同单元的组合(样本)都有相同的概率被抽中,这种抽样方法称为简单随机抽样法,所抽到的样本为简单随机样本。 4/24/20222抽样调查 定义定义2.2:(在具体实施过程中,)从总体中逐个等概率
2、抽取单元(每次抽取到尚未入样的任何一个单元的概率都相等),直到抽满 n个为止。如果每次抽中一个单元,然后放回总体,重新抽取。这样一个单元有可能被重复抽中,故又称重复抽样重复抽样。1.nnNN所有可能样本有个,每个样本抽中的概率为4/24/20223抽样调查 定义定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组合构造所有可能的 CNn 个样本,从CNn 个样本随机抽取一个样本,使每个样本被抽中的概率都等于 1/CNn.上述三中定义其实是完全等价的,而定义定义2.2在实际中容易实施 。4/24/20224抽样调查例2.1 设总体有5个单元(1,2,3,4,5),按有放回简单随机抽样
3、的方式抽取容量为2的样本,则所有可能样本为2552个,如表2.1。 表2.1 放回简单随机抽样所有可能样本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,54/24/20225抽样调查例2.2 上述总体按不放回简单随机抽样方式抽取容量为2的样本,则所有可能样本为1025C个,如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2 不放回简单随机抽样所有可能样本4/24/20226抽样调查(二)样本分布与符号从总体,21NNYYY抽样单元。假设顺序被抽中的样本单元的号码为
4、niii,21(入样号码),则样本为),(21niiiYYYy12(,)ny yy,称Nnf 为抽样比(Sampling fraction)。中逐个不放回抽取n个作为随机变量样本有什么分布呢?4/24/20227抽样调查1 y1,yn同分布但不相互独立,其共同分布列为 NYyPi11YYNyENi111)(2211)(1)(YYNyDNi2 ( yi, yj)的联合分布列均同(y1, y2 ),0) 1(1,21jijiNNYyYyPji4/24/20228抽样调查表2.3符号NNiYYYYY211NYYYYNYNNi/ )(1211) 10( ,11orYYNNAPiNiXYXYXYRNiN
5、i1122121)(11NNYYNSNinniyyyy211nyyyyynni/ )(211) 10( ,11oryynnapiaixyxyrnini11212)(11yynsni总体参数样本统计量222YSC4/24/20229抽样调查二、抽样方法(一)抽签法 制作N个外形相同的签,将它们充分混合,然后一次抽取n个签,或一次抽取一个但不放回,抽取n次得到n个签。则这n个签上所对应号码表示入样的单元号。例如例如:某中学为了解学生身体素质的基本状况,从全校N1200人中抽取一个简单样本n100人进行检查。4/24/202210抽样调查1 随机数表(二)随机数法如上例,N1200,则在表中随机连续
6、取四列,顺序往下,选出前面100个不同(不放回抽样)的00011200之间的数字。如果不够100个,可随机再取四列,同样操作,直至抽取100个止。 4/24/202211抽样调查Simple random sampling4/24/202212抽样调查571724208870098113332690229959439094960733883876802892315659098394581789405707437795067344106098711915859745774279175889116071159601796244981700967119006144952956149556783816
7、947228499319430367448312868071965101777298394983358752305662427549938091950582000790684555286776489805668440950862164816117646241643551394057518341218259744656958371041125142917477366391133824807673151487243567038453631545811638629945764885975654171526651678796730996072832063124312389823683108530403
8、875246018819905646747088460133188163744621455123094298319538723917074219786988092722011524321100481250524316181396413697099522535015843168149254052346349168020483152207698241810116101527170463146091507160502292125930795794348813211711209171549881681270050137484992782875180855020351091055309107133643
9、96566072554770214627922705920349089269853061756122176825182394768750612840774138754107091907430568196756348141598504321681782249946375454720185224384614452830953086330804968698087594561107556245878875371626648645498638964835346055750031758290562230237777954187026300Table of random numbers4/24/202213
10、抽样调查2 随机数骰子 随机数骰子是由均匀材质制成的正20面体,每个面上刻有一个09的数字,且每个数字只出现在两个面上。要产生一个m位数的随机数(如m4,N1200),则将m(m=4)个颜色不同的骰子盒中,并规定每个颜色代表的位数,盖上盖子,充分摇动盒子后,打开读出各色骰子的数字,即可得一个随机数。重复上述过程,直至产生了n个满足条件的随机数。4/24/202214抽样调查3 利用统计软件直接抽取法 大部分统计软件都有产生随机数的功能,快捷方便。不过产生的是伪随机数,有一定循环周期的。简单介绍一下利用EXCEL产生随机数的方法. 4/24/202215抽样调查4/24/202216抽样调查4/
11、24/202217抽样调查4/24/202218抽样调查2.2 简单估计法(SE)一、总体均值的估计(一)简单估计定义 .(2.6) Y 11niiyyn(二)简单估计量的性质 引理引理2.1 从大小为N的总体中抽取一个样本容量为n的简单随机样本,则总体中每个特定的单元入样的概率为n/N,两个特定单元入样的概率为n(n1)/N(N-1)。 4/24/202219抽样调查 引理引理2.2从大小为N的总体中抽取一个样本容量为n的简单随机样本。若令: 1iiYao入样否则 1inE afN 21in NnV affNN 13 cov,1,11ijffnna aijN NNN 则:4/24/20222
12、0抽样调查(二)简单估计量的性质 定理2.1上述简单估计是无偏的,即 E yY 定理2.2 上述简单估计的方差(均方误差)为:221( )NnfV ySSnNn.(2.12/2.18) 4/24/202221抽样调查证明(P35证法1对称证法): 211()niEyYn21()()nijijE yYyYn1221(1) ()()n nE yYyYn2( )V yE yY212 )(1niYyEn2211niE yYn21211nE yYn11()V yn11()()(1)NijijnYYYYnN N211 1()NiYYn N211111()()() (1)NNNijinYYYYYYnN N2
13、211NnSSnNnN222111()NnfSSSnNnNn为0注意样本分布4/24/202222抽样调查推论2.7)(yV的无偏估计为21snf.(2.25) 证明:只须说明样本方差是总体方差的无偏估计即可。 )(11122niyyEnsE211() 1niEyYYyn )(2)()(111122nniiYyYyYynYyEn)(1122YynEYyEni注意)()(1YynYyni11221YynEYynEn)()(11yVyVnn)(11212SnNnNYYNnnNi22211SSnNnNSNNnn4/24/202223抽样调查 例2.3 从某个N100的总体重抽取一个容量n=10的简单
14、随机样本,要估计总体平均水平,并给出置信度为95的置信区间估计。如表2.4序号iiy1 2 3 4 5 6 7 8 9 104 5 2 0 4 6 6 15 0 8表2.4 简单随机样本指标 4/24/202224抽样调查4/24/202225抽样调查(三)有放回简单随机抽样的简单估计量11niyyn11( )V yD yn12211NNSSnNn21211)(snsnNNyvN由于1,nfNN故有放回抽样的精度低于不放回抽样的精度。4/24/202226抽样调查 说明:1 抽样调查中的估计量与传统数理统计中估计量的区别(见表2.5)表2.5 抽样理论与传统数理统计关于样本均值性质异同比较nN
15、CY11niyyn11niyyn E yY E y221( )NnfV ySSnNn2( )V yn2()V X抽样理论数理统计理论假设样本之间不独立,所以可能样本最多 个,欲估计总体特征为 ,当nN时可以求出样本之间独立,所有可能样本最多为无限多个;欲估计总体特征为总体(一般是随机变量X)期望,一般不能通过样本求出 符号、定义期望方差4/24/202227抽样调查 2 总体方差一般也是未知的,故计算估计量方差(估计)值时总是用样本方差直接去估计它,因为该估计无偏,故这样做相对是合理的。 3 对于无限总体的简单随机抽样(或有限总体有放回简单抽样)估计中由于N一般很大, 即从有限总体抽样得到简单
16、随机样本均值得方差是从无限总体抽样得的独立样本均值的方差的1f 倍,要小些,这意味着对同等样本量,不放回简单随机抽样的精度高于有放回的。 由于样本点不会重复,样本量相同时所包含的有效样本点更多,因此信息更多,效果当然好些。 1f又被称为有限总体校正系数。2212111)(SnSnSnNNyVN4/24/202228抽样调查 4样本容量n越大,估计量方差越小。当样本容量一定时,总体方差越大,估计量方差越大。由于总体方差是固定的,因此在简单随机抽样的条件下,要提高估计量精度就只有增加样本容量了。但增加样本容量也会带来计算量骤增和成本增加,所以是矛盾的一对,需要找到合适的平衡点。4/24/20222
17、9抽样调查二、总体总量的估计(一)简单估计量niynNyNyY1.(2.7) (二)估计量性质 推论2.1 2.4 2.8YyEYE 222)1 ()()(SnfNyVNYV222)1 ()()(snfNyvNYv.(2.13) .(2.19) .(2.26) 4/24/202230抽样调查例2.4(续例2.3)估计总体总量,并给出置信度为95条件下的估计相对误差 。三、总体比例的估计 将总体分为两类,一类具有该特征的单元A个,另一类不具有该特征的单元NA个 。调查的目的是估计NAP 或A NiiYi, 2 , 101,否则个总体单元具有该特征第AYYNi1PNYY/若令则4/24/20223
18、1抽样调查(一)估计量的定义 11niayypnnNpyNy(二)估计量性质 推论2.2 2.5 2.9 对于简单随机抽样,p是P无偏估计。 p的方差为 PQNNnfNnNnPQpV111)(方差的无偏估计 pqnfpv11)( (2.27) (2.20)4/24/202232抽样调查例2.5某超市开张一段时间后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。该超市与附近一个小区的居委会取得联系,在总体中按简单随机抽样抽取了一个大小为n=200人的样本。调查发现对购物表示满意或基本满意的居民有130人,估计对该超市购物环境持肯定态度的居民的比例,并在置信度95%条件下,给出估
19、计的绝对误差和置信区间,假设抽样比可以忽略。4/24/202233抽样调查1111(,),(,)( , )( ,),(,)NNNnnX YXYx yx yxy设二维总体,样本为,如前记号:11()()1nxyiisxxyyn样本协方差xyxyxyrsss样本相关系数1cov( , )()();XYfx yE xXyYSn定理2.3:(1)(2)样本协方差是总体协方差的无偏估计. (2.22,2.23) (2.29) XYxySsE考虑二维总体4/24/202234抽样调查证明:仍采用对称法(P40证法1)(1)()()nijijExXyY122(1)()()n nE xXyYn11()()(1
20、)NijijnXX YYnN N)(),cov(YyXxEyx )()(1112nnjiYyXxEn21 ()()iiExXyYn111()()E xXyYn注意样本分布11 1()()NiiXX YYn N1XYNSnN11111()()()()(1)NNNijiinXX YYXX YYnN NXYXYSnNnSnNN11XYSnf1注意为04/24/202235抽样调查 (1)证法2: (构造性)V uUVyxYXV xXiiiuxy,u U分别是该变量的样本均值和总体均值。,uyx V u VyYxXV yY 2cov,yYxX 1cov,2y xV uV yV x于是222112uyx
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 简单 随机 抽样
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内