抽样调查-第5章不等概抽样18206.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《抽样调查-第5章不等概抽样18206.pptx》由会员分享,可在线阅读,更多相关《抽样调查-第5章不等概抽样18206.pptx(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、返回5.1 不等概抽样一、概念与特点前面所学的简单随机抽样,总体中的每个单元具前面所学的简单随机抽样,总体中的每个单元具有同样的入样概率,它是等概率抽样。有同样的入样概率,它是等概率抽样。与等概率抽样对应的另一类方法是不等概抽样,与等概率抽样对应的另一类方法是不等概抽样,也就是在抽样前赋予总体每个单元一个入样概率也就是在抽样前赋予总体每个单元一个入样概率.一一般而言般而言,每个单元的入样概率是由该单元在整体中的每个单元的入样概率是由该单元在整体中的地位来确定的地位来确定的.因此每个单元的入样概率可能是不相因此每个单元的入样概率可能是不相同的同的.返回 什么时候使用不等概抽样?实际工作中,如果遇
2、到下面几种情况,则可以实际工作中,如果遇到下面几种情况,则可以考虑使用不等概抽样:考虑使用不等概抽样:1、抽样单元在总体中所占的地位不一致、抽样单元在总体中所占的地位不一致2、调查的总体单元与抽样总体的单元不一致、调查的总体单元与抽样总体的单元不一致3、改善估计量、改善估计量 不等概抽样的优点:提高估计精度提高估计精度,减少抽样误差减少抽样误差。返回二、不等概抽样的种类1 1、放回不等概抽样、放回不等概抽样首先给整体的每一个单元赋予一个确定的首先给整体的每一个单元赋予一个确定的入样概率(通常是不相等的),然后在总体中入样概率(通常是不相等的),然后在总体中对每个单元按入样概率进行抽样,抽取出来
3、的对每个单元按入样概率进行抽样,抽取出来的样本单元记录后又放回总体,再进行下一次的样本单元记录后又放回总体,再进行下一次的抽样,很显然每次抽样都是独立的。抽样,很显然每次抽样都是独立的。返回 放回不等概抽样中,最常用的是按照整体单放回不等概抽样中,最常用的是按照整体单元的规模大小来确定单元在每次抽样时的入样概元的规模大小来确定单元在每次抽样时的入样概率,假设总体中第率,假设总体中第i个单元的规模度量为个单元的规模度量为 ,总,总体的总规模为体的总规模为 每次抽样中,第每次抽样中,第i个单个单元被抽中的概率用元被抽中的概率用 表示,其中表示,其中返回 这种不等概抽样称作放回的与规模大小成比这种不
4、等概抽样称作放回的与规模大小成比例的概率抽样(例的概率抽样(probability proportional to size),简称简称PPS抽样。实际问题中,总体单元大小的度抽样。实际问题中,总体单元大小的度量往往不止一个,比如企业员工数量、产值、销量往往不止一个,比如企业员工数量、产值、销售量、利润等都可以度量企业规模的大小。售量、利润等都可以度量企业规模的大小。PPS抽样的实施主要有两种方法:抽样的实施主要有两种方法:代码法代码法和和拉希里拉希里(Lahiri)法,下面我们用一个实例分别介法,下面我们用一个实例分别介绍这两种方法。绍这两种方法。返回代码数,将代码数累加得到每次抽样都产生一
5、个1,之间的随机数,设为m则代码m所对应的单元被抽中。(如果不是整数,则乘以某个倍数。)(1 1)代码法)代码法 在PPS抽样中,赋予每个单元与相等的返回 10累计累计 10代码代码123456789100.614.51.513.77.815103.661.161451513778150100366011615116630338153163166772773816715115216616730330438138253153263163266766872772873873.8738_【例5.1】设某个总体有N=10个单元,相应的单元大小 及其代码数如下表,我们要在其中产生一个n=3的样本.返回先
6、在先在1,7381,738中产生一个随机数为中产生一个随机数为354,354,再再在在1,7381,738中产生第二个随机数为中产生第二个随机数为553,553,最后最后产生第三个随机产生第三个随机493493。则它们所对应的第。则它们所对应的第5 5,7 7,6 6号单元被抽中。号单元被抽中。返回(2 2)拉希里法)拉希里法令 每次抽样都分别产生一个1,N之间的随机数 i 及1,之间的随机数m如果则第i个单元被抽中;否则,重抽一组(i,m).在例5.1中,在1,10和1,150中分别产生(i,m):返回(3,121),=15 121,舍弃,重抽;(8,50),=36 50,舍弃,重抽;(7,
7、77),=100 77,第7号单元入样;(5,127),78 127,舍弃,重抽;(4,77),137 77,第4号单元入样;(9,60),60 60,第9号单元入样。因此,第因此,第,7,9,7,9号单元被抽中。号单元被抽中。返回2 2、不放回不等概抽样、不放回不等概抽样每次在总体中对每个单元按入样概率进行抽样,每次在总体中对每个单元按入样概率进行抽样,抽取出来的样本单元不放回总体,对总体中剩下的抽取出来的样本单元不放回总体,对总体中剩下的单元进行下一次抽样。不放回不等概抽样的效率比单元进行下一次抽样。不放回不等概抽样的效率比放回时的效率高,但是样本不独立会加大抽样实施、放回时的效率高,但是
8、样本不独立会加大抽样实施、参数估计及精度计算的难度。参数估计及精度计算的难度。返回对于不放回不等概抽样,样本的抽取可以有以下几对于不放回不等概抽样,样本的抽取可以有以下几种方法:种方法:(1 1)逐个抽取法)逐个抽取法。每次从总体未被抽中的单元中。每次从总体未被抽中的单元中以一定的概率取一个样本单元。以一定的概率取一个样本单元。(2 2)重抽法。)重抽法。以一定的概率逐个进行放回抽样,以一定的概率逐个进行放回抽样,如果抽到重复单元,则放弃所有抽到的单元,重新抽取。如果抽到重复单元,则放弃所有抽到的单元,重新抽取。(3 3)全样本抽取法。)全样本抽取法。对总体每个单元分别按一定对总体每个单元分别
9、按一定概率决定其是否入样。这种方法的样本量是随机的,事概率决定其是否入样。这种方法的样本量是随机的,事先不能确定。先不能确定。(4 4)系统抽样法)系统抽样法。将总体单元按某种顺序排列,。将总体单元按某种顺序排列,根据样本量确定抽样间距根据样本量确定抽样间距k,k,在在11,kk中产生一个随机数。中产生一个随机数。返回5.2 放回不等概抽样一、只抽取一个样本单元(n=1)的不等概抽样 为了便于了解不等概抽样的基本思想,我们先看为了便于了解不等概抽样的基本思想,我们先看一个总体已知,只抽取一个样本单元的例子。一个总体已知,只抽取一个样本单元的例子。【例】一个城市有四个超市营业面积从【例】一个城市
10、有四个超市营业面积从100100平方米平方米到到10001000平方米不等(见下表),我们的目标是通过抽平方米不等(见下表),我们的目标是通过抽取一家超市来估计这四个超市上个月的总营销量。通取一家超市来估计这四个超市上个月的总营销量。通常超市面积越大则销售量越大,因此,我们选择的入常超市面积越大则销售量越大,因此,我们选择的入样概率与超市的营业面积成正比。样概率与超市的营业面积成正比。返回超市营业面积(平方米)(万元)A1001/1611B2002/1620C3003/1624D100010/16245总计16001300四个超市的背景数据四个超市的背景数据:第:第i i个超市的包含概率,个超
11、市的包含概率,:第:第i i个超市的销售量个超市的销售量返回 如果超市的营业面积近似正比于超市的销售额,如果超市的营业面积近似正比于超市的销售额,那么超市那么超市A A的销售额就占所有超市销售额的的销售额就占所有超市销售额的1/16,1/16,因因此超市此超市A A的销售额乘以权重的销售额乘以权重1616(包含概率的倒数)(包含概率的倒数)可以近似地估计所有超市的销售额。因此,样本量可以近似地估计所有超市的销售额。因此,样本量为为1 1的不等概抽样的总体总值估计量为:的不等概抽样的总体总值估计量为:式中式中返回样本样本A1/161117615375B2/162016019600C3/16241
12、2829584D10/162453928464四个四个n=1n=1可能的不等概样本及其估计量可能的不等概样本及其估计量返回从上表可以算出:可见不等概抽样的总体总值估计量是无偏的可见不等概抽样的总体总值估计量是无偏的返回 我们用同一个例题将不等概抽样与简单随机抽样我们用同一个例题将不等概抽样与简单随机抽样作一比较,以此认识不等概抽样的意义。作一比较,以此认识不等概抽样的意义。与与n=1n=1的简单随机抽样相比,简单随机抽样的样本的简单随机抽样相比,简单随机抽样的样本所有可能的样本见下表所有可能的样本见下表返回样本样本A1/4114465536B1/4208048400C1/4249641616D
13、1/4245980462400四个可能的简单随机样本的数据及其估计量四个可能的简单随机样本的数据及其估计量返回我们来计算简单随机抽样的估计量方差我们来计算简单随机抽样的估计量方差 前面按不等概抽样的估计量方差为前面按不等概抽样的估计量方差为 14248 14248,是无偏估计,期望为是无偏估计,期望为300300万元,但是其方差万元,但是其方差大于不等概抽样,这是因为不等概抽样利用了辅大于不等概抽样,这是因为不等概抽样利用了辅助信息,即与销售额相关的超市面积。助信息,即与销售额相关的超市面积。返回二、一般有放回不等概抽样 对于放回不等概抽取样本容量为对于放回不等概抽取样本容量为n n的样本,总
14、体总值的样本,总体总值的估计量为样本中所有的估计量为样本中所有 的平均,我们得到汉森的平均,我们得到汉森赫维慈赫维慈(Hansen-Hurwitz)(Hansen-Hurwitz)估计估计 :上式是总体总值的无偏估计上式是总体总值的无偏估计返回如果采用的是如果采用的是PPSPPS抽样,即抽样,即 ,则,则 上面估计量是上面估计量是n n个独立观测的平均,因此每个个独立观测的平均,因此每个单元的总值估计量方差是:单元的总值估计量方差是:返回返回【例5.2】某部门要了解所属某部门要了解所属85008500家生产企业当月完成家生产企业当月完成的利润的利润,该部门手头已有一份上年各企业完成产量的报告该
15、部门手头已有一份上年各企业完成产量的报告,将其汇总得到所属企业上年完成产量为将其汇总得到所属企业上年完成产量为36763676万吨万吨.考虑考虑到时间紧到时间紧,准备采用抽样调查来推算当月完成的利润准备采用抽样调查来推算当月完成的利润.根根据经验据经验,企业的产量和利润相关性比较强企业的产量和利润相关性比较强,且企业的特点且企业的特点是规模和管理水平差异比较大是规模和管理水平差异比较大,通常大企业的管理水平通常大企业的管理水平较高较高,因此采用与上年产量成比例的因此采用与上年产量成比例的PPSPPS抽样抽样,从所属企从所属企业中抽出一个样本量为业中抽出一个样本量为3030的样本的样本,调查结果
16、如下表调查结果如下表.不等概抽样例题不等概抽样例题返回imiyiimiyiimiyi138.2310926106.501900191.510213.7010241115.00864208.008030.7513127.00172128.421367242.85301316.001045229.01384552.0011021412.30220230.7548065.00600153.864600246.00311710.802901615.8023702528.43928482.00430179.00940269.9784298.819921821.00640276.20510样本单元的有关数
17、据红色数字表示被两次抽到,红色数字表示被两次抽到,mimi为企业上年完成的产量,为企业上年完成的产量,yiyi为企业当月完成的产量。为企业当月完成的产量。返回 要根据以上调查结果估计该部门所属企业当月完成的利润,并给出95%置信度下的相对误差.如果要求在相同条件下相对误差达到20%,所需的样本量应该是多少?解:由上述条件知由上述条件知估计当月完成的利润为:返回方差及标准差的估计在置信度为在置信度为95%95%时时,对应的对应的t=1.96,t=1.96,的相对误差的相对误差返回 因此,在置信度仍为因此,在置信度仍为95%95%、相对误差时、相对误差时 ,所需样本量为:所需样本量为:返回三、有放
18、回不等概整群抽样 在群规模不等的整群抽样中,如果群的规模在群规模不等的整群抽样中,如果群的规模差异较大,各个群对总体的影响会产生很大差别。差异较大,各个群对总体的影响会产生很大差别。这时可以采用不等概方式抽取群。其好处是把群这时可以采用不等概方式抽取群。其好处是把群的规模作为抽取样本的辅助信息,提高了估计的的规模作为抽取样本的辅助信息,提高了估计的精度,而且方差估计有比较简单的形式。下面主精度,而且方差估计有比较简单的形式。下面主要讨论以要讨论以PPS抽样抽取群的情况。抽样抽取群的情况。返回 每次按每次按 的概率抽取第的概率抽取第i i个群,由于群内的单元全部参与调查,个群,由于群内的单元全部
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 不等 抽样 18206
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内