第四章(整群抽样).pptx
《第四章(整群抽样).pptx》由会员分享,可在线阅读,更多相关《第四章(整群抽样).pptx(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1整群抽样一、整群抽样的基本概念二、群规模相等条件下的估计三、群规模不相等条件下的估计第1页/共49页2一、整群抽样的基本概念问题的提出整群抽样的定义整群抽样的特点群的划分群规模简介第2页/共49页3一个新建的居民区由近百幢居民楼组成,其中住户总数达数千户。欲用抽样调查方法估计该居民区现有的电话拥有率。a.一种是用简单随机抽样,抽取一定样本量的住户住户,譬如说共抽取n=250户进行调查,然后用简单估计方法对全居民区的电话拥有率进行估计。b.另一种方法是按一定方法抽取一定数量的居民楼居民楼,譬如说15幢或20幢楼,然后对这些楼中的每个住户都进行调查,根据调查结果来估计整个居民区的电话拥有率。实际
2、问题的提出:第3页/共49页4这两种方法的根本差别是:抽样单元不同。前者以住户住户为抽样单元,后者则以居民楼居民楼为抽样单元。后一种抽样方法称为整群抽样。第4页/共49页5Def.1 一般地说,如果总体中所有较小的基本单元可以以某种形式组成数量较少但规模较大的单元;或反过来说,每个“大”单元都由若干“小”单元组成,称这些 “大”单元为初级(抽样)单元(primary sampling unit),“小”单元为次级(抽样)单元(secondary sampling unit).Def.2在总体中,按一定方式抽取n个初级单元,调查每个被抽中的初级单元中所包含的全部次级单元,这种抽样方法称为整群抽样
3、(clustersampling),也称集团抽样。第5页/共49页6定义:整群抽样是将总体划分为若干群,然后以群为抽样整群抽样是将总体划分为若干群,然后以群为抽样单元,从样本中随机抽取一部分群,对选中的群的所有单元,从样本中随机抽取一部分群,对选中的群的所有基本单元进行调查的一种抽样技术。基本单元进行调查的一种抽样技术。这里的群(cluster)就是指初级单元,整群抽样就是指将总体中的小单元整群整群地进行抽群。在前面的例子中,居民楼就是群(初级单元),而住户则是次级单元,对居民楼的抽样就是一种对住户的整群抽样。整群抽样的定义第6页/共49页7整群抽样的特点1)抽样框的编制简单2)实施便利,节省
4、费用3)抽样误差相对比较大些发挥整群抽样的优势,因为其省时省力,每个单元的平均调查费用比较少,故可通过增大样本量的方法弥补精度的损失。第7页/共49页8划分群的标准总体方差=群间方差+群内方差群内方差群间方差 整群抽样是对被抽中的群的群内的每个单元进行抽样,因此群内方差的影响很小,主要的误差是由群间方差影响的。分群的标准:使同一群内各单元之间的差异大一些即群内方差大些,群与群的差异尽可能的小些,即群间方差小些。第8页/共49页9群的规模u 群的规模指组成群的单元的数量。u 群的规模比较灵活,可大可小,规模大些,估计的精度差些,但是费用省。规模小的,估计的精度可以提高但是费用大。费用与精度根据实
5、际需要而定。第9页/共49页10群规模相等的整群抽样群规模相等的整群抽样一、群规模相等简介 二、符号说明三、总体均值的估计及性质四、估计量方差的估计五、设计效应第10页/共49页11 总体中的N个初级单元即群的大小(群内次级单元数)都相等的情形。也就是,若总体有N个群时,每个群中所包含的单元数为M相等时,则称群规模相等,在实际问题中,只要群的规模接近时,也称为群规模相等。这时,对群的抽取一般采用简单随机抽样(无放回)。一、群规模相等简介第11页/共49页12二、符号说明第12页/共49页13总 体样 本第13页/共49页14三、总体均值的估计及性质总体平均值的估计为:性质 1)的无偏估计建立如
6、下盒子模型证明:第14页/共49页15在这个新的盒子中有N个小盒子,每个小盒子中含元素(Yij,j=1,2,M),它们的平均数是,而全体的平均数恰好构成盒子的平均数。第15页/共49页16我们的模型是从这N个小盒子中随机无放回地抽取n个,这n个小盒子相应的平均数为而这n个的平均数恰好构成样本平均数,总体均值,样本均值,故样本均值是总体均值的无偏估计。(为什么?)第16页/共49页17四、估计量方差的估计第17页/共49页18根据,的一个无偏估计是:在实际问题中,具有某种特性的次级单元在总体中所占的比例P的估计常用整群抽样,不仅方便而且效率高,在各群大小相等的情况下,利用前面对的讨论,推导出对P
7、的估计量及其方差。第18页/共49页19五、设计效应我们已经研究了简单随机抽样和较复杂的分层抽样、不等概率抽样、整群抽样,抽样方法的不同会引起估计量精度的不同。之所以采用比较复杂的抽样手段,目的无非是提高估计的效果。因此,看一个抽样方案的效果究竟如何,一个比较好的办法是将它与简单随机抽样在相同的样本容量之下对精度作比较这就是基什(Kish)在1965年提出的设计效应(design effect,简记为deff):Deff =(Deff =(所考虑抽样设计估计量的方差所考虑抽样设计估计量的方差)/)/(相同样(相同样 本量下简单随机抽样估计量的方差)本量下简单随机抽样估计量的方差)第19页/共4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 抽样
限制150内