第4章等概率整群抽样和多阶段抽样课件.ppt
《第4章等概率整群抽样和多阶段抽样课件.ppt》由会员分享,可在线阅读,更多相关《第4章等概率整群抽样和多阶段抽样课件.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第4章章 等概率整群抽样和多阶等概率整群抽样和多阶段抽样段抽样n由若干有联系的基本单元所组成的集合称为群群。抽样时抽取群,并对入选群的所有基本单元进行调查,这种方法就是整群抽样整群抽样。n当群规模比较大时,由于群内单元通常具有相似性,对群内单元进行再抽样,这就是两阶段抽样两阶段抽样,其中的群也称为初级抽样单元初级抽样单元,群内再抽样的单元称为二级抽样单二级抽样单元元。4.1.1 定义定义2023/2/53l整整群群抽抽样样(cluster cluster samplingsampling)是是将将总总体体划划分分为为若若干干群群,然然后后以以群群(clustercluster)为为抽抽样样单
2、单元元,从从总总体体中中随随机机抽抽取取一一部部分分群群,对对被被选选群群内内的的所所有有单单元元进进行行调调查查的的一一种种抽抽样样技技术术。例例2023/2/54l欲欲估估计计某某高高校校大大学学生生拥拥有有手手机机数数量量,大大学学共共有有4000040000名学生,名学生,1000010000个宿舍(每个宿舍个宿舍(每个宿舍4 4名学生)。名学生)。l方方案案1 1(简简单单随随机机抽抽样样):采采用用简简单单随随机机抽抽样样方方法法抽抽取取400400个学生;个学生;l方案方案2 2(整群抽(整群抽样样):根据学生宿舍名根据学生宿舍名录录抽取抽取100100个宿个宿舍,并舍,并调查调
3、查被抽宿舍的每一个学生;被抽宿舍的每一个学生;l方方案案3 3(两两阶阶段段抽抽样样):先先随随机机抽抽取取400400个个宿宿舍舍,再再在在每个被抽中的宿舍中随机抽取每个被抽中的宿舍中随机抽取1 1个学生。个学生。4.1.2 整群抽样的特点整群抽样的特点(1)抽样框)抽样框编制得以简化(2)实施调查便利,节省费用节省费用(3)对某些特殊结构的总体却有好的估计效果好的估计效果(4)抽样误差较大(可通过增大样本量的方法弥补抽样精度的损失)。大致可分为两类1.根据行政或地域形成的群体2.调查人员人为确定的分群的原则可用方差分析原理说明:群内差异尽可能大,群间差异尽可能小群内差异尽可能大,群间差异尽
4、可能小群内差异尽可能大,群间差异尽可能小群内差异尽可能大,群间差异尽可能小4.1.3 群的划分群的划分v群的规模大,估计的精度差但费用省;群的规模大,估计的精度差但费用省;v群的规模小,估计的精度可以提高但费用增群的规模小,估计的精度可以提高但费用增大;大;v群规模不宜过大群规模不宜过大v对于规模很大的群,通常需要采用多阶段抽样。对于规模很大的群,通常需要采用多阶段抽样。v有群规模相等与不相等两种情况有群规模相等与不相等两种情况4.1.4 群的规模群的规模4.1.5 符号说明符号说明表表 4.1 4.2 等概率整群抽样等概率整群抽样n4.2.1 群规模相等时的估计群规模相等时的估计群规模相同,
5、均为群规模相同,均为M,则,则 的估计量为:的估计量为:n定理定理 4.4.1 1:是 的无偏估计,即n定理定理 4.24.2:的方差为:n定理定理 4.34.3:的样本估计为:总总体体总值总值的估的估计计量量及其方差及其方差【例4.1】n在在一一次次对对某某中中学学在在校校零零花花钱钱的的调调查查中中,以以宿宿舍舍作作为为群群进进行行整整群群抽抽样样。每每个个宿宿舍舍都都有有M=6名名学学生生。用用简简单单随随机机抽抽样样在在全全部部N=315间间宿宿舍舍中中抽抽取取n=8个个宿宿舍舍。全全部部48个个学学生生上上周周每每人人的的零零花花钱钱 及及相相关关计计算算数数据据如如表表4-2所所示
6、示。试试估估计计该该学学校校学学生生平平均均每每周周的的零零花花钱钱 ,并并给给出出其其95%的置信区间。的置信区间。整群抽样的效率分析整群抽样的效率分析群内相关系数表达式为:上式中的分子为:上式中的分母为:故又可写为:用简单随机抽样方法抽取n个群,每个群内的M个单元全部进入样本,则等群抽样均值估计量的方差可用群内相关系数近似表示n简单随机抽样的方差公式为n由此可计算出等群抽样的设计效应为整群抽样的估计效率,与群内相关系数的关系密切。当时,deffM当时,deff1当为负时,deff1的取值范围是群内方差为群内方差与总体方差相等群间方差为群内相关系数也可由样本统计量估计【例4.2】4.2.2
7、群规模不等时的估计群规模不等时的估计当群规模Mi不等时,有不同的抽取方法和估计方法。(1)等概抽样,无偏估计)等概抽样,无偏估计思路:以群规模Mi为权数,乘以各群均值,得到群观察值总值yi,再将样本中n个群的群总和平均,求得群总和均值,再除以群平均规模估计公式为:若未知,可用样本群平均规模代替总体总值Y的估计为总量估计的另一公式为估计量的方差为它的无偏估计为均值估计的方差为(2)等概抽样,比率估计)等概抽样,比率估计总体均值估计为这里辅助变量不是Xi而是群规模Mi总体总量估计为总体总量估计为估计量的方差分别是与的样本估计分别是若若 未知,可用样本群平均规模未知,可用样本群平均规模 代替代替【例
8、4.3】某县有33个乡,726个村,该年度某种作物总种植面积30525亩,现采用等概抽样随机抽出10个乡,要求估计全县总产量,计算抽样误差。调查资料如下:样本乡编号村庄数Mi作物总产量(乡)yi(万公斤)种植面积(乡)xi(亩)123456789101518261420282119311722.022.830.221.725.331.226.020.533.823.68007801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882合计209257.18940n分别采用几种方法估计(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 抽样 阶段 课件
限制150内