第四章整群抽样课件.ppt
《第四章整群抽样课件.ppt》由会员分享,可在线阅读,更多相关《第四章整群抽样课件.ppt(93页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 整群抽样整群抽样4.1 引言引言4.2 群规模相等时的估计群规模相等时的估计4.3 总体比例的估计总体比例的估计1/6/20231/6/20231 1第一节第一节 引言引言一一.整群抽样的定义与特点整群抽样的定义与特点(一一)定义定义 整群抽样(整群抽样(cluster sampling)或集团或集团抽样抽样,是将总体划分为若干群,然后以群为是将总体划分为若干群,然后以群为抽样单元,从总体中随机抽取一部分群,抽样单元,从总体中随机抽取一部分群,对中选群中的所有基本单元进行调查的一对中选群中的所有基本单元进行调查的一种抽样技术。种抽样技术。1/6/20231/6/20232 2【例
2、例1 1】对某校的学生对某校的学生思想或身体情况思想或身体情况进行调查进行调查:某校学生某校学生 学生宿舍学生宿舍 宿舍学生宿舍学生 估计某居民区现有的电话拥有率估计某居民区现有的电话拥有率 全体居民全体居民 若干幢楼若干幢楼 居民居民【例2】某地小学生的视力状况进行调查【例3】某地小学生某所小学小学生1/6/20231/6/20233 3 整群抽样是由一阶抽样向多阶段抽样过渡的桥整群抽样是由一阶抽样向多阶段抽样过渡的桥整群抽样是由一阶抽样向多阶段抽样过渡的桥整群抽样是由一阶抽样向多阶段抽样过渡的桥梁。此章介绍的是单阶段整群抽样。梁。此章介绍的是单阶段整群抽样。梁。此章介绍的是单阶段整群抽样。
3、梁。此章介绍的是单阶段整群抽样。注注注注:多阶段抽样与多阶段整群抽样的不同。多阶段抽样与多阶段整群抽样的不同。多阶段抽样与多阶段整群抽样的不同。多阶段抽样与多阶段整群抽样的不同。(二二二二)特点特点特点特点 1.1.抽样框编制得以简化。抽样框编制得以简化。抽样框编制得以简化。抽样框编制得以简化。在大规模抽样调查中,常常没有或很难编在大规模抽样调查中,常常没有或很难编在大规模抽样调查中,常常没有或很难编在大规模抽样调查中,常常没有或很难编制出包括总体所有次级单元在内的抽样框,而制出包括总体所有次级单元在内的抽样框,而制出包括总体所有次级单元在内的抽样框,而制出包括总体所有次级单元在内的抽样框,而
4、整群抽样则不需要编制庞大的抽样框。整群抽样则不需要编制庞大的抽样框。整群抽样则不需要编制庞大的抽样框。整群抽样则不需要编制庞大的抽样框。因此因此因此因此,在缺少基本单元名单在缺少基本单元名单在缺少基本单元名单在缺少基本单元名单,但群有现成的但群有现成的但群有现成的但群有现成的名单或明显的空间界限时使用此方法很方便。名单或明显的空间界限时使用此方法很方便。名单或明显的空间界限时使用此方法很方便。名单或明显的空间界限时使用此方法很方便。1/6/20231/6/20234 4【例例例例】某市有某市有某市有某市有100100100100所小学共所小学共所小学共所小学共50,00050,00050,00
5、050,000名学生名学生名学生名学生,要从中抽要从中抽要从中抽要从中抽2000200020002000名学名学名学名学生显然是困难的生显然是困难的生显然是困难的生显然是困难的,而若以小学为单位抽取若干小学而若以小学为单位抽取若干小学而若以小学为单位抽取若干小学而若以小学为单位抽取若干小学,再对抽再对抽再对抽再对抽中的学校的全体学生进行调查就简化了中的学校的全体学生进行调查就简化了中的学校的全体学生进行调查就简化了中的学校的全体学生进行调查就简化了.【例例例例】调查农村居民住户,不必列出农村所有居民住户的抽调查农村居民住户,不必列出农村所有居民住户的抽调查农村居民住户,不必列出农村所有居民住户
6、的抽调查农村居民住户,不必列出农村所有居民住户的抽样框,可以利用现成的行政区域,如县、乡、村,将农村样框,可以利用现成的行政区域,如县、乡、村,将农村样框,可以利用现成的行政区域,如县、乡、村,将农村样框,可以利用现成的行政区域,如县、乡、村,将农村划分为若干群,这给抽样设计方案带来很大方便。划分为若干群,这给抽样设计方案带来很大方便。划分为若干群,这给抽样设计方案带来很大方便。划分为若干群,这给抽样设计方案带来很大方便。即使具备总体基本单元的名单即使具备总体基本单元的名单即使具备总体基本单元的名单即使具备总体基本单元的名单,能直接抽取能直接抽取能直接抽取能直接抽取,但总体基本单元在空间上的分
7、布面很广但总体基本单元在空间上的分布面很广但总体基本单元在空间上的分布面很广但总体基本单元在空间上的分布面很广,那么选定那么选定那么选定那么选定调查单位后的调查工作却可能相当大。如果是实调查单位后的调查工作却可能相当大。如果是实调查单位后的调查工作却可能相当大。如果是实调查单位后的调查工作却可能相当大。如果是实地观测调查费用则很高地观测调查费用则很高地观测调查费用则很高地观测调查费用则很高,并需要较长的时间。并需要较长的时间。并需要较长的时间。并需要较长的时间。2.2.实施调查便利,节省费用实施调查便利,节省费用实施调查便利,节省费用实施调查便利,节省费用。1/6/20231/6/20235
8、5 对于整群抽样对于整群抽样对于整群抽样对于整群抽样,由于样本单元的分布相对较集中,由于样本单元的分布相对较集中,由于样本单元的分布相对较集中,由于样本单元的分布相对较集中,在样本单元数相同的条件下,整群抽样与简单随在样本单元数相同的条件下,整群抽样与简单随在样本单元数相同的条件下,整群抽样与简单随在样本单元数相同的条件下,整群抽样与简单随机抽样相比,虽然样本的代表性较差,但调查组机抽样相比,虽然样本的代表性较差,但调查组机抽样相比,虽然样本的代表性较差,但调查组机抽样相比,虽然样本的代表性较差,但调查组织实施过程更加便利,同时还可以大大地节省调织实施过程更加便利,同时还可以大大地节省调织实施
9、过程更加便利,同时还可以大大地节省调织实施过程更加便利,同时还可以大大地节省调查费用。因此,实际工作中,在权衡费用和精度查费用。因此,实际工作中,在权衡费用和精度查费用。因此,实际工作中,在权衡费用和精度查费用。因此,实际工作中,在权衡费用和精度之后,有时宁可适当增加一些样本单元数,也采之后,有时宁可适当增加一些样本单元数,也采之后,有时宁可适当增加一些样本单元数,也采之后,有时宁可适当增加一些样本单元数,也采用整群抽样方法。用整群抽样方法。用整群抽样方法。用整群抽样方法。1/6/20231/6/20236 6 例如,在进行农村居民户收入情况调查时,在一例如,在进行农村居民户收入情况调查时,在
10、一例如,在进行农村居民户收入情况调查时,在一例如,在进行农村居民户收入情况调查时,在一个县抽千分之五的村庄,对其所有居民户进行调个县抽千分之五的村庄,对其所有居民户进行调个县抽千分之五的村庄,对其所有居民户进行调个县抽千分之五的村庄,对其所有居民户进行调查,明显地比从全县直接抽千分之五的农户进行查,明显地比从全县直接抽千分之五的农户进行查,明显地比从全县直接抽千分之五的农户进行查,明显地比从全县直接抽千分之五的农户进行调查,更便于组织,节省人力、旅途往返时间及调查,更便于组织,节省人力、旅途往返时间及调查,更便于组织,节省人力、旅途往返时间及调查,更便于组织,节省人力、旅途往返时间及费用。费用
11、。费用。费用。1/6/20231/6/20237 7整群抽样的随机性整群抽样的随机性体现在群与群间不体现在群与群间不重叠,也无遗漏,总体任何一个基本单元重叠,也无遗漏,总体任何一个基本单元都必须且只能归于某一群都必须且只能归于某一群,群的抽选按概率群的抽选按概率确定。确定。如果把每一个群看作一个单位,则整群如果把每一个群看作一个单位,则整群抽样可以被理解为是一种抽样可以被理解为是一种特殊的简单随机特殊的简单随机抽样抽样。理解这一点对给出整群抽样的估计。理解这一点对给出整群抽样的估计量的方差有帮助量的方差有帮助.整群抽样也整群抽样也是多阶段抽样的前提和基是多阶段抽样的前提和基础。础。1/6/20
12、231/6/20238 8整群抽样有特殊的用途。整群抽样有特殊的用途。整群抽样有特殊的用途。整群抽样有特殊的用途。有些现象的研究,如果直接调查作为基本单元的个体,有些现象的研究,如果直接调查作为基本单元的个体,有些现象的研究,如果直接调查作为基本单元的个体,有些现象的研究,如果直接调查作为基本单元的个体,很难说明问题,必须以一定范围所包括的基本单元为群体,很难说明问题,必须以一定范围所包括的基本单元为群体,很难说明问题,必须以一定范围所包括的基本单元为群体,很难说明问题,必须以一定范围所包括的基本单元为群体,进行整群抽样,才能满足调查的目的。进行整群抽样,才能满足调查的目的。进行整群抽样,才能
13、满足调查的目的。进行整群抽样,才能满足调查的目的。例例例例1:1:人口普查后的复查、要想估计出普查的差错率,只有人口普查后的复查、要想估计出普查的差错率,只有人口普查后的复查、要想估计出普查的差错率,只有人口普查后的复查、要想估计出普查的差错率,只有通过对一定地理区域通过对一定地理区域通过对一定地理区域通过对一定地理区域(如省如省如省如省,市市市市,县县县县,街道等街道等街道等街道等)内的人口群体内的人口群体内的人口群体内的人口群体作全面调查才行。类似地诸如人口出生率、流动率等调查作全面调查才行。类似地诸如人口出生率、流动率等调查作全面调查才行。类似地诸如人口出生率、流动率等调查作全面调查才行
14、。类似地诸如人口出生率、流动率等调查都需要采用整群抽样。都需要采用整群抽样。都需要采用整群抽样。都需要采用整群抽样。例例例例2:2:对某地人口性别比例的调查对某地人口性别比例的调查对某地人口性别比例的调查对某地人口性别比例的调查,以家庭作为群比直接抽以家庭作为群比直接抽以家庭作为群比直接抽以家庭作为群比直接抽取个人进行估计精度要高取个人进行估计精度要高取个人进行估计精度要高取个人进行估计精度要高,因为家庭的结构基本相似。因为家庭的结构基本相似。因为家庭的结构基本相似。因为家庭的结构基本相似。整群抽样要求分群后各群所含次级单元数目应该确知,整群抽样要求分群后各群所含次级单元数目应该确知,整群抽样
15、要求分群后各群所含次级单元数目应该确知,整群抽样要求分群后各群所含次级单元数目应该确知,否则会给抽样推断带来不便。否则会给抽样推断带来不便。否则会给抽样推断带来不便。否则会给抽样推断带来不便。1/6/20231/6/20239 9缺点缺点:整群抽样由于调查单位只能集中在若干群上,而整群抽样由于调查单位只能集中在若干群上,而整群抽样由于调查单位只能集中在若干群上,而整群抽样由于调查单位只能集中在若干群上,而不能均匀分布在总体的各个部分,因此,它的精不能均匀分布在总体的各个部分,因此,它的精不能均匀分布在总体的各个部分,因此,它的精不能均匀分布在总体的各个部分,因此,它的精度比起简单随机抽样来要低
16、一些。度比起简单随机抽样来要低一些。度比起简单随机抽样来要低一些。度比起简单随机抽样来要低一些。例如,在一个有例如,在一个有例如,在一个有例如,在一个有500500个村庄、个村庄、个村庄、个村庄、100000100000个农户的县,个农户的县,个农户的县,个农户的县,抽取抽取抽取抽取1 1的农户就是的农户就是的农户就是的农户就是10001000户,而抽户,而抽户,而抽户,而抽1 1的村庄则只的村庄则只的村庄则只的村庄则只有有有有5 5个村庄,也许抽到的个村庄,也许抽到的个村庄,也许抽到的个村庄,也许抽到的5 5个村庄农户多于个村庄农户多于个村庄农户多于个村庄农户多于10001000,但由于样本
17、单位只集中在但由于样本单位只集中在但由于样本单位只集中在但由于样本单位只集中在5 5个村庄,显然不如在全个村庄,显然不如在全个村庄,显然不如在全个村庄,显然不如在全县范围内简单随机抽取县范围内简单随机抽取县范围内简单随机抽取县范围内简单随机抽取10001000户分布均匀,代表性户分布均匀,代表性户分布均匀,代表性户分布均匀,代表性一般要差一些,抽样误差较大。一般要差一些,抽样误差较大。一般要差一些,抽样误差较大。一般要差一些,抽样误差较大。1/6/20231/6/20231010当然,由于整群抽样省时省力,每个单元当然,由于整群抽样省时省力,每个单元的平均调查费用较少,我们可以通过多抽的平均调
18、查费用较少,我们可以通过多抽几个群,适当增大样本量的方法弥补估计几个群,适当增大样本量的方法弥补估计精度的损失。精度的损失。1/6/20231/6/20231111 二二.群的划分群的划分 1.根据行政或地域形成的群体;如:村庄、城镇、一片森林等 2.调查人员人为确定的;对可控制规模的群,群规模不宜过大对可控制规模的群,群规模不宜过大1/6/20231/6/20231212分群的原则分群的原则:划分群时应使划分群时应使群内方差尽可能大群内方差尽可能大,群间方差群间方差尽可能小尽可能小。(注意:这一点与分层抽样中。(注意:这一点与分层抽样中总体内层的划分有着极大的差别)总体内层的划分有着极大的差
19、别)这意味着每个群均具有足够的代表性。如这意味着每个群均具有足够的代表性。如果划分的群相互之间颇多相似之处,那么果划分的群相互之间颇多相似之处,那么少量群的抽取足以提供良好的精度。少量群的抽取足以提供良好的精度。1/6/20231/6/20231313分析分析分析分析:整群抽样对于群而言是非全面调查整群抽样对于群而言是非全面调查整群抽样对于群而言是非全面调查整群抽样对于群而言是非全面调查,对于被抽中群对于被抽中群对于被抽中群对于被抽中群内基本单元而言则是全面调查内基本单元而言则是全面调查内基本单元而言则是全面调查内基本单元而言则是全面调查,是是是是“先部分先部分先部分先部分,后全体后全体后全体
20、后全体”的抽样组织形式的抽样组织形式的抽样组织形式的抽样组织形式,与分层抽样正好相反。根据方与分层抽样正好相反。根据方与分层抽样正好相反。根据方与分层抽样正好相反。根据方差分析原理,当总体划分为群后差分析原理,当总体划分为群后差分析原理,当总体划分为群后差分析原理,当总体划分为群后,总体方差可以分总体方差可以分总体方差可以分总体方差可以分解为群间方差和群内方差两部分。这两部分是此解为群间方差和群内方差两部分。这两部分是此解为群间方差和群内方差两部分。这两部分是此解为群间方差和群内方差两部分。这两部分是此消彼长的关系。由于整群抽样是对入选群中的所消彼长的关系。由于整群抽样是对入选群中的所消彼长的
21、关系。由于整群抽样是对入选群中的所消彼长的关系。由于整群抽样是对入选群中的所有单元都进行调查有单元都进行调查有单元都进行调查有单元都进行调查,因此因此因此因此影响整群抽样误差的主要影响整群抽样误差的主要影响整群抽样误差的主要影响整群抽样误差的主要是群间方差是群间方差是群间方差是群间方差。为了提高整群抽样估计的精度为了提高整群抽样估计的精度为了提高整群抽样估计的精度为了提高整群抽样估计的精度,划分划分划分划分群时应使群内方差尽可能大群时应使群内方差尽可能大群时应使群内方差尽可能大群时应使群内方差尽可能大,群间方差尽可能小。群间方差尽可能小。群间方差尽可能小。群间方差尽可能小。1/6/20231/
22、6/20231414群间相似 群间差异较大1/6/20231/6/20231515 三三.群的规模群的规模 即组成群的单元的数量。即组成群的单元的数量。整群抽样中,如何有效地对群的大小进整群抽样中,如何有效地对群的大小进行计量,直接关系到抽样估计效率的高低。行计量,直接关系到抽样估计效率的高低。研究表明,对群的大小的最优计量尺度是各研究表明,对群的大小的最优计量尺度是各群在所研究标志上的标志总量大小。但在实群在所研究标志上的标志总量大小。但在实际工作中,它是未知的。因此通常选择与所际工作中,它是未知的。因此通常选择与所研究标志高度线性相关的另一辅助标志作为研究标志高度线性相关的另一辅助标志作为
23、计量尺度。计量尺度。1/6/20231/6/20231616注注:整群抽样与分层抽样的的比较整群抽样与分层抽样的的比较二者在分组(层或群)的条件、调查的方二者在分组(层或群)的条件、调查的方式、分组(层或群)的目的、分组(层或式、分组(层或群)的目的、分组(层或群)的原则、总体方差的分解等方面都存群)的原则、总体方差的分解等方面都存在着较为明显的差别。在着较为明显的差别。1/6/20231/6/20231717 群的规模大群的规模大,估计的精度差但费用省估计的精度差但费用省;群群的规模小的规模小,估计的精度高但费用增大。估计的精度高但费用增大。通常我们面临的总体会有自然的初级单元,通常我们面临
24、的总体会有自然的初级单元,通常我们面临的总体会有自然的初级单元,通常我们面临的总体会有自然的初级单元,例如各所例如各所例如各所例如各所中学中学中学中学它们互相之间它们互相之间它们互相之间它们互相之间关于学生的体质关于学生的体质关于学生的体质关于学生的体质很很很很相似,但在一个学校里每个相似,但在一个学校里每个相似,但在一个学校里每个相似,但在一个学校里每个学生学生学生学生之间有一定的之间有一定的之间有一定的之间有一定的差异。差异。差异。差异。倘若需要我们自行划分群,一般还要考虑倘若需要我们自行划分群,一般还要考虑倘若需要我们自行划分群,一般还要考虑倘若需要我们自行划分群,一般还要考虑到组织管理
25、上的方便、精度上的要求以及费用到组织管理上的方便、精度上的要求以及费用到组织管理上的方便、精度上的要求以及费用到组织管理上的方便、精度上的要求以及费用的多少等因素。的多少等因素。的多少等因素。的多少等因素。1/6/20231/6/20231818当各群所含次级单元数相等时,就称群的当各群所含次级单元数相等时,就称群的大小相等;当各群所含次级单元数不相等大小相等;当各群所含次级单元数不相等时,就称群的大小不相等。时,就称群的大小不相等。当群的大小接近时,常采用简单随机抽样当群的大小接近时,常采用简单随机抽样抽取群;当群的大小相差比较大时,为提抽取群;当群的大小相差比较大时,为提高效率则更多地采用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 章整群 抽样 课件
限制150内