第四章分层抽样 (2)优秀PPT.ppt
《第四章分层抽样 (2)优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章分层抽样 (2)优秀PPT.ppt(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章分层抽样第四章分层抽样(2)第一页,本课件共有83页本章要点本章要点 本章主要是对分层抽样理论包括抽样方式、估计量本章主要是对分层抽样理论包括抽样方式、估计量及其性质、样本量的确定及分配、分层抽样设计效果等及其性质、样本量的确定及分配、分层抽样设计效果等进行系统全面地介绍。具体要求:进行系统全面地介绍。具体要求:正确理解层、分层抽样以及分层随机抽样的正确理解层、分层抽样以及分层随机抽样的涵义,分层抽样的特点及作用;涵义,分层抽样的特点及作用;掌握分层抽样的参数估计量及其性质;掌握分层抽样的参数估计量及其性质;掌握分层抽样样本量的确定方法;掌握分层抽样样本量的确定方法;了解分层抽样的设计效
2、果;了解分层抽样的设计效果;了解分层抽样其他有关理论问题,包括层权偏差、了解分层抽样其他有关理论问题,包括层权偏差、最优分配偏差、事后分层等。最优分配偏差、事后分层等。第二页,本课件共有83页第一节第一节 抽样方式抽样方式 第二节第二节 简单估计量及其性质简单估计量及其性质第三节第三节 样本量的分配样本量的分配第四节第四节 样本量的确定样本量的确定第五节第五节 分层抽样设计效果分析分层抽样设计效果分析第六节第六节 进一步讨论的问题进一步讨论的问题 第三页,本课件共有83页一、分层抽样与分层随机抽样一、分层抽样与分层随机抽样 在抽样之前,先将总体在抽样之前,先将总体N N个单元划分成个单元划分成
3、L L个互不重复的子总体,每个个互不重复的子总体,每个子总体称为层,它们的大小分别为子总体称为层,它们的大小分别为 ,这,这L L个层构成整个总体个层构成整个总体()。然后,在每个层中分别独立地进行抽样,这种抽样就)。然后,在每个层中分别独立地进行抽样,这种抽样就是分层抽样,所得到的样本称为分层样本。如果每层都是简单随机抽样,是分层抽样,所得到的样本称为分层样本。如果每层都是简单随机抽样,则称为分层随机抽样,所得到的样本称为分层随机样本。则称为分层随机抽样,所得到的样本称为分层随机样本。第一节第一节 抽样方式抽样方式第四页,本课件共有83页二、分层抽样的特点及作用二、分层抽样的特点及作用(一)
4、分一)分层层抽抽样样可以提高参数估可以提高参数估计计的精度。的精度。(二二)分分层层抽抽样样不不仅仅能能对对总总体体参参数数进进行行估估计计,而而且且能能对对各各层层(子子总总体)参数体)参数进进行估行估计计。(三三)便便于于依依托托行行政政管管理理机机构构进进行行组组织织和和实实施施,同同时时还还可可以以根根据各据各层层的不同特点采用不同的抽的不同特点采用不同的抽样样方式。方式。(四)分(四)分层层抽抽样样样样本在本在总总体中分布更加均匀。体中分布更加均匀。第一节第一节 抽样方式抽样方式第五页,本课件共有83页三、层的划分原则三、层的划分原则 (一一)层层内内单单元元具具有有相相同同性性质质
5、,通通常常按按调调查查对对象象的的不不同同类类型型进进行划分。这时,分层抽样能够对每一类的目标量进行估计。行划分。这时,分层抽样能够对每一类的目标量进行估计。(二二)尽尽可可能能使使层层内内单单元元的的标标志志值值相相近近,层层间间单单元元的的差差异异尽尽可可能能大大,从而达到提高抽样估计精度的目的。从而达到提高抽样估计精度的目的。(三三)既既按按类类型型又又按按层层内内单单元元标标志志值值相相近近的的原原则则进进行行多多重重分分层层,同时达到实现估计类值以及提高估计精度的目的。同时达到实现估计类值以及提高估计精度的目的。(四四)为为了了抽抽样样组组织织实实施施的的方方便便,通通常常按按行行政
6、政管管理理机机构构设设置置进进行分层。行分层。第一节第一节 抽样方式抽样方式第六页,本课件共有83页四、符号说明四、符号说明 设设总总体体分分为为L L层层,下下标标h h表表示示层层号号(h=1(h=1,2 2,L)L)。则则关关于于第第h h层的记号如下:层的记号如下:第第h h层总体单元数:层总体单元数:(通常已知),且(通常已知),且第第h h层样本单元数:层样本单元数:,且,且第第h h层总体和样本第层总体和样本第i i个单元标志值个单元标志值(观察值观察值):第一节第一节 抽样方式抽样方式第七页,本课件共有83页第一节第一节 抽样方式抽样方式层权层权:第第h h层层抽抽样样比:比:
7、第第h h层总层总体均体均值值:第第h h层样层样本均本均值值 第第h h层总层总体体总值总值:第八页,本课件共有83页第一节第一节 抽样方式抽样方式第第h h层样层样本本总值总值:第第h h层总层总体方差体方差 第第h h层样层样本方差:本方差:第九页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质 一、总体均值的估计一、总体均值的估计(一一)简单估计量的定义简单估计量的定义 在分在分层层抽抽样样中,中,对总对总体均体均值值 的估的估计计是通是通过对过对各各层层的的 的估的估计计,按按层权层权 加加权权平均得到的。公式平均得到的。公式为为:如果得到的是分如果得到的是分层层
8、随机随机样样本,本,则则总总体均体均值值 的的简单简单估估计为计为:第十页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质(二二)估计量的性质估计量的性质性性质质l l 对对于一般的分于一般的分层层抽抽样样,如果,如果 是是 的无偏估的无偏估计计(h=1,2,(h=1,2,,L)L),则则 是是 的无偏估的无偏估计计。的方差的方差为为:值值得得强强调调的是,在分的是,在分层层抽抽样样中只要中只要对对各各层层估估计计是无偏的,是无偏的,则对总则对总体体的估的估计计也是无偏的。因此,各也是无偏的。因此,各层层可以采用不同的抽可以采用不同的抽样样方法,只要相方法,只要相应应的估的
9、估计计量是无偏的,量是无偏的,则对总则对总体的推算也是无偏的。体的推算也是无偏的。第十一页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质性性质质2 2 对对于分于分层层随机抽随机抽样样,是是 的无偏估的无偏估计计,的方差的方差为为:性性质质3 3 对对于分于分层层随机抽随机抽样样,的一个无偏估的一个无偏估计为计为:第十二页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质二、总体总量的估计二、总体总量的估计(一一)简单估计量的定义简单估计量的定义总总体体总总量量Y Y的估的估计为计为:如果得到的是分如果得到的是分层层随机随机样样本,本,则总则总体体总总量
10、量Y Y的的简单简单估估计为计为:第十三页,本课件共有83页第二节第二节 简单简单估估计计量及其性量及其性质质(二)估(二)估计计量的性量的性质质 性性质质4 4 对对于一般的分于一般的分层层抽抽样样,如果,如果 是是 的无偏估的无偏估计计,则则 是是Y Y的无偏估的无偏估计计。的方差的方差为为:第十四页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质性性质质 5 5 对对于分于分层层随机抽随机抽样样,的方差的方差为为:性性质质 6 6 对对于分于分层层随机抽随机抽样样,的一个无偏估的一个无偏估计为计为:第十五页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及
11、其性质 【例例4.14.1】为为调调查查某某地地区区住住户户的的平平均均家家庭庭成成员员数数,将将该该地地区区分分成成城城市市和和乡乡村村2 2层层,每每层层按按简简单单随随机机抽抽样样抽抽取取1010户户,调调查查所所获获得得的的数数据据如如表表4-14-1。请请估估计计该该地地区区住住户户的的平平均均家家庭庭成成员员数数及及其其95%95%的的置置信信区区间间。95%95%的的置置信信区区间间为为 ,其其中中 。经经计计算算可可得得:平平均均家家庭庭成成员员数数的的95%95%的的置置信信区区间间为为:(3.24,4.243.24,4.24)第十六页,本课件共有83页第二节第二节 简单估计
12、量及其性质简单估计量及其性质第十七页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质三、总体比例的估计三、总体比例的估计(一)(一)简单简单估估计计量的含量的含义义 记记层层比比例例为为 ,层层样样本本比比例例 ,其其中中 与与 是是第第h h层层总总体体及及样样本本中中具具有有所所考考虑虑特特征征的的单单元元数数,则则总总体比例体比例P P的估的估计为计为:第十八页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质 (二)估(二)估计计量的性量的性质质 如果定如果定义义 则对总则对总体比例的估体比例的估计类计类似似对总对总体均体均值值的估的估计计,这时这
13、时 具有具有同同样样的性的性质质。第十九页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质性性质质7 7对对于于一一般般的的分分层层抽抽样样,如如果果 是是 的的无无偏偏估估计计(h=1,2,h=1,2,,L L),),则则 是是P P的无偏估的无偏估计计。的方差的方差为为:性性质质8 8 对对于分于分层层随机抽随机抽样样,是是P P的无偏估的无偏估计计,则则 :的方差的方差为为:第二十页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质第二十一页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质性质性质 9 9 对对于分于分层层随机抽随
14、机抽样样,的一个无偏估的一个无偏估计为计为:第二十二页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质【例例4.24.2】对对某某地地区区的的居居民民拥拥有有家家庭庭电电脑脑的的情情况况进进行行调调查查,以以居居民民户户为为抽抽样样单单元元,根根据据收收入入水水平平将将居居民民户户划划分分为为四四层层,每每层层按按简简单单随随机机抽抽样样抽抽取取1010户户,调调查查获获得得如如下下数数据据(单单位位:台台),如如表表4-34-3。估估计该计该地区居民地区居民拥拥有家庭有家庭电脑电脑的比例的比例计计估估计计的的标标准差。准差。第二十三页,本课件共有83页第二节第二节 简单估
15、计量及其性质简单估计量及其性质解:由上表可得解:由上表可得:第二十四页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质因此,该地区居民拥有家庭电脑比例的估计为:因此,该地区居民拥有家庭电脑比例的估计为:估计量的方差为:估计量的方差为:第二十五页,本课件共有83页第二节第二节 简单估计量及其性质简单估计量及其性质估计量的标准差为:估计量的标准差为:第二十六页,本课件共有83页第三节第三节 样本量的分配样本量的分配 在在分分层层抽抽样样抽抽样样中中,若若总总样样本本量量n n一一定定时时,还还需需研研究究各各层层应应该该分分配配多多少少样样本本量量的的问问题题,因因为为对对总总
16、体体参参数数进进行行估估计计时时,估估计计量量的的方方差差不不仅仅与与各各层层的的方方差差有有关关,还还与与各各层层所所分分配配的的样样本本量量有有关关。实实际际工工作作中中有有不不同同的的分分配配方方法法,既既可可以以按按各各层层单单元元数数占占总总体体单单元元数数的的比比例例分分配配,也也可可以以采采用用使使估估计计量量总总方方差差达达到到最最小小等等几种方法进行样本量的分配。几种方法进行样本量的分配。第二十七页,本课件共有83页第三节第三节 样本量的分配样本量的分配一、比例分配一、比例分配 比比例例分分配配指指的的是是按按各各层层单单元元数数占占总总体体单单元元数数的的比比例例,也也就就
17、是按各层的层权进行分配,即:是按各层的层权进行分配,即:这时:这时:第二十八页,本课件共有83页第三节第三节 样本量的分配样本量的分配总体比例总体比例P P的估计是:的估计是:对于分层随机抽样,这时总体均值的估计值是:对于分层随机抽样,这时总体均值的估计值是:第二十九页,本课件共有83页第三节第三节 样本量的分配样本量的分配 的方差为:的方差为:总总体体中中的的任任一一个个单单元元,不不管管它它在在哪哪一一层层,都都以以同同样样的的概概率率入入样样,因因此此按按比比例例分分配配的的分分层层随随机机样样本本,估估计计量量的的形形式式特特别别简简单单。这这种样本也称为自加权的样本。种样本也称为自加
18、权的样本。第三十页,本课件共有83页第三节第三节 样本量的分配样本量的分配 的方差为:的方差为:第三十一页,本课件共有83页第三节第三节 样本量的分配样本量的分配二、最优分配二、最优分配 (一)最优分配(一)最优分配 最最优优分分配配是是指指在在分分层层随随机机抽抽样样中中,如如何何将将样样本本量量分分配配到到各各层层,使使得得在在总总费费用用给给定定的的条条件件下下,估估计计量量的的方方差差达达到到最最小小;或或在在给给定定估估计计量量方方差差的的条条件件下下,使使总总费费用用最最小小,能能满满足足这这个个条条件件的的样样本本量量分配就是最优分配。分配就是最优分配。如果我们考虑简单线性费用函
19、数,总费用如果我们考虑简单线性费用函数,总费用第三十二页,本课件共有83页第三节第三节 样本量的分配样本量的分配则这时的最优分配是:则这时的最优分配是:由由此此得得出出下下面面的的行行为为准准则则,如如果果某某一一层层单单元元数数较较多多,内内部部差差异异较大,费用比较省,则对这一层的样本量要多分配一些。较大,费用比较省,则对这一层的样本量要多分配一些。第三十三页,本课件共有83页第三节第三节 样本量的分配样本量的分配 (二)二)NeymanNeyman(内曼)分配(内曼)分配 对对于于分分层层随随机机样样本本,作作为为特特例例,如如果果每每层层抽抽样样的的费费用用相相同同,即即 时,最优分配
20、可简化为:时,最优分配可简化为:这种分配称为这种分配称为NeymanNeyman分配。这时,分配。这时,达到最小。达到最小。第三十四页,本课件共有83页第三节第三节 样本量的分配样本量的分配 【例例4.34.3】对对某某地地区区的的居居民民豆豆制制品品年年消消费费支支出出进进行行调调查查,以以居居民民户户为为抽抽样样单单元元,根根据据收收入入水水平平将将居居民民户户划划分分为为四四层层,每每层层按按简简单单随随机机抽抽样样抽抽取取1010户户,调调查查获获得得如如下下数数据据(单单位位:元元),如如表表4-44-4。样样本本量量为为n=40n=40,则则按按比比例例分分配配和和NeymanNe
21、yman分分配配时时,各各层层的样本量应为多少?的样本量应为多少?第三十五页,本课件共有83页第三节第三节 样本量的分配样本量的分配解:由上表,解:由上表,各各层层的的层权层权及抽及抽样样比比为为:第三十六页,本课件共有83页第三节第三节 样本量的分配样本量的分配各各层样层样本均本均值值及方差及方差为为:同理可得:同理可得:第三十七页,本课件共有83页按比例分配时,各层的样本量为:按比例分配时,各层的样本量为:第三节第三节 样本量的分配样本量的分配即各层的样本量分别为即各层的样本量分别为3 3,6 6,1111,22 22 对于对于NeymanNeyman分配,根据前面对分配,根据前面对 及及
22、 的计算结果,得到:的计算结果,得到:第三十八页,本课件共有83页第三节第三节 样本量的分配样本量的分配第三十九页,本课件共有83页因此,按因此,按NeymanNeyman分配时,各层应分配的样本量为:分配时,各层应分配的样本量为:第三节第三节 样本量的分配样本量的分配即各层的样本量分别为即各层的样本量分别为3 3,7 7,2323,7 7。第四十页,本课件共有83页(三)某些层要求大于(三)某些层要求大于100%100%抽样时的修正抽样时的修正 按按最最优优分分配配时时,有有时时抽抽样样比比 较较大大,某某个个层层的的 又又比比较较大大,则则可可能能出出现现按按最最优优分分配配计计算算的的这
23、这个个层层的的样样本本量量 超超过过 的的情情况况。实实际际工工作作中中,如如果果第第k k层层出出现现这这种种情情况况,最最优优分分配配是是对对这这个个层层进进行行100%100%抽抽样样,即即取取 ,然然后后,将将剩剩下下的的样样本本量量 按按最最优分配各层。优分配各层。第三节第三节 样本量的分配样本量的分配第四十一页,本课件共有83页一、一般公式一、一般公式 令令 ,其中,其中 已经选定,于是当方差已经选定,于是当方差V V给定时,给定时,第四节第四节 样本量的确定样本量的确定 得得到到确确定定样样本本量量的的一般公式为:一般公式为:第四十二页,本课件共有83页如果估计精度是以误差限的形
24、式给出,则如果估计精度是以误差限的形式给出,则 ,第四节第四节 样本量的确定样本量的确定第四十三页,本课件共有83页当按比例分配时,当按比例分配时,第四节第四节 样本量的确定样本量的确定实际工作中,实际工作中,n n的计算可以分为两步,先计算的计算可以分为两步,先计算 然后进行修正:然后进行修正:当按当按NeymanNeyman分配时,分配时,第四十四页,本课件共有83页 【例例4.44.4】(续续例例4.34.3)如如果果要要求求在在95%95%置置信信度度下下,相相对对误误差差不不超超过过10%10%,则按比例分配和,则按比例分配和NeymanNeyman分配时,总样本量分别为多少?分配时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四章分层抽样 2优秀PPT 第四 分层抽样 优秀 PPT
限制150内