抽样技术与试验设计.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《抽样技术与试验设计.ppt》由会员分享,可在线阅读,更多相关《抽样技术与试验设计.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样技术与试验设计现在学习的是第1页,共53页统计学第11章 抽样技术与试验设计 11.1 抽样技术11.1.1抽样技术的几个基本概念11.1.2简单随机抽样11.1.3系统抽样11.1.4分层抽样11.1.5整群抽样11.1.6必要样本容量11.1.7根据费用函数确定样本容量11.2试验设计11.2.1一种简单的试验设计11.2.2随机化区组设计11.2.3拉丁方设计2022/10/3现在学习的是第2页,共53页第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术统计学教程卢小广现在学习的是第3页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术
2、 11.1.1 抽样技术的几个基本概念 目标总体(The Target Population)是指所要了解和研究的客观对象的全体构成的集合。目标总体是客观存在的现实,所以也称为客观总体。构成目标总体的个体称为总体单位(Population Units)。抽样总体(The Sampling Population)是指从中抽取样本进行数据采集的具体对象的全体构成的集合,抽样总体由已经搜集的数据构成,抽样总体是对客观存在的现实映射。构成抽样总体的个体称为抽样单位(Sampling Units)。系统性偏误(Systematic Bias)是指与抽样的随机性误差无关的,不会随着抽样的样本容量增大而减小
3、的常数项偏误。2022/10/3现在学习的是第4页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 抽样框(Sampling Frame)是按照抽样的目的和抽样方法的要求,为了实施样本的抽取而专门构造的,对抽样总体数据进行编码和排序,所构成的有序的数据库。首先,构造抽样框的前提是必须从统计研究和抽样目的出发。其次,构造一个有效的抽样框,要与具体抽样设计中所采取的抽样技术相适应。第三、构造一个有效的抽样框的基础是拥有能够如实反映目标总体现实状况的抽样总体数据。第四、在构造抽样框,还要防止在采取系统抽样方法时,发生抽样的频率与抽样框资料中样本单位的调查标志的变动周
4、期恰好吻合的现象,避免由此而引起的系统性偏误。在抽样技术中,抽样总体和目标总体存在差别而产生系统性偏误,往往通过抽样框有偏的形式反映出来。通常将这种由于抽样总体和目标总体存在差别而产生系统性偏误,以及构造抽样框过程中由于其它失误新产生的系统性偏误统称为“抽样框偏误”。2022/10/3现在学习的是第5页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 从抽样框抽取部分的抽样单位的观测值所构成的集合称为样本(Sample)。根据样本计算的统计量推断总体参数时产生的随机误差,称为抽样平均误差。抽样平均误差(Sampling Error)是样本统计量与总体参数真值之
5、间误差的测度,通常用样本估计量的标准差来度量,一般也简称为抽样误差。样本估计量的标准差反映了使用样本数据来推断总体参数时,统计量与总体参数真值之间误差的平均水平。2022/10/3现在学习的是第6页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 11.1.2 简单随机抽样 简单随机抽样(Simple Random Sampling)也叫纯随机抽样,是指没有利用任何辅助资料,对抽样总体不作任何分组或分类,直接从抽样总体的个抽样单位中随机抽取抽样个单位构成样本,并以这个抽样单位组成的样本数据对总体参数进行推断的抽样方法和过程。等概抽样(Equal Probabi
6、lity Sampling)是按照每个抽样单位具有同等的被抽中的概率进行的一种抽样方法,等概抽样又称之为自加权抽样(Self-Weighting Sampling),由等概抽样样本计算出来的估计量称为自加权估计量(Self-Weighting Estimator)。等概抽样的抽样框不仅仅提供了一个进行样本抽取的条件,同时它还是一个计算抽样统计量的加权结构。一旦抽样框有偏,直接导致参数估计的加权结构有偏,进而引起统计量的系统偏误。2022/10/3现在学习的是第7页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 1简单随机抽样的参数估计 在简单随机抽样场合,假
7、设从抽样总体中随机抽取一个样本,其样本均值为总体均值的无偏估计量,计算公式为 (11.1)样本均值的方差为 (11.2)2022/10/3现在学习的是第8页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 当式(11.2)中的总体方差未知时,需要采用样本方差作为它的估计量,即 (11.3)则有简单随机抽样的样本均值的标准差,即简单随机抽样的抽样平均误差为 (11.4)2022/10/3现在学习的是第9页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 2不重复抽样的简单随机抽样 重复抽样(Sampling With Repla
8、cement)是不受所抽取的样本的影响,在相同的抽样框中重复进行样本抽取的一种抽样设计。不重复抽样(Sampling Without Replacement)是不将已经抽取的抽样单位放回抽样框中的一种抽样设计。有限总体校正系数(Finite Population Corrections,fpc)为不重复抽样的统计量方差与重复抽样统计量方差所相差的一个数量测度,反映了与重复抽样相比不重复抽样效率提高的程度。对于有限总体而言,抽样率是一个正数,因此有限总体校正系数总是小于1,不重复抽样的抽样平均误差总是小于重复抽样。重复抽样的样本均值方差的计算公式为不重复抽样的样本均值方差计算公式乘以有限总体校正
9、系数,即 (11.5)2022/10/3现在学习的是第10页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 则有重复抽样的样本均值标准差为 (11.6)为了计算简便,当抽样率很小时,可以将有限总体校正系数忽略不计,采用重复抽样的抽样平均误差计算公式来近似计算不重复抽样的抽样平均误差。2022/10/3现在学习的是第11页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 11.1.3 系统抽样 系统抽样(Systematic Sampling)又称为机械抽样、或等距抽样,它是将抽样总体中的所有抽样单位按照一定的顺序排列,每隔一
10、定的间隔抽取一个抽样单位的一种抽样框设计和样本抽取的抽样技术。1系统抽样的步骤 首先,将调查总体中的所有单位按照一定的顺序排列,构造抽样框。其次,计算抽样距离。(11.7)第三,随机起点,或半距起点,按照抽样距离抽取随机样本。第四,要防止抽样距离与总体某种周期性波动相吻合,导致样本包含系统性偏误。为了防止出现此类情况,可以采用对称等距方式抽取系统抽样的随机样本。2022/10/3现在学习的是第12页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 2系统抽样的排序 依据有排序的标志不同,系统抽样分为按照有关标志排序和按照无关标志排序两大类。所谓按照有关标志排序
11、是指利用与抽样目的有联系的标志对抽样框中的所有抽样单位进行排序。按照有关标志排序的系统抽样,由于利用了相关的辅助信息,具有较高的抽样效率。通过这样的排序,赋予抽样框某种有序性,使得从中抽取的样本相对调查标志而言具有更强的均匀性和代表性,从而提高抽样的效率。按照无关标志排序是指利用与抽样目的没有任何联系的标志对抽样框中的所有抽样单位进行排序。这时的系统抽样具有类似简单随机抽样的特征,一般可用简单随机抽样的抽样平均误差计算公式来计算按照无关标志排序系统抽样的抽样平均误差。2022/10/3现在学习的是第13页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 3系统
12、抽样的特点(1)简便易行,便于操作,基层调查员能够较快地掌握运用。因此在实际工作中,系统抽样方法得到了广泛地应用;(2)有利于保证样本的随机性。由于这一方法在抽样框、抽样距离和第一个样本的抽取起点确定之后,整个样本的抽取过程就是一个简单和机械的操作,从而有效地避免了具体抽样人员为了简单了事,采取随意方式抽取样本,从而破坏样本的随机性;以及防止人为地有意识选择样本,破坏样本随机性的问题发生。(3)系统抽样可以使所抽取的抽样单位在抽样总体中分布均匀,提高样本的代表性。若采用与调查指标有着较高相关关系的标志进行排队,还会显著地提高这种抽样方法的抽样效率。(4)便于利用计算机数据库资料构造样本框,以及
13、使用计算机进行样本的抽取。2022/10/3现在学习的是第14页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 11.1.4 分层抽样 分层抽样(Stratified Sampling)也称为分类抽样或类型抽样,是将抽样总体按某一标志分层(或分类),然后从每层中抽取样本单位构成样本进行数据采集和参数估计的方法和过程。1分层抽样的特点 分层抽样将抽样总体的个抽样单位划分为没有遗漏和互不重叠的L层,其中第h层有nh个抽样单位.分层抽样是常用的抽样技术,它具有如下的特点。(1)分层抽样按层(类)进行调查,便于操作、方便管理;(2)分层抽样中各层(类)的抽样相对独立
14、,可以分别估计出各层总体参数数值;(3)当抽样总体各层之中各单位标志变异程度较小,且各层之间的标志变异程度较大时,分层抽样可以显著提高抽样效率。2022/10/3现在学习的是第15页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 抽样总体的总离差可以分解为层间离差和层内离差两个部分。在分层抽样场合,每层都抽取样本进行调查,即在各层之间进行的是全面调查,不存在层间抽样误差,只存在层内抽样误差。当层间离差大,层内离差小时,分层抽样具有较好的抽样效率。因此,在采用分层抽样方法进行抽样时,应通过抽样框的分层设计,应尽量扩大抽样框中各层之间的层间离差,相应减小层内离差
15、,以获得理想的抽样效率。(11.8)2022/10/3现在学习的是第16页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 2分层抽样的参数估计 分层抽样样本均值的计算公式为 (11.9)分层抽样需要总体在各层的单位数,或者总体单位数在各层中的分布结构作为各层样本估计量的权数作为辅助资料,来计算样本估计量。分层抽样样本均值方差的计算公式为 (11.10)2022/10/3现在学习的是第17页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 总体方差未知时,需要采用样本方差作为它的估计量,即 (11.11)在这里,假定在各层层内
16、采用简单随机抽样,式(11.11)中第h层样本方差为 (11.12)式(11.11)中表示第层有限总体校正系数,其中为第层抽样率。由分层抽样估计量方差的计算公式可知,分层抽样样本均值的方差仅由层内方差组成,当组间方差不为零时,分层抽样总是具有比简单随机抽样更高的抽样效率。并且,当各层估计量之间的差异越大,其组间方差的取值也就越大,分层抽样的优越性也就越显著。2022/10/3现在学习的是第18页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 3分层抽样的样本配置 在分层抽样中,不仅抽样总体的分层关系到抽样效率,样本容量在各层之间的分配也影响到抽样的效率,因此
17、需要在抽样总体分为若干层之后,再按照某一样本配置原则,将样本容量合理地分配到各层之中。(1)比例配置 按第h层总体单位数占总体单位总数的比重,来确定第h层样本容量的样本配置方法称为比例配置,其样本容量配置公式为 (11.15)由分层抽样比例配置公式可知,分层抽样的样本配置需要总体在各层的单位数,或者总体单位数在各层中的分布结构作为辅助数据,来实施样本在各层中的分配。2022/10/3现在学习的是第19页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 (2)Neyman最佳配置 Neyman最佳配置是既考虑各层单位数占总体单位数的比重大小,又同时考虑各层的总体
18、标准差差异的分层抽样技术。Neyman最佳配置的样本容量的分配公式为 (11.16)由式(11.16)可知,分层抽样的Neyman最佳配置不仅需要总体在各层的单位数,还需要各层的总体标准差作为必要的辅助数据,来进行样本在各层中的分配。当各层的总体方差都相等时,Neyman最佳配置退化为比例配置。当各层的总体方差不等,通过Neyman最佳配置总可以获得优于比例配置的抽样效率。2022/10/3现在学习的是第20页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 例例11.111.1 某市准备对全市人均收入水平进行一次抽样调查,现进行抽样设计和抽样误差的试算,对各
19、种抽样方法的效率进行分析。若已知总体的有关数据如表11.1所示。表11.1 某市人均收入水平情况表 要求要求 取样本容量为250,试算(1)分层抽样的样本均值;(2)比例配置分层抽样的抽样平均误差;(3)Neyman最佳配置分层抽样的抽样平均误差;(4)简单随机抽样的抽样平均误差。2022/10/3现在学习的是第21页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 (1)试算分层抽样的样本均值。由式(11.9),有 (2)试算比例配置分层抽样的抽样平均误差。由于抽样率趋于0,有限总体校正系数可以忽略不计,所以先采用式(11.15)配置样本,然后根据式(11.
20、14)计算抽样平均误差。表11.3 某市人均收入水平比例配置分层抽样的抽样平均误差计算表得比例配置分层抽样的抽样平均误差为11.25元。2022/10/3现在学习的是第22页,共53页统计学第11章 抽样技术与试验设计 11.1 11.1 抽抽样样技技术术 (3)Neyman最佳配置分层抽样的抽样平均误差。先采用式(11.16)配置样本。然后采用式(11.14)计算抽样平均误差。表11.4 某市人均收入水平最佳配置分层抽样的抽样平均误差计算表得Neyman最佳配置分层抽样的抽样平均误差为10.82元。2022/10/3现在学习的是第23页,共53页统计学第11章 抽样技术与试验设计 11.1
21、11.1 抽抽样样技技术术 (4)计算简单随机抽样的抽样平均误差。首先要根据式(11.8)计算出总体方差,然后再按照式(11.2)计算出简单随机抽样下的样本均值的方差。表11.5 某市人均收入水平总体方差计算表可得简单随机抽样的抽样平均误差为30.44元。约为分层抽样的3倍。2022/10/3现在学习的是第24页,共53页11.1 11.1 抽抽样样技技术术 11.1.5 整群抽样 整群抽样(Custer Sampling)先将总体划分为由抽样单位组成的若干群,以群为单元进行样本的抽取,然后对抽中群中的全部抽样单位进行观测和登记,并用以推断总体参数的一种抽样方法。整群抽样中对所抽中的群中的全部
22、单位进行全面调查,所以整群抽样的抽样平均误差只与群间的差异有关,整群抽样中“群”的划分,需要体现出“群内的差异性,群间的同质性”,才能提高抽样效率。假定每群的抽样单位数皆为M,共抽取r群,则有 (11.17)(11.18)统计学第11章 抽样技术与试验设计 2022/10/3现在学习的是第25页,共53页11.1 11.1 抽抽样样技技术术 在整群抽样中,由于抽样总体所划分的群数和构成样本的群数都较小,需要采用不重复抽样方法抽取样本,以提高抽样效率。并且,整群抽样的有限总体校正系数明显地不趋于1,不能忽略不计,必须加以考虑。所以,整群抽样的抽样平均误差计算公式为 (11.19)由于整群抽样比较
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 技术 试验 设计
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内