《不等概率抽样》PPT课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《《不等概率抽样》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《不等概率抽样》PPT课件.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 不等概率抽样不等概率抽样 1本章要点本章要点 前前面面各各章章介介绍的的抽抽样方方法法都都是是等等概概率率抽抽样,本本章章则对不不等等概概率率抽抽样方方法法进行行介介绍,具体要求:具体要求:熟熟练掌掌握握不不等等概概率率抽抽样的的概概念念和和分分类,了解不等概率抽了解不等概率抽样的的应用意用意义;了了解解放放回回与与不不放放回回不不等等概概率率抽抽样的的各各种种估估计量构造及其方差估量构造及其方差估计;能能够在在实际抽抽样中中运运用用不不等等概概率率方方法法,尤其是尤其是PPS等常用的方法。等常用的方法。2第一节第一节 问题的提出问题的提出3 简单随机抽样,总体中的每一个单位都有
2、相等简单随机抽样,总体中的每一个单位都有相等的入样概率,所以属于等概率抽样,在分层随机抽的入样概率,所以属于等概率抽样,在分层随机抽 样中,如果各层的样本单位也是按简单随机抽样抽样中,如果各层的样本单位也是按简单随机抽样抽 取,那么层内也是等概率抽样。等概率抽样的基本取,那么层内也是等概率抽样。等概率抽样的基本 出发点是将总体中的每一个单位看成是平等的。如出发点是将总体中的每一个单位看成是平等的。如 果所研究的指标在各个总体单位之间差异不大,简果所研究的指标在各个总体单位之间差异不大,简 单随机抽样是简便有效的;如果所研究的指标在各单随机抽样是简便有效的;如果所研究的指标在各 个总体单位之间的
3、差异较大,简单随机抽样的效果个总体单位之间的差异较大,简单随机抽样的效果 并不一定好。并不一定好。一、不等概率抽样的必要性一、不等概率抽样的必要性 4 如果这些为数不多,但指标值在总体总值中占较如果这些为数不多,但指标值在总体总值中占较大份额的大、特大城市,大、特大商场,大型农场,大份额的大、特大城市,大、特大商场,大型农场,万吨巨轮,大额账单,在调查中与为数众多,但指标万吨巨轮,大额账单,在调查中与为数众多,但指标值在总体总值中只占微小份额的中小城市、中小商场、值在总体总值中只占微小份额的中小城市、中小商场、中小农场、小船舶、小额账单一样对待,仍然采取等中小农场、小船舶、小额账单一样对待,仍
4、然采取等概率抽样,显然是不合理的。这些调查指标值占较大概率抽样,显然是不合理的。这些调查指标值占较大份额的大单位理应在调查中具有较重要的地位,给予份额的大单位理应在调查中具有较重要的地位,给予较多的关注,而那些调查指标值占较小份额的中较多的关注,而那些调查指标值占较小份额的中小单位则处于次要的地位,给予较少的关注。小单位则处于次要的地位,给予较少的关注。5 二、不等概率抽样的主要分类二、不等概率抽样的主要分类(一)放回不等概率抽样(一)放回不等概率抽样(二)不放回不等概率抽样(二)不放回不等概率抽样 6(一)放回不等概率抽样(一)放回不等概率抽样 所谓放回不等概率抽样是指,在抽样之前就给总体中
5、每个所谓放回不等概率抽样是指,在抽样之前就给总体中每个单位赋予一个确定的抽取概率,在放回抽样的每一次抽取中,单位赋予一个确定的抽取概率,在放回抽样的每一次抽取中,每个单位被抽中的概率都不变,直到抽够每个单位被抽中的概率都不变,直到抽够 个样本单位为止。个样本单位为止。对于放回不等概率抽样,由于每次抽取总体的分布都不变,所对于放回不等概率抽样,由于每次抽取总体的分布都不变,所以各次抽取是相互独立的,因此,无论抽样的实施,还是目标以各次抽取是相互独立的,因此,无论抽样的实施,还是目标量的估计及其方差的估计,都特别简单,这是这种抽样方法的量的估计及其方差的估计,都特别简单,这是这种抽样方法的最大优点
6、,从某种意义上讲,抽样调查中的放回抽样主要应用最大优点,从某种意义上讲,抽样调查中的放回抽样主要应用于不等概率抽样这种特殊的形式;然而由于这种抽样方式是有于不等概率抽样这种特殊的形式;然而由于这种抽样方式是有放回抽样,而且是不等概率抽样,因此赋予较大抽取概率的单放回抽样,而且是不等概率抽样,因此赋予较大抽取概率的单位不仅入样的机会大,而且被重复抽中的机会也大,这样就会位不仅入样的机会大,而且被重复抽中的机会也大,这样就会造成信息的重复浪费,降低抽样的精度和效率。放回不等概率造成信息的重复浪费,降低抽样的精度和效率。放回不等概率抽样方法中,最重要也是最常用的是总体中每个单位每次被抽抽样方法中,最
7、重要也是最常用的是总体中每个单位每次被抽到的概率与单位的规模大小成比例的抽样。到的概率与单位的规模大小成比例的抽样。7(二)不放回不等概率抽样(二)不放回不等概率抽样 不放回不等概率抽样是指,在抽样之前就给总体不放回不等概率抽样是指,在抽样之前就给总体中每一个单位赋予一个确定的入样概率,并对每一次中每一个单位赋予一个确定的入样概率,并对每一次抽取的概率进行精心的设计,以保证在抽取的概率进行精心的设计,以保证在n n次不放回抽样次不放回抽样中总体中的每一个单位被抽取的概率之和等于预先赋中总体中的每一个单位被抽取的概率之和等于预先赋予的入样概率。由于每次抽取采用不放回的形式,样予的入样概率。由于每
8、次抽取采用不放回的形式,样本中不会出现重复的单位,抽样效率比放回形式的高,本中不会出现重复的单位,抽样效率比放回形式的高,但同时也由于各次抽取相互不独立,所以无论抽样的但同时也由于各次抽取相互不独立,所以无论抽样的实施还是目标量及其方差的估计都比放回形式复杂。实施还是目标量及其方差的估计都比放回形式复杂。不放回不等概率抽样方法中,最重要最常用的是样本不放回不等概率抽样方法中,最重要最常用的是样本量固定,总体中每个单位的入样概率与单位的规模大量固定,总体中每个单位的入样概率与单位的规模大小严格成比例的抽样。小严格成比例的抽样。8第二节第二节 放回不等概率抽样放回不等概率抽样9 一、多项抽样与一、
9、多项抽样与PPS抽样抽样 设总体包含设总体包含 个单位,在放回抽样的每一次抽取个单位,在放回抽样的每一次抽取中,抽到第中,抽到第 个单位的概率为个单位的概率为 且且 ,按此规定有放回地独立抽取,按此规定有放回地独立抽取 次,共抽到次,共抽到 个单位(有可能重复),称这样的抽样为多项抽样。个单位(有可能重复),称这样的抽样为多项抽样。10 在现实中,总体单位规模在现实中,总体单位规模 大小往往可以是以低成本得大小往往可以是以低成本得到的单位的粗略度量,或是研究变量的目测值,他们不仅容易到的单位的粗略度量,或是研究变量的目测值,他们不仅容易获得而且与研究变量往往有很高的相关性,这些优点可以极大获得
10、而且与研究变量往往有很高的相关性,这些优点可以极大地提高抽样估计的精度,所以在抽样实践中,与单位规模大小地提高抽样估计的精度,所以在抽样实践中,与单位规模大小成比例的概率抽样受到青睐。记这种度量单位规模大小的指标成比例的概率抽样受到青睐。记这种度量单位规模大小的指标为为 ,并记,并记 ,则可取:,则可取:这时,每个单位在每次抽样中入样的概率与其单位的规模这时,每个单位在每次抽样中入样的概率与其单位的规模大小成比例,称这种特殊的多项抽样为放回的与单位规模大小大小成比例,称这种特殊的多项抽样为放回的与单位规模大小成比例的概率抽样(成比例的概率抽样(sampling with probability
11、 proportional to size),简称),简称 抽样。抽样。11 二、实施方法二、实施方法 多项抽样是最简单的不等概率抽样,其实多项抽样是最简单的不等概率抽样,其实施方法通常有两种施方法通常有两种:(一)代码法(一)代码法 (二)希里(二)希里(lahirilahiri)法)法 12(一)代码法(一)代码法 在在 抽样中,赋予每个单位与相应抽样中,赋予每个单位与相应 相等的代相等的代码数,将代码数累加得到码数,将代码数累加得到 ,每次抽取都产生一个,每次抽取都产生一个 之间的随机数,设为之间的随机数,设为 ,若代码,若代码 属于第属于第 个个单位拥有的代码数,则第个单位拥有的代码数
12、,则第个 单位入样。重复单位入样。重复 次这次这样的过程,就可得到由样的过程,就可得到由 个单位(存在重复的可能)个单位(存在重复的可能)组成的组成的 样本。如果在实际中存在样本。如果在实际中存在 不是整数的不是整数的情况,则可以乘以一个倍数,使所有的情况,则可以乘以一个倍数,使所有的 都成为整数。都成为整数。对于一般的多项抽样,总可以找到某个对于一般的多项抽样,总可以找到某个 ,使所有,使所有的的 成为整数。每个单位赋予与相应成为整数。每个单位赋予与相应 相等的相等的代码数,然后进行抽样。代码数,然后进行抽样。13(二)希里(二)希里(lahirilahiri)法)法 令令 ,即,即 为所有
13、为所有 中的最大值,每中的最大值,每次从次从 1,范围内抽取一个随机整数范围内抽取一个随机整数 ,从,从 1,范围内抽取一个随机整数范围内抽取一个随机整数m,若,若 ,则第,则第 个单个单位入样;若位入样;若 ,则按前面的步骤重抽(,则按前面的步骤重抽(,)。)。14 三、汉森三、汉森赫维茨估计量赫维茨估计量 设设 是按是按 抽样得到的样本观抽样得到的样本观测值,与它们相对应测值,与它们相对应 的值和的值和 的取值也自然地记的取值也自然地记为小写的为小写的 和和 。对于总体总值。对于总体总值 ,汉森(,汉森(Hansen)赫维茨(赫维茨(Hurwitz)给出如下估)给出如下估计量:计量:()(
14、)15 对于对于 这种特殊形式的不等概率抽样,这种特殊形式的不等概率抽样,的的 直观意义是明显的。由于直观意义是明显的。由于 ,代入()式,代入()式,有有16 汉森汉森赫维茨估计量赫维茨估计量 具有如下性质:它是总具有如下性质:它是总体总值体总值 的无偏估计,即有的无偏估计,即有 其方差为其方差为 若若 ,则,则 是是 的无偏估计。的无偏估计。17n【例例6.2】某某县县农农业业局局要要调调查查全全县县养养猪猪专专业业户户全全年年牲牲猪猪的的出出栏栏头头数数,并并有有全全县县365个个养养猪猪专专业业户户上上年年末末的的牲牲猪猪存存栏栏头头数数,各各养养猪猪专专业业户户的的饲饲养养规规模模相
15、相差差较较大大,决决定定以以放放回回方方式式按按与与各各养养猪猪专专业业户户上上年年末末牲牲猪猪存存栏栏头头数数成成正正比比的的概概率率从从中中抽抽取取30户户进进行行调调查查,调调查查结结果果见见下下表表,已已知知全全县县养养猪猪专专业业户户上上年年末末牲牲猪猪存存栏栏头头数数为为9542头头,试试估估计计该该县县养养猪猪专专业业户户牲牲猪猪年年出栏总头数和估计量抽样标准误差。出栏总头数和估计量抽样标准误差。181234567891015239298312429131975134371524518513317374871112131415161718192040321726113625538
16、42258186691564922114533288304212223242526272829301926372174318301241602151044933696177注注:表表示示养养猪猪专专业业户户样样本本编编号号,表表示示各各专专业业户户牲牲猪猪上上年年末末存存栏栏头头数数,表表示示各专业户调查年牲猪出栏头数;其中第各专业户调查年牲猪出栏头数;其中第2 2、第、第1919编号的专业户被抽中两次。编号的专业户被抽中两次。某县养猪专业户年牲猪出栏头数调查样本资料某县养猪专业户年牲猪出栏头数调查样本资料19解:据题中所给资料 ,(头)20第三节第三节 不放回不等概率抽样不放回不等概率抽样2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 不等概率抽样 不等 概率 抽样 PPT 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内