抽样技术其他专题优秀PPT.ppt
《抽样技术其他专题优秀PPT.ppt》由会员分享,可在线阅读,更多相关《抽样技术其他专题优秀PPT.ppt(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样技术 其他专题你现在浏览的是第一页,共46页2 n以前各章基本假设总体单元数以前各章基本假设总体单元数N是已知的,然是已知的,然后对总体的有关特征如均值、总值、比例等后对总体的有关特征如均值、总值、比例等进行估计。进行估计。n但有些场合,总体单元数是未知的,是要估但有些场合,总体单元数是未知的,是要估计的目标,如:一个池塘中鱼的数量,一片计的目标,如:一个池塘中鱼的数量,一片森林中鸟的数量等。森林中鸟的数量等。n彼得森(彼得森(Peterson,1896)提出捕获再捕)提出捕获再捕获抽样,并将此方法用于野生动物的数量研获抽样,并将此方法用于野生动物的数量研究中。究中。第一节第一节 捕获再捕
2、获抽样捕获再捕获抽样你现在浏览的是第二页,共46页以捕鱼为例说明:以捕鱼为例说明:n假如要估计湖中的鱼的数量假如要估计湖中的鱼的数量N;n从湖中捕获从湖中捕获200条鱼做记号放回湖中,让它们条鱼做记号放回湖中,让它们与湖中未做记号的鱼充分混合。与湖中未做记号的鱼充分混合。n然后从湖中再捕获然后从湖中再捕获100条鱼,假设这次捕获条鱼,假设这次捕获的鱼中有的鱼中有20条是已经做了记号的,若假定鱼条是已经做了记号的,若假定鱼的总体没有变化,两次捕鱼都是简单随机抽的总体没有变化,两次捕鱼都是简单随机抽样,就可以估计湖中的鱼样,就可以估计湖中的鱼20%做了标记,由做了标记,由此可以推断此可以推断N的估
3、计值是的估计值是1000。3你现在浏览的是第三页,共46页这种方法依赖于以下假定:这种方法依赖于以下假定:n(1)总体是封闭的)总体是封闭的两次抽样间没有鱼进入或离开该湖。两次抽样间没有鱼进入或离开该湖。即对每次抽样而言,即对每次抽样而言,N相同。相同。n(2)每个样本都是来自总体的简单随机抽样。即湖中每条鱼都有)每个样本都是来自总体的简单随机抽样。即湖中每条鱼都有同样机会被捕获。同样机会被捕获。n(3)两个样本是独立的。即第一次捕获并放回湖中再次与总体混)两个样本是独立的。即第一次捕获并放回湖中再次与总体混合,标记与否和第二次被捕获的概率没有关系。合,标记与否和第二次被捕获的概率没有关系。n
4、(4)鱼不会丢失其标记,从而有记号的鱼可以被识别。)鱼不会丢失其标记,从而有记号的鱼可以被识别。4你现在浏览的是第四页,共46页5若若 为第二次抽样的样本量,为第二次抽样的样本量,m m为第二次捕获有记号为第二次捕获有记号的单元的数量,有的单元的数量,有则则一、一、直接抽样法直接抽样法先从单元数为先从单元数为N N(未知)的总体中抽取一个随机样本,(未知)的总体中抽取一个随机样本,设样本量为设样本量为 ,把这些单元做上记号,然后放回,把这些单元做上记号,然后放回总体,使其与原总体的单元充分混合;这时,做记总体,使其与原总体的单元充分混合;这时,做记号的数量占总体数量的比例为号的数量占总体数量的
5、比例为 ,N,N未知,未知,P P待待估计;估计;再抽取一个样本,观察其中做记号的单元所占的比再抽取一个样本,观察其中做记号的单元所占的比例,对总体的单元数进行估计。例,对总体的单元数进行估计。你现在浏览的是第五页,共46页6可以看成比率估计的特殊形式可以看成比率估计的特殊形式令令1,0,如果第如果第i个做过标记个做过标记如果第如果第i个未做标记个未做标记你现在浏览的是第六页,共46页7由比率估计方差可以得到:由比率估计方差可以得到:有偏有偏当第一次样本量和第二次样本量足够大时,偏差会逐步变小。当第一次样本量和第二次样本量足够大时,偏差会逐步变小。通常对通常对N是略有高估的。是略有高估的。在大
6、样本情况下,估计量在大样本情况下,估计量 近似正态分布,可以给出一定置信近似正态分布,可以给出一定置信度下的置信区间。度下的置信区间。你现在浏览的是第七页,共46页8n前例中,前例中,你现在浏览的是第八页,共46页二、逆抽样法二、逆抽样法n当做记号的单元在总体中的比例很小时,即当做记号的单元在总体中的比例很小时,即 很小,很小,9则在第二次抽样时是一个小比例事件,如果则在第二次抽样时是一个小比例事件,如果 不够大,很可能出现不够大,很可能出现没有记号的单元,即没有记号的单元,即 ,无法对,无法对N进行估计。进行估计。n一种方法:加大第一次抽样的数目;一种方法:加大第一次抽样的数目;n另一种:逆
7、抽样;另一种:逆抽样;n这种方法在第二次抽样时,并不对这种方法在第二次抽样时,并不对 的数量作出规定,而是的数量作出规定,而是一直抽到曾做过记号的单元数达到一直抽到曾做过记号的单元数达到 个为止。个为止。n与直接抽样法不同,此时与直接抽样法不同,此时 是预先规定的,而是预先规定的,而 是一个随机是一个随机变量。变量。你现在浏览的是第九页,共46页n例:欲估计某个森林中啄木鸟的数量。首先随即捕捉了例:欲估计某个森林中啄木鸟的数量。首先随即捕捉了150只只啄木鸟,并在鸟的翅膀下染上颜色作为记号,然后予以放飞,啄木鸟,并在鸟的翅膀下染上颜色作为记号,然后予以放飞,适当的一段时间后,在第二次捕捉中目标
8、是捕到有记号的啄木适当的一段时间后,在第二次捕捉中目标是捕到有记号的啄木鸟鸟35只,结果一共捕捉了只,结果一共捕捉了100只。要求估计啄木鸟的数量,只。要求估计啄木鸟的数量,并给出估计标准误。并给出估计标准误。10你现在浏览的是第十页,共46页n某出版社要调查某一某出版社要调查某一畅销书的盗版数量畅销书的盗版数量,由于正版发行多少册,由于正版发行多少册是已知的,相当于已做记号的的是已知的,相当于已做记号的的 册,然后可以随机的抽册,然后可以随机的抽取取 个购买该书的读者,若其中有个购买该书的读者,若其中有 册正版书,则可以册正版书,则可以推算出正版书和盗版书的总量,从而算出盗版书的数量。推算出
9、正版书和盗版书的总量,从而算出盗版书的数量。n推算总的网站数量推算总的网站数量。在。在CN下注册的网站的数量是已知的,但在下注册的网站的数量是已知的,但在CN外的就无法掌握外的就无法掌握 11n捕获再捕获的抽样方法捕获再捕获的抽样方法 起源于野生动物的估计,可以进一步扩展用起源于野生动物的估计,可以进一步扩展用于社会经济的统计。于社会经济的统计。n广场集会人数的调查广场集会人数的调查。如某报社要报导某次自发性的集会人数,可。如某报社要报导某次自发性的集会人数,可以在广场入口处散发一些小红帽,然后由记者随机抽取一个参与集会以在广场入口处散发一些小红帽,然后由记者随机抽取一个参与集会的样本,该样本
10、中有多少有小红帽,就可以推断出总人数。的样本,该样本中有多少有小红帽,就可以推断出总人数。你现在浏览的是第十一页,共46页采用条样(采用条样(Quadrat samples)估计总体密度和数量估计总体密度和数量n直接抽样和逆抽样都是建立在总体单位流动性比较大的直接抽样和逆抽样都是建立在总体单位流动性比较大的基础上;基础上;n对于有些总体的流动性并不是很大,例如松林中发生对于有些总体的流动性并不是很大,例如松林中发生的松毛虫灾害,大气中的可吸入颗粒物,就不适宜采的松毛虫灾害,大气中的可吸入颗粒物,就不适宜采用捕捉再捕捉抽样;用捕捉再捕捉抽样;n通常采用抽取若干样本来估计总体密度,然后根据总通常采
11、用抽取若干样本来估计总体密度,然后根据总体的面积或体积来估计总体数量。体的面积或体积来估计总体数量。12你现在浏览的是第十二页,共46页n设一个地区的面积为设一个地区的面积为A,从中随机抽取,从中随机抽取n个样本,这种样本通常称为个样本,这种样本通常称为条样。若每个条样的面积为条样。若每个条样的面积为a,则总体划分为,则总体划分为N个个a,总面积,总面积A=Na。13n这些元素在总体中的密度为这些元素在总体中的密度为你现在浏览的是第十三页,共46页n在对密度的估计中,通常假设总体的元素在总体中的分布是随机在对密度的估计中,通常假设总体的元素在总体中的分布是随机的,而不是聚集在一起的,即分布没有
12、一定的规则顺序,因此在的,而不是聚集在一起的,即分布没有一定的规则顺序,因此在条样中条样中 的分布近似于泊松分布;的分布近似于泊松分布;14n先计算样本每个条样中的平均元素先计算样本每个条样中的平均元素数:数:n再估计条样的密度:再估计条样的密度:n总体的元素总量总体的元素总量M的估计值为:的估计值为:n其方差估计为:其方差估计为:你现在浏览的是第十四页,共46页n例:在一项耕地的切根虫调查中,抽取的工具是一个例:在一项耕地的切根虫调查中,抽取的工具是一个20cm长和长和20cm宽的一个正方形测框,取宽的一个正方形测框,取10cm的表土来计量切根虫的数的表土来计量切根虫的数量。随机取了量。随机
13、取了10个样框资料,得到每个测框中平均有切根虫个样框资料,得到每个测框中平均有切根虫2条。条。试估计在一块试估计在一块5000平方米的耕地中有多少切根虫,并给出估计平方米的耕地中有多少切根虫,并给出估计标准误。标准误。15解:解:切根虫数切根虫数已知已知该耕地切根虫数估计为该耕地切根虫数估计为25万条,估计标准误为万条,估计标准误为5.59万条。万条。你现在浏览的是第十五页,共46页16 第二节第二节 样本轮换样本轮换一、样本轮换的原因一、样本轮换的原因n有些抽样调查是连续性的,需要定期的重复进行;有些抽样调查是连续性的,需要定期的重复进行;n通常逐月、逐季或者每半年一次,都要估计有关指标,通
14、常逐月、逐季或者每半年一次,都要估计有关指标,还要与上月上季或上年同期对比;还要与上月上季或上年同期对比;n为了解决样本老化和更换全部样本单位引起的费用增为了解决样本老化和更换全部样本单位引起的费用增加以及前后期比较问题,就要考虑采用样本轮换。加以及前后期比较问题,就要考虑采用样本轮换。n样本轮换:样本轮换:在抽样调查中,每隔一定时间更换一定在抽样调查中,每隔一定时间更换一定比例的样本单位,保留其余单位。比例的样本单位,保留其余单位。你现在浏览的是第十六页,共46页17二、样本轮换的最优比例二、样本轮换的最优比例n假定抽样是放回的简单随机抽样;假定抽样是放回的简单随机抽样;n设在第一个时期的样
15、本量为设在第一个时期的样本量为n,在第二个时期,在第二个时期保留样本的比例为保留样本的比例为p,即保留的样本量为,即保留的样本量为np,同时独立的补充新的样本量同时独立的补充新的样本量nq,p+q=1。第。第二个时期的样本量仍然为二个时期的样本量仍然为n。你现在浏览的是第十七页,共46页18n第一个时期与第二个时期相同的第一个时期与第二个时期相同的np个单位在第一个时期个单位在第一个时期的均值的均值n第一个时期的第一个时期的nq个单位在第一个时期的均值个单位在第一个时期的均值nnp个单位在第二个时期的均值个单位在第二个时期的均值nnq个补充单位在第二个时期的均值个补充单位在第二个时期的均值n估
16、计第二个时期的均值,并希望此均值充分利用第一个时期的信估计第二个时期的均值,并希望此均值充分利用第一个时期的信息,令息,令你现在浏览的是第十八页,共46页19因为因为要使要使有有可以求得估计量方差可以求得估计量方差你现在浏览的是第十九页,共46页20该估计量的方差:该估计量的方差:你现在浏览的是第二十页,共46页n如果不利用前期信息,只根据第二期的结果来估计均值,有如果不利用前期信息,只根据第二期的结果来估计均值,有21其方差为其方差为n计算利用前期信息后的设计效应计算利用前期信息后的设计效应见书见书P208:可以得到最优的轮换比:可以得到最优的轮换比:你现在浏览的是第二十一页,共46页22n
17、三、样本轮换方法(三、样本轮换方法(P209P209)n四、样本轮换应该遵循的原则四、样本轮换应该遵循的原则你现在浏览的是第二十二页,共46页23 第三节第三节 敏感性问题的处理敏感性问题的处理n一、敏感性问题一、敏感性问题 所调查的内容涉及个人隐私,受访者不愿或不便于公开的问题。所调查的内容涉及个人隐私,受访者不愿或不便于公开的问题。n如果直接使用对这类问题的答案构成的调查结果来推断总体,显然如果直接使用对这类问题的答案构成的调查结果来推断总体,显然可靠性值得怀疑。可靠性值得怀疑。n一般从两个方面改进:一般从两个方面改进:n改进问卷设计;改进问卷设计;n通过引入专门的抽样技术(随机化模型),
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样技术 其他专题优秀PPT 抽样 技术 其他 专题 优秀 PPT
限制150内