2022年抽样调查理论与方法基本概念 .pdf

上传人：H****o

文档编号：33372398

上传时间：2022-08-10

格式：PDF

页数：10

大小：68.32KB

( 4.5 )

《2022年抽样调查理论与方法基本概念 .pdf》由会员分享，可在线阅读，更多相关《2022年抽样调查理论与方法基本概念 .pdf（10页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、抽样调查理论与方法基本概念（2011年 12 月 22 日整理）一、基本概念（一）抽样调查与非抽样调查1. 调查分类：根据调查是否针对总体的所有单元分为全面调查和非全面调查；根据调查单元是否按照一定的概率入样分为概率抽样调查和非概率抽样调查。2. 非全面调查相对于全面调查的优点：时间短速度快；费用少成本低；调查结果比较准确；应用范围广泛。3. 概率抽样分类：根据调查单元的入样概率是否相等分为等概率抽样和不等概率抽样；根据具体的抽样方式分为简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样等。优点：能够保证样本的代表性，避免人为干扰的因素；用概率抽样取得的样本去估计总体特征时，可以

2、对抽样产生的抽样误差进行估计。4. 非概率抽样分类：根据具体的抽样方式分为判断抽样、便利抽样、自愿样本、滚雪球抽样、配额抽样等；判断抽样包括典型调查和重点调查两种取样方式。缺点：难以评价样本的代表性；无法估计抽样误差；偏倚往往较大。5.抽样调查，是非全面调查中的一种重要方法，它是按照一定程序从名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页，共 10 页 - - - - - - - - - 所研究对象的全体（总体）中抽取一部分（样本）进行调查或观察，获取数据，并以此对总体的一

3、定目标量（参数）作出推断（例如估计）。（二）总体与样本1. 总体：分为目标总体和实际总体，目标总体是研究目标所针对的总体；实际总体是实际调查时所针对的有限的、具体的总体。2. 抽样框与抽样单元包含所有抽样单元的总体称为抽样框，构成抽样框的单元称为抽样单元。抽样框的形式：名单、手册、地图、数据包等。抽样框的要求：抽样框必须是有序的，即抽样单元必须编号，且根据某种顺序进行了排列；抽样框中包含的抽样单元必须“不重不漏”，否则将会出现抽样框误差。3. 抽样与样本样本：从总体中按照一定程序抽得的那部分个体或者抽样单元。（三）总体特征与估计量1. 总体特征：总体某个特征或属性的数量表现。通常有4 种：总

4、体总值 Y；总体均值 Y；总体比例 P；总体比率 R。总体总值、总体均值和总体比例三者是统一的，都可以用总体均值Y来表示。2.估计量：以样本指标为基础构造的，用以估计总体指标的规则或者形式，是随机变量。估计方法：最常见的是简单线性估计，除此之外，还可以借助于辅助名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页，共 10 页 - - - - - - - - - 变量。辅助变量必须具备两个条件：一是与估计量的变量高度相关；二是其总体信息已知。简单估计点估计：定值估计，以所抽

5、样本资料为依据，直接根据所选的估计量对总体指标作出一个确定值的估计。区间估计：以点估计为依据，用一个具有一定可靠程度的区间范围来估计总体指标。比估计与回归估计：利用调查指标和辅助变量之间的相关关系（成比例关系或线性回归关系），可以构造一类估计量，即比估计量或回归估计量。比估计量与回归估计量都是非线性的较为复杂的估计量，但是只要调查主要指标和辅助变量之间具有良好的线性相关关系，则比估计的精度比简单估计高，而回归估计总是优于简单估计，在通常条件下也较比估计的精度高。可用于简单随机抽样和分层随机抽样。比估计与回归估计的使用限制是要求辅助变量的总体或者均值是已知的。3.抽样分布：抽样估计量的概

6、率分布，由估计量的可能性取值与之对应的概率组成。对于一个固定的总体，用相同的抽样方法反复从中抽取容量为 n 的样本，就会产生m个估计值，把这些估计值形成频率分布，即形成 k（k=n）种不同的估计值及其相应频率分布，就是抽样分布。抽样分布的渐进正态性：当从一个比较大的总体N中抽取一个中等容量（30以上）的样本时，无论总体是何种分布，其样本均值的抽样分布都名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页，共 10 页 - - - - - - - - - 近似于正态分布。样本量越大，

7、越接近正态。（四）误差与精度抽样调查中的误差分为两类：抽样误差和非抽样误差。1.抽样误差：是由于抽样的非全面性和随机性引起的偶然性误差，即因抽样的估计随样本而异造成的误差。抽样误差表现为三种形式：抽样实际误差、抽样标准误、抽样极限误差。抽样实际误差是指抽样估计值与总体指标之间的离差。每一次抽烟的实际误差是不可知的，它是随机变量，若估计量无偏，所有可能的实际误差的总和为 0。抽样标准误是衡量抽烟误差大小的核心指标，是对总体指标作出区间估计的一个重要因素，狭义上所指的抽样误差就是抽样标准误，它就是抽样分布或抽样估计量得标准差，是抽样分布方差或者抽样估计量方差（均方误差）的平方根。抽样分布的方

8、差或标准差越大（小），估计量的抽样分布就越分散（集中），抽取样本估计总体的误差平均来讲就越大（小）。影响抽样标准误的主要因素有 : 总体内在差异；样本容量；抽样方式、方法；估计量。抽样极限误差是指以样本估计总体所允许的最大误差范围，也即在一次抽样估计时，抽样估计量所允许的最高值或者最低值与总体指标之间的绝对离差。抽样极限误差取决于两个因素：抽样标准误和置信水平（抽样估计概率保证程度）2. 非抽样误差：是有随机抽样的的偶然性因素以外的原因引起的误差。非抽样误差主要有三类：抽样框误差、无回答误差、计量误差。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - -

9、 - - - - - - - - 名师精心整理 - - - - - - - 第 4 页，共 10 页 - - - - - - - - - 抽样框误差是目标总体（研究对象的全体）与抽样总体之间的不一致导致的误差。无回答误差是指由于种种原因没有能够对被抽出的样本单元进行计量，从而没有获得有关这些单元的数据导致的误差。降低无回答的措施有：改进调查的组织，加强对调查员的培训；多次访问；替换样本单元；对敏感性问题的调查采取随机化回答技术。随机化回答技术模型有两个：沃纳随机化回答模型（Warner）和西蒙斯随机化回答模型（ Simmons ）。计量误差是指调查中所获得的数据与欲调查指标的真值之间

10、不一致而造成的误差，也成为回答误差。误差产生的原因可以分为由设计引起的误差、由调查员引起的误差、由被调查者引起的误差及由其它原因引起的误差等。3.置信区间与误差限置信区间是由样本对某总体参数所做的区间估计，该区间以一定的置信度(概率)包含该参数的真值。误差限：即是在某种概率意义下的最大绝对误差或相对误差。分为绝对误差限 d 和相对误差限 r，r=d/ ，其中为某个待估的参数。4. 费用与效率调查的费用是一个与样本量有关的函数，最简单是的线性费用函数，增大样本量可以提高估计量的精度，但与此同时调查的费用也增加了。效率是指以最小的费用达到要求的精度或在给定费用的情况下达到最大的精度。名师资料

11、总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页，共 10 页 - - - - - - - - - （五）样本设计样本设计：是指对抽样方式、方法和估计量选择所作的系统考虑，即对入样单位的产生方式和途径、样本容量的大小和对总体作出怎样的估计等问题所作的设计。（六）抽样调查的具体实施步骤确定调查目标；选择抽样框；抽样设计；问卷设计；数据收集；数据编码和录入；审核与插补；参数估计；数据分析和调查结果的表述；数据发布。二、简单随机抽样1. 简单随机抽样，也称单纯随机抽样，从N个单元中逐个不

12、放回（放回）地抽取 n 个单元作为样本。主要有四种情形：放回有序、放回无序、不放回有序、不放回无序。2. 分类：不放回简单随机抽样和放回简单随机抽样。3. 实施办法：抽签法、使用统计软件直接抽取法和随机数法。产生随机数的几种方法：使用计算器；使用计算机；使用随机数表；使用随机数骰子；使用电子随机数抽样器。4. 优缺点：简单随机抽样在抽样理论中占有重要地位，它是其他抽样方法的基础，其理论也最成熟。其局限性体现在：简单随机抽样需要一个完整的抽样框，当N很大时，这是不具备的；简单随机抽样抽得的样本很分散，调查样本单元会遇到很多困难。名师资料总结 - - -精品资料欢迎下载 - - - - - -

13、- - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页，共 10 页 - - - - - - - - - 三、分层抽样1. 分层抽样：将总体分成互不重叠且穷尽的若干个子总体（层），每个单元属于且仅属于一个子总体，抽样在每一层中独立进行，总的样本由层样本组成，根据各层样本汇总对总体参数做出估计。2. 分层抽样的优点：由于分层抽样是在各层中进行的，因此各层样本除了汇总后可用于总体参数估计，还可用来对层的参数进行估计；分层抽样便于组织，实施灵活方便，由于各层的抽样独立进行，允许根据不同层的具体情况采用不同的抽样方法；与简单随机抽样相比，分层抽样的样本

14、在总体中的分布更为均匀；分层抽样能较大的提高调查的精度，由于层间方差不进入估计量的方差，层与层之间的差异无关，因此事先将性质类似的单元归成一类（层），使层内的方差尽可能的小，层间的方差尽可能的大，可以大大减少估计量的方差，从而提高抽样的精度。3. 适用场合：层内差异小，层间差异大。4. 分层抽样的精度最优分配、比例分配的分层随机抽样与相同样本量的简单随机抽样的精度之间的关系： VoptVpropVsrs（下标srs代表简单随机抽样，prop代表比例分配的分层抽样，opt 代表奈曼最优分配的分层抽样）。结论：当各层均值之间的差异越大，则一般的分层（以比例分配为代表）的效益就越高；当各层的标准差

15、相差较大时，最优分配又会比比例分配具有更高的效益；当各层的标准差之间相差不大时，最优分配的效果不会比比例分配的效果好很多。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页，共 10 页 - - - - - - - - - 四、不等概率抽样1.特点：将总体中每个单元的入样概率与其“规模”大小联系起来，使得大单元被抽到的概率大，小单元被抽到的概率小。2. 主要用于以下两种情况：需要估计总体总量但总体单元规模相差很大的情况；由于种种原因不能直接对基本的较小的单元抽样的情形。3. 优

16、点：可以大大提高估计的精度，减少抽样误差。局限性：是对总体中的每一个单元，都要已知一个辅助变量用以确定其入样概率或两个单元同时入样的概率。4. 分类：按照抽样过程被抽到的单元是否被放回总体中去分为放回不等概率抽样和不放回不等概率抽样。五、整群抽样1. 整群抽样：指在总体中按照一定的方式抽取若干个初级单元，调查每个被抽中的初级单元所包含的全部次级单元，也称集团抽样。2. 整群抽样的优点：一是可以不需要完整的抽样框；二是由于样本相对集中，可以减少调查时间和费用；三是抽取样本的效率比简单随机抽样高。3. 整群抽样的方差取决于群间方差，群间方差越小，则估计量的方差越小，精度越高。在总体方差固定

17、的条件下，整群抽样的精度取决于群内相关系数，群内相关系数越小，即群内差异或群内方差越大，则估计量的精度越高。4. 整群抽样的精度与群的性质有很大的关系。多数情形，由于每个群名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页，共 10 页 - - - - - - - - - 内的小单元多少有点相似，因此如果抽取同样数量的小单元，整群抽样的抽样误差要比直接用简单随机抽样抽小单元的抽样误差大，但由于整群抽样的费用省，完全可以兼顾两方面，即用较多的小单元而同时做到误差小且费用也省。少数

18、情形，由于群的特殊结构，群内单元的差异很大，此时便抽取同样数量的小单元，其精度要比简单随机抽样高。采用整群抽样时，当群的大小接近时，常采用简单随机抽样抽取群；当群的大小相差比较大时，为提高效率则更多地采取不等概率抽样（按与群的大小成比例的概率抽样）方法。六、系统抽样1. 系统抽样：也称机械抽样，是将总体中的单元按某种顺序排列，在规定的范围内随机抽取起始单元，然后按一定规则确定其他样本单元的一种抽样方法。总体单元的排列可以是一维的（直线或者圆形），也可以是二维的（平面）；起始单元可以使一个，也可以是一组；对总体单元的抽取可以是等概率的，也可以是不等概率的。最简单的系统抽样是等距抽样，当

19、总体中的 N个单元按照直线排列时，根据样本量 n 确定最接近 N/n 的一个整数 k，在 1-k 范围内随机抽取一个整数 r，以单元 r 作为起始单元，以后每隔 k 抽取一个单元作为样本单元。k 为抽样间距，是一种等概率抽样。2. 系统抽样的精度 : 与总体单元的排列密切相关，如果单元的指标值与排列顺序无关（无关标识排列），系统抽样估计量的精度与简单随机抽名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页，共 10 页 - - - - - - - - - 样相仿；如果单元的指标

20、值与排列顺序相关（有关标识排列），系统抽样的精度比简单随机抽样高。3. 系统抽样的优点：系统抽样简便易行，只需随机确定一个（或少数几个）起始单元，整个样本就可以确定；系统抽样对抽样框的要求比较简单；系统抽样实施简单，容易被不熟悉抽样的非专业人士所掌握。4. 系统抽样的局限性：对于一般的直线等距抽样，当Nnk 是，样本平均数作为总体均值的估计不是无偏的；系统抽样的方差估计较为复杂，不可能找到设计意义下的无偏估计量；实际上行之有效的系统抽样不是严格的概率抽样，给抽样误差的估计带来很大困难。七、多阶段抽样1.多阶段抽样：设总体由 N个初级单元组成，每个初级单元又由若干个二级单元组成，若在总体中

21、按照一定方法抽取m个初级单元，对每个被抽中的初级单元再抽取若干二级单元进行调查，则这种抽样成为二阶抽样，或二级抽样。如果每个二级单元又由更小的三级单元组成，在二阶抽样后，若对每个被抽中的二级单元的三级单元再进行抽样，则是三阶抽样；如果对每个被抽中的二级单元不再抽样，调查其中每个三级单元，则称为二阶整群抽样。以此类推，可定义多阶抽样或多阶整群抽样。2. 多阶抽样的优点：组织实施方便；节省人力、物力、财力；构造抽样框相对容易；某些条件可以满足各级需要；可用于散料（连续松散、不易区分个体的材料）的抽样。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页，共 10 页 - - - - - - - - -

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

4.3 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 2022年抽样调查理论与方法基本概念 2022 抽样调查理论方法基本概念

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：2022年抽样调查理论与方法基本概念 .pdf
链接地址：https://www.taowenge.com/p-33372398.html