第5章抽样调查类型 教学课件农村社会经济调查方法.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第5章抽样调查类型 教学课件农村社会经济调查方法.pptx》由会员分享,可在线阅读,更多相关《第5章抽样调查类型 教学课件农村社会经济调查方法.pptx(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第5 章 抽样调查类型 教学课件农村社会经济调查方法第5章 抽样调查类型第一节 抽样调查中的关键概念第二节 抽样的一般程序第三节 随机抽样的方法第四节 非随机抽样的方法思考练习抽样调查是从调查对象的总体中抽取一部分单位组成样本,将样本作为调查对象开展调查活动,并根据样本调查的结果来推断总体特征的方法类型。抽样调查属于非全面调查,是随着近代数学和计算机技术的发展而形成的一种方法类型。第一节 抽样调查中的关键概念一、随机抽样和非随机抽样根据抽样是否遵循随机原则,抽样调查可以分为随机抽样和非随机抽样两类。也有学者认为,抽样可以分为概率抽样和非概率抽样两类。我们的理解是,这两种分类方法本质上无大的差别
2、。随机抽样一般是概率抽样,遵循随机原则抽取的每一个样本单位,都是可以计算概率的;非随机抽样一般是非概率抽样,不遵循随机原则意味着抽取的每一个样本单位都是无法明确计算概率的;普遍调查、典型调查、重点调查、个别调查等本身不应用抽样方法,所以也是非概率抽样的。(一)随机抽样的概念和特点1.概念随机抽样,是遵循随机原则,按照某种事先设计的程序,从总体中抽取部分单位的抽样方法。概率抽样又可分为等概率抽样和不等概率抽样两种类型。概率抽样是指总体中的每个单位都有一定的非零概率被抽中,且每个单位被抽中的概率是已知的,或是可以计算出来的。如果每个被抽中单位的概率相等,那么这样的抽样被称为等概率抽样;如果每个被抽
3、中单位的概率不相等,那么这样的抽样被称为不等概率抽样。2.特点调查对象是总体单位中的一部分,而不是全部,但也不是个别或少数几个单位;样本单位是按随机原则抽取的,而不是按照调查者的主观意愿进行选择或确定的;抽样调研的目的不仅仅是了解样本本身的情况,而是要通过样本来推断总体、说明总体。(二)非随机抽样的概念和特点1.概念非随机抽样,是指抽样时并不遵循随机原则,而是依据研究者的主观意愿、判断、或方便与否来抽取调查对象的方法。2.特点优点:简单、快捷、经济,不需要样本框,就可以收集数据,应用空间还是比较大的。局限:难以保证样本的代表性,不能计算抽样误差,且容易产生较大的系统性误差,因此,常常被用在研究
4、的初期阶段或者探索性研究上。如果样本不够大,就不能用样本数据对总体情况进行推断。如果样本足够大,那么非随机抽样数据也可以被用来推断总体。二、目标总体和抽样总体总体,是指所要调查研究对象的全体。在实际的调查研究工作中,又可以分为目标总体和抽样总体两个概念。目标总体,是指所要研究的对象的全体,是由所有性质相同的个体所组成的。组成总体的每个个体被称作总体单位。例如,我们要调查研究某县农户农业生产经营的情况,那么目标总体是该县所有的农户。在一项调查中,要对目标总体的范围做出具体规定。抽样总体,是指从中抽取样本的总体。通常情况下,抽样总体与目标总体应该是一致的,但是在实践中可能出现两者不一致的情况。例如
5、,目标总体是某县所有农户,但是,一些早已农转非的家庭,因为没有及时更改住户信息,而仍保留在目标总体中,这实际上造成了抽样总体与目标总体的不同。还有农村家庭的分家、搬迁等行为造成农户的增加或减少等情况,如果没能及时更新信息,那么也会造成目标总体与抽样总体存在差异。因此,理想的状态是:抽样总体由目标总体所决定,但在实践中,可以构造的抽样总体却有可能反过来决定调查中的目标总体。三、总体参数和统计量(一)总体参数的概念和类型表达在统计学中,总体的特征被称为参数,也可以说,参数是总体的某个特征值,是总体的某个特征的数量表现。只要确定了总体的范围,那么总体参数就客观存在了。总体参数值是数据的理论值,是唯一
6、确定的,但是是未知的,需要通过抽样调查的结果来对总体参数进行推断。假定总体有N个基本单位,Y1,Y2,YN为基本单位的数值,Yi表示总体的第i个单位的数值。可以计算的总体参数为:(二)统计量的概念和类型表达假定从总体中抽取的样本中包含n个样本单位,即样本规模为n。y1,y2,yn分别代表样本单位的观察值,yi表示样本中第i个样本单位的观察值。统计量,也叫估计量,是根据样本中n个单位的变量值计算出的一个量,用于对总体参数的估计。总体参数的表示通常为大写字母,估计量的表示通常为小写字母。在简单随机抽样下,与总体参数相对应的常用估计量分别为统计量(估计量)是样本的函数,是随机变量,其结果取决于抽样设
7、计和被选入样本的总体基本单位的特定组合。在同一个总体中抽取若干个样本,即使每个样本的规模相同,样本统计量的结果也会不同。当然,统计量的真正价值并不在于自身结果的数值大小,而在于提供有关总体参数的信息。四、抽样框和样本规模抽样总体,也称作抽样框,是抽样的范围。具体来看,样本框可以是一份包含所有抽样单位的名单,给每一个抽样单位编上一个号码,就可以按一定的随机化程序进行抽样。抽样框可以是按照名录排列的名录框,可以是按照地域排列的地域框,当然也可以是将名录和地域结合起来的样本框。例如,我们在一个村庄进行农户抽样时,抽样框可以是全村的农户名单,可以是农户住宅的地理位置信息,也可以是农户名单与地理位置信息
8、的结合。从抽样框中抽取样本的过程,被称作抽样。抽取的样本是由从总体中随机抽选出来进行调查的一部分单位组成的,是抽取的若干单位的集合。当从抽样框中抽取样本后,样本中的每一个单位就被称为样本单位。样本单位可以是一个农户、一位农民、一个乡镇企业,或一个学校等。例如,从某乡5 000个农户中抽取100个农户进行农户负担状况调查。在这里,5 000个农户的综合体即是“总体”,抽取出的100个农户为“样本”,其中,被抽中的每一个农户即为一个“样本单位”。总体单位数通常用N表示,样本单位数通常用n表示。从统计学上讲,样本只能代表样本框中的总体,而不能代表样本框之外的单位。因此,在使用抽样调查方法时,如何使抽
9、样框与所要描述的总体保持一致就是关键的问题。例如,当我们利用电话调查方法来调查家庭对于维护良好生态环境的支付意愿的时候,没有电话的家庭就已经被我们排除在抽样框外了,于是出现了抽样框里的总体与目标总体不一致的情况。因此确定抽样框时,必须保证抽样框的全面性,即具有某种特征的单位要全部包括在抽样框中,并且使每个单位具有非零的被抽取的概率。如果我们对某些单位进行排除,那么我们必须对哪些单位被排除,以及被排除单位的特别情况,做一个明确的交代。当然,如果我们把所有单位全部归入抽样框也是可以的,但这样做可能会增加工作量。抽样调查主要包括调查准备、抽样选取调查对象(利用各种抽样方法和技术抽取样本单位)、进行调
10、查(利用各种调查方法,包括实地观察法、问卷调查法、访谈调查法等收集资料)、总结整理分析资料、最后形成调查研究报告等几个主要的阶段。其中,抽样环节直接决定了调查研究的可行性和调查数据的质量。为了保证抽样的质量,按照科学、有序的程序完成抽样过程是非常必要和重要的。第二节 抽样的一般程序一、界定目标总体和抽样总体目标总体是我们在调研方案设计时的理想调查对象的范围,但是现实情况往往与理想状态不符,为了使调研方案中的调查工作能够操作和落实下去,调研人员必须进一步明确抽样总体。二、确定和编制样本框抽样框是具有操作意义的调查对象的集合,也就是调查总体中能够被找到的调查对象的名单。没有抽样框,就没有办法进行实
11、际的抽样。当抽样分成几个阶段、在不同的抽样层次上进行时,则需要分别编制几个不同的抽样框。抽样框是计算样本单位入样概率的依据。抽样框的质量决定了样本的质量。一个样本只能代表一个抽样框。例如,2008年受国际金融危机的影响,大量农民工返乡,政府采取了鼓励返乡农民工创业的政策。如果我们要采用抽样调查方法研究返乡农民工创业意愿或实际创业情况等,那么我们就必须到农民工返乡比较聚集的农村地区进行调查,因为只有这样我们才能找到返乡农民工,可以确定抽样框是所有农民工中的返乡农民工,而排除了没有返乡的那一部分农民工。当然返乡农民工名单可以通过县、乡、村三级对农民工返乡情况的及时统计获取。一般而言,抽样框的确定有
12、两条路径:一是利用现有的相对完整的农户、农民、企业、村庄、乡镇等的名单进行确定。例如,我们打算在某县进行农户流转农地的意愿和行为的抽样调查。假设该县有10个乡镇,每个乡镇有10个村,每个村200个农户。如果我们要随机抽选400个农户进行调查,那么我们如何确定抽样框呢?在这里我们根据随机抽样方法的不同,可以确定不同的抽样框。如果我们采用直接简单随机抽样的方法抽取400个农户进行调查,那么抽样框为全县20 000个农户的名单。这份名单可以按照全县农户的姓氏笔画排列,也可以按照拼音排列,也可以不做任何排列,直接体现为一份大名单。如果我们采用多阶段抽样的方法抽取400个农户,那么可以先抽取乡镇,再抽取
13、村庄,最后从村庄里抽取农户。不管是采取简单随机抽样,还是采取分层抽样等方法,可以确定的抽样框都是10个乡镇,从该框里抽取的样本单位是乡镇。假如我们采取分层抽取的方法抽取了经济发展水平处于高、中、低3个层次的3个乡镇。接下来,我们要从这3个乡镇的30个村里随机抽取要前往调查的村庄,那么这里的30个村即为二级样本框,从该样本框中抽取的样本单位为村。假定我们利用分层抽样的方法从30个村里随机抽选了5个村。最后,我们要从这5个村里随机抽选400个农户作为最终的调查对象。选取的不同方法决定了在这一阶段的样本框也是不同的。如果我们要在5个村里各选80个农户做调查,那么每个村的200个农户分别是这一阶段的抽
14、样框。另外,如果我们不是在各村做均等数量的农户调查,那么我们可以将5个村共1 000个农户的名单作为一个抽样框,从中抽取400个农户。多阶段抽样的这个过程说明抽样框的确定也是多阶段的、多层次的,每一阶段的抽样框不同,样本单位也不一样。二是抽样框是由在某处开展或参与某项活动的人组成。例如,我们从参加某个农业经济专题会议的专家学者中随意选择出参加会议的某些调查对象进行调查访问。假设抽样之前没有这些参加会议的人员的名单,因此,这些调查对象的选择和抽样框的确定是同步的。最终可以确定,参加会议的人员名单即为抽样框。三、设计抽样方案具体的抽样方法有多种,不同的抽样方法有不同的特点和使用范围,在进行社会经济
15、调查研究时,应该根据不同的研究目的,选择恰当的抽样方法,并综合考虑各种影响抽样进程和效果的可能,做好预案,以保证抽样过程的顺利进行和抽样结果的合意。在抽样方案设计中,要考虑的一个关键点是确定抽样类型和抽样方法。如果确定采用的是随机抽样这一类型,那么意味着我们选择了概率抽样的方法,需要进一步确定是采取等概率抽样的方法还是不等概率抽样的方法。如果确定采用的是非随机抽样这一类型,那么意味着我们选择了非概率抽样的方法。概率抽样的特征是遵循随机原则,样本单位的入样概率是已知的,从而达到了对总体数量特征进行描述及统计推断的目的。概率抽样的关键之一是调查者事先知道样本单位进入样本的概率,其目的是计算“权数”
16、,权数又被称为“扩张因子”,其计算方法是“入样概率的倒数”,其作用在于将样本调查结果放大,从而达到推断总体的目的。概率抽样又可以分为等概率抽样和不等概率抽样。例如,简单随机抽样就是等概率抽样的方法,每一个单位都有同等的被抽中的概率;分层抽样中同一层内的抽样是等概率抽样,但是不同层的抽样可能是不等概率抽样。不等概率抽样的特征是不完全遵循随机原则,而是遵循方便原则或者目标原则,使样本单位的选取非常方便,并且可以更好地提高估计精度,减少抽样误差。但是它的使用必须具有一定的条件,一般是通过辅助变量(单位规模、地区远近)的设置,来确定每个样本单位的入样概率,以使大的或重要的单位入样的概率大,而小的或不重
17、要的单位入样的概率小。四、落实抽样方案落实抽样方案就是完成样本抽取的工作。在实际抽取样本的过程中,可能会遇到各种困难以及非预期的情况,特别是涉及复杂抽样方法应用的时候,可能需要一边调查一边抽样。作为调研人员,在实际抽样阶段要有耐心、信心和决心,同时还要把握四个基本原则。一是高效率,即精度和费用的关系合理。效率高就是尽可能少用经费而取得尽可能高的精度。高效率有两种情况:在规定的费用之内达到尽可能高的精确度;以尽可能少的费用达到规定的精确度。二是目的性,即一个样本选择的好坏,不能仅从样本本身来看。抽样本身不是目的,而是手段,是工具,样本选择的好坏还要从样本能否很好地为调查服务这一方面来看。三是可度
18、量性,即指从样本能算出抽样误差,拿样本来推断总体。这是样本设计最基本的问题。四是可行性,即必须考虑调查在实地实施时能否完成。五、评估样本质量抽出样本工作的完成并不意味着抽样过程的结束。调研人员还需对样本的质量、代表性、偏差等进行初步的检验和衡量,称为样本评估。其目的是避免样本与总体之间出现过大的偏差,从而导致推断结果出现失误甚至是错误。基本做法是,根据调研人员对抽样总体特征信息的了解,选择一个或多个特征指标,与样本中的同类指标进行对比,如果二者相差不大,则样本的质量可能比较高,代表性比较强;相反,如果二者相差比较大,则样本的质量可能比较差,代表性也不太强。风笑天.社会学研究方法.北京:中国人民
19、大学出版社,2009:125-127.例如,我们以一个有2 000位村民的行政村中的200位村民作为样本。我们从行政村的人口统计报表中得知,该村村民中男性占比为62%,女性占比为38%。如果我们对抽取的200位村民的性别统计发现,男性占比为60%,女性占比为40%,那么与已知的性别比例相比较,可以认为,我们所抽取的样本在一定程度上具有较好的质量和较强的代表性。如果我们不仅比较性别特征指标,而且加入年龄特征指标进行比较,那么对样本质量的评估就更有效。第三节 随机抽样的方法一、简单随机抽样简单随机抽样(simple random simpling),又称为纯随机抽样,是对总体单位不进行任何处理,仅
20、按随机原则直接从总体(抽样框)中抽取样本的方法。调查总体中的任何单位都有同样的被抽取的机会,即总体中每一个单位的入样概率是一样的。(一)简单随机抽样的具体方法1.直接抽选法直接抽选法就是直接从调查总体中随机抽取样本单位的方法。俗话说,“闭着眼睛摸一个”,就是这种方法的生动展现。例如,我们打算调查食品标签标识是否规范,就可以直接从货架、摊位上抽取商品。2.抽签法抽签法就是先将总体的每个单位编上序号,将号码写在纸片上捏成团,做成签,掺和均匀后,再从中随机抽选,一直到抽满预先设计的样本量为止。3.随机数表法随机数表法,也称作乱数表抽样法。随机数表是统计工作者用计算机生成的随机数组成,并保证表中每个位
21、置上出现哪一个数字是等概率的,利用随机数表抽取样本保证了每个个体被抽取的概率是相等已知的,或可计算的。具体做法是:首先把调查总体中的所有单位加以编号,根据编号的最大位数确定使用随机数表中若干列或行数字的栏数,以组成需要的抽样数字;然后以任意组成的行或列的任意一个数字开始,向任何方向数过去;碰上属于总体单位编号范围内的数字号码,就摘录下来,作为样本单位。如果不属于总体单位编号范围内的数字号码,就越过去;如果是不重复抽样,那么碰到重复的数字就跳过去。抽样一直持续到抽足预定的样本数量为止。例1:从50个总体单位中抽取5个样本。抽样步骤:第一步,将总体单位按0150编号,编号最大的数50是一个两位数,
22、故取两位数为抽取单位;第二步,在随机数表中任意取定两列,然后从任一数字开始,由上而下,或由左至右,抽取50范围内的数字作为样本。这里随机选取数字表中的第5、6列,然后以07为起点,由上而下,抽取的样本为07、38、40、28、50;或者由左至右,抽取的样本为07,45,44,17,16。例2:从1 000个总体单位中抽取50个样本。抽样步骤:第一步,将总体单位按00011000编号,编号最大的数1000是一个四位数,故取四位数为抽取单位;当然,总体单位也可以按000999的顺序变化。第二步,在随机数表中任意取定四列,然后从任一数字开始,由上而下,或由左至右,抽取1 000范围内的数字作为样本。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第5章 抽样调查类型 教学课件农村社会经济调查方法 抽样调查 类型 教学 课件 农村 社会经济 调查 方法
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内