《第六章 抽样精选文档.ppt》由会员分享,可在线阅读,更多相关《第六章 抽样精选文档.ppt(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 抽样本讲稿第一页,共二十二页1 抽样的概念和类型一、抽样概念1.总体population:调查研究的全部事物,是构成它的所有元素的集合。2.样本sample:从总体中按一定方式抽取出来的一部分元素的集合,是总体的一个子集。本讲稿第二页,共二十二页3.抽样sampling:从总体中按一定方式抽取样本的过程。4.抽样单位sampling unit:一次直接的抽样所使用的基本单位。5.抽样框sampling frame:指一次直接抽样时总体所有抽样单位的名单。6.参数值总体值parameter:总体中某一变量的综合描述。7.统计值样本值statistic:样本中某一变量的综合描述。本讲稿第三
2、页,共二十二页二、抽样的作用抽样是人们由部分认识总体的关键环节。随机抽取能够保证样本的代表性;抽样误差可以控制;样本规模可以计算;本讲稿第四页,共二十二页三、抽样的类型抽样概率抽样非概率抽样简单随机抽样系统抽样分层抽样整群抽样多段抽样偶遇抽样判断抽样滚雪球抽样配额抽样本讲稿第五页,共二十二页2 非概率抽样方法非概率抽样:依据研究者的主观意愿、判断或是否方便等因素来抽取对象的方法。一、偶遇抽样 accidental sampling/方便抽样eg:公共场所进行的调查、记者街头的访问等。二、判断抽样judgemental/立意抽样选择特别能提供信息的独特个案。选取很难接近、特殊总体中的成员。研究总
3、体的规模较小、涉及的范围较窄。本讲稿第六页,共二十二页三、定额抽样quota/配额抽样依据某些因素对总体分层,并找出具有各种不同特征的成员在总体中所占的比例,并根据各类成员的比例去选择对象,使样本成员在各种特征上的构成尽可能接近总体。四、雪球抽样snowball开始于一个或少数人或个案,然后根据与初始个案的联结而扩展开来。eg:退休老人的闲暇生活。青少年之间的友谊关系网络 本讲稿第七页,共二十二页3 概率抽样的原理与程序一、概率抽样的原理随机抽取:即保证总体中每一个个体都有相等的机会入选样本。1、随机现象:随机现象:偶然性、不确定性/频率的稳定性。本讲稿第八页,共二十二页2、概率概率:在相同条
4、件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为随机事件A的频率(frequency);当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值 p,那么就把p称为随机事件A的概率。3、抽样分布:抽样分布:根据概率原则而成立的理性分布。4、中心极限定理中心极限定理:当n足够大时,无论总体的分布如何,其样本平均数所构成的分布都趋于正态分布。单峰、对称的悬钟形曲线,对称轴为x=;正态分布的平均数、众数和平均数相同。本讲稿第九页,共二十二页二、抽样的一般程序1.界定总体:eg:大学生价值取向的研究 2.制定抽样框:eg:兰登与罗斯福总统命运 3.决定抽样方案:抽样类型、样
5、本规模。4.实际抽取样本 先抽好样本再调查;边抽部分样本边调查。5.评估样本质量对比样本与总体某些指标的吻合程度。本讲稿第十页,共二十二页4 概率抽样方法一、简单随机抽样simple random sampling(一)从含有N个元素的总体中直接随机抽取n个元素组成样本。(二)方法 总体元素较少时:抽签法。总体元素较多时:随机数表法。本讲稿第十一页,共二十二页二、系统抽样/等距/机械抽样(一)含义(一)含义:把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码组成样本的方法。P131(二)具体步骤(二)具体步骤:1.将总体的所有个体按顺序编号;2.计算抽样间距K;N
6、 N(总体规模)n n(样本规模)K=K=本讲稿第十二页,共二十二页3.在头K个个体中随机确定起点(A)e.g.e.g.如果如果K=10K=10,就从,就从01-1001-10号中抽签决定号中抽签决定一个号码作为起点,假定为一个号码作为起点,假定为05054.从A开始,每隔K个个体抽取一个个体,组成样本:A,A+K,A+2K.,A+(n-1)K 05,15,25,.,95本讲稿第十三页,共二十二页001011021031091002012022032092003013023033093004014024034094005015025035095006016026.096007017027097
7、008018028098009019029099010020030100本讲稿第十四页,共二十二页(一)含义:先将总体中所有单位按某种特征或标志划分为若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的方法抽取一个子样本,将其合成样本。P133分类分类随机随机抽样抽样总体样本三、分层抽样/类型抽样子群本讲稿第十五页,共二十二页1.目的不同:定额抽样要保证样本与总体在结构比例表面上一致;分层抽样则包括比例分层和非比例分层。2.方法不同:定额抽样中各层样本是非随机抽取的;而分层抽样中各层样本是随机抽取的。(二)与定额抽样的区别本讲稿第十六页,共二十二页四、整群抽样cluster s
8、ampling(一)含义(一)含义:将总体按某种标准划分为一些子群体,每个子群为一个抽样单位,用随机方法从中抽若干子群,将抽出的子群中的所有个体结合起来构成样本。P137划分划分子群子群随机随机抽样抽样本讲稿第十七页,共二十二页1.优点:(1)简化抽样过程,降低费用(2)可扩大抽样规模(3)更容易取得抽样框2.缺点:样本分布面不广,代表性较差,尤其是当子群间异质性较强时,影响代表性更明显。3、与分层抽样的比较:(1)抽样的方式不同(2)划分子群的原则不同(二)整群抽样的特点本讲稿第十八页,共二十二页五、多级抽样multistage sampling(一)含义:按抽样元素的隶属关系或层次关系,把
9、抽样分为几个阶段进行。e.g.大学院系班级学生(二)特点:1.优点:不需要总体全部名单;节约人力物力。2.缺点:每级抽样都会有误差,误差较大。本讲稿第十九页,共二十二页一、样本规模又称为样本容量,它指的是样本中所含个案的多少。大样本:大于30个个案小样本:小于30个个案 实际研究过程中,习惯以100为界,把样本分为大样本和小样本。5 样本规模与抽样误差本讲稿第二十页,共二十二页二、影响样本规模的因素 1.总体规模。2.抽样的可靠性与精确性。置信度、置信区间置信度、置信区间3.总体的异质性程度。4.研究者所拥有的经费、人力和时间。三、确定样本规模的经验标准小型调查类,样本规模在100-300之间中型调查类,样本规模在300-1000之间大型调查类,样本规模在1000-3000之间。本讲稿第二十一页,共二十二页本章重点抽样的一般程序系统抽样的操作方法 分层抽样的操作方法分层抽样与整群抽样的区别与联系分层抽样与配额抽样的区别与联系本讲稿第二十二页,共二十二页
限制150内