第七章抽样设计精选文档.ppt
《第七章抽样设计精选文档.ppt》由会员分享,可在线阅读,更多相关《第七章抽样设计精选文档.ppt(95页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章抽样设计本讲稿第一页,共九十五页第一节第一节 抽样调查概述抽样调查概述本讲稿第二页,共九十五页一、抽样调查的含义 抽样调查是按照一定的程序,从所研究对象的全体中抽取一部分单位进行调查,并在一定条件下对研究对象的数量特征进行估计和推断。抽样调查包括随机抽样调查和非随机抽样调查两种。本讲稿第三页,共九十五页随机抽样调查具有如下特点:随机抽样调查具有如下特点:第一,第一,抽样推断是建立在随机取抽样推断是建立在随机取样的基础上。样的基础上。第二,第二,抽样推断是由部分推算总体抽样推断是由部分推算总体的一种方法。的一种方法。本讲稿第四页,共九十五页第三,第三,抽样推断以概率论中的大数抽样推断以概率
2、论中的大数法则和中心极限定理为理论依据。法则和中心极限定理为理论依据。第四,抽样推断可以事先计算和控第四,抽样推断可以事先计算和控制抽样误差。制抽样误差。本讲稿第五页,共九十五页二、抽样调查的作用二、抽样调查的作用抽样调查是市场调查中应用非常广泛抽样调查是市场调查中应用非常广泛的一种调查方式。它主要在以下场合的一种调查方式。它主要在以下场合应用:应用:1.1.在不可能进行市场全面调查的时候,在不可能进行市场全面调查的时候,应用抽样调查可以取得市场总体全面应用抽样调查可以取得市场总体全面的数据。的数据。本讲稿第六页,共九十五页2.有些现象虽然可以进行全面调查,但实际做起来有困难,这时也可以采用抽
3、样调查取得总体的全面数据。这时也可以采用抽样调查取得总体的全面数据。3.为了节省调查的人力、费用和时间,可以采用抽样调查代替全面调查。本讲稿第七页,共九十五页三、抽样调查的基本概念 1.1.总体和样本总体和样本 2.2.参数、估计量和估计值参数、估计量和估计值 3.3.入样概率与抽样比入样概率与抽样比 4.4.抽样分布抽样分布 5.5.抽样方差和抽样标准误抽样方差和抽样标准误 6.6.精确性和精度精确性和精度 7.7.抽样效率与设计效果抽样效率与设计效果 本讲稿第八页,共九十五页(一)总体和样本总体和样本:总体是指研究对象的全体,它是由研总体是指研究对象的全体,它是由研究对象中的单元组成的。总
4、体中包含单元究对象中的单元组成的。总体中包含单元的数目称作总体容量(或大小);样本是的数目称作总体容量(或大小);样本是指抽样时按照抽样的规则所抽中的那部分指抽样时按照抽样的规则所抽中的那部分单元所组成的集合。单元所组成的集合。总体样本抽取样本推断总体本讲稿第九页,共九十五页(二)参数、估计量和估计值(二)参数、估计量和估计值 反映总体特征的指标通常称为参数,如总体平均数、总体总量和总体比例等。估计量是样本观察值的函数,用它来对总体参数进行估计。根据估计量从具体样本得到的结果称作估计值。(三)入样概率与抽样比(三)入样概率与抽样比 入样概率是指某个总体单元被选入样本的概率;抽样比是指样本量 n
5、 与总体的容量N的比例,通常用f表示。即本讲稿第十页,共九十五页 (四)抽样分布抽样分布 是指估计量的分布。也就是说,如果按照一定的样本容量和一定的抽样方式反复抽取样本,每个样本可以计算一个估计值,这些估计值形成的分布,就是抽样分布。(五)抽样方差和抽样标准误五)抽样方差和抽样标准误 也就是估计量的方差和标准差。它表示某个抽样方案,抽样结果的离差大小,方差和标准差愈小,表明估计值接近参数。本讲稿第十一页,共九十五页(六六)精确性和精度精确性和精度 精确性是指在抽样中反复抽样,其结果的差别大小。差别越小,其精确性越高。因此同样也可以用抽样方差来表示精确性。精度则是一个相对的指标,它是抽样方差或标
6、准差与相应的待估参数之比。相对方差 相对标准误 本讲稿第十二页,共九十五页(七)抽样效率与设计效果抽样效率与设计效果 在样本容量相同的情况下,抽样方差越小表明抽样效率越高。设计效果是设计方案的方差与简单随机抽样的方差之比。设计效果通常用英文字母Deff表示:Deff=本讲稿第十三页,共九十五页四、抽样的一般程序 确定调查目的和总体范围 制定合适的抽样框 抽选样本容量抽取样本参数估计和检验 最终评估 确定抽样方法本讲稿第十四页,共九十五页抽样设计程序 1、定义目标总体-用统计的术语来讲,研究的总体是指我们要测量的个体的总和。-定义一个明确的总体包含的内容-构成分析的单位是什么?(比如家庭)-抽样
7、的单位是什么?-什么东西指定包括在内?-时限怎么样,即要获取的信息属于哪一段时间?-空间限制如何,是哪些地区,是否限于城市或城市的繁华街区?2、建立抽样框 抽样框是指为抽样所使用的所有调查单位的名单或清册。本讲稿第十五页,共九十五页示例抽样框:街道居委名录街道居委名录 企业名录企业名录 电话本电话本选民花名册选民花名册俱乐部名录俱乐部名录VIP名录名录本讲稿第十六页,共九十五页3、确定样本容量影响样本规模的因素可分为两个方面 与满足数据的可靠性要求有关的因素(如调查经费、时间限制、人力资源与实际操作上的限制有关的因素(如总体变异、调查精度、总体规模、抽样方式、回答率)4、明确抽样方法 5、抽选
8、样本 是指按指定方法抽取受访者是指在某一特定地区或任何地区,按照一系列标准直接指定受访者的抽样方法。本讲稿第十七页,共九十五页第二节第二节 抽样基本方法抽样基本方法本讲稿第十八页,共九十五页概率抽概率抽概率抽概率抽样样样样l简单随机抽样简单随机抽样 l等距等距抽样抽样l分层抽样分层抽样 l整群抽样整群抽样l多阶段抽样多阶段抽样非概率抽非概率抽非概率抽非概率抽样样样样l方便抽样方便抽样 l判断抽样判断抽样l配额抽样配额抽样 l滚雪球抽样滚雪球抽样抽样调查的基本方法抽样调查的基本方法本讲稿第十九页,共九十五页概率抽样是根据一个已知概率来选取样本单位;并且不应在抽取样本时带有任何倾向性,而是随机选取
9、样本单位。类型:简单随机抽样、等距抽样、分层抽样、整群抽样、多阶段抽样非概率抽样是用一种主观的(非随机的)方法从总体中抽选样本单位。类型:方便抽样、判断抽样、滚雪球抽样、配额抽样 本讲稿第二十页,共九十五页一、概率抽样方法(一)简单随机抽样 简单随机抽样是对全及总体完全按照随机原则从中抽取单位加以调查的一种抽样技术形式。特点:是在每次抽选中都能保证总体中每个单位有相等的中选机会。方法:直接抽选项法、抽签法、随机数表法、使用计算机模拟抽取。要求:有完整的抽样框 (名录或地域框)本讲稿第二十一页,共九十五页简单随机抽样的具体实施 抽签法随机数法使用统计软件直接抽取准备2000张卡片,写上所有学生的
10、编号,摇匀后抽出300名学生利用随机数表,从09的第一个个位数,以及两位数,三位数符合某个规律。SPSS,EXCEL,S-PLUS 等本讲稿第二十二页,共九十五页 随机数表随机数表 (1)(2)(3)(4)(5)(6)132,04469,03729,65592,14481,03440,582223,82196,07082,59281,6428,9717,411382,38394,98766,44128,67795,96178,346468,31021,79271,63586,08938,15795,620594,85676,94022,1651,4141,41337,231695,00061,
11、95883,43098,25070,0605,436720,76464,63811,35932,55689,8222,713871,40117,96450,94095,75334,09593,566988,46475,70716,75061,3711,53469,2051059,44259,24774,95582,83598,37883,5131111,81840,95199,27932,22275,43327,3971265,7856,83796,48300,23058,2209,756135,93369,83457,40235,16881,43844,8501431,72297,33477
12、,17870,36115,81935,0371595,11888,37326,93442,99100,14290,852本讲稿第二十三页,共九十五页(二)等距抽样(二)等距抽样也称也称机械抽样机械抽样机械抽样机械抽样或或系统抽样系统抽样系统抽样系统抽样,首先要选择标志将调查对象的全部个,首先要选择标志将调查对象的全部个体按一定顺序排队,其次要依简单随机抽样方式从总体中抽取第一体按一定顺序排队,其次要依简单随机抽样方式从总体中抽取第一个样本点,即所谓个样本点,即所谓随机起点随机起点随机起点随机起点,然后依据按某种固定顺序和规律,然后依据按某种固定顺序和规律依次抽取其余样本点,最终构成系统样本。依
13、次抽取其余样本点,最终构成系统样本。2.等距等距抽样的排序方法抽样的排序方法 有关标志排队法有关标志排队法 l l有关标志有关标志有关标志有关标志 指用于排队的标志与所调查的项目(指标)有密切的指用于排队的标志与所调查的项目(指标)有密切的关系。关系。l采用有关标志排队可以利用总体的有关信息,提高样本代表采用有关标志排队可以利用总体的有关信息,提高样本代表性并提高抽样估计精度。性并提高抽样估计精度。1.什么是等距抽样什么是等距抽样本讲稿第二十四页,共九十五页无关标志排队法无关标志排队法 l l无关标志无关标志无关标志无关标志指用于排队的标志与所调查的项目(指指用于排队的标志与所调查的项目(指标
14、)没有直接关系,或者关系很小。标)没有直接关系,或者关系很小。l采用无关标志排队的总体实际上是一个随机总采用无关标志排队的总体实际上是一个随机总体,因而按无关标志排队的系统抽样,可以视体,因而按无关标志排队的系统抽样,可以视为不重复的简单随机抽样。为不重复的简单随机抽样。系统抽样需满足的条件系统抽样需满足的条件 l调查对象中的每个总体单位都必须而且只属于一调查对象中的每个总体单位都必须而且只属于一个系统样本;个系统样本;l任何一个系统样本中所含总体单位数一般都相任何一个系统样本中所含总体单位数一般都相等;等;l任何一个系统样本都具有同等被抽中的机会。任何一个系统样本都具有同等被抽中的机会。本讲
15、稿第二十五页,共九十五页3.总体与样本间的相互关系总体与样本间的相互关系 直线系统抽样直线系统抽样直线系统抽样直线系统抽样 圆形系统抽样或循环系统抽样圆形系统抽样或循环系统抽样圆形系统抽样或循环系统抽样圆形系统抽样或循环系统抽样l它是总体容量它是总体容量 恰好是系统样本容量恰好是系统样本容量 的整数倍时的整数倍时的系统抽样,它是目标总体只有的系统抽样,它是目标总体只有 ()个容个容量为量为 的系统样本。的系统样本。l它是指将总体单位排列成首尾相接如同圆形的系统抽样。它是指将总体单位排列成首尾相接如同圆形的系统抽样。它是目标总体有它是目标总体有 个容量为个容量为 的系统样本,而无需考虑的系统样本
16、,而无需考虑总体容量与样本容量的关系。总体容量与样本容量的关系。本讲稿第二十六页,共九十五页4.常用的系统抽样方式常用的系统抽样方式 随机起点等距抽样。随机起点等距抽样。半距起点等距抽样。半距起点等距抽样。随机起点对称系统抽样。随机起点对称系统抽样。5.系统抽样的局限性系统抽样的局限性 系统抽样的前提是要有总体中每个单位的有关材系统抽样的前提是要有总体中每个单位的有关材料,这是一项很复杂、细致的工作。料,这是一项很复杂、细致的工作。当抽选间隔和调查对象本身的循环周期性重合时,当抽选间隔和调查对象本身的循环周期性重合时,就会影响调查的精度。就会影响调查的精度。机械抽样的抽样误差计算较为复杂。机械
17、抽样的抽样误差计算较为复杂。本讲稿第二十七页,共九十五页(三)分层抽样(三)分层抽样1.分层抽样与分层随机抽样分层抽样与分层随机抽样 分层抽样分层抽样分层抽样分层抽样:是先将包含是先将包含N N个总体单位的调查对象按某一标志划个总体单位的调查对象按某一标志划分成分成 个层,然后从含有个层,然后从含有 (=1,2,=1,2,;)个个体的层个个体的层中随机抽取中随机抽取 个样本单位组成第个样本单位组成第 层的层样本,所有这层的层样本,所有这 个层的层个层的层样本汇总起来构成的总样本就是容量为样本汇总起来构成的总样本就是容量为 ()的分层样本。)的分层样本。我们也又称它为我们也又称它为类型抽样类型抽
18、样或或分类抽样分类抽样。分层随机抽样分层随机抽样分层随机抽样分层随机抽样 在每一层中都采用单纯随机抽样法来抽取层样在每一层中都采用单纯随机抽样法来抽取层样本,所得分层样本被称为本,所得分层样本被称为分层随机样本分层随机样本分层随机样本分层随机样本。要求要求要求要求 l每个总体单位都必须属于且只属于某一层;每个总体单位都必须属于且只属于某一层;l每一层的总体单位数已知;每一层的总体单位数已知;l在任何两层所进行的抽样都是独立的。在任何两层所进行的抽样都是独立的。本讲稿第二十八页,共九十五页2.分层抽样方法分层抽样方法 等比例抽样等比例抽样不等比例抽样不等比例抽样 3.分层抽样的特点分层抽样的特点
19、 可同时对各层的指标进行估计。可同时对各层的指标进行估计。实施灵活方便,便于依托行政管理机构进行组织和实施。实施灵活方便,便于依托行政管理机构进行组织和实施。可使样本在总体中分布更均匀,从而具有更好的代表性。可使样本在总体中分布更均匀,从而具有更好的代表性。可缩小抽样误差,提高调查的精度。可缩小抽样误差,提高调查的精度。4.分层原则分层原则 以与调查的核心项目关系密切的项目为标准。以与调查的核心项目关系密切的项目为标准。当总体各标志值之间的差距很大,总体分布非常分散时,以引起其当总体各标志值之间的差距很大,总体分布非常分散时,以引起其分散的主要原因或标识为分层标志。分散的主要原因或标识为分层标
20、志。本讲稿第二十九页,共九十五页(四)整群抽样(四)整群抽样 整群抽样是将调查对象按某一标志分组后形成的每个群视为单整群抽样是将调查对象按某一标志分组后形成的每个群视为单元进行随机抽样,而后对抽中的每个群进行全面调查,也称元进行随机抽样,而后对抽中的每个群进行全面调查,也称集集集集团抽样团抽样团抽样团抽样、群体抽样群体抽样群体抽样群体抽样。分群原则分群原则分群原则分群原则 应选择能使群间方差尽量小,而群内方差尽量大的应选择能使群间方差尽量小,而群内方差尽量大的标志作为分群标志。标志作为分群标志。1.什么是整群抽样什么是整群抽样本讲稿第三十页,共九十五页3.整群抽样的特点整群抽样的特点 调查单位
21、比较集中,进行调查比较方便,可以减少调查人员调查单位比较集中,进行调查比较方便,可以减少调查人员与调查单位之间来往的时间和费用。与调查单位之间来往的时间和费用。设计和组织抽样比较方便,尤其是对那些无法事先掌握总体单位设计和组织抽样比较方便,尤其是对那些无法事先掌握总体单位情况的调查对象,采用整群抽样更为适宜。情况的调查对象,采用整群抽样更为适宜。2.整群抽样的适用性整群抽样的适用性 在某些一个个地抽取样本单位不适合的情况下,不得不采用整群抽在某些一个个地抽取样本单位不适合的情况下,不得不采用整群抽样。样。即使抽样调查中能够一个个地取样,出于经济的考虑也会选择即使抽样调查中能够一个个地取样,出于
22、经济的考虑也会选择整群抽样。整群抽样。本讲稿第三十一页,共九十五页(五)多阶段抽样(五)多阶段抽样是按抽样单位的隶属关系或层次关系,把抽样过程分为几个阶段进行。适用于总体规模特别大时。步骤:从总体中随机抽取若干大群;再从总体中抽取若干小群;最后抽取基本单位。本讲稿第三十二页,共九十五页例:1、对某县群众身体状况调查,样本单位数为500人;2、某市有2.4万教师,分布在全市10个区的200所学校中,抽样单位数为1200人,采用三个阶段抽样。下述方案哪个更好?本讲稿第三十三页,共九十五页方案方案1:抽:抽10个区,抽个区,抽4所学校,抽所学校,抽30名教师;名教师;方案方案2:抽:抽2个区,抽个区
23、,抽20所学校,抽所学校,抽30名教师;名教师;方案方案3:抽:抽10个区,抽个区,抽20所学校,抽所学校,抽6名教师;名教师;方案方案4:抽:抽8个区,抽个区,抽15所学校,抽所学校,抽10名教师;名教师;方案方案5:抽:抽5个区,抽个区,抽12所学校,抽所学校,抽20名教师;名教师;方案方案6:抽:抽4个区,抽个区,抽10所学校,抽所学校,抽30名教师;名教师;方案方案7:抽:抽3个区,抽个区,抽10所学校,抽所学校,抽40名教师;名教师;方案方案8:抽:抽2个区,抽个区,抽10所学校,抽所学校,抽60名教师;名教师;方案方案9:抽:抽1个区,抽个区,抽12所学校,抽所学校,抽100名教师
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 抽样 设计 精选 文档
限制150内