第五章_抽样设计(PPT_93).pptx
《第五章_抽样设计(PPT_93).pptx》由会员分享,可在线阅读,更多相关《第五章_抽样设计(PPT_93).pptx(93页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第第5 5章章 抽样设计抽样设计第一节第一节 基本概念基本概念一一. .抽样调查的概念抽样调查的概念 抽样调查是指从调研总体中抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种专门性的调查活动。二二. .抽样调查的特点抽样调查的特点 优点:时间快,收效快。 质量高、可信程度好。 费用省、易推广、破坏性小。 抽样调查的不足三三. .与抽样调查相关的重要概念:与抽样调查相关的重要概念:1.1.总体及定义总体总体及定义总体 调查对象就是调查总体。定义总体要解决:总体的范围、性质和构成。2.2.样本与样本单位样本与样本单位 样本是有一定数量的样本单位所组成的集合。样本单位的
2、多寡又称样本容量的大小。样本单位是按一定的抽样方法从总体中抽取出来。3.抽样框架及抽样框架的选择抽样框架及抽样框架的选择 抽样框架是包含所有样本单位的集合。所谓“最理想最理想”的抽样框架的抽样框架应该具有这样一些特点: 1)能够包容所有的样本单位。 2)所有的样本单位出现在这一集合中的概率相等。 3)类似的抽样框架应该有几个。 类型: 具体抽样框、抽象抽样框、阶段式抽样框 4.抽样误差抽样误差 抽样误差是调研所得出的对总体某个特征的推断与总体该特征最终实际结果之间的差距。【思考】 抽样调查中是否一定存在抽样误差,能抽样调查中是否一定存在抽样误差,能否控制?否控制?【分析提示】抽样误差是客观存在
3、和不可避免的,但抽样误差是客观存在和不可避免的,但误差的大小是可以控制的。误差的大小是可以控制的。可通过选定不同的抽样方法及样本数目可通过选定不同的抽样方法及样本数目来控制误差;来控制误差;或加强对抽样调查的组织领导,也可提或加强对抽样调查的组织领导,也可提高抽样调查的工作质量。高抽样调查的工作质量。四、抽样调查的作用四、抽样调查的作用 n1、对一些不可能或不必要进行全面调查的社会经济现象,可用抽样调查方式解决。n2、在经费、人力、物力和时间有限的情况下,采用抽样调查方式,可节省开支,争取时效,用比较少的人力、物力和时间,达到满意的调查效果。n3、可对同一现象在不同时间进行连续不断的调查,可随
4、时了解现象发展变化状况。n4、运用抽样调查对全面调查进行验证。 抽样与普查比较表五、普查与抽样调查的比较五、普查与抽样调查的比较问题:普查与抽样调查哪个更准确?五、抽样调查过程的五个步骤:五、抽样调查过程的五个步骤:确定确定调查调查总体总体执行执行抽样抽样过程过程确定确定样本样本容量容量选择选择抽样抽样技术技术确确定定抽抽样样框框抽样设计的五个步骤抽样设计的五个步骤l案例:民意调查 该调查由全国范围内1000名在校的年龄在8-17岁的年轻人组成。该样本代表了所有8-17岁正在上学的人口总体。研究内容包括他们的愿望和烦恼,他们的家庭和学校,以及他们对涉及范围很广的各种论题的观点。 调查中采用了一
5、个三阶段分层概率抽样技术来选择访谈地点。 第一阶段:将国内所有县根据每个地理区域内的人口规模进行 分层后,按照大体人口比例随机定出100个县。 第二阶段:按照大体人口比例随机抽出样本县内的城市和城镇 第三阶段:在城市或城镇内可以利用普查小区统计资料的地 方,根据大体人口比例随机选择普查小区;在没有 统计资料的地方,随机抽出农村的路段。 在每个人口普查小区或农村路段内都要给访谈人员指定地点。l抽样设计的五个步骤1)定义目标总体(如上述案例中正在上学的年龄在8-172) 岁的年轻人)2)确定抽样框架(例如上述案例中的所有县及县内的城市和城镇)3)选择一种抽样技术(如上述案例中的三阶段分层概率4)抽
6、样)4) 确定样本量(1000名)5) 执行抽样过程(步骤1、2、3和对调查员的指令)第二节第二节 抽样方法抽样方法一、非概率抽样方法一、非概率抽样方法二、概率抽样方法二、概率抽样方法一、一、 非概率抽样方法非概率抽样方法1 1、方便抽样、方便抽样 调研人员根据调研人员根据“最便利最便利”原则确定自己原则确定自己的调研样本。的调研样本。 如:拦截式访问、邮寄访问如:拦截式访问、邮寄访问 优点:优点: p117 缺点缺点2 2、判断抽样、判断抽样 调研人员根据调研人员根据“最符合调研对象特征最符合调研对象特征”原则来原则来确定自己的调研样本。确定自己的调研样本。 如:焦点小组访谈调研如:焦点小组
7、访谈调研 选择纳税大户作为中国富人的代表选择纳税大户作为中国富人的代表 n判断抽样适用的情况:判断抽样适用的情况: n优点:优点: 缺点缺点p1183 3、配额随机抽样、配额随机抽样调研人员如果对调研总体的结构特征有较为调研人员如果对调研总体的结构特征有较为详细的了解,在不具备采用随机抽样条件的详细的了解,在不具备采用随机抽样条件的情况下,可以尝试配额抽样方法。情况下,可以尝试配额抽样方法。根据总体各类单位的所占比例根据总体各类单位的所占比例(如性别、年龄、教育程度) ,确定在各类总体单位中抽,确定在各类总体单位中抽取样本单位的具体数量。取样本单位的具体数量。n优点:成本低、n 样本结构和特征
8、具有代表性 n缺点:存在选择偏见,误差很难估算例:按人均年纯收入分类(元)总体各类户数比重(%)各类中样本单位数(户)500及以下50010001000以上1075154030060合计100400【案例】对产业市场的客户的需求调研,将客户分为如下几类。产业市场需求调研的样本结构设计产业市场需求调研的样本结构设计 客户类型 各类客户比例 各类客户中拟定的样本单位数 大量购买者 25 13 中等数量购买者 44 22 少量购买者 20 10 初次购买者 11 5 合 计 100 50n1948年美国大选时,盖洛普联合全美约100家独立报纸,采用配额抽 样的方法对5万人次进行寻访,预测杜威(Dew
9、ey)将战胜杜鲁门,而结果是杜鲁门以52.8%的选票获胜,杜威的得票率为44.5%。 Why?n配额抽样似乎保证了样本和选举总体在被认为对选举行为有影响的所有主要特征方面将会相似,但国民政治中政治见解的分布状况恰恰是调查机构所不知道而正努力尝试去发现的,并且在规定的定额内,访问人员可以自由选择他喜欢的任何人。这给人为选择留有过多的余地。而人为选择常易带偏好。4 4、滚雪球抽样、滚雪球抽样n雪球抽样(snowball sampling)总体样本单位之间具有一定的联系,在不甚了解总体的情况下对总体或总体部分单位情况进行把握。n特点:P121n如:同性恋研究和小偷研究n 当我们无法了解总体情况时当我
10、们无法了解总体情况时, ,可以从总体中可以从总体中少数成员入手少数成员入手, ,对他们进行调查对他们进行调查, ,向他们询问还向他们询问还知道那些符合条件的人知道那些符合条件的人, ,再去找越来越多具有再去找越来越多具有相同性质的群体成员相同性质的群体成员. .n例如,要研究退休老人的生活,可以清晨到公例如,要研究退休老人的生活,可以清晨到公园去结识几位散步老人,再通过他们结识其朋园去结识几位散步老人,再通过他们结识其朋友,不用很久,你就可以交上一大批老年朋友。友,不用很久,你就可以交上一大批老年朋友。但是这种方法偏误也很大,那些不好活动、不但是这种方法偏误也很大,那些不好活动、不爱去公园、不
11、爱和别人交往、喜欢一个人在家爱去公园、不爱和别人交往、喜欢一个人在家里活动的老人,你就很难把雪球滚到他们那里里活动的老人,你就很难把雪球滚到他们那里去,而他们却代表着另外一种退休后的生活方去,而他们却代表着另外一种退休后的生活方式。式。5 5、非概率抽样方法的比较、非概率抽样方法的比较nP121表5-3非概率抽样技术n总结:n1、受客观条件限制,无法进行严格的随机抽样;n2、为了快速获得调查结果;n3、调查对象不确定,或无法确定的情况下采用,例如突发(偶然)事件进行现场调查等;n4、总体各单位间离散程度不大,且调查员具有丰富的调查经验时;二、二、 概率抽样方法概率抽样方法1 1、简单随机抽样、
12、简单随机抽样(1).(1).定义定义: P122P122(2).(2).使用对象:使用对象: 调查总体中各单位之间差异较小的情况,调查总体中各单位之间差异较小的情况, 或者调查对象不明,难以分组、分类的情况。或者调查对象不明,难以分组、分类的情况。(3)(3)特点:特点:按随机原则,从调查总体中不加任何分组、规划、排序等先行工作,直接地抽取调查样本; b、每个样本被抽中的概率相等,各个样本完全独立,彼此间无一定的关联性和排斥性,完全排除了抽样中主观因素的干扰抽签法抽签法 适用于总体单位数较少的情况。适用于总体单位数较少的情况。 抽签方式在具体应用上有多种方法,如抽纸签法、纸牌抽签方式在具体应用
13、上有多种方法,如抽纸签法、纸牌法等。法等。将调查总体的每将调查总体的每个单位编上号码个单位编上号码将号码均将号码均匀打乱匀打乱任意从中抽选,任意从中抽选,抽到一个号码,抽到一个号码,就作为一个单位就作为一个单位直到抽足预先规定直到抽足预先规定的样本数目为止的样本数目为止乱数表法 p294基本步骤基本步骤:调查总体中的调查总体中的所有单位加以所有单位加以编号,编号,根据编号的位根据编号的位数确定适用若数确定适用若干位数字干位数字查乱数表查乱数表直到抽足预定直到抽足预定样本数目为止样本数目为止【案例分析】 要从一个包含800个个体的抽样框中抽出大小为10的样本,可以从乱数表的第一行第一列开始,考虑
14、最右边的三个数字,从001-800依次选出10个数字: 386、762、766、564、439、331、429、244、245、775 若从第一行第三列最左边的三个数字呢?【分析提示】 在顺序抽取的过程中,遇到比编号大在顺序抽取的过程中,遇到比编号大的数字,应该舍去。此例中的的数字,应该舍去。此例中的 因大因大于于 ,故舍去不用。,故舍去不用。一定的局限性n1采用简单随机抽样n2某些事物无法适用简单随机抽样,大量产品进行质 n 量检验,就不能对全部产品进行编号抽样n3当总体的标志变异程度(方差)较大时n4由于抽出样本单位较为分散,所以调查人力、物力、费用消耗较大2 2、系统抽样、系统抽样n按照
15、一定的顺序,每隔若干个个体抽取一个体的方法。n电子营销专业的学生,选一个随机起点,按照学号,隔N个个体选一个3 3、分层抽样、分层抽样(1 1)要点:)要点:分层时各层之间要有明显的差异;要知道各层中的单位数目和比例;分层的数目不宜太多,每个层次内每个个体应保持一致性。(2 2). .程序:程序: 把总体各单位分成两个或两个以上的相互独立的完全的组(如男性和女性),而后从两个或两个以上的组中简单随机抽样,样本相互独立。 步骤:步骤:n 首先,辨明突出的人口统计特征和分类首先,辨明突出的人口统计特征和分类 特特征,这些特征与所研究的行为相关。征,这些特征与所研究的行为相关。 第二,确定在每个层次
16、上总体的比例。第二,确定在每个层次上总体的比例。 最后,从每层中抽取独立简单随机样本最后,从每层中抽取独立简单随机样本(3 3). .分层抽样具体形式有两种分层抽样具体形式有两种: 等比例分层抽样等比例分层抽样 等比例分层抽样等比例分层抽样即按各个层(或各类型)即按各个层(或各类型)中的单位数量占总体单位数量的比例分中的单位数量占总体单位数量的比例分配各层的样本数量。配各层的样本数量。 【案例分析】 某地共有居民20000户,按经济收入高低进行分类,其中高收入的居民为4000户,占总体的20%,中收入的居民为12000户,占总体的60%,低收入的居民为4000户,占总体的20%。要从中抽选户进
17、行购买力调查,则各类型应抽取的样本单位数为?【分析提示】经济收入高的样本数目为:200*20%=40 (户) 经济收入中的样本数目为:200*60%=120(户) 经济收入低的样本数目为:200*20%=40 (户)样本单位数的抽取是按各种经济收入的单位数量占总体单位数量的比例进行样本的抽选。这种方法简便易行,分配合理,计算方便。简便易行,分配合理,计算方便。适用于各类型之间差异不大的分类抽样调查,如果各适用于各类型之间差异不大的分类抽样调查,如果各类差异过大,则不宜采用而应采用分层最佳抽样法。类差异过大,则不宜采用而应采用分层最佳抽样法。分层最佳抽样法分层最佳抽样法定义:定义:又称非比例抽样
18、法,根据各层样本标准差的大小确定各层的样本数目的方法。计算公式为:计算公式为: ni=n*(NiSi/ NiSi)式中:式中:ni各类型应抽选的样本单位数各类型应抽选的样本单位数 n 样本单位数样本单位数 Ni 各类型的调查单位数各类型的调查单位数 Si 各类型调查单位数的样本标准差各类型调查单位数的样本标准差【案例分析】 仍以上述居民收入与购买力之间关系为例。各层样本标准差高收入为300元,中收入为200元,低收入为100元,如: 调查单位数与样本标准差乘积计算表 各层次各层次各层的调查单位各层的调查单位数数 (户)(户) Ni各层的样本标准各层的样本标准差差 (元)(元)Si乘积乘积 Ni
19、Si高中低400012000400030020010012000002400000400000 NiSi200004000000【分析提示】高收入样本单位数目为:200*(1200000/4000000)=60中收入样本单位数目为:200*(2400000/4000000)=120低收入样本单位数目为:200*(400000/4000000)=20【分析提示】2样本单位数是按各种经济收入下的样本标准差的样本单位数是按各种经济收入下的样本标准差的大小进行调整的,大小进行调整的, 按ni=n*(NiSi/ NiSi)计算。计算。通过上述计算可以看出,用非比例抽样法与比例通过上述计算可以看出,用非比
20、例抽样法与比例抽样法,抽取的样本各层次之间不同,特别是高抽样法,抽取的样本各层次之间不同,特别是高收入与低收入减少收入与低收入减少20户(户(20户户40户),中收入户),中收入不变。由于购买力同家庭经济收入关系很大,因不变。由于购买力同家庭经济收入关系很大,因而要增加高收入的样本数,相应减少低收入层的而要增加高收入的样本数,相应减少低收入层的样本数,这种使所抽取的样本更具有代表性。样本数,这种使所抽取的样本更具有代表性。这种以调查单位数和样本标准差两个因素为依据这种以调查单位数和样本标准差两个因素为依据进行的抽样是最佳抽样法。进行的抽样是最佳抽样法。4 4、整群抽样、整群抽样(cluster
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 抽样 设计 PPT_93
限制150内