抽样调查方法讲义.pptx
第八章第八章 抽样调查方法抽样调查方法主要内容主要内容一、为什么要采用抽样调查方法一、为什么要采用抽样调查方法二、如何确定调查方案二、如何确定调查方案三、如何确定抽样框三、如何确定抽样框四、如何选取样本和确定样本容量四、如何选取样本和确定样本容量五、抽样调查的误差来源五、抽样调查的误差来源六、问卷设计技术六、问卷设计技术七、统计数据分析七、统计数据分析八、调研报告的文本结构八、调研报告的文本结构8.1 8.1 为什么要采用抽样调查方法为什么要采用抽样调查方法 普查的代价:普查的代价: 1. 费用昂贵费用昂贵 2. 时间过长时间过长 3. 观测值几乎是无穷个观测值几乎是无穷个 4. 毁坏性实验毁坏性实验 5. 精度精度: 由一个训练有素的调查人员得到的样本统计结果,可能比没有受由一个训练有素的调查人员得到的样本统计结果,可能比没有受过训练的人进行普查得到的结果更准确过训练的人进行普查得到的结果更准确. . 抽样主要考虑:抽样主要考虑:调查的效率和精确性调查的效率和精确性 研究样本比研究总体的速度更快,花费更少;研究样本比研究总体的速度更快,花费更少; 可以把花费在不必要的数量过大的群体资料的精力和经费用在监测数可以把花费在不必要的数量过大的群体资料的精力和经费用在监测数据收集质量上据收集质量上8.2 如何确定调查方案如何确定调查方案1、调查目的、调查目的 指出调查所要达到的具体目标。指出调查所要达到的具体目标。 调查研究的目的是进行调查的原因。调查研究的目的是进行调查的原因。(1 1)对特定人群的调查研究,可以描述、比较、预测他们的)对特定人群的调查研究,可以描述、比较、预测他们的认知、态度及行为。认知、态度及行为。(2 2)可以对所发生的事实进行调查。)可以对所发生的事实进行调查。例如:例如:(1 1)某社会组织可以通过抽样调查,分析人们对某项政策的看法,或者)某社会组织可以通过抽样调查,分析人们对某项政策的看法,或者调查某项政策实施是否有效。调查某项政策实施是否有效。()一批灯泡的废品率或平均寿命()一批灯泡的废品率或平均寿命()国家创新研究群体的意义、作用、成果、管理中需要改进的问题,()国家创新研究群体的意义、作用、成果、管理中需要改进的问题,以及预测我国应保持多大的团队规模。以及预测我国应保持多大的团队规模。()北京市出租车司机的工作负荷情况和劳动收入情况。()北京市出租车司机的工作负荷情况和劳动收入情况。()国外技术性贸易措施()国外技术性贸易措施(TBTTBT)对我国对外贸易的影响情况;国外实)对我国对外贸易的影响情况;国外实施施TBTTBT的特点,我国企业在应对的特点,我国企业在应对TBTTBT时面临的困难,以及政府急需采取时面临的困难,以及政府急需采取的对策措施。的对策措施。2、调查大纲、调查大纲(调查研究的具体内容)(调查研究的具体内容) 只有在调查目的和内容都明确后,才能确定向谁调查、调查什么,以及采取什么方法。案例案例1:对中国妇女参政的看法:对中国妇女参政的看法(1)第一次研讨会的主要议题是什么?(主持人应如何把握会场研讨)(2)向谁发问卷?(3)根据调查结果,要向上级领导说明什么问题?注意:注意:在进行调查方案设计之前,必须准确地陈述调查目的在进行调查方案设计之前,必须准确地陈述调查目的以及调查研究的内容以及调查研究的内容(应该有详细的提纲)(应该有详细的提纲)案例案例2 2: 20072007年中国机电行业自主品牌产品出口情况抽样调查年中国机电行业自主品牌产品出口情况抽样调查(商务部(商务部总目的:总目的: 对对20072007年全国机电行业自主品牌产品出口情况调查年全国机电行业自主品牌产品出口情况调查调查大纲:调查大纲:统计报告期内,全国机电行业出口企业的自主品牌出口额占该行业总出统计报告期内,全国机电行业出口企业的自主品牌出口额占该行业总出口额的比例;口额的比例;分析自主品牌出口额比例在分析自主品牌出口额比例在金属制品、机械及设备、电器及电子产品、金属制品、机械及设备、电器及电子产品、运输工具、仪器仪表等运输工具、仪器仪表等产品的分布情况;产品的分布情况;分析机电行业自主品牌出口额比例在各地区分布情况;分析机电行业自主品牌出口额比例在各地区分布情况;了解我国机电行业企业在发展自主品牌方面的认识现状;了解我国机电行业企业在发展自主品牌方面的认识现状;了解企业采用贴牌出口的主要原因;了解企业采用贴牌出口的主要原因;了解我国机电行业企业在发展自主品牌出口方面多面临的主要困难,以了解我国机电行业企业在发展自主品牌出口方面多面临的主要困难,以及对政府扶持品牌发展的意见与建议。及对政府扶持品牌发展的意见与建议。8.3 如何确定抽样框如何确定抽样框1、目标总体:、目标总体:所有要调查的个体的集合所有要调查的个体的集合例如:例如:一批灯泡一批灯泡北京市全体出租车司机北京市全体出租车司机案例案例 : 20072007年中国机电行业自主品牌产品出口情况抽样调查年中国机电行业自主品牌产品出口情况抽样调查调查范围:调查范围: 20072007年年1 1月月1 1日至日至20072007年年1212月月3131日的日的全国机电行业出口企业全国机电行业出口企业。(。(产品类型包产品类型包括括金属制品、机械及设备、电器及电子产品、运输工具、仪器仪表。)金属制品、机械及设备、电器及电子产品、运输工具、仪器仪表。)统计调查的报告期:统计调查的报告期:20072007年年1 1月月1 1日日 20072007年年1212月月3131日日有时需要按照调查要求,分别调查几个不同的目标总体有时需要按照调查要求,分别调查几个不同的目标总体 案例:案例:关于创新研究群体的调查问卷关于创新研究群体的调查问卷一共分为三套一共分为三套:v 第一套:第一套:针对参加创新研究群体针对参加创新研究群体评审的专家评审的专家,以及国家自然科学基金委七,以及国家自然科学基金委七个学部的管理人员。从专家角度了解他们对创新研究群体资助计划的评价个学部的管理人员。从专家角度了解他们对创新研究群体资助计划的评价以及对管理问题的看法;以及对管理问题的看法;v 第二套:第二套:针对已经获得创新研究群体项目资助的针对已经获得创新研究群体项目资助的群体负责人群体负责人。了解群体成。了解群体成员对相关问题的看法以及他们的学术进展情况;员对相关问题的看法以及他们的学术进展情况;v 第三套:第三套:发放给已获得创新研究群体及杰出青年科学基金项目资助的各高发放给已获得创新研究群体及杰出青年科学基金项目资助的各高校和科研机构的校和科研机构的科技处的管理人员科技处的管理人员(基金负责人)。除了解部分观点性问(基金负责人)。除了解部分观点性问题外,主要调查相关科研机构在创新研究群体的人才储备及研究基础方面题外,主要调查相关科研机构在创新研究群体的人才储备及研究基础方面的情况。的情况。2、样本:、样本:样本是目标总体的一部分样本是目标总体的一部分 在总体中抽取一部分个体进行观测统计,再根据这部分个体的观测信息推断总体的性质。3、样本容量、样本容量 n :样本中的个体数目样本中的个体数目 大样本:n 30 小样本:n 30是总体的代表(缩影),非常像,但是小一些。样本中的重要特征应该与总体基本近似。例如:在TBT调查中,要了解出口企业受限比例 目标:目标:样本中的受限企业比例样本中的受限企业比例 = 总体中的受限企业比例总体中的受限企业比例4、抽样框:、抽样框:实施抽样的总体名单实施抽样的总体名单 进行抽样的第一步是获得一个符合条件的个体组成的总体名单,样本将在进行抽样的第一步是获得一个符合条件的个体组成的总体名单,样本将在这个总体名单中抽取这个总体名单中抽取 在实际操作时,我们是从抽样框中抽取一部分个体进行观测统计。在实际操作时,我们是从抽样框中抽取一部分个体进行观测统计。一个好的抽样框:一个好的抽样框:但是,但是,在实际情况下,有时抽样框并不等于目标总体在实际情况下,有时抽样框并不等于目标总体例如:例如: (1)如果采用)如果采用2002年出口企业名录做关于年出口企业名录做关于2003年年TBT影响调查影响调查(2)银行关于某项政策的调研以一个旧的单位职员名单为抽样框)银行关于某项政策的调研以一个旧的单位职员名单为抽样框(3)国家杰出青年科学基金实施效果的评价)国家杰出青年科学基金实施效果的评价(可否采用大众评估?)(可否采用大众评估?)(4)哪些管理期刊在各个学科中是比较重要的?)哪些管理期刊在各个学科中是比较重要的?(让所有管理专家来评分?)(让所有管理专家来评分?)应包括所有的目标总体的成员应包括所有的目标总体的成员案例案例: 文学摘要文学摘要民意测验民意测验 1936年美国总统选举年美国总统选举 F.D. Roosevelt (罗斯福)任美国总统的第一任期届满(民主党) A. Landon (兰登)Kansas州州长(共和党) 经济背景:经济背景:国家正努力从大萧条中恢复,失业人数高达九百万人。 The literary Digest文学摘要进行民意测验,将问卷邮寄给一千万人,他们的名字和地址摘自电话簿或俱乐部会员名册。其中240万人寄回答案(回收率24%)。 预测结果:预测结果:Roosevelt 43%, Landon 57% 竞选结果:竞选结果: Roosevelt 62%, Landon 38% 主要原因:主要原因: 选择偏倚选择偏倚将一类人排除在样本框之外(当时四个家庭中,只有一家安装电话)不回答偏倚不回答偏倚低收入和高收入的人倾向不回答抽样框 目标总体1936年美国总统竞选(年美国总统竞选(Gallup的预测)的预测)样本容量3000人,在摘要公布其预测结果之前,仅以一个百分位数的误差预言了摘要的预测结果。利用一个约5万人的样本,正确地预测了Roosevelt的胜利。 Roosevelt的百分数 盖洛普预言摘要的预测结果 44 摘要预测的选举结果 43 盖洛普预测的选举结果 56 选举结果 62从摘要要用的名单中随机选取3000人,并给他们每人寄去一张明信片,询问他们打算怎样投票。大样本并不能防止偏倚:大样本并不能防止偏倚:当抽样框不正确时,抽取一个大的样本并当抽样框不正确时,抽取一个大的样本并无帮助,它只不过是在较大的规模下,去重复基本错误。无帮助,它只不过是在较大的规模下,去重复基本错误。案例(案例(P34P34):):以固定电话为基础进行选民投票民调以固定电话为基础进行选民投票民调,没有考没有考虑到只使用移动电话的用户虑到只使用移动电话的用户这些用户一般更年轻和热爱这些用户一般更年轻和热爱自由。自由。 2008 2008年在奥巴马与麦凯恩进行的美国总统大选中,盖洛年在奥巴马与麦凯恩进行的美国总统大选中,盖洛普、华盛顿邮报等民调组织都发现,普、华盛顿邮报等民调组织都发现,如果不考虑移动用如果不考虑移动用户,民调结果会有个点的偏差;户,民调结果会有个点的偏差;如果考虑进来,则只有如果考虑进来,则只有个点的偏差。鉴于此次大选的票数差距极其微弱,这个偏差个点的偏差。鉴于此次大选的票数差距极其微弱,这个偏差就显得特别严重了。就显得特别严重了。 随机采样需要严密的安排和执行。一旦采样过程存在任随机采样需要严密的安排和执行。一旦采样过程存在任何偏见,分析结果就会相去甚远。何偏见,分析结果就会相去甚远。 (一)设计抽样方案的基本原则(一)设计抽样方案的基本原则 ()效果最佳原则:()效果最佳原则: 在固定费用下,选取调查精度最大的方案; 在要求的精度下,做到调查费用最小。 ()可操作原则()可操作原则 根据现有的数据条件以及时间进度要求,设计便于操作的抽样方案。8.4 如何选取样本如何选取样本 ()代表性原则:()代表性原则:样本尽可能对总体有很好的代表性样本尽可能对总体有很好的代表性 调查者不根据主观意图挑选调查单位调查者不根据主观意图挑选调查单位定额抽样:定额抽样:样本被精心挑选,以使在某些关键特征上与总体相似。 例如:在 St. Louis 的访问人员访问13个对象,并规定其中s 6人住在近郊,7人住在市中心;s 男人7名,女人6名;s 在男人中,3人40岁以下,4人40岁以上;1名黑人,6名白人。s 6名白人支付的月租:1人支付的金额不少于44.01$ 3人支付的金额为18.01 44.00 $ 2人支付的金额不超过18.00 $ 年份 预测共和党得票 共和党实际得票 偏差 1936 44 38 6 1940 48 45 3 1944 48 46 2 1948 50 45 5在规定定额内,访问人员可以自由选取任何人。在规定定额内,访问人员可以自由选取任何人。有利于共和党的案例:案例:Gallup19361948年年采用定额抽样采用定额抽样Gallup民意测验在民意测验在1948年后总统选举中的记录年后总统选举中的记录(随机抽样:访问员无任何自主处理的权利)随机抽样:访问员无任何自主处理的权利) 年份 样本容量 获胜候选人 预测值 选举结果 误差 1952 5385 艾森豪威尔 51.0% 55.4% +4.4% 1956 8144 艾森豪威尔 59.5% 57.8% -1.7% 1960 8015 肯尼迪 51.0% 50.1% -0.9% 1964 6625 约翰逊 64.0% 61.3% -2.7% 1968 4414 尼克松 43.0% 43.5% -0.5% 1972 3689 尼克松 62.0% 61.8% -0.2% 1976 3439 卡特 49.5% 51.1% +1.6% 1980 3500 里根 55.3% 51.6% -3.7% 1984 3456 里根 59.0% 59.2% -0.2% 1988 4089 布什 56.0% 53.9% -2.1%(二)常见的抽样方法(二)常见的抽样方法 (1)简单随机抽样)简单随机抽样 对北航学生的研究能力进行抽样测试。在北航全校学生中随机抽取 n 名学生。 (2)分层抽样)分层抽样 分层次抽样:专科、本科、研究生、博士、博士后。 (3)整群抽样)整群抽样 在本科生中,随机抽取若干个班,观察每个班的全部学生。 (4)分段抽样)分段抽样 全国调查,随机抽取若干省,再随机抽取若干市,再随机抽取若干区,. (5)非随机抽样)非随机抽样 在临沂农贸市场抽样,询问进货地点。编制抽样框很困难。 原则:原则:调查者不能根据主观意图挑选调查单位。而是在总体中,按照随机原则和纯粹偶然性的方法抽取样本。 8.5 简单随机抽样方法简单随机抽样方法简单随机抽样:简单随机抽样:每一个容量为每一个容量为 n 的可能样本被抽到的概率都是一样的。的可能样本被抽到的概率都是一样的。方法方法:(1)抽签法 (2)乱数表法(随机数字表)抽签法抽签法: 先将调查总体的每个单位编上号码,然后将号码写在卡片上搅先将调查总体的每个单位编上号码,然后将号码写在卡片上搅拌均匀,任意从中选取。抽到一个号码,就对上一个单位,直到抽足预拌均匀,任意从中选取。抽到一个号码,就对上一个单位,直到抽足预先规定的样本数目为止。先规定的样本数目为止。 放回抽样无限总体有限总体无放回抽样简单随机抽样NN优点:优点: 可以获得一个无偏倚的样本可以获得一个无偏倚的样本使用限制:使用限制:实施操作并不简单实施操作并不简单(1)保证样本点被充分搅拌均匀;或需要使用随机数表;)保证样本点被充分搅拌均匀;或需要使用随机数表;()调查人员要寻找所有样本中的个体,有时是很困难的。()调查人员要寻找所有样本中的个体,有时是很困难的。()样本容量较小时,一些比例少但是很重要的个体不能入()样本容量较小时,一些比例少但是很重要的个体不能入样,使样本的代表性受到影响。样,使样本的代表性受到影响。例如:例如:在人民银行随机抽取在人民银行随机抽取100名职员,可能会抽不到高层管理人员。名职员,可能会抽不到高层管理人员。 2007年全国有将近年全国有将近20万家出口企业。如果万家出口企业。如果TBT调查在全国抽调查在全国抽1000家家企业,很可能会有许多大型企业不能入样。企业,很可能会有许多大型企业不能入样。8.6 8.6 系统抽样方法系统抽样方法 又称“等距抽样等距抽样”或“机械抽样机械抽样” 特点:组织形式简单:特点:组织形式简单:不需要在抽样前对每一个单位进行编号。只要确定抽样起点和间隔,就可以确定整个样本单位。 (1)按照无关标志排队,按间隔抽取)按照无关标志排队,按间隔抽取 例如:例如:调查某企业职工收入时,按照姓氏比画排列职工名单,进行抽样。显然,职工工资与姓氏比画之间没有必然联系; (2)按照有关标志排队,按间隔抽取)按照有关标志排队,按间隔抽取 例如:例如:进行农产量调查时,将总体单位按照上一年度的产量高低排序。这样,可以使标志值高低不同的单位均进入样本,样本单位在总体中分布均匀,抽样误差较小。 (3)按照自然位置顺序排列,按间隔抽取)按照自然位置顺序排列,按间隔抽取 例如:例如:工业产品检验时,按照生产时间顺序,每间隔一定时间抽取一定数工业产品检验时,按照生产时间顺序,每间隔一定时间抽取一定数量的样本;量的样本;检验一打发票时,可以按照顺序,每隔检验一打发票时,可以按照顺序,每隔10张抽取张抽取1张;张;在估计在估计果园的产量时,每隔果园的产量时,每隔7株抽取株抽取1株。株。 方法:方法:随机起点,等距抽取。随机起点,等距抽取。 (1)按照某种顺序给总体中的N个单元排列编号; (2)计算间距: (3) 随机选取起始的样本点编号数。然后依次抽取编号如下的 n 个单元作为样本点。 如果得到某编号数 M 大于 N,则抽取的编号为 ( M N ) nNkknikikii) 1(,2,总体N=60 从此开始1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 抽中 抽中 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30抽中31 32 33 34 35 36 37 38 39 40 41 42 43 44 45抽中 抽中46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 (10660K)7 17 27 37 47 57 样本n=6 例如:例如:中央电视台在建立收视率调查网时,要在某居委会拥有电视的512户中抽取5个样本户。 在随机数表中任意确定一个三位数,例如是071。则被抽中的5户为: 71,173,275,377,479 如果开始的编号如果是135,则被抽中的5户的编号为: 135,237,339,441,31 其中: 441 + 102 = 542 543 - 512 = 311025512 , 5 ,512knN 抽样误差的大小与总体单位的排列顺序有关:抽样误差的大小与总体单位的排列顺序有关: (1 1)如果总体中所有单元的排列编号是随机的,并且)如果总体中所有单元的排列编号是随机的,并且 n 比比N小得多的话,小得多的话,那么等距抽样的精度和简单随机抽样的精度是十分相近的。那么等距抽样的精度和简单随机抽样的精度是十分相近的。 (例如,按照姓氏比画或按照行政单位编号排序。) (2 2)如果总体单元是按照某个与调查项目有关的变量的大小排序,由于等如果总体单元是按照某个与调查项目有关的变量的大小排序,由于等距抽样的样本点分布更加均匀,则等距抽样的精度将高于简单随机抽样。距抽样的样本点分布更加均匀,则等距抽样的精度将高于简单随机抽样。 (例如,调查机械加工企业的工业增加值时,以用电量排序。) (3 3)如果总体各单位的标志值存在周期变化趋势,而循环周期恰好等于抽)如果总体各单位的标志值存在周期变化趋势,而循环周期恰好等于抽样间隔,则等距抽样的精度低于简单随机抽样。样间隔,则等距抽样的精度低于简单随机抽样。 1,2,3,4,5,6; 1,2,3,4,5,6; 1,2,3,4,5,6; 1,2,3,4,5,6; 1,2,3,4,5,68.7 8.7 其他常用的抽样方法其他常用的抽样方法 (一)分层抽样方法(一)分层抽样方法 例如:例如: (1)对北航学生的研究能力进行抽样测试。学生层次有:对北航学生的研究能力进行抽样测试。学生层次有:专科、本科、研究生、博士、博士后。专科、本科、研究生、博士、博士后。 (2)对央行的某项政策意见进行调查。可以根据调查内容)对央行的某项政策意见进行调查。可以根据调查内容分层:不同的职务层次,分层:不同的职务层次, 或者不同的部门、不同地区。或者不同的部门、不同地区。 分层的原则:分层的原则: 例如例如 TBT影响调查:影响调查:按照按照36个地区进行分层?个地区进行分层?(行政管理力度大)(行政管理力度大) 按照按照22类出口地区分层?类出口地区分层? (受损情况类似)(受损情况类似)在所调查的指标上,各层的相似程度高,而且层间差异大在所调查的指标上,各层的相似程度高,而且层间差异大 分层抽样的特点:分层抽样的特点: 采用分层抽样,使每一层内的差异大大缩小,而每一个样本单位对各采用分层抽样,使每一层内的差异大大缩小,而每一个样本单位对各层均有较高的代表性。层均有较高的代表性。n 利用已知信息,提高抽样调查的精度;利用已知信息,提高抽样调查的精度;n 便于组织实施;便于组织实施;n 在调查中,除了得到总体的有关信息外,还可以得到一些子总体的信息在调查中,除了得到总体的有关信息外,还可以得到一些子总体的信息.同样的样本容量下,分层抽样的抽样误差更小同样的样本容量下,分层抽样的抽样误差更小。应用应用. TBT影响调查的分层方法: 按照产品分层 按照地区管理(二)(二) 整群抽样整群抽样整群抽样方法:整群抽样方法:整群:整群: 是一个自然出现的单位是一个自然出现的单位 (例如一所大学、一个班级、一个支行等)(例如一所大学、一个班级、一个支行等) 整群抽样:整群抽样: 群是随机抽取的,被抽中的群的所有成员都包含在样本中。群是随机抽取的,被抽中的群的所有成员都包含在样本中。 例: (1)一批进口的苹果,检验时随机抽取 n 箱,然后对每箱中的所有苹果进行检验。 (2)调查北京市近视眼的学生比例,抽取若干所中学,对每一所中学的全部学生 进行调查。为什么要进行整群抽样?为什么要进行整群抽样? (1)缺乏)缺乏“总体单位的抽样框总体单位的抽样框” 包含总体中所有单位的名单并加以编号。 原因:原因:总体很大,要汇总一个总体目标全部成员的详尽名单是不可能的,或者费时费力。 例如,例如,要整理出央行职员的全部名单并编码会比较困难。而得到一张央行支行的名单则比较容易。 (2)总体范围很大,使用简单随机抽样会使样本十分分散,)总体范围很大,使用简单随机抽样会使样本十分分散,调查时花费的人力、物力很大。调查时花费的人力、物力很大。 例如,例如,即使有了央行全体职员的名单,要抽取的职员如果分散在全国各个支行,进行调查是也十分费时、费力。而集中在几个支行调查,就非常方便、节省时间与经费。操作便捷操作便捷整群抽样的分群原则整群抽样的分群原则 问题:问题:可否把分层抽样的分层原则用于整群抽样?可否把分层抽样的分层原则用于整群抽样? 整群抽样的分群原则:整群抽样的分群原则: 使群间方差尽可能小;使群间方差尽可能小; 使群内方差尽可能大!使群内方差尽可能大! 如果群内的差异比较大,在每个群中,单位的分布近似于总体分布,那么如果群内的差异比较大,在每个群中,单位的分布近似于总体分布,那么只要任意抽取一个群,进行观测,就可以推测总体。只要任意抽取一个群,进行观测,就可以推测总体。例如:例如:要了解北航学生的研究能力,把全部学生分成博士生、要了解北航学生的研究能力,把全部学生分成博士生、硕士生、本科生和大专生。然后采用整群抽样方法。硕士生、本科生和大专生。然后采用整群抽样方法。不可取不可取案例:案例: 北航学生节水意识调查北航学生节水意识调查采取整群抽样的原因:采取整群抽样的原因:如果没有接受特殊的教育,可以认为如果没有接受特殊的教育,可以认为节水意识与学生所在的年级或专业没有直接联系。节水意识与学生所在的年级或专业没有直接联系。(组间差异不大,组内分布和总体相仿。)分成两个总体进行分析:(1)住在大运村的同学 / 住在校内宿舍的同学(2)接受节水教育前的总体 / 接受节水教育后的总体思考问题:思考问题:哪一类问题调研可以使用整群抽样?哪一类问题调研可以使用整群抽样? 哪一类问题调研需要使用分层抽样?哪一类问题调研需要使用分层抽样? (三)多级抽样(三)多级抽样(多阶段抽样多阶段抽样) 多级抽样:多级抽样: 是改良的整群抽样。当一个群被抽出后,又在群中抽取部分个体。是改良的整群抽样。当一个群被抽出后,又在群中抽取部分个体。 优点:优点:当样本容量确定时,当样本容量确定时,分阶段抽样的样本分布更为均匀,代表性更强。分阶段抽样的样本分布更为均匀,代表性更强。 应用领域应用领域: 广泛应用于大规模的社会调查,特别是当抽样单元为各级行政单广泛应用于大规模的社会调查,特别是当抽样单元为各级行政单位时,一般都采用多级抽样。位时,一般都采用多级抽样。 例如:例如:进行全国收视率调查时,先抽几个省,然后在从抽中的省中抽市,再抽进行全国收视率调查时,先抽几个省,然后在从抽中的省中抽市,再抽县、村,最后再抽至户。县、村,最后再抽至户。8.8 8.8 非随机抽样非随机抽样适合使用非随机抽样的情况:适合使用非随机抽样的情况:I、对难以确定的人群的调查、对难以确定的人群的调查例如: 进行少年团伙成员的目标和志向的调查(不可能得到所有合格被访问者的合作)II、试访形式的调查、试访形式的调查 用于收集信息,为开展正式调查做准备。(1)方便调查)方便调查方便样本:方便样本:选用一组容易获得的个体作为样本 他们愿意配合调查回答问题优点:优点:方法仅依赖于那些容易得到的个体,因此便于操作问题:问题:抽样方法存在潜在偏倚抽样方法存在潜在偏倚样本带有机会性,参加者的构成成分可能于总体目标存在差异:样本带有机会性,参加者的构成成分可能于总体目标存在差异: 自愿回答问题的人在某些重要方面可能与那些不愿意回答自愿回答问题的人在某些重要方面可能与那些不愿意回答的人有所不同。的人有所不同。(2) 雪球抽样雪球抽样 以前确定的一组成员被要求提供其他成员的名单,样本就以前确定的一组成员被要求提供其他成员的名单,样本就会像滚雪球一样增大。会像滚雪球一样增大。例例1 1:少年团伙成员和非法移民可能被要求参加雪球抽样少年团伙成员和非法移民可能被要求参加雪球抽样 (针对非法人群)(针对非法人群)例例2 2: 一项邮寄调查的目的是为了确定未来一项邮寄调查的目的是为了确定未来20年全科医生需要培养的关键年全科医生需要培养的关键能力有哪些。研究者获得一个能力有哪些。研究者获得一个50名医生和医学工作者的名单后,请求他们名医生和医学工作者的名单后,请求他们中的每一个人提供中的每一个人提供5位其他可能完成调查问卷的医生的名字。位其他可能完成调查问卷的医生的名字。优点:优点:在获得一个抽样名单既困难又不实际时,是一种有用的在获得一个抽样名单既困难又不实际时,是一种有用的 方法。方法。问题:问题:介绍成员可能会产生有偏倚性的样本。介绍成员可能会产生有偏倚性的样本。(3)配额抽样)配额抽样配额抽样方法:配额抽样方法: 把研究的总体分为不同的亚群,诸如男性、女性、年轻、年老等;把研究的总体分为不同的亚群,诸如男性、女性、年轻、年老等; 估计出总体中各亚群人群的比例;估计出总体中各亚群人群的比例; 分别在亚群中选择样本,似的样本中各亚群所占地比例与目标总体相同分别在亚群中选择样本,似的样本中各亚群所占地比例与目标总体相同例如:例如: Gallup19361948年年采用定额抽样采用定额抽样优点:优点: 如果比例计算准确,该方法在非随机抽样中是比较准确的如果比例计算准确,该方法在非随机抽样中是比较准确的使用限制:使用限制: 如果要得出准确的比例,数据资料必须是最新的。如果要得出准确的比例,数据资料必须是最新的。(4)小组讨论会)小组讨论会操作方法:操作方法: 一般有一般有6 10人组成。他们被召集到一起参加由人组成。他们被召集到一起参加由 主持人协调的小组讨。主持人协调的小组讨。 被选来的参加者都代表某一个特定的人群。被选来的参加者都代表某一个特定的人群。 然后由数个不同的小组来代表总体。然后由数个不同的小组来代表总体。优点:优点:可以对特定人群的需求和期望形成较深入的见解:可以对特定人群的需求和期望形成较深入的见解:参加人员可以互参加人员可以互相启发和激励;可以进行较深入的讨论相启发和激励;可以进行较深入的讨论 ;集体的压力会使得偏激者变得比;集体的压力会使得偏激者变得比较现实。较现实。 可以指导抽样调查设计:可以指导抽样调查设计:问卷包括了所有关键问题了吗?您能很容问卷包括了所有关键问题了吗?您能很容易地理解答卷的问题吗?回答这份答卷花费您多长时间?易地理解答卷的问题吗?回答这份答卷花费您多长时间?问题:问题:必须确定这个比较小的群体能有效地必须确定这个比较小的群体能有效地代表目标总体代表目标总体; 主持人要紧紧把握讨论的主题:主持人要紧紧把握讨论的主题:要有讨论提纲、是整个活动的灵魂要有讨论提纲、是整个活动的灵魂 每一个人都能较自主地表达自己见解每一个人都能较自主地表达自己见解8.9 抽样调查的误差来源抽样调查的误差来源 抽样误差:抽样误差:由于抽选样本的随机性而产生的误差由于抽选样本的随机性而产生的误差 (由于概率抽样方式不同所造成,(由于概率抽样方式不同所造成,是可以估计的是可以估计的) 非抽样误差:非抽样误差:除抽样误差外,由其他各种原因而引起的误差。除抽样误差外,由其他各种原因而引起的误差。 产生非抽样误差的主要原因:产生非抽样误差的主要原因: (1)抽样框误差:)抽样框误差:目标总体不等于抽样总体,如遗漏了有关单位,或包含了非目标单位;观测之间的复合连接;分层方案设计不当等。 (2)无应答误差:)无应答误差:受调查人有意识不合作;无意识(由于客观原因无法接受调查,填写问卷时粗心); (3)计量误差:)计量误差:问卷设计不合理、调查指标含义不清、计量单位不标准,选择的统计量和推算方法不适当等。调查误差调查误差 = = 抽样误差抽样误差 + + 非抽样误差非抽样误差案例:案例:TBT损失调查中的非抽样误差损失调查中的非抽样误差1、分层抽样方案设计不当,造成选择偏倚:、分层抽样方案设计不当,造成选择偏倚:按产品分层(样本分配原则是出按产品分层(样本分配原则是出口额高的产品多抽;对于一个产品,根据其出口额在全国各地分布分配样本。)口额高的产品多抽;对于一个产品,根据其出口额在全国各地分布分配样本。)问题:问题:2、样本点之间的复合连接、样本点之间的复合连接 ,造成重复统计,造成重复统计(1)企业类型()企业类型(生产型企业、流通型企业生产型企业、流通型企业)(2)按照产品分层,则一个地区的某个企业由于出口多种产品而被多次抽中。)按照产品分层,则一个地区的某个企业由于出口多种产品而被多次抽中。因此在统计因此在统计“受损企业比例受损企业比例”时该企业被重复计算。时该企业被重复计算。3、抽样框中包含非目标单位:、抽样框中包含非目标单位:若以上年企业出口额作为抽样依据;但该企业若以上年企业出口额作为抽样依据;但该企业的受调查产品当年没有出口。的受调查产品当年没有出口。减少有效样本数量减少有效样本数量4、避免调查表中内容的歧异:、避免调查表中内容的歧异:“所调查的产品所调查的产品” “本问卷所调查的产品本问卷所调查的产品” “进口国进口国” “贸易对象国贸易对象国” ;5、加强调查人员的责任意识加强调查人员的责任意识:一些出口总额小的地区会不能入样。一些出口总额小的地区会不能入样。采取登记制度和汇总结果的报告制度。采取登记制度和汇总结果的报告制度。八、针对本问卷本问卷所调查的产品,请统计在报告期内,国外技术性贸易措施对本企业出口造成的直接损失直接损失。(请填写数值,单位:万美元万美元) 贸易贸易 对象国对象国损失内容损失内容美国美国欧盟欧盟日本日本韩国韩国其他国家其他国家或地区或地区取消的定单扣留货物销毁货物退回货物额外费用*其他额外费用:主要指由于国外实施技术性贸易措施,额外新增的检验检疫费用、滞港费、手续费等;注:生产型企业填写此题时,只包含自主出口业务受到的直接损失。注:生产型企业填写此题时,只包含自主出口业务受到的直接损失。单位:万美元万美元总结:抽样方案的设计原则总结:抽样方案的设计原则n 便于组织实施便于组织实施 切实考虑工作条件和工作周期要求。切实考虑工作条件和工作周期要求。n 避免重要的非抽样误差避免重要的非抽样误差 详细分析可能出现的非抽样误差,并在工作环节的设详细分析可能出现的非抽样误差,并在工作环节的设计中设法消除这些因素的不良影响。计中设法消除这些因素的不良影响。n 减少和控制抽样误差减少和控制抽样误差 设计科学、合理的抽样方案,使样本在总体中分布均设计科学、合理的抽样方案,使样本在总体中分布均匀合理,更具代表性。匀合理,更具代表性。 问题与思考:问题与思考:20世纪80年代,美国可口可乐公司耗资500万美元,进行了历时2年的市场调查,调查了近20万名消费者。决定放弃传统配方,推出一代新的可口可乐。却几乎产生灾难性的后果。 可口可乐发展将近百年。但在20世纪80年代,它的市场销售增长率从平均每年13%猛降到2%。市场占有率从曾是百事可乐的2倍,变成只领先2.9个百分点。市场调查与决策:市场调查与决策:(1)出动2000名调查员,在10个主要城市调查消费者的口味。问卷的主要问卷的主要问题是:问题是:“如果在可口可乐配方中增加一种新的成分,使它喝起来更柔和,如果在可口可乐配方中增加一种新的成分,使它喝起来更柔和,您愿意吗?您愿意吗?结果有一多半的人表示接受,只有11%的人表示不安。(2)公司投资400万美元进行大规模的口味尝试活动。13个大城市的19.1万消费者参与口味尝试活动。在众多口味饮料中,消费者对新口味可乐青睐有加。55%的品尝者认为新口味超过传统配方。结论:立即生产新可乐。结论:立即生产新可乐。 (3)经过与全世界瓶装厂商量,并进行财务预算,公司决定:用新可乐代用新可乐代替传统可乐,停止传统可乐的生产与销售。替传统可乐,停止传统可乐的生产与销售。8.10 调查问卷设计调查问卷设计结果:结果: 新饮料上市新饮料上市4 4个小时,可口可乐公司接到个小时,可口可乐公司接到650650个抗议电话。个抗议电话。1010天后,每天后,每天接到天接到50005000多个抗议电话。更有雪片似的抗议信件。有人甚至说要改喝茶多个抗议电话。更有雪片似的抗议信件。有人甚至说要改喝茶水来代替可乐。公司不得不开辟水来代替可乐。公司不得不开辟8383个热线,雇佣大量的公关人员来处理这个热线,雇佣大量的公关人员来处理这些抱怨和抗议。些抱怨和抗议。 3 3个月以后,市场调研表明,只有不到个月以后,市场调研表明,只有不到30%30%的消费者说新可乐的好话了。的消费者说新可乐的好话了。愤怒的情绪在美国蔓延。社会学家认为,可口可乐公司把一个神圣的象征愤怒的情绪在美国蔓延。社会学家认为,可口可乐公司把一个神圣的象征毁掉了。毁掉了。 罗伯特罗伯特. .戈伊朱埃塔不得不率领公司全体高层管理者站在可口可乐的标戈伊朱埃塔不得不率领公司全体高层管理者站在可口可乐的标志下,向公众道歉,并宣布立即恢复传统配方生产。全国一片沸腾。有议志下,向公众道歉,并宣布立即恢复传统配方生产。全国一片沸腾。有议员在参议会回上发表演说:员在参议会回上发表演说:“这是美国历史上一个非常有意义的时刻,它这是美国历史上一个非常有意义的时刻,它表明有些民族精神使不可更改的。表明有些民族精神使不可更改的。”问题的根源是什么?问题的根源是什么? 耗资巨大、范围广泛、被调查者反映良好耗资巨大、范围广泛、被调查者反映良好问卷设计的问题:问卷设计的问题:在调查生产新饮料的同时,忘记询问:“如果是在停如果是在停止老饮料的情况下,您是否会选择新的饮料?止老饮料的情况