抽样调查方法讲义.pptx
《抽样调查方法讲义.pptx》由会员分享,可在线阅读,更多相关《抽样调查方法讲义.pptx(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章第八章 抽样调查方法抽样调查方法主要内容主要内容一、为什么要采用抽样调查方法一、为什么要采用抽样调查方法二、如何确定调查方案二、如何确定调查方案三、如何确定抽样框三、如何确定抽样框四、如何选取样本和确定样本容量四、如何选取样本和确定样本容量五、抽样调查的误差来源五、抽样调查的误差来源六、问卷设计技术六、问卷设计技术七、统计数据分析七、统计数据分析八、调研报告的文本结构八、调研报告的文本结构8.1 8.1 为什么要采用抽样调查方法为什么要采用抽样调查方法 普查的代价:普查的代价: 1. 费用昂贵费用昂贵 2. 时间过长时间过长 3. 观测值几乎是无穷个观测值几乎是无穷个 4. 毁坏性实验毁
2、坏性实验 5. 精度精度: 由一个训练有素的调查人员得到的样本统计结果,可能比没有受由一个训练有素的调查人员得到的样本统计结果,可能比没有受过训练的人进行普查得到的结果更准确过训练的人进行普查得到的结果更准确. . 抽样主要考虑:抽样主要考虑:调查的效率和精确性调查的效率和精确性 研究样本比研究总体的速度更快,花费更少;研究样本比研究总体的速度更快,花费更少; 可以把花费在不必要的数量过大的群体资料的精力和经费用在监测数可以把花费在不必要的数量过大的群体资料的精力和经费用在监测数据收集质量上据收集质量上8.2 如何确定调查方案如何确定调查方案1、调查目的、调查目的 指出调查所要达到的具体目标。
3、指出调查所要达到的具体目标。 调查研究的目的是进行调查的原因。调查研究的目的是进行调查的原因。(1 1)对特定人群的调查研究,可以描述、比较、预测他们的)对特定人群的调查研究,可以描述、比较、预测他们的认知、态度及行为。认知、态度及行为。(2 2)可以对所发生的事实进行调查。)可以对所发生的事实进行调查。例如:例如:(1 1)某社会组织可以通过抽样调查,分析人们对某项政策的看法,或者)某社会组织可以通过抽样调查,分析人们对某项政策的看法,或者调查某项政策实施是否有效。调查某项政策实施是否有效。()一批灯泡的废品率或平均寿命()一批灯泡的废品率或平均寿命()国家创新研究群体的意义、作用、成果、管
4、理中需要改进的问题,()国家创新研究群体的意义、作用、成果、管理中需要改进的问题,以及预测我国应保持多大的团队规模。以及预测我国应保持多大的团队规模。()北京市出租车司机的工作负荷情况和劳动收入情况。()北京市出租车司机的工作负荷情况和劳动收入情况。()国外技术性贸易措施()国外技术性贸易措施(TBTTBT)对我国对外贸易的影响情况;国外实)对我国对外贸易的影响情况;国外实施施TBTTBT的特点,我国企业在应对的特点,我国企业在应对TBTTBT时面临的困难,以及政府急需采取时面临的困难,以及政府急需采取的对策措施。的对策措施。2、调查大纲、调查大纲(调查研究的具体内容)(调查研究的具体内容)
5、只有在调查目的和内容都明确后,才能确定向谁调查、调查什么,以及采取什么方法。案例案例1:对中国妇女参政的看法:对中国妇女参政的看法(1)第一次研讨会的主要议题是什么?(主持人应如何把握会场研讨)(2)向谁发问卷?(3)根据调查结果,要向上级领导说明什么问题?注意:注意:在进行调查方案设计之前,必须准确地陈述调查目的在进行调查方案设计之前,必须准确地陈述调查目的以及调查研究的内容以及调查研究的内容(应该有详细的提纲)(应该有详细的提纲)案例案例2 2: 20072007年中国机电行业自主品牌产品出口情况抽样调查年中国机电行业自主品牌产品出口情况抽样调查(商务部(商务部总目的:总目的: 对对200
6、72007年全国机电行业自主品牌产品出口情况调查年全国机电行业自主品牌产品出口情况调查调查大纲:调查大纲:统计报告期内,全国机电行业出口企业的自主品牌出口额占该行业总出统计报告期内,全国机电行业出口企业的自主品牌出口额占该行业总出口额的比例;口额的比例;分析自主品牌出口额比例在分析自主品牌出口额比例在金属制品、机械及设备、电器及电子产品、金属制品、机械及设备、电器及电子产品、运输工具、仪器仪表等运输工具、仪器仪表等产品的分布情况;产品的分布情况;分析机电行业自主品牌出口额比例在各地区分布情况;分析机电行业自主品牌出口额比例在各地区分布情况;了解我国机电行业企业在发展自主品牌方面的认识现状;了解
7、我国机电行业企业在发展自主品牌方面的认识现状;了解企业采用贴牌出口的主要原因;了解企业采用贴牌出口的主要原因;了解我国机电行业企业在发展自主品牌出口方面多面临的主要困难,以了解我国机电行业企业在发展自主品牌出口方面多面临的主要困难,以及对政府扶持品牌发展的意见与建议。及对政府扶持品牌发展的意见与建议。8.3 如何确定抽样框如何确定抽样框1、目标总体:、目标总体:所有要调查的个体的集合所有要调查的个体的集合例如:例如:一批灯泡一批灯泡北京市全体出租车司机北京市全体出租车司机案例案例 : 20072007年中国机电行业自主品牌产品出口情况抽样调查年中国机电行业自主品牌产品出口情况抽样调查调查范围:
8、调查范围: 20072007年年1 1月月1 1日至日至20072007年年1212月月3131日的日的全国机电行业出口企业全国机电行业出口企业。(。(产品类型包产品类型包括括金属制品、机械及设备、电器及电子产品、运输工具、仪器仪表。)金属制品、机械及设备、电器及电子产品、运输工具、仪器仪表。)统计调查的报告期:统计调查的报告期:20072007年年1 1月月1 1日日 20072007年年1212月月3131日日有时需要按照调查要求,分别调查几个不同的目标总体有时需要按照调查要求,分别调查几个不同的目标总体 案例:案例:关于创新研究群体的调查问卷关于创新研究群体的调查问卷一共分为三套一共分为
9、三套:v 第一套:第一套:针对参加创新研究群体针对参加创新研究群体评审的专家评审的专家,以及国家自然科学基金委七,以及国家自然科学基金委七个学部的管理人员。从专家角度了解他们对创新研究群体资助计划的评价个学部的管理人员。从专家角度了解他们对创新研究群体资助计划的评价以及对管理问题的看法;以及对管理问题的看法;v 第二套:第二套:针对已经获得创新研究群体项目资助的针对已经获得创新研究群体项目资助的群体负责人群体负责人。了解群体成。了解群体成员对相关问题的看法以及他们的学术进展情况;员对相关问题的看法以及他们的学术进展情况;v 第三套:第三套:发放给已获得创新研究群体及杰出青年科学基金项目资助的各
10、高发放给已获得创新研究群体及杰出青年科学基金项目资助的各高校和科研机构的校和科研机构的科技处的管理人员科技处的管理人员(基金负责人)。除了解部分观点性问(基金负责人)。除了解部分观点性问题外,主要调查相关科研机构在创新研究群体的人才储备及研究基础方面题外,主要调查相关科研机构在创新研究群体的人才储备及研究基础方面的情况。的情况。2、样本:、样本:样本是目标总体的一部分样本是目标总体的一部分 在总体中抽取一部分个体进行观测统计,再根据这部分个体的观测信息推断总体的性质。3、样本容量、样本容量 n :样本中的个体数目样本中的个体数目 大样本:n 30 小样本:n 30是总体的代表(缩影),非常像,
11、但是小一些。样本中的重要特征应该与总体基本近似。例如:在TBT调查中,要了解出口企业受限比例 目标:目标:样本中的受限企业比例样本中的受限企业比例 = 总体中的受限企业比例总体中的受限企业比例4、抽样框:、抽样框:实施抽样的总体名单实施抽样的总体名单 进行抽样的第一步是获得一个符合条件的个体组成的总体名单,样本将在进行抽样的第一步是获得一个符合条件的个体组成的总体名单,样本将在这个总体名单中抽取这个总体名单中抽取 在实际操作时,我们是从抽样框中抽取一部分个体进行观测统计。在实际操作时,我们是从抽样框中抽取一部分个体进行观测统计。一个好的抽样框:一个好的抽样框:但是,但是,在实际情况下,有时抽样
12、框并不等于目标总体在实际情况下,有时抽样框并不等于目标总体例如:例如: (1)如果采用)如果采用2002年出口企业名录做关于年出口企业名录做关于2003年年TBT影响调查影响调查(2)银行关于某项政策的调研以一个旧的单位职员名单为抽样框)银行关于某项政策的调研以一个旧的单位职员名单为抽样框(3)国家杰出青年科学基金实施效果的评价)国家杰出青年科学基金实施效果的评价(可否采用大众评估?)(可否采用大众评估?)(4)哪些管理期刊在各个学科中是比较重要的?)哪些管理期刊在各个学科中是比较重要的?(让所有管理专家来评分?)(让所有管理专家来评分?)应包括所有的目标总体的成员应包括所有的目标总体的成员案
13、例案例: 文学摘要文学摘要民意测验民意测验 1936年美国总统选举年美国总统选举 F.D. Roosevelt (罗斯福)任美国总统的第一任期届满(民主党) A. Landon (兰登)Kansas州州长(共和党) 经济背景:经济背景:国家正努力从大萧条中恢复,失业人数高达九百万人。 The literary Digest文学摘要进行民意测验,将问卷邮寄给一千万人,他们的名字和地址摘自电话簿或俱乐部会员名册。其中240万人寄回答案(回收率24%)。 预测结果:预测结果:Roosevelt 43%, Landon 57% 竞选结果:竞选结果: Roosevelt 62%, Landon 38%
14、主要原因:主要原因: 选择偏倚选择偏倚将一类人排除在样本框之外(当时四个家庭中,只有一家安装电话)不回答偏倚不回答偏倚低收入和高收入的人倾向不回答抽样框 目标总体1936年美国总统竞选(年美国总统竞选(Gallup的预测)的预测)样本容量3000人,在摘要公布其预测结果之前,仅以一个百分位数的误差预言了摘要的预测结果。利用一个约5万人的样本,正确地预测了Roosevelt的胜利。 Roosevelt的百分数 盖洛普预言摘要的预测结果 44 摘要预测的选举结果 43 盖洛普预测的选举结果 56 选举结果 62从摘要要用的名单中随机选取3000人,并给他们每人寄去一张明信片,询问他们打算怎样投票。
15、大样本并不能防止偏倚:大样本并不能防止偏倚:当抽样框不正确时,抽取一个大的样本并当抽样框不正确时,抽取一个大的样本并无帮助,它只不过是在较大的规模下,去重复基本错误。无帮助,它只不过是在较大的规模下,去重复基本错误。案例(案例(P34P34):):以固定电话为基础进行选民投票民调以固定电话为基础进行选民投票民调,没有考没有考虑到只使用移动电话的用户虑到只使用移动电话的用户这些用户一般更年轻和热爱这些用户一般更年轻和热爱自由。自由。 2008 2008年在奥巴马与麦凯恩进行的美国总统大选中,盖洛年在奥巴马与麦凯恩进行的美国总统大选中,盖洛普、华盛顿邮报等民调组织都发现,普、华盛顿邮报等民调组织都
16、发现,如果不考虑移动用如果不考虑移动用户,民调结果会有个点的偏差;户,民调结果会有个点的偏差;如果考虑进来,则只有如果考虑进来,则只有个点的偏差。鉴于此次大选的票数差距极其微弱,这个偏差个点的偏差。鉴于此次大选的票数差距极其微弱,这个偏差就显得特别严重了。就显得特别严重了。 随机采样需要严密的安排和执行。一旦采样过程存在任随机采样需要严密的安排和执行。一旦采样过程存在任何偏见,分析结果就会相去甚远。何偏见,分析结果就会相去甚远。 (一)设计抽样方案的基本原则(一)设计抽样方案的基本原则 ()效果最佳原则:()效果最佳原则: 在固定费用下,选取调查精度最大的方案; 在要求的精度下,做到调查费用最
17、小。 ()可操作原则()可操作原则 根据现有的数据条件以及时间进度要求,设计便于操作的抽样方案。8.4 如何选取样本如何选取样本 ()代表性原则:()代表性原则:样本尽可能对总体有很好的代表性样本尽可能对总体有很好的代表性 调查者不根据主观意图挑选调查单位调查者不根据主观意图挑选调查单位定额抽样:定额抽样:样本被精心挑选,以使在某些关键特征上与总体相似。 例如:在 St. Louis 的访问人员访问13个对象,并规定其中s 6人住在近郊,7人住在市中心;s 男人7名,女人6名;s 在男人中,3人40岁以下,4人40岁以上;1名黑人,6名白人。s 6名白人支付的月租:1人支付的金额不少于44.0
18、1$ 3人支付的金额为18.01 44.00 $ 2人支付的金额不超过18.00 $ 年份 预测共和党得票 共和党实际得票 偏差 1936 44 38 6 1940 48 45 3 1944 48 46 2 1948 50 45 5在规定定额内,访问人员可以自由选取任何人。在规定定额内,访问人员可以自由选取任何人。有利于共和党的案例:案例:Gallup19361948年年采用定额抽样采用定额抽样Gallup民意测验在民意测验在1948年后总统选举中的记录年后总统选举中的记录(随机抽样:访问员无任何自主处理的权利)随机抽样:访问员无任何自主处理的权利) 年份 样本容量 获胜候选人 预测值 选举结
19、果 误差 1952 5385 艾森豪威尔 51.0% 55.4% +4.4% 1956 8144 艾森豪威尔 59.5% 57.8% -1.7% 1960 8015 肯尼迪 51.0% 50.1% -0.9% 1964 6625 约翰逊 64.0% 61.3% -2.7% 1968 4414 尼克松 43.0% 43.5% -0.5% 1972 3689 尼克松 62.0% 61.8% -0.2% 1976 3439 卡特 49.5% 51.1% +1.6% 1980 3500 里根 55.3% 51.6% -3.7% 1984 3456 里根 59.0% 59.2% -0.2% 1988 4
20、089 布什 56.0% 53.9% -2.1%(二)常见的抽样方法(二)常见的抽样方法 (1)简单随机抽样)简单随机抽样 对北航学生的研究能力进行抽样测试。在北航全校学生中随机抽取 n 名学生。 (2)分层抽样)分层抽样 分层次抽样:专科、本科、研究生、博士、博士后。 (3)整群抽样)整群抽样 在本科生中,随机抽取若干个班,观察每个班的全部学生。 (4)分段抽样)分段抽样 全国调查,随机抽取若干省,再随机抽取若干市,再随机抽取若干区,. (5)非随机抽样)非随机抽样 在临沂农贸市场抽样,询问进货地点。编制抽样框很困难。 原则:原则:调查者不能根据主观意图挑选调查单位。而是在总体中,按照随机原
21、则和纯粹偶然性的方法抽取样本。 8.5 简单随机抽样方法简单随机抽样方法简单随机抽样:简单随机抽样:每一个容量为每一个容量为 n 的可能样本被抽到的概率都是一样的。的可能样本被抽到的概率都是一样的。方法方法:(1)抽签法 (2)乱数表法(随机数字表)抽签法抽签法: 先将调查总体的每个单位编上号码,然后将号码写在卡片上搅先将调查总体的每个单位编上号码,然后将号码写在卡片上搅拌均匀,任意从中选取。抽到一个号码,就对上一个单位,直到抽足预拌均匀,任意从中选取。抽到一个号码,就对上一个单位,直到抽足预先规定的样本数目为止。先规定的样本数目为止。 放回抽样无限总体有限总体无放回抽样简单随机抽样NN优点:
22、优点: 可以获得一个无偏倚的样本可以获得一个无偏倚的样本使用限制:使用限制:实施操作并不简单实施操作并不简单(1)保证样本点被充分搅拌均匀;或需要使用随机数表;)保证样本点被充分搅拌均匀;或需要使用随机数表;()调查人员要寻找所有样本中的个体,有时是很困难的。()调查人员要寻找所有样本中的个体,有时是很困难的。()样本容量较小时,一些比例少但是很重要的个体不能入()样本容量较小时,一些比例少但是很重要的个体不能入样,使样本的代表性受到影响。样,使样本的代表性受到影响。例如:例如:在人民银行随机抽取在人民银行随机抽取100名职员,可能会抽不到高层管理人员。名职员,可能会抽不到高层管理人员。 20
23、07年全国有将近年全国有将近20万家出口企业。如果万家出口企业。如果TBT调查在全国抽调查在全国抽1000家家企业,很可能会有许多大型企业不能入样。企业,很可能会有许多大型企业不能入样。8.6 8.6 系统抽样方法系统抽样方法 又称“等距抽样等距抽样”或“机械抽样机械抽样” 特点:组织形式简单:特点:组织形式简单:不需要在抽样前对每一个单位进行编号。只要确定抽样起点和间隔,就可以确定整个样本单位。 (1)按照无关标志排队,按间隔抽取)按照无关标志排队,按间隔抽取 例如:例如:调查某企业职工收入时,按照姓氏比画排列职工名单,进行抽样。显然,职工工资与姓氏比画之间没有必然联系; (2)按照有关标志
24、排队,按间隔抽取)按照有关标志排队,按间隔抽取 例如:例如:进行农产量调查时,将总体单位按照上一年度的产量高低排序。这样,可以使标志值高低不同的单位均进入样本,样本单位在总体中分布均匀,抽样误差较小。 (3)按照自然位置顺序排列,按间隔抽取)按照自然位置顺序排列,按间隔抽取 例如:例如:工业产品检验时,按照生产时间顺序,每间隔一定时间抽取一定数工业产品检验时,按照生产时间顺序,每间隔一定时间抽取一定数量的样本;量的样本;检验一打发票时,可以按照顺序,每隔检验一打发票时,可以按照顺序,每隔10张抽取张抽取1张;张;在估计在估计果园的产量时,每隔果园的产量时,每隔7株抽取株抽取1株。株。 方法:方
25、法:随机起点,等距抽取。随机起点,等距抽取。 (1)按照某种顺序给总体中的N个单元排列编号; (2)计算间距: (3) 随机选取起始的样本点编号数。然后依次抽取编号如下的 n 个单元作为样本点。 如果得到某编号数 M 大于 N,则抽取的编号为 ( M N ) nNkknikikii) 1(,2,总体N=60 从此开始1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 抽中 抽中 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30抽中31 32 33 34 35 36 37 38 39 40 41 42 43 44 45抽中 抽中46 4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 方法 讲义
限制150内