社会调查方法——抽样36553.pptx
《社会调查方法——抽样36553.pptx》由会员分享,可在线阅读,更多相关《社会调查方法——抽样36553.pptx(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 四章四章 抽抽 样样 抽抽样样使使我我们们能能从从总总体体具具有有代代表表性性的的部部分分样样本本中中获获取取数数据据,从而可以得到关于整个总体的有效结论。从而可以得到关于整个总体的有效结论。英英 托尼托尼普罗科特普罗科特社会调查方法社会调查方法浙江工业大学浙江工业大学开篇案例 我们知道,近几十年来,美国总统大选前夕,总有一些民意测验机构喜欢对总统选择投票的结果进行预测。1936年美国总统选举前夕,盖洛普民意测验所仅仅调查了3000人,就成功地预测了民主党人罗斯福将当选为美国的新一任总统。1984年这家民意测验机构又一次成功地预测了罗纳得里根将以59%比41%的优势战胜蒙代尔而当选为美国
2、的新一任总统。这一预测结果与实际投票结果(59%:41%)相一致。而当时盖洛普民意测验所在将近1亿美国选民中,调查的对象还不到2000人。社会调查方法社会调查方法浙江工业大学浙江工业大学案例2004年美国大选主要民调样本数调查机构调查机构样本量样本量福克斯新闻福克斯新闻 1200 1200 盖洛普盖洛普 1573 1573 全国广播公司全国广播公司/华尔街日报华尔街日报 1014 1014 哥伦比亚广播公司哥伦比亚广播公司/纽约时报纽约时报 939 939 美国广播公司美国广播公司/华盛顿邮报华盛顿邮报 939 939 新闻周刊新闻周刊 882882社会调查方法社会调查方法浙江工业大学浙江工业
3、大学51.3448.3148.3120042004年美国总统大选一周前民调结果年美国总统大选一周前民调结果社会调查方法社会调查方法浙江工业大学浙江工业大学抽样与我们的生活抽样与我们的生活v生活中充满了抽样 冬泳之前,用脚尖试探一下水温;做菜时,用勺子舀起一些试试味道浓了还是淡了;在书店挑选一本营销调研的书籍,随手拿起一本,翻看其中几页以决定是否购买;体检时抽一试管的血看看身体血液情况;社会调查方法社会调查方法浙江工业大学浙江工业大学为什么需要抽样?为什么需要抽样?v一些实验本质上是破坏性的v物理上不具备考察总体所有项目的可能性v对总体每一项目逐一考察费用过高v对总体每一项目逐一考察相当耗时v样
4、本结论充分性社会调查方法社会调查方法浙江工业大学浙江工业大学抽样方法论抽样方法论v抽样过程就是使用少量项目或者总体的一部分得出关于整个总体的结论v样本(sample)是一个更大的总体的子集或一部分v抽样的目的在于帮助我们对总体的一些未知特征进行估计社会调查方法社会调查方法浙江工业大学浙江工业大学抽样的有关术语抽样的有关术语抽样的基本程序抽样的基本程序抽样类型(方法)抽样类型(方法)样本规模与抽样误差样本规模与抽样误差1234社会调查方法社会调查方法浙江工业大学浙江工业大学一、抽样的有关术语1 1、总体总体(PopulationPopulation)(此指调查总体)(在社会调查中用)(此指调查总
5、体)(在社会调查中用N N表示)表示)通常与构成的元素共同定义,总体是构成它的所有元素的集合,而元通常与构成的元素共同定义,总体是构成它的所有元素的集合,而元素则是构成总体的基本单位。素则是构成总体的基本单位。(1)(1)研究总体:是在理论上明确界定的个体(分析单位)集合体。(是理论研究总体:是在理论上明确界定的个体(分析单位)集合体。(是理论上的总体)上的总体)(2)(2)调查总体:是研究者实际抽样样本的个体(分析单位)的集合体。(是调查总体:是研究者实际抽样样本的个体(分析单位)的集合体。(是实际操作中的总体)实际操作中的总体)二者不同:研究总体是我们概念上的,而调查总体是我们实际抽取样二
6、者不同:研究总体是我们概念上的,而调查总体是我们实际抽取样本的集合。二者关系:调查总体应当无限趋近直至等于本的集合。二者关系:调查总体应当无限趋近直至等于研究总体。研究总体。如:开展对某省大学生择业倾向调查时,该省所有在校大学生的集合就是研如:开展对某省大学生择业倾向调查时,该省所有在校大学生的集合就是研究总体,每个在校大学生就是构成总体的元素。该省所有在册大学生则究总体,每个在校大学生就是构成总体的元素。该省所有在册大学生则构成调查总体。构成调查总体。2 2、样本样本(SampleSample)(社会调查中用)(社会调查中用n n表示)表示)是从调查总体中按一定方式抽取出来的那一部分代表的集
7、合体。是从调查总体中按一定方式抽取出来的那一部分代表的集合体。社会调查方法社会调查方法浙江工业大学浙江工业大学3.3.抽样(抽样(SamplingSampling)是一种选择调查对象的程序与方法,即从总体中选取一部分代表的过程,是一种选择调查对象的程序与方法,即从总体中选取一部分代表的过程,也即从总体中按一定方式选择或抽取样本的过程。也即从总体中按一定方式选择或抽取样本的过程。如:从某省总数为如:从某省总数为1010万人的大学生总体中按照一定方式抽取出万人的大学生总体中按照一定方式抽取出10001000名大名大学生进行调查,这学生进行调查,这10001000名大学生就是构成总体的一个样本。(名
8、大学生就是构成总体的一个样本。(从一个总体中从一个总体中可以抽取出若干个不同的样本可以抽取出若干个不同的样本)4.4.抽样单位抽样单位(Sampling Unit)(Sampling Unit)一次直接的抽样所使用的基本单位。抽样单位和构成总体的元素有时相一次直接的抽样所使用的基本单位。抽样单位和构成总体的元素有时相同,有时不同。同,有时不同。5.5.抽样框抽样框(Sampling FrameSampling Frame)也称抽样范围,指抽取样本的所有抽样单位的名单。也称抽样范围,指抽取样本的所有抽样单位的名单。如:从某所大学全体学生中直接抽取如:从某所大学全体学生中直接抽取200200名学生
9、作为样本名学生作为样本该校全体学生的名单该校全体学生的名单 从某一所大学所有班级中抽取从某一所大学所有班级中抽取3 3个班级作为样本个班级作为样本该校所有班级的名单该校所有班级的名单社会调查方法社会调查方法浙江工业大学浙江工业大学6.6.参数值参数值(Parameter)(Parameter)也称总体值,是关于总体中某一变量的综合描述。也称总体值,是关于总体中某一变量的综合描述。如:某厂职工的平均收入、平均年龄如:某厂职工的平均收入、平均年龄7.7.统计值统计值(StatisticStatistic)也称样本值,是关于样本中某一变量的综合描述。也称样本值,是关于样本中某一变量的综合描述。如:某
10、厂职工中抽取出一部分,得到的平均收入、平均年龄如:某厂职工中抽取出一部分,得到的平均收入、平均年龄参数值与统计值之间的区别与联系:参数值与统计值之间的区别与联系:(1)(1)参数值是确定不变的、唯一的,并且通常是未知的。参数值是确定不变的、唯一的,并且通常是未知的。(2)(2)统计值则是变化的,即对于同一个总体来说,不同样本所得到的统计值统计值则是变化的,即对于同一个总体来说,不同样本所得到的统计值常常是有差别的;对于某一个特定的样本来说,统计值是已知的,是可以通常常是有差别的;对于某一个特定的样本来说,统计值是已知的,是可以通过计算得到的。过计算得到的。(3)(3)联系:通过样本统计值可以推
11、算总体参数值,从而达到调查部分以认识联系:通过样本统计值可以推算总体参数值,从而达到调查部分以认识总体的目的。这就是抽样调查的作用所在。总体的目的。这就是抽样调查的作用所在。社会调查方法社会调查方法浙江工业大学浙江工业大学8.8.抽样误差抽样误差(Sampling ErrorSampling Error)是指在用样本统计值去推估总体参数值时所存在的偏差。它是由是指在用样本统计值去推估总体参数值时所存在的偏差。它是由抽样本身的随机性引起的,是不可避免的。但是抽样误差的大小抽样本身的随机性引起的,是不可避免的。但是抽样误差的大小是控制的。是控制的。抽样误差的意义:是衡量样本代表性好坏的标准,抽样误
12、差越小,抽样误差的意义:是衡量样本代表性好坏的标准,抽样误差越小,说明样本的代表性越好,反之,则越不好。说明样本的代表性越好,反之,则越不好。社会调查方法社会调查方法浙江工业大学浙江工业大学9.9.置信水平与置信区间置信水平与置信区间(1 1)置信水平()置信水平(Confidence LevelConfidence Level)也称置信度,指的是总体参数值落在样本统计值某一区间内的概率。也称置信度,指的是总体参数值落在样本统计值某一区间内的概率。(2 2)置信区间()置信区间(Confidence IntervalConfidence Interval)是指在一定范围的置信水平下,样本统计值
13、与总体参数值之间的误差范围是指在一定范围的置信水平下,样本统计值与总体参数值之间的误差范围(3 3)置信水平与)置信水平与置信区间的关系的关系置信水平反映的是抽样的可靠性程度,置信区间反映的是抽样的精确性程置信水平反映的是抽样的可靠性程度,置信区间反映的是抽样的精确性程度。度。在其他条件不变的情况下,置信水平越高,置信区间越大;置信水平越低,在其他条件不变的情况下,置信水平越高,置信区间越大;置信水平越低,置信区间越小。对抽样的可靠性程度要求越高,抽样的精确性程度将越低;置信区间越小。对抽样的可靠性程度要求越高,抽样的精确性程度将越低;对抽样的可靠性程度要求越低,则抽样的精确性程度将越高。对抽
14、样的可靠性程度要求越低,则抽样的精确性程度将越高。社会调查方法社会调查方法浙江工业大学浙江工业大学抽样的有关术语抽样的有关术语抽样的基本程序抽样的基本程序抽样类型(方法)抽样类型(方法)样本规模与抽样误差样本规模与抽样误差1234社会调查方法社会调查方法浙江工业大学浙江工业大学二、抽样的基本程序二、抽样的基本程序(一)界定总体(一)界定总体 即在具体抽样前,对从中抽取样本的总体范围作出明确的即在具体抽样前,对从中抽取样本的总体范围作出明确的界定。界定。为什么要对总体进行界定?为什么要对总体进行界定?原因之一:是由抽样调查的目的决定的,其目的是调查部原因之一:是由抽样调查的目的决定的,其目的是调
15、查部分以反映总体。分以反映总体。原因之二:界定总体是达到良好的抽样效果的前提条件。原因之二:界定总体是达到良好的抽样效果的前提条件。例如:例如:19361936年美国总统大选前年美国总统大选前文学文摘文学文摘杂志的抽样杂志的抽样 社会调查方法社会调查方法浙江工业大学浙江工业大学思考思考 美国的美国的文学文摘文学文摘是一本是一本18901890年年19381938年间在美国发行颇为流年间在美国发行颇为流行的新闻杂志。行的新闻杂志。19201920年、年、19241924、19281928、19321932年的美国总统大选前都作年的美国总统大选前都作出了准确的预测。出了准确的预测。19361936
16、,文学文摘文学文摘进行了一次最具雄心的民意测进行了一次最具雄心的民意测验活动:选票寄给了从电话簿与车牌登记单中挑选出来的验活动:选票寄给了从电话簿与车牌登记单中挑选出来的10001000万人。万人。收到了收到了200200万人以上的回应;结果显示,有万人以上的回应;结果显示,有57%57%人支持共产党候选人阿人支持共产党候选人阿尔夫尔夫兰登,而当时在任的美国总统富兰克林兰登,而当时在任的美国总统富兰克林罗斯福的支持率为罗斯福的支持率为43%43%。两个星期以后全民选举的结果出来了,罗斯福以历史上最大的优两个星期以后全民选举的结果出来了,罗斯福以历史上最大的优势势61%61%的得票率获得第二届任
17、期。的得票率获得第二届任期。v思考:为什么思考:为什么文学文摘文学文摘的预测会失败?的预测会失败?社会调查方法社会调查方法浙江工业大学浙江工业大学(二)选择抽样的具体方法,确定抽样的精确性程度与样本(二)选择抽样的具体方法,确定抽样的精确性程度与样本规模规模如何确定抽样的精确性和样本规模(待)如何确定抽样的精确性和样本规模(待)(三)制作抽样框(回顾什么是抽样框)(三)制作抽样框(回顾什么是抽样框)当采用一次性抽样时,应依据已经明确界定的总体范围,当采用一次性抽样时,应依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并对名单按随机原则进收集总体中全部抽样单位的名单,并对名单按随机原则
18、进行统一编号,建立起供抽样使用的抽样框。行统一编号,建立起供抽样使用的抽样框。例如:我们要在浙江工业大学进行一项该校学生职业观的例如:我们要在浙江工业大学进行一项该校学生职业观的抽样调查。抽样调查。注意:当采取多级抽样时,则需制作多个抽样框。注意:当采取多级抽样时,则需制作多个抽样框。例如:为了了解某市小学生的学习情况,需要从全市例如:为了了解某市小学生的学习情况,需要从全市500500所小学中抽取所小学中抽取500500名小学生调查。名小学生调查。社会调查方法社会调查方法浙江工业大学浙江工业大学准确的抽样框原则:准确的抽样框原则:1 1、完整性、完整性2 2、不重复性、不重复性 例如:例如:
19、在城市居民户的抽样中,会经常出现一户有多处住房的在城市居民户的抽样中,会经常出现一户有多处住房的情况,这样很容易把一户重复列入抽样框,使得他们在抽情况,这样很容易把一户重复列入抽样框,使得他们在抽样中的中选概率高于其他居民,相反,许多城市居民居住样中的中选概率高于其他居民,相反,许多城市居民居住条件比较差,很多居民同住在一个门牌号中,因此很容易条件比较差,很多居民同住在一个门牌号中,因此很容易遗漏。两种情况均违背了随机抽样的等概率原则。遗漏。两种情况均违背了随机抽样的等概率原则。社会调查方法社会调查方法浙江工业大学浙江工业大学(四)实际抽取样本(四)实际抽取样本 即在前进几个步骤的基础上,严格
20、按照所选定的抽样方法,从抽样框中抽即在前进几个步骤的基础上,严格按照所选定的抽样方法,从抽样框中抽取一个个抽样单位,构成调查样本。取一个个抽样单位,构成调查样本。(五)评估样本质量(五)评估样本质量 所谓样本评估,就是对样本的质量、代表性、偏差等进行初步的检验和衡所谓样本评估,就是对样本的质量、代表性、偏差等进行初步的检验和衡量,其目的是防止由于前面步骤中的失误而使样本偏差太大,进而导致量,其目的是防止由于前面步骤中的失误而使样本偏差太大,进而导致整个调查的失误。整个调查的失误。评估样本的基本方法评估样本的基本方法:将可得到的反映总体中某些重要特征及其分布的资:将可得到的反映总体中某些重要特征
21、及其分布的资料与样本中的同类指标的资料进行对比。若二者之间的差别很小,则可料与样本中的同类指标的资料进行对比。若二者之间的差别很小,则可认为样本的质量较高,代表性较好;反之,若二者之间的差别十分明显,认为样本的质量较高,代表性较好;反之,若二者之间的差别十分明显,则表明样本的质量和代表性不可能高。因而需要对前面的抽样步骤进行则表明样本的质量和代表性不可能高。因而需要对前面的抽样步骤进行检查、修正,直到抽出质量较高、代表性较好的样本为止。检查、修正,直到抽出质量较高、代表性较好的样本为止。社会调查方法社会调查方法浙江工业大学浙江工业大学例如:例如:从我校从我校30003000名学生中抽取名学生中
22、抽取300300名学生作为样本。同时,名学生作为样本。同时,我们从学校教务处或学生处得到下列统计资料:全校我们从学校教务处或学生处得到下列统计资料:全校男生男生占学生总数的占学生总数的53%53%,女生占,女生占47%47%;本市学生占本市学生占40%40%,外省学,外省学生占生占60%60%。那么,我们可以对抽出的。那么,我们可以对抽出的300300名学生进行这两方名学生进行这两方面分布情况的统计。假定样本统计得到的结果是:面分布情况的统计。假定样本统计得到的结果是:男生占男生占52%52%,女生占女生占48%48%;本市学生占本市学生占41%41%,外省学生占外省学生占59%59%。两相对
23、。两相对比,可以发现二者之间的差距很小,这就在一定程度上说比,可以发现二者之间的差距很小,这就在一定程度上说明,样本的质量较高,代表性较好,从这样的样本中得到明,样本的质量较高,代表性较好,从这样的样本中得到的结果往往能较好地反映和体现总体的情况。的结果往往能较好地反映和体现总体的情况。社会调查方法社会调查方法浙江工业大学浙江工业大学抽样的有关术语抽样的有关术语抽样的基本程序抽样的基本程序抽样类型(方法)抽样类型(方法)样本规模与抽样误差样本规模与抽样误差1234社会调查方法社会调查方法浙江工业大学浙江工业大学三、抽样类型 根据调查总体中每一个个体有无同等的机会入选样本,根据调查总体中每一个个
24、体有无同等的机会入选样本,可以将抽样分为概率抽样与非概率抽样两大类。可以将抽样分为概率抽样与非概率抽样两大类。概率抽样概率抽样是依据概率论的原理,按照是依据概率论的原理,按照等概率原则等概率原则进行进行的抽样,因而它能够避免抽样过程中的人为误差,保证样的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性。此法在社会调查最常用。本的代表性。此法在社会调查最常用。非概率抽样非概率抽样主要是依据研究者的主观意愿、主观判断主要是依据研究者的主观意愿、主观判断或是否方便等因素来抽取调查对象,它或是否方便等因素来抽取调查对象,它不考虑抽样中是否不考虑抽样中是否等概率等概率,因而往往产生较大的误差,
25、难以保证样本的代表,因而往往产生较大的误差,难以保证样本的代表性。此法在社会调查中用得较少。性。此法在社会调查中用得较少。社会调查方法社会调查方法浙江工业大学浙江工业大学根据抽取调查对象的具体方式的不同,又可分将概率抽样与非概率抽样分为若干小类,具体分类如下图所示。简单随机 系统抽样 概率抽样 分层抽样 整群抽样抽样方法 多段抽样 偶遇抽样 非概率抽样 判断抽样 定额抽样 雪球抽样 probability sample Non-probability sample sample社会调查方法社会调查方法浙江工业大学浙江工业大学(一)概率抽样1 1、简单随机抽样(、简单随机抽样(Simple Ra
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会调查 方法 抽样 36553
限制150内