社会经济调查方法课件.pptx
《社会经济调查方法课件.pptx》由会员分享,可在线阅读,更多相关《社会经济调查方法课件.pptx(88页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 西安财经学院 经济学院 经济学系 王宗鱼 第一节 调查研究概述一、社会调查研究方法的界定:就是通过向被访者询问问题来搜集资料,并对资料进行统计分析的一种量化的社会研究方法。 理解其内涵需注意以下三点:1、询问-作为调查研究的基本要素,是一个科学测量过程。2、选取有代表性的被访者,是调查研究成功的关键。 抽样调查-现代调查最常用的技术。 抽样误差-抽样调查特有误差,影响抽样质量。 (1)随机原则(2)增加样本数目(3)选择恰当抽样方式3、统计分析-是完成调研的必要环节。总之,社会经济调查研究是通过对事实的考察,现状的了解,材料搜集来认识社会经济问题,或探讨社会经济现象之间联系的研究方法。二、调
2、查研究发展简史(一)近代调查研究_主要包括行政和社会问题调查。 公元前21世纪 夏朝 华夏大地分九州 人口1355万人 土地约2438万顷 1676年 英国 威廉.配第政治算术 首次以数字资料为基础用计算和对比方法,系统地比较了英、法、荷三国经济、军事、政治等方面的实力。并提出用图表形式概括数字资料的理论和方法。政治算术学派是采用计量方法研究社会经济问题,应用大量观察法、分类法、通过对比、综合、推算等方法解释与说明社会经济活动,构建了初具规模的社会经济统计的研究方法体系。 (二)现代调查研究-民意测验、市场调查和研究性调查。 从调查研究发展简史中可以看出,调查研究是一项综合了多项技术的研究方法
3、,抽样和统计分析技术的完善,进一步扩展了调查的应用范围。三、社会经济调查研究的局限性 1、缺乏弹性 2、无法了解被访者具体的生活情境 3、易受人为因素影响一、按调查对象的范围分类: 1、普查:人口普查(53、64、82、90、2000) 2、抽样调查二、按调查目的要求分类 1、探索性调查 2、描述性调查 3、解释性调查三、按执行方式分类: 1、自填问卷 2、当面访问 3、电话访问(2009年底,中国电话用户数10亿6千万户,其中移动7.5亿户) 四、按时间维度分类: 1、单一时点的横剖调查 2、多重时点的纵贯调查五、按应用领域分类: 1、人口调查 2、抽样调查 3、民意调查 4、市场调查 5、
4、社会问题调查 6、居民家计调查 7、学术性专业调查一、调查设计(一)调查工作的总体规划(二)抽样设计(三)资料搜集和处理方案二、实际抽样三、资料搜集四、资料处理五、撰写报告调查研究的最后一步 第一节 抽样概述一、抽样的概念:抽样是指根据某种既定规则从一个总体中选取一组元素的过程,由此产生的元素集合称为样本。 抽样方法大体可分为两类: 1、非概率抽样依据主观愿望、判断或方便与否选取。 2、概率抽样按随机原则选取样本。 两种方法的最大差别是:非概率抽样无法估算出抽样误差二、非概率抽样(一)方便抽样(任意抽样)又称为偶遇抽样是指研究者使用对自己最为便利的方法抽样,它是非几率抽样中最简便、费用最省的一
5、种方法,多用于市场初步调查,或对市场情况不甚明了时采用,正式调查较少采用。(二)判断抽样是根据研究目的或专家判断来选取样本。 其对研究者的研究素质有较高要求。市场调查实践中常用的典型调查、重点调查,其实质属于判断抽样法的具体应用。(三)配额抽样是指市场调查总体按某些属性特征进行分层,对分层后的副次母体样本,按一定的特征规定样本配额,配额内的样本则由调查人员主观判断选定。(四)雪球抽样也称网络抽样,是一种根据已有研究对象的介绍,不断辨识和找出其他研究对象的累积抽样方法。三、概率抽样设计特点(一)编制抽样框: 进行概率抽样,必须先找到一份近似涵盖所有总体元素的清单,然后从中抽取部分元素,这份元素清
6、单被称为抽样框。(二)选择抽样方法: 概率抽样是按照随机原则从总体中抽取部分要素构成样本来推断总体数量特征的方法。所谓随机原则是指抽样时总体的每个元素都有一个已知的、非零的被抽取的概率。常见的抽样方法有:简单随机抽样、系统抽样、分层抽样、整群抽样和多级抽样等。(三)估计抽样误差 统计值与参数值之间的差异被称为抽样误差(四)确定抽样规模 由于样本规模的大小直接影响到抽样变异性,因此抽样设计需要事先估计有效样本规模。一、总体定义 编制抽样框工作的第一步是定义总体,只有对总体构成及边界有一个清晰的认识,才能最大限度的使抽样框与总体保持一致。具体来说,总体可划分为目标总体和抽样总体。 1、目标总体:是
7、理论上具有研究者所考察特征的总体元素。 2、抽样总体(调查总体):有那些有机会被抽取到的总体元素构成的集合体,就是抽样总体或调查总体。 如对某市大学生择业倾向调查中的“大学生”二、编制抽样框 对于抽样而言,真正具有操作意义的是确定抽样框,没有抽样框实际抽样就无法进行。抽样框有两类: 1、名单抽样框 2、区域抽样框一、简单随机抽样:也叫纯随机抽样。它是概率抽样的最基本形式,其他概率抽样方法都是在此基础上派生出来的。常用的抽样方法包括两种:(一)抽签法:当总体数目N不大时,可以采用之。(二)随机数法:当总体单位很多时,通常采用随机数法。 具体操作可以利用随机数表、随机数骰子、计算机产生的伪随机数等
8、进行抽样。 其中最常用的是随机数表。随机数表是由范围在0000199999内的五位数的随机数排序构成。(若N100000,可随机抽取样本) 用随机数表产生随机数,需解决以下问题: 1、确定随机数的位数。如N=900 即需要3位数的随机数。 2、决定从5位数组中选择那几位数字。左右,右左或中间3位。 3、确定在表中选择数字的顺序。上下,下上,左右,右左 ,对角线 4、确定开始选择的5位数组起点。 5、处理大于总体规模或重复的随机数(跳过或舍弃这个数)二、系统抽样 实际抽样中经常采用的是系统抽样,又称机械抽样。由于等间距抽取,是最常用的规则,故又称为等间距抽样。常用的等距抽样方法包括:直线等距抽样
9、和循环等距抽样,两者的区别在于总体规模N是否为样本规模n的整数倍。(一)整数抽样间距(直线等距抽样):当N是n的整数倍,间距k=N n为整数,先在1k的范围内抽取一个随机数r作为起点,然后每隔k个单位抽出一个单位,直到抽足n为止。(二)非整数抽样间距:当N不是n的整数倍时,可采用以下两种方法抽样: 1、循环等距抽样:先将N单位,首尾相接,排成一个封闭园,间距K取最接近N/n的整数,再从1 N中随机抽取一个起始单位,然后每隔K 抽取一个单位,直到抽足n单位为止。2、调整直线等距抽样:先将非整数K的小数点后移,使其称为整数K,然后再1K之间选定一个整数随机起点,接下来再将r的小数点移回来,成为非整
10、数随机起点,由其开始每隔K各单位抽出一个单位,直到抽足n个单位,再将小数部分略去,便相应得到入样单位号码。 注意排队方法。无关标志排队;有关标志排队。三、分层抽样(也叫类型抽样)(一)定义:也叫类型抽样,是先将总体N个单位,按某种特征划分成若干个子总体,称为层,然后在每个层中分别独立的进行抽样,最后将抽出的子样本合起来构成总体样本。(二)适合条件: 分层抽样要遵循:“层内同质性,层间差异性。”这种方法适用于母体范围大,母体中各子体间差异大且分布不均匀时抽取样本。(三)样本量在各层的分配方法 1、分层比例抽样(最常见):依各层占母体的比例确定应抽样本数。 ni= (Ni N ) n如:调查某市居
11、民家用电器用品潜在需求量。已知该市有居民户100万户,计划抽取样本1000个(1),居民家庭按收入划分为高、中、低三层,其中高收入户15万户,中等收入户65万户,低收入户20万户,若采取分层比例抽样,各层应抽取样本数分别是: 高收入层应抽取=(15 100) 1000=150户 中收入层应抽取=(65 100) 1000=650户 低收入层应抽取(20 100) 1000=200户2、分层最佳抽样法(也叫非比例抽样法):它不仅按各层占母体中的比例来分配样本数,而且还根据各层的样本标准差的大小,调整各层的样本数目的抽样方法。它采取同时兼顾层的大小和差异程度大小来抽样。各层样本数计算公式为: ni
12、= (N iSi N iSi ) n 若S高=300元 S中=200 S低=50 因为N iSi =15 300+65 200+50 20 =4500+13000+1000 =18500所以,n高=(4500 18500) 1000=243户 n中=(13000 18500) 1000=703户 n低=(1000 18500) 1000=54户 3、最低成本抽样法:如果各层单位调查费用差异较大,样本量最优分配原则是:单位调查费用越低的层,抽样越多。这时抽样比与层内单位平均调查费用的平方根成反比。样本量的确定公式为: ni= 【(NiSi / Ci ) NiSi / Ci】 n 例如调查一个市的
13、市场情况,从地理位置上分为城区、近郊区、远郊区县。如果各地区之间水平差异不大,抽取一定样本都能反映母体情况,而远郊区县调查费用较高,可适当调低选样数目,以便降低调查费用。 实际抽样中,除非各层的标准差相差非常大,一般大多采用按比例分配的方式确定样本数。 四、整群抽样(一)含义:是先将总体划分成若干个群,然后按随机原则从总体中抽取一部分群,由抽取的群构成总体样本。 通常情况下,其抽样误差大于简单随机抽样,但其抽样框编制容易,样本单位分布较集中。(二)群的性质:经常用到的是“自然群”。即由行政或地域区划形成的群。如学校、企业、区县、村镇、省市。 群的划分应遵循以下原则: 群内方差尽可能大,群件方差
14、尽可能小。即群内差异性,群间相同性。与分层原则恰好相反:异质的群,同质的层。 实际抽样中,影响样本代表性的有两类误差:抽样误差和非抽样误差。其中抽样误差是一种随机误差,只要进行抽样调查,都会产生抽样误差。但在概率抽样中,抽样误差是可以事先估算出来的。一、简单随机抽样的抽样误差(一)重复抽样方法下1、平均数的抽样平均误差(ux)2、比率的抽样平均误差(up)(二)不重复抽样方法下1、平均数的抽样平均误差(ux)2、比率的抽样平均误差(up) 从上述计算公式中可以看出:不重复抽样方法下的抽样平均误差总是小于重复抽样,所以,实际中为了提高样本代表性,通常采用不重复抽样方法抽取样本。二、简单随机抽样的
15、样本规模(样本容量)计算确定(一)影响样本规模的因素:1、总体标准差大小2、抽样推断概率保证程度3、抽样允许误差即抽样精度的高低4、抽样方式的不同5、抽样方法不同 (二)样本规模的计算1、重复抽样方法下平均数和比率的样本规模计算2、不重复抽样方法下平均数和比率的样本规模计算注意问题:1、上面公式计算的样本规模是最低的,也是最必要的样本。2、一般总体方差是未知的,在实际计算时往往利用有关资料代替。在比率的方差完全缺乏资料的情况下可采用比率方差最大值0.25来代替即p=0.53、如果进行一次抽样调查,同时对总体平均数和比率进行区间估计,可计算两个样本容量n1和n2,一般情况下,为了同时满足两个推断
16、的要求,一般在两个样本容量中选择较大的一个。 4、计算的样本容量不一定是整数,如果带小数,一般不采取四舍五入的办法化成整数,而是用比这个数大的邻近整数代替。如n=64.03,则样本容量应确定为65个。 第一节 区域抽样 区域抽样是一种实用的抽样方法,它能为抽选居民住户提供很好的抽样方法。一、按户籍资料PPS抽样(按规模大小成比例的概率抽样)步骤如下:(一)计算总的抽样比(二)确定各级抽样单位和计划样本规模(三)对PSU(初级抽样单位)分层和确定层内样本规模(四)在层内抽取PSU (五)在PSU内抽取次级抽样单位二、从住户中抽取被访者户内抽样 一般说来,多阶段抽样的最后一级抽样单位往往是居民住户
17、,但所抽到的居民住户大多是由多名成员构成的。在实际调查中,通常需要从这些成员中按一定规则抽取一位成年人作为调查对象,这就是所谓的户内抽样。当前抽样调查中比较常用的是Kish表抽样法。 Kish表抽样法是通过附在问卷的第一页上的一份抽样页来进行的,抽样页内包括被访问住户的地址、住户家庭成员登记表和抽样表等项内容。1、填写住户成员情况 2、根据抽样表抽取被访者三、按居住地地图法抽样 区域抽样中,抽取居民户需要一份详细的居民户名单抽样框,通常这要根据户籍资料编制。若没有现成的户籍资料,或已有的户籍资料不完备、过时了的情况下,可以采用地图法直接从居住地抽取居民户。(一)对抽样区域分层(二)选定进行抽样
18、的地图(最新出版,比例尺较小)(三)选出地图上的坐标点(四)训练访问员(步测训练、计算步距)(五)访问员实地确定坐标点(六)抽取居民住户(以邮差送信的地址为单位的户) 由于采用当面访问费用很高,加上入户调查越来越困难,因此,除了一些有特殊目的的调查外,电话访谈正越来越普遍的取代访问员访谈。加上电话普及率的提高,使其调查变得更为实用。据统计,截止2009年末,我国电话用户已达10.6亿户,其中移动电话7.4亿户。 一、搜集相关信息 (一)搜集电话局编码(第一步) 在抽样区域的地理范围内,无遗漏的搜集电话号码字冠(如8位数电话号码的前4个数字),这种字冠叫中心电话局编码。取得的最简单方法是花钱或通
19、过在电信公司中认识的熟人索取。(二)确定电话局编码的线路数量 最好从电信部门获得抽样区域内每个电话局编码所涵盖的、可以正常运作的家用电话线路的数量,以此所占总线路比例来产生电话号码。 如某市共有8个电话局,其中3个局(6864局、6866局、6869局)占了该市8000条家用电话线路的四分之三,分别拥有的有效号码数为3000个、2000个和1000个,各自所占比例为37.5%、25%、和12.5%,若需随机拨出电话号码的样本规模为1000个,则3个局的样本分别是375个、250个、和125个。(三)确认无效号码范围 无效号码可能是非家用电话号码或电信部门未放号的号码。如果能事先将这些号码去掉,
20、无疑会大大提高随机数字拨号的效率。 如已知6864局的家用电话号码范围是20003999,则6864-2及6864-3为有效号码范围。 6866局号码范围是50007999,则6866-5,6866-6,6866-7则为有效号码范围。二、随机数字拨号技术(一)随机数表 利用随机数表以人工方式进行简单随机数字拨号抽样是最基本技术。具体做法是:1、利用随机数表生成一系列随机数2、将随机数字加在中心局编码后,形成一系列将要拨出的电话号码(通常比预期的要多)。如8155-6300(二)数字添加技术1、从电话号码本中抽取“种子”号码2、将某个定数或随机数,添加在种子号码上,“往上加1”就是一种数字添加技
21、术。 主要是由于抽样框不完备、无回答、计量问题而产生的误差。一、抽样框误差1、抽样框丢失了本该列入的目标总体单元。如流动人口2、抽样框包含了不应该列入的目标总体单元。如公司、机关单位包括进居民户调查中。3、抽样框与目标总体存在复合连接。即抽样框中的单元与调查总体单元不是一一对应关系(一个门牌号码内居住两户或多户 )。一个抽样框中的单元可能与多个总体单元相连接(一个住户有两处或多处住房)二、无回答误差(无意无回答和有意无回答) 1、地址不准确 按住户门牌号码抽样2、访问时不在家 较长时间不在家(出差、生病住院、被收监) 偶尔不在家(重复入户3次才允许更换被选住户)3、拒访(生病、太忙、对问题不感
22、兴趣或出于安全考虑) 解决方法:动用政府资源,扩大样本规模,提高问题质 量,合理安排问题顺序,将易引起拒访的隐私性、敏感性问题尽量放在后面,提高访问员素质 第一节第一节 题目的类型题目的类型一、问卷概念及题目类型 所谓问卷,又称为调查表,是市场调查中用来收集资料的一种工具,是指一系列事先精心设计的、系统的、严密的、需要调查对象书面或口头回答的问题表格。它用词语回答的方式测量人们的行为、态度和社会特征,了解调查对象的反映和看法,以此获得资料和信息。设计问卷是问卷调查的关键环节。 调查问卷的题目大致可分两类:开放式题目和封闭式题目。二、开放式题目 (一)概念及特点 所谓开放式题目,又称为自由问卷,
23、是指只提出问题,不提供任何可能答案,由 被调查者自由回答的问卷。例如:您对某品牌的家用电器有何看法? 开放式题目的优点:充分性;被调查者可以就所问问题充分发表自己的看法。适用性;适用于不易确定答案或答案过多的问题。检验性;调查者可以从被调查者的回答中发现是否理解了所提的问题,有没有误解的问题,从而有利于检验对所提问题的回答是否存在偏差。开放式提问的缺点:不易进行统计汇总;填答比较费时费力,使问卷回复率降低。对被调查者的表达水平要求较高,不适用于对文化水平较低者的调查。(二)开放式题目的形式 主要有两种形式:填空式和自由回答式例如:你的家庭住址: 区(市、县 ) 镇(乡、街道) 村 组 再如:您
24、喜欢饮用的乳品饮料是(1) (2) (3) 自由问答式问题:如:你对住房商品化有何看法? 您在遇到经济困难时,得到过他人的帮助吗?三、封闭式题目(一)含义和特点 封闭式题目是指调查者事先已经设计好了问题的各种可能答案,被调查者只能从中选定一个或几个现成答案的提问形式。例如:您喜欢读报吗?1、很喜欢 2、喜欢 3、不喜欢其优点是:答案标准化,便于汇总与整理;问题较清楚,答题简单,费时较少;有助提高回复率。 其缺点是:被调查者只能在备选答案中做出选择,适用性和准确性有时会受到限制。封闭式题目类型的具体表达形式有很多种,主要常见的有:复选题、排序题、是否题、评定尺度、语意差异等。1、复选题: 是一种
25、常见类型,要求被访者在两个或多个可能答案中选择一个或几个适合自己的答案来回答。例如:您认为成绩和知识的关系是( )?(1)完全一致(2)基本一致 (3)不清楚(4)不一致(5)完全不一致2、排序题 是要求被调查者根据自己的偏好判断所列答案的重要程度,并按顺序排列答案。例如:您选择到 超市购物的主要原因中,最重要的是( );其次是例如:您选择到 超市购物的主要原因中,最重要的是( );其次是( );再次是( );(1)干净卫生 (2)购物环境好 (3)商品丰富(4)离家近 (5)价格便宜 (6)服务态度好 (7)停车方便 (8)交通方便 (9)有会员卡或贵宾卡 (10)其他3、是否题也即是非题,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会经济 调查 方法 课件
限制150内