调查数据处理技术.pptx
《调查数据处理技术.pptx》由会员分享,可在线阅读,更多相关《调查数据处理技术.pptx(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 1、调查数据加工与处理的目的和特点目的:通过审核、编码、录入、编辑、数据清理和变量代换、数据分布、分组、汇总及制表等数据加工处理过程,确保调查的每个环节都符合既定程序,所有问卷都填写准确完整,数据完整且都干净可用,为下一步做数据分析创造良好条件。特点:调查数据加工与处理过程是调查数据搜集、整理与分析的中间环节,起到承前启后的作用。是整个调查除现场调查为最费时费事、同时又需要很高技巧的一项工作。包括:预处理、录入、审核编辑、再加工、分组汇总等过程。第1页/共30页2、数据处理的基本过程预处理(复查审核;编辑整理;编码等)数据录入(含录入质量控制)数据文件的审核及编辑数据文件的再加工(数据清理、
2、再编码、变量转换)数据描述、统计分组及汇总审核编辑编辑整理编码复查审核填卡和录入分析分组汇总 统计工作中经过调查、登记所取得的原始资料,都必须经过数据录入工作才能输入到计算机中去进行数据处理。文件再加工数据描述第2页/共30页 2-2、调查数据的预处理目的:对调查数据进行预先的复查审核、编辑整理和编码,通过预审,判断调查数据是否有效、内容是否完整、调查是否按规定的方式进行等,并及时采取对策和措施进行整改。编码主要是为计算机数据录入奠定基础。预处理是一项十分耗时、耗力的工作。但从数据处理全局看,在预处理上多投入一些时间和精力是十分必要的,也是值得的。内容包括:复查审核、编辑整理和编码。第3页/共
3、30页 1、复查审核对调查现场的质量控制目的:确保每份要送去进行数据录入分析的调查问卷都是有效的。衡量是否有效的标准是看访谈是否按规定的方式进行的,访员有无作假。审核回收问卷是否有效乃是各种调查过程中当然的、必不可少的步骤。职业调查人员知道,访员说谎作弊的现象相当普遍,不幸的是在我国,情况尤其严重。许多研究项目都有有关访员作弊行为的记载。因此审核回收问卷是否有效乃是各种调查项目特别是数据分析过程中当然的、必不可少的步骤。所需信息:如问卷开头部分对调查过程的记录一般都含有调查时间、调查地点、调查员姓名、受访问者姓名、地址及电话号码等。这些内容对数据的分析处理毫无用处,但可以为调查管理人员的复查审
4、核工作提供基础。第4页/共30页 无论是入户调查、购物场所的拦截调查还是电话访谈,通常在所有现场调查结束后,客户单位或调查机构都要对每位访问人员所做的调查做一定比例的复查。复查的比例一般为本0%20%不等。复查一般通过电话或回访进行,审核内容主要包括五方面:1)查实此人是否真正接受了调查?2)查实受访者是否符合过滤条件?例如,一项调查可能要求对家庭收入为100000元以上的人进行,那么在复查中受访者将被再次问到他的年收入是否在100000元以上。3)查实调查是否按规定的方式进行?例如,一项拦截访谈应在指定的购物场所进行,那么就应查实受访者是否在该购物场所接受访谈。市场研究人员有义务确保所有的数
5、据都是在规定的条件下获取的。第5页/共30页 4)查实问卷内容是否完整。有时访员会借口受访者很忙,没有时间完成所有题目;或因某项目具体调查的受访者很难找到,所以访员很可能开始问一些问题,其余的问题就自己填写。因此在复查审核过程中应查实受访者是否回答了所有问题。5)核查其他方面的问题。例如,访员举止是否礼貌、衣冠是否整齐、礼品是否足量送到、是否有过提示?受访者对访员或调查本身有什么意见?综上所述,这一步的目的是确认调查是按要求正确无误进行的。研究人员必须确信用以要提交的调查结果是真实地反映了目标客户的回答。第6页/共30页 2、编辑整理对调查表登记过程的质量控制 复查审核是指对访员的作弊行为及调
6、查是否严守程序进行核实,而编辑整理是对访员和受访者的疏忽、遗漏、错误进行检查。根据常规,在进行数据录入之前,问卷至少应经过两次编辑整理。首先由实施现场调查的访员进行自我整理,然后再由调查机构的质量监督部门的人员再进行一次编辑整理。编辑整理过程中查验的问题包括以下一个方面:1)访员是否没问某些问题,或者没有记录某些问题的答案。如果这些问题及早发现,将可以通过补访的方法加以补救,但一旦进入数据录入或分析阶段,在大多数情形下,这时已经没有时间再行补访,这份问卷或相关问题的答案可能会因此而遭丢弃。2)访员是否遵循了规定的跳问路线。有些时候,特别是在项目开始的头几次访谈中,访员很容易混淆,跳过了实际应该
7、访问的问题,或者没有跳过不要求作答的问题。第7页/共30页3)开放式问题的答案是否真实合理。调查研究人员以及客户企业通常对开放式问题的答案很感兴趣,因此开放式问题的答案质量,或答案所记录的内容,是反映记录答案的访员工作优劣的标志。通常要求访员逐字记录答案,而不以任何方式重新解释、表达或掺进自己的见解。同时也要求进行几次(通常要满3次)追问。做编辑整理工作的人必须对开放式问题非标准答案作出判断,还必须判定某一特定问题的回答中哪些方面有缺陷甚至毫无用处。如有可能,应在补访时再次提问那些答案未被认定有效的问题。第8页/共30页 3、编码编码是对以文字符号表示的原始资料数据,按照专门制定的编码规则和编
8、码表进行人工或自动转换,把它们转换成数字字符型的数据,以便数据录入的过程。编码包含:选项的命名(变量名)和取值(变量值)两方面。如:您的文化程度 (1-大学 2-中学 3-小学 4-没上过学)可采用 edu 或 whcd 作为变量名,其取值可为14。1)选项命名是因为在数据处理时一般都要求采用字母,而尽量少用汉字以方便计算机处理。选项命名一般都尽量保留问项原意(如name、sex、wage等)。第9页/共30页2)编码:问项答案一般可以分为两类,即数字符号和文字符号。对数字符号一般不需编码,直接可将其输入计算机进行数据处理。而对于文字符号的答案,则需要进行编码。编码规则:“专项编码”和“非专项
9、编码”。专项编码:如第二次全国农业普查中对普查小区的编码,其中省、地、县三级就必须根据国家标准的统一的行政区划代码(表)进行。非专项编码:如对于调查表上的“圈填”信息(如性别:1、男,2、女),回答时已编上了代码,编码时一般是“圈几填几”。第10页/共30页问项答案编码示意变量名 变量值第11页/共30页社会经济调查常用的几种编码 一、单选项编码1、类别编码 “类别”编码是调查项目编码中最基本的一种编码,它将被选答案分成各种互相排斥、互不相客的不同类别,并以相应编码值代表其类别的一种编码。“类别”是指“与名字类似的”。这意味着赋予目标或现象不同的数字是用来命名或分类的,但这些数字没有真实的意义
10、。这些数字不能排序或加减乘除,它们只是一种标签或识别数字,别无他意。类别量表的例子如下:性别 (1)男 (2)女 地理区域 (1)城节 (2)农村 (3)郊区 类别编码表中惟一的量化是对每一类别的客体进行频次和百分比计算算、例如,有50值男性(占48.5)和53位女性(占51.5)。计算平均数(如对地理区域求平均数为2.4)是毫无意义。只有计算众数(出现频率最多的数)才比较恰当。第12页/共30页 2)顺序编码 “顺序”编码除了具有类别编码用数字代表特征的特点外,还增加了对数据排序性质的一种编码。顺序测量是基于可传递假设的应用。可传递性假设可以加以描述:“如果a大于b,而b大于c,则a大于c。
11、”还有一些其他可代替的词语:更喜欢、比强或在之前。以下是顺序量表的一个例子:文化程度:1-大学 2-中学 3-小学 4-没上过学 第13页/共30页注意:1、顺序数字严格地用于表示等级的顺序,数字既不表明绝对数量,同时也不表明两个数字之间的差距是相等的。2、顺序量表的目的是排序。因此,任何可代表顺序关系的数字都可以接受。如文化程度的编码:1-大学 2-中学 3-小学 4-没上过学 或 7-大学 4-中学 3-小学 1-没上过学等都可以。3、普通的算术运算如加、减、乘、除都不能用干顺序量表,对中心趋势的适当量度是众数、中位数,四分位数可以用来测量离散程度。第14页/共30页3)等距编码“等距”编
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 调查 数据处理 技术
限制150内