《Epidata数据库使用方法详细介绍.ppt》由会员分享,可在线阅读,更多相关《Epidata数据库使用方法详细介绍.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、EpiData数据库使用方法简介及其在健康教育工作中的应用 选选择择合合适适的的数数据据管管理理软软件件是是保保证证数数据据质质量量的的重重要要方方面面 主要内容主要内容 EpiDataEpiData基本情况简介基本情况简介 EpiDataEpiData使用流程使用流程 建立调查表及数据文件生成建立调查表及数据文件生成 添加字段控制添加字段控制 录入数据和数据转出录入数据和数据转出一、简介(一、简介(Introduction)EpiData 是一个免费的数据录入和数据管理软件。(一)(一)EpiData的特点特点直观方便直观方便简单易学简单易学实用性强实用性强对计算机要求不高对计算机要求不高数
2、据录入功能强(有良好的逻辑检错功能)数据录入功能强(有良好的逻辑检错功能)(二)如何获取(二)如何获取 EpiEpi-Data-Data软件软件 www.epidata.dkwww.epidata.dk 搜索其它下载网站搜索其它下载网站 当前最高版本当前最高版本3.13.1 可不必安装,直接可不必安装,直接copycopy并运行安装目并运行安装目 录下录下epidata.exeepidata.exe(三)在数据管理方面的优点(三)在数据管理方面的优点 规则简单规则简单 数据文件生成与录入界面设计方便数据文件生成与录入界面设计方便 具备双份录入核查功能具备双份录入核查功能 具有多种常用数据库的输
3、出接口具有多种常用数据库的输出接口 FreeFree(四)应用方面的局限性(四)应用方面的局限性 变量名不能为中文变量名不能为中文 记录数最好不超过记录数最好不超过300000300000条条 录入界面不超过录入界面不超过999999行行(五)(五)EpiDataEpiData的的三种文件类型三种文件类型 QESQES文文件件(调调查查表表文文件件):定定义义调调查查表表(问问卷卷)的结构的结构 ;RECREC文文件件(数数据据文文件件):存存放放数数据据以以及及已已经经定定义义好的编码;好的编码;CHKCHK文文件件(核核查查文文件件):定定义义了了数数据据输输入入时时字字段段的有效性规则。
4、的有效性规则。数据管理流程数据管理流程直观方便直观方便 EpiDataEpiData 的屏幕具有标准的视窗形式,包括一行的屏幕具有标准的视窗形式,包括一行菜单和两行工具条;菜单和两行工具条;“工作过程工具条工作过程工具条”可以指导用户从可以指导用户从“1.1.定义数据定义数据”到到“6.6.数据导出数据导出”工作过程工具条界面界面(一)(一)EpiData使用流程使用流程最简单的使用流程是:最简单的使用流程是:1)1)创建调查表文件(创建调查表文件(*.qesqes););2)2)在调查表文件的基础上建立数据库(在调查表文件的基础上建立数据库(*.recrec););3)3)在数据库(在数据库
5、(*.recrec)中录入数据。)中录入数据。数据定义是基础性工作,也是关键性的工作;数据定义是基础性工作,也是关键性的工作;在在EpiDataEpiData中表现为建成中表现为建成QESQES文件文件(二)(二).Qes文件的建立文件的建立2.直接复制、粘贴word调查表1.建立途径操作步骤操作步骤-1按shift键+#字段编辑器:字段编辑器:方便实现对变量类型和长度的定义方便实现对变量类型和长度的定义 操作步骤操作步骤-2使用制表符使用制表符,只会改变变量录入框在表格中的位置,只会改变变量录入框在表格中的位置,而不会对变量或而不会对变量或REC数据库产生其它不良影响。数据库产生其它不良影响
6、。在变量编码前插入在变量编码前插入,可以将这个变量对齐到下一个,可以将这个变量对齐到下一个制表位置。制表位置。注意:注意:插入的插入的与变量编码间不能有空格与变量编码间不能有空格文件文件 选择项选择项Show data formTabs/IndentsTab stop in data form every pixels 中进行设置,默认值为中进行设置,默认值为40家庭住址shi_地市xian_县区xiang_乡(镇、街办)cun_村(小区)hao_组(楼、号)操作步骤操作步骤-3默认值默认值200与与40的差别的差别.Qes文件的建立和注意事项文件的建立和注意事项编辑编辑字段清单(字段清单(c
7、trl+q)字段选取清单字段选取清单 日期日期存在存在bug(程序缺陷)(程序缺陷)早期版本:不能计算早期版本:不能计算当前版本:当前版本:记录存在缺失时,记录存在缺失时,导出数据导出数据 库会出问题(错位)库会出问题(错位)建议:暂时不要用此种格式建议:暂时不要用此种格式本次采用的格式。本次采用的格式。由于问卷中只设计了年月,由于问卷中只设计了年月,调查者应将调查者应将日日调查清楚并填写调查清楚并填写注意事项注意事项数值型变量:数值型变量:#,最长允许,最长允许14个字符个字符字符型变量:字符型变量:_,最长允许最长允许80个字符,一个中文个字符,一个中文字占字占2个字符个字符日期型变量:日
8、期型变量:注意其他变量:自动生成注意其他变量:自动生成ID号号逻辑是否逻辑是否注意事项数值型变量允许录入数字、减号和小数点。在QES 文件中和数据录入过程中,你可以用圆点(.)或逗号(,)来表示小数点。一个变量中只允许输入一个小数点,这意味着不能用逗号作为千位的分隔符(例如:1,000,000)。字符“#”的数目表示变量的长度,小数点占一位字符。变量最长允许18 个字符。如何生成字段名?如何生成字段名?在在EpiDataEpiData表现为生成表现为生成.REC.REC文件文件 本文件基于本文件基于QESQES文件而生成文件而生成 产生产生RECREC文件前可输入文件标记文件前可输入文件标记
9、警惕:覆盖文件操作一定要警惕:覆盖文件操作一定要慎重!慎重!(二)创建数据库(二)创建数据库注意:注意:.qes和和.rec可同名、可不同名可同名、可不同名建议:同名建议:同名创建数据库创建数据库修改数据库修改数据库非常非常重要重要三三.chk文件的建立和常用语法文件的建立和常用语法CHECK 的文件建立:必须与数据库的文件名相同,唯一不同的就是扩展名;打开需要检查的数据库.chk文件的建立和常用语法文件的建立和常用语法常用语法常用语法Range:允许范围,允许值:允许范围,允许值例:例:4-5,1,2,-inf-5(=0)Jump:跳转功能:跳转功能例:例:age变量变量1v23,2v40,
10、3end,4write Must Enter:必须录入:必须录入 Repeat:重复输入:重复输入Value label:添加数值标签:添加数值标签例:例:label sex1 male2 female更多的更多的check设置设置忽略缺失值(IGNOREMISSING)V4BEFORE ENTRYIGNOREMISSINGV4=V1+V2+V3END使用运算符号和函数使用运算符号和函数Let 命令:命令:例例1:V1let field5=field2/field3end例例2:birth today let age=round(today-birth)/365.25)添加字段控制添加字段控制
11、 可以使数据输入过程按给定的一些规则和可以使数据输入过程按给定的一些规则和 算法完成,是算法完成,是EpiDataEpiData功能强大的体现功能强大的体现 添加输入控制的指令以文件形式单独保添加输入控制的指令以文件形式单独保 存,该文件后缀为存,该文件后缀为CHKCHK 程序运行时,自动寻找与扩展名程序运行时,自动寻找与扩展名RECREC相相 同文件的同文件的CHKCHK文件文件 添加字段控制添加字段控制5 5项基本功项基本功 限定特定值(数值范围,合法值)限定特定值(数值范围,合法值)指定输入的顺序(跳转)指定输入的顺序(跳转)某些字段不得缺项,必须输入某些字段不得缺项,必须输入 重复上一
12、条记录的某字段值重复上一条记录的某字段值 标签:给出各数字对应的描述性文本标签:给出各数字对应的描述性文本(二)添加字段控制(二)添加字段控制1 1项高级功项高级功 相当于在相当于在CHKCHK文件中进行编程文件中进行编程 需掌握各种需掌握各种check commandscheck commands:-if-ifthenthenendifendif、mustentermustenter、relaterelate 需熟悉各种需熟悉各种operatorsoperators和和functionsfunctions:-arithmetic-arithmetic、stringstring、datedat
13、e、timetime四、输入数据四、输入数据 点击点击“数据录入数据录入”,给定数据文件,给定数据文件,即显示数据录入界面即显示数据录入界面注意事项注意事项 无键入内容,仅按回车,以缺失值论无键入内容,仅按回车,以缺失值论 字段填满,光标自动跳到下一个字段字段填满,光标自动跳到下一个字段 任何时候要退出录入,按任何时候要退出录入,按F10F10键即可键即可 数据库中查找记录数据库中查找记录 查找查找定位记录:用于已知记录号时定位记录:用于已知记录号时 查找查找查找记录:用于不知记录号时查找记录:用于不知记录号时四、数据库的管理四、数据库的管理1、修改数据库:、修改数据库:增加、删除变量;增加、
14、删除变量;改变变量类型,变量名字改变变量类型,变量名字2、数据库的追加、合并、数据库的追加、合并3、双录入和核查、双录入和核查4、数据的输出和输入、数据的输出和输入对已输入的数据库进行系列操作对已输入的数据库进行系列操作修改数据库(Revise Data File)在不丢失数据的前提下,修改一个已经录入了的数在不丢失数据的前提下,修改一个已经录入了的数据库的结构。已经录入的数据会被拷贝到新数据库据库的结构。已经录入的数据会被拷贝到新数据库中相同名字的变量下,这个变量的格式有可能是修中相同名字的变量下,这个变量的格式有可能是修改了的格式。改了的格式。也可以增加变量、修改变量的定义、或者删除变量。
15、也可以增加变量、修改变量的定义、或者删除变量。然后,先关闭所有的文件,点击菜单然后,先关闭所有的文件,点击菜单ToolsRevise Data File,完成数据库的修改。,完成数据库的修改。修改数据库(Revise Data File)修改步骤1打开调查表文件(打开调查表文件(*.qes)进行修改;如果没有现成)进行修改;如果没有现成的调查表文件,可以用已有的数据库(的调查表文件,可以用已有的数据库(*.rec)反过)反过来创建一个新的调查表文件,即选择菜单来创建一个新的调查表文件,即选择菜单ToolsQES File from REC File(根据数据文件产生调查表)(根据数据文件产生调
16、查表);编辑、修改调查表文件(编辑、修改调查表文件(*.qes),例如增加新变量、),例如增加新变量、删除变量、改变变量类型等;删除变量、改变变量类型等;保存修改后的调查表文件,然后关闭该文件;保存修改后的调查表文件,然后关闭该文件;选择选择 ToolsRevise Data File(更新数据文件);(更新数据文件);选择修改好的调查表文件(选择修改好的调查表文件(*.qes)和准备修改的数)和准备修改的数据库(据库(*.rec)。)。操作步骤更改变量名方式如果删除或者修改了变量名,会丢失一些数据。请认真检查修改了的数如果删除或者修改了变量名,会丢失一些数据。请认真检查修改了的数据库,避免错
17、误操作。据库,避免错误操作。即使操作失误,原来的数据库还是可以恢复的,它现在已被存为另外一个数即使操作失误,原来的数据库还是可以恢复的,它现在已被存为另外一个数据库(仍在相同的文件夹里),文件名为据库(仍在相同的文件夹里),文件名为FILENAME.OLD.RECEpiData 中有两种方式生成变量名中有两种方式生成变量名改变命名方式,有可能会修改变量名,进而丢失数据。在修改数据库时,程改变命名方式,有可能会修改变量名,进而丢失数据。在修改数据库时,程序会先检查原始数据库创建时使用变量名定义方法,如果不同于现在的序会先检查原始数据库创建时使用变量名定义方法,如果不同于现在的Options 中的
18、设置,程序会自动弹出一个警告框,建议你使用相同的变量名中的设置,程序会自动弹出一个警告框,建议你使用相同的变量名定义方法。定义方法。修改原始数据库中的变量类型。所有变量类型都可以修改为字符型变量或大修改原始数据库中的变量类型。所有变量类型都可以修改为字符型变量或大写字母的字符型变量。数值型变量可以修改为有相同或更多小数位数的数值写字母的字符型变量。数值型变量可以修改为有相同或更多小数位数的数值型变量。如果修改后的小数位数变少了,程序会弹出警告框,提醒这样修改型变量。如果修改后的小数位数变少了,程序会弹出警告框,提醒这样修改可能会丢失数据。可能会丢失数据。慎重!慎重!更改变量名工具字段更名选择文
19、件名出现文件名在弹出的窗口中,第一列在弹出的窗口中,第一列是原有的变量名,第二列是原有的变量名,第二列是标签。如果要修改变量是标签。如果要修改变量名,请将光标放在第三列名,请将光标放在第三列相应的变量行上,键入新相应的变量行上,键入新的变量名。修改完毕后,的变量名。修改完毕后,点击点击Save and close,保存,保存并关闭窗口。并关闭窗口。旧的数据库会被另存为旧的数据库会被另存为Filename.old.rec,以备需,以备需要的时候恢复。要的时候恢复。.Qes文件的保存文件的保存保存路径保存路径数据库的追加、合并数据库的追加、合并Append/Merge追加(append)是将两个数
20、据结构完全一样或基本上一样的数据库纵向连起来。如:几个不同人分录数据的合并横向连接(Merge)可使两个数据库结构不同的文件横向连接,前提是两个文件中有相同的关键变量如:基本情况库,实验室信息库,流调数据库的合并数据库的管理数据库的管理以A库结构为准,B库中多余的变量将被忽略两库中相同名称的变量,则新创建数据库对应的变量类型将以数据库A为准新库中包括A库和B库中的所有变量合并以A库结构为准,只合并标识变量在两个数据库中完全匹配的记录两库共有标识变量,唯一不重复可同时选择13个变量不一定要设置KEY或key unique合并两个数据库中的所有记录双录入和核查双录入和核查注意!数据的输出数据库的输
21、出数据库的输出/输入输入输出选项:可选择部分变量和记录输出选项:可选择部分变量和记录变量个数的限制变量个数的限制输出到输出到dBaseIII,最多,最多128个变量,且变个变量,且变量标签、数值标签无法同时转出量标签、数值标签无法同时转出Excel不同版本的行、列数均有限制,且不同版本的行、列数均有限制,且变量标签、数值标签无法同时转出变量标签、数值标签无法同时转出Spss文件文件syntax语句要删除注释部分语句要删除注释部分输出到输出到epidata:可创建一个新库,含部分可创建一个新库,含部分记录或部分变量记录或部分变量Options设置设置小结Qes中要尽量与原始问卷结构相同,以减少数据录入中的失中要尽量与原始问卷结构相同,以减少数据录入中的失误误Chk中多设置数值标签,导出时中多设置数值标签,导出时Chk文件要在同一文件夹中文件要在同一文件夹中在进行大量录入前,数据库建立者要自己录入在进行大量录入前,数据库建立者要自己录入1020份左右,份左右,以发现存在的问题以发现存在的问题数据转出时,特别是较大数据库转出时,可试用几种格式数据转出时,特别是较大数据库转出时,可试用几种格式(如(如.xls,.sps,.txt),注意每种转出格式局限性),注意每种转出格式局限性关联数据库:能不用就不用关联数据库:能不用就不用配套文件:数据录入说明配套文件:数据录入说明 谢谢谢谢
限制150内