《数据录入》PPT课件.ppt
《《数据录入》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数据录入》PPT课件.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2章 数据录入与数据获取本章主要解决两个问题:第一个问题,根据问题类型的不同,将会从开放题、单选题和多选题的录入方式为例进行介绍。第二个问题,重点介绍如何用SPSS直接读取Excel类型和文本格式的数据,以及如何用ODBC接口读取数据库文件。2.1.1 2.1.1 统计软件中数据的录入格式统计软件中数据的录入格式(1 1)不同观测对象的数据不能在同一记录中出现,即同一)不同观测对象的数据不能在同一记录中出现,即同一观测数据应当独占一行。观测数据应当独占一行。(2 2)每一个观测量指标或影响因素只能占据一列的位置,)每一个观测量指标或影响因素只能占据一列的位置,即同一指标的数量观测值都应当录入
2、到同一个变量中去。即同一指标的数量观测值都应当录入到同一个变量中去。2.1 数据格式概述数据格式概述即:一个观测占一行,一个变量占一列在录入数据时,归纳为以下三步:第一步:定义变量名;第一步:指定每个变量的各种属性;第一步:录入数据。变量名不能与spss保留字相同,spss的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。2.1.2 变量属性介绍变量属性介绍一、变量的储存类型一、变量的储存类型SPSSSPSS中,变量有三种的基本类型:数值型、字符型和日期型。中,变量有三种的基本类型:数值型、字符型和日期型。标准数值型逗号数值型圆点数值型科学技术法
3、数值型美元数值型用户自定义型数值型:数值型的数据是0-9的阿拉伯数字和其他符号,如美元符号、逗号或圆点组成的。字符型:字符型数据的默认显示宽度为8个字符位,系统不区分变量名中的大小写字母,并且不能进行数学运算。注意:在输入数据时不应输入引号,否则双引号将会作为字符型数据的一部分。日期型:日期型数据是用来表示日期或时间的。日期型数据的显示格式有很多,SPSS以菜单方式列出日期型数据的显示格式以供用户选择。事实上,SPSS存储中的日期型变量是该实践与1582年10月14日零点相差的秒数。关于日期型格式的几点说明:“m”在年与日(字母y与d)之间表示月份;在时与秒(字母h与s)之间表示“分”钟。“m
4、mm”表示要求书写英文月份单词的前三个字母组成的缩写。“ddd”三个字母d表示要求用从元月一日算起的日数表示日期。指定了日期变量的格式,不一定在输入时就使用指定的格式。可以输入用“/”或“”作分隔符的具体日期,回车后,系统将自动将输入的格式转化为指定的格式,显示在单元各种。二、变量的测量尺度在SPSS中使用Measure属性对变量的测量尺度进行定义。(1)定类尺度(Nominal Measurement):定类尺度是对事物的类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。特点:其值仅代表了事物的类别和属性,即能测度类别差异,不能比较各类之间的大小,所以各类之间没有顺序和等级。对定类
5、尺度的变量只能计算频数和频率。在spss中,能适用定类尺度的数据可以是数值型,也可以是字符型变量。使用定类变量对事物进行分类时,必须符合穷尽原则和互斥原则。(2)定序尺度(Ordinal Measurement):定序尺度是对事物之间的等级或顺序差别的一种测度,可比较优劣或排序。特点:由于定序变量只能侧度类别之间的顺序,无法测出类别之间的准确差值,即测量数值不代表绝对的数量大小,所以其测量结果只能排序,不能进行运算。(3)定矩尺度(Interval Measurement):定矩尺度是对事物类别或次序之间间距的测度。特点:不仅能将事物区分为不同类型并进行排序,而且可能准确指出类别之间的差距是多
6、少;定居变量通常以自然或物理单位为计量尺度,因此测量结果往往表现为数值,所以计量结果可以进行加减运算。(4)定比尺度(Scale Measurement):定比尺度是能够测算两个测度值之间比值的一种计量尺度,它的测量结果同定距变量一样表现为数值。特点:定必变量是测量尺度的最高水平,它除了具有其他三种测量尺度的全部特点外,还具有可计算两个侧度至之间笔直的特点,因此它可以进行加、减、乘、除运算,而定居变量值可进行加减运算。三、变量名与变量标签值Label:定义变量名标签Value:定义变量值标签四、缺失值四、缺失值Spss中缺失值有用户自定义缺失值和系统缺失值两大类。在SPSS中,对字符型变量,默
7、认的缺失值为空格;对数值型变量,默认的缺失值为零。2.2 数据的直接录入2.1.1 操作界面说明标尺栏菜单栏工具栏数据输入区数据编辑区窗口标签标题栏状态栏当前数据栏显示区滚动条Data View表可以直接输入观测数据值或存放数据,表的左端列边框显示观测个体的序号,最上端行边框显示变量名。Variable View表用来定义和修改变量的名称、类型及其他属性,如图所示。如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的属性,直接输入数据,系统将默认变量Var00001,Var00002等。在Variable View表中,每一行描述一个变量,依次是:Name:变量名。变量名必须以字母、汉
8、字及开头,总长度不超过8个字符,共容纳4个汉字或8个英文字母,英文字母不区别大小写,最后一个字符不能是句号。Type:变量类型。变量类型有8 种,最常用的是Numeric数值型变量。其它常用的类型有:String字符型,Date日期型,Comma逗号型(隔3位数加一个逗号)等。Width:变量所占的宽度。Decimals:小数点后位数。Label:变量标签。关于变量涵义的详细说明。Values:变量值标签。关于变量各个取值的涵义说明。Missing:缺失值的处理方式。Columns:变量在Date View 中所显示的列宽(默认列宽为8)。Align:数据对齐格式(默认为右对齐)。Measur
9、e:数据的测度方式。系统给出名义尺度、定序尺度和等间距尺度三种(默认为等间距尺度)。为了在统计分析过程中能有效的利用其它软件产生的数据,SPSS软件编辑窗口除可以使用*.sav扩展名数据文件,还可以直接打开和保存下述类型的文件:SPSS DOS版本产生的数据文件*.sys;Excel 报表程序产生的数据文件*.xls;DBASE 数据库格式文件*.dbf;SAS统计软件产生的数据文件。2.2.2 开放题和简单单选题的录入开放题和简单单选题的录入一、在一、在spss中定义变量中定义变量录入数据的第一步是定义变量属性,随后才能进行数据录入。二、开放题的录入二、开放题的录入三、单选题的录入三、单选题
10、的录入单选题的录入可以采用字符直接录入、字符代码+值标签、数值代码+值标签三种方式。2.2.3 多选题的录入一、多重二分法(一、多重二分法(Multiple Dichotomy MethodMultiple Dichotomy Method)所谓多重二分法,是在编码的时候,对应每一个选项所谓多重二分法,是在编码的时候,对应每一个选项都要定义一个变量,有几个选项就有几个变量,这些变量都要定义一个变量,有几个选项就有几个变量,这些变量均为二分类,他们各自代表对一个选项的选择结果。均为二分类,他们各自代表对一个选项的选择结果。二、多重分类法(二、多重分类法(Multiple Category Met
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据录入 数据 录入 PPT 课件
限制150内