企业信息化数据库管理体系(doc 10)cgnq.docx
《企业信息化数据库管理体系(doc 10)cgnq.docx》由会员分享,可在线阅读,更多相关《企业信息化数据库管理体系(doc 10)cgnq.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据管理数据管理包括数据的存储、检索和操纵。为了能够在系统开发和开展业务工作期间有效地与信息服务人员进行联系,用户管理人员应具备本章中所提到的有关概念、方法和术语方面的业务知识。一、数据和信息计算机系统并不存储信息,只存储数据。数据是获得信息的原始材料,为了满足定期存取的需要,它们被存储在二级(辅助)存储设备(磁盘和磁带)上。信息是经过同化、聚合和“加工”后的有特定含义的数据。为了突击数据和信息之间的差别,我们考察下面的例子。一个部门领导要求每个职工分别在一张纸上写下他们的年龄。每张纸只有一行含义简单的数据。然而经理可以从这些数据中获得信息。他能够以此确定超过50岁的职工有多少、职工平均年龄是
2、多少,最年轻的职工年龄是多少等等。人们经常使用“信息处理”这个词汇容易造成误解,实际上,它的真正含义是为了产生信息而处理数据。二、数据组织的层次体系 任何信息系统都有一个数据组织的层次体系。在该层次体系中,每一后继层都是其前驱层数据元组合的结果,最终实现一个综合的数据库。处于第一层的“位”用户是不必了解的,而其它五层则是用户输入和请求数据时合理的需要。数据是一切信息系统的基础。一个高质量的计算机信息系统的最终用户必须具备数据的组织及其处理方面的知识。 ? 位 位是主存储器和辅助存储器的基本单位。计算机是电子的,因而只能实现两种状态。从物理上讲,可以通过不同途径来实现这两种状态(电流的方向,开关
3、,涂在带上和盘上的铁淦氧的磁性排列)。由于每一位只能表示两种状态,因此,必须将位组合才能形成字母数字字符。由位组合成的字母数字字符被暂时存放在主存储器中,或永久地存放在辅助存储器中。在主存和辅存中存放的是字母数字字符的内部表示形式(例如,如果采用EBC-DIC编码体制,则11000010表示字母A,而11110001表示数字1)。 在输入时,对字母数字字符进行编码以形成若干位的组合,而在输出时进行译码。目前还没有工业标准的编码体制。最为流行的编码体制是六位二进制编码的十进制码(BCD),七位ASCII码以及八位扩充二进制编码的十进制交换码(EBCDIC-发音为eb-se-dik)。 六位编码最
4、多可以表示64个字符(2?6)。七位编码可以表示128个字符,而八位编码可以表示256个字符。读者可能会问:既然用六位就可以对一个字符编码。为什么还要用八位来编码?这是因为六位码的64种可能的组合只够表示字母、数字和18个特殊符号。如果希望有表示大写和小写字母,那么六位编码就不够用了。因此,就需要具有128种组合的七位编码。 目前还难以想象出对128种以上的位的组合需要。引进八位编码体制(EBCDIC)是为了利用这一个事实,即只用4位(24-具有16种可能的组合)来表示一个数值数据。因此,一个8位的编码实际上可以用来表示两个十进制数字。由于所存储的数据多数是数值数据,所以将两个数字的编码压缩成
5、八位可以节省存储空间。EBCDIC的8位组合称之为一个字节。而BCD的六位就构成一个字节。在BCD和ASCII编码体制中,字节是字符的同义词。在EBCDIC编码体制中,由于可以将两个数字压缩到一个字节中,所以EBCDIC的字节与字符间并不一一对应。然而,在涉及到存储容量时,则经常交替地使用字符和字节。一个磁盘组可以有800兆字节容量(即800兆字节的永久存储器),而一台计算机的主存可以有8兆字节(作为处理用的兆字节的高速临时存储器)。较小的存储设备用千字节(一千个字节的倍数来度量)。通常将兆和千分别缩写“M”和“K”。 在逻辑上讲,一个EBCDIC字节是8位,而实际上它有9位。由于要将这些位在
6、计算机和外部设备(或远程终端)之间传送,所以在计算机硬件中使用了一种内部校验方法来保证传送数据的准确性。这种构验方法之一是给传送的数据附加一位奇偶校验位,用该位来发现在传送过程中是否丢失了一位。计算机可以采用偶数奇偶校验或奇数奇偶校验法,即每一字符要包含偶数个或奇数个“开状态”位。假定某台计算机采用偶数奇偶校验法,如果要将一个EBCDIC的字母A(它具有奇数个“开”位-11000001)写到磁带上,那么在传送之前为了维持偶校验,则需要增加一位奇偶位(即:111000001偶数个“开”位),在将字符写到磁带之前,硬件自动计算“开”位的个数。如果计算机结果是奇数,则说明已经出现了奇偶校验错误,计算
7、机自动向操作员发出警告。 ? 字符(字节) 在通过键盘(光符号识别器或其他输入设备)输入一个字符时,机器直接将字符翻译成某特定的编码系统中一串位的组合。一个计算机系统可以使用不止一种编码体制。例如,某些计算机系统中将ASCII编码体制用于数据通信,而将EBCDIC编码体制用于数据存储。 ? 数据元 描述数据元的最好办法是举例说明。一个人的社会保险号、姓名、信用卡号、街道地址和婚姻状况等都是数据元。在数据的层次体系中,数据元是最低一层的逻辑单位,为了形成一个逻辑单位,需要将若干位和若干字节组合在一起。一个日期不一定是一个数据元,它可以是三个数据元:年、月、日。对地址来说,也是同样的。一个地址中可
8、以包括州、城市、街道地址和邮政码这四个数据元。从逻辑上可以把日期和地址都看成是一个数据元,但是输出这种数据元是不方便的。例如,通常在输出时总是把街道地址单写一行,因而应该把一个地址的几个数据元分开。此外,由于姓名和地址文件经常按邮政码排序,因此,需要将邮政码作为一个逻辑实体(数据元)来对待。 根据上下文的需要,有时也把数据元称作为字段(记录中的字段)。数据元是泛指的,而数据项才是实际的实体(或实际的“值”)。例如,社会保险号是一个数据元,而445487279和44214158则是两个数据项。 为了节省输入数据时敲打键盘的时间和存储空间,在输入数据时通常将数据元编码。例如,通常将职工主文件中的“
9、性别”数据元编码,这样,数据录入员就可以简单的输入“M”或“F”来代替“Male”(男)或“Female”(女)。在输出时再将“M”和“F”分别翻译成“男”或“女”。 在设计数据元时,可以使一个数据项(如帐号)的编码具有特定的含义,从而可以向用户提供信息。例如,可以将一个大学的六位帐号编码如下:表20.6.1 举一个例子,RBI001将表示生物系的1另研究项目的帐号。 ? 记录 将逻辑上相关的数据元组合在一起就形成一个记录。表20.6.2列举了一个职工记录中可能包含的若干数据元,以及作为职工记录的一个值的若干数据项。记录是能够从数据库中存取的最低一层的逻辑单位。例如,如果一个人事经理需要知道阿
10、温肥访芩沟幕橐鲎纯觯敲矗桶阉恼黾锹即痈嬷腥隼床偷街鞔娼写怼 ? 文件 文件是逻辑上相关的记录的集合。职工主文件包含每一个职工的记录。库存文件包含每一种库存货物的记录。应收帐目文件包含每个顾客的记录。“文件”这个词有时也指某台二级存储设备上的一块已命名的区域,该区域中可以包含程序代码、教材、数据,甚至还可以包含输出报表。 ? 数据库数据库是一种作为计算机系统资源共享的全部数据之集合。有时根据不同应用领域可将该资源共享数据分成若干段。例如,财会数据库可以划分为一个应用领域,它可以包含六个不同的文件。读者应该注意到:用“文件”来组织数据这种方法将带来数据的冗余。也就是说,为了在处理时使用,必须将某些
11、数据元重复地存放在几个文件中。例如,在一所大学的安置办公室、宿舍管理处、财务支持办公室以及注册处等都有可能保存学生文件。像学生名、校内地址这类数据元几乎在每个文件中都重复出现。在对开发一个综合的学生信息系统进行可行性分析时,一些系统分析员在美国西南部一所规模很大的大学中发现有75个计算机文件中都包含学生名和校内地址。采用先进的数据库管理系统比之传统的文件系统有较大的改进,它使得用户可以将存储数据的重复程度减至最小。三、数据库的概念与用途 ? 数据库的概念 什么是数据库呢?当人们从不同的角度来描述这一概念时就有不同的定义(当然是描述性的)。例如,称数据库是一个“记录保存系统”(该定义强调了数据库
12、是若干记录的集合)。又如称数据库是“人们为解决特定的任务,以一定的组织方式存储在一起的相关的数据的集合”(该定义侧重于数据的组织)。更有甚者称数据库是“一个数据仓库”。当然,这种说法虽然形象,但并不严谨。严格地说,数据库是“按照数据结构来组织、存储和管理数据的仓库”。在经济管理的日常工作中,常常需要把某些相关的数据放进这样“仓库”,并根据管理的需要进行相应的处理。例如,企业或事业单位的人事部门常常要把本单位职工的基本情况(职工号、姓名、年龄、性别、籍贯、工资、简历等)存放在表20.6.3中,这张表就可以看成是一个数据库。有了这个“数据仓库”我们就可以根据需要随时查询某职工的基本情况,也可以查询
13、工资在某个范围内的职工人数等等。这些工作如果都能在计算机上自动进行,那我们的人事管理就可以达到极高的水平。此外,在财务管理、仓库管理、生产管理中也需要建立众多的这种“数据库”,使其可以利用计算机实现财务、仓库、生产的自动化管理。 J.Martin给数据库下了一个比较完整的定义:数据库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种应用服务;数据的存储独立于使用它的程序;对数据库插入新数据,修改和检索原有数据均能按一种公用的和可控制的方式进行。当某个系统中存在结构上完全分开的若干个数据库时,则该系统包含一个“数据库集合”。 ? 数据库的优点 使用数据库可以带来许
14、多好处:如减少了数据的冗余度,从而大大地节省了数据的存储空间;实现数据资源的充分共享等等。此外,数据库技术还为用户提供了非常简便的使用手段使用户易于编写有关数据库应用程序。特别是近年来推出的微型计算机关系数据库管理系统dBASELL,操作直观,使用灵活,编程方便,环境适应广泛(一般的十六位机,如IBM/PC/XT,国产长城0520等均可运行种软件),数据处理能力极强。数据库在我国正得到愈来愈广泛的应用,必将成为经济管理的有力工具。 数据库是通过数据库管理系统(DBMS-DATA BASE MANAGEMENT SYSTEM)软件来实现数据的存储、管理与使用的dBASELL就是一种数据库管理系统
15、软件。 ? 数据库结构与数据库种类 数据库通常分为层次式数据库、网络式数据库和关系式数据库三种。而不同的数据库是按不同的数据结构来联系和组织的。 1.数据结构模型 (1)数据结构 所谓数据结构是指数据的组织形式或数据之间的联系。如果用D表示数据,用R表示数据对象之间存在的关系集合,则将DS(D,R)称为数据结构。例如,设有一个电话号码簿,它记录了n个人的名字和相应的电话号码。为了方便地查找某人的电话号码,将人名和号码按字典顺序排列,并在名字的后面跟随着对应的电话号码。这样,若要查找某人的电话号码(假定他的名字的第一个字母是Y),那么只须查找以Y开头的那些名字就可以了。该例中,数据的集合D就是人
16、名和电话号码,它们之间的联系R就是按字典顺序的排列,其相应的数据结构就是DS(D,R),即一个数组。 (2)数据结构种类 数据结构又分为数据的逻辑结构和数据的物理结构。数据的逻辑结构是从逻辑的角度(即数据间的联系和组织方式)来观察数据,分析数据,与数据的存储位置无关。数据的物理结构是指数据在计算机中存放的结构,即数据的逻辑结构在计算机中的实现形式,所以物理结构也被称为存储结构。本节只研究数据的逻辑结构,并将反映和实现数据联系的方法称为数据模型。 目前,比较流行的数据模型有三种,即按图论理论建立的层次结构模型和网状结构模型以及按关系理论建立的关系结构模型。 2.层次、网状和关系数据库系统 (1)
17、层次结构模型 层次结构模型实质上是一种有根结点的定向有序树(在数学中“树”被定义为一个无回的连通图)。例如图20.6.4是一个高等学校的组织结构图。这个组织结构图像一棵树,校部就是树根(称为根结点),各系、专业、教师、学生等为枝点(称为结点),树根与枝点之间的联系称为边,树根与边之比为1:N,即树根只有一个,树枝有N个。这种数据结构模型的一般结构见图20.6.5所示。图20.6.4 高等学校的组织结构图 图20.6.5 层次结构模型 图20.6.5中,Ri(i1,2,6)代表记录(即数据的集合),其中R1就是根结点(如果Ri看成是一个家族,则R1就是祖先,它是R2、R3、R4的双亲,而R2、R
18、3、R4互为兄弟),R5、R6也是兄弟,且其双亲为R3。R2、R4、R5、R6又被称为叶结点(即无子女的结点)。这样,Ri(i1,2,6)就组成了以R1为树根的一棵树,这就是一个层次数据结构模型。 按照层次模型建立的数据库系统称为层次模型数据库系统。IMS(Information Manage-mentSystem)是其典型代表。 (2)网状结构模型? 在图20.6.6中,给出了某医院医生、病房和病人之间的联系。即每个医生负责治疗三个病人,每个病房可住一到四个病人。如果将医生看成是一个数据集合,病人和病房分别是另外两个数据集合,那么医生、病人和病房的比例关系就是M:N:P(即M个医生,N个病人
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 企业信息化数据库管理体系doc 10cgnq 企业 信息化 数据库 管理体系 doc 10 cgnq
限制150内