《数据库设计方法、规范与技巧_.docx》由会员分享,可在线阅读,更多相关《数据库设计方法、规范与技巧_.docx(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据库设计方法、规范与技巧_数据库设计方法、规范与技巧一、数据库设计经过数据库技术是信息资源管理最有效的手段。数据库设计是指对于一个给定的应用环境,构造最优的数据库形式,建立数据库及其应用系统,有效存储数据,知足用户信息要求和处理要求。数据库设计中需求分析阶段综合各个用户的应用需求现实世界的需求,在概念设计阶段构成独立于机器特点、独立于各个DBMS产品的概念形式信息世界模型,用E-R图来描绘。在逻辑设计阶段将E-R图转换成详细的数据库产品支持的数据模型如关系模型,构成数据库逻辑形式。然后根据用户处理的要求,安全性的考虑,在基本表的基础上再建立必要的视图VIEW构成数据的外形式。在物理设计阶段根
2、据DBMS特点和处理的需要,进行物理存储安排,设计索引,构成数据库内形式。1.需求分析阶段需求采集和分析,结果得到数据字典描绘的数据需求和数据流图描绘的处理需求。需求分析的重点是调查、采集与分析用户在数据管理中的信息要求、处理要求、安全性与完好性要求。需求分析的方法:调查组织机构情况、调查各部门的业务活动情况、协助用户明确对新系统的各种要求、确定新系统的边界。常用的调查方法有:跟班作业、开调查会、请专人介绍、询问、设计调查表请用户填写、查阅记录。分析和表达用户需求的方法主要包括自顶向下和自底向上两类方法。自顶向下的构造化分析方法StructuredAnalysis,简称SA方法从最上层的系统组
3、织机构入手,采用逐层分解的方式分析系统,并把每一层用数据流图和数据字典描绘。数据流图表达了数据和处理经过的关系。系统中的数据则借助数据字典DataDictionary,简称DD来描绘。数据字典是各类数据描绘的集合,它是关于数据库中数据的描绘,即元数据,而不是数据本身。数据字典通常包括数据项、数据构造、数据流、数据存储和处理经过五个部分(至少应该包含每个字段的数据类型和在每个表内的主外键)。数据项描绘数据项名,数据项含义讲明,别名,数据类型,长度,取值范围,取值含义,与其他数据项的逻辑关系数据构造描绘数据构造名,含义讲明,组成:数据项或数据构造数据流描绘数据流名,讲明,数据流;,数据流去向,组成
4、:数据构造,平均流量,高峰期流量数据存储描绘数据存储名,讲明,编号,流入的数据流,流出的数据流,组成:数据构造,数据量,存取方式处理经过描绘处理经过名,讲明,输入:数据流,输出:数据流,处理:扼要讲明2.概念构造设计阶段通过对用户需求进行综合、归纳与抽象,构成一个独立于详细DBMS的概念模型,能够用E-R图表示。概念模型用于信息世界的建模。概念模型不依靠于某一个DBMS支持的数据模型。概念模型能够转换为计算机上某一DBMS支持的特定数据模型。概念模型特点:(1)具有较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识。(2)应该简单、明晰、易于用户理解,是用户与数据库设计人员之间进行沟
5、通的语言。概念模型设计的一种常用方法为IDEF1X方法,它就是把实体-联络方法应用到语义数据模型中的一种语义模型化技术,用于建立系统信息模型。使用IDEF1X方法创立E-R模型的步骤如下所示:2.1第零步初始化工程数据库设计方法、规范与技巧数据库设计方法、规范与技巧这个阶段的任务是从目的描绘和范围描绘开场,确定建模目的,开发建模计划,组织建模队伍,采集源材料,制定约束和规范。采集源材料是这阶段的重点。通过调查和观察结果,业务流程,原有系统的输入输出,各种报表,采集原始数据,构成了基本数据资料表。2.2第一步定义实体实体集成员都有一个共同的特征和属性集,能够从采集的源材料基本数据资料表中直接或间
6、接标识出大部分实体。根据源材料名字表中表示物的术语以及具有“代码结尾的术语,如客户代码、代理商代码、产品代码等将其名词部分代表的实体标识出来,进而初步找出潜在的实体,构成初步实体表。2.3第二步定义联络IDEF1X模型中只允许二元联络,n元联络必须定义为n个二元联络。根据实际的业务需求和规则,使用实体联络矩阵来标识实体间的二元关系,然后根据实际情况确定出连接关系的势、关系名和讲明,确定关系类型,是标识关系、非标识关系强迫的或可选的还是非确定关系、分类关系。假如子实体的每个实例都需要通过和父实体的关系来标识,则为标识关系,否则为非标识关系。非标识关系中,假如每个子实体的实例都与而且只与一个父实体
7、关联,则为强迫的,否则为非强迫的。假如父实体与子实体代表的是同一现实对象,那么它们为分类关系。2.4第三步定义码通过引入穿插实体除去上一阶段产生的非确定关系,然后从非穿插实体和独立实体开场标识侯选码属性,以便唯一识别每个实体的实例,再从侯选码中确定主码。为了确定主码和关系的有效性,通过非空规则和非多值规则来保证,即一个实体实例的一个属性不能是空值,也不能在同一个时刻有一个以上的值。找出误认确实定关系,将实体进一步分解,最后构造出IDEF1X模型的键基视图KB图。2.5第四步定义属性从源数据表中抽取讲明性的名词开发出属性表,确定属性的所有者。定义非主码属性,检查属性的非空及非多值规则。此外,还要
8、检查完全依靠函数规则和非传递依靠规则,保证一个非主码属性必须依靠于主码、整个主码、仅仅是主码。以此得到了至少符合关系理论第三范式的改良的IDEF1X模型的全属性视图。2.6第五步定义其他对象和规则定义属性的数据类型、长度、精度、非空、缺省值、约束规则等。定义触发器、存储经过、视图、角色、同义词、序列等对象信息。3.逻辑构造设计阶段将概念构造转换为某个DBMS所支持的数据模型例如关系模型,并对其进行优化。设计逻辑构造应该选择最适于描绘与表达相应概念构造的数据模型,然后选择最适宜的DBMS。将E-R图转换为关系模型实际上就是要将实体、实体的属性和实体之间的联络转化为关系形式,这种转换一般遵循如下原
9、则:1一个实体型转换为一个关系形式。实体的属性就是关系的属性。实体的码就是关系的码。2一个m:n联络转换为一个关系形式。与该联络相连的各实体的码以及联络本身的属性均转换为关系的属性。而关系的码为各实体码的组合。3一个1:n联络能够转换为一个独立的关系形式,可以以与n端对应的关系形式合并。假如转换为一个独立的关系形式,则与该联络相连的各实体的码以及联络本身的属性均转换为关系的属性,而关系的码为n端实体的码。4一个1:1联络能够转换为一个独立的关系形式,可以以与任意一端对应的关系形式合并。5三个或三个以上实体间的一个多元联络转换为一个关系形式。与该多元联络相连的各实体的码以及联络本身的属性均转换为
10、关系的属性。而关系的码为各实体码的组合。6同一实体集的实体间的联络,即自联络,可以按上述1:1、1:n和m:n三种情况分别处理。7具有一样码的关系形式可合并。为了进一步提高数据库应用系统的性能,通常以规范化理论为指导,还应该适当地修改、调整数据模型的构造,这就是数据模型的优化。确定数据依靠。消除冗余的联络。确定各关系形式分别属于第几范式。确数据库设计方法、规范与技巧数据库设计方法、规范与技巧定能否要对它们进行合并或分解。一般来讲将关系分解为3NF的标准,即:表内的每一个值都只能被表达一次。?表内的每一行都应该被唯一的标识有唯一键。表内不应该存储依靠于其他键的非键信息。4.数据库物理设计阶段为逻
11、辑数据模型选取一个最合适应用环境的物理构造包括存储构造和存取方法。根据DBMS特点和处理的需要,进行物理存储安排,设计索引,构成数据库内形式。5.数据库施行阶段运用DBMS提供的数据语言例如SQL及其宿主语言例如C,根据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,并进行试运行。数据库施行主要包括下面工作:用DDL定义数据库构造、组织数据入库、编制与调试应用程序、数据库试运行6.数据库运行和维护阶段数据库应用系统经过试运行后即可投入正式运行。在数据库系统运行经过中必须不断地对其进行评价、调整与修改。包括:数据库的转储和恢复、数据库的安全性、完好性控制、数据库性能的监督、
12、分析和改良、数据库的重组织和重构造。建模工具的使用为加快数据库设计速度,目前有很多数据库辅助工具CASE工具,如Rational公司的RationalRose,CA公司的Erwin和Bpwin,Sybase公司的PowerDesigner以及Oracle公司的OracleDesigner等。ERwin主要用来建立数据库的概念模型和物理模型。它能用图形化的方式,描绘出实体、联络及实体的属性。ERwin支持IDEF1X方法。通过使用ERwin建模工具自动生成、更改和分析IDEF1X模型,不仅能得到优秀的业务功能和数据需求模型,而且能够实现从IDEF1X模型到数据库物理设计的转变。ERwin工具绘制
13、的模型对应于逻辑模型和物理模型两种。在逻辑模型中,IDEF1X工具箱能够方便地用图形化的方式构建和绘制实体联络及实体的属性。在物理模型中,ERwin能够定义对应的表、列,并可针对各种数据库管理系统自动转换为适当的类型。设计人员可根据需要选用相应的数据库设计建模工具。例如需求分析完成之后,设计人员能够使用Erwin画ER图,将ER图转换为关系数据模型,生成数据库构造;画数据流图,生成应用程序。二、数据库设计技巧1.设计数据库之前需求分析阶段1)理解客户需求,询问用户怎样看待将来需求变化。让客户解释其需求,而且随着开发的继续,还要经常询问客户保证其需求仍然在开发的目的之中。2)了解企业业务能够在以
14、后的开发阶段节约大量的时间。3)重视输入输出。在定义数据库表和字段需求输入时,首先应检查现有的或者已经设计出的报表、查询和视图输出以决定为了支持这些输出哪些是必要的表和字段。举例:假设客户需要一个报表根据邮政编码排序、分段和求和,你要保证其中包括了单独的邮政编码字段而不要把邮政编码糅进地址字段里。4)创立数据字典和ER图表ER图表和数据字典能够让任何了解数据库的人都明确怎样从数据库中获得数据。ER图对表明表之间关系很有用,而数据字典则讲明了每个字段的用处以及任何可能存在的别名。对SQL表达式的文档化来讲这是完全必要的。5)定义标准的对象命名规范数据库各种对象的命名必须规范。2.表和字段的设计数
15、据库逻辑设计数据库设计方法、规范与技巧数据库设计方法、规范与技巧表设计原则1)标准化和规范化数据的标准化有助于消除数据库中的数据冗余。标准化有好几种形式,但ThirdNormalForm3NF通常被以为在性能、扩展性和数据完好性方面到达了最好平衡。简单来讲,遵守3NF标准的数据库的表设计原则是:“OneFactinOnePlace即某个表只包括其本身基本的属性,当不是它们本身所具有的属性时需进行分解。表之间的关系通过外键相连接。它具有下面特点:有一组表专门存放通过键连接起来的关联数据。举例:某个存放客户及其有关定单的3NF数据库就可能有两个表:Customer和Order。Order表不包含定
16、单关联客户的任何信息,但表内会存放一个键值,该键指向Customer表里包含该客户信息的那一行。事实上,为了效率的缘故,对表不进行标准化有时也是必要的。2)数据驱动采用数据驱动而非硬编码的方式,很多策略变更和维护都会方便得多,大大加强系统的灵敏性和扩展性。举例,假设用户界面要访问外部数据源文件、XML文档、其他数据库等,不妨把相应的连接和途径信息存储在用户界面支持表里。还有,假如用户界面执行工作流之类的任务发送邮件、打印信笺、修改记录状态等,那么产生工作流的数据可以以存放在数据库里。角色权限管理可以以通过数据驱动来完成。事实上,假如经过是数据驱动的,你就能够把相当大的责任推给用户,由用户来维护
17、本人的工作流经过。3)考虑各种变化在设计数据库的时候考虑到哪些数据字段将来可能会发生变更。举例,姓氏就是如此注意是西方人的姓氏,比方女性结婚后从夫姓等。所以,在建立系统存储客户信息时,在单独的一个数据表里存储姓氏字段,而且还附加起始日和终止日等字段,这样就能够跟踪这一数据条目的变化。字段设计原则4)每个表中都应该添加的3个有用的字段?dRecordCreationDate,在VB下默认是Now(),而在SQLServer下默以为GETDATE()?sRecordCreator,在SQLServer下默以为NOTNULLDEFAULTUSER?nRecordVersion,记录的版本标记;有助于
18、准确讲明记录中出现null数据或者丢失数据的原因5)对地址和采用多个字段描绘街道地址就短短一行记录是不够的。Address_Line1、Address_Line2和Address_Line3能够提供更大的灵敏性。还有,号码和邮件地址最好拥有本人的数据表,其间具有本身的类型和标记类别。6)使用角色实体定义属于某类别的列在需要对属于特定类别或者具有特定角色的事物做定义时,能够用角色实体来创立特定的时间关联关系,进而能够实现自己文档化。举例:用PERSON实体和PERSON_TYPE实体来描绘人员。比方讲,当JohnSmith,Engineer提升为JohnSmith,Director乃至最后爬到J
19、ohnSmith,CIO的高位,而所有你要做的不过是改变两个表PERSON和PERSON_TYPE之间关系的键值,同时增加一个日期/时间字段来知道变化是何时发生的。这样,你的PERSON_TYPE表就包含了所有PERSON的可能类型,比方Associate、Engineer、Director、CIO或者CEO等。还有个替代办法就是改变PERSON记录来反映新头衔的变化,不过这样一来在时间上无法跟踪个人所处位置的详细时间。7)选择数字类型和文本类型尽量充足在SQL中使用smallint和tinyint类型要十分小心。比方,假设想看看月销售总额,总额字段类型是smallint,那么,假如总额超过了
20、$32,767就不能进行计算操作了。而ID类型的文本字段,比方客户ID或定单号等等都应该设置得比一般想象更大。假设客户ID为10位数长。那你应该把数据库表字段的长度设为12或者13个字符长。但这额外占据的空间却无需将来重构整个数据库就能够实现数据库规模的增长了。数据库设计方法、规范与技巧数据库设计方法、规范与技巧8)增加删除标记字段在表中包含一个“删除标记字段,这样就能够把行标记为删除。在关系数据库里不要单独删除某一行;最好采用去除数据程序而且要仔细维护索引整体性。3.选择键和索引数据库逻辑设计键选择原则:1)键设计4原则?为关联字段创立外键。?所有的键都必须唯一。?避免使用复合键。?外键总是
21、关联唯一的键字段。2)使用系统生成的主键设计数据库的时候采用系统生成的键作为主键,那么实际控制了数据库的索引完好性。这样,数据库和非人工机制就有效地控制了对存储数据中每一行的访问。采用系统生成键作为主键还有一个优点:当拥有一致的键构造时,找到逻辑缺陷很容易。3)不要用用户的键(不让主键具有可更新性)在确定采用什么字段作为表的键的时候,可一定要小心用户将要编辑的字段。通常的情况下不要选择用户可编辑的字段作为键。4)可选键有时可做主键把可选键进一步用做主键,能够拥有建立强大索引的能力。索引使用原则:索引是从数据库中获取数据的最高效方式之一。95%的数据库性能问题都能够采用索引技术得到解决。1)逻辑
22、主键使用唯一的成组索引,对系统键作为存储经过采用唯一的非成组索引,对任何外键列采用非成组索引。考虑数据库的空间有多大,表怎样进行访问,还有这些访问能否主要用作读写。2)大多数数据库都索引自动创立的主键字段,但是可别忘了索引外键,它们也是经常使用的键,比方运行查询显示主表和所有关联表的某条记录就用得上。3)不要索引memo/note字段,不要索引大型字段有很多字符,这样作会让索引占用过多的存储空间。4)不要索引常用的小型表不要为小型数据表设置任何键,假设它们经常有插入和删除操作就更别这样作了。对这些插入和删除操作的索引维护可能比扫描表空间消耗更多的时间。4.数据完好性设计数据库逻辑设计1)完好性
23、实现机制:实体完好性:主键参照完好性:父表中删除数据:级联删除;受限删除;置空值父表中插入数据:受限插入;递归插入父表中更新数据:级联更新;受限更新;置空值DBMS对参照完好性能够有两种方法实现:外键实现机制约束规则和触发器实现机制用户定义完好性:NOTNULL;CHECK;触发器2)用约束而非商务规则强迫数据完好性采用数据库系统实现数据的完好性。这不但包括通过标准化实现的完好性而且还包括数据的功能性。在写数据的时候还能够增加触发器来保证数据的正确性。不要依靠于商务层保证数据完好性;它不能保证表之数据库设计方法、规范与技巧数据库设计方法、规范与技巧间外键的完好性所以不能强加于其他完好性规则之上
24、。3)强迫指示完好性在有害数据进入数据库之前将其剔除。激活数据库系统的指示完好性特性。这样能够保持数据的清洁而能迫使开发人员投入更多的时间处理错误条件。4)使用查找控制数据完好性控制数据完好性的最佳方式就是限制用户的选择。只要有可能都应该提供应用户一个明晰的价值列表供其选择。这样将减少键入代码的错误和误解同时提供数据的一致性。某些公共数据十分合适查找:国家代码、状态代码等。5)采用视图为了在数据库和应用程序代码之间提供另一层抽象,能够为应用程序建立专门的视图而不必非要应用程序直接访问数据表。这样做还等于在处理数据库变更时给你提供了更多的自由。5.其他设计技巧1)避免使用触发器触发器的功能通常能
25、够用其他方式实现。在调试程序时触发器可能成为干扰。假设你确实需要采用触发器,你最好集中对它文档化。2)使用常用英语或者其他任何语言而不要使用编码在创立下拉菜单、列表、报表时最好根据英语名排序。假设需要编码,能够在编码旁附上用户知道的英语。3)保存常用信息让一个表专门存放一般数据库信息非常有用。在这个表里存放数据库当前版本、近期检查/修复对Access、关联设计文档的名称、客户等信息。这样能够实现一种简单机制跟踪数据库,当客户抱怨他们的数据库没有到达希望的要求而与你联络时,这样做对非客户机/服务器环境十分有用。4)包含版本机制在数据库中引入版本控制机制来确定使用中的数据库的版本。时间一长,用户的
26、需求总是会改变的。最终可能会要求修改数据库构造。把版本信息直接存放到数据库中更为方便。5)编制文档对所有的快速方式、命名规范、限制和函数都要编制文档。采用给表、列、触发器等加注释的数据库工具。对开发、支持和跟踪修改非常有用。对数据库文档化,或者在数据库本身的内部或者单独建立文档。这样,当过了一年多时间后再回过头来做第2个版本,犯错的时机将大大减少。6)测试、测试、反复测试建立或者修订数据库之后,必须用用户新输入的数据测试数据字段。最重要的是,让用户进行测试并且同用户一道保证选择的数据类型知足商业要求。测试需要在把新数据库投入实际服务之前完成。7)检查设计在开发期间检查数据库设计的常用技术是通过
27、其所支持的应用程序原型检查数据库。换句话讲,针对每一种最终表达数据的原型应用,保证你检查了数据模型并且查看怎样取出数据。三、数据库命名规范1.实体表的命名1)表以名词或名词短语命名,确定表名是采用复数还是单数形式,此外给表的别名定义简单规则比方讲,假如表名是一个单词,别名就取单词的前4个字母;假如表名是两个单词,就各取两个单词的前两个字母组成4个字母长的别名;假如表的名字由3个单词组成,从头两个单词中各取一个然后从最后一个单词中再取出两个字母,结果还是组成4字母长的别名,其余依次类推对工作用表来讲,表名能够加上前缀WORK_后面附上采用该表的应用程序的名字。在命名经过当中,根据语义拼凑缩写即可
28、。注意,由于ORCLE会将字段名称统一成大写或者小写中的一种,所以要求加上下划线。数据库设计方法、规范与技巧数据库设计方法、规范与技巧举例:定义的缩写Sales:Sal销售;Order:Ord订单;Detail:Dtl明细;则销售订单明细表命名为:Sal_Ord_Dtl;2)假如表或者是字段的名称仅有一个单词,那么建议不使用缩写,而是用完好的单词。举例:定义的缩写MaterialMa物品;物品表名为:Material,而不是Ma.但是字段物品编码则是:Ma_ID;而不是Material_ID3)所有的存储值列表的表前面加上前缀Z目的是将这些值列表类排序在数据库最后。4)所有的冗余类的命名(主要
29、是累计表)前面加上前缀X冗余类是为了提高数据库效率,非规范化数据库的时候参加的字段或者表5)关联类通过用下划线连接两个基本类之后,再加前缀R的方式命名,后面根据字母顺序罗列两个表名或者表名的缩写。关联表用于保存多对多关系。假如被关联的表名大于10个字母,必须将原来的表名的进行缩写。假如没有其他原因,建议都使用缩写。举例:表Object与本身存在多对多的关系,则保存多对多关系的表命名为:R_Object;表Depart和Employee;存在多对多的关系;则关联表命名为R_Dept_Emp2.属性列的命名1)采用有意义的列名,表内的列要针对键采用一整套设计规则。每一个表都将有一个自动ID作为主健
30、,逻辑上的主健作为第一组候选主健来定义,假如是数据库自动生成的编码,统一命名为:ID;假如是自定义的逻辑上的编码则用缩写加“ID的方法命名。假如键是数字类型,你能够用_NO作为后缀;假如是字符类型则能够采用_CODE后缀。对列名应该采用标准的前缀和后缀。举例:销售订单的编号字段命名:Sal_Ord_ID;假如还存在一个数据库生成的自动编号,则命名为:ID。2)所有的属性加上有关类型的后缀,注意,假如还需要其它的后缀,都放在类型后缀之前。注:数据类型是文本的字段,类型后缀TX能够不写。有些类型比拟明显的字段,能够不写类型后缀。3)采用前缀命名给每个表的列名都采用统一的前缀,那么在编写SQL表达式
31、的时候会得到大大的简化。这样做也确实有缺点,比方毁坏了自动表连接工具的作用,后者把公共列名同某些数据库联络起来。3.视图的命名1)视图以V作为前缀,其他命名规则和表的命名类似;2)命名应尽量体现各视图的功能。4.触发器的命名触发器以TR作为前缀,触发器名为相应的表名加上后缀,Insert触发器加_I,Delete触发器加_D,Update触发器加_U,如:TR_Customer_I,TR_Customer_D,TR_Customer_U。5.存储经过名存储经过应以UP_开始,和系统的存储经过区分,后续部分主要以动宾形式构成,并用下划线分割各个组成部分。如增加代理商的帐户的存储经过为UP_Ins_Agent_Account。6.变量名变量名采用小写,若属于词组形式,用下划线分隔每个单词,如my_err_no。7.命名中其他注意事项1)以上命名都不得超过30个字符的系统限制。变量名的长度限制为29不包括标识字符。数据库设计方法、规范与技巧数据库设计方法、规范与技巧2)数据对象、变量的命名都采用英文字符,禁止使用中文命名。绝对不要在对象名的字符之间留空格。3)小心保留词,要保证你的字段名没有和保留词、数据库系统或者常用访问方法冲突5)保持字段名和类型的一致性,在命名字段并为其指定数据类型的时候一定要保证一致性。假设数据类型在一个表里是整数,那在另一个表里可就别变成字符型了。
限制150内