数据库技术理论与电子商务介绍harm.docx
《数据库技术理论与电子商务介绍harm.docx》由会员分享,可在线阅读,更多相关《数据库技术理论与电子商务介绍harm.docx(34页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第7章 数据库技术计算机与人类相比的最大优势就是能够迅速准确地处理大量数据。因此,自从计算机发明以来,数据处理就是它的基本功能和关键技术。数据处理的中心问题是数据管理,数据管理是指对数据的分类、组织、编码、存储、检索和维护。而数据库技术正是数据处理技术发展到比较成熟后的产物。电子商务以电子计算机及其网络技术取代传统方式来进行生产经营活动,离不开数据库技术的支持。数据库技术对电子商务的支持主要表现在两方面:存储和管理各种商务数据。这是数据库技术的基本功能。决策支持。近几年,随着数据仓库和数据挖掘技术的产生和发展,使企业可以科学地对数据库中海量的商务数据进行科学地组织、分析和统计,从而更好地服务于
2、企业的决策支持。可以说,数据库技术是电子商务的一项支撑技术,在电子商务的建设中占有重要的地位。7.1 数据库技术的产生与发展数据库技术是应数据管理任务的需要而产生的,是数据管理技术发展到一定阶段的产物。数据管理技术的发展,是随着计算机硬件和软件技术的发展而不断发展的。到目前为止,数据管理技术主要经历了以下几个阶段:手工管理阶段、文件系统阶段、数据库系统阶段、数据仓库阶段。7.1.1 手工管理阶段20世纪50年代中期以前,计算机主要用于科学计算。硬件存储设备主要有磁带、卡片机、纸带机等,还没有磁盘等直接存取的存储设备;软件上也处于初级的阶段,没有操作系统和管理数据的工具。数据的组织和管理完全靠程
3、序员手工完成,因此称为“手工管理阶段”。这个阶段数据的管理效率很低。手工管理方式的特点是: 数据不保存。 程序与数据合在一起,因而数据没有独立性,程序没有弹性,要修改数据必须修改程序。 程序员必须自己编程实现数据的存储结构、存取方法和输入输出,迫使程序员直接与物理设备打交道,加大了程序设计难度,编程效率低。 数据面向应用,这意味着即使多个不同程序用到相同数据,也得各自定义,数据不仅高度冗余,而且不能共享。7.1.2 文件系统阶段进入20世纪60年代,数据管理方式发生了很大的变化。计算机在这个阶段不仅用于科学计算,还大量用于管理。外存储设备也出现了存取效率高得多的直接存储设备,如磁盘、磁鼓等;在
4、软件方面,不仅有了操作系统,而且还出现了专门的数据管理软件,一般称之为文件系统。有了文件系统,数据的增、删、改等操作都变得轻松了。更重要的是数据的复制变得相当容易,使数据可以反复使用。程序员在免除了数据管理工作以后,不仅可以专心从事其他更有意义的工作,而且减少了错误。文件管理方式本质上是把数据组织成文件形式存储在磁盘上。文件是操作系统管理数据的基本单位。文件可以命名,通过文件名以记录为单位存取数据,不必关心数据的存储位置。由于文件是根据数据所代表的意义组织的,所以文件能反映现实世界事物。在文件中常涉及下列术语:数据项:描述事物性质的最小数据单位;记录:若干数据项的集合称记录,一个记录能表达一个
5、具体事物;文件:若干记录的集会就叫做文件。显然,数据组织成文件,逻辑关系非常明确,使数据处理真正体现了信息处理,按名存取数据,既形象,又方便。由于有了直接存取存储设备,所以文件可以组织成多种形式,如顺序文件、索引文件等,从而对文件中的记录可顺序访问,也可随机访问。文件方式管理数据是数据管理的一大进步,即使是数据库方式也是在文件系统基础上发展起来的。这一阶段的特点如下: 数据可长期保存在磁盘上。 数据的物理结构与逻辑结构有了区别,两者之间由文件管理系统进行转换,因而程序与数据之间有物理上的独立性,即数据在存储上的改变不一定会影响到程序,这可使程序员不必过多地考虑数据存放地址,而把精力放在算法上。
6、 文件系统提供了数据存取方法,但当数据的物理结构改变时,仍需修改程序。 数据不再属于某个特定程序,在一定程度上可以共享。上述特点可用图7l表示文件管理系统程序1程序2程序n文件n文件2文件1图7l 文件系统阶段数据管理示意图然而,文件方式管理数据还是有很多缺陷的,主要表现在以下几个方面:1. 文件是面向特定用途设计的:这意味着有一个应用,就有一个文件相对应。而程序是基于文件编制的,导致程序仍然与文件相互依存。因为文件有所变动,程序就得相应修改,而文件离开了使用它的程序便全部失去存在的价值。2. 数据冗余大:因为文件之间缺乏联系,有可能造成同样数据在不同文件中重复存储。3. 数据可能发生矛盾:因
7、为同一数据出现在不同文件中,稍有不慎就可能造成同一数据在不同文件中不一样,这将导致数据的冗余。4. 数据联系弱:不同文件缺乏联系就不能反映现实世界中事物之间的自然联系,这是文件方式最大的弊端。7.1.3 数据库系统阶段到了20世纪60年代后期,计算机被越来越多地应用于管理领域,而且规模也越来越大,因此数据量也急剧增长。同时,人们对数据共享的要求也越来越强烈。在这种情况下,“数据库”的概念应运而生了。用数据库管理数据有如下的特点:1. 数据结构化数据库是存储在磁盘等外部直接存取存储设备上的数据集合,是按一定的数据结构组织起来的。与文件系统相比,文件系统中的文件之间不存在联系,因而从总体上看数据是
8、没有结构的;而数据库中的文件是相互联系着的,并在总体上遵从一定的结构形式。这是文件系统与数据库系统的最大区别。数据库正是通过文件之间的联系反映现实世界事物间的自然联系。2. 数据共享数据库中的数据是考虑所有用户的数据需求、面向整个系统组织的。因此数据库中包含了所有用户的数据成分,但每个用户通常只用到其中一部分数据。不同用户所使用的数据可以重叠,同一部分数据也可为多用户共享,如图72所示。程序1程序2程序n数据库应用程序远程终端用户图72 数据共享示意图3. 减少了数据冗余在数据库方式下,用户不是自建文件,而是取自数据库中的某个子集,它并非独立存在,而是靠数据库管理系统从数据库中映射出来的,所以
9、叫做逻辑文件。如图73所示,用户使用的是逻辑文件,因此尽管一个数据可能出现在不同的逻辑文件中,但实际上的物理存储只可能出现一次,这就减少了数据冗余。DBMS程序A程序B程序C逻辑文件C逻辑文件B逻辑文件A数据库图73 应用程序使用从数据库中导出的逻辑文件4. 有较高的数据独立性数据独立是数据库技术努力追求的目标,其好处是数据存储方式的改变不会影响到应用程序。数据独立又有两个含义,即物理数据独立性和逻辑数据独立性。所谓物理数据独立性是指数据库物理结构(包括数据的组织和存储、存取方法沙十部存储设备等)发生改变时,不会影响到逻辑结构,而用户使用的是逻辑数据,所以不必改动程序;所谓逻辑数据独立性是指数
10、据库全局逻辑发生改变时,用户也不需改动程序,就像数据库并没发生变化一样。这是因为用户仅使用数据库的一个子集,全局变化与否与具体用户无关,只要能从数据库中导出他所用到的数据就行。5. 用户接口在数据库系统中,数据库管理系统作为用户与数据库的接口,提供了数据库定义、数据库运行。数据库维护和数据安全性、完整性等控制功能;此外还支持某种程序设计语言,并设有专门的数据操作语言,为用户编程提供了方便。数据库系统的出现,使信息系统的研制从围绕加工数据的程序为中心转变到围绕共享的数据库来进行。这既便于数据的集中管理,也有利于应用程序的研制和维护,提高了数据的利用率和相容性,从而提高了做出决策的可靠性。因此大型
11、复杂的信息系统大多以数据库为核心。数据库是一个通用化的综合性数据集合。它可以供各种用户共享且具有最小的冗余度和较高的数据与程序的独立性。由于多种程序并发地使用数据库,为了能有效、及时地处理数据,并提供安全性和完整性,就需要一个软件系统数据库管理系统(DBMS),在建立、运用和维护时对数据库进行统一控制。在这个阶段,企业的管理一般采用管理信息系统(MIS)。管理信息系统可以有效地管理企业内部的信息和信息流,是企业向管理现代化迈出的第一步。而企业管理信息系统可以说是数据库管理系统在功能上的一种扩展,因为数据管理仍是它的核心内容。电子数据交换(EDI)也渐渐发展起来。数据库管理系统对企业从事电子交易
12、起到很大的支持作用。我们都知道EDI的一大特点(同时也是优点)就是把各种贸易单证的电子化和标准化。而数据库系统也是把数据管理规范化和标准化了。因此,就可以比较容易地实现数据库系统的业务数据与EDI的单证之间的自动转换。与手工制作电子单证相比,提高了效率、减少了错误、降低了成本。更高层次的、帮助企业决策的决策支持系统(DSS)也慢慢发展起来。但直到20世纪80年代末,决策支持系统的应用还不是很广泛。原因在于:那时的决策支持系统在理论和方法上过于复杂,过于偏重高级而抽象的理论,而且过于偏重结论,在一定程度上忽视了对业务数据的分析,而且,成本高昂,因此实际产生的应用效果远远比不上管理信息系统。在人们
13、眼里,决策支持系统是一个高高在上的东西。事实上,企业对于决策支持并不要求大而全,也并不要求一套系统代替决策者去思考,他们所需要的往往是对简单却十分重要的业务数据的反复挖掘,为决策提供一定的依据。科学的决策必须以大量可靠的数据为基础,这些数据应包括企业的内部数据、与企业的经营和生产相关的外部数据,还应包括综合数据和历史数据。否则,决策就没有根据,就会成为主观的猜想。当时,数据库技术虽然已经成熟,但应用还不广泛,所以普遍存在一个数据量不足的问题。此外,分析工具的缺乏也是一大问题。没有充足的数据,分析工具也不得力,分析的结果当然不能切中要害。由此可以看出,在这个阶段,用于决策支持的技术还不完备,时机
14、也还不成熟,决策支持系统的失败也是可以理解的。7.1.4 数据仓库阶段进入20世纪90年代,计算机得到空前广泛的应用,使得企业的生产效率进一步提高,商业竞争也越来越激烈了。一个企业要想在市场上生存下去,不仅要建立完善的计算机管理信息系统来提高效率,而且要先于对手获得至关重要的决策信息。这样,企业才能在未来的竞争中适应潮流、把握正确的发展方向。企业对迅速而准确地获得决策信息的需求比以前大大增强了。对企业来说,决策支持系统已不是可有可无的东西,企业需要实用而且成本低廉的决策支持系统。系统开发人员由于企业的需求,也渐渐认识到了决策支持系统开发的方向。决策支持系统的建设更应该把注意力放在对数据的挖掘上
15、,放在满足业务主管们各种各样的查询要求上,由他们自己做决定,系统只是提供一些用来辅助决策的参考意见,应该帮助而不是代替高级业务人员的思考。在这一时期,计算机及其网络技术的应用更为广泛,企业管理信息系统逐渐由以内部管理为主转变为对整个供应链的管理。企业之间的商务活动也从以前简单的电子数据传输转变为全方位的合作,电子商务蓬勃兴起。企业之间的相互合作不仅可以提高企业的生产效率、降低生产成本,也为企业获取大量的外部数据带来了方便。这就为决策支持分析奠定了基础。另外,由于数据库技术的发展和日益成熟,决策支持分析工具也渐渐丰富起来。企业的需求和技术的成熟最终导致了数据仓库的产生。数据仓库作为决策支持系统的
16、一种有效、可行的体系化解决方案,包括三个方面的内容:数据仓库技术(DW)、联机分析处理技术(OLAP)和数据挖掘技术(DM)。数据库技术的发展为解决决策支持问题提供了可能,而激烈的市场竞争产生了对决策支持的巨大需求,由此人们找到了以数据仓库为基础、以OLAP和DMI具为手段的一整套可操作、可实施的解决方案。7.2 数据库技术的基本理论 电子商务是指利用电子网络进行的商务活动,这里的电子网络主要是指Internet和基于 Internet技术的Intranet(企业内部网)及Extranet(企业外部网)。其进行的商务活动不仅包含电子数据交换所涉及的电子交易,还包括电子邮件交流、网上站点宣传和利
17、用lnternet技术改造的其他传统应用。但电子商务应用的前提是企业管理信息系统的广泛应用。数据库技术是企业管理信息系统的核心技术之一,所以,想深入地理解电子商务就应该先了解数据库的一些基本理论。7.2.1 数据模型1. 数据模型的要素数据库是某个企业、组织或部门所涉及的数据的一个综合,它不仅要反映数据本身的内容,而且还要反映数据之间的联系。由于计算机不可能直接处理现实世界中的具体事物,所以人们必须事先把具体事物转换成计算机能够处理的数据。在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。通俗地讲数据模型就是现实世界的模拟。数据模型应满足三方面要求;一是能比较真实地模拟现实
18、世界;二是容易为人所理解;三是便于在计算机上实现。一种数据模型要很好地满足这三方面的要求,在目前尚很困难。在数据库系统中针对不同的使用对象和应用目的,采用不同的数据模型。不同的数据模型实际上是提供给我们模型化数据和信息的不同工具。根据模型应用的不同目的,可以将这些模型划分为两类,它们分属于两个不同的层次。第一类模型是概念模型,也称信息模型,它是按用户的观点对数据和信息建模。另一类模型是数据模型,主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模。一般地讲,任何一种数据模型都是严格定义的概念的集合。这些概念必须能够精确地描述系统的静态特性、动态特性和完整性约束条件。因此数据
19、模型通常都是由数据结构、数据操作和完整性约束三个要素组成。 数据结构数据结构用于描述系统的静态特性,它包括数据对象及其相互联系,即数据结构是所研究的对象类型(object type)的集合。这些对象是数据库的组成成分,它们包括两类,一类是与数据类型、内容、性质有关的对象,例如网状模型中的数据项、记录,关系模型中的域、属性、关系等;一类是与数据之间联系有关的对象,例如网状模型中的系型(set type)。数据结构是刻画一个数据模型性质最重要的方面。因此在数据库系统中,人们通常按照其数据结构的类型来命名数据模型。例如,层次结构、网状结构和关系结构的数据模型分别命名为层次模型、网状模型和关系模型。
20、数据操作数据操作用于描述系统的动态特性,主要是对数据的检索和更新,即数据操作是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则。数据库主要有检索和更新(包括插入、删除、修改)两大类操作。数据模型必须定义这些操作的确切含义、操作符号、操作规则(如优先级)以及实现操作的语言。 数据的约束条件数据的约束条件是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容。数据模型应该反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。例如,在关系模型中,任何关
21、系必须满足实体完整性和参照完整性两个条件。此外,数据模型还应该提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。例如,在学校的数据库中规定大学生年龄不得超过29岁,硕士研究生不得超过38岁,学生累计成绩不得有3门以上不及格等。2. 数据模型的种类不同的数据模型具有不同的数据结构形式。目前最常用的数据模型有层次模型(hierarchical model)、网状模型(network model)和关系模型(relational model)。其中层次模型和网状模型统称为非关系模型。非关系模型的数据库系统在20世纪70年代与80年代初非常流行,在数据库系统产品中占
22、据了主导地位,现在已逐渐被关系模型的数据库系统取代,但在美国等一些国家里,由于历史遗留下来的原因,目前网状数据库系统的用户数仍很多。20世纪80年代以来,面向对象的方法和技术在计算机各个领域,包括程序设计语言、软件工程、信息系统设计、计算机硬件设计等各方面都产生了深远的影响,也促进了数据库中面向对象数据模型的研究和发展。 层次模型层次模型是数据库系统中最早出现的数据模型,它用树形结构表示各类实体以及实体间的联系。现实世界中许多实体之间的联系本来就呈现出一种很自然的层次关系,如行政机构、家族关系等。层次模型数据库系统的典型代表是IBM公司的IMS(Information Management S
23、ystems)数据库管理系统,这是一个曾经广泛使用的数据库管理系统。 层次模型的数据结构层次模型用树结构表示数据之间的层次关系。按照树的定义,在层次模型中,数据之间的关系满足;有且仅有一个结点无双亲,这个结点称为根结点。其他结点有且仅有一个双亲结点。因此,层次模型职能描述数据之间一对一或多对多的关系。层次模型就像一棵倒立的树,如图74所示。在层次模型的数据库中查找某一结点,必须指定存取路径。所谓存取路径是指从根结点开始沿途所经过的路径。以图74为例。存取不同结点的存取路径如表71所示。n An Dn Cn B表71 存取路径 存取结点存取路径ABCDAABABCAD图74 层次模型 层次模型的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库技术 理论 电子商务 介绍 harm
限制150内