XML数据库系统综述.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《XML数据库系统综述.doc》由会员分享,可在线阅读,更多相关《XML数据库系统综述.doc(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、XML数据库系统综述摘 要:XML数据库是一种新型的数据库技术,本文结合XML数据库研究的最新进展和XML数据库最新产品的实际性能,对XML数据库技术进行了总体分析,与传统的数据库技术进行了比较,指出了其目前需要改进的方面。关键词:NXD XEDB 半结构化数据随着Web应用的不断扩展,传统的基于HTML的Web信息表达方式不能适应人们进行信息查询和对web数据进行管理的需要1。由万维网协会(W3C)提出和设计的可扩展标记语言(XML,Extensible Markup Language)正在逐步成为新一代Web数据描述和数据交换标准。XML是一种自描述的半结构化语言,不仅能描述数据的外观,可
2、以表达数据本身的含义,在兼容原有Web应用的同时,XML还可以更好地实现Web中的信息共享与交换。XML的扩展性和灵活性允许它描述不同种类应用软件中的数据,从Web页面信息到数据记录,XML能够使不同来源的结构化的数据很容易地结合在一起。各种基于XML的应用不断涌现,产生了对XML文档进行统一管理的需求。另外,传统的数据库在基于Web的应用中遇到了诸多障碍,在这种情况下XML数据库应运而生。目前,XML数据库主要有两种类型:XML本源数据库(NXD,Native XML Database)、支持XML的数据库(XEDB,XML enable database)o NXD是专门对XML数据格式的
3、文档进行存取管理和数据查询的数据库。XEDB是在传统数据库的基础上,通过增加对XML数据的映射功能,从而实现对XML数据的存取管理。XML数据库的主要用途可以概括为两方面:对XML数据进行有效的管理,提供数据查询和修改功能,对基于Web的各种数据源进行集成。本文结合XML数据库研究的最新进展和XML数据库最新产品的实际性能,对XML数据库进行总体分析。1 XML数据库系统的组成11 XML数据库的数据区以及存储机制XML文档是XML数据库的数据区,一个XML文档就是一个基本的存储单元,相当于关系数据库中的一个表格。XML数据直接以XML文档格式存储。12 XML数据库数据模型DTD(文档类型定
4、义)或者Schemas是XML数据库数据模型。对XML数据库内容的存取访问都依据该模型。模型中规定了元素(elements)、属性(atributes)、PCDATA以及文档内容的顺序。XML数据模型可以支持任意层次的数据嵌套,对半结构化数据提供了良好的支持。在DTD中可以说明XML文档中的数据类型(datatypes),通过detatypes可以进行基于数据类型的查询操作。因此,DTD还是对XML数据建立索引的一种主要手段。Schemas是W3C推荐的XML数据模型标准,它比DTD更加严格规范。目前大量使用的是DTD,未来XML Schema有可能取而代之。13 XML数据库查询和操作语言X
5、Query、XPath、XQL、XMLQL都是数据库查询语言。XQuery是W3C提出的对XML文档进行信息查找的查询语言规范。其具体标准由XML Query工作组制订,其当前版本为XQuexy 10。XPath是W3C提出的在XML文档内描述数据元素在文档中的位置的规范。W3C在2OO2年4月30日推出的XPath 20标准中,容纳了XQuery 10的基本要求。因此XPath不仅用于确定数据在文档中的位置,还支持数据查询。目前的大多数XML数据库都采用它实现数据查询。XSLT是对XML数据进行操作的语言。XSLT与XML的关系,就好象SQL语言与关系数据库的关系一样。在对XML文档操作时,
6、通常XPath与XSLT是协同工作的。14 XML数据库处理工具DOM、SAX、JDOM是XML数据库处理工具。提供对XML文档的编辑、管理功能,以及与其它语言的编程接口。DOM(Document Object Model),即文档对象模型。是W3C推荐的对XML数据进行组织管理的标准和编程接口规范。JDOM是采用JAVA语言实现的DOM。SAX(Simple API for XML)是目前大多数XML数据库实际使用的开发标准,几乎所有的XML解析器都支持它。与DOM比较而言,SAX是一种轻量型的方法。2 XML文档类型XML文档可以分两大类:以数据为中心、以文档为中心。以数据为中心的文档结构
7、规范、数据粒度好(最小的独立数据单元是PCDATA、elements或者atributes)、很少或者没有混合内容。文档中间层次的elements、PCDATA的之间的顺序不作严格要求,类似于关系表。数据为中心的文档主要用于数据存储或交换,便于机器理解和处理。以文档为中心的文档内部数据结构不规则,内容是混合的,其内部包含的信息自身的物理结构很重要。数据的粒度比较大。以文档为中心的文档便于人们的阅读,是典型的半结构化的文档,具有不规则的内容,如书本、电子邮件、广告等等。NXD不仅可以管理以文档为中心的文档,也可以管理以数据为中心的文档,而XEDB只可以对以数据为中心的文档进行管理。如果要对以文档
8、为中心的文档进行管理,应当选择NXD。3 XML数据库产品及其与传统数据库的比较31 NXD产品概述截止2003年8月,共有34种NXD产品2,这些NXD产品基本上是在2001年下半年以后面世的。比较有代表性的NXD产品有Tamino、dbXML、eXcelon和XHiveDB,分别由德国的Software AG公司、dbXMLGroup LLC公司、eXcelon公司和荷兰的The Connection Factory公司研制。32 NXD与传统数据库的比较与传统数据库相比,NXD具有以下特点: 对半结构化数据进行有效的存取和管理,而传统的关系数据库对于半结构化数据无法进行有效的管理。 提供
9、对标签(Tag)和路径的操作。传统数据库语言不能对元素名称操作,半结构化数据库提供了对标签名称的操作,还包括了对路径的操作。 当数据本身具有层次结构时,由于XML数据格式能够清晰表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作。顺序性(sequence):在传统的数据表中,表项(field)之间的顺序是可以互换的。以文档为中心的XML文档与传统的数据表不同,其内容是有顺序的,不允许随便调整elements、attributes、PCDATA的顺序。当然,顺序性使得对XML文档的查询、修改比传统数据库的相应操作复杂。 与各种数据的交换能力:由于XML本身是一种标准的数据交换格式,因
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XML 数据库 系统 综述
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内