基于XML的数据库分析.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《基于XML的数据库分析.doc》由会员分享,可在线阅读,更多相关《基于XML的数据库分析.doc(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、北华大学电脑科学技术学院数据库原理课程论文基于XML的数据库分析班级:软件08-2班小组成员:国娟 李阿雪 王丹 张雪 李国婧指导教师:胡晓宏2010年12月1日基于XML的数据库分析摘要:数据库提供了扩展的功能,能够在XML文档和数据库之间进行数据的传输。通常是设计成为能够存储和提取以数据为中心的文档。一般来说是把XML文档进行解析以后,存储到相应的表格中,当然,也可以存储以文档为中心的文档,也就是说把整个文档作为一个单一的表中的一个字段,然后通过文本检索机制进行查询。因为许多数据库现在能够把内容发布到网站上,基于XML的数据库和XML服务器之间的差异就变得很模糊。XML本身是不是数据库,从
2、严格的意义上来说,XML仅仅意味着XML文档。因为尽管一个XML文档包含数据,但是如果不通过其他的软件的软件来进行数据处理的话,它本身只不过是一个文本文件。所以XML本身不不能和数据库挂上钩,但是加上一些其他的辅助工具,我们可以把整个XML看成是一个数据库系统,XML文本本身可以看成是数据库中的数据区,DTD或者Schemas可以看成是数据库模式设计,XQL可以看成是数据库查询语言,SAX或DOM可以看成是数据库处理工具。Abstract: The database provides expanded capabilities to the XML documents and database
3、s for data transmission. Usually designed to be able to store and retrieve data-centric document. Generally it is to parse XML documents after the storage to the appropriate form, of course, can be stored in the document-centric document, which means the entire document as a single table in a field,
4、 then the text retrieval mechanism to search. Because many databases are now able to publish to the site, based on the XML database and XML server becomes very blurred the difference. XML itself is not a database, from the strict sense, XML simply means that the XML document. Because, despite an XML
5、 document containing the data, but if not through other software for data processing software, then it itself is just a text file. XML itself does not and so the database process is linked, but with a number of other auxiliary tools, we can put the entire XML as a database system, XML text itself ca
6、n be seen as data in the database area, DTD or Schemas can be seen as is a database schema design, XQL can be seen as a database query language, SAX or DOM processing tools can be viewed as a database. 关键字:XML 关系型数据库 XML服务器 中间件Keywords: XML relational database XML server middleware 引言:我们知道当存在大量数据需要处
7、理分析的话,最好是把这些数据放到数据库中,所以几乎所有大型的商业应用系统都是和数据库相关联的,所以如果XML需要在商业领域大展宏图的话,也必须要和数据库相联系。作为一种“数据库”格式,XML有一些优势:例如,它是自描述的所用的标记描述了数据的结构和类型,尽管缺乏语义,可交换的(portable)Unicode,能够以树型或图形结构描述数据。同样它也有缺点,例如,它显得有些繁琐,由于要对它进行解析和文本转换,所以数据访问速度较慢。一个更有用的问题就是在较为宽松的意义上,XML及其周边技术是否可以算作“数据库” - 数据库管理系统(DBMS)。答案是“在某种程度上是(sort of)”。从正面来说
8、,XML提供了许多数据库所具备的东西:存储(XML文档), 模式(DTD, XML schema,RElAX NG 等等), 查询语言(XQuery, XPath, XQL, XML-QL, QUILT等等,编程接口(SAX, DOM,JDOM)等等。从反面来说,它缺少一些作为实用的数据库所应具备的特性:高效的存储,索引,安全,事务和数据一致性,多用户访问,触发器,在查询多个文件等等。1 XML数据库的发展从早期将XML转换为关系型数据表或大型对象,到今日转向原生XML数据型态,关系型数据库与XML之间的合作日益紧密。 10年前XML开始起草并向W3C提案,而在1998年后成为W3C的标准。事
9、隔10年之后,XML已经随着网络应用日益普及,更在Web Services和SOA推波助澜下,可以预见XML的角色将会更形重要。 观察XML的重要发展趋势之一,是XML和关系型数据库的合流。IBM甫于6月在美国发表的新版本数据库DB2 9.0,便以原生XML数据型态和存取技术作为改版重点之一。事实上,微软于去年年底推出的SQL Server 2005同样也在XML上下了一番功夫,改变过去将XML转换成关系型数据表的存放方式,让开发人员可以用XML的方法使用储存在数据库中的XML文件或 片段。其它如Oracle或Sybase等数据库也都具备在数据库中处理XML的技术和工具。由于XML部分技术仍在
10、审议,因此每家数据库厂商除对标准的 规格支持外,也各自发展不同的实作方式。 2 XML数据库介绍如果仅按数据库这个术语的本质来看,XML文件就是数据库,它是数据的集合。在许多方面看起来它和其他文件没什么区别 - 无论如何,每个文件都含有某种类型的数据。目前XML数据库有三种类型: (1)XMLEnabledDatabase(XEDB),即能处理XML的数据库。其特点是在原有的数据库系统上扩充对XML数据的处理功能,使之能适应XML数据存储和查询的需要。一般的做法是在数据库系统之上增加XML映射层,这可以由数据库供给商提供,也可以由第三方厂商提供。映射层管理XML数据的存储和检索,但原始的XML
11、元数据和结构可能会丧失,而且数据检索的结果不能保证是原始的XML形式。XEDB的基本存储单位与具体的实现紧密相关。 (2)NativeXMLDatabase(NXD),即纯XML数据库。其特点是以自然的方式处理XML数据,以XML文档作为基本的逻辑存储单位,针对XML的数据存储和查询特点专门设计适用的数据模型和处理方法。 (3)HybridXMLDatabase(HXD),即混合XML数据库。根据应用的需求,可以视其为XEDB或NXD的数据库,典型的例子是Ozone。 XML数据库是一个能够在应用中管理XML数据和文档的集合的数据库系统。XML数据库是XML文档及其部件的集合,并通过一个具有能
12、力管理和控制这个文档集合本身及其所表示信息的系统来维护。XML数据库不仅是结构化数据和半结构化数据的存储库,像管理其它数据一样,持久的XML数据管理包括数据的独立性、集成性、访问权限、视图、完备性、冗余性、一致性以及数据恢复等。这些文档是持久的并且是可以操作的。 当前着重于页面显示格式的HTML标记语言和基于它的关键词检索等技术已经不能满足用户日益增长的信息需求。近年来的研究致力于将数据库技术应用于网上数据的管理和查询,使查询可以在更细的粒度上进行,并集成多个数据源的数据。但困难在于网上数据缺乏统一的、固定的模式,数据往往是不规则且经常变动的。因此,XML数据作为一种自描述的半结构化数据为We
13、b的数据管理提供了新的数据模型,如果将XML标记数据放入一定的结构中,对数据的检索、分析、更新和输出就能够在更加容易管理的、系统的和较为熟悉的环境下进行,因而我们将数据库技术应用于XML数据处理领域,通过XML数据模型与数据库模型的映射来存储、提取、综合和分析XML文档的内容。这为数据库研究开拓了一个新的方向,将数据库技术的研究扩展到对Web数据的管理。3 XML数据库优势与传统数据库相比,XML数据库具有以下优势: 1、XML数据库能够对半结构化数据进行有效的存取和管理。如网页内容就是一种半结构化数据,而传统的关系数据库对于类似网页内容这类半结构化数据无法进行有效的管理。 2、提供对标签和路
14、径的操作。传统数据库语言允许对数据元素的值进行操作,不能对元素名称操作,半结构化数据库提供了对标签名称的操作,还包括了对路径的操作。 3、当数据本身具有层次特征时,由于XML数据格式能够清晰表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作。XML数据库适合管理复杂数据结构的数据集,如果己经以XML格式存储信息,则XML数据库利于文档存储和检索;可以用方便实用的方式检索文档,并能够提供高质量的全文搜索引擎。另外XML数据库能够存储和查询异种的文档结构,提供对异种信息存取的支持。4 基于XML的数据库产品分类根据Ronald Bourret在XML Database Products
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 XML 数据库 分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内