XML学习辅导材料.doc
《XML学习辅导材料.doc》由会员分享,可在线阅读,更多相关《XML学习辅导材料.doc(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、XML学习辅导材料XML学习进阶XML学习进阶1- 什么是XML11为什么使用 XML?32什么是 XML?33数据的结构表示44XML 文档45数据是从表示和处理中分离出来的76使XML数据自描述87XML数据处理98开放式标准109从XML中受益1110前景12XML学习进阶2-XML标准14XML标准141W3C 建议(Recommendations)152W3C Proposed Recommendations(W3C提出的建议)163W3C Working Drafts(工作草案)164W3CNotes(注释)185其它W3C Notes186在XML基础上建立的标准18XML学习进
2、阶3-XML使用方案211XML使用内容212XML的使用方案22a)数据自我描述:(Defination)22b)数据分析:(Parser)23c)数据显示:(Presentation)24XML学习进阶1- 什么是XML关键词:SGML, HTML,XML,SAX,DOM,XSL,DTD,Schema,DCD, RDF,CSS,W3C,Xpath,Xlink,SVG,VRML摘 要: 可扩展标记语言或者简称XML,是Web应用的一种新技术,是万维网联盟(W3C) 制定的的标准。XML简化了网络中数据交换和表示,使得代码、数据和表示可以分离,可以作为数据交换的标准格式。就这点而言,XML被称
3、为智能数据文档。本文概述了 XML 是什么、它产生的原因以及为什么它对表示和交换数据来说是极有价值和益处的技术。 缩略语清单:SGML Standard Generalized Markup LanguageHTML Hyper Text Markup LanguageXML Extensible Markup LanguageSAX Simple APIDOM Document Object ModelXSL Extensible Stylesheet Language,可扩展样式语言DTD Document Type Definition,文档类型声明DCD Document Conten
4、t DeclarationRDF Resource Description FormatCSS Cascading StyleSheetsXSLT Extensible Stylesheet Language TransformationsXpath XML Path LanguageXlink eXtensible Link Language,可扩展链接语言W3C world Web Consortium,web技术标准化集团SVG Scalable Vector GraphicsVRML Virtual Reality Markup Language参考资料清单:参考资料清单名称作者编号发
5、布日期查阅地点或渠道出版单位XML网络时代的娇子XML技术网为什么使用XMLMicrosoft MSDNXML的基本理论_河南众通信息技术有限公司_ Microsoft Online XML development Centre1 为什么使用 XML?Web 使我们能够与任何地方的任何人通讯。广泛接受的标准(这对完全使用 Web 的潜力是至关重要的)允许 Web 在多种交互操作的技术层上通讯。一个重要层是可视化显示和用户界面,例如 HTML、GIF 和 JScript(TM) 之类的现有标准。这些标准允许创建一次页面,并且在不同时间向众多接收者显示。尽管可视化和用户界面标准是必要层,但它们并不
6、足以表示和管理数据。当前,Internet 只是文本和图片的访问媒体。并没有智能搜索、数据交换、自适应表示和个人化的标准。Internet 必须超出设置信息访问和显示标准的限制。Internet 必须设置信息理解标准(表示数据的通用方式),以便软件能够更好地搜索、移动、显示和处理上下文中隐藏的信息。由于 HTML 是一种描述如何表示 Web 页的格式,所以 HTML 并不能完成以上处理;HTML 并不表示数据,它能够也只能够描述数据的显示格式。例如,HTML 不能: 允许医药实验室以所有接收者均能分析的格式发表统计信息。 以所有接受者均能解码和处理的表格描述电子支付。 提供搜索法律图书馆中有关
7、某一主题的所有诉讼文档的标准方式。 指定以何种方式传送公司目录中的信息,以便销售人员可以脱机工作、向客户显示目录、接受定单并以标准格式上载这些定单。 简而言之,尽管 HTML 提供了用于显示的丰富工具,但 HTML 并没有提供任何基于标准的管理数据的方式。正如数年前用于显示的 HTML 标准扩展了 Internet 一样,数据标准亦将扩展 Internet。 数据标准将是商业交易、公布个人喜爱的配置文件、自动协作和数据共享的工具。将以此格式编写制药研究数据、半导体部件图以及采购定单。这将开创众多新用途,这些新用途均基于在 Web 上到处移动结构数据的标准表示,正如当前我们移动 HTML 页一样
8、容易。数据标准是 XML 和 XML 扩展名。2 什么是 XML?World Wide Web Consortium (W3C)对XML进行了如下描述:Extensible Markup Language,缩写为 XML,描述了一类被称为XML文档的数据对象,并部分描述了处理它们的计算机程序的行为。XML 是SGML (Standard Generalized Markup Language ISO 8879)的一个应用实例或一种受限形式。从结构上说,XML文档顺从SGML文档标准。Microsoft 对 XML 的定义是:Standard Generalized Markup Languag
9、e (SGML) 的简化子集,专门为 Web 应用程序而设计。XML 提供描述不同类型数据的标准格式 例如,约会记录、购买定单、数据库记录 从而可一致而正确地解码、管理和显示信息。XML 提供表示数据的文件格式、描述数据结构的计划、以及用语义信息扩展和注释 HTML 的机制。总而言之,XML 是一种元标注语言,该语言提供一种描述结构数据的格式。这有助于更精确地声明内容,方便跨越多种平台的更有意义的搜索结果。此外,XML 将起用新一代的基于 Web 的数据查询和处理应用程序。3 数据的结构表示XML 提供可以广泛执行并易于配置的数据的结构表示。XML 是 万维网协会(W3C) 定义的用于优化 W
10、eb 上的传输的 SGML 的子集,XML 确保结构数据是一致的并独立于应用程序或供应商。XML 提供可以编码各种情况(从简单至复杂)的内容、语义和架构的数据标准,可被用于标注以下对象: 普通文档。 诸如约会记录或采购定单之类的结构记录。 具有数据和方法的对象,如 Java 对象或 ActiveX 控件的持续型表单。 数据记录,如查询的结果集。 有关 Web 站点的元内容,如“频道定义格式 (CDF)”。 图形表示,如应用程序的用户界面。 标准架构实体和类型。 Web 上的信息与用户之间的所有链接。 一旦该数据在客户机桌面上,就可以在多个视图中处理、编辑和表示它,而无需返回到服务器。由于较低的
11、计算量和带宽负载,所以目前的服务器更易于升级。此外,由于以 XML 格式交换数据,所以可以轻而易举地合并来自不同来源的数据。XML 对 Internet 和大型企业的 Intranet 环境是颇有价值的,这是由于 XML 提供使用灵活、开放、基于标准格式的互用性,并具备访问遗留数据库和将数据传输到 Web 客户机的新方式。可以更快地生成应用程序,应用程序更易于维护,并且可以在结构数据上轻易提供多种视图。4 XML 文档XML 是一种基于文本的格式,在许多方面类似于 HTML,后者是专为存储和传输数据而设计的。XML 源是由 XML 元素组成的,每个 XML 元素包括一个开始标记(),一个结束标
12、记()以及两个标记之间的信息(称为内容)。就象 HTML 一样,XML 文档保存利用标记注释的文本。然而,与 HTML 不同的是,XML 允许无限的标记集,各标记集并不表示如何显示,而是表示其含义。例如,可以将 XML 元素标记为价格、订单编号或名称。由文档的作者确定使用何种数据以及哪种标记名称最合适。 标记是对了文档存储格式和逻辑结构的描述。在形式上,标记有以下各种可能项:注释、引用、字符数据段、起始标记、结束标记、空元素、文档类型声明(DTD)和序言。 很容易创建 XML 文档。如果您熟悉 HTML,那么您可以很快地学会采用 XML 格式进行编写。在该示例中,利用 XML 描述天气预报,可
13、以用 XML 的扩展名保存该文件,如 Weather.xml。2001 年 1 月 1 日08:00 南京 江苏 东部 中国 局部多云 -3 西北 3 51 87 10 1各标记表示各数据项的含义(是否为 元素、 元素等等),而并不描述显示数据的次序和形式。此数据的所有接收者均可将该文档解码,以便用于自己的特定目的。例如,某人可以利用该信息制定当天的计划,而气象研究员可以将其作为南京的历史记录。每个XML文档都有一个逻辑结构和物理结构。从物理角度来看,文档由实体单元组成,一个实体也可以在其他文档的实体中被引用。一个文档以一个根元素或文档实体来开始。从逻辑上讲,文档由声明(declaration
14、)、元素(element)、注释(comment)、字符引用(character reference)和处理说明(processing instruction)组成。这些组成部分在文档的标记中必须明确规定。物理结构从另一角度来规范XML文档。文档的起始标记和结束标记对数据进行结构化组织,并确定了元素的范围和相互之间的关系。 在XML文档中,除标记之外就是字符数据。一般的字符用其本身来表示,但这不适用于XML中的保留字符。例如,字复符&和 Greater thanLess than Apostrophe'Quotation mark 例如,如果要表示a b,就必须写成: a、 和,它们
15、的名称分别为amp、lt、gt、apos和quot。因此,如果要在元素中引用这些实体,就必须写成:&、'和。 字符引用代表了ISO/IEC 10646字符集中的一个特定字符,它是一个十六进制代码。如果XML文档需要引用现有设备不能直接输入的字符(比如回车),则必须用字符引用来代表。 XML文件也可以对一个处理XML数据的应用提供处理信息,即处理说明,其格式为:。例如,就是一种处理指令。解析器通过它得知该文档应当遵循XML 1.0标准。XML文件可以对不同应用提供不同处理说明。 引用预定义实体或字符非常方便,而且计算机处理也十分容易,但去读一懂大堆像&、#xNNNN;这样枯燥的数据确实
16、是一件烦琐的事;在写文档时也得面临同样的问题,你必须化精力去寻找这些字符实体,然后将特殊字符替换为字符引用。以结束的字符数据段(CDATA Section)凌驾于解析器之上,其中的内容将不被解析。字符数据段中除了不能有结束标志 外,可以包括任意字符序列。例如,标记化的文本可以直接放在字符数据段中而不会被解释为结构化的标记。我们可以在字符数据段中包含一段HTML代码,也可以在字符数据段中添加编程语言代码。 字符数据段为XML的后续处理提供了编程接口。例如,我们可以在XML的样式语言XSL中采用ECMAScript脚本语言编写灵活丰富的应用。 XML文件总有一个序言(prolog)声明该文件为XM
17、L文档,例如()。该序言也可以包含附加信息,如: Prolog的属性包括:版本、编码以及是否独立,后者指明该文档是否引用一个外部实体或外部数据类型。另外还可以直接包含本来在DTD中声明的实体定义和规范。 从上面的介绍,我们可以看出,XML有以下几个特点: l XML文档是纯文本,因此可用从文本编辑器直到可视化开发环境的任何工具创建和编辑,程序可以更简单,而在需要存储大量数据的场合,一个数据库的XML前端就可以满足需要,因此XML提供了从小配置文件到公司级数据仓库的可扩展性。 l 基于内容的数据标识,因而可被不同程序用于不同用途。 l 可格式化。在显示很重要的时候,XSL可指定如何显示数据。由于
18、数据和显示是分离的,甚至可以为同一数据指定不同的样式表用于不同输出,并很容易在将来使用新的格式。 l 具有很强的链接能力,可以定义双向链接、多目标链接、扩展联结和两个文档间的链接。 l 易于处理。XML对格式的定义更为严格,并具有层次结构,处理起来更加容易。它是与厂商无关的标准,可以任选一个解析器来处理。 您可以在 XML 中定义无限的标记集。虽然可以使用 HTML 标记以粗体或斜体的方式显示文字,但 XML 可提供一个用于标记结构数据的框架。XML 元素可以将其关联数据声明为零售价格、营业税、书名、降雨量或其他任何需要的数据元素。随着整个组织以及 Internet 上的其他用户采用 XML
19、标记,将出现搜索和处理数据的相应能力,而不管发现该数据的应用程序如何。一旦定位了数据,就可以在网络上传送并以多种方式在浏览器中显示,或者传送到其他应用程序以供进一步处理和查看。标记表示一块数据。通常,它对应于某个表中的某个字段。然而,这并不是必要的。标记可以是一个计算列(价格乘以数量)。没有理由认为一个 XML 文件表示某个表中的所有数据。正像通常看到的那样,XML 将表示包括许多表的查询结果。只要接收应用程序能够搞清 XML 中的数据的意思,数据是从哪里来的以及该数据如何到达 XML 文件并不重要。5 数据是从表示和处理中分离出来的XML 的优势在于,它保持了用户界面和结构数据之间的分离。H
20、TML 指定如何在浏览器中显示数据,而 XML 则定义内容。在 HTML 中,使用标记告诉浏览器以粗体或斜体的方式显示数据;而在 XML 中,只使用标记来描述数据,如城市名、温度和气压。在 XML 中,使用诸如“扩展样式语言 (XSL)”和“层叠样式表 (CSS)”之类的样式表,来表示浏览器中的数据。XML 把数据从表示和处理中分离出来,使您可通过应用不同的样式表和应用程序,来按您的愿望显示和处理数据。把数据从表示中分离出来,能够无缝集成众多来源的数据。可以将用户信息、采购定单、研究结果、帐单支付、医疗记录、目录数据以及其他来源转换为中间层上的 XML,以便像 HTML 页显示数据一样很容易地
21、联机交换数据。然后可以在 Web 上将按照 XML 编码的数据传送到桌面。对于大型数据库或文档中存储的遗留信息无需进行更新,并且由于使用了 HTTP 在网络上传送 XML,所以此功能不需要更改。XML 在采用简单、柔性的标准化格式表达和在应用间交换数据方面迈出了一大步。HTML 提供了显示数据的通用方法;XML则提供了直接在数据上工作的通用方法。XML的威力在于将用户界面和结构化数据相分离,允许不同来源数据的无缝集成和对同一数据的多种处理。从数据描述语言的角度看,XML是灵活的、可扩展的、有良好的结构和约束;从数据处理的角度看,它足够简单且易于阅读,几乎和HTML一样易于学习,同时又易于被应用
22、程序处理,因此,XML必将带来下一代网络应用技术的革命。6 使XML数据自描述在 XML 中,“文档类型定义(DTD)”可以伴随文档,且文档类型定义实质上定义文档的规则,例如哪些元素可被显示以及元素之间的结构关系。当接收应用程序没有传入数据的内部描述时,DTD 将帮助验证该数据。然而,在 XML 中,DTD 是可选的。与 DTD 一起发送的数据称为有效 XML。此时,XML 语法分析程序应对照 DTD 中定义的规则校正传入的数据,以确保该数据被正确构造。没有与 DTD 一起发送的数据称为结构良好的 XML。这里,可以使用基于 XML 的文档实例,如以上显示的层次结构气象数据,可用来隐含地描述它
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XML 学习 辅导材料
限制150内