《XML及其应用》PPT课件.ppt
《《XML及其应用》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《XML及其应用》PPT课件.ppt(62页珍藏版)》请在三一办公上搜索。
1、XML及其应用,北京大学计算机系,王胜清,推荐站点,一个XML的例子,张三 1999年3月2日 脸盆 20 李四 1999年12月8日 牙刷 10,在电子商务应用中,需要对大量复杂的动态数据使用统一的数据格式进行表示和管理。如何实现?一种可行的方法就是使用扩展标记语言XML(eXtensible Markup Language)。XML基于文本格式,开放跨平台,采用结构化数据表示格式,数据表示与数据显示相分离,无论是在B2B还是在B2C中,均能发挥重要作用。,主要内容简介,1.XML及其主要特征2.XML的研究背景3.XML与HTML的比较4.XML的相关技术5.XML的实现6.XML的应用7
2、.XML在中国,一、.XML及其基本特征,XML eXtensible Markup Language(可扩展的标记语言)是SGML(Standard Generalized Markup Language)的一个优化子集,是一通用数据格式表示语言XML 是一标记语言族,XML是一种元标记语言,使用者可按需创建新的标记。带标记的元素是XML文档的构造块,这种元素可以有若干个属性,并可以包含零个或多个子元素。这些子元素可以是文本数据,也可以是带标记的元素。,1、XML,1、XML(续),XML文档示例,Brown9 1/2 在中国定制,2、XML的特性 可扩展性。XML是设计标记语言的元语言,而
3、不是HTML这样的只有一个固定标记集的特定的标记语言。正如Java让使用者声明他们自己的类,XML让使用者创建和使用他们自己的标记,而不是HTML的有限词汇表。可扩展性是至关重要的,企业可以用XML为电子商务和供应链集成等应用定义自己的标记语言,甚至特定的行业一起来定义该领域的特殊的标记语言,作为该领域信息共享与数据交换的基础。,2、XML特性(续)灵活性。HTML很难发展,因为它是格式、超文本和图形用户界面的混合,要同时发展这些混合在一起的功能是很困难的。而XML提供了一种结构化的数据表示方式,使得用户界面分离于结构化数据。在XML中,可以使用样式表,如XSL(Extensible Styl
4、esheet Language,可扩展样式表语言)和CSS2(Cascading Style Sheets Level 2,层叠样式表第2进阶),将数据呈现到浏览器中。另外,XML文档之间的超链接(Hyper Link)功能由独立的XLink(Extensible Linking Language,可扩展链接语言)来支持。所有这些方面都可以互相独立地改进并发展。所以,Web用户所追求的许多先进功能在XML环境下更容易实现。,2、XML特性(续)自描述性。XML文档通常包含一个文档类型声明,因而XML文档是自描述的;不仅人能读懂XML文档,计算机也能处理。XML文档中的数据可以被任何能够对XML
5、数据进行解析的应用所提取、分析、处理,并以所需格式显示。XML表示数据的方式真正做到了独立于应用系统,并且这些数据能重用。所以XML适合开放的信息管理。因为它的自描述性,文档里的数据可以由XML使能的应用来创建、查询和更新,跟处理传统的关系型数据库、面向对象数据库里的数据类似。XML甚至还能用来表示那些以前不被看作文档但是对传统的数据库来说又过于复杂而难以处理的数据。所以,XML文档被看作是文档的数据库化和数据的文档化,2、XML特性(续)除上述特性以外,XML具有简明性。它只有SGML约20%的复杂性,但具有SGML功能的约80%。同完整的SGML相比,XML简单得多,易学、易用并且易实现。
6、另外,XML的诞生也吸收了人们多年来在Web上使用HTML的经验。值得注意的是,XML采用Unicode字符编码系统,从而支持世界上几乎所有的主要语言,并且不同语言的文本可以在同一文档中混合使用,XML能使的软件能处理所有这些语言的任何组合。总之,XML是数据表示的一个开放标准,这种数据表示独立于机器平台、提供商、和编程语言。这一切使得XML及相关技术成为新一代网络计算的一个关键。,二、XML的研究背景,1、WWW技术的发展2、HTML与HTTP HTTP-协议 HTML(1992)+Browser-用户接口3、动态、数据驱动的Web,超过HTML的能力范围4、HTML:显示格式与内容一起5、
7、CSS(Cascading Style Sheets)+HTML6、大量复杂的动态数据管理,需要通用的数据格式,7、HTML缺陷HTML并不具备大规模Web应用所需的可扩展性、结构化和数据验证等特性。8、GML与SGML GML,1960s(IBM的文档(如Script和Bookmaster)系统的基础)。SGML为出版业提供了一种将数据内容与显示分离开来的数据表示方法,使得数据独立于机器平台和处理程序。SGML的确在许多大型出版系统中很有用,但是它的复杂性使其难以直接应用到Internet上,这也是它没有被广泛接受的主要原因。另一方面,作为一个用SGML定义标记语言的典型例子,HTML是专为
8、Web上发布超文本而设计的标记语言。,9、XML的设计准则:1)XML应直接可用于Internet 2)XML应支持更广泛的应用 3)XML应与SGML兼容 4)应易于写处理XML文档的程序 5)XML的可选特征应最小,最好为零 6)XML文档应含义清楚,人可理解.7)XML的设计应入手容易 8)XML的设计应可形式化、简明 9)XML文档应易于产生 10)简洁,10、XML从1996年开始,W3C(World Wide Web Consortium)致力于XML技术。建立了基本技术规范建立了XSL及XML命名空间规范1998年2月10日,W3C发布了XML 1.0作为其推荐标准。1999年9
9、月推出XML查询标准规范。XML给Web应用乃至网络计算注入了新的活力。,三、XML与HTML的比较,1、两者同根SGML,均基于文本2、HTML文档主要包含显示格式、主要是为了浏览,而不是为计算机所使用,是显示格式描述语言3、HTML包含预定义的标记(Tag)集,易学易于访问,但难以数据重用,可扩展性差4、XML以数据可重用为切入点,可定义自己的标记集,且能让其它人或程序知道和理解这些标记集,可扩展性强5、XML比HTML易于扩展,XML标记表示了数据的逻辑结构,可为不同应用以不同方式加以分析 同时,进行严格的语法和语义检查。6、XML文档将数据与显示格式分离,是数据格式描述语言,为信息开放
10、、共享和交互提供基础,XML基本概念及语法,元素由标记加上内容构成.标记与属性(attribute).属性是针对元素的,但形式上常附着在标记中.XML文档的well-formed概念所有元素都要正确关闭(空元素 要标记之间不能交叉所有属性指都要括上引号,属性压要以名值对方式出现其它规定,XML基本概念及语法(续),XML文档的有效(Validation)概念 如果一个文档类型声明(DTD)与一个XML文档相关联,如果该文档符合该DTD,那么该文档被认为是有效的。XML文档的生命周期Authoring storageTransmissionParsing Validation?processin
11、gRenderingXML文档与它的Prolog和DTD,XML基本概念及语法(续),DTD的链接方式有两种,内嵌式,外接式。如果用外接式,将定义好的DTD存成一个.dtd的纯文字文件,比如上面例子存为book.dtd,然后按如下方式引用:XML大小写有区分元素名和属性名均区分大小写,这有点像UNIX操作系统,一个关于图书编目卡的DTD:可选安全属性,缺省值 语言的一种固有数据类型,四、XML的相关技术,1、DTD(Document Type Definition)XML文档可以在它的文档类型声明(Document Type Declaration)里声明某个DTD(Document Type
12、 Definition,文档类型定义)。DTD是关于XML文档中出现的标记和元素结构的语法约束,它可用来验证一个XML文档。DTD是一系列关于元素类型(Element Type),属性(Attributes),实体(Entities)和符号(Notations)的定义。它定义了文档所需的标记,比如可在文档里使用的元素类型,这些元素之间可能的联系,等等。,2、XSL(eXtensible StyleSheet Language)XML把内容和显示格式分开,可以让不同的用户按照各自希望的格式显示同一XML文档的数据内容。为XML文档提供格式信息的是样式表,适用于XML文档的样式表语言有XSL和CS
13、S2语言。XSL是专为XML设计的样式表语言,并采用XML语法。XSL的优势在于它可以用于转换,当然XSL也可以把XML文档转换为HTML格式。而且同一个样式表可以用于多个具有相似源树结构的文档。显示的媒介不仅限于WEB浏览器的窗口,还可以是印在纸上的书和报告等等。(CSS是用于分离HTML文档中的数据和格式)注:XSL实际上由两个基本点不同的标准构成:转化语言(XSLT)和格式化对象(fo,定义如何显示结果树),3、XSLT(XSL Transformation)XSLT的基本原理是模式和模板匹配,是一个用来根据一个XSL样式表将一个XML文档转换到另一个XML文档的语言。XSLT表达的一个
14、转换本身也是用一个XML文档表示的,它描述那些用来将一棵源树转换到一棵结果树的转换规则。XSLT表达的转换也叫做样式表(stylesheet)样式表包含一系列模板规则(template rules)。一个模板规则包含一个模式(pattern)和一个模板(template),4、XPath(XML Path Language,XML路径语言)Xpath是一个用来指明XML文档中部件的地址的语言。XPath采用简洁的非XML语法,是从XSLT中分离出来的表达式语言,主要用在XSLT和XPointer中;XPath表达式通常出现在URI(Uniform Resource Identifier)和XM
15、L属性值里。XPath表达式的求值是基于XML文档的抽象逻辑结构的,因此XPath被看作是一种在XML文档的层次结构里表示路径的方法。,5、Xpointer(XML Pointer)XPointer 是指向文档片段的指针。当文档片段发生变化时仍然可以发现。便于Server处理。,6、Xlink(XML Link)XLink是一种用XML元素向XML文档中加入链接的机制。它提供了比HTML更加灵活的链接机制,不仅支持HTML的单向链接,还支持多目的,多方向链接,它甚至还允许链接单独提出来存放在数据库中,或者是单独的文档中。XLink通过URI引用来定位资源。URI引用由URI和一个可选的块标识符
16、构成,两者用井号(“#”)分开。对于定位XML文档来说,块标识符使用XPointer规定的格式。对于链接元素来说,应用软件可以通过获取元素类型及属性名字或通过名为“XLink”的名字空间来辨认和处理链接。这两种方法都能很简单地确定链接元素。,7、命名空间命名空间用于区分具有相同名而又在相应的上下文中具有不同含义的元素和属性。.,前置字符串,Tom 1234.henry5648.,8、XML SchemaXML Schema 用于对XML文档的内容及其语义的约束机制进行有效的类型检验,应用XML Schema Language书写的schema文档定义了相应XML文档的规则,以约束其数据元素及其
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XML及其应用 XML 及其 应用 PPT 课件
链接地址:https://www.31ppt.com/p-5454538.html