二章XML语言.ppt
《二章XML语言.ppt》由会员分享,可在线阅读,更多相关《二章XML语言.ppt(133页珍藏版)》请在三一办公上搜索。
1、第二章 XML语言,第一节 XML概述第二节 XML语法第三节 DTD第四节 Schema第五节 Namespace第六节 XSL第七节 XML的应用第八节 其他,如何表示信息?,如何表示信息?,如何表示信息?,计算机可读懂的信息表示,TCP/IP格式,计算机与人均可读的信息表示,国民党研究续集 中国友谊出版公司 1999-01-01 11.4 元 李敖议坛衰思录 中国友谊出版公司 2009-01-01 31.6 元 李敖有话说 中国友谊出版公司 2007-01-01 11.4 元,演示:http:/,http:/,第一节、XML概述,XML介绍XML的组成,XML介绍,XML:eXtensi
2、ble Markup Language中文译为“可扩展标记语言”,是用于标记电子文件使其具有结构性的标记语言。是SGML(Standard generalized markup language)的一子集.,标记读书时,为了突出重点,可以用彩色笔把某些句子加亮,或者下划线。文字编辑器借助置标来定义格式与外观通信程序依靠置标理解所传输信息的语意数据库通过置标来将数据字段与一定的含义相连,并表明字段之间的关系,标记语言一种用来给文本添加标记的语言。置标用标记语言对数据进行编码的过程。,GML(Generalized Markup Language)2 0世纪6 0年代,I B M公司创建了第一个标
3、识文档的通用标记语言GML。最初,GML只被用于IBM内部文档。,SGML随着众多企业采用GML,它被扩展为标准通用标记语言SGML(Standard Generalized Markup Language)。1986年,国际标准化组织把SGML确定为ISOhttp:/www.iso.org/SGML特点SGML包含一系列的文档类型定义(简称DTD)SGML是可以扩展;SGML十分复杂,不易学习使用,计算机实现也十分困难。,HTML1989年,欧洲核子物理研究中心在SGML基础上提出HTML(HyperText Markup Language)。HTML包含一组事先定义好的标签,每个标签表明一
4、定的显示格式。例如:被置标后的HTML文件,同时包含文本及文本显示格式信息。HTML文件由专门处理工具进行读取、显示。,HTML特点HTML只使用SGML中很小一部分标签HTML规定的标签是固定的,不可扩展,它不需包含DTD。HTML简单、易学易用HTML使 Web 技术从计算机界走向千家万户,从SGML到HTML,从MARC到DC,从Z39.50到SRU,W3C推出精简SGMLXMLHTML过于简单的语法无法表现复杂的形式,不能满足不断增长的需求。SGML太庞大,用户学、用不方便,且要全面实现SGML的浏览器又非常困难。,XMLXML是一种比HTML更强大的标记语言XML同样依赖于描述一定规
5、则的标签和能够读懂这些标签的处理工具。XML是可扩展的标记语言与HTML事先定义好固定标签不同,XML提供一个标签标准,用户可以根据实际需要自行定义新的标签。,XML目标在互联网上直接使用(类似于HTML)。支持各种不同的应用方式(浏览、内容分析)。与SGML兼容(SGML是XML的直接先驱)。处理XML文件的应用程序应该容易编写。XML文件具有良好的可读性(HTML的易读性很差)。用XML设计新的标记语言应该方便快捷(不必再去经历标准制定程序)XML文件应该容易编制(借助普通编辑工具就能编写)。XML标记的简洁性并不重要(不必再去费尽心机减少标记)。,XML1998年XML1.0成为W3C推
6、荐标准http:/www.w3.org/TR/1998/REC-xml-19980210 XML 1.0(Fifth Edition)http:/www.w3.org/TR/REC-xml/,第一节、XML概述,XML简史XML组成XML的优点,XML文档组成,三部分 标记描述 XML数据文件(.XML)置标语法 DTD/Schema文件(.DTD/.XSD)置标含义 XSL文件(.XSL),XML,DTD/XSD,XSL,理解结构,获得语义,XML标记描述,分两类一类偏重于语意描述XML看上去和HTML非常相象,但XML标签具有语义,支持相关工具的语义解析。一类偏重于显示方式描述,包括:文本
7、描述矢量图形、图象、声音描述等,张三 001 A公司(010)62345678 五街1234号 北京 北京 100001.,XML标记文档实例,置标语法,DTD(Document Type Definition)置标语法是通过文件类型定义DTD来描述的,即通过DTD来描述什么是有效的标签。DTD语法定义文件与XML数据标记文件是分离的。,DTD文档:contact.dtd,张三001A公司(010)62345678 北京 北京 五街1234号,XML标记文档:list.xml,置标含义,样式单(Style Sheet)为明确各个标签含义,XML使用样式单来向应用程序提供如何处理显示的指示说明。
8、,F公司的客户联系信息 用户ID:公司:EMAIL:电话:,样式单实例,将XML文档中的标签转换为HTML中的标签;将XML文档中的、等标签转换为HTML中的标签。,XML核心内容 XML Specification:http:/www.w3.org/TR/2006/REC-xml-20060816/W3C推荐标准,定义XML基本语法规范XML Namespace:http:/www.w3.org/TR/REC-xml-names/提供一种统一命名XML文档中的元素和属性的机制,避免来自不同标记词汇表的元素和属性之间冲突。XML Schema:http:/www.w3.org/XML/Sche
9、ma 用于定义和描述XML文档结构和内容模式,定义元素和元素之间的关系,定义元素和属性的数据类型。,XML Specification,XML Schema(DTD),XML Namespace,Application,XML应用体系结构,第一节、XML概述,XML简史XML组成XML的优点,XML的优点,可以自由地制定自己的置标语言不必由有关的组织认可,不必开发专用的浏览器;允许各个组织、个人建立适合他们自己需要的标记库,并且,这个标记库可以迅速地投入使用。,XML的优点,从语义层次进行描述便于修改便于检索便于处理遵循严格的语法要求便于书写、阅读便于借助工具自动化处理,XML的优点,便于不同
10、系统之间信息传输可以标注多种信息类型文字、图像、二进制文件等,XML的优点,具有较好的保值性XML的保值性来自SGML语言,SGML最初设计目标是要为文件提供50年以上寿命。电子文档的虽然能长期保存,但也存在隐患,处理软件升级导致打开文档的困难性。如五十年以后,人们可能没有工具去打开用Word97写的文档。,XML与HTML的比较,第二章 XML语言,第一节 XML概述第二节 XML语法第三节 DTD第四节 Schema第五节 XML命名空间第六节 XSL第七节 XML的应用第八节 其他,第二节 XML语法,XML规则逻辑结构物理结构参考资料:XML Specification(http:/w
11、ww.w3.org/TR/REC-xml/),XML规则,基本规则XML文档是由 Unicode 字符集组成的纯文本文档。XML 文档具有良好结构。XML文档区分大小写。标记之间信息构成字符数据。XML处理器不关心字符数据。XML可为各种对象、应用程序定义语法和文件格式。,XML规则,格式良好性规则XML 文档结构定义遵循XML 规范基于XML Specification规范构建的 XML 文档被称为“具有良好格式的 XML文档”。自定义由文档作者自行创建结构文档“DTD”或“XML Schema”;XML 处理器按照这个文档中的定义规则进行检验。,XML规则,格式良好性规则(1)有且仅有一个
12、根元素。根元素也称文档元素,整个 XML 文档的其他元素都包含在根元素中,并通过嵌套形成树型结构。除了根元素外,其他元素都是子元素。(2)每个元素必须有开始标记和结束标记开始标记的格式是:结束标记的格式是:空元素标记:,XML规则,格式良好性规则(3)元素必须正确嵌套元素嵌套时不允许交叉,最先出现开始标记的元素,其结束标记最后出现。(4)所有属性值必须放在双引号或单引号中。(5)如果文档没有 DTD,在缺省情况下,所有属性值的类型必须是“CDATA”。,有效性规则 如果 XML 文档中元素出现的个数、顺序以及元素包含的内容都符合 DTD或XML Shema规则,则该文档就是有效的。一个 DTD
13、 或 XML Shema 可以被多个XML 文档共享,既保证了 XML 文档结构的标准化,又大大减少编写代码的工作负担。,DTD,XML,XML,XML,XML规则,命名规则所有 XML命名都必需以字母、下划线或冒号开头。用作命名空间时才以冒号做分隔符。如:dc:title保留字用户不使用如:“XML”、“xml”,XML规则,第二节、XML的语法,XML规则逻辑结构物理结构,XML文件的逻辑结构,XML 文档组成文档头部声明注释处理指令文档类型定义文档主体由一个或多个元素组成;每个元素可以有子元素。,XML实例 1 23 4 5 XML 6 XML是一种可扩展的源置标语言,它可用以规定新的置
14、标规则,并根 据这个规则组织数据 7 8 9 11 张三12 13 14 15 16,XML文档头部,文档头部可以包括声明注释处理指令文档类型定义,XML文档头部,(1)XML 声明一个 XML 文档通常以一个XML声明开始,它指明XML版本等信息,必须出现在XML文档的第一行。XML声明的作用就是告诉XML处理程序:“当前文件是按照XML标准对数据进行置标的”。,XML文档头部,(1)XML声明语法格式 实例,XML文档头部,(1)XML声明属性Version:必备属性XML版本号,必须在属性列表中排在最前列。由于当前的XML最新版本是1.0,所以:version=“1.0”Standalo
15、ne:可选属性表明该XML文件是否还有一个配套置标声明文件Standalone=“yes”:表示没有配套的DTD文件;Standalone=“no”,可能有这样一个文件(也可能没有)缺省为:Standalone=“no”Encoding:可选属性表明XML文档使用的字符编码标准,常见的有:简体中文码:GB2312 繁体中文码:BIG5 西欧字符:UTF-8,(2)处理指令(PI,Processing Instruction)指导应用程序如何处理XML文件,格式:?处理指令名 处理指令信息?用于连接CSS样式单的PI格式 用于连接XSL样式单的PI格式,XML文档头部,(3)注释XML 中使用注
16、释对文档进行解释说明,增加程序的可读性,处理程序不对注释标记的内容进行处理。语法,XML文档头部,(3)注释使用注释规则注释不能出现在声明之前注释可以包容标记,使标记失去作用注释不能出现在标记中注释内容中不能包含“-”以下是合法注释:-,XML文档头部,(4)文档类型定义语法:要求:文档类型定义必须出现在根元素标记符前面。实例:张三,XML文档头部,文档主体,文档主体组成一个文档元素(根元素)多个子元素也可以有 PI 和注释,元素,XML元素一个元素包含一个起始标记、一个结束标记以及标记之间的数据内容。张三,元素标记,元素标记基本形式例如:,元素标记命名规则(1)以字母或下划线开头,后跟字母、
17、数字、下划线、横线和圆点等,不能包含空格,不能以字符串“xml”作为开头。下面是合法的XML标记名称:、下面是非法的XML标记名称:有空格 以数字开头 有非法字符”&”(2)标记是大小写敏感的,空元素标记 正常方式 简便方式,元素属性,XML元素属性属性不影响元素树型结构、并提供附加的上下文。属性格式:例如:,元素属性举例:王芳 李奇 黄昂扬 文笛声,属性定义规则 标记中可以使用多个属性,但属性名称不得重复;属性名是大小写敏感的;属性只能出现在起始标记或空标记中;属性值必须用引号(英文);少用属性,尽可能用子元素。因为属性有以下缺陷:属性值不能包含多重数值,但是元素可以;属性值很难扩展;属性不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XML 语言
链接地址:https://www.31ppt.com/p-6273645.html