java对XML的解析.ppt
《java对XML的解析.ppt》由会员分享,可在线阅读,更多相关《java对XML的解析.ppt(44页珍藏版)》请在三一办公上搜索。
1、第八章 java对XML的解析,XML是扩展性标识语言的简写特点:自定义标签作用:一种通用数据交换格式,系统配置文件一般采用XML格式书写,用来记录应用程序的配置信息。优点:结构严谨规范性强标准的数据交换文件,已用于通用的配置信息文件结构简单,清晰,便于书写,增强阅读性将数据结构化,让数据间具有明确的层次关系,XML(Extensible Markup Language),语言标记html标记是固定标记集合xml提供的是一个定义标记的标准,其中的标记是可以自由定义代码的书写html语言编写相对随意,要求松散。xml语言编写有非常严格的规范描述内容html将数据和显示结合在一起xml将数据和显示
2、相分离,记录数据和数据间关系,只对数据进行描述,不考虑显示效果。,XML与HTML区别,张三20李四23,XML举例,XML声明(declaration)DOCTYPE声明处理指令(processing Instruction)注释(comment)元素(element)CDATA并不是每一个XML都需要所有的组成部分。,XML文档的组成部分,文档声明(xml文档首行):格式:encoding定义文档字符编码集合,“gb2312”Standalone定义文档是否独立,“yes”no”文档类型定义:指定xml文档定义文档类型所用的dtd来源处理指令为处理XML文档的应用程序提供提示信息,,XML
3、文档的组成部分,文档注释 注释不可以嵌套文档主体内容自定义标记对数据进行结构描述,通过树形结构体现文档结构文档中只能有一个顶层元素(根元素)顶层元素中包含:元素属性元素文本内容CDATA(character data字符数据区)各种子元素,XML文档的组成部分,所有XML标记都严格区分大小写XML只能有一个顶层元素,其他元素都包含在顶层元素中所有的标记都必须要要有开始和结束标签,如果没有单独的结束标签,则在开始标签的内部直接添加结束“/”所有标记的属性值必须用“”或 括起来,XML语法规则,名字中可以包含字母、数字及一些可见字符和中文名字不以数字和下划线开头,不以“xml”开头,名称中不可以包
4、含空格,冒号(:)命名尽量简短,一个文件中大小写尽量统一标准所有的XML标记都必须合理嵌套,不允许出现交叉嵌套,XML命名规则,存放不想被解析的原始数据格式:中示例:,CDATA区域(字符数据区域),在元素的文本中有些符号不可以直接出现,因为会出现解析错误。比如:“”对于这些符号可以使用转义字符来标识,XML中的特殊字符,什么是约束模式?定义:定义XML文档中允许出现的元素名,元素中的属性,元素中的内容类型及元素间的嵌套关系和出现顺序,为文档指定XML约束模式后,就必须遵循该约束模式。XML约束模式语言:用作XML约束模式的内容也需要遵循一定的语法规则,这些规则形成XML约束模式语言,像这种创
5、造XML标记语言的语言称为元语言。模式文档:定义约束模式的文档实例文档:根据模式文档编写的文档常见的约束模式文件:DTD、XMLSchema,XML文档的约束模式,文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。DTD文件的好处:让每一个 XML 文件都可以具备单独的格式描述。也可以让一个组织都使用同一种格式描述。还可以直接引用一个权威机构指定的格式描述。,DTD文件(Document Type Definition),定义一个元素格式:PCDATA(Parsed Character DATA)(被解析的字符数据),DTD文件示例,如何给XML文档
6、加上约束呢?将DTD约束直接嵌套在xml文档中。格式:引入外部的DTD文件到XML文档中,DTD文件与XML文档的结合,mike29bj,将DTD约束直接嵌套在xml文档中,文档类型名称:可以自定义,通常使用根节点名称SYSTEM:表明XML遵循的是一个组织内部的约束。示例:PUBLIC:表示XML遵循的是权威机构或特定行业提供的DTD文件。DTD名称:用于标识该DTD文件,只有在PUBLIC声明时才用到。,引入外部的DTD文件到XML文档中,元素是 XML 文档的基本组成部分,在 XML 文档中使用的每个元素及其属性都要在 DTD 文件中进行定义语法格式:示例:,DTD 文档元素定义,元素的
7、使用规则定义了:元素中包含的组成部分每种组成部分出现的次数各组成部分间的次序(#PCDATA)表示元素中嵌套的内容是普通文本字符串。EMPTY:元素中不包含任何子元素和普通文本字符串,这种情况用于定义 XML 文件中的空元素:例如,定义的元素形式为,DTD 文档元素使用规则,DTD 文档元素使用规则,每条元素定义语句的顺序是无关紧要的 具有不同用途的元素不能使用相同的元素名 在元素的使用规则中可以通过正则表达式定义子元素出现的次数:,圆括号可将括在其中的内容组合成一个可统一操作的分组,分组中可以嵌套更小的分组。,元素的各个组成成份的特点 元素的使用规则中的各个组成成分用空白符分隔,他们的出现顺
8、序没有严格要求:?用逗号分隔,出现顺序必须与排列顺序一致:用竖杠|分隔,它们在 XML 文档中只能出现它们之中的任何一个:,DTD 文档元素使用规则,语法格式:示例:#REQUIRED:必须设置该属性#IMPLIED:可以设置也可以不设置#FIXED:说明该属性的取值固定为一个默认值,属性类型CDATA:指的是纯文本,即由字符、符号组成的字符串,DTD 文档属性定义,Enumerated:属性也可以被描述为一组可接受的取值的列表,XML文件中对属性的赋值将从这个列表中选取一个值。这类属性属于枚举类型ENUMERATED,不过关键字ENUMERATED是不出现在Dtd定义中的。ID:是用属性值的
9、方式为文件中的某个元素定义唯一标识的方法,由处理文件的程序或脚本语言使用。ENTITY:将多内容文本或者一个文件用一个简称来标识。,属性类型,lisi预览结果:学生元素的id属性会自动加载male值。,ENUMERATED,XML解析器是读取XML文档并分析其结构的代码。一般而言使用解析器需要以下步骤:创建一个解析器对象使解析器指向您的XML文档处理结果常见的解析模式DOM(Document Object Model)文档对象模型,w3c的标准,DOM处理XML文档是基于将XML文档解析成树状模型,放入内存进行处理,XML解析,SAX(Simple Api for Xml)SAX则是采用基于事
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- java XML 解析

链接地址:https://www.31ppt.com/p-6509766.html