【教学课件】第10章XMLDOM物件模型.ppt
《【教学课件】第10章XMLDOM物件模型.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第10章XMLDOM物件模型.ppt(85页珍藏版)》请在三一办公上搜索。
1、第10章 XML DOM物件模型,DOM 的基礎JAXP API 的基礎在 Java 程式載入和剖析 XML 文件DOM 的節點介面XML 文件的驗證XPath/XSLT 與 Java,General Purpose XML Programming,Needed for:domain-specific applicationsimplementing new generic toolsImportant constituents:parsing XML documents into XML treesnavigating through XML treesmanipulating XML tr
2、eesserializing XML trees as XML documents,XML程式設計,一般來說,XML剖析器主要有兩種類型:樹狀基礎的剖析器(Tree-based Parser):將XML文件轉換成樹狀結構剖析器需要分析完整份XML文件後提供相關介面物件來存取樹狀結構的節點,例如:DOM、JDOM、JAXP APIs。事件基礎的剖析器(Event-based Parser):讀取內容時觸發一系列事件,應用程式提供函數處理這些事件,以便存取XML內容,例如:SAX(Simple API for XML)。,Parsing Events,View the XML document a
3、s a stream of events:the document startsa start tag is encounteredan end tag is encountereda namespace declaration is seensome whitespace is seencharacter data is encounteredthe document endsThe SAX tool observes these events It reacts by calling corresponding methods specified by the programmer,DOM
4、 vs.SAX,Memory consumption:The JDOM version:on 18MB documentThe SAX version handles 1.2GB in 51 secondsTree Navigation is easier for DOM;especially when backward traversal is necessary.,什麼是DOM,DOM(Document Object Model)物件模型可以將一份結構化文件轉換成一棵由節點(Nodes)組成的樹狀結構,提供節點的相關屬性和方法來存取元素內容,或新增、刪除和修改節點內容,如下圖所示:,什麼是
5、W3C DOM,DOM 是 W3C 建議規格Designed with language independenceDOM Level 1 在 1998 年 10 月 1 日成為 W3C 的建議規格,DOM Level 2 是在2000 年 11 月成為建議規格,目前最新版本是 Level 3,W3C DOM的特點,跨平台和程式語言的程式介面支援多種結構化文件W3C DOM 支援 HTML 和 XML 文件支援多種程式語言JavaScript、VBScript、Perl、Visual Basic、Delphi、C+、PHP 和 Java 等程式語言。支援多種文件驗證DOM 支援 DTD、XML
6、Schema 等 XML 文件驗證。,W3C DOM基礎的文件分析,例如:一份XML文件,如下所示:01:02:03:Java 2程式設計範例教本04:陳會安05:65006:07:,XML的DOM樹,以 W3C DOM 的角度來看,前頁的 XML 文件就是一棵樹狀結構的節點資料,以 Java 語言來說,就是一個 Document 物件,如下圖所示:,什麼是JAXP,之前已經說過了,要處理 XML 文件,首先這份文件都必須先經過 parser 來解析。XML 的 parser 有非常多種,比較著名的有 Apache 的 Xerces、Crimson 等;只可惜這些 parser 所提供的 AP
7、Is 並不相通(這跟當初設計 DOM APIs 時的想法不同)。Suns JAXP(Java API for XML Parsing)提供通用介面使得 Java 程式使用任意符合 JAXP 介面的 parser 來處理 XML 文件。JAXP 支援 Crimson、Xerces 等 XML parsersJAXP 支援 XML、SAX、XPath、XSLT 等標準JAXP vs.JDOMJDOM requires extra installationJDOM does not directly support XSLT,什麼是JAXP,JAXP API 的主要套件是 javax.xml.par
8、sers 套件提供與開發廠商無關的通用 API 來使用 DOM 和 SAX 剖析和驗證 XML 文件。在 javax.xml.parsers 套件主要包含兩個代理商類別(Factory Classes),如下所示:DocumentBuilderFactory 類別:自動選取某一 parser 類別(ex.Xerces),來產生 DocumentBuilderFactory 的物件利用現有的 configuration 來產生 DocumentBuilder 實例。SAXParserFactory類別:可以取得 SAXParser 實例來處理 SAX 事件基礎的 XML 剖析。,JAXP API
9、 的相關套件,JAXP API 提供 DOM 和 SAX 剖析和驗證的常用套件,如下表所示:,DOM API-說明,JAXP API 的 DOM API(Document Object Model API)是使用 javax.xml.parsers 套件的 DocumentBuilderFactory 類別來取得DocumentBuilder 實例,以便建立 DOM 樹狀結構節點的 Document 物件,如下圖所示:,DOM API-介面物件,將 XML 文件內容視為一個樹狀結構的節點,其主要的介面物件,如下表所示:,載入與剖析XML文件檔案,在 Java 程式載入與剖析 XML 檔案,首先
10、需要匯入 JAXP API 的相關套件,如下所示:import javax.xml.parsers.*;import org.xml.sax.*;import org.w3c.dom.*;程式碼匯入 XML 剖析器和 DOM 的相關套件,至於 org.xml.sax.*套件是剖析錯誤處理的相關套件。此外因為 XML 檔案是文字檔案,所以需要匯入檔案處理套件,如下所示:import java.io.*;,載入與剖析XML文件檔案,String filename=“Books.xml”;DocumentBuilderFactory dbf=DocumentBuilderFactory.newIns
11、tance();try DocumentBuilder db=dbf.newDocumentBuilder();Document document=db.parse(new File(filename);catch(SAXException se)se.printStackTrace();catch(ParserConfigurationException pe)pe.printStackTrace();catch(IOException ie)ie.printStackTrace();,設定剖析器的參數,DocumentBuilderFactory 類別提供相關方法可以利用 configur
12、ation 來設定 XML 剖析器的功能或者特性是否忽略註解文字或空白字元的 XML 元素等例如:設定剖析器參數來忽略註解節點、空白字元(需要配合 DTD)和不轉換 CDATA 節點,如下所示:/設定剖析的參數dbf.setIgnoringComments(true);dbf.setIgnoringElementContentWhitespace(true);dbf.setCoalescing(false);,使用DTD驗證,JAXP 從 API 1.1 版就開始支援 DTD 驗證,只需在DocumentBuilderFactory 物件使用setValidating()方法設定參數為 tru
13、e,就可以驗證XML文件,如下所示:dbf.setValidating(true);參數 true 表示 XML 剖析器需要驗證 XML 文件,預設是 DTD 驗證;如果設為 false,剖析器就不會進行文件驗證。,Ch10_5_1,import javax.xml.parsers.*;import org.xml.sax.*;import java.io.*;public class Ch10_5_1 public static void main(String args)String filename=Ch10-5-1.xml;DocumentBuilderFactory dbf=Docu
14、mentBuilderFactory.newInstance();try dbf.setValidating(true);/設定剖析的參數 dbf.setIgnoringComments(false);dbf.setIgnoringElementContentWhitespace(false);dbf.setCoalescing(false);DocumentBuilder db=dbf.newDocumentBuilder();/剖析XML文件 db.parse(new File(filename);System.out.println(XML文件:+filename+剖析成功!);catc
15、h(ParserConfigurationException pe)System.out.println(剖析器設定錯誤!);catch(IOException ie)System.out.println(檔案處理錯誤!);catch(SAXException se)System.out.print(“XML剖析錯誤);System.out.println(se.getMessage();,範例:Books.xml,function hello()alert(Hello World);PHP 5網頁設計範例教本 陳會安 600 2005 JSP 2.0網頁設計範例教本 陳會安研究室 650 2
16、004,Ch10_3_1 修改版,import javax.xml.parsers.*;import org.xml.sax.*;import org.w3c.dom.*;import java.io.*;public class Ch10_3_1 static Document document;public static void main(String args)String filename=Books.xml;DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();/dbf.setIgnoringElementC
17、ontentWhitespace(true);try DocumentBuilder db=dbf.newDocumentBuilder();/讀入XML文件 document=db.parse(new File(filename);/Document 也是 Node 的一種 System.out.println(getID(document);/取得文件的根節點,這兩種方式略有不同!/Node root=document.getDocumentElement();Node child=(Node)document.getFirstChild();,讀取 Books.xml 的內容,並將每一個
18、節點的節點型態、節點名稱等依照樹狀結構列印出來。,請觀察設定有無的差異!,Ch10_3_1 修改版,/取得這一層的所有節點 for(;child!=null;child=child.getNextSibling()System.out.print(getID(child);pChild(child,0);catch(SAXException se)/剖析過程錯誤 se.printStackTrace();catch(ParserConfigurationException pe)pe.printStackTrace();/剖析器設定錯誤 catch(IOException ie)ie.prin
19、tStackTrace();/檔案處理錯誤,Ch10_3_1 修改版,/練習題:請補上其他的節點型態/程設的補充:這就是多型的應用 private static String getID(Node n)int type=n.getNodeType();switch(type)case 1:return 元素:+n.getNodeName();case 3:return 內容:+n.getNodeValue().trim();case 4:return CDATA Section:+n.getNodeValue();case 6:return 實體名稱:+n.getNodeName();case
20、 8:return 註解:+n.getNodeValue();case 9:return Document:+n.getNodeName();case 10:return DOCTYPE:+(DocumentType)n).getSystemId();default:return 尚未定義:+type;,Ch10_3_1 修改版,/顯示子節點的遞迴方法 private static void pChild(Node temp,int pos)if(temp.hasChildNodes()NodeList nodes=temp.getChildNodes();/取得所有子節點 for(int i
21、=0;i nodes.getLength();i+)int type=nodes.item(i).getNodeType();printIndent(pos);System.out.println(getID(nodes.item(i);if(type=Node.ELEMENT_NODE)pChild(nodes.item(i),pos+1);/顯示縮排所需的字元 private static void printIndent(int num)System.out.print(+);for(int i=0;i=num;i+)System.out.print(-);,Node節點種類,Docum
22、ent文件物件,XML 文件建立的樹狀結構是 Document 物件(可以想成之前說過的 root node)當 DOM 載入 XML 文件建立 Document 物件後,就可以使用 getDocumentElement()方法取得 XML 文件的根元素,如下所示:Node root=document.getDocumentElement();取出的每一個節點都是一個 Node 物件。Document 物件還提供特殊的方法,能夠直接使用標籤名稱取得所有為該名稱的節點,如下所示:NodeList tagNodes=document.getElementsByTagName(book);Note:
23、Document 是 Node 的子類別,Node 節點物件,Node 節點物件許多方法:程式碼使用 getNodeName()方法取得節點的節點名稱若一個節點 root 擁有多個子節點,我們可以取得該節點下的所有子節點:NodeList nodes=root.getChildNodes();另外,還有 getNodeValue()和 getAttributes(),Node 節點物件,Node 節點物件還提供更多方法能夠瀏覽XML 文件來取得指定節點,相關方法的說明,如下表所示:,NodeList 節點清單的集合物件,當在 Java 程式呼叫 getChildNodes()方法,或是 get
24、ElementByTagName()方法取得指定節點時,這些節點是一個 NodeList 集合物件(也就是類似 List 的結構),而每一個節點包含該節點和其子節點的一棵子樹。在 NodeList 物件的 getLength()方法可以取得共擁有多少個節點。例如:使用 for 迴圈顯示所有NodeList 物件的節點,如下所示:NodeList nodes=root.getChildNodes();for(int i=0;i nodes.getLength();i+)System.out.println(元素:+nodes.item(i).getNodeName();,NodeList 節點清
25、單的集合物件,Node節點物件的 getChildNodes()方法可以在樹狀結構的節點取得所需的子節點,如下所示:System.out.print(root.getChildNodes().item(1).getChildNodes().item(2).getNodeName();程式碼在取得根節點 root 物件後,使用getChildNodes()方法取得下一層第 2 個節點的第 3個子節點,對應 XML 元素就是第 2 個 book 元素的第3個子元素 price。,Element元素物件,Element 物件代表樹狀結構的 XML 元素節點:NodeList tagNodes=doc
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 10 XMLDOM 物件 模型
链接地址:https://www.31ppt.com/p-5657599.html