<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    lqxue

    常用鏈接

    統計

    book

    tools

    最新評論

    [收藏]XML Schema 與 XML DTD的技術比較與分析


    未顯示需要 JavaScript 的文檔選項






    級別: 初級

    周競濤 (zhoujtnet@yahoo.com.cn)西北工業大學CAD/CAM國家專業實驗室
    王明微 (wangmv@hotmail.com)西北工業大學CAD/CAM國家專業實驗室

    2002 年 7 月 01 日

    XML DTD是目前使用最廣泛的一種XML 模式,XML Schema則已經成為W3C的正式推薦標準,并有替代XML DTD的趨勢。那么,從技術角度看,XML Schema與XML DTD有那些區別,XML Schema又有那些優勢呢?

    引言

    XML DTD(XML的文檔類型定義)是近幾年來XML技術領域所使用的最廣泛的一種模式。但是,由于XML DTD并不能完全滿足XML自動化處理的要求,例如不能很好實現應用程序不同模塊間的相互協調,缺乏對文檔結構、屬性、數據類型等約束的足夠描述等等,所 以W3C于2001年5月正式推薦XML Schema為XML 的標準模式。顯然,W3C希望以XML Schema來作為XML模式描述語言的主流,并逐漸代替XML DTD。那么XML Schema與XML DTD相比到底有哪些優勢呢,XML DTD是否真的會在XML的模式描述領域中逐漸消失呢?





    回頁首


    XML模式與XML格式

    XML模式是指用來描述XML結構、約束等因素的語言,例如XML Schema、XML DTD、XDR,SOX等等。XML格式則是XML文檔本身所具有的格式。本文以XML Schema來代表W3C所推薦的XML Schema模式標準,而以"XML模式"來代表所有的XML模式描述語言。

    從 模式的描述語言來說,XML Schema和XML DTD都屬于語法模式。與概念模式不同,語法模式在對同一事物描述時,可以采用不同的語法,例如在對關系模式描述時,無論是使用XML Schema還是XML DTD,都既可以用元素也可以用屬性來描述關系模式的列。

    模式必須以某種格式來表示,XML Schema的格式與XML DTD的格式有著非常明顯的區別,XML Schema事實上也是XML的一種應用,也就是說XML Schema的格式與XML的格式是完全相同的,而作為SGML DTD的一個子集,XML DTD具有著與XML格式完全不同的格式。這種區別會給XML Schema的使用帶來許多好處:

    1. XML用戶在使用XML Schema的時候,不需要為了理解XML Schema而重新學習,節省了時間;
    2. 由于XML Schema本身也是一種XML,所以許多的XML編輯工具、API 開發包、XML語法分析器可以直接的應用到XML Schema,而不需要修改。
    3. 作為XML的一個應用,XML Schema理所當然的繼承了XML的自描述性和可擴展性,這使得XML Schema 更具有可讀性和靈活性。
    4. 由于格式完全與XML一樣,XML Schema除了可以像XML一樣處理外,也可以同它所描述的XML文檔以同樣的方式存儲在一起,方便管理。
    5. XML Schema與XML格式的一致性,使得以XML為數據交換的應用系統之間,也可以方便的進行模式交換。
    6. XML有非常高的合法性要求,XML DTD對XML的描述,往往也被用作驗證XML合法性的一個基礎,但是XML DTD本身的合法性卻缺少較好的驗證機制,必需獨立處理。XML Schema則不同,它與XML有著同樣的合法性驗證機制。




    回頁首


    數據類型

    或 許,對于許多開發人員來講,XML Schema與XML DTD相比的一個最顯著的特征,就是其對數據類型的支持了。這完全是因為XML DTD提供的數據類型只有CDATA 、Enumerated、NMTOKEN 、NMTOKENS等十種內置(built-in)數據類型。這樣少的數據類型通常無法滿足文檔的可理解性和數據交換的需要。XML Schema則不同,它內置了三十七種數據類型,如long,int,short,double等常用的數據類型,并通過將數據類型表示為由value space、lexical space和facet三部分組成的三元組而獲得更大的靈活性。但是, XML Schema數據類型的真正靈活性來自于其對用戶自定義類型的支持。XML Schema提供兩種方式來實現數據類型的定義。

    1) 簡單類型定義(simpleType),即在XML Schema內置的數據類型基礎上或其它由XML Schema內置的數據類型繼承或定義所得到的簡單的數據類型(simpleType)基礎上,通過restriction,list 或者 union方式定義新的數據類型。

    例如:



    源碼1 restriction方式的定義
    <simpleType name='Sku'>
    <restriction base='string'>
    <pattern value='\d{3}-[A-Z]{2}'/>
    </restriction>
    </simpleType>




    源碼2 list方式的定義
    <simpleType name='listOfDouble'>
    <list itemType='double'/>
    </simpleType>




    源碼3 union方式的定義
    <xsd:attribute name="size">
    <xsd:simpleType>
    <xsd:union>
    <xsd:simpleType>
    <xsd:restriction base="xsd:positiveInteger">
    <xsd:minInclusive value="1"/>
    <xsd:maxInclusive value="12"/>
    </xsd:restriction>
    </xsd:simpleType>
    <xsd:simpleType>
    <xsd:restriction base="xsd:string">
    <xsd:enumeration value="month"/>
    </xsd:restriction>
    </xsd:simpleType>
    </xsd:union>
    </xsd:simpleType>
    </xsd:attribute>

    2) 復合類型定義(complexType),該方法提供了一種功能強大的復雜數據類型定義機制,可以實現包括結構描述在內的復雜的數據類型。下面是一個以 complexType定義實現關系模式中表結構的例子,設有表T_C_Type(Psign,Count),其中Psign為CHAR數據類型, Count為NUMBER數據類型。則有:



    源碼4 complexType定義
    <!--表結構類型定義-->
    <complexType name="T_C_Type">
    <sequence minOccurs="0" maxOccurs="unbounded">
    <element name="Psign">
    <complexType>
    <simpleContent>
    <restriction base="string">
    <attribute name="value" type="string"/>
    </restriction>
    </simpleContent>
    </complexType>
    </element>
    <element name="Count" minOccurs="0">
    <complexType>
    <complexContent>
    <restriction base="anyType">
    <attribute name="value" type="int" use="optional"/>
    </restriction>
    </complexContent>
    </complexType>
    </element>
    </sequence>
    </complexType>

    不僅如此,XML Schema還允許元素的內容取空值,這一點可以擴大XML Schema對數據情況的描述范圍,而XML DTD則無能為力。例如:



    源碼5 XML Schema 元素取空值的定義
    <element name='test' nullable='true'/>





    回頁首


    元素順序的支持

    XML DTD與XML Schema 都支持對子元素節點順序的描述,但XML DTD沒有提供對于無序情況的描述,也就是如果以XML DTD來描述元素的無順序出現情況,它必須采用窮舉元素各種可能出現的排列順序的方式來實現,這種方法不僅繁瑣,有時甚至是不現實的。例如對于table 的a,b子元素,如果希望它們以任意的順序出現,用XML DTD來描述:



    源碼6 a,b子元素任意順序出現的XML DTD定義
    <?xml version="1.0" encoding="UTF-8"?>
    <!ELEMENT ENTER_NAME_OF_ROOT_ELEMENT_HERE EMPTY>
    <!ELEMENT table ((a,b)|(b,a))>
    <!ELEMENT a (#PCDATA)>
    <!ELEMENT b (#PCDATA)>

    XML Schema提供了<all>標記來描述這種情況:



    源碼7 a,b子元素任意順序出現的XML Schema定義
    <xsd:element name="a" type="xsd:string"/>
    <xsd:element name="b" type="xsd:string"/>
    <xsd:element name="table">
    <xsd:complexType>
    <xsd:all>
    <xsd:element ref="a"/>
    <xsd:element ref="b"/>
    </xsd:all>
    </xsd:complexType>
    </xsd:element>

    可見,用XML Schema來實現子元素的無序描述要簡單的多。





    回頁首


    命名空間

    在XML中引入命名空間的目的是為了能夠在一個XML文檔中使用其它XML文檔中的一些具有通用性的定義(通常是一些元素或數據類型等的定義),并保證不 產生語義上的沖突。XML DTD并不能支持這一特性,這進一步限制了XML DTD的適用范圍。而XML Schema則很好的滿足了這一點。

    并 且, XML Schema還提供了include 和 import兩種引用命名空間的方法。下面的例子中XML Schema文檔引用了其它兩個XML Schema的定義,通過使用import實現了混合使用不同命名空間的目的。例子中還定義了不同命名空間中元素之間的keyref約束。



    源碼8 XML Schema對命名空間的使用
    schema targetNamespace="http://202.117.84.144"
    xmlns:xs="http://202.117.84.144"
    xmlns="http://www.w3.org/2001/XMLSchema"
    xmlns:a="http://202.117.84.228/middlewareSqlServer2000sqlservertest20211784228"
    xmlns:b="http://202.117.84.228/middlewareOracle805ioracletest20211784144"
    elementFormDefault="qualified">
    <import namespace="http://202.117.84.228/middlewareSqlServer2000sqlservertest20211784228"
    schemaLocation="F:\xml schema\middlewareSqlServer2000sqlservertest20211784228.xsd"/>
    <import namespace="http://202.117.84.228/middlewareOracle805ioracletest20211784144"
    schemaLocation="F:\xml schema\middlewareOrcal805ioracletest20211784144.xsd"/>
    <annotation>
    <documentation xml:lang="cn">
    schema for Middleware
    Copyright 2001 Zhou Jingtao. All rights reserved.
    </documentation>
    </annotation>
    <element name="CombineDatabase">
    <complexType>
    <sequence>
    <element name="CombinGlobeSchema">
    <complexType>
    <sequence>
    <element ref="a:H-Database"/>
    <element ref="b:H-Database"/>
    </sequence>
    </complexType>
    <keyref name="SqlServerTest_T_C_Psign" refer="b:gz_jgxx_ID_pk">
    <selector xpath="a:H-Database/a:SqlServerTest/a:T_C/a:Count"/>
    <field xpath="@value"/>
    </keyref>
    </element>
    </sequence>
    </complexType>
    </element>
    </schema>





    回頁首


    對于API的支持

    在掌握和使用XML技術時,DOM和SAX可能是技術人員最常使用到的XML API。DOM和SAX只對XML實例文檔有效,雖然可以通過它們實現以XML DTD來驗證XML文檔,但是DOM和SAX卻沒有提供解析XML DTD文檔內容的功能,也就是說我們無法通過DOM或SAX來得到DTD中元素、屬性的聲明和約束的描述。但是在基于XML+DTD的數據交換過程中,一 些應用程序需要得到DTD本身的描述內容和結構,以方便對XML文檔中數據的處理,例如在使用關系數據庫存儲XML 文檔的過程中就涉及到如何將XML DTD映射為關系模式描述的問題。為了實現對XML DTD的解讀,研究人員必須為XML DTD開發新的接口或者專用工具,帶來了很大的不便。

    由于XML Schema本身就是一個XML 文檔,所以我們可以通過使用DOM、SAX或JDOM等XML API很容易的解析XML Schema,這就實現了XML文檔與其描述模式處理方式的一致性,利于數據的傳輸和交換。





    回頁首


    更加清晰的屬性出現情況的限制、以及缺省值和枚舉

    XML DTD以關鍵字#IMPlIED、#FIXED和#REQUIRED來指定屬性是否出現,并支持屬性缺省值的定義。XML Schema則提供了更明確的標記來實現清晰易懂的表示。XML Schema廢棄了XML DTD的#IMPlIED,不再支持屬性的隱含狀態,而要求必須給出明確的狀態,并以prohibited來表示屬性的禁用。對于缺省值的表達則更為直 觀,用default來直接給出。



    源碼9 XML DTD 、XML Schema對屬性出現情況的限制
    <!ATTLIST TestDTD testAr1 CDATA  #IMPLIED>
    <!ATTLIST TestDTD testAr2 CDATA #REQUIRED>
    <!ATTLIST TestDTD testAr3 CDATA #FIXED "3">
    <!ATTLIST TestDTD testAr4 CDATA "3">
    <xsd:attribute name="TestAr1" type="xsd:string" use="optional" default="3"/>
    <xsd:attribute name="TestAr2" type="xsd:string" use="prohibited"/>
    <xsd:attribute name="TestAr3" type="xsd:string" use="required" fixed="3"/>

    對于XML Schema在枚舉方面的改進,請參見參考資料中"XML 問題 #7 W3C XML Schema 與文檔類型定義 (DTD) 比較"一文(文獻9)。





    回頁首


    注釋

    XML DTD和XML Schema都支持<!-注釋內容-->這樣的注釋方法,但是XML Schema提供了更靈活和有用的注釋方式:documentation和appinfo。它們提供了面向讀者和應用的注釋。



    源碼10 XML Schema的注釋
    <xsd:annotation>
    <xsd:documentation>面向用戶和應用的注釋</xsd:documentation>
    <xsd:appinfo>
    //這是一段C語言代碼。
    #include stdio.h
    void main()
    {
    int i,j;
    i =1;
    j=i+1;
    }
    </xsd:appinfo>





    回頁首


    對數據庫的支持

    目前如何將關系數據表示為XML數據和如何實現基于關系數據庫的XML數據存儲、查詢和更新已經成為了研究的熱點。Deutsh,Florescu [5],Kossman[5],Shanmugasundaram[6,7]和D W Lee[8]等人都在XML與關系數據的相互轉化問題方面作了較深入的研究。然而由于XML Schema成為正式推薦標準的時間較晚,加之XML DTD語法相對簡單,所以現在大部分的研究和應用都是基于XML DTD展開的。但是,XML DTD在對關系數據的描述方面明顯存在著不足,例如XML DTD有限的數據類型根本無法完成對關系數據數據類型的一一映射,也無法實現大部分的數據規則的描述。XML Schema提供了更多的內建數據類型,并支持用戶對數據類型的擴展,基本上滿足了關系模式在數據描述上的需要,這一點可以作為XML Schema比XML DTD更適合描述關系數據的一個主要的原因。





    回頁首


    一個結論

    通過比較,可以看出,XML Schema比XML DTD具有更強的表現力,能夠更好的滿足不同領域應用的需求。那么,是不是可以說XML DTD會很快被XML Schema替代并最終消失呢。從作者的觀點來看,XML Schema雖然在大多數的應用領域都有替代XML DTD的趨勢,但是XML DTD仍然有它的適用范圍,并不可能被XML Schema完全替代:

    • XML DTD是作為XML 標準的一部分發布的,W3C似乎并沒有準備將其從XML標準中廢除掉,對于XML DTD的支持還將持續。
    • 目 前大多數的面向XML應用,都對XML DTD做了很好的支持,XML DTD的工具也相對較為成熟,一般情況下,這些應用和工具并不會選擇以XML Schema替換XML DTD的方式對其升級,更多的選擇應該是二者都支持。當然,對于那些對數據交換或者描述能力要求較高、XML DTD已不能滿足功能需求的應用來說,以XML Schema來代替XML DTD已經成為一種必然趨勢。
    • 當前大多數與XML 模式相關的算法研究都是基于XML DTD展開的,作為一種研究的延續,并不會放棄XML DTD的研究成果,但是,針對XML Schema的研究將會成為一個新的熱點。
    • 在一些相對要求簡單的處理環境中,XML DTD仍然會占有它的一席之地。
    • 同其他技術的發展一樣,由于新標準的出現,XML DTD的作用會逐漸減弱,但正如層次數據庫在今天仍然在使用一樣, 對XML Schema是否會完全替代XML DTD做一個結論似乎為時過早。

    所以,作為一種強有力的標準,XML Schema作為XML模式的主流已經成為一種趨勢;但作為一種最簡單的XML模式,XML DTD也還將會在一段時間內發揮它應有的作用。



    參考資料

    • Fallside D C. XML Schema Part 0: Primer. http://www.w3.org/TR/xmlschema-0, 2001.5 XML Schema 標準的總體介紹。

    • Thompson H,et al . XML Schema Part 1: Structures. http://www.w3.org/TR/xmlschema-1, 2001.5 XML Schema的結構標準

    • Biron P V, Malhotra A. XML Schema Part 2: Datatypes. http://www.w3.org/TR/xmlschema-2, 2001.5 XML Schema的數據類型標準。

    • Lee D W, Chu W W. Comparative Analysis of Six XML Schema Languages.ACM SIGMOD Record, 2000.9,29(3): 76~87 該文對XML 模式中的XML DTD , XML Schema , XDR , SOX , Schematron, DSD作了詳細的比較,其中對于XML Schema的論述,由于當時XML Schema標準還未定稿,所以與最新的標準相比有些出入。

    • Florescu D, Kossman D. Storing and Querying XML Data Using a RDBMS. IEEE Data Engineering Bulletin, 1999,22(3): 27~34 研究了如何利用RDBMS實現XML數據的存儲和查詢。

    • Shanmugasundaram J, et al..Efficiently Publishing Relational Data as XML Documents..The VLDB Journal, 2000, 65~76 提出了一種基于SQL語言的的關系數據到XML的有效發布方法。

    • Shanmugasundaram J,et al.Querying XML Views of Relational Data.The VLDB Journal, 2001, 261~270提出了用來實現復雜XQuery的框架結構,研究如何提高XML視的查詢效率。

    • Lee D W, Chu W W. Constraints-preserving Transformation from XML Document Type Definition to Relational Schema.International Conference on Conceptual Modeling / the Entity Relationship Approach, 2000, 323~338 詳細論述了XML DTD到關系模式的映射算法CPI。

    • David Mertz ,W3C XML Schema 與文檔類型定義 (DTD) 比較, http://www.ibm.com/developerWorks/cn/xml/x-matters/part7/index.shtml


    作者簡介


    周競濤,西北工業大學CAD/CAM國家專業實驗室博士研究生,致力于將哲學、數學結合到技術研究中,主要研究方向:中間件、XML技術、EII,Semantic Web Services。可以通過 zhoujtnet@yahoo.com.cn與他聯系。



    王明微,陜西西安,西北工業大學CAD/CAM國家專業實驗室碩士研究生,研究方向:逆向工程、模式識別。可以通過 wangmv@hotmail.com與他聯系。










    摘自:http://www-128.ibm.com/developerworks/cn/xml/x-sd/index.html

    posted on 2007-07-02 17:00 lqx 閱讀(213) 評論(0)  編輯  收藏


    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 足恋玩丝袜脚视频免费网站| 成人免费黄色网址| 免费va在线观看| 亚洲AV无码国产精品永久一区| 女人与禽交视频免费看| 亚洲精品亚洲人成在线| 久久久久亚洲AV成人无码| 大地资源中文在线观看免费版| 中文字幕亚洲一区| 免费国产成人18在线观看| 亚洲综合一区二区精品导航 | 免费高清A级毛片在线播放| 午夜a级成人免费毛片| 妇女自拍偷自拍亚洲精品| 全部免费a级毛片| 久久一区二区免费播放| 久久久久亚洲精品影视| 国产精品色拉拉免费看| 亚洲妇女无套内射精| 国产亚洲一区区二区在线| 182tv免费视视频线路一二三| 精品国产日韩久久亚洲| 免费在线观看日韩| 曰批全过程免费视频在线观看无码| 久久精品国产亚洲AV无码娇色| 免费下载成人电影| 阿v视频免费在线观看| 久久久久久a亚洲欧洲aⅴ| 久久笫一福利免费导航| 老司机免费午夜精品视频| 亚洲av一综合av一区| 成年大片免费视频| 中文字幕免费在线看电影大全| 亚洲?V乱码久久精品蜜桃 | 中出五十路免费视频| 亚洲精品视频在线观看免费| 日韩免费在线观看| 女人体1963午夜免费视频| 亚洲精品无码少妇30P| 久久精品国产亚洲AV麻豆王友容| 国产桃色在线成免费视频|