(本系列文章是我學習的過程中,整理出來的筆記,如有錯漏,看官請一定不吝回復告知我,讓我能認識自己的不足,并改進錯誤。非常感謝!)

    XML的全稱是Extensible Markup Language,意思是可擴展的標識語言,是SGML(Standard Generalized Markup Language)的一個子集。1998年2月,W3C組織發布了XML1.0標準,其目的是為了在Web上能以現有的超文本標識語言(HTML)的使用提供,接收和處理通用的SGML。XML以一種開放的,自我描述的方式定義了數據結構,在描述數據內容的同事能突出對結構的描述,從而體現出數據與數據之間的關系。XML的最新版本是1.1,于2004年2月4日發布。目前大多數的應用還是基于XML1.0的推薦標準。1.0版本的規范在下面網址中定義:
http://www.w3.org/TR/2004/REC-xml-20040204/

    XML不是(X)HTML的擴展,兩者之所以看起來很像,是因為它們都是SGML發展而來的標識語言,語法很相似,標識的使用也很相似。HTML只是SGML的一個子應用,它的DTD(Document Type Definition)被固定下來,所以不能用來定義新的應用。而XML不同,我們可以根據自己的需要,隨意定義我們自己的DTD,所以,利用XML,可以定義出新的應用,比如,RDF(Resource Description Framework,資源描述框架,blog中經常看見的RSS1.0就是RDF Site Summary,RDF網站摘要,關于RSS,我將在潛心學習RSS中去認識它),CDF(Channel Definition Format,通道定義格式,微軟在IE4.0中引入的一個新功能。基于CDF,網站可以通過活動通道將數據聚合到設置為活動桌面的用戶桌面上)。

    XML規范的制定者之一Tim Bray說,XML的設計出發點是取SGML的優點,去除復雜的部分,使其保持輕巧,可以在Web上工作。

    XML的應用非常廣泛,計算機和網絡的世界里,處處活躍著它矯健輕快的身影,或為配置文件,或為數據存儲,或為數據傳輸使用的格式。XML已經成為事實上的數據交換格式的標準,使用XML,意味著所有設備,比如手機,PDA,信息家電等等,都可以輕松的讀取,解析你的數據。
   
    XML很重要的兩個特性:
    一:XML文檔僅僅描述數據,它不關心數據是如何表現外觀的,比如字體大小,顏色,間距之類的,所以它能將數據和數據的表現方式完全的分離開,這個特性很重要,HTML就萬萬做不到這種完全的分離,所以W3C組織不得不推出一個XHTML,作為HTML向XML過度的產物。

    二:XML對文檔的格式要求非常嚴格,符合標準的XML文檔就是格式良好的XML文檔(Well-Formed XML Documents)。這是使得XML文檔能被普遍認可的一個特點。嚴格的文檔格式,減輕了解析的復雜性。相對來說,HTML的文檔格式就非常松散,解析起來就比較復雜,也造成了瀏覽器兼容的問題。XML文檔格式的要求有下面幾點:
    1、所有的標簽都必須關閉,開始標簽有對應的結束標簽,空標簽必須被關閉。
    2、所有的標簽都區分大小寫
    3、所有的標簽都必須合理嵌套
    4、所有的標簽的屬性值必須用收引號("")或單引號('')括起來
    5、XML文檔有且只能有一個根元素
    6、(還有其他的嘛?)

本章到此結束,重點掌握XML與HTML的異同點,XML的兩個特性。
下一章學習XML的結構。