xml約束
編寫一個文檔來約束一個xml文檔的書寫規范
常用的約束技術
XML DTD
XML Schema
DTD(Document Type Definition),全程為文檔類型定義
舉例:
文件清單:book.xml
- <?xml version="1.0" encoding="UTF-8"?>
- <!DOCTYPE 圖書 SYSTEM "book.dtd">
- <圖書>
- <書>
- <書名>西游記</書名>
- <作者>吳承恩</作者>
- <售價>18</售價>
- </書>
- <書>
- <書名>三國演義</書名>
- <作者>羅貫中</作者>
- <售價>20</售價>
- </書>
- </圖書>
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE 圖書 SYSTEM "book.dtd">
<圖書>
<書>
<書名>西游記</書名>
<作者>吳承恩</作者>
<售價>18</售價>
</書>
<書>
<書名>三國演義</書名>
<作者>羅貫中</作者>
<售價>20</售價>
</書>
</圖書>
文件清單:book.dtbd
- <?xml version="1.0" encoding="UTF-8"?>
- <!ELEMENT 圖書 (書+)>
- <!ELEMENT 書 (書名,作者,售價)>
- <!ELEMENT 書名 (#PCDATA)>
- <!ELEMENT 作者 (#PCDATA)>
- <!ELEMENT 售價 (#PCDATA)>
<?xml version="1.0" encoding="UTF-8"?>
<!ELEMENT 圖書 (書+)>
<!ELEMENT 書 (書名,作者,售價)>
<!ELEMENT 書名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售價 (#PCDATA)>
ELEMENT 元素
PCDATA 的意思是已經解析的字符數據,文本中的標簽會被當作標記來處理,而實體會被展開。
用book.dtd約束book.xml,如果在book.xml的書標簽下添加出版日期,會報錯,因為文檔格式已經固定。
注意:DTD文件應使用utf-8保存或者encoding="gb2312",否則會報錯。
引用DTD約束
xml文件使用DOCTYPE聲明語句來指明它所遵循的DTD文件,聲明語句有兩種形式
(1)當引用的文件在本地時 ,采用如下方式:
<!DOCTYPE 文檔根節點 system "DTD文件的URL">
例如:<!DOCTYPE 圖書 SYSTEM "book.dtd">
(2)當引用的文件是一個公共的文件時 ,采用如下方式:
<!DOCTYPE 文檔根節點 public "DTD名稱" "DTD文件的URL">
例如:<!DOCTYPE struts-config PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 1.3//EN"
"http://struts.apache.org/dtds/struts-config_1_3.dtd">
struts2的DTD文件,一般做框架都會用到DTD
DTD約束語法細節
元素定義
屬性定義
實體定義
元素定義
在DTD文件中使用element聲明一個xml元素,語法格式所示:
<!ELEMENT 元素名稱 元素類型>
(1)元素類型可以是元素內容或者類型
如為元素內容:則需要使用()括起來,如
<!ELEMENT 書 (書名,作者,售價)>
<!ELEMENT 書名 (#PCDATA)>
(2)如為元素類型,則直接書寫 ,DTD規范定義如下幾種類型:
EMPTY:用于定義空元素,例如<br></br>
ANY:表示元素內容為任意類型
-----------------------------------------------------
元素內容可以使用如下方式,描述內容的組成關系用逗號分隔,表示內容的出現順序必須與聲明時一致
用逗號分隔,表示內容的出現順序必須與聲明時一致。
<!ELEMENT 書 (書名,作者,售價)>
用|分隔,表示任選其一,即多個只能出現一個
<!ELEMENT 書 (書名|作者|售價)>
在元素內容中也可以使用+,*,?等符號表示元素出現的次數:
+:一次或多次(書+)
0:0次或一次(書?)
*:0次或多次(書*)
什么都不寫 (書)只出現一次
也可以使用原括號()批量設置,例
<!ELEMENT 書((書名*,作者?售價)*|COMMENT)>
屬性定義
xml文檔的標簽性需要通過ATTLIST為其設置屬性
語法格式:
<!ATTLIST 元素名
屬性名1 屬性值類型 設置說明
屬性名2 屬性值類型 設置說明
......
>
屬性聲明舉例
<!ATTLIST 圖書
書名 CDATA #REQUIRED
售價 CDATA #IMPLED
>
對應xml文件:
<圖書 書名="三國演義" 售價="20">...</圖書>
<圖書 書名="西游記" 售價="18">...</圖書>
設置說明:
#REQUIRED 必須設置該屬性
#IMPLED 可以設置也可以不設置
#FIXED:說明該屬性的值固定為一個值
直接使用默認值:在xml中可以設置該值也可以不設置該屬性值。如果沒設置則使用默認值
舉例:
<!ATTLST 圖書
書名 CDATA #REQUIRED
售價 CDATA #IMPLED
類別 CDATA #FIXED "文學"
評價 CDATA "好"
>
-----------------------------------------------
CDATA表示屬性值為普通文本字符串
ENUMERATED(枚舉)
ID,表示設置值為一個唯一值,ID屬性的值只能由字母,下劃線開始,不能出現空白字符
ENTITY(實體)
實體定義
實體用于為一段內容創建一個別名,以后在xml文檔中就可以使用別名引用這段內容
在DTD定義一個實體,一條<!ENTITY>語句用于定義一個實體
實體可分為兩種類型:引用實體個參數實體
(1)引用實體主要在xml文檔中被應用
語法格式:
<!ENTITY 實體名稱 "實體內容">: 直接轉變成實體內容
引用方式:
&實體名稱;
舉例
<!ENTITY name "I am a student">
.....
&name;
(2)參數實體被DTD文件自身使用
語法格式:
<!ENTITY % 實體名稱 "實體內容">
&實體名稱;
在struts1里action標簽必須要設置的屬性:path
- <!ELEMENT action (icon?, display-name?, description?, set-property*, exception*, forward*)>
- <!ATTLIST action id ID #IMPLIED>
- <!ATTLIST action attribute %BeanName; #IMPLIED>
- <!ATTLIST action className %ClassName; #IMPLIED>
- <!ATTLIST action forward %RequestPath; #IMPLIED>
- <!ATTLIST action include %RequestPath; #IMPLIED>
- <!ATTLIST action input %RequestPath; #IMPLIED>
- <!ATTLIST action name %BeanName; #IMPLIED>
- <!ATTLIST action parameter CDATA #IMPLIED>
- <!ATTLIST action path %RequestPath; #REQUIRED>
- <!ATTLIST action prefix CDATA #IMPLIED>
- <!ATTLIST action roles CDATA #IMPLIED>
- <!ATTLIST action scope %RequestScope; #IMPLIED>
- <!ATTLIST action suffix CDATA #IMPLIED>
- <!ATTLIST action type %ClassName; #IMPLIED>
- <!ATTLIST action unknown %Boolean; #IMPLIED>
- <!ATTLIST action validate %Boolean; #IMPLIED>