XML 是一種簡單而有彈性的文字格式。
一. Element [XML 標準]
項目element :能識別區段、建立開頭和結尾標籤。
包含屬性名稱和值(attribute names and values)。
項目名稱:區分大小寫,且必須以字母或底線開頭。 可包含字母、數字、連字號、底線和句點。
開始標記、結束標記與空標記
開始標記可以含屬性 <elementName>
<elementName att1Name="att1Value" att2Name="att2Value"...>
結束標記能表示項目的結尾,而且不含屬性。
</elementName>
element 含開始到結尾標記,其間的所有內容。
空標記可用來表示沒有文字內容的項目,但它們可擁有屬性。
HTML img 和 br 項目就是空項目的範例。
<elementName att1Name="att1Value" att2Name="att2Value".../>
在 XML 中,可以含開始和結束標記,且其間沒有空白字元或內容的空項目,
例如,<giggle></giggle> 和 <giggle/>。這兩種格式是相同結果。
二. XML 宣告 [XML 標準]
版本號碼 <?xml version="1.0"?>。這是必要項。 目前的版本是 1.0編碼宣告 <?xml version="1.0" encoding="UTF-8"?> 這是選擇項。 編碼宣告須緊接在 XML版本資訊後面,且必須包含一個代表現有字元編碼的值。獨立宣告 <?xml version="1.0" encoding="UTF-8" standalone="yes"?> 是選擇項。 置在 XML 宣告的最後面。作用是指出文件的內容是否依賴外部來源資訊,例如外部文件類型定義 (DTD)。如果獨立宣告具有值 "yes",當文件參考外部 DTD 或外部實體時,剖析器將報告錯誤。 省略獨立宣告與包含 "no" 的獨立宣告會得到相同的結果
三. 五個用於 XML 標記字元
三. 五個用於 XML 標記字元
四. CDATA 區段 [XML 標準]
內容中含有 HTML 標籤或者是一些特殊字元﹙如﹕<、>、&﹚,通常都會出現 XML 分析錯誤的情況,這時候就必須將這些字元作些轉換的工作(如︰< / <、> / >、& / &)。
而 CDATA 區段提供了一種通知剖析器的方法,說明 CDATA 區段所包含的字元沒有標記。
當 XML 剖析器遇到開頭的『<![CDATA[』,會將接下來的內容報告成字元,而不會嘗試將其解譯成項目或實體標籤。直遇到結尾的『]]>』時,剖析器會停止報告並回到正常的剖析