XML
読み:エックスエムエル
外語:XML: eXtensible Markup Language
SGML
規格に準拠した
マークアップ言語
の名で、SGMLからインターネットでの利用に不要な機能を取り去ったサブセット(簡易版)規格に、いくらかの改良を加えたもの。
目次
概要
特徴
コンセプト
アプリケーション
SGMLとの差
代替表現
概要
1998(平成10)年2月10日に、
W3C
からXML 1.0として公開された。
Netscape Communications
や
Microsoft
がXMLをサポートすると発表したため、一気に注目が集まることになった。
特徴
コンセプト
XMLは次世代の
HTML
と誤解されることもあるが、この解釈は正しくない。
HTMLはSGMLによって定義された言語であるのに対し、XMLはHTMLのような構造化言語を作るための言語であるという点で、むしろSGMLに代わるものである。
アプリケーション
XMLで記述された
マークアップ言語
を「
XMLアプリケーション
」という。
今やその数は無数に存在するが、HTMLに代わる
XHTML
、XHTMLで用いる数式記述用言語
MathML
などが、代表的なものである。
SGMLとの差
HTMLを含む従来のSGMLとの大きな違いは、タグの省略を一切許さなくなったことである。
HTMLを代表とするSGMLでは、文書型の定義において、要素ごとに開始タグや終了タグを省略できるかを指定することができ、省略可能と指定されたタグは、文脈が明らかな場合にはそれを省略することができる。
SGML処理プログラムはこれを適宜補わなければならないため、解析する処理で時間が掛かったり、
バグ
が出たりすることが多かった。その反省を踏まえ、XMLではタグの省略を認めない
仕様
に改善されている。
また、内容モデル(子要素)を持たない「空要素」の場合、<br></br> のような従来の方法のほかに、"<要素名/>" のように、"/>" で終わらせることで終了タグが指定されたとみなすことができるようになった。
代替表現
XMLは、決して処理効率の良いものではない。XMLがSGMLアプリケーションであるのは、それ以前に普及していたHTMLがSGMLアプリケーションだったから、という以上の理由はない。
そこで、XMLの機能を持ったまま、他の形式で表現する代替形式のフォーマットも様々に作られた。
EBML
(
Matroska
用)
PYX
(行指向のXML)
SOX
(行指向のXML、Python)
SXML
(Schemeで書かれたXML)
WBXML
(無線バイナリXML、WAP用)
再検索