JIS X 0213

読み:ジスエックスゼロにーいちさん
外語:JIS X 0213 英語
品詞:固有名詞

日本語用の漢字文字やかな文字、記号類を情報交換で用いるための文字集合を規定する工業規格の一つ。7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合。

目次

JIS X 0213は、それまで使われてきたJIS X 0208の後継として作られた仕様である。

JIS漢字表は誕生当初より、「字形そのもの」は定めていない。正字、略字等で字形の差異が僅かな字は原則として同じ文字とし、同じ一つの番号を与えている。これを「包摂」と呼んでいる。

しかし、JIS X 0213制定時に基準の適用を若干ゆるめ、さらに改訂版制定時には文部科学省の諮問機関である国語審議会により「印刷標準字体」の採用が決定されたため、JIS X 0213は、例示字体に印刷標準字体を採用した。

かくして、JIS X 0208との互換性は一部損なわれており、JIS C 6226→JIS X 0208の際の問題が再び発生している。

特徴

長く使われたJIS X 0208で規定される6,879文字を拡張し、これと同時に運用可能な規格として作られた。

具体的には、JIS X 0208の第1水準漢字第2水準漢字の計6,879文字と同時に使える、第3水準漢字1,259字・第4水準漢字2,436字の漢字と、各種の記号を含む非漢字など659字、合計4,354文字(JIS X 0213:2004)、総合計11,233文字が収められている文字集合(CCS)の規格である。

この規格は符号化方法(CES)としてシフトJIS及びEUC-JPを重視しており、シフトJISのJIS X 0208及びEUC-JPのJIS X 0208、JIS X 0212と衝突しない区に文字を配置するように配慮されているため、シフトJISおよびEUC-JP双方のCESにおいて完全に同居することが可能である。

沿革

経緯

当初はシフトJISの半角カタカナ領域を廃止し、そこを2バイト文字の先頭バイトに割り当てる、更に2バイト文字のコードレンジの最後の値を0xfcから0xfeに拡張、という案があった。

このため当初予定されていた文字数は非常に多かったが、互換性などの問題のため最終的には両案とも棄却された。

それでも、Microsoft Windows環境においてさえ、第4水準領域が外字領域と重複するなどの理由からシフトJISを使う分においては第4水準漢字は利用できない。

他のISO登録状況

JIS X 0213には、第一面と第二面の2面が存在する。

第一面は、初版と改訂版で仕様が異なるため、それぞれ別に登録されている。

第一面・初版(JIS X 0213:2000)

初版(JIS X 0213:2000)の第一面は、ISO-IR 228として登録されている。

ISO-IR 228のISO/IEC 2022におけるエスケープシーケンスは次のとおり。

  • G0: ESC 2/4 2/8 4/15
  • G1: ESC 2/4 2/9 4/15
  • G2: ESC 2/4 2/10 4/15
  • G3: ESC 2/4 2/11 4/15

第一面・改訂版(JIS X 0213:2004)

改訂版(JIS X 0213:2004)の第一面は、ISO-IR 233として登録されている。

ISO-IR 233のISO/IEC 2022におけるエスケープシーケンスは次のとおり。

  • G0: ESC 2/4 2/8 5/1
  • G1: ESC 2/4 2/9 5/1
  • G2: ESC 2/4 2/10 5/1
  • G3: ESC 2/4 2/11 5/1

第二面

初版・改訂版ともに第二面は、ISO-IR 229として登録されている。

ISO-IR 229のISO/IEC 2022におけるエスケープシーケンスは次のとおり。

  • G0: ESC 2/4 2/8 5/0
  • G1: ESC 2/4 2/9 5/0
  • G2: ESC 2/4 2/10 5/0
  • G3: ESC 2/4 2/11 5/0

現在は、3版ある。

  1. JIS X 0213:2000 (第一次規格)
  2. JIS X 0213:2004 (第二次規格)
  3. JIS X 0213:2012 (第三次規格)

この文字集合(CCS)を用いた代表的な符号化方法(CES)は、次の通りである。

JIS X 0213:2000

JIS X 0208で規定される6,879文字を拡張し、これと同時に運用可能な第3水準漢字1,249字、第4水準漢字2,436字、非漢字659字(計4,344字)を含む11,223文字を規定する規格として作られた。

例えば、JIS X 0208では「鴎」「鷗」の2字は包摂されており、同じ18区10点にある。但し、JIS X 0208の仕様範囲内では、相互を区別する機械的方法は存在しない。

対してJIS X 0213は包摂基準変更により、「鴎」は1面18区10点、「鷗」は1面94区69点となった。包摂範囲内での区別方法がないのは同様だが、事実上、異体字が文字コードのレベルで分割されたことになる。

つまり、JIS X 0208とJIS X 0213では18区10点という符号の指す範囲が異なっているため、JIS X 0208の文字範囲もJIS X 0213として収載されることになった。

JIS X 0213:2004

JIS X 0213:2004は、JIS X 0213の最初の改訂版である。JIS X 0213:2000との違いは次の通り。

  1. UCSが割り当てられていなかった非漢字128字と漢字363字に正式な対応を追加
  2. 168字の例示字形を変更した
  3. 表外漢字UCS互換10字の追加とそれに伴う包摂規準の変更
  4. 第一面を指示するための終端文字(5/1)を追加した(追加であり改訂ではない点に注意)
  5. 附属書1〜3の符号化表現の名称の変更。Shift_JIS-2004/Shift_JIS-2004-plane1/ISO-2022-JP-2004/ISO-2022-JP-2004-plane1/EUC-JIS-2004/EUC-JIS-2004-plane1が最新の名称となる。
  6. ISO-2022-JP-2004の切り替え指示にESC 2/4 2/8 5/1を追加し上述(3)に関わる20字がESC 2/4 4/2およびESC 2/4 2/8 4/15で使用しない文字に追加

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club