JIS X 0212

読み:ジスエックスゼロにーいちにー
外語:JIS X 0212 英語
品詞:固有名詞

日本語用の漢字文字や記号類を情報交換で用いるための文字集合を規定する工業規格の一つ。規格名は「情報交換用漢字符号―補助漢字」。

目次

JIS X 0208では文字が不足する分野向けに開発された。

規格の冒頭では「JIS X 0208で規定している"通常の国語の文章の表記に用いる図形文字の集合"に含まれていない図形文字を必要とする情報交換のために、JIS X 0208の補助として用いる図形文字の符号について、JIS X 0202に基づき規定する。」としている。

しかし、ISO/IEC 2022EUC-JPなどの符号化では利用できたが、パソコンでの主流だったシフトJISからは利用できなかったため、一般には普及しなかった。

収載文字

合計6,067文字が収められている。

  • 漢字 ‐ 5,801字文字
  • 非漢字 ‐ 266文字
    • 特殊文字
      • 記述記号 ‐ 2文字
      • 単位記号 ‐ 1文字
      • 一般記号 ‐ 7文字
      • ダイアクリティカルマーク ‐ 11文字
    • アルファベット
      • ダイアクリティカルマーク付きギリシアアルファベット ‐ 21文字
      • キリル系アルファベット ‐ 26文字
      • ラテン系アルファベット ‐ 27文字
      • ダイアクリティカルマーク付きラテンアルファベット ‐ 171文字

沿革

現在は次の版が存在する。

他のISO登録状況

ISO-IR 159として登録されている。

ISO-IR 159のISO/IEC 2022におけるエスケープシーケンスは次のとおり。

  • G0: ESC 2/4 2/8 4/4
  • G1: ESC 2/4 2/9 4/4
  • G2: ESC 2/4 2/10 4/4
  • G3: ESC 2/4 2/11 4/4

普及状況

JIS X 0212の全文字は、UnicodeのCJK統合漢字(URO)に全て含まれている。原規格分離規則により、Unicodeの基準として包括対象であってもJIS X 0208と分離されている字については別の符号位置が与えられている。

文字集合としてはWindows NTそしてWindows 2000の普及に伴うUnicodeの普及によりにわかに日の目を見始めたが、日本向けの符号では遂に普及しなかった。

このため、JIS X 0213(第3水準・第4水準)が策定され、JIS X 0212の廃止さえも囁かれるようになった。実際に廃止も(失敗作として)検討されたが、利用実績があるということで見送られている。

符号の構造

区点

JIS X 0208と同様で、符号は、ISO/IEC 2022に準拠している。そして、2バイトで1文字を表わす。このため、文字表は、94×94の範囲に収まる。

このうち、最初のバイトを「区」(row)と呼び、次のバイトを「点」(cell)と呼び、あわせて「区点」という。区、点、それぞれ範囲は、1〜94の範囲とする。

配置

非漢字については、2区、6区、7区、9区、10区、11区にあり、JIS X 0208の同じ区の空き位置に配列されている。このため、非漢字についてはJIS X 0208と重ね合わせて符号化することもできる。

これら非漢字はJIS X 0213でも規定されたが、区点位置は異なり、互換性はない。

漢字は16区〜77区に配列されている。62区存在するため、36区程度しか空き容量がないシフトJISでは符号化できない。

この文字集合(CCS)を用いた代表的な符号化方法(CES)は、次の通りである。

シフトJIS系の符号では利用できない。

用語の所属
JIS
文字コード
関連する用語
JIS X 0208
JIS X 0213

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club