ISO-2022-JP-2

読み:アイエスオウにーまるにーにージェイピートゥー
読み:アイソにーまるにーにージェイピートゥー
外語:ISO-2022-JP-2 英語
品詞:固有名詞

複数の言語文字(文字集合)を切り替えて利用するISO-2022のサブセット規格で、日本語文字コードの符号化を規定した仕様。RFC 1554で規定されている。

目次

ISO-2022-JPに対し、各種の外国語の対応を追加したものである。簡単には、Latin-1の他、支那語、朝鮮語、ギリシャ語に対応した。これらの対応言語はMule多言語エディターの機能に由来している。

数あるISO-2022-JPシリーズの中では、現状、最も多くの言語に対応したものと考えられる。しかし、対応しているソフトウェアは、殆ど知られていない。

基本仕様

7ビットで文字を表現する7ビット符号である。文字のコードレンジとしては0x20〜0x7fまでを用いる。つまり、図形文字表はGLのみを用る。また、GLには常にG0を呼び出した状態が固定されており、G0への割り当て指示によって文字集合を切り替える。

この符号系では、初期状態はASCIIである。エスケープを使用するまでは、ASCIIの文字列のみを表現できる。

改行文字(CR/LF)の前では、必ずASCIIに戻さなければならない。

情報の終了の前でも、必ずASCIIに戻さなければならない。

特徴

ISO-2022-JPとの仕様の差は、エスケープシーケンスの追加のみである。

  • ISO-8859-1のエスケープシーケンスを導入 (ESC 2/14 4/1)
  • ISO-8859-7(ギリシャ語)のエスケープシーケンスを導入 (ESC 2/14 4/6)
  • GB 2312:1980(支那語)のエスケープシーケンスを導入 (ESC 2/4 4/1)
  • KS X 1001(朝鮮語)のエスケープシーケンスを導入 (ESC 2/4 2/8 4/3)

96 character setsである二つのISO-8859は、G2に割り当てられる。

ISO-2022-JP-2はC0とGLのみを用いる仕様なので、96 character setsを用いるときには、SSを使い、1文字ごとにGLにG2を呼び出すことになる。ISO/IEC 2022をきちんと実装している処理系なら問題は出ないが、そうでない場合、2/0や7/15の文字を使ったときに誤動作を招くおそれがあるので注意が必要である。

対応する文字集合

94 character sets

reg#character setESC sequencedesignated to
6ASCIIESC 2/8 4/2ESC ( BG0
14JIS X 0201-RomanESC 2/8 4/10ESC ( JG0
42JIS C 6226-1978ESC 2/4 4/0ESC $ @G0
58GB 2312:1980ESC 2/4 4/1ESC $ AG0
87JIS X 0208-1983ESC 2/4 4/2ESC $ BG0
149KS X 1001ESC 2/4 2/8 4/3ESC $ ( CG0
159JIS X 0212-1990ESC 2/4 2/8 4/4ESC $ ( DG0

96 character sets

reg#character setESC sequencedesignated to
100ISO-8859-1ESC 2/14 4/1ESC . AG2
126ISO-8859-7(Greek)ESC 2/14 4/6ESC . FG2
関連するリンク
RFC 1554 邦訳
用語の所属
ISO/IEC 2022
ISO-2022
該当する符号化方法
ISO-2022-JP
ISO-2022-JP-1
ISO-2022-JP-2004
関連する用語
文字コード
RFC
Mule

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club