x-iso2022jp-cp932
読み:エックス-アイエスオウにーまるにーにージェイピー-スィーピーきゅうさんに
外語:x-iso2022jp-cp932

 XML日本語プロファイルで定義されている、ISO-2022-JPの亜種(変種)の一つ。
目次

概要
 詳細は定かではないが、名前から判断するに、ISO-2022-JPに対して文字集合CP932に変更した符号のようである。
 XML日本語プロファイルには、次の正体不明の符号/文字集合が明記されており、x-iso2022jp-cp932はそのうちの一つである。
 それぞれの差異等は明言が無く、詳細は不明である。

仕様

基本仕様
 基本的には7ビットで文字を表現する7ビット符号で、エスケープシーケンスもISO/IEC 2022に準じていると見られる。
 CP932ということで、各種の拡張文字が使えそうではあるが、規定には次のように記されている。
 たとえば、x-sjis-cp932は、NEC特殊文字、NEC選定IBM拡張文字、IBM拡張文字、ユーザー外字を表現できるが、x-iso2022jp-cp932がそれらの文字を表現できるわけではない。
 CP932からこれらの文字を除いたら、どう考えても「単なるJIS X 0208」である。
 結果としてこの仕様は、ISO-2022-JPと完全に同一のように読み取ることが可能である。
 Windowsの実装、CP50220/CP50221/CP50222のサブセットとも考えられ、文字集合を標準のJIS X 0208としたものと言えるだろう。

特徴
 XMLを用いた情報交換が用途として想定される。
 「iso-2022-jp」との仕様差が定かではなく、「x-iso2022jp-cp932」を敢えて選択する理由なども定かではない。

符号化方式(CES)

符号化文字集合(CCS)
 次の文字集合に対応しているようである。
 ※を附したものは、入力(読み込み)には対応するが、出力されないと見られる。

符号の割り当て

開始状態
 開始状態では、次のように指示されている。
 開始状態では、次のように呼び出されている。
 G0がASCIIであるのは標準通りである。GRにG1が呼び出されているのかどうかは定かではない。

エスケープシーケンス
文字集合エスケープシーケンスCP50220Unicode
1バイト目2バイト目
ASCIIESC 2/8 4/2ESC ( B0x00〜0x7fU+0000〜U+007F
JIS X 0201 ローマ字ESC 2/8 4/10ESC ( J
JIS C 6226-1978ESC 2/4 4/0ESC $ @0x21〜0x280x30〜0x740x21〜0x7e
JIS X 0208-1983ESC 2/4 4/2ESC $ B

再検索