ISO-2022-CN
読み:アイエスオウにーまるにーにースィーエン
外語:ISO-2022-CN
複数の言語文字(
文字集合
)を切り替えて利用する
ISO-2022
のサブセット規格で、支那語
文字コード
の符号化を規定した仕様。
RFC 1922
で規定されている。
目次
概要
仕様
基本仕様
対応する文字集合
関連・後継仕様
概要
ASCII
と、
GB 2312
、
CNS 11643
の第一面と第二面に対応する。
支那語環境のIRCや電子メールなどで使われることがある。
仕様
基本仕様
7ビットで文字を表現する
7ビット符号
である。文字のコードレンジとしては0x20〜0x7fまでを用いる。
図形文字表は
GL
のみを用る。一旦呼び出した後は、
SI
/
SO
で切り替えて用いる。G2にある文字は、一文字ごとにSS2で指示する。
7ビットなので、それぞれ、SI=0x0f、SO=0x0e、SS2=0x1b 0x4e、となる。
この符号系では、初期状態は(
ASCII
)である。エスケープを使用するまでは、ASCIIの文字列のみを表現できる。
改行文字(CR/LF)の前では、必ずSIでASCIIに戻さなければならない。
情報の終了の前でも、必ずSIでASCIIに戻さなければならない。
対応する文字集合
reg#
character set
ESC sequence
designated to
6
ASCII
ESC 2/8 4/2
ESC ( B
G0
58
GB 2312
-80
ESC 2/4 2/9 4/1
ESC $ ) A
G1
171
CNS 11643
-1
ESC 2/4 2/9 4/7
ESC $ ) G
G1
172
CNS 11643-2
ESC 2/4 2/10 4/8
ESC $ * H
G2
関連・後継仕様
関連仕様として、上位仕様の
ISO-2022-CN-EXT
がある。
台湾では、
EUC-CN
(
EUC-TW
)や
Big5
などが関連する符号化法(CES)である。
大陸支那では、
GBK
や
GB 18030
などが関連する符号化法(CES)である。
再検索