ISO-2022-CN
読み:アイエスオウにーまるにーにースィーエン
外語:ISO-2022-CN

 複数の言語文字(文字集合)を切り替えて利用するISO-2022のサブセット規格で、支那語文字コードの符号化を規定した仕様。RFC 1922で規定されている。
目次

概要
 ASCIIと、GB 2312CNS 11643の第一面と第二面に対応する。
 支那語環境のIRCや電子メールなどで使われることがある。

仕様

基本仕様
 7ビットで文字を表現する7ビット符号である。文字のコードレンジとしては0x20〜0x7fまでを用いる。
 図形文字表はGLのみを用る。一旦呼び出した後は、SI/SOで切り替えて用いる。G2にある文字は、一文字ごとにSS2で指示する。
 7ビットなので、それぞれ、SI=0x0f、SO=0x0e、SS2=0x1b 0x4e、となる。
 この符号系では、初期状態は(ASCII)である。エスケープを使用するまでは、ASCIIの文字列のみを表現できる。
 改行文字(CR/LF)の前では、必ずSIでASCIIに戻さなければならない。
 情報の終了の前でも、必ずSIでASCIIに戻さなければならない。

対応する文字集合
reg#character setESC sequencedesignated to
6ASCIIESC 2/8 4/2ESC ( BG0
58GB 2312-80ESC 2/4 2/9 4/1ESC $ ) AG1
171CNS 11643-1ESC 2/4 2/9 4/7ESC $ ) GG1
172CNS 11643-2ESC 2/4 2/10 4/8ESC $ * HG2

関連・後継仕様
 関連仕様として、上位仕様のISO-2022-CN-EXTがある。
 台湾では、EUC-CN(EUC-TW)やBig5などが関連する符号化法(CES)である。
 大陸支那では、GBKGB 18030などが関連する符号化法(CES)である。

再検索