ISO-2022-CN-EXT
読み:アイエスオウにーまるにーにースィーエン-イーエックスティー
外語:ISO-2022-CN-EXT

 複数の言語文字(文字集合)を切り替えて利用するISO-2022のサブセット規格で、支那語文字コードの符号化を規定した仕様。RFC 1922で規定されている。
目次

概要
 ISO-2022-CNの上位規格であり、支那語に関連する全仕様に対応する。
 ASCIIの英数記号と、大陸支那のGB 2312ほか各種符号、台湾CNS 11643の第一字面から第七字面の全てに対応する。
 但しISOに終端文字が定義されていないものがあり、これらは現時点では利用できない。

仕様

基本仕様
 7ビットで文字を表現する7ビット符号である。文字のコードレンジとしては0x20〜0x7fまでを用いる。
 図形文字表はGLのみを用る。一旦呼び出した後は、SI/SOで切り替えて用いる。G2やG3にある文字は、一文字ごとにSS2またはSS3で指示する。
 7ビットなので、それぞれ、SI=0x0f、SO=0x0e、SS2=0x1b 0x4e、SS3=0x1b 0x4f、となる。
 この符号系では、初期状態は(ASCII)である。エスケープを使用するまでは、ASCIIの文字列のみを表現できる。
 改行文字(CR/LF)の前では、必ずSIでASCIIに戻さなければならない。
 情報の終了の前でも、必ずSIでASCIIに戻さなければならない。

対応する文字集合
 〓印は、終端文字が未定義であるもの。
reg#character setESC sequencedesignated to
6ASCIIESC 2/8 4/2ESC ( BG0
58GB 2312:1980ESC 2/4 2/9 4/1ESC $ ) AG1
 GB 7589:1987ESC 2/4 2/10 〓ESC $ * 〓G2
 GB 7590:1987ESC 2/4 2/11 〓ESC $ + 〓G3
 GB 12345:1990ESC 2/4 2/9 〓ESC $ ) 〓G1
 GB 13131:1990ESC 2/4 2/10 〓ESC $ * 〓G2
 GB 13132:1990ESC 2/4 2/11 〓ESC $ + 〓G3
165ISO-IR-165ESC 2/4 2/9 4/5ESC $ ) EG1
171CNS 11643-1ESC 2/4 2/9 4/7ESC $ ) GG1
172CNS 11643-2ESC 2/4 2/10 4/8ESC $ * HG2
183CNS 11643-3ESC 2/4 2/11 4/9ESC $ + IG3
184CNS 11643-4ESC 2/4 2/11 4/10ESC $ + JG3
185CNS 11643-5ESC 2/4 2/11 4/11ESC $ + KG3
186CNS 11643-6ESC 2/4 2/11 4/12ESC $ + LG3
187CNS 11643-7ESC 2/4 2/11 4/13ESC $ + MG3

そもそも使い物にならない
 終端文字は殆ど定義されていない。また定義される見込みもない。
 ISO-2022-CNにしろISO-2022-CN-EXTにしろ、このような使い物にならない仕様をむりやり作ったのは、符号は一つで共通、つまり支那大陸と台湾は一つである、とするような政治思想、侵略計画に基づくものである。
 そもそも、大陸はGBKと後継のGB 18030を使っており、台湾ではBig5を使っていて、双方においてこの仕様は使っていないのである。

再検索