ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
複数の言語文字(文字集合)を切り替えて利用するISO-2022のサブセット規格で、支那語文字コードの符号化を規定した仕様。RFC 1922で規定されている。
ISO-2022-CNの上位規格であり、支那語に関連する全仕様に対応する。
ASCIIの英数記号と、大陸支那のGB 2312ほか各種符号、台湾のCNS 11643の第一字面から第七字面の全てに対応する。
但しISOに終端文字が定義されていないものがあり、これらは現時点では利用できない。
7ビットで文字を表現する7ビット符号である。文字のコードレンジとしては0x20〜0x7fまでを用いる。
図形文字表はGLのみを用る。一旦呼び出した後は、SI/SOで切り替えて用いる。G2やG3にある文字は、一文字ごとにSS2またはSS3で指示する。
7ビットなので、それぞれ、SI=0x0f、SO=0x0e、SS2=0x1b 0x4e、SS3=0x1b 0x4f、となる。
この符号系では、初期状態は(ASCII)である。エスケープを使用するまでは、ASCIIの文字列のみを表現できる。
改行文字(CR/LF)の前では、必ずSIでASCIIに戻さなければならない。
情報の終了の前でも、必ずSIでASCIIに戻さなければならない。
〓印は、終端文字が未定義であるもの。
reg# | character set | ESC sequence | designated to | |
---|---|---|---|---|
6 | ASCII | ESC 2/8 4/2 | ESC ( B | G0 |
58 | GB 2312:1980 | ESC 2/4 2/9 4/1 | ESC $ ) A | G1 |
GB 7589:1987 | ESC 2/4 2/10 〓 | ESC $ * 〓 | G2 | |
GB 7590:1987 | ESC 2/4 2/11 〓 | ESC $ + 〓 | G3 | |
GB 12345:1990 | ESC 2/4 2/9 〓 | ESC $ ) 〓 | G1 | |
GB 13131:1990 | ESC 2/4 2/10 〓 | ESC $ * 〓 | G2 | |
GB 13132:1990 | ESC 2/4 2/11 〓 | ESC $ + 〓 | G3 | |
165 | ISO-IR-165 | ESC 2/4 2/9 4/5 | ESC $ ) E | G1 |
171 | CNS 11643-1 | ESC 2/4 2/9 4/7 | ESC $ ) G | G1 |
172 | CNS 11643-2 | ESC 2/4 2/10 4/8 | ESC $ * H | G2 |
183 | CNS 11643-3 | ESC 2/4 2/11 4/9 | ESC $ + I | G3 |
184 | CNS 11643-4 | ESC 2/4 2/11 4/10 | ESC $ + J | G3 |
185 | CNS 11643-5 | ESC 2/4 2/11 4/11 | ESC $ + K | G3 |
186 | CNS 11643-6 | ESC 2/4 2/11 4/12 | ESC $ + L | G3 |
187 | CNS 11643-7 | ESC 2/4 2/11 4/13 | ESC $ + M | G3 |
終端文字は殆ど定義されていない。また定義される見込みもない。
ISO-2022-CNにしろISO-2022-CN-EXTにしろ、このような使い物にならない仕様をむりやり作ったのは、符号は一つで共通、つまり支那大陸と台湾は一つである、とするような政治思想、侵略計画に基づくものである。
そもそも、大陸はGBKと後継のGB 18030を使っており、台湾ではBig5を使っていて、双方においてこの仕様は使っていないのである。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます