8ビット符号
読み:はちビット-ふごう

 8ビットを一つの単位とする符号のこと。
目次

ISO/IEC 2022

定義
 ISO/IEC 2022で「8ビット符号」というときは、8ビット全て、つまり0/0〜15/15の範囲で、CL/GLに加えてCR/GRも使うことをいう。
 プログラム的には0x00〜0xffまでの範囲を使う。このため、GLとGRを使って、それぞれにG0G1G2G3のいずれかを任意に割り当て、複数の言語を扱うことができる。

EUC
 パーソナルコンピューターなどは8ビット環境なので、無理に7ビットで済ませる必要性が薄い。
 このため「EUC」という方法がよく用いられる。日本では古くから「シフトJIS」が使われているが、これはISO/IEC 2022ではない。
 ISO/IEC 2022準拠のものはいわゆるEUC-JPであり、GL(0x20〜0x7f)にASCIIを、GR(0xa0〜0xff)にJIS X 0208などを割り当てて使う。

ISO/IEC 2022の実装
 通常のISO/IEC 2022実装では、指示(designate)と同時に呼出(invoke)がなされる。言語の切り換えは、切り換えたい文字集合をG0やG1に割り当てるエスケープシーケンスを使えばよい。
 例えば、EUC-JPのような環境にするには、1/11 2/8 4/2(ESC 0x28 0x42)でG0にASCIIを、そして1/11 2/4 2/9 4/1(ESC 0x24 0x29 0x41)でG1にJIS X 0208をG1に指示(designate)する。すると同時にGLとGRに呼出(invoke)がされる。
 但しISO/IEC 2022では、G0〜G3に初期で割り当てられる文字集合は「情報交換当事者間の合意によって決まる」規定がある。EUC-JPでは、文字集合があらかじめ決まっていると仮定されているため、エスケープシーケンスは一切使うことなく、シフトJISのような使い勝手で日本語が扱える。

再検索