8ビット符号
読み:はちビット-ふごう
8ビットを一つの単位とする符号のこと。
目次
ISO/IEC 2022
定義
EUC
ISO/IEC 2022の実装
ISO/IEC 2022
定義
ISO/IEC 2022
で「8ビット符号」というときは、8ビット全て、つまり0/0〜15/15の範囲で、
CL
/
GL
に加えて
CR
/
GR
も使うことをいう。
プログラム的には0x00〜0xffまでの範囲を使う。このため、GLとGRを使って、それぞれに
G0
、
G1
、
G2
、
G3
のいずれかを任意に割り当て、複数の
言語
を扱うことができる。
EUC
パーソナルコンピューター
などは8ビット環境なので、無理に7ビットで済ませる必要性が薄い。
このため「
EUC
」という方法がよく用いられる。日本では古くから「
シフトJIS
」が使われているが、これはISO/IEC 2022ではない。
ISO/IEC 2022準拠のものはいわゆる
EUC-JP
であり、GL(0x20〜0x7f)に
ASCII
を、GR(0xa0〜0xff)に
JIS X 0208
などを割り当てて使う。
ISO/IEC 2022の実装
通常のISO/IEC 2022実装では、指示(designate)と同時に呼出(invoke)がなされる。言語の切り換えは、切り換えたい
文字集合
をG0やG1に割り当てる
エスケープシーケンス
を使えばよい。
例えば、EUC-JPのような環境にするには、1/11 2/8 4/2(ESC 0x28 0x42)でG0にASCIIを、そして1/11 2/4 2/9 4/1(ESC 0x24 0x29 0x41)でG1にJIS X 0208をG1に指示(designate)する。すると同時にGLとGRに呼出(invoke)がされる。
但しISO/IEC 2022では、G0〜G3に初期で割り当てられる文字集合は「情報交換当事者間の合意によって決まる」規定がある。EUC-JPでは、文字集合があらかじめ決まっていると仮定されているため、エスケープシーケンスは一切使うことなく、シフトJISのような使い勝手で
日本語
が扱える。
再検索