CES
読み:スィーイーエス
外語:CES: Character Encoding Scheme
文字集合(CCS)をビット列で表現するルール。符号化方法のこと。この概念はRFC 2130で規定される。
概要
文字のエンコード方法のこと。
例えばJIS X 0208というCCSに対するCESとしてISO-2022-JP、EUC-JP、シフトJISなどが存在する。
他にも、UnicodeというCCSに対するCESとしてUTF-8などがある。
UTF-16の場合
CESと呼ばれ、文字列として扱われるものは、原則としてバイト列で表現されている。
この時問題となるのは、UTF-16の存在である。
UnicodeはCCSで、「オクテット化された」UTF-16のバイト列はCESであると言える。しかしUTF-16は本来16ビット単位で扱われる前提で設計されており、この時に16ビット単位のUTF-16をどう表現するべきかという問題が生じた。
そこで、UTF-16を表現するために、新たにCEFという用語が作られた。
これにより、UTF-16の16ビット単位をCEFといい、これをファイル化等した時にオクテット単位に扱われた状態をCESということになる。
再検索