CES
読み:スィーイーエス
外語:CES: Character Encoding Scheme

 文字集合(CCS)をビット列で表現するルール。符号化方法のこと。この概念はRFC 2130で規定される。
目次

概要
 文字のエンコード方法のこと。
 例えばJIS X 0208というCCSに対するCESとしてISO-2022-JPEUC-JPシフトJISなどが存在する。
 他にも、UnicodeというCCSに対するCESとしてUTF-8などがある。

UTF-16の場合
 CESと呼ばれ、文字列として扱われるものは、原則としてバイト列で表現されている。
 この時問題となるのは、UTF-16の存在である。
 UnicodeはCCSで、「オクテット化された」UTF-16のバイト列はCESであると言える。しかしUTF-16は本来16ビット単位で扱われる前提で設計されており、この時に16ビット単位のUTF-16をどう表現するべきかという問題が生じた。
 そこで、UTF-16を表現するために、新たにCEFという用語が作られた。
 これにより、UTF-16の16ビット単位をCEFといい、これをファイル化等した時にオクテット単位に扱われた状態をCESということになる。

再検索