ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
文字集合(CCS)をビット列で表現するルール。符号化方法のこと。この概念はRFC 2130で規定される。
文字のエンコード方法のこと。
例えばJIS X 0208というCCSに対するCESとしてISO-2022-JP、EUC-JP、シフトJISなどが存在する。
CESと呼ばれ、文字列として扱われるものは、原則としてバイト列で表現されている。
この時問題となるのは、UTF-16の存在である。
UnicodeはCCSで、「オクテット化された」UTF-16のバイト列はCESであると言える。しかしUTF-16は本来16ビット単位で扱われる前提で設計されており、この時に16ビット単位のUTF-16をどう表現するべきかという問題が生じた。
そこで、UTF-16を表現するために、新たにCEFという用語が作られた。
これにより、UTF-16の16ビット単位をCEFといい、これをファイル化等した時にオクテット単位に扱われた状態をCESということになる。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます