ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
UnicodeやISO/IEC 10646を、実際に計算機で利用できるように変換した形式の符号化のこと。
RFCなどで定義されているものに、次のようなものがある。
符号長は「バイト単位」だが、このバイトが8ビット(オクテット)とは限らない。
名称 | 最大値 | 符号長 | 特徴等 | 典拠 |
---|---|---|---|---|
UTF-1 | 0x7FFFFFFF | 1〜5 | 現在は破棄された | ISO/IEC 10646-1:1993 Annex G |
UTF-2 | 0x7FFFFFFF | 1〜6 | 後にUTF-8となった | |
UTF-5 | 0x7FFFFFFF | 1〜8 | 国際化ドメイン名用、しかし不採用 | draft-jseng-utf5-01.txt |
UTF-6 | 0x0000FFFF | 国際化ドメイン名用、しかし未完成 | draft-ietf-idn-utf6-00.txt | |
UTF-7 | 0x0010FFFF | 電子メール用 | RFC 2152 | |
UTF-8 | 0x7FFFFFFF | 1〜6 | ファイルシステムや文書ファイル用 | RFC 3629、(RFC 2279) |
UTF-EBCDIC | 0x7FFFFFFF | 1〜7 | EBCDICと親和性の高い符号化 | Unicode TR16 |
UTF-9 (I-D) | 0x7FFFFFFF | 1〜5 | ファイルシステムや文書ファイル用 | draft-abela-utf9-00 |
UTF-9 (RFC) | 0x7FFFFFFF | 1〜4 | エイプリルフールの冗談 | RFC 4042 |
UTF-16 | 0x0010FFFF | 1〜2 | RFC 2781 | |
UTF-18 | 1 | エイプリルフールの冗談 | RFC 4042 | |
UTF-32 | 0x0010FFFF | 1 | Unicode TR19 |
コメントなどを投稿するフォームは、日本語対応時のみ表示されます