ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
国際化ドメイン名を実現するために James Seng、Martin Duerst と Tin Wee Tan により提案された符号法の一つ。最終的には不採用となった。
基本的なコンセプトはUTF-8などと同様で、1ビットの符号部と4ビットのデータ部の不定長となる。
先頭1バイトの最上位ビット(MSB)が1となり、続くバイトのMSBは0としている。
UCS-4 (16進) | UTF-5 (2進) |
---|---|
00000000〜0000000F | 1xxxx |
00000010〜000000FF | 1xxxx 0xxxx |
00000100〜00000FFF | 1xxxx 0xxxx 0xxxx |
00001000〜0000FFFF | 1xxxx 0xxxx 0xxxx 0xxxx |
… | |
10000000〜7FFFFFFF | 1xxxx 0xxxx 0xxxx …… 0xxxx |
こうして得られた5ビットの符号は、次のように文字に割り当てる。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます