UTF-5 |
辞書:通信用語の基礎知識 通信技術識別子編 (CTURI) |
読み:ユーティーエフ-ファイブ |
外語:UTF-5: Unicode Transformation Format-5 |
品詞:固有名詞 |
国際化ドメイン名を実現するために James Seng、Martin Duerst と Tin Wee Tan により提案された符号法の一つ。最終的には不採用となった。
特徴 |
基本的なコンセプトはUTF-8などと同様で、1ビットの符号部と4ビットのデータ部の不定長となる。
先頭1バイトの最上位ビット(MSB)が1となり、続くバイトのMSBは0としている。
UCS-4 (16進) | UTF-5 (2進) |
---|---|
00000000〜0000000F | 1xxxx |
00000010〜000000FF | 1xxxx 0xxxx |
00000100〜00000FFF | 1xxxx 0xxxx 0xxxx |
00001000〜0000FFFF | 1xxxx 0xxxx 0xxxx 0xxxx |
… | |
10000000〜7FFFFFFF | 1xxxx 0xxxx 0xxxx …… 0xxxx |
こうして得られた5ビットの符号は、次のように文字に割り当てる。
リンク |
通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022) Search System : Copyright © Mirai corporation Dictionary : Copyright © WDIC Creators club |