UTF-9 (RFC) |
辞書:通信用語の基礎知識 通信技術文字符号編 (CTCHRE) |
読み:ユーティーエフ-ナイン |
外語:UTF-9: Unicode Transformation Format-9 |
品詞:名詞 |
Unicodeを9ビット文字で表現できるように変換したもの、及びその方法。
本来31ビット固定のもののを9ビット文字の不定長に変換する。RFC 4042で情報提供扱いで規定されている。姉妹品にUTF-18がある。
|
目的 |
これはDECのPDP-10やIBM-7090、NEC ACOS-6などの36ビットワードマシンのためのもので、これら1バイトが9ビットのコンピューターで効率良くUnicodeが扱えるようになっている。
RFC内のサンプルプログラムはC言語とPDP用アセンブリ言語で書かれている。
ちなみにこのRFCの公開日は2005(平成17)年4月1日である。
仕様 |
符号化方法 |
UTF-9ではUnicodeのU+0000〜U+00FFは1バイト(9ビット、以下同)で表現される。
データは末尾寄せとし、末尾バイトのみMSBを0とし、それ以外は1とした2バイト以上の文字列で表現する。
UCS-4 (16進) | UTF-9 (2進) |
---|---|
00000000〜000000FF | 0Xxxxxxxx |
00000100〜0000FFFF | 1Xxxxxxxx 0Xxxxxxxx |
00010000〜00FFFFFF | 1Xxxxxxxx 1Xxxxxxxx 0Xxxxxxxx |
01000000〜7FFFFFFF | 1Xxxxxxxx 1Xxxxxxxx 1Xxxxxxxx 0Xxxxxxxx |
上記Xはオクテットごとの先頭MSBである.
リンク |
通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022) Search System : Copyright © Mirai corporation Dictionary : Copyright © WDIC Creators club |