ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
Unicodeを9ビット文字で表現できるように変換したもの、及びその方法。
本来31ビット固定のもののを9ビット文字の不定長に変換する。RFC 4042で情報提供扱いで規定されている。姉妹品にUTF-18がある。
UTF-9ではUnicodeのU+0000〜U+00FFは1バイト(9ビット、以下同)で表現される。
データは末尾寄せとし、末尾バイトのみMSBを0とし、それ以外は1とした2バイト以上の文字列で表現する。
UCS-4 (16進) | UTF-9 (2進) |
---|---|
00000000〜000000FF | 0Xxxxxxxx |
00000100〜0000FFFF | 1Xxxxxxxx 0Xxxxxxxx |
00010000〜00FFFFFF | 1Xxxxxxxx 1Xxxxxxxx 0Xxxxxxxx |
01000000〜7FFFFFFF | 1Xxxxxxxx 1Xxxxxxxx 1Xxxxxxxx 0Xxxxxxxx |
上記Xはオクテットごとの先頭MSBである.
コメントなどを投稿するフォームは、日本語対応時のみ表示されます