UTF-18
読み:ユーティーエフ-じゅうはち
外語:UTF-18: Unicode Transformation Format-18
UnicodeおよびISO/IEC 10646を18ビット文字で表現できるように変換したもの、及びその方法。
本来31ビット固定長のものを、18ビット文字の固定長に変換する。RFC 4042で情報提供扱いで規定されている。姉妹品にUTF-9がある。
概要
31ビットのコードを18ビット固定長で表現するため、全範囲を表現することはできない。
表現できるのは、U+0000〜U+2FFFFの範囲と、U+E0000〜U+EFFFFの範囲だけである。これでも0〜2面と14面が網羅されるため、現時点においては必要充分である。
目的
これはDECのPDP-10やIBM-7090、NEC ACOS-6などの36ビットワードマシンのためのもので、これら1バイトが9ビットのコンピューターで効率良くUnicodeが扱えるようになっている。
RFC内のサンプルプログラムはC言語とPDP用アセンブリ言語で書かれている。
ちなみにこのRFCの公開日は2005(平成17)年4月1日である。
表現方法
具体的には、U+0000〜U+2FFFFの範囲はUTF-18でもそのままの値で用いられ、U+E0000〜U+EFFFFの範囲は0x70000シフトし0x30000〜0x3ffffとして扱う。
再検索