UTF |
辞書:通信用語の基礎知識 通信技術文字符号編 (CTCHRE) |
読み:ユーティーエフ |
外語:UTF: Unicode Transformation Format |
品詞:名詞 |
UnicodeやISO/IEC 10646を、実際に計算機で利用できるように変換した形式の符号化のこと。
|
概要 |
Unicodeなどは文字集合(CCS)の仕様で、これを実際に符号化する仕様(CES)がUTFである。
ASCIIなどの7ビット文字などと共存可能なように工夫したものが良く使われているが、必ずしもそれが全てでは無い。
16ビット長または32ビット長のUnicodeやISO/IEC 10646を、1バイト以上の不定長に変換する仕様として、主に7ビットを基準とするUTF-7と、8ビットを基準とするUTF-8がある。
また、Unicode専用としては、サロゲートを使い16ビット単位の可変長で符号化するUTF-16、32ビット固定長で符号化するUTF-32などがある。
種類 |
RFCなどで定義されているものに、次のようなものがある。
符号長は「バイト単位」だが、このバイトが8ビット(オクテット)とは限らない。
名称 | 最大値 | 符号長 | 特徴等 | 典拠 |
---|---|---|---|---|
UTF-1 | 0x7FFFFFFF | 1〜5 | 現在は破棄された | ISO/IEC 10646-1:1993 Annex G |
UTF-2 | 0x7FFFFFFF | 1〜6 | 後にUTF-8となった | |
UTF-5 | 0x7FFFFFFF | 1〜8 | 国際化ドメイン名用、しかし不採用 | draft-jseng-utf5-01.txt |
UTF-6 | 0x0000FFFF | 国際化ドメイン名用、しかし未完成 | draft-ietf-idn-utf6-00.txt | |
UTF-7 | 0x0010FFFF | 電子メール用 | RFC 2152 | |
UTF-8 | 0x7FFFFFFF | 1〜6 | ファイルシステムや文書ファイル用 | RFC 3629、(RFC 2279) |
UTF-EBCDIC | 0x7FFFFFFF | 1〜7 | EBCDICと親和性の高い符号化 | Unicode TR16 |
UTF-9 (I-D) | 0x7FFFFFFF | 1〜5 | ファイルシステムや文書ファイル用 | draft-abela-utf9-00 |
UTF-9 (RFC) | 0x7FFFFFFF | 1〜4 | エイプリルフールの冗談 | RFC 4042 |
UTF-16 | 0x0010FFFF | 1〜2 | RFC 2781 | |
UTF-18 | 1 | エイプリルフールの冗談 | RFC 4042 | |
UTF-32 | 0x0010FFFF | 1 | Unicode TR19 |
リンク |
通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022) Search System : Copyright © Mirai corporation Dictionary : Copyright © WDIC Creators club |