ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
ISO/IEC 10646およびUnicode文字を8ビットの不定長(1、2、3、5バイト)として表現できるように変換したものだった。不人気のため現在は仕様から破棄されている。
これは、ASCIIの上位互換となるよう変換するものの一つである。
0x00〜0x9f(CL、GL、CR)は1バイト文字として維持し、1バイト目が0xa0〜0xff(GR)から始める。
2バイト目以降は0x21〜0x7eと0xa0〜0xffの190種類を使い、制御文字は避けるように設計されている。
ISO/IEC 10646-1:1993の附属書Gに掲載されたが、すぐにISO/IEC 10646からは削除された。IANAには次の名前で登録されている。
ISO-IR 178として登録されている。ISO/IEC 2022におけるエスケープシーケンスは次のとおり。
UTF-1からISO/IEC 2022に戻るには、次のエスケープシーケンスを用いる。
変換には、除算と剰余計算が含まれるため、処理が重くなりがちである。
2バイト目は190種類ある。次の計算式を、マクロT(z)として定義する(後の2行は原則として未使用)。
次に、文字番号の範囲に応じて、次のように算出する。UCS-4の文字番号をU、除算記号(÷)を/、剰余演算記号を%とする。
UCS-4 (16進) | UTF-7 |
---|---|
00000000〜0000009F | 0xxxxxxx |
000000A0〜000000FF | 11000000 1xxxxxxx |
00000100〜00004015 | y = U - 0x00000100 0xA1+y/190 T(y%190) |
00004016〜00038E2D | y = U - 0x00004016 0xF6+y/1902 T(y/190%190) T(y%190) |
00038E2E〜7FFFFFFF | y = U - 0x00038E2E 0xFC+y/1904 T(y/1903%190) T(y/1902%190) T(y/190%190) T(y%190) |
コメントなどを投稿するフォームは、日本語対応時のみ表示されます