ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
Unicodeの版の一つで、Unicode 3.0に対する改訂版である。
01面以降の面のうち、01面、02面、および14面の面の名前が決定した。
これに伴い、01面、02面に各種の文字が、14面にタグが、それぞれ追加され、扱える文字の数が大幅に増加した。
ISO/IEC 10646-2:2001に対応した。これにより、BMP以外の文字が追加された。
日本語に関係するところでは、CJK統合漢字拡張B(Ext-B)の追加により、JIS X 0213:2000の殆どの文字に対応した。
追加された文字から推定される新規対応言語は、以下の通りである。併記はISO 639-2またはISO 639-3の言語コード。
この版で、次に新規対応した。
3.1から追加された文字は、次の通り(文字コード順)。
Unicode 3.1.1は、UCDファイルの幾つかの問題の修正をしたバージョンである。
タグに使うことができる文字がU+E0000〜U+E007Fに追加されている。
U+E0020〜U+E007EまではASCIIの0x20〜0x7eと同じ配列になっている。
現時点では、言語タグとして、U+E0001(language tag)から始めると言語を指定するタグとして機能する。
実用例は皆無だが、RFCでは、RFC 5466に次のような用例の記載がある。
言語の処理は、文字コードの層ではなく、より上位の層(HTMLやXMLなど)で行なうべきという議論もあり、追加こそされたものの、実際には殆ど使われていない。
例えばXMLにはxml:lang属性があり、Unicodeの言語タグと併用されると矛盾が発生する。そこでXMLでは、xml:lang属性を使い、Unicodeの言語タグは使用しないということで結論を見ている。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます