ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
サロゲートは、Unicode 2.0から基本多言語面(BMP)に追加された機能文字の一種である。
この部分の文字を組み合わせて使う(UTF-16という符号化方法を使う)ことで、00群01面〜00群16面、つまりU+010000〜10FFFFの範囲の文字が利用可能となる。
上位サロゲートU+D800〜U+DBFF、下位サロゲートU+DC00〜U+DFFFで、各々1,024個ずつある。
これを互いに組み合わせる(サロゲートペア)ことで1024×1024=1,048,576字の拡張を実現する。
派生して、この方法によってアクセス可能となった00群01面〜00群16面までの文字コード領域のこともサロゲート領域という。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます