ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
二組のサロゲートを一対(pair)にして用いるということ。
Unicodeでは、Unicode 2.0規格以降、サロゲート文字として上位、下位、それぞれに1024字を割り当てた。
上位サロゲート1,024個(U+D800〜U+DBFF)と下位サロゲート1,024個(U+DC00〜U+DFFF)を組み合わせるのがサロゲートペアである。
上位と下位は常に対に使用される。UTF-16の仕様では、対になっていないサロゲートはエラーと見なされる。
この手法によって、1024×1024=1,048,576字の拡張を実現し、00群01面〜00群16面(U+010000〜U+10FFFF)の文字が利用可能となった。
なお、Unicodeであっても、UTF-8などの符号化法ではサロゲートペアは使用しない。使わなくても、これらの文字を表わすことが可能なように設計されているからである。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます