サロゲート領域
読み:サロゲートりょういき
外語:Surrogates
Unicodeで、サロゲートが置かれた場所の俗称。
概要
サロゲートは、Unicode 2.0から基本多言語面(BMP)に追加された機能文字の一種である。
この部分の文字を組み合わせて使う(UTF-16という符号化方法を使う)ことで、00群01面〜00群16面、つまりU+010000〜10FFFFの範囲の文字が利用可能となる。
特徴
上位サロゲートU+D800〜U+DBFF、下位サロゲートU+DC00〜U+DFFFで、各々1,024個ずつある。
これを互いに組み合わせる(サロゲートペア)ことで1024×1024=1,048,576字の拡張を実現する。
派生して、この方法によってアクセス可能となった00群01面〜00群16面までの文字コード領域のこともサロゲート領域という。
再検索