CJK統合漢字拡張B
読み:スィージェイケイ-とうごうかんじ-かくちょう-ビー
外語:Ext-B: CJK Unified Ideographs Extension B
UnicodeやISO/IEC 10646の補助漢字面(SIP)領域にある漢字文字領域の一つ。また、そこにある漢字のこと。
概要
Unicode 3.1から追加された領域と文字である。
ISO/IEC 10646では、ISO/IEC 10646-2:2001から対応した。
URO、Ext-Aと、このExt-Bを合わせれば康熙字典の文字が揃うとされる。
Macintoshでは、Mac OS X 10.1から対応した。
特徴
領域
補助漢字面(SIP)の、U+20000〜U+2A6DFの範囲が予約されている。
文字が定義されているのは、次の範囲である。
- U+20000〜U+2A6D6 (42,711文字) Unicode 3.1〜5.2.0
U+2A6D7〜U+2A6DFの範囲は、未定義のままとなっている。
問題
4万字以上が追加され、Unicodeで扱える漢字が一気に増やされたが、複数の重複字が指摘されている。
このため、拡張C以降は反省として、一気に増やすのではなく少しずつ増やすよう方針を変更した。
重複
例示字体は若干異なるが、Unicodeの基準で包括の範囲内と思われる組み合わせは次の通り。
- U+20727 と U+20730
- U+22D47 と U+22D4E
- U+24BD2 と U+2A415
CJK互換漢字と重複して追加されてしまったと見られる文字は次の通り。
その他、CJK統合漢字で統合されたが、拡張B以降で分離されたグリフ(特に台湾関係)もある。これは枚挙に暇がない。
- U+5668 と U+20F96
- U+6B04 と U+237EC
- U+7468 と U+24A01
- U+7C06 と U+25C83
再検索