ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
UnicodeやISO/IEC 10646として実装されている漢字のこと。
CJK統合漢字は、Unicode表のうち基本多言語面(BMP)のI領域(U+4E00〜U+9FFF)に配置された20,902文字が最初である。Unicode 1.0から登場し、これをURO(Unified Repertoire and Ordering)という。
一応、JIS X 0208/JIS X 0212など、CJKの基本的な仕様を丸呑みはしたものの、字数が不足したことからCJKで批判が巻き起こった。
特に日本人が気に入らなかったのは、JCKVで字体が違うものを一つの符号位置に「包括」していることだった。点一つの有無にもうるさい人にとって、これは屈辱的な事だったのである。
以降、殺到する追加要求に対応すべく、Unicode 2.0からはサロゲート領域が追加され、対応可能な符号範囲が広げられた。以降、積極的に文字の追加が行なわれている。
現在は、拡張などが繰り返されており、次のラインナップとなっている。
CJK互換漢字は、CJK統合漢字ではない。
Unicodeは「CJK Ideograph Extension ※」と呼んでいるが、ISO/IEC 10646は同じものをきちんと「CJK UNIFIED IDEOGRAPHS EXTENSION ※」のように呼んでいる。
符号位置は、U+4E00〜9FFF(基本多言語面、BMP)の範囲が予約されている。
名称は「Unified Repertoire and Ordering」(URO)で、Unicodeでは「CJK Unified Ideographs」と呼ばれている。
あまり変わらないようでいて、実は少しずつ字数が増えている。
符号位置は、U+3400〜4DBF(補助漢字面、SIP)の範囲が予約されている。
この領域は「CJK統合漢字拡張A」と呼ばれている。
符号位置は、U+20000〜U+2A6DF(補助漢字面、SIP)の範囲が予約されている。
この領域は「CJK統合漢字拡張B」と呼ばれている。
符号位置は、U+2A700〜U+2B73F(補助漢字面、SIP)の範囲が予約されている。
この領域は「CJK統合漢字拡張C」と呼ばれている。
符号位置は、U+2B740〜U+2B81F(補助漢字面、SIP)の範囲が予約されている。
この領域は「CJK統合漢字拡張D」と呼ばれている。
符号位置は、U+2B820〜U+2CEAF(補助漢字面、SIP)の範囲が予約されている。
この領域は「CJK統合漢字拡張E」と呼ばれている。
符号位置は、U+2CEB0〜U+2EBEF(補助漢字面、SIP)の範囲が予約されている。
この領域は「CJK統合漢字拡張F」と呼ばれている。
現在策定中であり、将来的(おそらくUnicode 9以降)に追加予定である。
CJK互換漢字は、CJK統合漢字ではないが、併用される集合である。Annex.Sの統合規則も適用されないとされる。
この集合は、本来はCJKの統合基準的にCJK統合漢字に統合されるべき文字であるが、既存の文字集合規格と互換性(ラウンドトリップ、往復変換性)を保つため、別の符号位置を特別に割り振ったものである。
Unicode 1.0.1から登場した。BMPとSIPに存在する。
日本であれば、IBM拡張文字(NEC選定IBM拡張文字)の一部の文字などが、ここに登録されている。
但し、符号位置がこの範囲内であっても、一部の文字についてはCJK互換漢字ではなくCJK統合漢字へと変更されたものがあり、それらはCJK統合漢字と同等に扱われている。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます