ISO/IEC 10646:2011
読み:アイエスオウ-アイイースィー-いちゼロろくよんろく-にせんじゅういち
外語:ISO/IEC 10646:2011
ISO/IEC 10646の2011(平成23)年版。2011(平成23)年5月2日に発行された。
概要
変更点
ISO/IEC 10646:2003から約8年ぶりの更新となる。
Unicodeとして実用化と普及が進んだ時期に発行された、それまでのISO/IEC 10646:2003とその全てのAmendmentを統合し、さらにいくつかの改良を加えた版である。
ISO/IEC 10646:2003は、最初のISO/IEC 10646の色を残していた。このISO/IEC 10646:2011では初期のISO/IEC 10646の色を一掃し、完全にUnicode色に染める改訂がなされた。これにより、ISO/IEC 10646:2011は実質的にUnicode 6.0.0相当である。
この仕様で、BMP/SMP/SIP/TIP/SSPの全てを規定する。
沿革
- 2011(平成23)年5月2日: ISO/IEC 10646:2011
特記点
この版で特記すべき点は、次の通りである。
- UCSコードスペースを0から10FFFFと明記(p.16)
- Group-Plane-Row-Cell(群、面、区、点)という概念の削除(p.17) 上位8ビットの群を廃止し、全17面からなる単体構造とする。
- 採用符号は、UTF-8/UTF-16/UTF-16BE/UTF-16LE/UTF-32/UTF-32BE/UTF-32LE
- UCS-2は廃止予定(deprecated)と明記された(p.24)
- UCS-4はUTF-32の別名扱いとなった(p.24) 符号位置が0から10FFFFに制限されることから実質的に同義となるため。
- Implementation levels(実装水準)という概念を廃止(p.27) Level 3相当、つまりUnicodeの実装のみを使う。
ISO/IEC 2022のDOCS対応では次のエスケープシーケンスのみを使い、Level 1/2を呼び出すシーケンスは廃止予定(deprecated)と明記された(p.27)
- ESC 02/05 02/15 04/09 (UTF-8)
- ESC 02/05 02/15 04/12 (UTF-16BE)
- ESC 02/05 02/15 04/06 (UTF-32BE)
ISO/IEC 10646はもはや、実質的にUnicodeとしてしか機能していない。このため初期に標榜された、Unicodeを含む上位仕様という概念を削除することで、ISO/IEC 10646をUnicodeにするのが柱となっている。
Level 1/2の実装が廃止されたことから、サロゲートペアの処理や、合成文字の処理も、Unicodeに準じて処理することが求められる。
特徴
合計で109,379字が収録されている。
Unicode 6.0.0のほぼ全ての字が収録されており、日本向けには、CJK統合漢字拡張Dとケータイ絵文字の対応が国際規格化されたことが大きい。また、Adobe-Japan1-6の漢字も、CID+20156以外の全てが符号化されたようである。
再検索