ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
Unicodeのうち、BMP(00群00面)を2オクテットで符号化する符号化方法(CES)。
ISO/IEC 10646(32ビット)で考えると、上位16ビットが0となる領域。
この領域を基本多言語面(BMP)と呼び、Unicodeのコード体系をそのまま割り当てている。
UCS-2は、このBMPのみを符号化できる、古い符号化方法である。
ISO/IEC 10646誕生の経緯から、Unicodeに配慮してこの「UCS-2」という用語が生まれたが、Unicode用語としては既に廃止されている。
UCS-2自体は完全な16ビットのコード体系であり、16ビットを越える範囲の文字を扱うことができないからである。
可決寸前だったISO/IEC 10646の案DIS 10646 1.0を潰し、16ビットで全てを賄うとしたUnicodeであったが、UCS-2では領域が不足するため、UCS-2は捨てることになった。
そこで、このUCS-2にサロゲートペアと呼ばれる技術を併用した符号法が提唱され、これはUTF-16と呼ばれている。Unicode 2.0以降でこの仕様が採用された。
現在一般にUnicodeと称した場合、このUTF-16のことを指すことが多いと思われる。
UCS-2ではサロゲートペアの機能が定義されていないので、現在UCS-2で当該の文字をどのように扱うべきかは実装上の課題として残されている。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます