ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
Microsoft Windowsで使われている、EUC-JPの亜種の一つ。
EUC-JPの符号化方式(CES)を使い、符号化文字集合(CCS)にCP932全文字(重複を除くWindows-31Jの文字)を採用した符号である。
Windowsそのものの実装であり、Internet Explorerなどで使われている。
成瀬ゆいにより、IANAに次の名前で登録された。
Webサイト等、EUC-JP相当の環境で、Windowsで使われる拡張文字を正しく処理したい場合が、用途として想定される。
Windows内部では、一旦シフトJISに変換してからUnicodeに変換しており、UnicodeからCP51932にする場合はその逆処理をしている。この途中で変換不能な文字があると、それをそのまま残した偽のシフトJIS文字列を内部に作り、これを更にUnicode化するため、他にはない独特の文字化けを起こす。
また、ユーザー定義外字は存在しない。Windowsでこの文字をCP51932として出力しようとすると、ユーザー定義外字(U+E000〜U+E757)がシフトJISの符号(0xF040〜0xF9FC)で出力されてしまうため注意が必要である。
文字集合 | CP51932 | Unicode | |
---|---|---|---|
1バイト目 | 2バイト目 | ||
ASCII | 0x00〜0x7f | ‐ | U+0000〜U+007F |
JIS X 0201 片仮名 | 0x8e | 0xa1〜0xdf | U+FF61〜U+FF91 |
JIS X 0208-1983 | 0xa1〜0xfe | 0xa1〜0xfe | ‐ |
NEC特殊文字 | 0xad | ||
NEC選定IBM拡張文字 | 0xf9〜0xfc |
コメントなどを投稿するフォームは、日本語対応時のみ表示されます