Microsoft Windows Codepage : 51932
読み:マイクロソフト-ウィンドウズ-コードページ-ごーいちきゅうさんに
外語:CP51932: Microsoft Windows Codepage : 51932
Microsoft Windows
で使われている、
EUC-JP
の亜種の一つ。
目次
概要
仕様
基本仕様
IANA
特徴
符号化方式(CES)
符号化文字集合(CCS)
符号の割り当て
開始状態
符号位置
概要
EUC-JP
の符号化方式(
CES
)を使い、符号化文字集合(
CCS
)に
CP932
全文字(重複を除く
Windows-31J
の文字)を採用した符号である。
Windowsそのものの実装であり、
Internet Explorer
などで使われている。
仕様
基本仕様
基本的には8ビットで文字を表現する
8ビット符号
である。
但し、これによって指示される
文字集合
は、標準ではなく、Windowsの実装に合わせた独自の文字集合である。
IANA
成瀬ゆいにより、IANAに次の名前で登録された。
CP51932
csCP51932
特徴
Webサイト等、EUC-JP相当の環境で、Windowsで使われる拡張文字を正しく処理したい場合が、用途として想定される。
Windows内部では、一旦シフトJISに変換してからUnicodeに変換しており、UnicodeからCP51932にする場合はその逆処理をしている。この途中で変換不能な文字があると、それをそのまま残した偽のシフトJIS文字列を内部に作り、これを更にUnicode化するため、他にはない独特の文字化けを起こす。
また、
ユーザー定義外字
は存在しない。Windowsでこの文字をCP51932として出力しようとすると、ユーザー定義外字(U+E000〜U+E757)がシフトJISの符号(0xF040〜0xF9FC)で出力されてしまうため注意が必要である。
符号化方式(CES)
8ビットISO/IEC 2022 (ISO-2022-JP)
符号化文字集合(CCS)
US-ASCII
JIS X 0201 片仮名
JIS X 0208:1997
NEC特殊文字
NEC選定IBM拡張文字
符号の割り当て
開始状態
開始状態では、次のように指示されている。
G0
:
ASCII
G1
:
JIS X 0208
G2
:
JIS X 0201
片仮名
G3
: ‐
開始状態では、次のように呼び出されている。
GL
‐ G0
GR
‐ G1
符号位置
文字集合
CP51932
Unicode
1バイト目
2バイト目
ASCII
0x00〜0x7f
‐
U+0000〜U+007F
JIS X 0201
片仮名
0x8e
0xa1〜0xdf
U+FF61〜U+FF91
JIS X 0208-1983
0xa1〜0xfe
0xa1〜0xfe
‐
NEC特殊文字
0xad
NEC選定IBM拡張文字
0xf9〜0xfc
再検索