Microsoft Windows Codepage : 932
読み:マイクロソフトウィンドウズ-コードページ-きゅうさんに
外語:CP932: Microsoft Windows Codepage : 932

 Microsoftにより作られ、Microsoft Windowsで採用された符号化方法(CES)。
目次

概要
 これはシフトJISの実装の一つである。
 文字コードの符号化方法(CES)にシフトJISを用い、文字集合(CCS)に独自の「Windows-31J」などを採用したものを言う。

特徴

沿革

コードページ
 「コードページ」は文字集合を表わす。
 かつて、PC DOSMS-DOSでは、このコードページを16ビットの番号で管理した。
 「932」は、日本語のシフトJISというCESに与えられた番号である。但し、CCSが異なるものも同じく932となっているため、全ての環境で同じ文字が扱えるとは限らない。

IBM
 まず最初に採用されたのはIBMであり、「IBM 5550」というパーソナルコンピューターで最初に採用されたとされている。
 基本的な仕様は次の通り。
 この仕様は、後に同社のPC DOS(DOS/V)でも採用された。932という番号は、定かではないがこの時に附されたものと考えられる。

NEC MS-DOS
 NEC PC-9800シリーズで採用されたMS-DOSでも、ほぼ同じものが採用された。番号も、同じく932となっている。但し文字集合(CCS)は違っている。
 NECは、同社の汎用コンピューターACOS2,4系で使われていた文字集合と互換性を持たせることとし、9区〜13区にあった独自の拡張文字をそのまま採用した。
 基本的な仕様は次の通り。
 外字は、機種により字数が異なるが最大で188字に対応し、最初の94字がJISコードで0x7621〜0x767e、残りの94字が0x7721〜0x777eに割り当てられている。
 IBMで115区〜119区に採用された漢字を、符号位置を変えてそのまま採用した。
 このため、必要な文字は全て94×94の中に収まっている。
 EPSONの互換機では、ベースの文字集合がJIS X 0208である点を除けば、同様の拡張を施してあり、互換性が考慮されている。

Microsoft Windows Codepage : 932
 Windowsで日本語対応をするにあたり、IBMとNEC、双方との充分な互換性確保が求められた。結果、両者の主要な拡張をそのまま併合して採用した。
 基本となる文字集合は、時代に合わせて「JIS X 0208-1990」としている。
 選択基準は次の通り。
 NECの漢字類はIBMの漢字と同じものであり、つまり少なくとも同じ字が二つのコードポイントに存在するということになる(詳細後述)。
 基本的な仕様は次の通り。
 こうして作られた文字集合は、Windows-31Jと呼ばれている。

重複問題

状況
 IBM拡張文字も、NEC特殊文字も、JIS C 6226-1978に対して追加した文字集合であるため、JIS X 0208に対してすら重複しているものがある。
 また、IBM拡張文字とNEC選定IBM拡張文字は、完全に重複している。
 これらの文字も、Unicodeでは互換文字として採用され、全てが基本多言語面(BMP)内にあるが、IBM拡張文字とNEC選定IBM拡張文字はUnicode内では一つのコードポイントしか無く、重複はしていない。

IBM拡張文字
 全388文字で、うち漢字は360字である。

NEC特殊文字
 全83文字である。

再検索