ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
Microsoftにより作られ、Microsoft Windowsで採用された符号化方法(CES)。
これはシフトJISの実装の一つである。
文字コードの符号化方法(CES)にシフトJISを用い、文字集合(CCS)に独自の「Windows-31J」などを採用したものを言う。
まず最初に採用されたのはIBMであり、「IBM 5550」というパーソナルコンピューターで最初に採用されたとされている。
基本的な仕様は次の通り。
この仕様は、後に同社のPC DOS(DOS/V)でも採用された。932という番号は、定かではないがこの時に附されたものと考えられる。
NEC PC-9800シリーズで採用されたMS-DOSでも、ほぼ同じものが採用された。番号も、同じく932となっている。但し文字集合(CCS)は違っている。
NECは、同社の汎用コンピューターACOS2,4系で使われていた文字集合と互換性を持たせることとし、9区〜13区にあった独自の拡張文字をそのまま採用した。
基本的な仕様は次の通り。
外字は、機種により字数が異なるが最大で188字に対応し、最初の94字がJISコードで0x7621〜0x767e、残りの94字が0x7721〜0x777eに割り当てられている。
IBMで115区〜119区に採用された漢字を、符号位置を変えてそのまま採用した。
このため、必要な文字は全て94×94の中に収まっている。
EPSONの互換機では、ベースの文字集合がJIS X 0208である点を除けば、同様の拡張を施してあり、互換性が考慮されている。
Windowsで日本語対応をするにあたり、IBMとNEC、双方との充分な互換性確保が求められた。結果、両者の主要な拡張をそのまま併合して採用した。
基本となる文字集合は、時代に合わせて「JIS X 0208-1990」としている。
選択基準は次の通り。
NECの漢字類はIBMの漢字と同じものであり、つまり少なくとも同じ字が二つのコードポイントに存在するということになる(詳細後述)。
基本的な仕様は次の通り。
こうして作られた文字集合は、Windows-31Jと呼ばれている。
全388文字で、うち漢字は360字である。
全文字が、二重以上重複で登録されている。
「¬」「∵」の2文字が2区と重複している。
また、「∵」は13区でも重複している。
多くの文字が重複している。
多くの文字が重複している。
全文字が、重複で登録されている。
全文字が基本多言語面(BMP)内に登録されている。
全83文字である。
「≒」「≡」「∫」「√」「⊥」「∠」「∵」「∩」「∪」の9文字が2区と重複している。
また、「∵」は115区でも重複している。
重複状況はWindows-31Jと同じ。
「№」が2区で重複している。
「≒」「≡」「∫」「√」「⊥」「∠」「∵」「∩」「∪」の9文字は、JIS X 0208と同様に2区のものが使われる。
この9字を除いたものが、コードポイントそのまま、13区に収録されている。
「Ⅰ」「Ⅱ」「Ⅲ」「Ⅳ」「Ⅴ」「Ⅵ」「Ⅶ」「Ⅷ」「Ⅸ」「Ⅹ」「№」「℡」「㈱」の13文字が重複している。
全文字が基本多言語面(BMP)内に登録されている。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます