ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
EUC-JPの亜種の一つ。
TOG日本ベンダ協議会(TOG/JVC)が策定したもので、Windows用シフトJISであるWindows-31Jの文字集合との相互変換を可能としたもの。
Windows-31Jの拡張漢字や外字領域が用意されている。
実際には幾つかの亜種があり、「eucJP-open」という呼称は、これらを包含する総称と考えられる。
符号化方法(CES)の仕様はEUC-JPと全く同じである。文字集合(CCS)のみが違う。
WindowsのシフトJISに存在するユーザー定義外字領域が用意されている。
EUCの文字集合(JIS X 0208)には本来存在しないユーザー定義外字だが、シフトJISには20区分(1880字)の領域が用意されている。
eucJP-openでは、G1とG3の85区〜94区に各10区、合計20区を割り当てている。
Windows-31JとUnicodeの変換表は、通常想定されうるものと若干異なっているため、注意を要する。
eucJP-ms/ascii/0201の変換と、既にOBSOLETE(破棄)扱いではあるがUnicodeコンソーシアムのJIS0208.TXTの変換、そしてJIS X 0208の文字名から対応づけられるUnicode文字との差異を、以下に示す。
文字 | EUC | eucJP-open | JIS0208.TXT | JIS X 0208 | ||
---|---|---|---|---|---|---|
eucJP-ms | eucJP-ascii | eucJP-0201 | ||||
 ̄ | 0xA1B1 | U+FFE3 | U+203E | U+FFE3 | U+FFE3 | U+203E OVERLINE |
― | 0xA1BD | U+2015 | U+2014 | U+2014 | U+2015 | U+2014 EM DASH |
\ | 0xA1C0 | U+FF3C | U+FF3C | U+005C | U+005C | U+005C REVERSE SOLIDUS |
~ | 0xA1C1 | U+FF5E | U+301C | U+301C | U+301C | U+301C WAVE DASH |
∥ | 0xA1C2 | U+2225 | U+2016 | U+2016 | U+2016 | U+2016 DOUBLE VERTICAL LINE |
- | 0xA1DD | U+FF0D | U+2212 | U+2212 | U+2212 | U+2212 MINUS SIGN |
¥ | 0xA1EF | U+FFE5 | U+00A5 | U+FFE5 | U+FFE5 | U+00A5 YEN SIGN |
$ | 0xA1F0 | U+FF04 | U+FF04 | U+FF04 | U+FF04 | U+0024 DOLLAR SIGN |
¢ | 0xA1F1 | U+FFE0 | U+00A2 | U+00A2 | U+00A2 | U+00A2 CENT SIGN |
£ | 0xA1F2 | U+FFE1 | U+00A3 | U+00A3 | U+00A3 | U+00A3 POUND SIGN |
¬ | 0xA2CC | U+FFE2 | U+00AC | U+00AC | U+00AC | U+00AC NOT SIGN |
文字の名前から、例えば0xA1C0「\」(バックスラッシュ)をU+005Cに変換してしまうことは、理想的ではあるかもしれないが妥当とは言い難い。プログラム中に\を書いたときに\と等価に扱われる可能性があり、様々な問題を生む危険性がある。
eucJP-openは、このようにUnicodeを介そうとするとシフトJISと同様の問題が生じるため、シフトJISとの間でのみ使うのが最も望ましい利用法であるといえる。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます