ISO-2022-JP-MS |
辞書:通信用語の基礎知識 通信技術文字符号編 (CTCHRE) |
読み:アイエスオウにーまるにーにージェイピー-エムエス |
外語:ISO-2022-JP-MS |
品詞:固有名詞 |
ISO-2022-JPの亜種の一つ。
|
概要 |
ISO-2022-JPに対し、CP932全文字(重複を除くWindows-31Jの文字)が扱えるよう拡張をした符号である。
Windowsで使われているCP50220/CP50221/CP50222は、ユーザー定義外字の表現方法がISO/IEC 2022(JIS X 0202)から逸脱しており、好ましくない。
そこで、Linuxの陣営が作った符号がISO-2022-JP-MSだったようである。
libiconv、glibcなどで実装されているらしい。
仕様 |
基本仕様 |
7ビットで文字を表現する7ビット符号で、エスケープシーケンスもISO/IEC 2022に準じている。
問題であったユーザー定義外字領域については、私用のエスケープシーケンスを用いることで解決させた。
特徴 |
電子メール等、ISO-2022-JP相当の環境で、Windowsで使われる拡張文字を正しく処理したい場合が、用途として想定される。
JIS X 0201 片仮名、いわゆる半角カナは、「ESC ( I」でエスケープして出力される。
ユーザー定義外字は、ESC 2/4 2/8 3/15「ESC $ ( ?」でエスケープして出力される。3/15という終端文字Fpは私用の文字集合を表わすもので、交信するお互いの合意に基づいて使用されるものである。
符号化方式(CES) |
符号化文字集合(CCS) |
※を附したものは、入力(読み込み)には対応するが、出力されない。
出力時は、英数文字はUS-ASCII、JIS C 6226はJIS X 0208のエスケープシーケンスが使われる。
符号の割り当て |
開始状態では、次のように指示されている。
開始状態では、次のように呼び出されている。
G0がASCIIであるのは標準通りである。GRにG1が呼び出されているのかどうかは定かではない。
エスケープシーケンス |
文字集合 | エスケープシーケンス | ISO-2022-JP-MS | Unicode | I/O | ||
---|---|---|---|---|---|---|
1バイト目 | 2バイト目 | |||||
ASCII | ESC 2/8 4/2 | ESC ( B | 0x00〜0x7f | ‐ | U+0000〜U+007F | I/O |
JIS X 0201 ローマ字 | ESC 2/8 4/10 | ESC ( J | IN | |||
JIS X 0201 片仮名 | ESC 2/8 4/9 | ESC ( I | 0x21〜0x5f | U+FF61〜U+FF91 | IN | |
JIS C 6226-1978 | ESC 2/4 4/0 | ESC $ @ | 0x21〜0x28 0x30〜0x74 | 0x21〜0x7e | ‐ | IN |
JIS X 0208-1983 | ESC 2/4 4/2 | ESC $ B | I/O | |||
NEC特殊文字 | 0x2d | I/O | ||||
NEC選定IBM拡張文字 | 0x79〜0x7c | I/O | ||||
ユーザー定義外字 | ESC 2/4 2/8 3/15 | ESC $ ( ? | 0x21〜0x34 | U+E000〜U+E757 | I/O |
リンク |
通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022) Search System : Copyright © Mirai corporation Dictionary : Copyright © WDIC Creators club |