ISO-2022-JP-MS

読み:アイエスオウにーまるにーにージェイピー・エムエス
読み:アイソにーまるにーにージェイピー・エムエス
外語:ISO-2022-JP-MS 英語
品詞:固有名詞

ISO-2022-JPの亜種の一つ。

目次

ISO-2022-JPに対し、CP932全文字(重複を除くWindows-31Jの文字)が扱えるよう拡張をした符号である。

Windowsで使われているCP50220/CP50221/CP50222は、ユーザー定義外字の表現方法がISO/IEC 2022(JIS X 0202)から逸脱しており、好ましくない。

そこで、Linuxの陣営が作った符号がISO-2022-JP-MSだったようである。

libiconv、glibcなどで実装されているらしい。

基本仕様

7ビットで文字を表現する7ビット符号で、エスケープシーケンスもISO/IEC 2022に準じている。

問題であったユーザー定義外字領域については、私用のエスケープシーケンスを用いることで解決させた。

特徴

電子メール等、ISO-2022-JP相当の環境で、Windowsで使われる拡張文字を正しく処理したい場合が、用途として想定される。

JIS X 0201 片仮名、いわゆる半角カナは、「ESC ( I」でエスケープして出力される。

ユーザー定義外字は、ESC 2/4 2/8 3/15「ESC $ ( ?」でエスケープして出力される。3/15という終端文字Fpは私用の文字集合を表わすもので、交信するお互いの合意に基づいて使用されるものである。

符号化方式(CES)

  • 7ビットISO/IEC 2022 (ISO-2022-JP)

符号化文字集合(CCS)

※を附したものは、入力(読み込み)には対応するが、出力されない。

出力時は、英数文字はUS-ASCII、JIS C 6226はJIS X 0208のエスケープシーケンスが使われる。

符号の割り当て

開始状態

開始状態では、次のように指示されている。

開始状態では、次のように呼び出されている。

  • GL ‐ G0
  • GR ‐ ‐

G0がASCIIであるのは標準通りである。GRにG1が呼び出されているのかどうかは定かではない。

エスケープシーケンス

文字集合エスケープシーケンスISO-2022-JP-MSUnicodeI/O
1バイト目2バイト目
ASCIIESC 2/8 4/2ESC ( B0x00〜0x7fU+0000〜U+007FI/O
JIS X 0201 ローマ字ESC 2/8 4/10ESC ( JIN
JIS X 0201 片仮名ESC 2/8 4/9ESC ( I0x21〜0x5fU+FF61〜U+FF91IN
JIS C 6226-1978ESC 2/4 4/0ESC $ @0x21〜0x28
0x30〜0x74
0x21〜0x7eIN
JIS X 0208-1983ESC 2/4 4/2ESC $ BI/O
NEC特殊文字0x2dI/O
NEC選定IBM拡張文字0x79〜0x7cI/O
ユーザー定義外字ESC 2/4 2/8 3/15ESC $ ( ?0x21〜0x34U+E000〜U+E757I/O

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club