ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
ISO-2022-JP-3の亜種の一つ。
ISO-2022-JPとの互換性を重視したISO-2022-JP-3の実装の一つ。
2004(平成16)年2月20日に発行されたJIS X 0213:2004の規格票、JIS X 0213:2000/AMENDMENT 1:2004では、このCESの後継の名がISO-2022-JP-2004-strictになった。従って既にこのISO-2022-JP-3-strict符号化は旧式と考えられる。
Mule-UCSで使われている符号である。JIS X 0208に適合する範囲の文字は、極力JIS X 0208のエスケープシーケンス(ESC 2/4 4/2)で符号化する、というもの。
この符号ではJIS X 0213:2000を厳守(strict)し、包摂基準上問題のある文字はJIS X 0213の文字を用い、それ以外ではJIS X 0208の文字を用いる。かくして、この符号で符号化した文書は、ISO-2022-JPにしか対応していないソフトウェアであってもある程度読むことが可能である。
JIS X 0213:2000のエスケープシーケンスはESC 2/4 2/8 4/15だが、全部の文字をこれで符号化してしまうと、このエスケープシーケンスを知らないソフトウェアでは全く文字が表示できない。この問題に対応した仕様である。
例えば明治・大正期の小説家「森鷗外」の場合、「鴎」「鷗」の2字は、JIS X 0208では同じ符号位置18区10点となる。これを「包摂」という。JIS X 0208漢字表の例示字体は「鴎」である。
森鷗外自身、鴎外と自著していたことが知られており、森を例とするなら「鴎」「鷗」の2字は同じ字であると断定でき、包摂の基準は妥当だといえる。
JIS X 0213:2000では、JIS X 0208より若干包摂基準をゆるめることで、第3水準と第4水準の漢字を追加した。
例えば、JIS X 0213では「鷗」が1面94区69点に追加された。もちろん、1面18区10点には「鴎」がそのまま残されている。
これをJIS X 0208側からみると、「鴎」も「鷗」も18区10点であるので、18区10点については相互で互換性が無いということになる。
上に述べたようにJIS X 0208の「鴎」とJIS X 0213の「鴎」は同一視できないため、JIS X 0213ではこのような包摂に関して非互換の文字をJIS X 0208のエスケープシーケンスで符号化することを禁じている。これを「禁止文字」という。
ISO-2022-JP-3-strictでは、禁止文字はJIS X 0213のエスケープシーケンスを採用し、それ以外の文字はJIS X 0208のエスケープシーケンスを採用する。もって互換性を高めている。
なお、禁止文字さえもJIS X 0208のエスケープシーケンスを用い更に互換性を高める方法もあり、これはISO-2022-JP-3-compatibleと呼ばれている。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます