概要
JIS X 0213は、それまで使われてきたJIS X 0208の後継として作られた仕様である。
JIS漢字表は誕生当初より、「字形そのもの」は定めていない。正字、略字等で字形の差異が僅かな字は原則として同じ文字とし、同じ一つの番号を与えている。これを「包摂」と呼んでいる。
しかし、JIS X 0213制定時に基準の適用を若干ゆるめ、さらに改訂版制定時には文部科学省の諮問機関である国語審議会により「印刷標準字体」の採用が決定されたため、JIS X 0213は、例示字体に印刷標準字体を採用した。
かくして、JIS X 0208との互換性は一部損なわれており、JIS C 6226→JIS X 0208の際の問題が再び発生している。 仕様 特徴
長く使われたJIS X 0208で規定される6,879文字を拡張し、これと同時に運用可能な規格として作られた。
具体的には、JIS X 0208の第1水準漢字、第2水準漢字の計6,879文字と同時に使える、第3水準漢字1,259字・第4水準漢字2,436字の漢字と、各種の記号を含む非漢字など659字、合計4,354文字(JIS X 0213:2004)、総合計11,233文字が収められている文字集合(CCS)の規格である。
この規格は符号化方法(CES)としてシフトJIS及びEUC-JPを重視しており、シフトJISのJIS X 0208及びEUC-JPのJIS X 0208、JIS X 0212と衝突しない区に文字を配置するように配慮されているため、シフトJISおよびEUC-JP双方のCESにおいて完全に同居することが可能である。 沿革
2012(平成24)年2月20日: JIS X 0213改正 (JIS X 0213:2000/AMENDMENT 2:2012、JIS X 0213:2012)
経緯
当初はシフトJISの半角カタカナ領域を廃止し、そこを2バイト文字の先頭バイトに割り当てる、更に2バイト文字のコードレンジの最後の値を0xfcから0xfeに拡張、という案があった。
このため当初予定されていた文字数は非常に多かったが、互換性などの問題のため最終的には両案とも棄却された。
それでも、Microsoft Windows環境においてさえ、第4水準領域が外字領域と重複するなどの理由からシフトJISを使う分においては第4水準漢字は利用できない。 他のISO登録状況
JIS X 0213には、第一面と第二面の2面が存在する。
第一面は、初版と改訂版で仕様が異なるため、それぞれ別に登録されている。 第一面・初版(JIS X 0213:2000)
初版(JIS X 0213:2000)の第一面は、ISO-IR 228として登録されている。
ISO-IR 228のISO/IEC 2022におけるエスケープシーケンスは次のとおり。
G0: ESC 2/4 2/8 4/15
G1: ESC 2/4 2/9 4/15
G2: ESC 2/4 2/10 4/15
G3: ESC 2/4 2/11 4/15
第一面・改訂版(JIS X 0213:2004)
改訂版(JIS X 0213:2004)の第一面は、ISO-IR 233として登録されている。
ISO-IR 233のISO/IEC 2022におけるエスケープシーケンスは次のとおり。
版ごとの仕様差 JIS X 0213:2000
JIS X 0208で規定される6,879文字を拡張し、これと同時に運用可能な第3水準漢字1,249字、第4水準漢字2,436字、非漢字659字(計4,344字)を含む11,223文字を規定する規格として作られた。
例えば、JIS X 0208では「鴎」「鴎」の2字は包摂されており、同じ18区10点にある。但し、JIS X 0208の仕様範囲内では、相互を区別する機械的方法は存在しない。
対してJIS X 0213は包摂基準変更により、「鴎」は1面18区10点、「鴎」は1面94区69点となった。包摂範囲内での区別方法がないのは同様だが、事実上、異体字が文字コードのレベルで分割されたことになる。
つまり、JIS X 0208とJIS X 0213では18区10点という符号の指す範囲が異なっているため、JIS X 0208の文字範囲もJIS X 0213として収載されることになった。 JIS X 0213:2004 JIS X 0213:2004は、JIS X 0213の最初の改訂版である。JIS X 0213:2000との違いは次の通り。