JIS X 0208:1997
読み:ジスエックスゼロにーゼロはち-いちきゅうきゅうなな
外語:JIS X 0208:1997

 JIS X 0208の1997(平成9)年版。JIS X 0208:1997 7ビット及び8ビットの2バイト情報交換用符号化漢字集合。
目次

仕様

概要
 JIS C 6226-1978に対して行なわれた三回目の改定版で、JIS X 0208-1990の改訂版。これが現行規格である。第四次規格と呼ばれる。
 文字の追加や入れ替えなどは行なわれていないが、規格上で曖昧だった部分を明確化した。
 第1水準漢字2,965文字、第2水準漢字3,390文字、非漢字524字で、合計6,879文字が収められている。

沿革

他のISO登録状況
 JIS X 0208:1997としては登録されていないが、改定前のJIS X 0208-1990と文字集合自体は変更がないため、これが準用されている。
 JIS X 0208-1990は、ISO-IR 168として登録されている。
 ISO-IR 168のISO/IEC 2022におけるエスケープシーケンスは次のとおり。

特徴

JIS X 0208-1990との差異
 文字集合自体には手が加えられておらず、文字の追加や移動、例示字体の変更等はない。このため、第三次規格(JIS X 0208-1990)と完全な互換性がある。
 この版では、従来曖昧だった部分を明確化することに重点が置かれ、規格票は刷新された。

符号化方法
 第三次規格までは、符号化方法は原則としてJIS X 0202(ISO/IEC 2022)を前提としていた。いわゆる区点コードと呼ばれたものである。
 実質的に、区点コードを元とした「JISコード」が使われる想定であったが、規格票ではその点が明記されて来なかった。
 この版からは、こういった符号化についても明確化した。具体的には「RFC 1468符号化表現」および「シフト符号化表現」と記されている。
 表現方法を鑑みるに、前者はいわゆるISO-2022-JPであり、電子メール等、インターネットでは広く用いられている。後者はいわゆるシフトJISである。

文字の典拠調査
 JIS漢字表には、康熙字典や諸橋大漢和辞典にも見られない不思議な字が収載されていることが問題となっていた。
 例えば、「」や「」などに代表される、出所が不明な謎の文字があり、これらは「幽霊文字」とも俗称されていた。
 そこで、この漢字表の初版(第一次規格)がどのような経緯で文字を採録したのかが調査された。

包摂基準の明確化
 字体の包摂基準を明確化した。
 包摂基準とは、各区点位置に、どれほどの字体の揺れ・差異が認められるか、という基準である。
 JIS漢字の規格票に印刷されている字はあくまでも「例示字体」であって、この通りである必要はない。包摂の範囲内であれば、どのような字体であっても良いとしている。

空き領域の扱い
 これまでは、空き領域については殆ど制限がなく、各実装は必要に応じて文字を割り当てて使うことがあった。いわゆる機種依存文字と呼ばれるものである。
 この版からは、この空き領域は原則として使用不可とされた。これは、後に作られるJIS X 0213のためのものと考えられる。

規格の将来

後継
 JIS X 0208は、1997年版が最新であり、既に長く更新されていない。規格の後継としてJIS X 0213が制定されたためである。JIS X 0213は、JIS X 0208の容量制限を改良、大幅に容量を増やすことに成功した規格である。
 期待されたJIS X 0213だが制定後長く普及せず、Windows Vista登場から徐々に普及が始まった。今後は、JIS X 0208は徐々にJIS X 0213に置き換えられてゆくと考えられている。

後継の互換性
 JIS X 0213は、JIS X 0208の全ての文字を含む、完全な上位互換の文字集合である。但しこれには異論があり、文字集合としては上位互換であるが、規格自体は上位互換ではないとする。
 この最大の理由は包摂基準に差があるためである。JIS X 0208では包摂され一つの区点位置が与えられていた複数の字体に、JIS X 0213は別個の区点位置を与えた。このため、JIS X 0208で符号化された文書は、単純にはJIS X 0213の符号に変換できない。

携帯端末
 但し、全ての機器でJIS X 0213にすぐ移行できるかというと、必ずしも容易なことではない。
 例えば携帯電話のような小型端末では対応が鈍く、いつ頃からJIS X 0213に移行するかは明確でない。
 なぜなら、携帯電話などではJIS X 0208の空き領域に「絵文字」などを割り当てて使っているためである。JIS X 0213の文字と衝突してしまうため文字の削除や符号位置の移動が必要になるが、互換性は確実に損なわれる。

符号
 この文字集合(CCS)を用いた代表的な符号化方法(CES)は、次の通りである。
 但し、ISO/IEC 2022系に関しては規格上、ESC 2/6 4/0などのエスケープシーケンスについて明記していないため、正確には対応しているとは言えないとする論もある。

再検索