幽霊文字
読み:ゆうれいもじ

 JIS漢字表に含まれる、典拠不明の文字のこと。
目次

概要
 日本語の文字集合として作られたJIS C 6226-1978(後のJIS X 0208)は、当時の通産省(後の経産省)によって制定された規格である。
 多くの人の努力により、日本初の工業規格として漢字文字コード表を作ることに成功した。しかし、この規格がパーソナルコンピューター等に実装され、使われ始めると、漢和辞典にも載っていない正体不明の文字が少なからず存在することが明らかとなった。これを俗に「幽霊文字」と呼ぶようになった。

特徴

幽霊文字の数
 JIS漢字表では、規格中には文字の典拠が示されなかった。このため幽霊文字の扱いは学者によって様々であり、字数も不定だが、一説では60とも100ともされている。
 正体不明の文字の存在が明らかになった後、JIS C 6226-1978がどのようにして文字を収録したのかが調査された。その結果、地名として使われる字であったり、資料から書き写す際に誤字したものである等が明らかとなった。

幽霊文字の扱い
 誤字であると明確に分かっているものも含め、最新のJIS漢字表でも、字体の変更は行なわれていない。これは互換性等のためである。
 JISは日本の規格であるが、ここに含まれる文字がUnicodeにも含まれるため、字形を変更してしまうと問題が大きいため、とされている。

音義未詳字
 「JIS X 0208:1997附属書7(参考)区点位置詳説」などにおいて、字源についての調査結果が記されている。
 JISで、典拠不詳、同定不能、不明とした漢字は12字あるが、これで全てではない。他の文献では更に幾つかが音義未詳字であるとしている。

典拠不詳
 規格制定時の漢字表には発見されたが、そこから原典資料に遡ることができず、字書・用例等による文字同定が困難である文字。全9字。

典拠不明
 JIS附属書で「不明」とされた文字。全2字。

同定不能
 典拠、用例ともに発見できず、同定が全く出来ない文字。全1字。

その他の字
 JIS附属書でもその他として包括等が言及されているが、それ以外で、幽霊文字、音義未詳字として広く言及されていた文字の例。
 現在では、その多くが地名、人名などで使われていることが明らかとなっている。

再検索