外字
読み:がいじ
外語:external characters
特定の
文字集合
(
CCS
)に含まれていない文字のこと。
目次
概要
システム外字
ユーザー定義外字
特徴
JIS X 0208
JIS X 0213
JIS X 0221(Unicode)
概要
システム外字
JIS X 0208
や旧JIS C 6226は、文字のない未定義領域が存在する。
PC-9800シリーズ
などは、この空き部分に独自の文字を設定しており、
98文字
と呼ばれた。このようにシステムが最初から用意する外字は、「
システム外字
」または「ベンダ定義外字」や「ベンダー定義文字」と呼ばれる。
またWindowsといった機種を問わないOSが登場する以前は、こういった文字を「
機種依存文字
」と呼んだ。
ユーザー定義外字
ワープロソフトなどでは利用者が独自の文字を作り利用可能な製品が多く、
Microsoft Windows
でも古くから「外字エディター」という
ソフトウェア
が提供され、システムとして外字機能を提供している。
このような外字を、
ユーザー定義外字
という。
特徴
JIS X 0208
JIS X 0208
や旧JIS C 6226の未定義領域は様々に拡張された。
JIS C 6226は、8区〜15区が未使用だったため、ここに独自の文字を追加したシステムが多かった。
中でも特に有名なのが、PC-9800シリーズが13区に追加した
NEC特殊文字
である。
日本語
の符号化方法で一般化した
シフトJIS
では、95区〜120区(0xF040〜0xFCFC)がよく外字領域として使われ、Microsoft Windowsの外字は95区〜114区(0xF040〜0xF9FC)に計1880字分を確保している。
JIS X 0213
JIS X 0208の拡張として作られた
JIS X 0213:2000
では、シフトJISの一種として「
Shift_JISX0213
」というものが作られた。
改訂版の
JIS X 0213:2004
でも、同様に「
Shift_JIS-2004
」が定義されている。
このシフトJISには複数の実装水準があり、
第3水準
の文字までしか含まない「実装水準3」の場合は、
第4水準
の領域と重複する従来の外字領域を外字領域として使用可能、とした。
JIS X 0221(Unicode)
Unicode
(JIS X 0221)は
ISO/IEC 10646
の部分集合で、次の領域をユーザー定義外字領域としている。
BMP領域 U+E000‐U+F8FF (6,400字)
15面 U+F0000‐U+FFFFD (65,534字)
16面 U+100000‐U+10FFFD (65,534字)
合計137,468字が利用可能となっている。
日本語Windowsで使うシフトJISの0xF040〜0xF9FCは、U+E000〜U+E757に割り当てられている。
再検索