Unicode 4.0.0
読み:ユニコード-よんてんゼロてんゼロ
外語:Unicode 4.0.0
Unicode
の版の一つで、
Unicode 3.2.0
に対する改訂版であり、
Unicode 4.0
の一つ。
目次
概要
沿革
特徴
対応ISO/IEC 10646
対応言語
新規対応
追加文字
概要
補助多言語面
(SMP)を中心に歴史的な文字が多数追加された他、
異体字セレクター
の拡張となる17〜256が追加された。
この仕様書の本
The Unicode Standard, Version 4.0
の説明によれば、96,248文字が収録されているとする。
沿革
2003(平成15)年4月17日: Unicode 4.0.0
2004(平成16)年3月30日:
Unicode 4.0.1
特徴
対応ISO/IEC 10646
ISO/IEC 10646:2003に対応した。
ISOのこの版から、枝番-1と-2が無くなり両者統合され、ISO/IEC 10646として非漢字・漢字問わず全てを規定する文字集合の仕様となった。
対応言語
追加された文字から推定される新規対応
言語
は、以下の通りである。併記はISO 639-1、ISO 639-2またはISO 639-3の言語コード。
リンブ文字
リンブ語 [lif]
線文字B
ミケーネギリシャ語 [gmy]
ウガリット楔形文字
ウガリット語 [uga]
フルリ語 [xhu]
オスマン文字
ソマリ語 [som、so] (現在はラテンアルファベットを使う)
キプロス音節文字
古代ギリシャ語(Arcado-Cypriot)
鉄器時代の古代ギリシャ語(Eteocypriot) (※但し一説による)
新規対応
この版で、次に新規対応した。
U+1900〜U+197F リンブ文字 (LIMBU)
U+19E0〜U+19FF クメール記号 (KHMER)
U+1D00〜U+1D6B 表音拡張 (PHONETIC EXTENSIONS)
U+4DC0〜U+4DFF 易経記号 (Yijing Hexagram Symbols)
U+10000〜U+100FF 線文字B (LINEAR B)
U+10100〜U+1013F エーゲ数字 (Aegean Numbers)
U+10380〜U+1039F ウガリット楔形文字 (Ugaritic)
U+1D300〜U+1D35F 太玄経記号 (Tai Xuan Jing Symbols)
U+10450〜U+1047F シェイヴィアン文字 (SHAVIAN)
U+10480〜U+104FF オスマン文字 (Osmanya)
U+10800〜U+1083F キプロス音節文字 (Cypriot Syllabary)
U+E0100〜U+E01EF 異体字セレクター (Variation Selectors)
追加文字
4.0から追加された文字は、次の通り(文字コード順)。
ラテン文字 拡張-B
U+0221
U+0234〜U+0236
IPA 発音記号
U+02AE〜U+02AF
前進を伴う修飾文字
U+02EF〜U+02FF
ダイアクリティカルマーク(合成可能)
U+0350〜U+0357
U+035D〜U+035F
ギリシャ文字・コプト文字
U+03F7〜U+03FB
アラビア文字
U+0600〜U+0603
U+060D〜U+0615
U+0656〜U+0658
U+06EE〜U+06EF
U+06FF
シリア文字
U+072D〜U+072F
U+074D〜U+074F
デヴァナガリ文字
U+0904
ベンガル文字
U+09BD〜U+09BD
グルムキー文字
U+0A01
U+0A03
グジャラーティー文字
U+0A8C
U+0AE1〜U+0AE3
オリヤー文字
U+0B35
U+0B71
タミル文字
U+0BF3〜U+0BFA
カンナダ文字
U+0CBC〜U+0CBD
クメール文字
U+17DD
一般句読点
U+2053〜U+2054
文字風記号
U+213B
各種技術用記号
U+23CF〜U+23D0
囲み英数字
U+24FF
各種記号
U+2614〜U+2615
U+268A〜U+2691
U+26A0〜U+26A1
各種記号と矢印
U+2B00〜U+2B0D
囲みCJK文字・月
U+321D〜U+321E
U+3250
U+327C〜U+327D
U+32CC〜U+32CF
CJK互換文字
U+3377〜U+337A
U+33DE〜U+33DF
U+33FF
アラビア文字 表示形A
U+FDFD
CJK互換形
U+FE47〜U+FE48
デセレット文字
U+10426〜U+10427
U+1044E〜U+1044F
数学 英数記号
U+1D4C1
再検索