Unicode 1.1
読み:ユニコード-いってんいち
外語:Unicode 1.1
Unicode
の版の一つで、初版
Unicode 1.0
に対する改訂版である。
目次
概要
沿革
特徴
対応言語
追加文字
削除された字
仕様変更
統廃合
符号位置変更
変更された字
チベット語
仝と〓
概要
Unicode 1.1は、Unicode 1.0.1に文字の追加や、一部
仕様変更
を加えた版である。
チベット文字の一旦削除など、大きな仕様変更も存在する。
Unicodeの普及が始まった最古の版である。
沿革
1993(平成5)年6月: Unicode 1.1.0
1995(平成7)年7月: Unicode 1.1.5
特徴
対応言語
U+1E00〜1EFFに定義される「ラテン文字 追加拡張」の多くがUnicode 1.1から追加された。ケルト語派などに使われる
ISO-8859-14
の文字の一部が、この拡張に含まれている。
追加された文字から推定される新規対応
言語
は、以下の通りである。
ケルト語派
スコットランド・ゲール語[gla、gd]
ウェールズ語[wel、cym、cy]
ベトナム語[vie、vi]
このほか、拡張アルファベットを使う様々な言語に新規対応したものと思われる。
追加文字
1.1から追加された文字は、次の通り(文字コード順)。
ラテン文字
U+017F〜U+017F
U+01F1〜U+01F5
U+01FA〜U+01FF
U+0200〜U+0217
U+1E00〜U+1E9A
U+1EA0〜U+1EF9
U+FB00〜U+FB06 ‐ LATIN SMALL LIGATURE
結合文字
U+0342〜U+0345 ‐ COMBINING GREEK
U+0360〜U+0361
ギリシャ文字
U+0374〜U+0375
U+037A〜U+037A
U+037E〜U+037E
U+0387〜U+0387
U+03F3〜U+03F3
U+1F00〜U+1F15
U+1F18〜U+1F1D
U+1F20〜U+1F45
U+1F48〜U+1F4D
U+1F50〜U+1F57
U+1F59〜U+1F59
U+1F5B〜U+1F5B
U+1F5D〜U+1F5D
U+1F5F〜U+1F7D
U+1F80〜U+1FB4
U+1FB6〜U+1FC4
U+1FC6〜U+1FD3
U+1FD6〜U+1FDB
U+1FDD〜U+1FEF
U+1FF2〜U+1FF4
U+1FF6〜U+1FFE
キリル文字
U+04D0〜U+04EB
U+04EE〜U+04F5
U+04F8〜U+04F9
アルメニア文字
U+0587 ‐ ARMENIAN SMALL LIGATURE ECH YIWN
U+FB13〜U+FB17 ‐ ARMENIAN SMALL LIGATURE
アラビア文字
U+066D〜U+066D
U+06D6〜U+06ED
U+FB50〜U+FBB1
U+FBD3〜U+FBFF
U+FC00〜U+FD3F
U+FC50〜U+FD8F
U+FC92〜U+FDC7
U+FDF0〜U+FDFB
グルムキー文字
U+0A4D ‐ GURMUKHI SIGN VIRAMA
グジャラーティー文字
U+0A8D ‐ GUJARATI VOWEL CANDRA E
U+0A91 ‐ GUJARATI VOWEL CANDRA O
U+0AC9 ‐ GUJARATI VOWEL SIGN CANDRA O
オリヤー文字
U+0B56 ‐ ORIYA AI LENGTH MARK
ハングル
字母
U+1100〜U+1159
U+115F〜U+11A2
U+11A8〜U+11F9
合成済みハングル
U+3D2E〜U+44B7 ‐ Hangul Supplementry-A
U+44B8〜U+4DFF ‐ Hangul Supplementry-B
記号
U+203F ‐ UNDERTIE
U+2045〜U+2046
U+206A〜U+206F
U+2300 ‐ DIAMETER SIGN
U+232D〜U+237A
U+25EF ‐ LARGE CIRCLE
U+3037 ‐ IDEOGRAPHIC TELEGRAPH LINE FEED SEPARATOR SYMBOL
U+30F7〜U+30FA
U+32C0〜U+32CB
U+3358〜U+3376
U+33E0〜U+33FE
U+FE20〜U+FE23
U+FFE8〜U+FFEE
ヘブライ文字
U+FB1E〜U+FB36
U+FB38〜U+FB3C
U+FB3E〜U+FB3E
U+FB40〜U+FB41
U+FB43〜U+FB44
U+FB46〜U+FB4F
削除された字
Unicode 1.0.0にあり、Unicode 1.1で削除された文字は、次の通りである(判明分のみ)。
削除された符号位置に、別の文字が割り当てられているものもある。
「移動」や、「統廃合」の対象となったものは除く(詳細後述)。
U+03DB GREEK SMALL LETTER STIGMA
U+03DD GREEK SMALL LETTER DIGAMMA
U+03DF GREEK SMALL LETTER KOPPA
U+03E1 GREEK SMALL LETTER SAMPI
U+0E70 THAI PHONETIC ORDER VOWEL SIGN SARA E
U+0E71 THAI PHONETIC ORDER VOWEL SIGN SARA AE
U+0E72 THAI PHONETIC ORDER VOWEL SIGN SARA O
U+0E73 THAI PHONETIC ORDER VOWEL SIGN SARA MAI MUAN
U+0E74 THAI PHONETIC ORDER VOWEL SIGN SARA MAI MALAI
U+0EF0 LAO PHONETIC ORDER VOWEL SIGN E
U+0EF1 LAO PHONETIC ORDER VOWEL SIGN EI
U+0EF2 LAO PHONETIC ORDER VOWEL SIGN O
U+0EF3 LAO PHONETIC ORDER VOWEL SIGN AY
U+0EF4 LAO PHONETIC ORDER VOWEL SIGN AI
U+1000〜U+104C TIBETAN
U+2300 APL COMPOSE OPERATOR
U+2301 APL OUT
U+2300とU+2301は、Unicode 1.0.1の段階で既に削除されていた。
GREEK SMALL LETTER 4種(U+03DB、U+03DD、U+03DF、U+03E1)は、
Unicode 3.0
から同じ符号位置で復活した。
TIBETANは符号位置を変更して
Unicode 2.0
で改めて登録されている。
仕様変更
先のUnicode 1.0はUnicodeの中では特殊な版であり、1.1以降と比較して、様々な仕様差が存在する。
統廃合
Unicode 1.0.0にあり、Unicode 1.1から重複等を理由として統合された文字は、次の通りである。
矢印の左側がUnicode 1.0の番号、右がUnicode 1.1の番号だが、右の文字はUnicode 1.0にも存在する。つまり、右の文字番号に統廃合されたことになる。文字の名前は、Unicode 1.0での名称である。
U+0371→U+0314 GREEK NON-SPACING DASIA PNEUMATA
U+0372→U+0313 GREEK NON-SPACING PSILI PNEUMATA
U+0384→U+030D GREEK NON-SPACING TONOS
U+04C5→U+049A CYRILLIC CAPITAL LETTER KA OGONEK
U+04C6→U+049B CYRILLIC SMALL LETTER KA OGONEK
U+04C9→U+04B2 CYRILLIC CAPITAL LETTER KHA OGONEK
U+04CA→U+04B3 CYRILLIC SMALL LETTER KHA OGONEK
U+3004→U+4EDD IDEOGRAPHIC DITTO MARK
Unicode 1.0→1.1以降のコンバーターを作る場合は、片方向変換をすることになる。
符号位置変更
以下の文字は、Unicode 1.1以降で符号位置が変更になる。
U+0370→U+0345 GREEK NON-SPACING IOTA BELOW
U+0385→U+0344 GREEK NON-SPACING DIAERESIS TONOS
U+03D7→U+037E GREEK QUESTION MARK
U+03D8→U+0374 GREEK UPPER NUMERAL SIGN
U+03D9→U+0375 GREEK LOWER NUMERAL SIGN
U+03F3→U+0384 GREEK SPACING TONOS
U+03F4→U+0385 GREEK SPACING DIAERESIS TONOS
U+03F5→U+037A GREEK SPACING IOTA BELOW
U+05F5→U+FB1E HEBREW POINT VARIKA
U+32FF→U+3004 JAPANESE INDUSTRIAL STANDARD SYMBOL
変更された字
以下は、Unicode 1.1で同位置ながら文字機能が変更されていると見られる文字である(判明分のみ)。
「NON-SPACING」(文字送りをしない)とされていたものが「COMBINING」(結合)となったのが、
仕様変更
の柱である。両者を「同一の文字」と見なせるのかどうかは、議論の対象であろう。
U+0300 NON-SPACING GRAVE → COMBINING GRAVE ACCENT
U+0301 NON-SPACING ACUTE → COMBINING ACUTE ACCENT
U+0302 NON-SPACING CIRCUMFLEX → COMBINING CIRCUMFLEX ACCENT
U+0303 NON-SPACING TILDE → COMBINING TILDE
U+0304 NON-SPACING MACRON → COMBINING MACRON
U+0305 NON-SPACING OVERSCORE → COMBINING OVERSCORE
U+0306 NON-SPACING BREVE → COMBINING BREVE
U+0307 NON-SPACING DOT ABOVE → COMBINING DOT ABOVE
U+0308 NON-SPACING DIAERESIS → COMBINING DIAERESIS
U+0309 NON-SPACING HOOK ABOVE → COMBINING HOOK ABOVE
U+030A NON-SPACING RING ABOVE → COMBINING RING ABOVE
U+030B NON-SPACING DOUBLE ACUTE → COMBINING DOUBLE ACUTE ACCENT
U+030C NON-SPACING HACEK → COMBINING CARON
U+030D NON-SPACING VERTICAL LINE ABOVE → COMBINING VERTICAL LINE ABOVE
U+030E NON-SPACING DOUBLE VERTICAL LINE ABOVE → COMBINING DOUBLE VERTICAL LINE ABOVE
U+030F NON-SPACING DOUBLE GRAVE → COMBINING DOUBLE GRAVE ACCENT
U+0310 NON-SPACING CANDRABINDU → COMBINING CANDRABINDU
U+0311 NON-SPACING INVERTED BREVE → COMBINING INVERTED BREVE
U+0312 NON-SPACING TURNED COMMA ABOVE → COMBINING TURNED COMMA ABOVE
U+0313 NON-SPACING COMMA ABOVE → COMBINING COMMA ABOVE
U+0314 NON-SPACING REVERSED COMMA ABOVE → COMBINING REVERSED COMMA ABOVE
U+0315 NON-SPACING COMMA ABOVE RIGHT → COMBINING COMMA ABOVE RIGHT
U+0316 NON-SPACING GRAVE BELOW → COMBINING GRAVE ACCENT BELOW
U+0317 NON-SPACING ACUTE BELOW → COMBINING ACUTE ACCENT BELOW
U+0318 NON-SPACING LEFT TACK BELOW → COMBINING LEFT TACK BELOW
U+0319 NON-SPACING RIGHT TACK BELOW → COMBINING RIGHT TACK BELOW
U+031A NON-SPACING LEFT ANGLE ABOVE → COMBINING LEFT ANGLE ABOVE
U+031B NON-SPACING HORN → COMBINING HORN
U+031C NON-SPACING LEFT HALF RING BELOW → COMBINING LEFT HALF RING BELOW
U+031D NON-SPACING UP TACK BELOW → COMBINING UP TACK BELOW
U+031E NON-SPACING DOWN TACK BELOW → COMBINING DOWN TACK BELOW
U+031F NON-SPACING PLUS SIGN BELOW → COMBINING PLUS SIGN BELOW
U+0320 NON-SPACING MINUS SIGN BELOW → COMBINING MINUS SIGN BELOW
U+0321 NON-SPACING PALATALIZED HOOK BELOW → COMBINING PALATALIZED HOOK BELOW
U+0322 NON-SPACING RETROFLEX HOOK BELOW → COMBINING RETROFLEX HOOK BELOW
U+0323 NON-SPACING DOT BELOW → COMBINING DOT BELOW
U+0324 NON-SPACING DOUBLE DOT BELOW → COMBINING DOUBLE DOT BELOW
U+0325 NON-SPACING RING BELOW → COMBINING RING BELOW
U+0326 NON-SPACING COMMA BELOW → COMBINING COMMA BELOW
U+0327 NON-SPACING CEDILLA → COMBINING CEDILLA
U+0328 NON-SPACING OGONEK → COMBINING OGONEK
U+0329 NON-SPACING VERTICAL LINE BELOW → COMBINING VERTICAL LINE BELOW
U+032A NON-SPACING BRIDGE BELOW → COMBINING BRIDGE BELOW
U+032B NON-SPACING INVERTED DOUBLE ARCH BELOW → COMBINING INVERTED DOUBLE ARCH BELOW
U+032C NON-SPACING HACEK BELOW → COMBINING CARON BELOW
U+032D NON-SPACING CIRCUMFLEX BELOW → COMBINING CIRCUMFLEX BELOW
U+032E NON-SPACING BREVE BELOW → COMBINING BREVE BELOW
U+032F NON-SPACING INVERTED BREVE BELOW → COMBINING INVERTED BREVE BELOW
U+0330 NON-SPACING TILDE BELOW → COMBINING TILDE BELOW
U+0331 NON-SPACING MACRON BELOW → COMBINING MACRON BELOW
U+0332 NON-SPACING UNDERSCORE → COMBINING LOW LINE
U+0333 NON-SPACING DOUBLE UNDERSCORE → COMBINING DOUBLE LOW LINE
U+0334 NON-SPACING TILDE OVERLAY → COMBINING TILDE OVERLAY
U+0335 NON-SPACING SHORT BAR OVERLAY → COMBINING SHORT STROKE OVERLAY
U+0336 NON-SPACING LONG BAR OVERLAY → COMBINING LONG STROKE OVERLAY
U+0337 NON-SPACING SHORT SLASH OVERLAY → COMBINING SHORT SOLIDUS OVERLAY
U+0338 NON-SPACING LONG SLASH OVERLAY → COMBINING LONG SOLIDUS OVERLAY
U+0339 NON-SPACING RIGHT HALF RING BELOW → COMBINING RIGHT HALF RING BELOW
U+033A NON-SPACING INVERTED BRIDGE BELOW → COMBINING INVERTED BRIDGE BELOW
U+033B NON-SPACING SQUARE BELOW → COMBINING SQUARE BELOW
U+033C NON-SPACING SEAGULL BELOW → COMBINING SEAGULL BELOW
U+033D NON-SPACING X ABOVE → COMBINING X ABOVE
U+033E NON-SPACING VERTICAL TILDE → COMBINING VERTICAL TILDE
U+033F NON-SPACING DOUBLE OVERSCORE → COMBINING DOUBLE OVERLINE
U+0340 NON-SPACING GRAVE TONE MARK → COMBINING GRAVE TONE MARK
U+0341 NON-SPACING ACUTE TONE MARK → COMBINING ACUTE TONE MARK
U+0384 GREEK NON-SPACING TONOS → GREEK TONOS
U+0385 GREEK NON-SPACING DIAERESIS TONOS → GREEK DIALYTIKA TONOS
U+0483;CYRILLIC NON-SPACING TITLO → COMBINING CYRILLIC TITLO
U+0484;CYRILLIC NON-SPACING PALATALIZATION → COMBINING CYRILLIC PALATALIZATION
U+0485;CYRILLIC NON-SPACING DASIA PNEUMATA → COMBINING CYRILLIC DASIA PNEUMATA
U+0486;CYRILLIC NON-SPACING PSILI PNEUMATA → COMBINING CYRILLIC PSILI PNEUMATA
U+20D0 NON-SPACING LEFT HARPOON ABOVE → COMBINING LEFT HARPOON ABOVE
U+20D1 NON-SPACING RIGHT HARPOON ABOVE → COMBINING RIGHT HARPOON ABOVE
U+20D2 NON-SPACING LONG VERTICAL BAR OVERLAY → COMBINING LONG VERTICAL LINE OVERLAY
U+20D3 NON-SPACING SHORT VERTICAL BAR OVERLAY → COMBINING SHORT VERTICAL LINE OVERLAY
U+20D4 NON-SPACING ANTICLOCKWISE ARROW ABOVE → COMBINING ANTICLOCKWISE ARROW ABOVE
U+20D5 NON-SPACING CLOCKWISE ARROW ABOVE → COMBINING CLOCKWISE ARROW ABOVE
U+20D6 NON-SPACING LEFT ARROW ABOVE → COMBINING LEFT ARROW ABOVE
U+20D7 NON-SPACING RIGHT ARROW ABOVE → COMBINING RIGHT ARROW ABOVE
U+20D8 NON-SPACING RING OVERLAY → COMBINING RING OVERLAY
U+20D9 NON-SPACING CLOCKWISE RING OVERLAY → COMBINING CLOCKWISE RING OVERLAY
U+20DA NON-SPACING ANTICLOCKWISE RING OVERLAY → COMBINING ANTICLOCKWISE RING OVERLAY
U+20DB NON-SPACING THREE DOTS ABOVE → COMBINING THREE DOTS ABOVE
U+20DC NON-SPACING FOUR DOTS ABOVE → COMBINING FOUR DOTS ABOVE
U+20DD ENCLOSING CIRCLE → COMBINING ENCLOSING CIRCLE
U+20DE ENCLOSING SQUARE → COMBINING ENCLOSING SQUARE
U+20DF ENCLOSING DIAMOND → COMBINING ENCLOSING DIAMOND
U+20E0 ENCLOSING CIRCLE SLASH → COMBINING ENCLOSING CIRCLE BACKSLASH
U+20E1 NON-SPACING LEFT RIGHT ARROW ABOVE → COMBINING LEFT RIGHT ARROW ABOVE
U+3099 NON-SPACING KATAKANA-HIRAGANA VOICED SOUND MARK → COMBINING KATAKANA-HIRAGANA VOICED SOUND MARK
U+309A NON-SPACING KATAKANA-HIRAGANA SEMI-VOICED SOUND MARK → COMBINING KATAKANA-HIRAGANA SEMI-VOICED SOUND MARK
チベット語
Unicode 1.0.1までは、U+1000〜U+104Cにチベット文字が存在した(途中、空きあり)。
Unicode 1.1では文字が全て削除された。
チベット文字は、
Unicode 2.0
から符号位置をU+0F00〜U+0FFFに変えて、再び定義されている(配置、文字数などは異なる)。
仝と〓
Unicode 1.0.1までは「仝」という字が二つあった。
U+3004の記号「IDEOGRAPHIC DITTO MARK」と、U+4EDDのCJK統合漢字の双方に存在した。
但し同形というだけで、Unicode consortiumとしては別の文字として扱っていたようである。1.1では、記号側のU+3004は削除され、U+4EDDが残された。
そして記号の仝の跡地U+3004には、元々U+32FFに存在していた旧JISマーク「〓」(JAPANESE INDUSTRIAL STANDARD SYMBOL)が移動となっている。
再検索