ISO/IEC 10646 - 通信用語の基礎知識

1993(平成5)年5月1日: ISO/IEC 10646-1制定 (ISO/IEC 10646-1:1993)
1996(平成8)年7月: Unicode 2.0
1996(平成8)年10月15日: ISO/IEC 10646-1:1993/Amd.1:1996 (Transformation Format for 16 planes of group 00 (UTF-16))
1996(平成8)年10月15日: ISO/IEC 10646-1:1993/Amd.2:1996 (UCS Transformation Format 8 (UTF-8))
1996(平成8)年10月15日: ISO/IEC 10646-1:1993/Amd.3:1996 (Code positions for control characters)
1996(平成8)年10月15日: ISO/IEC 10646-1:1993/Amd.4:1996 (Removal of annex G (UTF-1))
1997(平成9)年11月15日: ISO/IEC 10646-1:1993/Amd.6:1997 (Tibetan)
1997(平成9)年11月15日: ISO/IEC 10646-1:1993/Amd.7:1997 (33 additional characters)
1997(平成9)年12月15日: ISO/IEC 10646-1:1993/Amd.8:1997 (New annex on CJK Ideographs)
1997(平成9)年12月15日: ISO/IEC 10646-1:1993/Amd.9:1997 (Identifiers for characters)
1998(平成10)年1月: UTF-8の初案RFC、RFC 2279発行
1998(平成10)年2月18日: Unicode 2.1
1998(平成10)年5月15日: ISO/IEC 10646-1:1993/Amd.5:1998 (Hangul syllables)
1998(平成10)年7月15日: ISO/IEC 10646-1:1993/Cor.2:1998
1998(平成10)年7月15日: ISO/IEC 10646-1:1993/Amd.11:1998 (Unified Canadian Aboriginal Syllabics)
1998(平成10)年9月1日: ISO/IEC 10646-1:1993/Amd.12:1998 (Cherokee)
1998(平成10)年10月1日: ISO/IEC 10646-1:1993/Amd.10:1998 (Ethiopic script)
1998(平成10)年10月15日: ISO/IEC 10646-1:1993/Amd.13:1998 (CJK unified ideographs with supplementary sources)
1998(平成10)年11月1日: ISO/IEC 10646-1:1993/Amd.16:1998 (Braille patterns)
1998(平成10)年11月1日: ISO/IEC 10646-1:1993/Amd.19:1998 (Runic)
1998(平成10)年11月1日: ISO/IEC 10646-1:1993/Amd.20:1998 (Ogham)
1999(平成11)年5月15日: ISO/IEC 10646-1:1993/Amd.23:1998 (Bopomofo and various other characters)
1999(平成11)年6月1日: ISO/IEC 10646-1:1993/Amd.21:1998 (Sinhala)
1999(平成11)年7月15日: ISO/IEC 10646-1:1993/Amd.17:1999 (CJK Unified Ideograph Extension)
1999(平成11)年7月15日: ISO/IEC 10646-1:1993/Amd.18:1999 (Symbols and Others)
1999(平成11)年9月21日: ※ISO/IEC 10646-1:1993/Cor.3:1999 (Architecture and Basic Multilingual Plane)
1999(平成11)年: ※ISO/IEC 10646-1:1993/Amd.14:1999 (Yi syllables and Yi radicals)
1999(平成11)年9月21日: ※ISO/IEC 10646-1:1993/Amd.15:1999 (Kang Xi radicals and CJK radicals supplement)
1999(平成11)年: ※ISO/IEC 10646-1:1993/Amd.22:1999 (Keyboard symbols)
1999(平成11)年: ※ISO/IEC 10646-1:1993/Amd.24:1999 (Thaana)
1999(平成11)年: ※ISO/IEC 10646-1:1993/Amd.25:1999 (Khmer)
1999(平成11)年: ※ISO/IEC 10646-1:1993/Amd.26:1999 (Myanmar)
1999(平成11)年: ※ISO/IEC 10646-1:1993/Amd.27:1999 (Syriac)
1999(平成11)年9月24日: ISO/IEC 10646-1:1993/Amd.28:1999 (Ideographic description characters)
1999(平成11)年: ※ISO/IEC 10646-1:1993/Amd.29:1999 (Mongolian)
1999(平成11)年4月6日: ※ISO/IEC 10646-1:1993/Amd.30:1999 (Additional Latin and other characters)
1999(平成11)年4月6日: ※ISO/IEC 10646-1:1993/Amd.31:1999 (Tibetan extension)
1999(平成11)年9月11日: Unicode 3.0
2000(平成12)年2月23日: UTF-16のRFC、RFC 2782発行

ISO/IEC 10646-1:2000時代

2000(平成12)年9月15日: ISO/IEC 10646-1改正 (ISO/IEC 10646-1:2000)
2001(平成13)年3月: Unicode 3.1
2001(平成13)年11月1日: ISO/IEC 10646-2制定 (ISO/IEC 10646-2:2001)
2002(平成14)年3月25日: Unicode 3.2.0
2002(平成14)年7月16日: ISO/IEC 10646-1:2000/Amd.1:2002 (Mathematical symbols and other characters)
2003(平成15)年4月17日: Unicode 4.0.0
2003(平成15)年11月: UTF-8の標準化RFC、RFC 3629発行

ISO/IEC 10646:2003時代

規格が融合されたISO/IEC 10646:2003を「1st Edition」という。

2003(平成15)年12月15日: ISO/IEC 10646:2003 (ISO/IEC 10646-1と2を統合)
2004(平成16)年3月30日: Unicode 4.0.1
2005(平成17)年3月31日: Unicode 4.1.0
2005(平成17)年11月15日: ISO/IEC 10646:2003/Amd.1:2005 (Unicode 4.1相当)
2006(平成18)年7月1日: ISO/IEC 10646:2003/Amd.2:2006 (Unicode 5.0相当)
2006(平成18)年7月14日: Unicode 5.0.0
2008(平成20)年2月15日: ISO/IEC 10646:2003/Amd.3:2008 (Unicode 5.1相当・甲)
2008(平成20)年4月4日: Unicode 5.1.0
2008(平成20)年7月1日: ISO/IEC 10646:2003/Amd.4:2008 (Unicode 5.1相当・乙)
2008(平成20)年12月1日: ISO/IEC 10646:2003/Amd.5:2008 (Unicode 5.2相当・甲)
2009(平成21)年10月13日: ISO/IEC 10646:2003/Amd.6:2009 (Unicode 5.2相当・乙)
2009(平成21)年10月1日: Unicode 5.2.0
2010(平成22)年7月15日: ISO/IEC 10646:2003/Amd.7:2010 (Unicode 6.0相当・甲)
2010(平成22)年10月11日: Unicode 6.0.0

ISO/IEC 10646:2011時代

ISO/IEC 10646-1:2011を規格融合後の「2nd Edition」という。

2011(平成23)年5月2日: ISO/IEC 10646:2011 (Unicode 6.0相当)

ISO/IEC 10646:2012時代

ISO/IEC 10646-1:2012を規格融合後の「3rd Edition」という。

2012(平成24)年5月21日: ISO/IEC 10646:2012 (Unicode 6.1/6.2相当)
2013(平成25)年4月9日: ISO/IEC 10646:2012/Amd.1:2013 (Unicode 7.0相当・甲)
?: ISO/IEC 10646:2012/Amd.2:2013 (Unicode 7.0相当・乙)

ISO/IEC 10646:2014時代

ISO/IEC 10646:2014を規格融合後の「4th Edition」という。

?: ISO/IEC 10646:2014

今後の予定

?: ISO/IEC 10646:2014/Amd.1
?: ISO/IEC 10646:2014/Amd.2

誕生までの経緯

前夜

1991(平成3)年に投票されたDIS 10646は、否決された。これは、同年に登場したUnicode 1.0の影響であり、似たような規格が乱立することを避けるためだった。

DIS 10646というのは、元々のISO/IEC 10646の思想に基づくものともいえる。

DIS 10646は4オクテットの符号系で、8ビットごとの上位から群、面、区、点と区切ったものである。各国の現役のコードは、そのまま(統合などせずに)収容され、従来のものとの互換性を最大限に配慮(?)しているのが特徴だった。

これは、現在のTRONコードと殆ど同じ思想である。

その一方、UnicodeはASCIIおよびISO/IEC 8859の拡張という形を取った2オクテット固定長の符号系である。ASCIIとISO/IEC 8859-1はそのまま、それ以降は全て新規割り当てで、漢字文字は(2オクテットに収めるために)統合する、というものであった。

両者は、根本から全く思想の異なるものだったのである。しかしDIS 10646はUnicodeより出遅れたため、完敗を喫することになった。

DIS 10646第二版

こうしてUnicode 1.0の後に登場したDIS 10646第二版は、群、面、区、点という概念自体はそのままだが、その内容は0群0面にUnicodeをそのまま飲み込みこれを基本多言語面(BMP)とする、他の群、面は未使用で予約、という、ものであった。

第二版と名は付いていたが、実質これはUnicode 1.0そのままであった。

こうして、第二版は無事に国際投票で可決され、ISO/IEC 10646-1となったのである。

基本的な構造

ビットの使い方

元々の設計では、32ビットのうち、上位の8ビットが群(group)、次の8ビットが面(plane)、次の8ビットが区(row)、下位の8ビットが点(cell)と表わされ、この8ビットずつのかたまりをオクテット(octet)と呼んだ。但し、実際には32ビット中の31ビットのみを利用し、最上位の1ビットは利用しない。つまり群のみ7ビットで表現された。