コードページ
読み:コードページ
外語:CP: Code Page
文字集合
(CCS)を表わす番号、あるいはその番号で表わされる文字集合(CCS)のこと。
目次
概要
特徴
Microsoftのコードページ
種類
1バイト符号
マルチバイト符号
概要
世界各国で、必要となる文字が異なる。使われる
言語
が異なるからである。
電子計算機の性能が低い頃は、全世界の文字を一つで扱うことはできず、性能の範囲内で必要となる文字を集め、それを文字集合として用いた。
この識別のため、文字集合には番号が付けられ管理され、これをコードページという。
但しコードページは公的な規格ではなく、各社が独自に管理するものである。IBMやMicrosoftが、それぞれ自社システム用に管理している。基本的に両者は一致することが多いが、そうでないものもある。
特徴
Microsoftのコードページ
種類
MS-DOS
や
Microsoft Windows
で使われているものである。
次のように分類されているようである。
SBCS
(シングルバイト文字集合)
DBCS
(ダブルバイト文字集合)
OEMコードページ
Windows OEMコードページ
Windows ANSI & OEMコードページ
ISOコードページ
但し、複数のグループで重複もある。
日本では、
日本語
の
シフトJIS
を表わす
Microsoft Windows Codepage : 932
が代表的であるが、この932は「DBCS」と「Windows ANSI & OEMコードページ」の双方に分類されている。
なお、番号の大小と歴史的な新旧はあまり関係がない。
1バイト符号
437 (US)
720 (Arabic)
737 (Greek)
775 (Baltic)
850 (Multilingual Latin I)
852 (Latin II)
855 (Cyrillic)
857 (Turkish)
858 (Multilingual Latin I + Euro)
862 (Hebrew)
866 (Russian)
874 (Thai)
1250 (Central Europe)
1251 (Cyrillic)
1252 (Latin I)
1253 (Greek)
1254 (Turkish)
1255 (Hebrew)
1256 (Arabic)
1257 (Baltic)
1258 (Vietnam)
28951 (ISO-8859-1、Windows 28591)
28592 (ISO-8859-2、Windows 28592)
28593 (ISO-8859-3、Windows 28593)
28594 (ISO-8859-4、Windows 28594、Baltic)
28595 (ISO-8859-5、Windows 28595、Cyrillic)
28596 (ISO-8859-6、Windows 28596、Arabic)
28598 (ISO-8859-8、Windows 28598、Hebrew)
28599 (ISO-8859-9、Windows 28599、Turkish)
28605 (ISO-8859-15、Windows 28605、Latin 9)
マルチバイト符号
日本語
932
(
Shift_JIS
)
50220
(ISO-2022-JPの亜種)
50221
(ISO-2022-JPの亜種)
50222
(ISO-2022-JPの亜種)
51932
(EUC-JPの亜種)
支那語
936 (Simplified Chinese GBK)
950 (Traditional Chinese Big5)
朝鮮語
949 (Korean)
再検索