GBK

読み:ジービーケイ
外語:GBK: GuoBiao Kuozhan 英語
品詞:名詞

簡体字支那語で使われている文字コードで、符号化方法(CES)の一つ。

目次

用途

従来の国家標準GB 2312は、EUC(ISO/IEC 2022)に準拠して符号化されており、EUC-CNと呼ばれていた。

その後、Unicode 1.1が登場すると、新たな国家標準として「GB 13000.1-93」が制定された。

そして、EUC-CNのコードレンジを拡張し、多くの漢字を格納可能な符号として作られたのが、GBK(GBのK=拡張)であった。但し、規格としては標準化されなかった。

しかしMicrosoft Windowsでコードページ936として採用されたため、広く普及することになった。

亜種

漢字文字のみでなく、全てのUnicode文字に対応するため、GBKは更に拡張された。

2000(平成12)年に発布されたGB 18030が、現在の主流である。

GBKは国家標準ではないが、GBKとほぼ完全な互換性があるGB 18030は国家標準である。

マッピング

元々はEUCで、その符号を拡張して作られている。1または2バイトの可変長で、GB 18030も含めると1、2、4バイトの可変長となる。

符号位置は、16進数で次の通りである。

  • 1バイト ‐ 00‐7f
  • 2バイト ‐ 81‐fe | 40‐7e、80‐fe
  • 4バイト ‐ 81‐fe | 30‐39 | 81‐fe | 30‐39

2バイトの場合、第1バイトは126個分、第2バイトは190個分あり、23,940文字分の空間が存在する。

4バイト(GB 18030)の場合、第1バイトと第3バイトは126個分、第2バイトと第4バイトは10個分あり、1,587,600文字分の空間が存在する。

具体的な文字コード範囲は、次の通りになる。

バイト数符号範囲符号位置数
1バイト00‐7f128
2バイト第1バイト第2バイト23,940
81‐fe40‐7e、80‐fe
4バイト第1バイト第2バイト第3バイト第4バイト1,587,600
81‐fe30‐3981‐fe30‐39

文字集合

EUCの範囲内がGB 2312の文字集合である。

GBKとして拡張された領域には、GB 2312には含まれていない、Unicode 1.1のCJK統合漢字に含まれる全ての漢字(20,902字)と、互換領域の全ての漢字が割り当てられており、EUC範囲内含め、全てで21,886字を収録している。

符号機能

GBKの領域は、従来のEUC-CN相当の空間も含め、GBK/1からGBK/5までと、外字領域に水準分けされて使われている。

名称第1バイト第2バイト収録文字種符号位置数収録文字数
GBK/1A1‐A9A1‐FE記号類846717
GBK/2B0‐F7A1‐FE漢字6,7686,763
GBK/381‐A040‐7E、80‐FE漢字6,0806,080
GBK/4AA‐FE40‐7E、80‐A0漢字8,1608,160
GBK/5A8‐A940‐7E、80‐A0漢字192166
外字AA‐AFA1‐FE漢字564 
F8‐FEA1‐FE漢字658
A1‐A740‐7E、80‐A0漢字672

収録されている字は、次の通り。

  • GBK/1
    • GB 2312-80の記号類
    • GB 12345-90の追加記号類
  • GBK/2
    • GB 2312-80の6,763文字
  • GBK/3
    • GB 13000.1-93のCJK統合漢字6,080文字
  • GBK/4
    • GB 13000.1-93のCJK統合漢字、互換漢字、計8,160文字
  • GBK/5
    • GB 13000.1-93の非漢字等、計166文字
用語の所属
CCS
CES
文字コード
関連する用語
GB 2312
Unicode
EUC
EUC-CN
GB 18030
CJK統合漢字

コメントなどを投稿するフォームは、日本語対応時のみ表示されます


KisoDic通信用語の基礎知識検索システム WDIC Explorer Version 7.04a (27-May-2022)
Search System : Copyright © Mirai corporation
Dictionary : Copyright © WDIC Creators club