TRONコード
読み:トロンコード
外語:TRON code

 TRONで使われている文字コードの仕様。
目次

概要

用途
 自由に利用できることもあり、広く用いられている。
 BTRONである超漢字シリーズでも、標準的にこのコードが使われる。

符号体系
 コードはISO/IEC 2022を独自にアレンジしたような仕様となっている。
 2バイトで構成される16ビットコードのそれぞれが2/1〜7/14、8/0〜15/13の範囲にあり、都合220種類が2バイト構成で計48,400符号位置を表現できる。
 これを言語面と呼び、超漢字以降のBTRONでは31面までの言語面に対応する。つまり最大1,500,400字まで扱う事ができる。しかも、言語面は容易に拡張可能で、都合無限の文字を扱えるようになっている。

切り替え式の選択理由
 文章では通常、同じ言語面の文字を使い続ける事が多いということから、例えば32ビット等で統一して文字を表わすよりは、16ビットで表現し、必要とあらば言語面を切り換える手法の方が効率が良い。
 TRONコードはその通りの仕様になっている。

技術

包摂規準
 TRONコードを設計したのはTRONプロジェクト提唱者である坂村健である。
 彼らは、JISやUnicodeの「包括」を嫌っており、言語が異なれば同じような文字であっても異なる符号に符号化した方がよいと考えていた。出来るだけ細かく分け、検索などの際には、必要に応じて同一視する、という方針とした。
 これはつまり、実質的に同一と考えられる文字に対して、複数のコードが存在することを意味している。
 例えば漢数字の1「一」という字を考えても、第一面だけでもJIS X 0208とGB 2312、KS X 1001があり、第2面のGT書体にもあり、第6面のCNS 11643-1986(Big5)にもあり、第8面の大漢和辞典にもあり、そして第11面の今昔文字鏡にもあった(過去形)わけである。
 とにかく文字が多ければ良く、とにかく文字の統合は拒否する、という思想からこの様な結果になったわけである。電子計算機用の符号であるにも関わらず、電子計算機での処理のしやすさが殆ど考慮されていない。
 もし、文書から検索をしようと思えば、一旦同等文字をまとめるためのデータベースなどを介さねばならない。

ゾーン
 TRONコードには「8ビット空間」と「16ビット空間」の仕様が存在するが、実際に使われているのは16ビット空間だけである。16ビット空間では、文字は原則として16ビット単位の可変長で扱われる。
 仕様はISO/IEC 2022に似るが、ISO/IEC 2022が7ビットを基本とするのに対し、TRONコードは最初から8ビット単位として設計されている。
 各バイトの範囲により、ISO/IEC 2022相当の領域が四つできることになる。これを、TRONコードでは「ゾーン」と呼んでいる。
 そのため、一回の言語面切り換えでISO/IEC 2022の約4倍の文字を扱う事ができることになり、理論上はISO/IEC 2022の約4倍の効率があるといえる。
 各範囲は、次のように使われている。
 16ビット領域では、改行などの制御コードも16ビットである。

仕様

言語面
 なお、第16〜17面のUnicodeに関しては、CJK統合漢字とハングル音節は除外されている。

収録文字
 文字集合中に含まれる文字(仕様)と、その先頭符号位置を以下に示す(面-面内番号)。

再検索