テクスト
読み:テクスト
外語:text
文章のこと。バイナリの対語。「テキスト」とも。
概要
「文字だけ」で構成されたファイルや画面などのことを、特にこう呼ぶ。
このようなファイルは、テクストファイルと呼ばれる。
特徴
条件
コンピューターのデータは数値のみで管理される。あらゆるコンピューターのファイルは、この番号の羅列を格納している。
文字も番号で管理されているが、文字として使用される番号の範囲は決まっており、この範囲内に収めたものを、テクストファイルと呼ぶ。その内容が人間の読み書きする言語であっても無くても良い。
許容条件
通常、テクストの符号化には、ASCIIやシフトJIS、UTF-8などが使われる。
例えば、ASCIIであれば文字の範囲は0x20〜0x7e、シフトJISなら文字の範囲は0x20〜0x7e、0x81〜0xfcと決まっている。
しかし、例えば改行コードであるとか、シフトJISではなくISO/IEC 2022を使う場合は符号系の切り替えの制御符号などは、文字ではない情報である。こういった必要最小限のものは、含まれていてもテクストファイルの範疇として許容される。
バイナリ
ワードプロセッサーで作成された文書ファイルの場合、装飾の情報など、文章とは直接無関係の情報が含まれ、また画像情報なども含まれることがある。
こういった情報を、文字として許される範囲外の符号で表現した場合、それはテクストでなく、バイナリファイルと呼ばれる。
なお、こういった装飾情報でも、HTMLやXMLのように全てを文字の範囲で表現できるもので書き表わせば、それはテクストファイルとして扱われる。しかし、なぜかHTMLはテクスト(テキスト)では無いかのごとく記述を見かけることも多々ある。
(例)「メールの形式はどちらにしますか? HTML形式 or テキスト形式」
再検索