ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
英語用として広く使われている文字コード。コンピューターにおいてはASCIIおよびこの上位互換が最も良く使われている。
ASCIIは7ビットの文字集合である。この中に大小のラテン文字や数字、記号類、そして制御文字が収録されており、ASCIIは「情報交換用米国標準符号」という意味を持っている。
この仕様は広く普及し、国際標準ISO/IEC 646(当初はISO 646)の元となった。
更に、8ビットの文字集合であるISO/IEC 8859(当初はISO 8859)はASCIIの仕様を維持し、ASCIIでは使用されていない文字番号128番以降に新たな文字を追加した集合として規定され、ヨーロッパなどラテン文字圏を中心に広く使われるようになった。西欧ではこのうち、ISO-8859-1が一般化している。
また、Unicodeも、文字番号0から127まではASCIIと全く同じに作られている。文字番号128から255まではISO-8859-1と全く同じで、西欧の処理系には都合良く設計されている。
ASCIIには、全部で33文字の制御文字が存在する。
制御文字は画面に表示したり印字したりするための文字ではなく、プリンターやモニターに何らかの制御を与えるために用意されたものである。
この仕様も現在のような高性能なコンピューターではなく当時の状況を色濃く反映しているのが特徴で、特にデータ記録に使われた紙テープ(パンチテープ)の影響が垣間見える。
文字番号127は2進数で1111111で、DEL(Delete、削除)の文字として使われる。これは元々、その場所のデータが消去されていることを意味した。紙テープは穴を空けてデータを記録するが、穴は空けるだけで埋めることができない(つまり上書きが出来ない)ので、7桁の全桁に穴を空けてデータの削除とした。
同様に文字番号0は2進数で0000000で、NUL(Null、空)の文字として使われる。これも紙テープにおいて、情報が無い=空を意味するのが由来である。また同時に、DELの場合と同様だが逆に、1を0にすることで情報を削除するような機構にも対応可能なようになっている。
それ以外は任意で決められたと見られるが、結果として先頭の0x00‐0x1fが制御文字の範囲となった。これは現在、ISO-646 C0制御コードとして、制御コードの代表となっている。
ASCIIには、全部で95文字の図形文字(空白を含む)が存在する。
基本的な記号類に加え、アラビア数字、ラテンアルファベットの大文字と小文字が収録されている。
現在使われているパーソナルコンピューター用のキーボードでは、このASCIIにある図形文字は何らかの方法で直接入力可能なように設計されている。
制御文字集合も、図形文字集合のうち@から始まる32文字(0x40‐0x5f)をCtrlキーと共に押すことで64(0x40)を減じた制御文字を入力可能にしている実装が多い(実装依存)。そしてこれを、"^"を付けて記述する習慣がある(例: 0x00なら、^@)。
上位3ビット | ||||||||
---|---|---|---|---|---|---|---|---|
0- | 1- | 2- | 3- | 4- | 5- | 6- | 7- | |
-0 | NUL | DLE | SPC | 0 | @ | P | ` | p |
-1 | SOH | DC1 | ! | 1 | A | Q | a | q |
-2 | STX | DC2 | " | 2 | B | R | b | r |
-3 | ETX | DC3 | # | 3 | C | S | c | s |
-4 | EOT | DC4 | $ | 4 | D | T | d | t |
-5 | ENQ | NAK | % | 5 | E | U | e | u |
-6 | ACK | SYN | & | 6 | F | V | f | v |
-7 | BEL | ETB | ' | 7 | G | W | g | w |
-8 | BS | CAN | ( | 8 | H | X | h | x |
-9 | HT | EM | ) | 9 | I | Y | i | y |
-A | LF | SUB | * | : | J | Z | j | z |
-B | VT | ESC | + | ; | K | [ | k | { |
-C | FF | FS | , | < | L | \ | l | | |
-D | CR | GS | - | = | M | ] | m | } |
-E | SO | RS | . | > | N | ^ | n | ~ |
-F | SI | US | / | ? | O | _ | o | DEL |
日本語のJIS X 0201環境では0x5c(5/12)は円マークが表示されるが、実際のASCIIではバックスラッシュ(\)である。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます