ア | イ | ウ | エ | オ |
カ | キ | ク | ケ | コ |
サ | シ | ス | セ | ソ |
タ | チ | ツ | テ | ト |
ナ | ニ | ヌ | ネ | ノ |
ハ | ヒ | フ | ヘ | ホ |
マ | ミ | ム | メ | モ |
ヤ | ユ | ヨ | ||
ラ | リ | ル | レ | ロ |
ワ | ヰ | ヴ | ヱ | ヲ |
ン |
A | B | C | D | E |
F | G | H | I | J |
K | L | M | N | O |
P | Q | R | S | T |
U | V | W | X | Y |
Z | 数字 | 記号 |
Unicodeを32ビット(4オクテット)固定長で表現する符号化方法(CES)の一つ。
Unicode Standard Annex #19(Unicode標準 付則 #19)によって定義されている。
UTF-32においては、32ビット=4オクテットが1バイトとなる。
これは、Unicode標準の一つである。UTF-32でもISO/IEC 10646の全領域を表現することは不可能ではないが、あくまでUnicode用である。
ISO/IEC 10646のUCS-4との違いはこの点で、UTF-32は32ビット(符号があるため、有効31ビット)あるが、使うのはU+0〜U+10FFFFまでの範囲だけとなる。
つまり、UTF-32⊆UCS-4、ということが出来る。
BOMが定義される以前の文書には、BOMが無いものもある。
現在それはUTF-32LEやUTF-32BEと呼ばれ、名称でエンディアンネスを識別するようになっている。
なお、BOMがなく、エンディアンネスの指定も無いUTF-32の場合、その文書はビッグエンディアン(いわゆるネットワークバイトオーダー)として処理される。
コメントなどを投稿するフォームは、日本語対応時のみ表示されます