CESU-8 |
辞書:通信用語の基礎知識 通信技術文字符号編 (CTCHRE) |
読み:スィーイーエスユーはち |
外語:CESU-8: Compatibility Encoding Scheme for UTF-16:8-Bit |
品詞:固有名詞 |
UTF-8の亜種の一つで、Oracleが使っている不届き千万な仕様の一つ。
概要 |
本来UTF-8(RFC 2279)では、サロゲートペアは適時解釈してから符号化せねばならない。
しかしこのCESU-8は、サロゲートの各ペアを機械的にUTF-8に変換するのみであり、supplementary characterは6バイトで表現される。これはUTF-8の仕様から外れた手法であるばかりか、公害ともなりうる実装である。
しかしながら、Oracleはこのような実装をしてしまった。それを正当化するために、CESU-8としてエンコーディング登録をしてしまったのである。
リンク |
通信用語の基礎知識検索システム WDIC Explorer Ver 7.04a (27-May-2022) Search System : Copyright © Mirai corporation Dictionary : Copyright © WDIC Creators club |