音声圧縮
読み:おんせいあっしゅく
外語:voice compression
音声や音楽のデータを圧縮するための技術のこと。
概要
圧縮には、完全に元に戻せる可逆圧縮と、そうではない非可逆圧縮がある。
音声や音楽の場合、多少劣化しても聞き取ることができるため、後者の非可逆圧縮がよく使われている。
しかし、パソコンの音楽配信用では処理能力とネットワーク帯域の向上により、可逆圧縮も採用されるようになってきている。
特徴
性能競争
可逆圧縮では音質についての比較は(変化しないので)なく、いかに圧縮率が高いか、処理速度がどのくらい早いかの勝負になる。
非可逆圧縮は、可聴周波数外の情報の削除や、聴覚特性を利用した聞こえにくい音(例えば大きな音の直後の小さい音や大きな音の周辺の小さい音など)の削除などによって行なわれる。このアルゴリズムの品質によって音質が決まるが、例えば携帯電話では声だけが伝われば良いという考えからばっさりと音をカットしていることがあり、これも程度が過ぎると非常に不自然な音になることがある。現に、PDCハーフレートの音質の評価は最低最悪なものに成り果てた。
宗教論争
非可逆圧縮の音質の評価については、たびたび「宗教論争」を巻き起こすことで有名である。
もっとも、一般人が使う上ではその性能差については、殆どの場合、気になる程度のものではない。そのようなこともあり、パーソナルコンピューター向けの製品では、いかに使いやすいかが一番に評価される。
パーソナルコンピューター向けの音声圧縮技術では、各種プレイヤーに対応してもらうため、オープンソース化されているものが多い。
主要技術
使われている、主だった技術に、次のようなものがある(順不同)。
- パーソナルコンピューター向け(非可逆)
- パーソナルコンピューター向け(可逆)
- 音響機器向け
- 携帯電話など
用途や目的などにより、圧縮技術は多数存在する。
再検索