音频处理 |
您所在的位置:网站首页 › 音频编码技术包括 › 音频处理 |
目录
为什么音频需要编码编码原理频频域掩蔽效应时域掩蔽效应
压缩编码方法音频编码器选型
为什么音频需要编码
和图像压缩原理对比 数字音频信号如果不加压缩地直接进行传送,将会占用极大的带宽。 例如,一套双声道数字音频若取样频率为44.1KHz,16bit量化,码率为 2 x 44.1kHz x 16bit = 1.411Mbit/s如此大的带宽将给信号的传输和处理都带来许多困呐和成本(阿里云服务器带宽大于5M后,没M价格是100元/月) 因此必须采取音频压缩技术对音频数据进行处理,才能有效地传输音频数据 编码原理数字音频压缩编码在保证信号在听觉方面不产生失真的前提下,对音频数据信号尽可能大的压缩,降低数据量。数字音频压缩编码采取去除声音信号中的冗余成分的方法来实现 所谓冗余成分指的是音频中不能被人耳感知到的信号,即[20, 20k]Hz以外频率的信号,他们对确定声音的音色,音调等信息没有任何的帮助。 此外,根据人耳听觉的生理和心理声学现象,当一个强音信号与一个弱音信号同时存在时,弱音信号将被强音信号所遮蔽而听不见,这样弱音信号就可以视为冗余信号而不用传送。这就是人耳听觉的掩蔽效应,主要表现在频谱掩蔽效应和时域掩蔽效应。 频频域掩蔽效应
由图中我们可以看出人耳对2KHz~5KHz的声音最敏感,而对频率太低或太高的声音信号都很迟钝,当有一个频率为0.2KHz、强度内60db的声音出现时,其附近的阈值提高了很多. 由图中我们可以看出在在0.1KHz以下、1KHz以上的部分,由于离0.2KHz强信号较远,不受0.2KHz强信号影响,阈值不受影响;而在0.1KHz~1KHz范围,由于0.2KHz强音的出现,阈值有较大的提升,人耳在此范围所能感觉到的最小声音强度大幅提升。如果0.1KHz~1KHz范围内的声音信号的强度在被提升的阈值曲线之下,由于它被0.2KHz强音信号所掩蔽,那么此时我们人耳只能听到0.2KHz的强音信号而根本听不见其它弱信号,这些与0.2KHz强音信号同时存在的弱音信号就可视为冗余信号而不必传送。 20hz和20khz左右音量需要非常大才能听见 如果在)0.2khz时音量很大,就会出现掩蔽效应,即0.2khz音量很大的点的附近频率的声音也需要很大才能听得见。于是我们不需要编码白色部分的声音,低于那个点以下的声音都听不到 时域掩蔽效应
前掩蔽 人耳在听到强信号之前的短暂时间内,已经存在的弱信号或被这笔而听不到 同时掩蔽 当强信号消失后与弱信号同时存在时,弱信号会被强信号所掩蔽而听不到 后掩蔽 强信号消失后,需经过较长的一段时间才能重新听见弱信号 这些被掩蔽的弱信号可以视为冗余信号 突然有强音,这时弱信号听不见 强音消失后一段时间后才能听见弱信号 压缩编码方法当前数字音频编码领域存在不同编码方案和实现方式,基本编码思路大同小异,如图所示 对每一个音频声道中的音频采样信号 1、将他们映射到频域中,这种时域到频域的映射可通过子带滤波器实现。每个声道中的音频采样块首先要根据心理声学模型来计算掩蔽门限值(人耳对1kHz-7kHz较为敏感)2、由计算出的掩蔽门限值决定从公共比特池中分配给该声道不同频率域中多少比特数,接着进行量化以及编码工作3、将控制参数及辅助数据加入数据之中,产生编码后的数据流 音频编码器选型 OPUSMP3AACAC3和EAC3(杜比公司的方案) 参考《详解音频编码的原理、演进和引用选型等》 https://www.jianshu.com/p/6b4c481f4294 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |