音频处理

您所在的位置：网站首页 › 音频编码技术包括 › 音频处理

音频处理

2024-06-19 07:05| 来源: 网络整理| 查看: 265

目录为什么音频需要编码编码原理频频域掩蔽效应时域掩蔽效应压缩编码方法音频编码器选型

为什么音频需要编码

和图像压缩原理对比数字音频信号如果不加压缩地直接进行传送，将会占用极大的带宽。例如，一套双声道数字音频若取样频率为44.1KHz，16bit量化，码率为

2 x 44.1kHz x 16bit = 1.411Mbit/s

如此大的带宽将给信号的传输和处理都带来许多困呐和成本(阿里云服务器带宽大于5M后，没M价格是100元/月) 因此必须采取音频压缩技术对音频数据进行处理，才能有效地传输音频数据

编码原理

数字音频压缩编码在保证信号在听觉方面不产生失真的前提下，对音频数据信号尽可能大的压缩，降低数据量。数字音频压缩编码采取去除声音信号中的冗余成分的方法来实现

所谓冗余成分指的是音频中不能被人耳感知到的信号，即[20, 20k]Hz以外频率的信号，他们对确定声音的音色，音调等信息没有任何的帮助。

此外，根据人耳听觉的生理和心理声学现象，当一个强音信号与一个弱音信号同时存在时，弱音信号将被强音信号所遮蔽而听不见，这样弱音信号就可以视为冗余信号而不用传送。这就是人耳听觉的掩蔽效应，主要表现在频谱掩蔽效应和时域掩蔽效应。

频频域掩蔽效应

在这里插入图片描述一个频率的声音音量（db）小于某个阈值，人耳就会听不到。当有另外能量较大的声音出现的时候，该声音频率附近的阈值就会提高很多，即所谓的掩蔽效应，如上图所示。

由图中我们可以看出人耳对2KHz～5KHz的声音最敏感，而对频率太低或太高的声音信号都很迟钝，当有一个频率为0.2KHz、强度内60db的声音出现时，其附近的阈值提高了很多. 由图中我们可以看出在在0.1KHz以下、1KHz以上的部分,由于离0.2KHz强信号较远，不受0.2KHz强信号影响,阈值不受影响;而在0.1KHz~1KHz范围，由于0.2KHz强音的出现,阈值有较大的提升,人耳在此范围所能感觉到的最小声音强度大幅提升。如果0.1KHz~1KHz范围内的声音信号的强度在被提升的阈值曲线之下，由于它被0.2KHz强音信号所掩蔽，那么此时我们人耳只能听到0.2KHz的强音信号而根本听不见其它弱信号，这些与0.2KHz强音信号同时存在的弱音信号就可视为冗余信号而不必传送。

20hz和20khz左右音量需要非常大才能听见如果在）0.2khz时音量很大，就会出现掩蔽效应，即0.2khz音量很大的点的附近频率的声音也需要很大才能听得见。于是我们不需要编码白色部分的声音,低于那个点以下的声音都听不到

时域掩蔽效应

在这里插入图片描述在强音和弱音信号同时出现时，还存在时域掩蔽效应。即两者发生时间很接近的时候，也会发生掩蔽效应。时域掩蔽过程曲线如图所示，分为前掩蔽、同时掩蔽和后掩蔽三部分。

前掩蔽人耳在听到强信号之前的短暂时间内，已经存在的弱信号或被这笔而听不到

同时掩蔽当强信号消失后与弱信号同时存在时，弱信号会被强信号所掩蔽而听不到

后掩蔽强信号消失后，需经过较长的一段时间才能重新听见弱信号

这些被掩蔽的弱信号可以视为冗余信号

突然有强音，这时弱信号听不见强音消失后一段时间后才能听见弱信号

压缩编码方法

当前数字音频编码领域存在不同编码方案和实现方式，基本编码思路大同小异，如图所示在这里插入图片描述

对每一个音频声道中的音频采样信号

1、将他们映射到频域中，这种时域到频域的映射可通过子带滤波器实现。每个声道中的音频采样块首先要根据心理声学模型来计算掩蔽门限值（人耳对1kHz-7kHz较为敏感）2、由计算出的掩蔽门限值决定从公共比特池中分配给该声道不同频率域中多少比特数，接着进行量化以及编码工作3、将控制参数及辅助数据加入数据之中，产生编码后的数据流音频编码器选型 OPUSMP3AACAC3和EAC3（杜比公司的方案）参考《详解音频编码的原理、演进和引用选型等》 https://www.jianshu.com/p/6b4c481f4294

【本文地址】

音频处理

音频处理

今日新闻

推荐新闻