数据压缩（十三）

2024-05-24 22:47| 来源: 网络整理| 查看: 265

文章目录一、MPEG音频编码原理1.1 基本思想1.2 心理声学模型（Psychoacoustic model)1.2.1 听觉阈值1.2.2 频域掩蔽 1.3 临界频带（Critical Band）1.4 人耳听觉系统1.5 掩蔽效果的加和二、MPEG音频压缩编码器2.1 多相滤波器组(Polyphase Filter Bank)2.2 心理声学模型2.3 量化和编码2.3.1 比例因子的取值和编码2.3.2 比特分配及编码 2.3.3 数据帧包装三、MPEG音频编码器调试3.1 理解程序设计的整体框架3.2 理解感知音频编码的设计思想3.2.1 两条线3.2.2 时-频分析的矛盾 3.3 理解心理声学模型的实现过程3.3.1 临界频带的概念3.3.2 比例因子的计算3.3.3 掩蔽值计算的思路 3.4 理解码率分配的实现思路3.5 输出音频的采样率和目标码率3.6 某个数据帧，输出3.6.1 该帧所分配的比特数3.6.2 该帧的比例因子3.6.3 该帧的比特分配结果3.6.4 输出result文件结果

一、MPEG音频编码原理

在这里插入图片描述

1.1 基本思想

分析信号，去掉不能被感知的部分【声音压缩算法可以确立这种特性的模型来取消更多的冗余数据】

子带分析滤波器组：使信号具有高的时间分辨率【短暂冲击信号情况下，编码的声音信号具有足够高的质量】FFT运算：使信号具有高的频率分辨率比特分配：低频子带分配较多的位数【保护音调和共振峰的结构】；高频自带分配较少的位数【摩擦音和类似噪声的声音】 1.2 心理声学模型（Psychoacoustic model) 生理（Physiological）感知极限（传感极限）心理（Psychological）感知极限（信号处理极限） 1.2.1 听觉阈值

听觉系统中存在一个听觉阈值电平，低于这个电平的声音信号就听不到

在这里插入图片描述

听觉阈值的大小随声音频率的改变而改变一个人是否听到声音取决于声音的频率，以及声音的幅度是否高于这种频率下的听觉阈值。 1.2.2 频域掩蔽

听觉阈值电平是自适应的，会随听到的不同频率声音而发生变化

在这里插入图片描述如果有多个频率成分的复杂信号存在，那么频谱的总掩蔽阈值与频率的关系取决于各掩蔽音的强度、频率和它们之间的距离。

1.3 临界频带（Critical Band）

临界频带是指当某个纯音被以它为中心频率、且具有一定带宽的连续噪声所掩蔽时，如果该纯音刚好被听到时的功率等于这一频带内的噪声功率，这个带宽为临界频带宽度。 1 B a r k = { f 100 , f o r f r e q u e n c i e s f < 500 H z 9 + 4 l o g ( f 1000 ) , f o r f r e q u e n c i e s f ≥ 500 H z 1 Bark=\left\{ \begin{aligned} &\frac{f}{100},&&for frequencies&& f

【本文地址】

数据压缩（十三）

数据压缩（十三）

今日新闻

推荐新闻