基于MCRA

2024-07-13 23:32| 来源: 网络整理| 查看: 265

基于MCRA-OMLSA的语音降噪(一)：原理 2021 年 12 月 21 日筆記传统音频

前面的几篇文章讲了webRTC中的语音降噪。最近又用到了基于MCRA-OMLSA的语音降噪，就学习了原理并且软件实现了它。MCRA主要用于噪声估计，OMLSA是基于估计出来的噪声去做降噪。类比于webRTC中的降噪方法，也有噪声估计（分位数噪声估计法）和基于估计出来的噪声降噪（维纳滤波），MCRA就相当于分位数噪声估计法，OMLSA就相当于维纳滤波。本文先讲讲怎么用MCRA和OMLSA来做语音降噪的原理，后续会讲怎么来做软件实现。

一， MCRA

MCRA的全称是Minima Controlled Recursive Averaging（最小值控制的递归平均），是cohen提出的一种常用的噪声估计方法，具体见论文《Noise Estimation by Minima Controlled Recursive Averaging for Robust Speech Enhancement》。从名字就可看出这个方法主要包括两部分，最小值控制和递归平均。最小值控制用来算语音存在概率，递归平均用来做噪声估计，即基于语音存在概率做噪声估计。先定义一些名称，然后分别看这两部分。用l表示第l帧，k表示第k个频点，Y(k, l)表示带噪语音第l帧的第k个频点的幅度谱，N(k, l)表示噪声第l帧的第k个频点的幅度谱，S(k, l)表示干净语音第l帧的第k个频点的幅度谱，H0(k, l)表示第l帧的第k个频点上只有噪声，H1(k, l)表示第l帧的第k个频点上有语音。P(H1(k, l) | Y(k, l)) 表示第l帧的第k个频点上是语音的概率，P(H0(k, l) | Y(k, l)) 表示第l帧的第k个频点上是噪声的概率，显然P(H0(k, l) | Y(k, l)) + P(H1(k, l) | Y(k, l)) = 1。

1，用最小值控制来算语音存在概率

前面的文章（ webRTC中语音降噪模块ANS细节详解(四) ）讲过webRTC的ANS是基于似然比等来算语音存在概率。而这里是用最小值控制来算语音存在概率，即基于当前带噪语音的能量谱与指定长度帧内带噪语音的能量谱的最小值的比值来计算，具体如下：

1）对带噪语音的能量谱做频域平滑和时域平滑

从上式可见，平滑窗的长度是奇数(2w + 1)，系数是b(i)。

其中，αs (0

【本文地址】

基于MCRA

基于MCRA

今日新闻

推荐新闻