语音信号处理--韩纪庆--笔记2-3

您所在的位置:网站首页 韩信的语音什么意思 语音信号处理--韩纪庆--笔记2-3

语音信号处理--韩纪庆--笔记2-3

2024-07-15 13:51| 来源: 网络整理| 查看: 265

语音信号的同态解卷积:

解卷就是将各卷积分量分开,解卷算法可以分为两大类:参数解卷即线性分析预测、非参数解卷即同态解卷积--对语音信号进行同态分析后得到语音信号的倒谱参数。

语音信号可以看作是声门激励信号与声道响应的卷积结果。

同态信号处理的基本原理:

加性信号通常可以用线性系统处理,但很多现象中的信号是乘性信号或卷积性信号。同态信号处理就是一种为之而生的设法将非线性问题转化为线性问题来处理的一种方法,可以分为 乘积同态信号处理和卷积同态信号处理两种。同态系统的主要理论是童泰系统分解,目的是用两个特征系统和一个线性系统替代非线性的同态系统。513b950e64ad46199a6ac00ffcded2ea.jpg

 特征系统D*是将卷积信号转化为加性信号--对输入的卷积进行Z变换,将卷积变为乘积,然后对数运算,将乘积变为加法,再对所得的加法逆Z变回时域的加法,即得到了语音信号的倒谱。L系统是在倒谱域对信号进行处理--通常是将声源信号和声道信号进行分离。处理后若还想恢复原始信号,可经过逆特征系统。

语音信号的复倒谱:

在求解倒谱域的过程中不仅考虑到了对应的频谱的模,也考虑其相位,则为复倒谱。

①声门激励信号--发清音时声门激励信号是能量较小,频谱分布均匀的白噪声;发浊音时,声门激励信号是以基音周期为周期的冲激序列。由声门激励的倒谱可以得到如下结论:一个周期冲击的有限长度的序列,倒谱也是一个周期冲激的有限长序列,只是周期不变,有限长变无限长;周期冲激序列的倒谱振幅逐渐衰减且比原序列快。

②声道冲激响应倒谱--是一个双边、衰减序列;最小相位信号序列的倒谱是一个因果序列;最大相位信号的倒谱是一个反因果序列。

避免相位卷绕的算法(简):相位卷绕--相位的多值性问题--恢复语音时运算存在不确定性。解决方法:微分法(不理想,会引起混叠)、最小相位信号法(较好,要求被处理的信号是最小相位信号)、递归法。

基于听觉特性的Mel频率倒谱系数:

mel frequency cepstrum coefficient--MFCC将人耳的听觉感知和语音的产生机制相结合。耳蜗相当于一个滤波器组,在对数频率尺度上进行的--1000Hz以下为线性尺度,1000Hz以上为对数尺度。梅尔频率计算:f=2595×lg(1+f/700)。梅尔倒谱系数计算过程如下:信号分帧、预加重、加汉明窗、STFT得到频谱→能量谱(频谱平方),用M个梅尔带通滤波器进行滤波,将每个滤波频带内的能量进行叠加(人耳就是这样的)→将每个滤波器的输出取对数得到相应频带的对数功率谱,反DCT得到L个梅尔系数,通常L取12-16。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3