【特征提取】共振峰估计【含Matlab源码 550期】 |
您所在的位置:网站首页 › 共振效果图 › 【特征提取】共振峰估计【含Matlab源码 550期】 |
获取代码方式1: 完整代码已上传我的资源:【特征提取】基于matlab共振峰估计【含Matlab源码 550期】 点击上面蓝色字体,直接付费下载,即可。 获取代码方式2: 付费专栏Matlab语音处理(初级版) 备注: 点击上面蓝色字体付费专栏Matlab语音处理(初级版),扫描上面二维码,付费29.9元订阅海神之光博客付费专栏Matlab语音处理(初级版),凭支付凭证,私信博主,可免费获得1份本博客上传CSDN资源代码(有效期为订阅日起,三天内有效); 点击CSDN资源下载链接:1份本博客上传CSDN资源代码 ⛄二、共振峰估计简介声道可以看成是一根具有非均匀截面的声管,在发音时起共鸣器的作用。当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。共振峰参数包括共振峰频率和频带宽度,它是区别不同韵母的重要参数。共振峰信息包含在语音频谱包络中,因此共振峰参数提取的关键是估计自然语音频谱包络,并认为谱包络中的最大值就是共振峰。 与基音提取类似,精确的共振峰估值也是很困难的。存在的问题包括以下几方面: 1)虚假峰值。在正常情况下,频谱包络中的最大值完全是由共振峰引起的,但也会出现虚假峰值。一般,在利用非线性预测分析方法的频谱包络估值器中,出现虚假峰值情况较 多,而在采用线性预测方法时,出现虚假峰值情况较少。 2)共振峰合并。相邻共振峰的频率可能会靠得太近难以分辨,而寻找一种理想的能对共振峰合并进行识别的共振峰提取算法有不少实际困难。 3)高音调语音。传统的频谱包络估值方法是利用由谐波峰值提供的样点,而高音调语音(如女声和童声)的谐波间隔比较宽,因而为频谱包络估值所提供的样点比较少。利用线性预测进行频谱包络估值也会出现这个问题,在高音调语音中,线性预测包络峰值趋向于离开真实位置而朝着最接近的谐波峰值移动。 1 带通滤波器组法 这种方法类似于语谱仪,但由于使用了计算机,使滤波器特性的选取更具灵活性,实现 框图示于图5-31中。这是共振峰提取的最早形式,与线性预测法相比,滤波器组法性能较 差。但通过滤波器组的设计可以使估计的共振峰頻率同人耳的灵敏度相匹配,其匹配的程度比线性预测法要好。 滤波器的中心频率有两种分布方法:一种是等间距地分布在分析频段上,即所有带通滤波器的带宽相同,从而保证了各通道的群延时相同;另一种是非均匀地分布,例如为了获得类似于人耳的频率分辨特性,在低频端间距小,高频端间距大,带宽也随之增加,这时滤波器的阶数必须设计成与带宽成正比,使得它们输出的群延时相同,不会产生波形失真。 为了使频率分辨率提高,滤波器的阶数应取足够大的值,使得带通滤波器具有良好的截 止特性,但同时也意味着每个滤波器均有较长的冲激响应。由于语音信号具有时变特性,显然较长的冲激响应会模拟这种特性,所以频率分辨率与时间分辨率总是相互矛盾的。带通滤波器组的方法可以实现较高的时间分辨率,故常用它来分析共振峰的走向。 图5-16为利用滤波器组进行共振峰估值的一种系统结构示意图。滤波器的中心频率为 150Hz~7kHz, 分析带宽为100Hz~1kHz, 频率按对数规律递增。滤波器输出经全波整流而用于提供频谱包络估值。辨识逻辑用于对适当频率范围内的峰值进行辨识而获得前三个共振峰。频谱峰值被依次指定,每一峰值都被约束在其已知的频率范围之内并且高于前面共振峰的频率。 clear all; clc; close all; waveFile=‘手放开.wav’; % [x, fs]=audioread(waveFile); % ⛄四、运行结果
1 matlab版本 2014a 2 参考文献 [1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019. [2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019. 3 备注 简介此部分摘自互联网,仅供参考,若侵权,联系删除 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |