情感计算

您所在的位置:网站首页 音质特征 情感计算

情感计算

2023-09-24 04:32| 来源: 网络整理| 查看: 265

神经网络

高斯混合模型(GMM) 混合高斯模型是只有一个状态的模型,在这个状态里具有多个高斯分布函数。 P k =    ∑ i    =    1 N w i f i ( Y ) P_{k}=\; \sum_{i\; =\; 1}^{N}{w_{i}f_{i}\left( Y \right)} Pk​=i=1∑N​wi​fi​(Y)

其中 f i f_i fi​是一个高斯分布函数,不同高斯分布之间的加权系数 w i w_i wi​满足 ∑ i    = 1 N w i    =    1 \sum_{i\; =1}^{N}{w_{i}\; =\; 1} ∑i=1N​wi​=1 每一个情感类型训练一个高斯混合函数,高斯函数的输入参数为语音的情感特征参数。

HMM HMM是一种基于转移概率和观测概率的随机模型,它既能用短时模型(状态)解决声学特征相对稳定段的描述,又能用状态转移规律刻画稳定段之间的时变过程

支持向量机 基于结构风险最小化和统计学习理论提出了一种名为支持向量机(SVM)的机器学习方法,该方法在诸如函数拟合、非线性模式识别。小样本等领域都极具优势。

混合模型 混合高斯模型-支持向量机:该方法不仅拥有混合高斯模型统计能力强的优点,而且同时有支持向量机分类能力强的优点。

隐马尔科夫模型-人工神经网络模型:首先用隐马尔科夫模型对情感特征向量进行整合,再用人工神经网络进行最终分类识别。

采用投票机制将支持向量机、K最近邻算法、人工神经网络种分类器进行融合。

深度神经网络 DNN:原始语音信号分段输入到网络中,提取局部的情感信息,然后经过处理得到全局情感特征,送到分类器中,得到预测的概率类别。输入一段语音情感信号,可以得到每一段对每个情感类别的预测概率值。

CNN:卷积神经网络广泛应用到语音情感识别中,包括局部不变特征学习模块、情感区分特征分析模块和支持向量机模块三个部分。这种模型结构能够抽取出具有区分性的情感特征。

RNN:能够有效融合上下文信息进行音频情感建模。

CNN- RNN:联合了CNN模型的音频信息表征能力和RNN模型的情感时序建模能力。

胶囊网络:利用胶囊网络,考虑音频特征在声谱图中的空间关系,为获取语音全局特征提供了一种有效的汇聚方法。

基于端到端的音频识别:直接将语谱图或时域波形点作为输入,具有特征自学习能力的优势 其性能依赖于数据规模。

注意力机制:有效挖掘不同音频片段对当前情感状态的贡献度。

多任务学习:不同维度情感状态存在依存关系,利用多任务学习机制实现维度情感模型的协同优化。

融合功能副语言信息检测的识别模型:对副语言段和语音段进行区分性建模,有效利用副语言先验信息。

融合说话人信息和文本信息的识别模型:对音频信息、识别的文本信息、说话人信息进行时空融合。

融合区分性训练准则的识别模型:利用三元损失函数解决不同情感状态边界模糊的问题



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3