情感计算

2023-09-24 04:32| 来源: 网络整理| 查看: 265

神经网络

高斯混合模型（GMM）混合高斯模型是只有一个状态的模型，在这个状态里具有多个高斯分布函数。 P k = ∑ i = 1 N w i f i ( Y ) P_{k}=\; \sum_{i\; =\; 1}^{N}{w_{i}f_{i}\left( Y \right)} Pk=i=1∑Nwifi(Y)

其中 f i f_i fi是一个高斯分布函数，不同高斯分布之间的加权系数 w i w_i wi满足 ∑ i = 1 N w i = 1 \sum_{i\; =1}^{N}{w_{i}\; =\; 1} ∑i=1Nwi=1 每一个情感类型训练一个高斯混合函数，高斯函数的输入参数为语音的情感特征参数。

HMM HMM是一种基于转移概率和观测概率的随机模型，它既能用短时模型（状态）解决声学特征相对稳定段的描述，又能用状态转移规律刻画稳定段之间的时变过程

支持向量机基于结构风险最小化和统计学习理论提出了一种名为支持向量机（SVM）的机器学习方法，该方法在诸如函数拟合、非线性模式识别。小样本等领域都极具优势。

混合模型混合高斯模型-支持向量机：该方法不仅拥有混合高斯模型统计能力强的优点，而且同时有支持向量机分类能力强的优点。

隐马尔科夫模型-人工神经网络模型：首先用隐马尔科夫模型对情感特征向量进行整合，再用人工神经网络进行最终分类识别。

采用投票机制将支持向量机、K最近邻算法、人工神经网络种分类器进行融合。

深度神经网络 DNN：原始语音信号分段输入到网络中，提取局部的情感信息，然后经过处理得到全局情感特征，送到分类器中，得到预测的概率类别。输入一段语音情感信号，可以得到每一段对每个情感类别的预测概率值。

CNN：卷积神经网络广泛应用到语音情感识别中，包括局部不变特征学习模块、情感区分特征分析模块和支持向量机模块三个部分。这种模型结构能够抽取出具有区分性的情感特征。

RNN：能够有效融合上下文信息进行音频情感建模。

CNN- RNN：联合了CNN模型的音频信息表征能力和RNN模型的情感时序建模能力。

胶囊网络：利用胶囊网络，考虑音频特征在声谱图中的空间关系，为获取语音全局特征提供了一种有效的汇聚方法。

基于端到端的音频识别：直接将语谱图或时域波形点作为输入，具有特征自学习能力的优势其性能依赖于数据规模。

注意力机制：有效挖掘不同音频片段对当前情感状态的贡献度。

多任务学习：不同维度情感状态存在依存关系，利用多任务学习机制实现维度情感模型的协同优化。

融合功能副语言信息检测的识别模型：对副语言段和语音段进行区分性建模，有效利用副语言先验信息。

融合说话人信息和文本信息的识别模型：对音频信息、识别的文本信息、说话人信息进行时空融合。

融合区分性训练准则的识别模型：利用三元损失函数解决不同情感状态边界模糊的问题

【本文地址】

今日新闻