可解释的文本语义匹配方法、装置、电子设备及存储介质与流程

您所在的位置:网站首页 语义解释 可解释的文本语义匹配方法、装置、电子设备及存储介质与流程

可解释的文本语义匹配方法、装置、电子设备及存储介质与流程

2023-04-11 02:40| 来源: 网络整理| 查看: 265

技术特征:1.一种可解释的文本语义匹配方法,其特征在于,所述方法包括:获取待识别文本,其中,所述待识别文本的字符数大于阈值;对所述待识别文本进行特征提取,得到多个第一候选文本片段和多个第一句子;对文本数据库中的第一候选文本进行特征提取,得到多个第二候选文本片段和多个第二句子,其中,所述第一候选文本为所述文本数据库中多个候选文本中的任意一个;对每个第一候选文本片段进行关键词分析,得到多个第一目标文本片段;对每个第二候选文本片段进行关键词分析,得到多个第二目标文本片段;根据每个第一目标文本片段和每个第二目标文本片段,得到每个第一目标文本片段对应的多个第一相似度;根据每个第一目标文本片段对应的多个第一相似度、所述多个第一句子和所述多个第二句子,从所述多个候选文本中确定出目标文本;将每个第一目标文本片段和所述目标文本中与每个第一目标文本片段所关联的第二目标文本片段确定为解释信息,其中,与每个第一目标文本片段所关联的第二目标文本片段为该第一目标文本片段对应的多个第一相似度中最大的第一相似度所对应的第二目标文本片段,所述解释信息用于解释所述待识别文本和所述目标文本相似的原因。2.根据权利要求1所述的方法,其特征在于,所述根据每个第一目标文本片段对应的多个第一相似度、所述多个第一句子和所述多个第二句子,从所述多个候选文本中确定出目标文本,包括:将所述多个第一句子中包括任意一个第一目标文本片段的第一句子组成为第一文本;将所述多个第二句子中包括任意一个第二目标文本片段的第二句子组成为第二文本;根据所述第一文本和所述第二文本,得到所述待识别文本和所述第一候选文本之间的第二相似度;根据每个第一目标文本片段对应的多个第一相似度和所述待识别文本和所述第一候选文本之间的第二相似度,从所述多个候选文本中确定出所述目标文本。3.根据权利要求1或2所述的方法,其特征在于,所述可解释的文本语义匹配是通过多任务模型执行的,所述多任务模型包括特征提取网络、第一子任务网络、第二子任务网络和第三子任务网络,所述方法还包括:获取第一训练文本和标准文本;将所述第一训练文本输入所述特征提取网络,得到多个第三候选文本片段和多个第三句子;将所述标准文本输入所述特征提取网络,得到多个第四候选文本片段和多个第四句子;基于所述多个第三候选文本片段、所述多个第四候选文本片段、所述多个第三句子和所述多个第四句子,得到与所述第一子任务网络对应的第一损失、与所述第二子任务网络对应的第二损失以及与所述第三子任务网络对应的第三损失;基于所述第一损失、所述第二损失以及所述第三损失,得到目标损失;基于所述目标损失对初始多任务模型进行迭代训练,得到所述多任务模型。4.根据权利要求3所述的方法,其特征在于,所述基于所述多个第三候选文本片段、所述多个第四候选文本片段、所述多个第三句子和所述多个第四句子,得到与所述第一子任务网络对应的第一损失、与所述第二子任务网络对应的第二损失以及与所述第三子任务网络对应的第三损失,包括:将所述多个第三候选文本片段和所述多个第四候选文本片段输入所述第一子任务网络,分别得到每个第三候选文本片段的第一预测值和每个第四候选文本片段的第二预测值;基于每个第三候选文本片段的第一预测值和每个第四候选文本片段的第二预测值,得到所述第一损失;根据每个第一候选文本片段的第一预测值、每个第二候选文本片段的第二预测值、所述多个第三句子和所述多个第四句子,得到所述第二损失和所述第三损失。5.根据权利要求4所述的方法,其特征在于,所述基于每个第一候选文本片段的第一预测值和每个第二候选文本片段的第二预测值,得到所述第一损失,包括:基于每个第三候选文本片段的第一预测值和每个第三候选文本片段预先标注的第一标签,得到第一候选损失;基于每个第四候选文本片段的第二预测值和每个第四候选文本片段预先标注的第二标签,得到第二候选损失;根据所述第一候选损失和所述第二候选损失,得到所述第一损失。6.根据权利要求4或5所述的方法,其特征在于,所述根据每个第一候选文本片段的第一预测值、每个第二候选文本片段的第二预测值、所述多个第三句子和所述多个第四句子,得到所述第二损失和所述第三损失,包括:根据每个第三候选文本片段的第一预测值,从所述多个第三候选文本片段中确定出多个第三目标文本片段;根据每个第四候选文本片段的第二预测值,从所述多个第四候选文本片段中确定出多个第四目标文本片段;将所述多个第三目标文本片段和所述多个第四目标文本片段输入所述第二子任务网络,得到每个第三目标文本片段对应的多个第三预测值;基于每个第三目标文本片段对应的多个第三预测值、每个第三目标文本片段与每个第四目标文本片段之间预先标注的第二标签,得到所述第二损失;将所述多个第三句子中包括任意一个第三目标文本片段的第三句子组成为第三文本;将所述多个第四句子中包括任意一个第四目标文本片段的第四句子组成为第四文本;将所述第三文本和所述第四文本输入所述第三子任务网络,得到第四预测值;基于所述第四预测值、所述第三文本和所述第四文本之间预先标注的第三标签,得到所述第三损失。7.根据权利要求3-6任一项所述的方法,其特征在于,所述基于所述第一损失、所述第二损失以及所述第三损失,得到目标损失,包括:获取所述第一子任务网络的第一任务噪声、所述第二子任务网络的第二任务噪声,以及所述第三子任务网络的第三任务噪声;基于所述第一任务噪声、所述第二任务噪声、所述第三任务噪声、所述第一损失、所述第二损失和所述第三损失,得到所述目标损失;其中,所述目标损失满足以下公式:其中,l为所述目标损失,σ1为所述第一任务噪声,σ2为所述第二任务噪声,σ3为所述第三任务噪声,l1为所述第一损失,l2为所述第二损失,l3为所述第三损失。8.一种可解释的文本语义匹配装置,其特征在于,所述装置包括:获取单元和处理单元;所述获取单元,用于获取待识别文本,其中,所述待识别文本的字符数大于阈值;所述处理单元,用于对所述待识别文本进行特征提取,得到多个第一候选文本片段和多个第一句子;所述处理单元,用于对文本数据库中的第一候选文本进行特征提取,得到多个第二候选文本片段和多个第二句子,其中,所述第一候选文本为所述文本数据库中多个候选文本中的任意一个;所述处理单元,用于对每个第一候选文本片段进行关键词分析,得到多个第一目标文本片段;所述处理单元,用于对每个第二候选文本片段进行关键词分析,得到多个第二目标文本片段;所述处理单元,用于根据每个第一目标文本片段和每个第二目标文本片段,得到每个第一目标文本片段对应的多个第一相似度;所述处理单元,用于根据每个第一目标文本片段对应的多个第一相似度、所述多个第一句子和所述多个第二句子,从所述多个候选文本中确定出目标文本;所述处理单元,用于将每个第一目标文本片段和所述目标文本中与每个第一目标文本片段所关联的第二目标文本片段确定为解释信息,其中,与每个第一目标文本片段所关联的第二目标文本片段为该第一目标文本片段对应的多个第一相似度中最大的第一相似度所对应的第二目标文本片段,所述解释信息用于解释所述待识别文本和所述目标文本相似的原因。9.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器与所述存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如权利要求1-7中任一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-7中任一项所述的方法。

技术总结本申请实施例公开了一种可解释的文本语义匹配方法、装置、电子设备及存储介质。该方法包括:获取待识别文本;对待识别文本和第一候选文本进行特征提取,得到多个第一候选文本片段和多个第一句子、多个第二候选文本片段和多个第二句子;对每个第一候选文本片段和每个第二候选文本片段进行关键词分析得到多个第一目标文本片段和多个第二目标文本片段;根据每个第一目标文本片段和每个第二目标文本片段得到每个第一目标文本片段对应的多个第一相似度;根据多个第一相似度、多个第一句子和多个第二句子,确定目标文本;将每个第一目标文本片段和目标文本中与每个第一目标文本片段所关联的第二目标文本片段确定为解释信息。所关联的第二目标文本片段确定为解释信息。所关联的第二目标文本片段确定为解释信息。

技术研发人员:周倚文 张云云 何剑涛 魏志辉 张文锋 王福海受保护的技术使用者:招联消费金融有限公司技术研发日:2022.12.13技术公布日:2023/4/5



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3