AI时代的多角色演播:打开声音世界的新宇宙

您所在的位置:网站首页 配音角色理解 AI时代的多角色演播:打开声音世界的新宇宙

AI时代的多角色演播:打开声音世界的新宇宙

2024-07-17 14:17| 来源: 网络整理| 查看: 265

过去,传统语音服务商多从智能客服、语音助手起家,极少为阅读场景定制符合有声内容中角色人设的AI对话音色。面对如今网文的“爆发式增长”,火山语音历时两年时间围绕网文各类题材中的典型角色,着力打造出适配不同年龄、风格的AI音色矩阵。

目前,AI配音家族已有60多个精品音色,无论是穿越文里的睿智大女主,还是言情文中的霸气冷酷总裁,抑或是青涩校园中的鬼马少女,可以满足大部分小说的角色人设需求。快来感受下火山语音音库中的多样精品音色吧!

02

会「哭」会「笑」

多种情感演绎「以声传情」

在有声内容创作中,仅仅只有音色数量的积累还是不够的,如果在技术上无法达成媲美真人的效果水平,让霸道总裁、大女主用特定风格的声音讲故事,还是无法满足用户“沉浸式阅读”的需求。

为了让AI主播能「哭」会「笑」,像专业配音演员一样表达“深刻的人类情感”,火山语音还为每个AI音色赋予了开心、悲伤、愤怒、恐惧等多种感情,例如:

不仅如此,为了让不同情绪下的演绎更加贴合真人表达,团队还在“副语言”上进行了深入探索。“副语言”也称“类语言”,是指伴随话语出现的某些声音现象,包括语音要素特征,例如停顿、重音、语速、语调等;以及言语的功能性发声,例如笑声、哭腔、急喘、咬牙切齿等。

“我们针对'副语言'现象进行了精细化的建模还原,实现了有声书中常见的重音停顿、疑问反问、笑声哭腔以及各类叹息、叫喊声等,给用户带来更近一步的‘沉浸式体验’。”

PART 2.

除了效果 , 更关注成本与效率

其实对于火山语音来说,在声学技术层面实现高表现力的声音合成并不是最难的,更难的则是「AI多角色演播方案」如何能够更加低成本、批量化的高效率生产。例如在无人工标注的情况下,AI 能否像配音演员一样理解文本,自动区分旁白和对话?能否自动判定句子的情感、重音以及句间停顿?能否快速批量化地生产出高质量有声作品?这些问题,火山语音团队都在不断尝试解决。

01

突破传统生产瓶颈

AI 文本理解模型效率远超人工

在有声内容创作中,能否实现文本的语义理解并自动制作画本,是贴近多角色有声书批量化生产的关键。通常在精品 AI 有声书制作中,往往需要人工对文本进行标识,即划分出对话与旁白,并标识出每个角色的台词以及其表达的情感,但这一过程往往十分耗时耗力,造成精品 AI 有声书很难大规模批量生产的现状。

针对这一痛点,火山语音开发并应用了“AI 文本理解”模型 ,即一套多任务的长文本理解 AI 系统。基于预训练语言大模型在数百万章的小说文本上的大规模自监督预训练学习,通过小说人名识别、对话-说话人匹配以及人物指代消解三个任务,让“AI 文本理解”模型具备自动提取小说中对话角色、自动区分对话/旁白、自动判定对话所属的角色的能力。同时,为了让小说演绎情感丰富,团队还采用了对比学习得到句子情感表征,从而大幅提升对话情感的识别能力。

总体来说模型优化带来的成本降低以及产能提升的收益是显著的。在整体听感与纯人工标注齐平的前提下,AI 文本理解模型可以解放绝大部分的标注人力,大幅缩减标注的时间和成本,这意味着不必维持一个庞大的标注团队,也能让有声书量产成为可能,借助此模型精品 AI 有声书的制作效率得以大幅提升。

图 | 「AI 文本理解」模型

02

AI有声内容创作平台

批量高效的生产工具

值得提及的是,火山语音还自主打造了AI有声内容创作平台,以实现AI多角色有声内容的批量高效生产。简单来说用户只需将目标书籍文本导入,即可由平台自动完成角色的抽取、对话/旁白的区分,同时判定对话所属的角色和情感。在配音环节,用户可以自主选择配置AI音色来匹配书中各角色,也可选择简单标定角色人设,依据平台内置策略一键配音。完成配音后,平台即会根据自动预测的信息完成音频的自动合成和拼接,仅需几小时便可完成一部数千章的成品有声书的生产!

此外,为了满足连载追更用户的听书诉求,平台还实现了连载自动更新的功能,即收到线上文本更新的通知后,几秒钟之内即可完成更新章节音频的生产和上线,用户可以通过听书功能实时追更、无需等待。

最后,为了满足用户差异化的创作需求,该平台还提供了一系列音频调整和精修功能,例如指定特定词语发音;控制句子的停顿、连读、语速和音调等,可以让AI自动合成的音频演绎更加完美。

火山语音,长期以来面向字节跳动各大业务线提供优质的AI语音技术能力以及全栈语音产品解决方案。目前团队的语音识别和语音合成覆盖了多种语言和方言,多篇论文入选各类AI 顶级会议,技术能力已成功应用到抖音、剪映、番茄小说等多款产品上,并通过火山引擎开放给外部企业。

END

图文 | 火山语音团队返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3