VITS语音模型

您所在的位置:网站首页 娜娜翻唱《终点》 VITS语音模型

VITS语音模型

2024-07-05 05:06| 来源: 网络整理| 查看: 265

    1.本站提供的语音模型可将声音(干声)转换为模型训练的音色;任何发布到视频平台的基于本站模型创作的视频,都必须要在简介明确指明用于变声转换的输入源歌声、音频,例如:使用他人发布的视频/音频,通过分离的人声作为输入源进行转换的,必须要给出明确的原视频、音乐链接;严禁使用该项目从事违法行为与宗教、政治等活动,本站坚决抵制上述行为;使用者必须严格遵守以上要求及相关法律法规,严禁滥用模型生成违法违规内容;特别提示,使用者的使用痕迹及输入/生成内容均会被日志保存,本站已进行劝导义务,一切不遵守上述规定产生的后果,由使用者自行承担,继续使用本站提供的服务则视为已同意本条所述相关内容。

    2.可在线体验的模型均已挂载于魔搭社区,可通过页内“在线体验”快速跳转开始使用。语音生成速度受转换声音的音频长度和魔搭社区服务器分配的计算资源限制,生成会比较慢,请耐心等待!有长期使用打算可考虑下载离线模型在本地部署使用。

    3.在线体验语音转语音(翻唱)功能需自行准备干声文件。特别提示:因模型普遍受训练集过少或训练集缺乏高音及低音的素材,因此模型或多或少都会有不擅长高音或低音的情况,表现方式为转换出来的声音是哑音,遇此情况请按需选择或考虑混合使用。如音频转换报错可能是魔搭平台创空间的核心库出错或未正确部署,有硬件条件建议下载部署包本地部署使用。

    4.在线体验文字转语音功能时如选择语言(即内置TTS模型)为Auto,生成的效果不太好时,请自行调整内置TTS语言模型至你认为最好的一个(详见在线体验页中模型的在线推理页)。 (个人建议女声语言选择zh-CN-XiaoyiNeural,男声语言建议选择zh-CN-YunyangNeural)。

    5.本项目内提供的模型版本(Version)与训练步数(Step)的比例关系是1:10000,例如:v1.0=10000step、v6.1=61000step。

    6.如想在本地离线部署并使用,请前往模型下载页下载一键部署包及模型文件,Python环境部署详见部署包内教程文档。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3