微软的技术,直接颠覆了我对听书这件事的看法!

您所在的位置:网站首页 微软在线tts 微软的技术,直接颠覆了我对听书这件事的看法!

微软的技术,直接颠覆了我对听书这件事的看法!

2022-05-28 23:22| 来源: 网络整理| 查看: 265

阿虚一度是对听书不太感兴趣的,AI机械式的发音,固定的腔调、语速,总会丢失那些波澜起伏的剧情所带来的沉浸式情感体验

但最近才知道微软在//Build 2021大会上,发布了旗下 TTS 2021版的人工语音,让我对听书这件事简直是有了革新式的看法

大家可以听听官方网页的示例,新增的这5种中文语音,根本听不出是机器在念,逼真地吓人:https://techcommunity.microsoft.com/t5/azure-ai-blog/azure-text-to-speech-updates-at-build-2021/ba-p/2382981#:~:text=Five%20more%20Chinese%20voices%20are%20generally%20available

对于喜欢听书的人来说,估计和阿虚一样心里只有一个想法吧:赶紧让我体验一下!!!

总之阿虚今天就准备来介绍一下安卓/iOS上分别怎么用上微软这些最新的TTS语音!

1 安卓端

TTS对于多数人,肯定还是用于手机上看小说,所以这里还是先介绍怎么在手机上体验

1.1 TTS

目前最简单的方法就是@ag2s20150909制作的这款小APP了

APP的最新版发布在作者的Github:https://github.com/ag2s20150909/TTS/tree/master/release

▲自己下载这个apk文件

如果你访问Github困难,建议了解《2022 Github加速访问教程》https://mp.weixin.qq.com/s/C5XUgzL3_KGIga2X-LHJuw

将APP下载并安装好之后,点击左上角「设置TTS」,将手机的默认的文字转语音引擎改成「TTS」

然后回到APP内,默认的AI是晓晓,如果你要切换成其他AI,要先勾选「自定义」,然后再点击切换!

阿虚自己是比较喜欢云希这个AI 的声音,讲话风格你也可以自行选择(有新闻/客服/助手/闲聊等等),阿虚自己是用的默认

然后因为TTS是系统级的功能,基本上的电子书阅读器都是支持调用系统TTS来朗读的

你立马就能在你常用的阅读、静读天下这类APP上体验到微软TTS的牛逼了!

▲这俩APP都能在储物间下载

不过这个TTS据悉会时不时存在卡顿、跳读问题,网友们给出的解决方法有以下这些:

换格式

换AI发声人

换时端

换格式的意思是,在TTS右上角的设置中,更改音频流的格式

说白了就是降低音频质量,32kbit/64kbit/128kbit 这些总能明白吧

理论上来说如果是网络问题导致的朗读卡顿,降低音频质量就应该是能明显改善问题的

而会出现以上问题的原因,大抵是因为大家用的都是作者的 API 导致的(或者是作者从某处挖来的),公共服务的缺点自然是用的人越多越不好用...

1.2 大声朗读

如果你想要长期稳定可用的微软TTS服务,还是建议各位用大声朗读这款APP

不过使用这款APP的前提是你得满足这俩条件之一:有国外的 edu 邮箱或者有VISA、MasterCard这类双币卡

但其实没有也有办法,你也可以借助万能的淘宝

现在还是能找到很多 edu 邮箱的卖家的,不过请注意:不是所有的 edu 邮箱都能订阅 Azure⚠️,买之前请自己详询卖家!

或者你也可以选择淘宝找一家虚拟信用卡用于过 Azure 的支付验证(后续使用并不会扣费)

总之若你满足以上条件,你就能自行注册微软 Azure 服务,然后借用大声朗读这款APP,从而获取到长期稳定可用的微软TTS服务啦!

这个APP是由酷安大佬@I I I I I 开发的:http://www.coolapk.com/u/453544(可用酷安打开此链接,此链接为作者ID地址)

不过由于他现在已经隐藏了之前的动态,我没找到他原始发布的动态,你可以点击这里来获取这款APP:https://www.yuque.com/docs/share/276153fb-74a1-4024-b7c7-6d9681be58eb

APP现在已经支持自动更新了,后续也不担心找不到最新版这种问题了

有国外 edu邮箱的话,你可以直接搜「面相学生的Azure」,然后填学校邮箱注册就行了,不需要信用卡(前提是你的 edu邮箱支持过Azure订阅)

要国外 edu邮箱是因为,由于国人大量薅微软的羊毛,国内的 edu邮箱的优惠早被薅没了...

下面阿虚只介绍下有双币卡的情况怎么注册并使用

你别担心:双币卡只是用于过验证,并不会真的扣款,并且后续使用也并不会扣款

第一步打开此地址:https://azure.microsoft.com/zh-cn/free/cognitive-services/

类似于谷歌云,首次注册 Azure 账号即微软云,会免费给你提供12个月的热门服务,还有200美元的服务付费额度,不过我们后续会用到的AI语音服务是有免费版提供的,所以并不用担心1年之后就要收费了

在上方地址「点击免费开始使用」后登录你的微软账号,并填写相关账号信息+勾选协议+填写双币信用卡信息后

耐心等待信用卡验证注册好账号后,打开此地址:https://azure.microsoft.com/zh-cn/services/cognitive-services/text-to-speech/

点击「已在使用Azure?立即免费试用此服务」

在创建资源页面按下图方式进行,只需要注意订阅和Pricing tier处都选择免费选项即可

然后点击底部的「审阅并创建」,等待审阅通过,继续点击一下「创建」

创建好之后,点击「转到资源」

点击管理密钥

你会看到两个密钥,随便用一个就行

把密钥填到大声朗读的APP里即可,然后点击「SSML语音合成标记语言」

输入下方代码并保存,然后就可以随心使用了 ~

关于这段代码,你可以按需调整这3部分:

name="zh-CN-YunxiNeural",即阿虚上图使用的是Yunxi(云希)这款AI语音

style="assistant",表示讲话风格设置的则是assistant(以热情而轻松的语气对数字助理讲话)

styledegree="2",这个值可以指定说话风格的强度, 默认值为1,最小值0.01,最大值2

如果你想要自行更换以上配置,你需要参考微软官方的文档:https://docs.microsoft.com/zh-cn/azure/cognitive-services/speech-service/speech-synthesis-markup

你需要知道的是,每个AI所拥有的 Style 风格是不一样的,比如 Yunyang 目前就只有 customerservice 这一种风格

而 Yunye 则有calm、cheerful、sad、angry等等多种风格可选

最后需要注意的是目前微软Azure的免费额度是每月50万文本转语音字符

最新的免费额度见这里:https://azure.microsoft.com/zh-cn/pricing/details/cognitive-services/speech-services/

2 iOS端2.1 源阅读

iOS上就没有像安卓端的TTS那样装上就能用的APP了

目前阿虚所知仅有「源阅读」这款APP支持自定义添加微软AI语音

具体来说就是必须自己去注册微软Azure账户申请Key才能使用,具体申请步骤就请自行参考本文1.2节了,在此阿虚便不再复述

但是这里有一点非常重要的步骤需要注意:目前iOS源阅读1.4.8版本还不能自定义TTS服务区域,导致目前想要用上的话,必须在最开始创建语音服务时选择东亚地区(East Asia)⚠️

就只有这一点需要注意,后续到是就没啥了

打开源阅读APP,找到设置 » 语音管理 » 创建云语音

服务商选择Azure,语音名称随便输入,然后填入你自己的Key,发音人的设置方法依旧请参考本文1.2节

随后就直接能在听书的时候选择并使用了

另外就是这款APP由于一些原因,在2022年1月的时候从APPStore的中国区下架了,目前想要下载这款APP,需要到国外区的APPStore下载

具体如何注册国外APPle ID,请自行参考我原来的这篇教程:https://zhuanlan.zhihu.com/p/49754407

2.2 云手机

另外一个可行的方法就是之前写iOS微信双开时候提到的,花钱使用云手机了

https://mp.weixin.qq.com/s/fDtU19-QNB3tdDCaPaKOFw

云手机是安卓系统,那你就只需要回头去参考本文第一节的内容就行了

另外如果你不是想用于听书,而是想将微软AI语音用于自媒体配音,相关软件、网站请参看本文原文:https://mp.weixin.qq.com/s/RX3ZtPU4CjcH_tuKtNuxmA



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3