这可能是最像人声的免费文字转语音服务了 |
|
陈蛋蛋
L3
• 2022-01-24 • 回复 10 • 只看楼主
• 举报
|
今天这篇文章可是我花了大价钱(60元)亲自测试的才发布的,傲娇脸
引言
在阅读文章之前,先请大家听三段语音
很显然,上面三段都是人工合成的语音,但是我们明显能感受到,第三段语音合成的更加自然,更加接近我们人类的自然语音,它是利用微软的语音合成技术而来,而前面两段分别是国内的阿里云和讯飞。
或许你对此还有所怀疑,那么就看一下下面这段我从B站下载的最新的微软语音合成技术
https://www.bilibili.com/video/BV1Zw411R7JA?spm_id_from=333.999.0.0
正文
现如今,短视频领域可谓是非常火热,再加上剪映等简单编辑的剪辑软件的出现,人人都可以成为创作者。可是在创作的过程中,配音可能就成为第一个拦路虎。
普通话标准声音好听的人自然不用担心,担心的都是我们这群普通话不标准声音还贼鸡儿难听的小渣渣,不说了,暴风哭泣中。
于是文字转语音这个需求就诞生了。蛋蛋曾经也介绍过文字语音互转的一些网站和软件,其实现在市面上已经有很多文字转语音的软件/小程序/网站了,但很多都是收费的,或者免费范围之内有字数限制,而且最最最重要的一点就是合成的语音机器味道太严重了,一点都不像人声,就像你在前面听到的阿里云和讯飞语音。
就在我一度以为市面上所有的语音合成软件都是这样的情况,直到看到了一个公众号号主(龙轩导航)做的视频,我在留言区好奇地询问是真人配音吗,号主告诉我是用微软语音合成的,我才知道,原来微软的语音合成技术已经如此成熟。于是就诞生了非要写篇文章来介绍一下如何白嫖微软语音的想法了。
本文只涉及到电脑网页端,手机端语音合成方法不在讨论范围之内,因为我针对的也是利用文字转语音好方便大家创作中短视频的场景。
其实我也是在看了B站UP主@良校长的视频教程以后才写了这篇文章,大家如果觉得文字太麻烦,也可以去B站观看他的视频。
当然在此之前,大家也可以先去体验一下微软的语音合成
(只是不能下载,你可以利用自带的录音录下来保存)
https://azure.microsoft.com/zh-cn/services/cognitive-services/text-to-speech/
PS:云希的声音最好听,我也觉得最像真人了。
具体步骤:
1 注册微软Azure账号;
微软Azure是微软的云服务平台,其中就包括文本转语音服务。
打开网站:
https://azure.microsoft.com/zh-cn/
注册微软Azure完全是免费的,包括后续使用文本转语音都是免费的,那开头为什么我说花了60元钱呢?
是因为注册的过程中你需要使用visa信用卡,我没有,只能从淘宝上买了一下。
登录你的微软账号(没有微软账号的就创建一个),点击免费试用Azure,填写好一些信息以后,就来到了注册需要使用visa信用卡步骤,有VISA信用卡的可以直接注册,没有的小伙伴就打开万能的淘宝,直接搜索【微软zaure】。
购买之前可以询问店家是否支持微软的visa注册,价格的话一般是一年60,七年100,然后注册不成功可以全额退款。
2 注册成功以后,我们打开下面网站,选择有声内容创作;
添加好资源,注意定价选择空闲F0,区域选择美国东部,确定好以后,就可以创建语音资源组了。
3 选择新建文本文件,复制粘贴你需要语音合成的文本,然后在右侧优化栏目设置好语言,发音人,场景等等,你甚至还可以设置语速,音量,音调,让其更加逼真。
4 编辑好以后,可以选择导出到本地磁盘。
至此,完成了以上所有步骤,我们也可以正常免费使用微软的语音合成技术了。需要注意的是,免费试用只给了30天的额度,如果需要继续使用,需要升级为免费用户,当然实际并不会产生费用,可以根据B站评论区小伙伴写的步骤升级一下。
另外,在注册过程中,我看到了B站评论区说也可以利用面向学生的Azure服务,这样你就不需要使用Visa信用卡了,只需要一个教育邮箱就够了,但是我又看到了微软好像终止了这项服务,所以我就没再测试,感兴趣的小伙伴可以自己测试一下,搜索【面向学生的Azure服务】即可。
本文的一些步骤可能稍显复杂,对于没有文字转语音的小伙伴来说没有什么值得看的,但是如果你以后有想从事中短视频领域又不想用原声的创作者来说,无疑是帮助很大,也十分方便。
随着科技的发展,以后的语音合成技术会更加成熟,也会越来越接近人声,可以说这是一把双刃剑,有利又有弊,关键在于手握这把剑的人如何利用这项技术了。