Skip to content

文本朗读、文本转音频

不坑盒子中接入了微软Azure的文本转语音功能,可以实现在Word中进行朗读、文本导出为音频文件,可以自由选择播讲人、风格和扮演角色。

使用前提

此功能接入的是微软Azure的文本转语音功能,需要用户填写Azure的密钥,用户自行承担使用额度、费用。微软Azure每月免费50万字额度,如果不是重度使用完全足够了,如果需要重度使用,请付费给微软Azure。

注册、获取密钥的方法

1.进入微软Azure官网点击进入

Azure官网

可以点击免费开始使用,也可以直接使用即付即用。如果点了左边按钮,一个月后,还需要人工来升级为即付即用,即付即用也不是一定要付费,在创建项目时仍然可以选择免费版。

在注册Azure的过程中,需要验证VISA信用卡,这是最难的一个地方,需要自行解决。验证信用卡会扣$1,验证完成后会退回。

微软Azure注册验证信用卡

创建资源

在Azure的控制面板,创建资源,搜索“语音”,创建即可。

在Azure创建语音资源

在创建过程中,请按图片中的提示选择和填写:

创建Azure文本转音频

接下来,你就能拿到Azure的密钥了。

Azure密钥

把密钥填写到不坑盒子的设置中

在不坑盒子中设置Azure密钥

朗读逻辑

朗读功能使用的逻辑是:

当你在Word中拖选中文本后,朗读功能将对拖选的文本生效;

当你在Word中未拖选文本时,朗读功能将从光标从在处一直处理到文档最后。

实时朗读

点击朗读按钮,即可看到“语音朗读助手”界面。

不坑盒子的语音朗读界面

我们可以自由选择发音人语气风格扮演角色速度

朗读过程中,会自动选中当前朗读的那一句文本。

不坑盒子文本朗读并标记

生成音频文件

和实时朗读的逻辑一样,只是将文本转为音频文件。生成后会放置到不坑盒子安装目录下的temp文件夹中。

生成完成后,会自动弹出目录并选中刚生成的那个音频文件。

不坑盒子生成的音频文件

问题排查

如果你在使用朗读过程中,发现没有声音且文字标注变化得非常快。

那是Azure的密钥失效了,去Azure后台看看,是不是订阅已经被禁用了

免费试用的订阅一个月后需要手动升级到即付即用,整个过程是免费的,需要人工升级一下。