文本朗读、文本转音频
不坑盒子中接入了微软Azure的文本转语音功能,可以实现在Word中进行朗读、文本导出为音频文件,可以自由选择播讲人、风格和扮演角色。
使用前提
此功能接入的是微软Azure的文本转语音功能,需要用户填写Azure的密钥,用户自行承担使用额度、费用。微软Azure每月免费50万字额度,如果不是重度使用完全足够了,如果需要重度使用,请付费给微软Azure。
注册、获取密钥的方法
1.进入微软Azure官网:点击进入
可以点击免费开始使用
,也可以直接使用即付即用
。如果点了左边按钮,一个月后,还需要人工来升级为即付即用,即付即用也不是一定要付费,在创建项目时仍然可以选择免费版。
在注册Azure的过程中,需要验证VISA信用卡,这是最难的一个地方,需要自行解决。验证信用卡会扣$1,验证完成后会退回。
创建资源
在Azure的控制面板,创建资源,搜索“语音”,创建即可。
在创建过程中,请按图片中的提示选择和填写:
接下来,你就能拿到Azure的密钥了。
把密钥填写到不坑盒子的设置中
朗读逻辑
朗读功能使用的逻辑是:
当你在Word中拖选中文本后,朗读功能将对拖选的文本生效;
当你在Word中未拖选文本时,朗读功能将从光标从在处一直处理到文档最后。
实时朗读
点击朗读
按钮,即可看到“语音朗读助手”界面。
我们可以自由选择发音人、语气风格、扮演角色、速度。
朗读过程中,会自动选中当前朗读的那一句文本。
生成音频文件
和实时朗读的逻辑一样,只是将文本转为音频文件。生成后会放置到不坑盒子安装目录下的temp
文件夹中。
生成完成后,会自动弹出目录并选中刚生成的那个音频文件。
问题排查
如果你在使用朗读过程中,发现没有声音且文字标注变化得非常快。
那是Azure的密钥失效了,去Azure后台看看,是不是订阅已经被禁用了。
免费试用的订阅一个月后需要手动升级到即付即用,整个过程是免费的,需要人工升级一下。