(资料图片)

IT之家 12 月 23 日消息,微软 Azure 神经网络版文本转语音服务(Neural TTS)作为 Azure 认知服务下的一项强大的语音合成功能,开发人员可使用 AI 将文本转换为逼真的语音。自其面世以来,Azure Neural TTS 已被应用于各种使用场景,包括电子书、语音助手、视频音频制作、界面朗读等等。

图源 Unsplash

现在,通过新语言扩展,微软 Azure 神经网络版文本转语音服务总共支持 147 种语言 / 方言。此外,还发布了 46 个新的平台预制声音,以及更多的情感支持。至此,Azure 神经网络文本转语音服务声音家族共提供 449 个声音供客户选择。

IT之家获悉,微软 Azure 神经网络文本转语音服务现在新增 2 种语言:巴斯克语和亚美尼亚语。公共预览版推出两种新的中文语言方言:吴语和粤语。

Azure 语音合成服务为每个语言都提供了至少一个女声和一个男声。但是,在实际使用中,很多场景需要用到多个声音来实现多样性或者进行多角色自然对话。现在,微软带来了 46 个新声音的公开预览,这包括英语(澳大利亚)、西班牙语(西班牙)、韩语(韩国)和日语(日本)。这些新声音覆盖了不同的角色和年龄,可以为不同的业务场景带来更多的选择。这些声音目前可以在 3 个 Azure 数据中心使用:美国东部、西欧和东南亚。

越来越多的场景需要根据不同的内容来表达不同的风格和情感。微软还在不断地赋予更多的语言和声音多种不同的情绪风格,包括支持更轻松的聊天或表达欢快的情感。

在 2022 年 5 月,微软 Azure 在英语(美国)预览版中发布了 5 个新声音和 10 种语音风格,并在 2022 年 6 月预览了西班牙语(墨西哥)、意大利语和葡萄牙语(巴西)的若干新声音。微软将把这些声音和风格进一步在更广泛的服务区域进行提供。

微软 Azure 认知服务更新更多内容查看,点此链接。

推荐内容