火星科技网您的位置:首页 >人工智能 >

谷歌的Translatotron将语音直接翻译成语音

导读 谷歌宣布Translatotron是一个实验性新系统,它表示将把语音直接翻译成语音,不再需要任何文本。Translatotron是第一个能够直接将语言从一种

谷歌宣布Translatotron是一个“实验性新系统”,它表示将把语音直接翻译成语音,不再需要任何文本。

“Translatotron是第一个能够直接将语言从一种语言翻译成另一种语言的语音的端到端模式,”周三谷歌AI博客文章称。

谷歌表示,今天的翻译系统分为三个阶段:自动语音识别,将语音转录为文本;机器翻译,将此文本翻译成另一种语言;和文本到语音合成,它使用该文本生成语音。

这些步骤的层叠导致了谷歌翻译等服务,但这家技术巨头现在表示它将使用单一模型而不需要文本。

“被称为Translatotron,这个系统避免将任务分成不同的阶段,”Google AI软件工程师Ye Jia和Ron Weiss的博客文章说。

谷歌表示,这意味着更快的翻译速度和更少的复合错误。

该系统使用频谱图作为输入并生成频谱图,同样依赖于神经声码器和扬声器编码器,这意味着系统在翻译后保留说话者的声音特征。

标签:

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。