计算机如何教自己说话

2018-09-28 08:24:45

机器翻译

最近我们报道了一个相当令人震惊的消息，谷歌的翻译设备在人工智能术语方面取得了重大飞跃- 看起来一直都是这样。利用机器学习，谷歌翻译“教授”本身是一种更好的方式来翻译不熟悉的语言，有效地通过发明自己的语言充当中间人。

任何看过原始终结者电影的人都知道，一旦天网人工智能系统变得自我意识，事情就会迅速变成梨形状。

所以你可能会因为发现机器正在悄悄地开始自己做出创造性的决定而感到有些惊慌。在终结者中，天网迅速从自我意识到引发核浩劫。

机器思考和学习的时代正在我们身上。在硅谷，互联网巨头百度在语音合成方面取得了突破，使人工智能能够学会快速表达口语。实际上，这些机器现在可以在几个小时内自学。

文本到语音系统之前是通过记录个人（通常是演员）大声朗读大量口头语言和常用短语而创建的。

然后以各种组合提供它们以适合它们作为讲话时钟，或卫星导航系统或自动呼叫系统来接听电话。

这种方法带来了一些挑战，例如，如果系统需要扩展并且原始actor不再可用，会发生什么。导航系统通常通过让原始演员记录一些常见的单词部分来环绕这个问题，然后将它们拼凑在一起以形成不寻常的街道名称。

演员将记录常见的地名，如“高街”，但对于非常不寻常的地名，如Torquay的Hellevoetsluis Way（以荷兰小镇的双城命名），该系统将粉碎演员的音节录音以获得在宣布这个词时可以做出的努力。

谷歌最近的研究提出使用一种系统来克服这个问题，该系统反而从观察到的语音中观察声波并用它来发出任何文本的抄本。

神经网络使用深度学习但仍然需要人类训练，并且在它可以在现实世界中使用之前还需要克服一些计算挑战。

部分问题在于，现实生活中发言速度太快，以至于计算无法跟上新发展的步伐。谷歌的解决方案尚未达到与人们交谈的足够速度。