澎湃Logo
下载客户端

登录

  • +1

Facebook翻译革命性突破:速度是谷歌的9倍,更准确

澎湃新闻记者 王歆悦 实习生 吴峻
2017-05-11 08:36
来源:澎湃新闻
10%公司 >
字号

美国时间5月9日,Facebook 的人工智能(AI)研究团队宣布,已经开发出一项新的语言翻译技术,翻译速度及准确度均超越谷歌翻译。这项技术再次印证了社交媒体的使命:让世界更开放、更紧密。

语言成为了不同母语的人群间相互交流的障碍,所以突破这层阻拦是社交平台完成使命的必经之路。此前,Facebook可以自动翻译超过45国语言的状态内容,但是Facebook的CEO扎克伯格称“仍有进步空间”。

谷歌机器翻译系统基于循环神经网络(RNN),是老牌翻译系统,已经处于领先地位。但是,微软于2016年12月推出了最新技术,在翻译复杂句型时可以较灵活调整语序,准确度较高。

Facebook的人工智能程师Michael Auli和David Grangier介绍,他们的翻译技术突破在于发挥卷积神经网络(CNN)独特优势,使其性能超越基于RNN的翻译技术。谷歌机器翻译系统是基于RNN,这意味着Facebook翻译速度将是谷歌的9倍。

CNN和RNN是两种神经网络,被用以处理数据序列。RNN是循环分析数据,严格按照句子从左到右的顺序一个字一个字进行翻译。而CNN可以同时从不同角度捕捉数据,更好地契合机器图形处理器(GPU)硬件系统,CNN的特性和GPU的并行计算功能相辅相成。

GPU是为处理视频游戏中的图像而设计的。据彭博社报道,CNN与其的结合意味着用户将有机会在Facebook查阅的每一项内容,都以用户的习惯语言表述,不仅是状态文字,还有视频。

在翻译技术突破方面,另一项杰出表现是使用多跳注意力(multi-hop attention)和门控(gating)来改善翻译效果。注意力机制类似于人在翻译时的断句,系统在翻译时会回看和多次看整个句子来选择下一个翻译的词语,这样更接近人类翻译时的顺序。而多跳注意力是其升华版,利用网络反复回看,做出最符合的翻译。

使用多跳注意力进行编码到解码的过程示意。

门控是用来控制神经网络内的信息流动,决定某一特定信息是否可以通过并传输到下一个神经元。在选择下一个翻译的单词时,神经网络会考虑到目前为止所做的翻译。门可以任意放大某一部分的翻译或者整体的大意,以确保接下来选择符合的语境。

目前这项技术还停留在研究阶段,没有完全开发并在Facebook产品上发布。但是,该技术已经应用在翻译状态更新上。

Facebook称已经公开这项翻译资源的源代码,大家可以利用该资源来满足个人翻译需求。除了翻译,这项技术还可以被广泛应用到其他语言类项目。

    校对:张艳
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈