京财时报

Facebook用CNN做机器翻译:速度比对手快9倍

http://www.jingcsb.com/ 来源:中国网 发布时间:2017-05-10 18:34:34

        翻译一直是Facebook人工智能研究中最重要的应用之一。毕竟,Facebook的总目标是“让世界更开放、更互联”。对于这种目标的实现,多种多样的语言是一个明显的障碍。为了跨越这一障碍,Facebook本周公布了一种创新的机器学习翻译方法,据称速度比竞争对手快9倍。

目前,这项工作仍停留在研究阶段,Facebook公开了论文,并在GitHub上开源了相关代码。
但该技术尚未被集成至Facebook的产品,Facebook人工智能实验室的研究人员Michael Auli和David Grangier等人在接受科技媒体TheVerge采访时表示,未来Facebook将会把这项技术应用于产品。目前,Facebook已经使用人工智能去自动翻译用户的状态更新。不过,新技术从实验室阶段走到实际应用总是需要花一定时间。
“我们正在与产品团队沟通,希望将这项成果用于Facebook的环境。”Grangier表示,“对语言来说,从研究数据转移至真实环境将带来不同。研究数据用的是新闻风格的语言,而Facebook上的会话则更口语化。”Facebook此前表示,该公司正在建设俚语词汇表,让这样的翻译更简单。
这一项目的研究人员们在Facebook官方博客发表的文章称,通常情况下,人工智能翻译依靠递归神经网络,即RNN,而这种新技术利用了卷积神经网络,即CNN。
RNN以线性方式分析数据,对于一个句子将从左至右进行阅读,并逐个单词地翻译。与此不同,CNN同时关注数据的不同方面,这样的计算方式更适合GPU硬件,而GPU是用于训练当代神经网络的主要工具。
因此,使用CNN模型进行翻译意味着更多地从整体着眼,可以分析更高层次的句子结构。Auli表示:“在文字的基础上,CNN建立起了逻辑结构,有些类似于语言学分析。”
Facebook的CNN机器翻译包括两个步骤:系统读取一个法语短语(编码器),然后输出一个英语翻译(解码器)。也就是说,首先,编码器用CNN同时为每个法语词创建一个向量,然后,解码器逐个生成英语词。每一步,网络的注意力(attention)都会关注整个法语短语,来决定在生成下一个英语词的过程中,哪些法语词是最相关的。
博客文章中用一张动图简单展示了这个系统的工作原理:
解码器有两层,上图展示了注意力在其上如何运行。绿色线条的深度表示每个词的相关程度。
关于这项技术为何没有被更广泛地应用,Grangier指出,人工智能研究者已经在RNN翻译模型方面投入了大量精力,因此更喜欢在此基础上进行改进。他表示:“简单来说,这是因为人们没有在这项技术中投入太多时间。我们取得了一些新进展,让这项技术变得更好。”
【免责声明】 凡本站未注明来源为京财时报(www.jingcsb.com)的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。其他媒体、网站或个人转载使用时必须保留本站注明的文章来源,并自负法律责任。 如您不希望作品出现在本站,可联系我们要求撤下您的作品。联系邮箱:xinxifankuui@163.com

热文推荐

首页 | 新闻 | 财经 | 房产 | 娱乐 | 旅游 | 时尚 | 生活 | 科技 | 健康 | 汽车 | 教育 | 今日北京 | 电子报

Copyright © 2008-2016 备案号:京ICP备09109218号 网络视听许可证:1908457号 增值电信业务经营许可证:京-20080118
关于同意京财时报设立互联网站并提供新闻信息服务的批复

友情链接: 大粤日报 时尚周刊 京晨晚报 投资观察界 新讯网 西北商报网 万亿财富网 中国投资界 新尧网 中国证券期货 广东晨报