澎湃Logo
下载客户端

登录

  • +1

对话博鳌AI同传负责人:为何明知挑战这么大,腾讯还要坚持

澎湃新闻记者 杨鑫倢
2018-04-17 19:07
来源:澎湃新闻
10%公司 >
字号

2018年博鳌亚洲论坛首次采用人工智能同声传译(以下简称“AI同传”),但是这套系统翻译的表现,在网上引起不小的讨论。

4月12日,博鳌论坛AI同传官方合作方、腾讯翻译君负责人李学朝接受澎湃新闻(www.thepaper.cn)记者电话采访对质疑作出回应。李学朝坦言,AI翻译在目前还需要不断完善,现场语种多元、话题专业性强、噪音干扰多,肯定会遇到各种问题,首次接受国际会议大考,希望各界对AI翻译有合理的预期。

在本次博鳌部分论坛上,腾讯提供了同传双语内容会议现场投屏、翻译结果语音收听的服务,并允许场外观众在微信小程序查看同传内容。但腾讯AI同传被发现多个翻译问题,如外国嘉宾将“一带一路”说反后,AI直接翻译为了“一路一带”;嘉宾中英文混着讲时,AI同传出现大面积单词无意义重复、大小写及字符混乱的情况;还有时,AI同传不翻译却连续吐出十几个相同字符。

随后有网络传言称,“腾讯AI博鳌同传还是需要人类,紧急招募人工同传协助。”

李学朝表示这实属误会。他解释道,那天,腾讯新闻团队为了直播需要,找了人工同传。腾讯有两个团队服务博鳌,一是负责现场会议的AI同传团队,一是腾讯新闻团队。

实际上,各方都预料到之后可能出现的种种问题。

博鳌论坛现场。

博鳌开幕首日,腾讯董事会主席兼首席执行官马化腾在微信朋友圈中表示,“在博鳌的朋友麻烦现场反馈一下同传效果如何。新尝试,多包涵。”

“博鳌主办方也知道AI同传的现状在准确度方面肯定达不到百分之百,博鳌会议规格高,翻译难度大,但依然愿意去做这种尝试,这种对创新支持的态度感染了我们。”李学朝说。

李学朝不愿谈及拿下博鳌项目的具体过程,但关于合作费用问题,他透露是免费的。

一些自然语言处理专家认为,腾讯敢于做这类会议的同传“勇气可嘉”。

“腾讯同传的表现是在意料之中的。”爱尔兰都柏林城市大学教授刘群向澎湃新闻记者表示,近年来神经网络技术的应用使得机器翻译的水平有了大幅度的提高,但最近一段时间以来关于机器翻译的宣传使得大众对机器翻译的期待过高。

刘群说,谷歌和微软的论文都宣称机器翻译达到甚至超过了人类翻译的水平,但这样的结论都是在严格的限定条件下才成立的。一旦跨出给定的领域,或者领域数据不充分,结论肯定是不成立的。

“当然,这次大规模测试也暴露了腾讯同传的一些问题。”刘群说,同传技术与一般的机器翻译不完全一样,它并不仅仅是语音识别和机器翻译的简单组合,而需要有效融合;语音识别在这种高噪音、高多样性的环境下如果表现不稳定,也会导致后面的机器翻译无法给出合理的译文。

东北大学教授、小牛翻译负责人朱靖波告诉澎湃新闻记者,AI翻译从开始基于规则的方法,到上世纪九十年代的统计方法,再到最新的深度学习方法,经历了几个范式,性能得到了巨大提升。但是由于语言的多样性和复杂性,通用的AI同传可能无法在短期达到完美。

李学朝认为,AI同传和人工同传各有优势,两者适用不同的场景。AI翻译速度快,人工翻译质量高,可以相互合作。

在接受澎湃新闻记者近一小时电话采访中,李学朝还被问及腾讯的AI翻译战略、对AI翻译前景的判断、与科大讯飞搜狗的竞争、是否会做最近大热的翻译机、AI翻译的内部赛马机制等问题。

腾讯翻译君负责人李学朝

以下是澎湃新闻记者与腾讯翻译君负责人李学朝的对话实录:

回应质疑:外界对AI同传的关注度超过预期

澎湃新闻:最近网上关于博鳌同传AI的非议很多,你对腾讯AI同传这次翻译情况是否满意?

李学朝:腾讯同传能第一次登上国际大会,整体表现还是符合我预期的,有好例子也有坏的例子冒出。这类跨领域讨论型会议的同传对任何AI系统都有巨大挑战,参与嘉宾是多国的,每一种语言在会上自由讨论、自由切换,口音也各不相同,在一些场景下有可能触发Bug或者不翻译的情况,这也是AI系统可以持续进化的地方。我们预料到意外情况的发生,但行业对AI同传的关注热度超过我们预期,给了我们多维度的输入,这也是我们这次收获最大的地方。

澎湃新闻:有传言称,腾讯AI博鳌同传效果不佳,于是紧急招募人工同传协助?

李学朝:腾讯同传是百分之百的AI同传,网上传言实属误会。实际上,腾讯有几个团队服务博鳌,一个是负责现场会议的AI同传团队,还有一个是负责直播的腾讯新闻团队。发生误会的那天,有一场分论坛的人工同传线路没有直播声音传过来,所以腾讯新闻团队为了工作需要,找了人工同传。而那个会场没有腾讯AI同传在支持,不是全部的博鳌论坛都支持腾讯AI同传。

澎湃新闻:为什么只有几个论坛支持AI同传,而不是所有的论坛?

李学朝:我们为了保证同传速度,都是在现场用服务器直接部署到本地,所以在这种情况下,我们没有准备那么多套服务器能一下子服务全场的会议。

澎湃新闻:为什么将“一带一路”的英语错误翻译成了“一路一带”?

李学朝:嘉宾在会场上发言比较口语化,在英文表达的时候把“一带一路”说反了,说成the road and belt,机器就把它当成字面的意思直译出来了。这就是人跟机器的区别吧。如果是人工的话,就有很大的容错,会把它翻译成“一带一路”。

澎湃新闻:既然是人工智能系统,为什么它没有反应过来是嘉宾说反了?

李学朝:这是当前人工智能翻译技术现状,它无法结合上下文去校对发言准确性,现在技术上一些学术圈内开始有这方面的研究,但是还没有到产品实用的阶段。目前,我们已专门针对上面“一带一路”可能的错误表达个例做了强制转化。不过人类语言很丰富,我们没有办法穷举所有可能说错的情况。

澎湃新闻:有张截图显示,AI同传过程中,出现不翻译情况,反倒生成了很多for。

李学朝:出现这个情况主要是包括神经网络机器翻译在内的深度学习算法,在原理上或多或少都有一定不确定性,在特定的情况下有一定概率引发翻译偏差。嘉宾重复说了4个for,刚好这种情况触发了系统把它翻译成更多的for出来,而翻译引擎不巧放大了这个重复,出现翻译错误,我们在技术与产品方面会有针对性优化。

澎湃新闻:像噪音、语言口音的问题怎么解决呢?

李学朝:之前大家看到的AI同传大多是用在单场个人演讲中,尽管那已经很复杂了,但相比讨论型会议,复杂度还是低的。博鳌这类国际讨论会议中,多国嘉宾同场参与、多种口音、多语自由切换或中英文夹杂,多噪音等特点,复杂度很高,对AI同传有极大的挑战。

硬件方面,可以用更多有指向性的设备,比如麦克风阵列;另一方面,也需要提高语音识别技术。这些问题需要学术圈、企业、科研机构等一起努力来解决的。

中英文混讲导致大面积单词无意义重复、大小写及字符混乱。

澎湃新闻:据现场记者反映,嘉宾如果中英文混着讲的话,AI翻译也会凌乱。

李学朝:中英混讲的情况,确实对系统也很挑战。目前我们系统的做法会判断这一句话到底中文多一些还是英文多一些,来决定翻译为哪种目标语言。在中英双语切换频繁或一个单句包含的中英文量级差不多时,后台中、英文识别引擎就会同时开始工作,会导致两种识别引擎互相“掐架“,翻译结果只能选择一种语言进行输出,有可能出现句子中的中文也被当作英文了,所以这时候就有可能出现翻译错误的情况。

幕后故事:免费向博鳌提供AI同传服务

澎湃新闻:为什么明知道博鳌这个会场的情况会特别复杂,但是腾讯还是要坚持做AI同传呢?

李学朝:我们确实预测到难度比较大,因为这种会场规格高,难度又很大,但是博鳌作为主办方,愿意去做这种尝试,也知道AI同传的现状在准确度方面肯定达不到百分之百,这种对创新支持的态度感染了我们,也是一个向国际及行业内外展示AI同传当前进展状态的机会,因此我们认为这是一次很好的历练。

澎湃新闻:参加博鳌之前,预期AI同传准确率大概达到多少,现在看来实际的准确率大概是多少?

李学朝:基本上,语音识别翻译准确率在90%以上,目前看来和我们的预期差不多。但由于比我们之前支持同传的会议要复杂,所以最后准确率的数据还需要做进一步统计。

澎湃新闻:腾讯是怎么接到博鳌同传的项目的?

李学朝:博鳌亚洲论坛从会议主题到会务细节都秉承开放、创新的精神。每一届都会邀请代表科技前沿的产品进行技术展示。AI同传是一个方向,博鳌选择了腾讯同传。我们针对博鳌做了非常充分的准备和技术升级,把博鳌往届的视频拿过来在系统中进行测试,经过反复验证,最后才把这套系统拿出来。

澎湃新闻:给博鳌提供项目的价格?

李学朝:这个合作是免费的。

澎湃新闻你认为AI同传和人工同传是什么关系?

李学朝:AI同传和人工同传各有优势,两者适用不同的场景,可以协同。很多会议条件不允许,无法为每个语种请一个同传;一个会议需要多个人工同传轮流支持,非常耗精力,这时候AI同传能做协同。但AI同传不能百分之百翻译对,也需要与人工同传合作。人工同传在会议之前往往也需要学习,来补充不同行业的知识。

谈行业:各家重回新的起跑线

澎湃新闻:在AI翻译方面,前有科大讯飞和百度,为什么腾讯也介入进来了,并加大了投入?

李学朝:主要两个因素吧,一是翻译的用户场景和需求,二是机器翻译技术变革。腾讯翻译君是在公司鼓励内部创业的背景下,我们团队孵化的一个项目。最初是为了帮助出国旅游的用户解决语言问题,然后看到腾讯许多产品的用户都有外语使用需求,有很好的结合场景。腾讯翻译君是2016年发布的,在2016年之前的机器翻译技术并没有让用户非常满意,我们观察到神经网络机器翻译技术是一个新的机会,一个技术转折点、并决定走这一新的技术路线。目前,大家都在用这套新的技术路线,各家又回到了新的起跑线。实际上,腾讯翻译君全量部署与使用神经网络机器翻译技术,反而是业界最早的一批。

澎湃新闻:这两年国内外公司都在大力投入AI翻译,你如何判断AI翻译市场的前景?

李学朝:这个市场还是有前景的,技术的演进让AI翻译质量有了较大提升,在一些特定的领域或场景已经可以辅助人类做更多事情,比如在旅游、会议等场景,多家公司也都推出了翻译App,但当前AI翻译技术还在发展中,还没有到完美的阶段。目前学术圈研究热度与各公司的技术升级迭代速度都保持的不错,相信AI翻译在与现有产品或行业结合的落地场景会有挺多机会与新的尝试。

比如,腾讯翻译君现在已将AI翻译的能力以服务的方式在腾讯云和AI开放平台开放出来了,包括微信、QQ、QQ浏览器、王者荣耀海外版(AOV)、金山词霸、VIPKID、富途等几十个产品或不同行业的客户在使用。目前,腾讯翻译君这套服务每天请求数量已经超过4亿次了,腾讯同传近期也入围了中国人工智能产业发展联盟组织的《中国人工智能产业发展联盟人工智能技术和应用案例集》。我们希望腾讯翻译君赋能合作伙伴,也期望与行业一起合作让AI翻译更强大。

澎湃新闻:科大讯飞和搜狗推出了翻译机硬件产品,腾讯未来会不会做翻译机?

李学朝:我们要看翻译机是否能更好满足一些用户需求或场景。目前也有一些厂商找我们沟通,在未来,我们不排除这种可能性,目前还没一个确定的结论。

澎湃新闻:如何理解翻译机这种产品形态?我可以用手机翻译,为什么还要再拿一个翻译机呢?而且翻译机的价格还不低,都要一千元以上,相当于买一个手机的价格了。

李学朝:你说的这一点确实很认同,也是我们在考虑的问题。现在看这个市场很火,出货量各方面在升温,肯定也是有需求和场景的,我们是抱着一个开放的态度,持续去关注这个事情。

澎湃新闻:腾讯内部,有几个团队在做AI翻译?

李学朝:腾讯内部有赛马机制,腾讯内部做同传也有几个方案。腾讯同传是基于腾讯翻译君和微信智聆研发的一套方案。2017年底,我们公司年会,有两套同传系统同时为年会服务。公司几个大老板现场演讲,两套同传系统在左右两边同时输出PK,这个事件对我们的触动是非常大的。最后结果出来以后,让我们看到AI翻译在会议同传方面可以做更多的事情,所以我们这两个团队又都做了更多演化,然后在更多的会议应用和实践。

    责任编辑:孙扶
    校对:刘威
    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈