字节跳动在计算语言学顶级会议上获得最高ACL奖

2021-08-06 16:35 来源:凤凰网科技

8月6日,昨天,顶级国际学术会议ACL 2021正式颁发“最佳论文”奖。字节跳动人工智能实验室机器翻译技术论文在提交的3350篇论文中脱颖而出,当选今年“最佳论文”。这是自ACL成立59年以来,中国科学家第二次获得最高奖项。此前,中国科学院计算技术研究所牵头的研究项目被评为ACL 2019年度“最佳长论文”。

ACL大会由国际计算语言学协会主办,是自然语言处理和计算语言学领域的最高级别学术会议。自然语言处理被誉为“人工智能的皇冠上的明珠”,已广泛应用于机器翻译、搜索、信息流、输入法等领域。

近年来,ACL大会收到的捐款数量不断增加,中国队在这一领域取得了令人瞩目的成就。在过去的几年里,他们获得了“最佳长篇论文”、“最佳学生论文”和“优秀论文”的奖项。除了字节跳动获得今年最高荣誉外,大会还评选出6篇“优秀论文”,香港中文大学与腾讯AI Lab合作论文成功入选。

图:ACL  2021公布“最佳论文”评选结果

图:ACL 2021公布“最佳论文”评选结果

字节跳动的获奖论文提出了一种新的词汇学习方案VOLT。词表是所有自然语言处理任务使用的基本组件,其功能就像人类词典的索引。研究人员创新性地将经济学和数学的知识应用到叙词表中:首先用“边际收益”定义叙词表质量的评价指标,然后用“最优运输”的数学方法解决最优叙词表的生成问题,从而在各种翻译任务中取得优异的结果。VOLT研究项目现在对全球开发者开放。

根据ACL的官方评论,“字节跳动的VOLT方案为机器翻译中的一个重要问题提供了一个有效而新颖的解决方案,可以显著减少词汇学习和搜索的时间。相信它不仅会在研究领域产生重要影响,在工业应用方面也有很大潜力”。

据悉,论文的最佳研究成果将逐步登陆字节跳动火山翻译业务,为舒菲、今日头条、火山引擎等产品的企业客户提供机器翻译支持。2021年以来,火山翻译取得了许多重要的技术突破,开发了支持150种语言之间翻译的大规模翻译模型mRASP2。它还开放了业界最快的推理和训练引擎LightSeq2.0和端到端语音翻译工具包NeurST,获得了开源社区的广泛好评。

在ACL举办的机器翻译大赛WMT2021中,火山翻译以独创的“平行翻译”系统参赛,在德英比赛自动评测中获得第一名。当“平行翻译”在国际比赛中首次亮相时,它从左到右击败了传统的逐字翻译技术,打破了后者在机器翻译领域的绝对优势。关于这项技术的论文也包含在ACL 2021会议中。

延伸 · 阅读