首页 ☉  科技  ☉ 译见||机器翻译的梦想与现实

译见||机器翻译的梦想与现实

2019-11-12 18:46:14

资料来源:《光明日报》

这篇文章来自:语言科学

如何突破语言障碍,让机器完成不同语言之间的自动翻译,最终实现任何语言在任何时间、任何地点的无障碍、自由交流,是人类的长期梦想。

近年来,随着计算机性能的提高,云计算、大数据、机器学习等相关技术发展迅速,人工智能再次兴起,机器翻译再次成为人们关注的焦点。当时,机器翻译系统如雨后春笋般涌现,各种报道如潮水般涌来。“机器翻译将取代人类”的说法也时有所闻。然而,机器翻译的真正水平是什么?梦想和现实之间的距离有多远?

从萧条到繁荣

机器翻译的概念于1947年提出,随后成为人工智能研究的核心问题。在70年的发展中,机器翻译研究经历了几个不同的历史阶段:

从构思到1954年乔治城大学在ibm的帮助下实施第一个机器翻译演示系统,它可以被认为是机器翻译的初始阶段。

1966年,美国国家科学院自动语言处理咨询委员会(alpac)发表了一份题为《语言与机器》的报告,声称“目前没有很多理由大力支持机器翻译研究”,并且“机器翻译遇到了不可逾越的语义障碍”,从而导致了机器翻译研究的世界性衰退。

从1970年代中后期到1980年代初期,一些机器翻译系统最初被应用于特定领域(如由加拿大蒙特利尔大学开发的天气预报翻译系统taum-meteo)。欧洲共同体实施的欧洲翻译系统(eurotra)计划和日本对第五代计算机的研究都支持机器翻译研究,机器翻译研究已经开始复苏。

20世纪80年代后期,ibm实现了一个基于噪声通道模型的统计机器翻译系统,并在arpa组织的评估中取得了良好的效果,促进了机器翻译技术的快速发展。尤其是2000年以后,吉萨、法老、摩西和其他开源工具相继发布。谷歌翻译于2006年正式上线,百度翻译于2011年上线。大公司纷纷推出自己的翻译系统。机器翻译的整个领域呈现出蓬勃发展、遍地开花的良好态势。

2013年,提出了基于神经网络模型的机器翻译方法(以下简称“神经机器翻译”)。机器翻译的质量得到了极大的提高,许多开源工具相继问世。机器翻译技术的研究和系统的推广应用空前盛况。统计机器翻译和神经机器翻译的基本原理是基于现有的大规模句子级双语对比语料库进行模型训练,建立最佳翻译模型,最终实现从一种语言到另一种语言的翻译。通常,用于训练模型的语料库越大,模型的性能越好。

夸张的技术

机器翻译技术的进步和系统性能的提高给人们的日常生活和工作带来了更多的便利,也为该技术的产业化发展带来了更多的商机。这种前所未有的局面不仅让人们看到梦想成真的希望,也点燃了一些人心中无法抑制的渴望。从传统媒体到新媒体,有许多声音夸大和宣传机器翻译技术。然而,不可否认的事实是,目前的机器翻译技术还不成熟。无论是文本翻译还是口头翻译,机器翻译的质量远未达到令人满意的水平。

目前所有商业文本机器翻译系统的常见问题;

首先,错误、遗漏和重复翻译很常见,尤其是习语、缩写、专业术语以及人名、地名和组织机构名。

其次,很难在文本中实现回指解析,这常常导致失败。例如,我之前说的是美国和伊朗之间的关系,而我后来翻译的是“美国和伊拉克”。

第三,缺乏足够的在线优化能力,无法从译者的修订过程中自动学习和更新翻译知识。即使译者反复修改系统给出的错误翻译,系统仍然会出错。

第四,对于英语口语来说,说话者的语调、重音、语调甚至肢体语言都不能得到充分的利用,尤其是当说话者的口音很重、词语太不常见、语篇的主题超出了先验知识的范围时,翻译的质量就不能得到保证。

高端翻译是不可替代的。

我们不否认机器翻译技术的进步。如上所述,机器翻译的质量有了显著提高。在日常口语对话中,对于资源充足的语言(如英语、汉语、日语等)。),口语翻译的表现在口语场景不是很复杂,重音是基本标准,语速基本正常,词汇和句型的使用并不少见的情况下,基本能够满足正常交流的需要。当训练语料足够用于专业领域的文本机器翻译时,翻译的准确率可以达到80%以上。然而,缺乏资源的语言(如波斯语或大理语和汉语)之间的翻译质量仍然非常有限。

毫无疑问,机器翻译可以取代那些任务重复、翻译难度较低的低端翻译,如天气预报查询、酒店预订服务、交通信息咨询等。,但不可能取代高端译者(如翻译重要文件、伟人作品、文学名著等)。),甚至不可能消灭翻译职业。“信、达、雅”是翻译的最终目标。我们可以期待未来的机器翻译系统能够帮助高端译者提高翻译效率,但实现高质量的自动翻译而不需要人工干预仍然是一个愿望。

必须说,任何负责任的科学家和商业界都有责任和义务向公众通报技术或产品的真实水平和性能,而不是为了利益盲目推广甚至迷惑。实事求是既是一种态度,也是一种品格。

宗成庆:中国科学院自动化研究所研究员


快乐10分开奖结果 山西十一选五开奖结果 广西快3 天津十一选五开奖结果