翻译家的饭碗会被机器抢走吗?

时间:2022-04-04 04:13:16

翻译家的饭碗会被机器抢走吗?

当你兴致勃勃地在互联网上搜寻自己感兴趣的资料,特别是“翻墙”去看一些外文资料时,结果发现面对的是一堆堆不认识的单词或符号,会是怎样一种心情呢?

科技的发展会帮助我们解决这种尴尬。过去十年来,技术使机器翻译得到了革新,通过人工智能计算机,机器翻译的能力越来越强,利用软件浏览各种语言网站的梦想正在实现。眼下,新的研究还在不断涌现。最近,美国南加州大学的科学家们利用军事中的密码学,把翻译视为一种“解码”过程。科学家表示,这种技术不但能翻译各种语言,甚至能破译“海豚音”和“外星人语言”。这是真的吗?

“科学家从上世纪50年代就开始研究机器翻译,但长期以来这项研究并未取得大的突破。”南加州大学的计算机科学家凯文·奈特说。最早,他和他的同事采用计算机编码方式,让机器翻译,但效果很差,电脑完整翻译一页内容需要一年时间。

“早期的机器翻译,比较像字典,计算机仅进行一个字一个字地转换,加上一些简单的语法规则。”谷歌翻译研发经理陈雍异说,上世纪80年代个人电脑开始普及之后,机器翻译的技术才开始有了突破。

十年前,机器学习的翻译方式开始出现,这是一种人工智能,机器自己可以学习。可以像人学外语一样,逐渐掌握语言的规则模式。凯文此前的同事、南加州大学的首席科学家弗兰兹·奥切加盟了谷歌公司,令谷歌翻译上升到新的高度。现在,在网页上只要按一个谷歌翻译键,网页整段文本就会立刻变成需要的文字。

“谷歌翻译是往计算机内输入大量的文字文本,包括原语言的文本,以及对应目标语言人工翻译的文本。”陈雍异说。这两种语言文本,称为“平行语料”,机器会对海量的文本进行学习,查找各种语言模式,通过统计计算得到认为最为准确的翻译结果。

“这就好像联合国开会时,机器坐在翻译员后面看翻译员怎么翻译,一边看,一边学习,看了比如一万遍后,就知道该怎么翻译了。”凯文说。

机器在学习过程中也需要老师,此时人类可以告诉机器一些语法规则。只要往计算机中输入这些规则后,翻译机器很快就明白了。

凯文说,比较难的情况是遇到中文成语,但是计算机遇到成语第一次可能比较麻烦,之后就不难了。另外一个难处是比较长的词汇,在一些语言如芬兰语中,往往有着超过16个字母的词语,这时,机器就必须对其拆分,然后再翻译。“机器像猴子一样,很聪明。”凯文说。

机器翻译虽然已经和十年前大不一样了,但依然存在很多缺陷。同一个系统的语言,比如英语和法语,因规则相近,所以较好翻译,但不同的语言系统就难了。“英语翻西班牙语很棒,英语翻汉语还行,英语翻日语就很差。”凯文说。

就像一个学习外语的人坐在一大堆外语教材和字典之前一样,机器学习的基础就是得有大海一样的文本材料供其学习。但是世界上有4000种语言,大部分语言是不常用的,没有那么多的文本,那怎么办?

同样是南加州大学的科学家、凯文的同事苏吉斯·拉维想到了一个新的办法。2011年6月19日至24日,在美国俄勒冈举行的计算机语言学年会上,他提交了一种全新的机器翻译方法。

这种方法叫做“解码外语”,之所以叫“解码”,是因为他们把英语视为一种初始语言,需要翻译的外语类似一种加密后的高级文字,通过解码破译,把外语“破解”,变成英语。

拉维表示,这种翻译方法目前只能翻译一些短句或电影字幕,尚未运用到长句或片段翻译中。但是,它给机器翻译打开了一条新的思路,可以运用到任何一种语言中。因为不需要任何既有的文本为基础,这种翻译方法今后甚至可破译“外星人语言”或“海豚音”。

(选自《科学大众》2011年第12期)

上一篇:神奇的「汗血宝马 下一篇:能力诞生于一百个问号之后