机器翻译迎来又一春?

时间:2022-07-21 07:58:04

机器翻译迎来又一春?

在市场准备充分的情况下,机器翻译软件能否迎来又一个春天,将取决于其技术创新是否具有足够的征服力。

在2000年前后,机器翻译软件的市场曾一度红红火火,随后却很快地销声匿迹了。就在人们几乎要忘记它的时候,机器翻译发展到今天又有了复兴的迹象,看上去,机器翻译似乎将迎来又一个春天。只是希望这次,我们能吸取以前的教训,使春天更长一些。

曾经的风云变幻

机器翻译(machine translation),又称机译(MT),是利用计算机把一种自然语言转变成另一种自然语言的过程。用以完成这一过程的软件叫做机器翻译系统。早在1946年,电子计算机问世不久,美国人沃伦・韦弗、英国人A・D布思就提出了机器翻译的设想,此后各国开始进行机器翻译的研究和开发。从1956年开始,我国也开始了机器翻译的研究,在“六五”、“七五”、“八五”和高技术研究发展计划(863计划)期间国家均把机器翻译列入重点发展项目。早期机器翻译主要以研究机构的学术开发为主,到了1992年,我国迈出了机器翻译软件商品化的步伐。中国软件与技术服务股份有限公司(以下简称“中软公司”)在JFYⅢ翻译系统之上成功推出了“译星”1号软件产品,从而带动我国机器翻译进入了一个发展热潮期。

继中软之后,国内众多的软件公司相继涌进这一领域。国内的机器翻译软件一时达到百种之多,根据这些软件的翻译特点,大致可以分为三大类:词典翻译类、汉化翻译类和专业翻译类。

词典类翻译软件有金山软件公司的《金山词霸》。这类软件相当于一种电子词典,它可以迅速查询英文单词或词组的词义,并提供单词的发音,为用户了解单词或词组含义提供了便利。

汉化翻译软件的代表之一是北京实达铭泰公司开发的《东方快车2000》,这类软件主要满足用户汉化英文软件、英文网页,实现对屏幕英文信息的了解和文章的初步翻译等,对信息获取、了解文章大意有实际作用。

专业翻译系统,则以译星为代表,是面对专业或行业用户的翻译软件。这类软件具有传统语法规则的翻译内核,追求自动翻译的可读性效果。

当时机器翻译软件市场的繁荣与互联网刚刚在国内兴起的大环境密切相关。由于互联网上中文信息还很少,用户迫切需要翻译软件来辅助他们快速阅读英文信息,另外,一些外来的软件在国内还没有中文版,也需要通过第三方途径将其汉化才能正常使用。一时爆发的需求使得人们以为机器翻译软件充满了希望。

然而,现实并不是看上去的那么美好。语言专家回忆当时的情况总结说,一方面,互联网使当时的用户经受着层出不穷的新事物新方式所带来的冲击,认为计算机什么都能做到,机器翻译软件完全可以代替人的工作的心理在当时也不足为奇。而另一方面,机器翻译软件最高潮的时期,各厂家为了争夺市场,采用一些过分的宣传误导了用户,有的甚至说自己的翻译准确性达到了90%以上,这导致了用户对翻译软件期望过高,而实际使用时又失望过大,用户对机器翻译软件产生了不信任感,导致整体市场口碑下降,由此就有了后来机器翻译软件在市场上的销声匿迹。

这一段由盛迅速转衰的历史其实表明,机器翻译技术本身存在的问题,即翻译准确度低、错误率高等等是阻碍其发展的硬伤。另外,表面看来机器翻译的市场需求很大,但如果理性一些,就会发现这种市场需求的旺盛之上泛着泡沫。对此,我国著名计算语言学与机器翻译专家董振东说:“人尚且做不到什么都能翻译,何况机器。专业翻译人员,包括一些有名的翻译家都会在翻译上犯错误,只是人类会掩盖,即使翻译出来的东西是错误的,他也会保持语句的通顺,给人正确的感觉。而机器不会这么做,有什么错误都会直接显示出来,这也是机器翻译让人感觉错误百出的原因之一。”总之,无论是从用户心理还是技术本身来看,机器翻译软件市场还远未成熟。

复兴契机

从繁荣之巅到谷底,机器翻译软件沉寂了,许多软件厂商撒手而去,这个市场几近销声匿迹。不过,依然有一批人坚守这片天空一直到今天,比如中软公司的机器翻译事业部。

作为第一个将机器翻译软件商品化的软件产品,当年中软机器翻译事业部推出的“译星”可谓是取到了里程碑的作用。机器翻译软件的一度繁荣结束后,中软并没有放弃这块业务,而是继续投入进行了进一步的技术创新和市场拓展。如今,中软又以敏锐的眼光看到了移动设备广泛普及的前景,将“译星”推进了嵌入式领域。

据中软机器翻译事业部负责人刘杰介绍,从2004年,中软“译星”就从以前单一的个人电脑方向,转而同时向嵌入式领域进军。“我们在原有PC系统下,一方面对系统进行优化,另一方面去适应嵌入式系统的需求,最终是要提供给厂商一个纯软件的产品形态。”

刘杰说,“译星”进入嵌入式领域一个重要的目标(同时也是挑战)就是要实现与嵌入式平台之上各种应用软件的集成。她认为,机器翻译技术、印刷体及手写体文字识别技术、语音输入和输出技术、全文校对技术等,同是处于智能应用领域中的技术,都具有很高的实用价值。但是在很长一段时间内,这些技术都“各自为政”,而硬件设备的生产厂商往往把注意力放在集成电路技术的升级和革新,对这些软件技术并不太在意。中软经过多年的努力,不断与其他应用技术提供商和硬件制造商进行沟通,寻求合作和创新。最终,将众多技术结合在一起,组成集成的软件产品面向用户。这样,一方面为用户带来了更多的应用,最大限度地满足了用户的需求,从而体现出智能应用技术的价值;另一方面,集成的产品进一步降低了用户的整体拥有成本(TCO)。

在集成目标的指引下,目前,译星智能翻译软件家族已经完成了基于大多数平台的开发,除Windows、Linux以外,Unix、Cosix、Mac OS X、Windows CE、Mobile、 Symbian等平台上均有译星的产品。译星智能全文翻译(整句翻译)引擎还应用在电子词典产品、学习机产品、手机等PDA产品,并在学习机领域完成了Mips、Epson、Arm、三星等平台的移植。此外,译星智能全文翻译(整句翻译)引擎对软件开发商提供翻译引擎功能接口,可以集成在其他应用软件中,使这些应用软件具有翻译功能。

这些都为译星出击移动设备市场做好了准备。近几年,中国移动通讯市场增长迅速,中国手机用户已经超过3亿,这为移动应用提供了丰富的用户基础。而中软针对这个蓬勃发展的市场已经能够提供包括国际短信翻译网关及其平台、翻译引擎、全文翻译器、电子词典、移动应用软件开发、移动产品测试等在内的翻译产品及服务。中软公司国际软件开发部总经理于世国说:“中软译星目前的工作重点是嵌入式领域的应用创新,特别是移动设备方面,因为市场的需求在这里。”

除嵌入式市场外,在线翻译服务在这几年开始兴盛起来。这类翻译服务主要是互联网搜索类公司创建的,在中国雅虎网站上,用户可以实现英汉、汉英、日汉、汉日的150词以内的快速的文句翻译;Google、百度也可以提供类似的翻译服务。另外,也有部分翻译专业公司提供这种在线的服务。比如如金山公司从“词霸在线”发展到了今天的“爱词霸”,金桥在线翻译等等。这些在线翻译服务暂时都是免费的,主要针对网民用户,与大型的翻译软件有较大区别。

苦练硬功

回顾那一段兴衰史,软件厂商已经认识到应该吸取教训苦练硬功,也就是抓技术创新,提高翻译的准确率和可读性才是最根本的。中软译星继续加大技术创新的投入,据刘杰介绍,如今中软译星已经实现了基于实例、基于模板、基于规则三种翻译方法混合集成的技术创新。这样,目前“译星”的翻译质量得到了较大提高。据介绍,对于一般复杂程度的文章,“译星”英汉翻译系统的翻译准确率在85%以上,“译星”汉英、汉日翻译系统的翻译准确率在75%以上。

众所周知的是,用意译代替字面翻译,可以避免译文的误解,提高译文的可读性。所以,一直以来意译成为机器翻译的不懈追求,如今取得了显著进展。赛迪翻译推出的基于Web词库和混合引擎的新一代“赛迪环宇通”英汉双向翻译系统即是意译技术产品的代表。该软件采用了基于模板匹配、规则与统计相结合的机器翻译方法,以及基于Web词库和可比语料库的新词抽取技术,从而使翻译的可读性大于85%。最新消息显示,赛迪翻译已被北京2008年奥运翻译平台工程选中,将利用自动翻译系统为奥运会做笔译工作。

反思

据中软公司国际软件开发部总经理于世国透露,2006年中软机器翻译事业部的年利润已经达到了千万级别,其中,基于个人电脑和基于嵌入式平台的部分各占一半。在移动手持设备广泛普及的今天,这不禁让人意识到,机器翻译软件在嵌入式领域将具有广阔的应用前景。另外,坚守机器翻译领域的软件厂商在技术上也有了不少创新,那么,这是否意味着机器翻译将迎来又一个春天?

不过,假设这一预想得到实现的话,软件厂商们能否重新复活这一市场呢?从用户的角度来说,人们对机器翻译的期望值可以说已经回归正常,大部分使用者认识到机器翻译只是一种辅助的翻译工具,人的能动性在翻译过程中还不可或缺。也就是说,用户心理和需求都已经到位了,这是毫无疑问的。

但是,从技术上来说,机器翻译系统特别是专业的机器翻译系统的发展是一个持续的过程,需要专业技术的沉淀,绝非一日之功,如果软件厂商们仅仅看到市场的复兴而在没有过硬的技术基础上盲目投入的话,只会是历史的重演,最终,机器翻译的春天也难以为继。

上一篇:打响ERP排位战 下一篇:可视化设计引爆游戏业