翻译软件范文

时间:2023-02-28 13:00:42

翻译软件

翻译软件范文第1篇

翻译软件互联网化是个趋势。金山词霸很早就推出词霸豆豆,而雅虎和网易相继推出各自的桌面翻译软件雅虎乐译和网易有道。谷歌金山词霸的推出更是业内的一枚重磅炸弹。它们无一例外充分将翻译和网络搜索进行了有效结合,提供在线翻译、网络释义等独特功能,一改传统翻译软件的模式,甚至以免费的方式攻城略地。

在向互联网转型的过程中,翻译软件面临着严峻的盈利模式挑战。就目前而言,大多在线翻译软件基本采取的是免费模式,然后通过高市场占有率,向用户推送广告盈利。在国内用户习惯了免费大餐环境之下,软件和互联网企业的盈利和成长之路日益艰难。

如何在收费和免费之间,走出一条共赢的道路?金山词霸的模式是脚踏两只船:一方面坚守收费的金山词霸,另一方面,对于前景无限的在线市场,则是和Google联姻。

英业达公司在翻译软件市场耕耘多年,Dr.eye译典通在企业级翻译市场已经取得了不菲的业绩,服务于电信、金融、制造、服务等众多行业,诸如花旗软件、台积电、富士康、耐克、索尼等都是Dr.eye译典通的忠实用户。

英业达公司副总经理暨软件事业部总经理邱全成说:“传统翻译产品市场萎缩,网络翻译市场在扩大。翻译软件市场目前已经进入一个拐点。英业达一直在服务领域进行耕耘,Dr.eye译典通与widge、百度、Yahoo、谷歌、MSN等知名互联网公司进行异业合作,每月点击查询突破亿次。”

翻译软件范文第2篇

让机器像人一样识别声音

语音翻译(Speech translation)就是通过计算机系统实现持不同语言的说话人之间的话语翻译的过程,也称口语翻译或对话翻译。语音翻译技术一般包括三大部分:语音识别(输入)、机器翻译(转换处理)、语音合成(输出)。

我们知道,OCR识别。可以将纸面上的文字转变成电脑可识别的文本,而语音识别与其类似,不过它是将人的说话语音转变成文本。人的语音是千差万别的,如不同的方言口音,说话时的重复、停顿、错误等,都增加了软件对语音的识别难度。人工神经网络是较好的解决方案之一。

人工神经网络技术包括学习和识别两个过程。其中的学习过程,就是使用者按要求念出指定的文本,经过话筒转化为已知的语音信号作为学习样本,经过语音分段,从中求取语音的特征参数(这个过程反复多次,所以也称之为训练)。识别的过程则是,将待测的语音(同样经过话筒)进行语音分段,提取出特征参数,按一定的规则与学习所得的结果进行比对计算,最后得出识别的结果。可以看出,学习和识别的过程中,最关键的是语音特征参数的求取。

如图所示,语音信号输入就是将人的声带发出的模拟波形语音转换成数字波形,这样才能被计算机处理,这跟OCR识别中先把文字扫描进电脑的道理是一样的。人说话时一般都是连贯的,语音信号分段,就是根据字与字之间、词与词之间极短的间隔(低音或无音),将话语分解成每一个语音段,最后通过各种算法对处理过的语音段进行分析。比如不少语音识别系统中采用倒频谱(Cepstrum)分析,将倒频谱参数作为语音的特征参数输入神经网络中。

微软本次演示的软件,在人工神经网络技术上更进一步,采用了“深度神经网络”(Deep Neural Networks,DNNs)技术。

语音识别系统的本质,实际上就是对语音组成单元(音素)进行建模,比如英语中表达发音方式的大约也就30个音素。而深层神经网络(DNNs)将音素进一步细分,分解成更小的元素(Senone),总数达到几千上万个。这项创新简化了大词汇量语音识别中的语音处理,大大降低了错词率。原理何在?其实从输入法的编码就可以想象得到,中文有几万字(相当于形式各变的语音),却只有26个字母键(相当于有限的音素)可用,于是造成了许多重码,输入时我们必须时时手工选择才不会出错。而如果用来编码的字母足够多,重码率肯定可以降低。

不一样的语言里找出相似规则

语音到文本的问题解决了,接下来是更大的难题:机器怎么翻译?语言千变万化,两种语言之间很难一一对应。前人为此探索出很多方法,可以归结为两大类型:基于语言规则的机器翻译法(包括直接翻译系统、转换系统、中间语言系统等)和基于语料库的机器翻译法(包括统计法、实例法等)。微软的语音翻译软件中机器翻译的部分,采用的是多引擎翻译,即多种翻译方法的整合,所以这里我们在两大类型中各挑一个典型的翻译方法来介绍。

以中英文为例,像“This is a book”和“这是一本书”这么一一对应的句子少之又少,而且“a”和“一本”之间也不是完全对应。更多的是“The book which was given to him was a workbook of English grammar”这样的句子,如果一个单词一个单词对应翻译,就成了“这书哪个是给到他是一本手册的英语语法”根本就不通,实际意思是“送给他的是一本英语语法练习册”。看似很凌乱,但通过分析会发现,混乱的原因主要是两种语言对定语的处理习惯不同造成的。中文定语前置,而英语定语习惯后置。

整个机器翻译过程可分为三个阶段:分析、转换、生成。因为自然语言有着太多的岐义性,所以这个过程也是对岐义的一步步消解。软件首先根据一系列算法对句子进行切分(即分词),并进行词性标注。词性对结构分析非常重要,比如上例中的代词which和介词of,通过词性判断可以确定最终翻译中的定语位置。一般词会有多个词性,所以还要通上下文分析排除有岐义的词性,得到明确判断。接下来是句法分析,一般是树形结构,由词到词组,由词组到句子。结构分析完成后进行转换,最后生成目标语言。当语法清晰了,程序算法也就容易实现。

基于实例的机器翻译

简单来说,基于实例的机器翻译系统中,存有一个对照的翻译实例语料库,实例库主要有两个字段,一个保存源语言句子(比如英文),另一个保存与之对应的译文(比如中文)。当要翻译某个句子时,系统先把这个句子与实例库进行比较,找出最相似的句子,模拟这个句子相对应的译文,最后输出译文。

比如要翻译句子:

(E1)He bought a book on physics.

在语料库中查到相似的英语句子及其汉语译文是:

(E2)He wrote a book on history.

(C2)他写了一本关于历史的书。

比较(E1)和(E2)两个句子,我们得到变换式:

(T1)replace(wrote, bought) and replace(history, physics)

将这个变换式中的单词都换成汉语就变成:

(T2)replace(写 , 买) and replace(历史 , 物理)

将(T2)作用于(C2),最后得到正确译文:

(C1)他买了一本关于物理学的书。

翻译软件范文第3篇

关键词:机器翻译;翻译;内存

中图分类号:TP391.2

随着经济全球化的发展和科学技术的日益进步,翻译领域受到前所未有的冲击。全球交流的与日俱增为翻译带来更多的机遇,极大地拓宽了翻译市场;科技的进步,也极大地推动着翻译技术的发展。然而,机遇和挑战是并存的,更多的机遇带来的是更多的挑战。全球化发展对翻译或是译者提出了更高的要求,既要讲究翻译的速度,又需保证翻译的质量。要求翻译从数量、质量和速度上都能够满足日益增长的市场需求。因此,如今的翻译方式早就不同往日,利用机器翻译软件――来协助人们快速翻译资料,已成为必然的趋势,计算机辅助翻译便应运而生了。

在这种快速发展的信息时代,如果译员还是单纯依靠几本词典手工操作翻译活动,那么这样的翻译肯定没有时效性,显然无法跟上时展的要求。有资料表明,人工翻译的产量为平均每人每八小时内完成2000字,但是,翻译系统能够在每秒钟翻译3000字,在同样8小时之内,一个系统完成的翻译总量为86400000字,速度是人工翻译的43200倍。由此可见,译员借助计算机辅助翻译,既省时又省力,在保证翻译质量的同时还能保证数量,何乐为不为呢?另外,翻译是一项跨学科的活动,要求译员要掌握很多学科的专业术语,译员不可能完全记住这些术语,那么借助翻译记忆软件就可以完全避免挨个去查术语的繁重工作,只需建立一个术语库,导进去相关的术语就可以了,而且还可以做到翻译资源的重复使用。现在一些有规模的翻译公司,均靠信息技术在竞争中立足的,其翻译工作中的高科技含量所占的比重颇高,这些公司对其所招聘的译员也都要求会使用新技术。从某种程度上来说,市场的迅速发展迫使译员走信息化的道路,以更好地适应时展的需求,满足国际、国内交流对翻译的需要。

1 计算机辅助翻译

计算机辅助翻译(Computer-aided translation,简称CAT)是译员使用专门为翻译过程设计的计算机软件进行翻译工作的形式。在计算机辅助翻译中,计算机程序协助译员,译员自己翻译文档并做出涉及到的所有基本的决定。机器翻译,根本上帮助译者提高了效率。它能够帮助翻译者高效、高质量地完成翻译工作。它与以前的机器辅助翻译软件不同,不依靠于计算机的自主翻译,而是在人为下完成整个翻译过程,但与人工翻译相比较,质量相同或效果更好,翻译速率可上升一倍以上。计算机辅助翻译使得复杂的人工翻译过程更加高效。

2 对机器辅助系统的理性定位

如今,人们对机器翻译存在各种不好的看法,认为它操作困难,精确度不高,组不成句,难以理解,甚至引人发笑。但是其实机器翻译(MT)的确可以在很大程度上的节约人力、财力等资源。那么应如何降低人们对机器辅助翻译的错误理解呢?

2.1 机器翻译在各种语言转换中局限性

在使用机器翻译之前,我们应对它有一个正确的定位。无论机器翻译如何迅速、方便,但是它始终不能取代译者翻译。这两者之间并没有竞争对手一样的关系,反而,应该是互助的关系。如果对机器翻译的期望超过实际,认为将任何文字直接输入,不经一定处理,就能产生纯熟人们所需要的内容,这简直是开玩笑。

中文和英文两中语言之间的很大的区别决定了翻译过程的困难性和复杂性。王力先生曾说过:“中文里多用意合法,结合成分并非必要;外国多用形合法,结合成分在很多情况下是必不可少的。”中文是一种高语境语言,无需在意时间,无词语多义变化,无前缀后缀,语和意之间的联系多建立在语言和语序和语境中,而且含义往往含蓄,隐藏在上下文中,没有准确的连词。句语之间的承接主要靠意思,通过读者的理解后来承上启下。总之,中文结构空间、弹性较大、比较随意,断句没有严格标准的要求,如空间,各自为独立小句,但和在一起,构成了一片完整的空间。而英语则是一种低语境要求的语言,相对的曲折变化、时态变化、单复数变化,语义之间的联系都需要由连词清楚地表达。在英语中,连词是相当重要的。他们的作用为承接语义,加深句与句之间的联系,指明作者思想方向。总之,英语句子严密,弹性较小。长句多如蔓藤,枝条清明,层次连接,每一片叶子的归属都很分明。两种语言的各种差别使得精确的计算机翻译非常困难。

歧义与多义是两种语言中出现频率相当大的问题,它也为机器翻译构造成了相当大的困难。语言无论是从词组、语法、语义、语用等各种方面都存在歧义。计算机翻译系统将面对的无法突破的难题之一是排除歧义。

多义识别也是语言处理中最基础、最难处理的问题之一。因为语用造成的语句多种意思或语句模糊是多种意义产生的一种原因。一样的话却有不同的含义。不同的人对同一句话也会有给出不同的反应。任何语言交流,环境都是相当重要的。翻译任务要完成则对语言存在的环境进行识别。由于歧义和多种意思义都是由于语言结构和其意义之间的不同而产生,对于这种独特的语言情况,只能注意并识别其不同交流环境中的内部和外部之间的联系。而这只有经过天天积累的语言知识来判别,计算机翻译(CAT)本身是无法不能逃离和解决、消除歧义和多义的。

如果要让机器翻译系统(MT)达到最好状态的抚顺意思,就需要在计算机中安装一部像通用的百科全书的软件,书中所有内容都需要包括,如词法、形态、句法、语义、语用等,还有语言知识以外的人类所有知识与常识,而且还需要包含人类所独有的丰富的生活细节。另外,系统在使用这部大全的时候,必须忽视它的随机性、任意性等其他;而这显然是“乱谈,没什么依据的”。

2.2 计算机翻译与译者使翻译更加完整

翻译软件范文第4篇

正是看到了这个现状,英业达正式宣布其Dr.eye软件产品进军内地市场,Dr.eye中文名称为译典通中英日翻译软件。在进入市场的同时,英业达也充满信心,表示将在两年之内取得同类软件市场占有率第一的成绩。

毫无疑问,目前这个霸主位置被《金山词霸》牢牢占据,我身边几乎所有的人都在自己的计算机中安装了这个我们早已熟知的老牌产品。而作为Baidu、Yahoo等网站在线翻译的全球合作伙伴,在台湾市场赫赫有名的译典通在内地还没有这么大的名气,想要挑战金山词霸的霸主地位显然不是一件容易的事情。那么,译典通究竟有何绝技呢?

《个人电脑》测试了译典通中英日翻译软件8.0中的豪华版产品。令我们感到意外的是,这款翻译软件提供了2张安装光盘,并且需要重新启动系统完成安装操作。尽管看起来麻烦了一些,但事实证明用户得到的回报着实不少――译典通8.0不仅提供了普通的翻译功能,还内置了输入法、在线升级、真人发音等额外功能。

译典通在屏幕上方提供了一个快捷访问栏,根据该软件的三大功能划分出三个模块,分别是:基本功能、翻译功能和学习功能。我们不想列举每个模块下可提供的功能,但可以肯定的是,几乎所有你能够想到的功能全部都被集成在这款软件中――除了通过鼠标实现的即指即译,或者其它简单的翻译功能之外,译典通还提供了多个十分有趣且实用的功能。

对那些从事国际贸易的用户们来讲,即时写作和书信助理功能可实时帮助他们完成与国外客户的沟通。当启动即时写作之后,在任何程序中输入中英文均会出现一个翻译对话框,实时显示当前文字的翻译结果,该功能适合那些具备一定外语基础,对某些专业或者生僻词汇不甚了解的用户。书信助理则会提供单独的界面,通过各种预置好的书信格式来帮助用户完成信件的撰写。

即将毕业的学生用户再也不必四处寻找英文简历的撰写规范了,利用文件翻译功能,只要提供中文简历文件的路径,译典通会自动完成对整个文件的翻译工作.我们在测试中指定了一篇docx格式的中文简历文件,并选择了“简译英”功能,数秒钟之后,我们在同一目录下发现了同样文件格式的英文简历文件,译典通为将这个文件自动添加了”en”的后缀并单独保存――在这之后,你需要做的只是修改一下个别难以翻译的信息,例如你的姓名等。

网页翻译是另一个有趣的功能,你可以将整个网页翻译成中/英文,根据我们的测试结果可以发现,其准确度还是十分不错的。如果你需要使用MSN、QQ等即时消息文件与他人进行交流,那么在输入一段文字之后,可以选择相应的翻译选项,将翻译后的中、日、英文直接发送给对方――在译典通的帮助下,你的专业程度和反应速度可能会令对方感到惊讶。

同期的译典通翻译软件产品共有“豪华”和“专业”两个版本。根据厂商提供的资料表明,两个版本的主要区别在于,豪华版中取消了中文和日文在全文、网页、文件等方面的互译功能,而专业版则提供了全部功能。值得一提的是,两个版本的软件均可兼容Windows Vista和Office 2007 System,并且支持真人发音。

翻译软件范文第5篇

关键词:Deja Vu X;雪人CAT;翻译记忆;术语

中图分类号:H085 文献标识码:A文章编号:1005-5312(2010)01-0091-01

一、翻译记忆(TM)和术语管理

翻译记忆是将以前翻译过的词句存储起来,以后进行翻译时系统可以调出并且重复使用完全匹配的句子;对不完全匹配的句子系统会提出翻译建议,供译员参考。TM数据库通过不断存储新的译文使自己得到充实。它的价值体现在被翻译文章中重复内容的比重。因此,对于那些从事资料数量巨大,内容相对狭窄,有较高重复率的译员来说,非常有帮助。这也是计算机辅助翻译的核心内容和最有价值的方面之一。

在这一点上,两者都做得很好,均可添加多个记忆库和术语库,均可分别设定选择优先权。其中,个人认为,雪人的术语提取更加简便快捷。二者不同的数据库结构导致维护方法不同。相对于雪人而言,Deja Vu X数据库的维护相对复杂很多,但如果掌握了维护方法,则功能要比雪人强大的多。并且Deja Vu X具有一个当前项目专用术语库――Lexicon。可以利用自带的术语提取工具制作当前项目专用术语库,在译稿过程中可极其方便地随时添加单个术语,此功能可用于设定特定术语的优先权。译员在使用这两款软件进行翻译时,都可对术语库和句库中的数据及时进行修改。这就使得数据库可以得到及时更新。

二、用户友好程度

Deja Vu X把翻译记忆库、术语库、工作区等所有的组件全部整合在同一个界面上,非常清晰。因此,在开展翻译项目时,都在同一个界面中完成,而每一项的操作也大致相同,这就在一定程度上减少了译员在前期准备工作上花费的时间和精力。而且用户可以自行调节原文和译文工作区、术语显示区、翻译记忆显示区、字体大小、各个显示区的位置、工作区的分栏方式、客户、翻译领域、自动修正、翻译环境、预翻译设置等等,这样一来,就可以把Deja Vu X界面打造成最适合自己的形式。在这一点上,雪人CAT做得也很好。界面清晰,简洁,一目了然。组件比DejavuX要少,因此前期准备给工作也相应较少。

三、自动翻译

DejavuX除了能替换数字、时间、单位等非译元素外,可结合智能化的词汇进行等价单词的智能替换,当然要达此功能对词库建立的标准要求很高。在这一点上,个人认为,雪人做得更好一些。它除了能进行等价单词的替换外,还将EBMT(Example-Based Machine Translation)和TM两种技术相结合,可以通过类比、推理、学习等原理根据已有的句子,自动替换出其它相似的句子。这种功能设计的初衷很好,但实用性不强。因为在实际的翻译中,很难出现相似度很高的句子。

四、有效工作面积

Deja Vu X和雪人的有效工作面积率都很高,基本没有很多闲置浪费的界面。Deja Vu X的原文和译文工作区、术语显示区、翻译记忆显示区等都可以调节成用户自己所需要的大小。如果用不到术语显示区、翻译记忆显示区的话,用户可以关闭它们。此外,工作区和显示区的字体都可以进行自主调节。雪人CAT 也具有此项功能,它的各项区域也可通过鼠标拖动自由调整。

五、屏幕取词功能

雪人CAT还具备一项Deja Vu X不具备的功能,就是屏幕取词功能。Deja Vu X是由一个CAT软件和一个词典软件协同工作,查到的词语只能再次录入或复制。而雪人CAT软件自带数十专业和数百万的词典,当鼠标指向某词或短语停留片刻,立刻会弹出一个小窗口给出该词或短语的翻译,单机内容后可自动输入到译文中,这样就大大减少了键盘输入的工作量。不仅如此,在翻译过程中定义的术语,也可立即在屏幕取词中应用,这对于某特定专业领域的翻译而言,是非常有帮助的,因为同一主题下的文章很定会有大量专业术语重复出现。个人认为,这项功能还是比较实用的。

总的来说,DejavuX功能复杂而强大,要想掌握它,需要一定的时间进行系统的学习,但一旦掌握,它将成为译员不可多得的帮手;相比之下,雪人CAT的功能就简单得多,译员可以在很短的时间内掌握软件的使用方法。因此,个人认为,对于有志于终生从事翻译工作,或者至少是较长时间从事较复杂翻译工作的人而言,即使花费很多的时间,也应掌握DejavuX的使用方法;但对于那些只需从事英汉翻译,且相对翻译量较小,从事翻译时间较短的人员,则使用雪人CAT比较合适。

参考文献:

翻译软件范文第6篇

关键词:英汉翻译软件 大学生 语言得体性

长期以来,英汉翻译软件一直是大学生进行英语学习和非汉语母语人士了解中国的重要工具,这在我国对外交流日益频繁的今天更是如此。尽管期望翻译软件能够像翻译大家一样,输入原文就能得到准确、流畅、得体,甚至优美的译文是不切实际的,但我们总是希望翻译软件能够给出我们至少是可读而基本准确,符合目标语言逻辑的译文。但是,由于英汉语言属于不同的语系,在构词、句法结构方面相差甚远,再加上东西方文化背景的巨大差异以及建立强大语料库的巨大难度与目前对语言结构的研究水平的限制,目前大学生常用的英汉翻译软件在语言得体性方面都或多或少地存在着取词不合适、语法不正确、语序不符合目标语言逻辑等问题,从而导致翻译结果无法或难以完全理解。这对大学生的英语学习产生了一定的负面影响。

为了对英汉翻译软件的语言得体性进行深入分析,我们选取了有道,Google翻译器,金山词霸三个在大学生中使用较为频繁的英汉翻译软件,对其语言得体性进行测试并对这三个软件的翻译质量进行对比。通过分析比较说明翻译软件的语言得体性存在语法、词汇以及原语与目的语文化差异等方面的问题。

英译汉测试:

1. Are you a doctor? Yes, I was

金山词霸:你是医生吗?是的,我是

Google 翻译器: 你是医生吗?是的,我是

有道翻译:你是医生吗?是的,我是

2. She would have come here, but she has been sick.

金山词霸:她会来的,但她已经病了。

Google 翻译器: 她会来到这里,但她一直生病。

有道翻译:她会来这里,但她一直生病。

3. The patient with a cold should drink a lot of water and have some honey if he has a sore throat.

金山词霸:感冒的病人应该喝大量的水,如果他有喉咙痛吃蜂蜜。

Google 翻译器: 感冒患者应该喝大量的水,如果他有一个喉咙痛,有一些蜂蜜。有道翻译:病人感冒应该喝大量的水和有一些蜂蜜如果他喉咙痛。

4. Studies serve for delight, for ornament, and for ability.

金山词霸:学习可以使人快乐,装饰,和能力。

Google 翻译器: 读书足以怡情,足以,以及能力。

有道翻译:读书可以作为娱乐,作为装饰,作为能力的培养。

5. One was a violent thunderstorm, the worst I had ever seen, which obscured my objective.

金山词霸:一个是暴风骤雨,我所见过的最糟糕的,它掩盖了我的目标。

Google 翻译器: 一个是猛烈的暴风雨,我见过的最糟糕的,遮蔽我的目标。

有道翻译:一个是暴风骤雨,猛烈的程度实为我所见过的最糟糕的(?),遮住了我的目标。

从这五组翻译测试中我们可以看到,第一句、第二句、第五句的翻译存在语法问题。第一个句子涉及到时态问题,答句应译为我曾经是,也就是现在已经不是医生了。但因为汉语对时态的表述与英语有所差异,翻译软件没能做到得体地翻译,误译为“我是”,也就是我现在是医生。第二句属虚拟语气,译文除了词意选择上有错误外,其虚拟的口气基本没有译出来。然而虚拟语气在这一句句意的准确表达中是至关重要的。第五句为倒装,这三款翻译软件基本上是字字对应,翻译地令人不知所云。第三句定冠词的意思没有体现出来,状语从句所修饰的动作也没做到很好的区分。这种英汉语言语言逻辑不同的问题也常常困扰翻译软件。常用翻译软件语言得体性存在词汇方面的问题。例如:多义词问题,program一词有大纲、节目单、计划、程序等意义,可是在一句话中究竟用的是哪一种意义,机器常常是很难判断的[1]。(机器翻译归根到底是个语言学问题,刘涌泉,语言文字应用,1997)第四句存在原语与目的语的文化差异问题。第四句话是名家名言,所负载的信息深邃,包含省略成分,令三款翻译软件都深感为难。由此可见, 常用翻译软件的英译汉功能存在较为普遍的语法、词汇问题,以及由于东西方文化背景差异造成深层次的信息无法充分表达。

其实,这几个例句在语法上讲只属于中等难度,没有使用任何修辞手段;从语义上讲也很直白,没有涉及丰富的内涵和联想。但翻译效果都难以令人满意。英译汉如此,那么汉译英的效果又怎样呢?

对英汉翻译软件进行的汉译英测试:

1. 床前明月光,疑是地上霜

金山词霸:So bright a gleam on the foot of my bed. It seems like frost on the ground

Google 翻译器: Moonlight, the suspect is frost on the ground

有道翻译:Bright moonlight before bed, doubt is frost on the ground.

2. 你这真是黄鼠狼给给鸡拜年,没安好心

金山词霸:You this is really the weasel to chicken pay New Year's call, no good

Google 翻译器: This is really weasel you give to the chickens New Year, there is fire

有道翻译:This is really the weasel you give to chicken New Year, not good。

3. 下周五我要和妈妈、妹妹去上海

金山词霸:I'm going to Shanghai next Friday, sister and mother

Google 翻译器: Next Friday I'm going to my mother, and my sister went to Shanghai

有道翻译:I want with mother and sister go to Shanghai next Friday。

4. 我认为你不能用这种方法取得成功。

金山词霸:I don't think you can use this method to succeed

Google 翻译器: I think that you can not use this method to succeed.

有道翻译:I think you can't succeed in this way.

就这三款翻译软件对以上例句的处理效果来看,似乎比英译汉还要令人难以接受。第一句是中国脍炙人口的诗歌,第二句运用了歇后语。但是,除了有道对第一句的翻译尚可理解外,其他的翻译都是难以通读的。但是,如果说这两句尚可用中西文化背景的巨大差异和诗歌翻译本身具有相当难度来为翻译软件开脱的话,后面两句话的翻译则显然是令人难以接受的。第三句的翻译支离破碎,第四句的翻译不仅质量不高,而且只有金山词霸做到了否定前移。可以说,正如刘涌泉在《机器翻译归根到底是个语言文学问题》(语言文字应用,1997)中所提到的那样,在汉译英中,英汉语言的词序,介词使用等的差异都给给翻译软件造成了极大地困扰,而汉语言与英语言背后巨大的文化差异更加增大了翻译的难度[1]。

通过对这三种较为普及的翻译软件的效果进行比较,我们很难说出孰优孰劣,只能分出在此点上这个较好,在彼点上那个上略胜。但其相同点是很明显的,即句子越简单,翻译效果就越好;语序排列顺序越是单一规范,译文就越易懂。令人遗憾的是简单规范的句子只有在中小学课本里才会频频出现,对大学生和英语学习已经进行到较高水平的英语专业学生来说意义不大。另外,具有最大实用价值的是文章翻译,而任何一篇成熟的文章绝非文字的罗列与堆砌。[2]且不说其中掌故、成语、引用语、惯用法等具有深厚文化内涵的表达方法,就是句与句段与段之间,都是密切相关,相互支持的,而这显然是目前的翻译软件所不能做到的。

而这些翻译软件要想提高翻译软件的语言得体性,就要加强对语言结构,诸如词序语序等语言结构方面的研究[2]。同时,常用翻译软件可以借鉴一些专业软件的做法,增加专门词汇语料库的功能[3],比如,文学语料库,口语语料库,名人名言语料库,诗歌语料库等,同时在这些语料库中储存一些文学,口语的常用词汇以及名人名言和诗歌的固定翻译[4]。如果能够建立足够强大的语料库,翻译软件的语言得体性无疑会得到一定优化。

参考文献:

[1]刘涌泉 《机器翻译归根到底是个语言文学问题》 语言文字应用 1993(3).

[2]张国敬 《翻译软件的完善任重道远》 天津外语学院学报 2002(1).

[3]薛文枫中国机器翻译软件与计算机辅助翻译软件的发展与现状西南民族大学学报(人文社科版)2008(4).

[4]陈光火 《翻译软件渴望“成熟”—我国翻译软件的现状与未来》 中国翻译 1991(1).

翻译软件范文第7篇

关键词:计算机辅助翻译;翻译记忆;术语管理

中图分类号:H319.3 文献标识码:A 文章编号:1001-5795(2013)01-0069-0007

计算机辅助翻译(computer-aided Translation,简称CAT)由机器翻译(Machine Translation,简称MT)演变而来,但二者有着本的区别。机器翻译试图通过完全自动化的翻译过程来取代人工(Kenny,1999:67),其中可能会涉及人的译前编辑和译后校改(Bowker&Fisher,2010:71),而计算机辅助翻译是运用计算机技术来提高翻译效率和译文量,人在这一过程中仍然起着决定性的作用。从广义上来说,计算机辅助翻译工具是指能够辅助译员进行翻译的所有计算机工具,包括文字处理软件、语法检查工具、电子邮件和互联网等(Bowker,2002:6)。从狭义上来说,它“专指为提高翻译效率,优化翻译流程而设计的专门的计算机翻译辅助软件”(徐彬等,2007:79),包括翻译记忆系统、术语管理工具、对齐工具和项目管理工具等。本文的研究对象是后者,即以翻译记忆系统为核心的狭义的计算机辅助翻译软件。

除了一些通用功能之外,CAT软件供应商为了营销的目的大都会罗列出自己软件的众多优点。但是,这些软件真正的优缺点是什么?它们的众多功能中,到底哪些才是至关重要的?学生译者和没有实际使用经验的教师往往都会感到迷茫。如果他们选择的CAT工具不合适,非但不能提高他们的翻译效率,反而事倍功半,浪费时间与金钱。因此,合理而有针对性的CAT软件评估在译者选择机辅软件时起着至关重要的作用。

1 计算机辅助翻译软件简介

早在20世纪70年代,翻译记忆工具就已经出现,但直到20世纪90年代中期才开始进行商业开发。随后国内外大量的计算机辅助翻译软件如雨后春笋般地涌入市场,为越来越多的译员所认识并使用。现在国际上,除了领头羊SDL Trados外,知名的CAT软件还有Déjà Vu、Wordfast、Idiom、Catalyst等;在国内,1998年国外CAT软件进入国内翻译市场,1999年国产雅信CAT软件投入市场,接着传神、永利、赛迪、雪人等公司也相继研发并推出了自己的CAT软件。所有的CAT软件开发商都在不断更新自己的软件,CAT软件的发展日新月异。根据英国帝国理工大学《2006年翻译记忆系统调查》(Translation Memories Survey,2006)提供的数据(Lagoudaki,2006:23),国外使用最广泛的几种翻译记忆系统软件按各自占使用翻译记忆系统译员人数的比例依次为TRADOS(51%)、Wordfast(29%)、SDL Trados 2006(24%)、Déjà Vu(23%)、SDLX(19%)和STAR Transit(14%),其中53%的职业译者使用了不止一种翻译记忆系统。由于翻译记忆(TranslationMemory,简称TM)系统是CAT软件的最核心构件,因此我们可以将上面的调查结果看成是各种CAT软件在职业译者中的使用状况。2005年TRADOS被SDL公司收购,现在整合后的SDL Trados计算机辅助翻译软件可以说占了更大的市场份额。北京大学计算机辅助翻译专业的侯晓琛、颜玉祚在2008年做了一项关于中国翻译行业CAT应用现状的网络调查,其结果显示:接受该问卷网络调查的受试中,约有66%的译员使用CAT工具,其中85.8%的译员使用Trados,29.68%使用雅信CAT 3.0+CAM(Computer-aided Match,计算机辅助匹配),26.45%使用Déjà Vu x,20.65%使用Wordfast。根据上述两个问卷调查的结果可见,SDLTrados、D6ja Vu、Wordfast和雅信是国内外比较常见的四种CAT软件。

上述四种CAT软件中,Trados是由德国TradosGmbH公司开发的一款CAT软件,在机辅翻译领域中独占鳌头,很多跨国公司和国际组织(如微软和欧盟等)都是其用户。2005年,SDL International公司收购了Trados,之后相继推出了SDL Trados 2007和SDLTrados Studio 2009两个版本。其中,SDL Trados 2007主要由Translator’s Workbench(译者工作站,用于创建和管理翻译记忆库),TagEditor(标记编辑器,用于处理带标记的文档)、MultiTerm(术语管理器,用于创建和管理翻译术语库)等模块组成;SDL Trados Studio 2009虽然在2007版的基础上新增了一些功能,但必须使用2007版的WinAlign模块才能对齐别人翻译的文档;最新推出的SDL Trados Studio 2011则不再受此限制,全部功能都整合到一个平台中。Déjà Vu由法国Atril公司开发,被许多职业译者誉为CAT工具中的后起之秀,它可以在自己的独立界面中完成“创建术语库和翻译记忆库”、“创建项目文件”、“预翻译”、“校对和量控制”以及“导出翻译结果”(徐彬等,2007:84)等功能。Wordfast最初由法国职业译者Yves Champollion于1999年开发,截止2002年底,这个基于Word软件的插件(现称为经典版)在4.0版之前一直都是一款免费软件,只需用电子邮件注册便可使用其全部功能。后来,该软件由Wordfast LLC公司负责商业开发和销售,已经研制出经典版(Wordfast Classic)、专业版(Wordfast Professional)和在线版(Wordfast Anywhere)三种o:除了作为插件的经典版,专业版是独立界面的CAT工具,而在线版只需用电子邮箱注册便可免费在网页浏览器上使用。雅信由北京东方雅信软件技术有限公司开发,是国内这一领域的先行者之一,最新版本东方雅信CAT4.0除继承了“雅信CAT”在翻译记忆与人机交互方面的所有优点之外,比3.5版本增加了CAM和CAP(Computer-aided Project,计算机辅助项目管理)功能,但其基本功能并没有较大的改变。在本文中,我们根据所拥有软件的版本情况,最终选取了SDLTrados Studio 2009(含SDL Trados 2007)、Déjà Vu x7.5、Wordfast系列(包括经典6.0版,简称WFC 6.0;专业2.1.8版,简称WFP 2.1.8;在线1.5.0版,简称WFA1.5.0)和雅信CAT3.5作为本文比较研究的对象。

2 比较基础

国内外研究者对计算机辅助翻译技术作了很多有价值的研究,如Quah(2008)和钱多秀(2011)对计算机辅助翻译技术涉及的各方面知识的介绍;吕立松等(2007)从翻译教学结合翻译市场需求的角度,提出要重视对翻译技术人才的培养;文军、任艳(2011)对国内计算机辅助翻译研究的历史与现状做了较为全面的述评,并对未来的发展方向做了一些预测。但这些研究对CAT软件的评估却鲜有探讨,也未能形成一个公认的统一评估标准。有鉴于此,我们拟从一般计算机软件的量评价模型和计算机辅助语言教学软件的评估方法中找出一些共同要素,作为CAT软件的评估参数。

石柱(2008)罗列了国内外几种主要的软件量评价模型,如早期的Beohm量模型认为应从软件的易用性(程序可靠的、高效率的、考虑到人类因素的程度)、可维护性(当需求改变时,程序修改和完善的难易度)和可移植性(程序在其他计算机配置上运行的难易度)来评价软件产品的量(参见石柱,2008:17)。国际标准化组织于1991年提出一种评价软件量的通用模型,即ISO 9126量模型。该量评估模型从抽象到具体分为三个层次,共析出6个量特性和21个量子特性,具体如图1所示(根据石柱,2008:22的图2~4,略有改动):

计算机辅助语言教学软件的评估标准通常都是建立在语言学习理论的基础上,国内外很多学者都提出过自己的看法。Watts(1997)认为语言学习软件的设计应当根据“以学习者为中心”的教学原则,最大程度地满足学习者(即使用者)的要求;许哲、顾佩娅(1999:36_37)提出了多媒体英语学习软件评估的一组标准,即媒体的综合效果、操作方便性、交互性和用户支配度以及语言内容的要求。

从以上软件量评估模型的特性选取和计算机辅助语言教学软件评估标准的设定来看,他们虽各有自己的侧重点,但都比较重视软件满足用户要求的性能。而计算机辅助翻译技术关注的是“如何应用计算机软件,最大限度地实现翻译流程的自动化,提高人工翻译的效率,保证人工翻译的量,并能够管理翻译流程”(徐彬等,2007:82),因此,翻译记忆系统、术语管理工具、对齐工具和量保证工具是保障CAT软件实现其主要功能的四大模块。本文将以用户(包括学生译者、翻译课教师和职业译者)的量观为基础,结合笔者对SDL Trados Studio 2009(含SDL Trados 2007)、Déjà VuX 7.5、Wordfast系列和雅信CAT3.5的使用经验,从理论与实际操作相结合的层面比较这四种常见软件的功能性和易用性。其中,功能性指标主要探讨他们在翻译记忆系统、术语管理工具、对齐工具、项目管理工具(包括量保证工具)这四个主要功能模块方面的异同,易用性指标主要关注软件界面的有效工作面积以及是否具有中文界面。在此基础上,我们进一步指出它们各自的独特与不足之处,以期为那些对CAT技术感兴趣的个人和群体在选择CAT软件时提供一些参考。

3 比较结果和讨论

3.1功能性

3.1.1翻译记忆系统比较

国内外这四种常见的CAT软件,大都功能丰富,包括了诸如翻译记忆系统、对齐工具、术语管理工具、自动翻译、文件过滤器、电子词典、拼写与语法检查工具等功能性模块。由于所有的CAT软件都是基于翻译记忆技术架构的,因此翻译记忆库是CAT软件的核心模块。翻译记忆技术利用对齐工具将相关源语文本和目标语文本材料,按照句子或段落进行分割,然后将这些切分单位存入翻译记忆库。译者在将一篇英语文本翻译成汉语时,翻译记忆系统将通过人工智能搜索及对比技术,根据用户所设定的匹配值(一般系统默认设置为75%)自动搜索英汉翻译记忆库中的词汇、短语和句子,若搜索到的内容与要翻译的内容100%一致,则达到完全匹配(perfect match),译者可以根据语境决定是否直接使用;若搜索结果并非完全一致,则构成模糊匹配(fuzzy match),译者可进一步决定是否要接受或进行修改后再使用该翻译单位。这种匹配功能可以使译者最大限度地利用已有的翻译材料,减少重复的翻译工作。此外,译者在使用CAT软件进行翻译时,也可将自己正在翻译的文本存入翻译记忆库,供以后的翻译任务使用。在翻译记忆技术这一方面,四种CAT软件可谓大同小异,我们将从翻译记忆库的创建和文件的导入两个方面来比较。

这四种CAT软件的翻译记忆系统都可以创建和导入一个或多个翻译记忆库,且操作步骤基本相似,创建时都要预先设定相关的语言等参数。SDL Trados Studio 2009建立翻译记忆库时生成的翻译记忆库文件后缀名是.sdltm,在向创建好的翻译记忆库导入相关翻译记忆文件时,它可以兼容符合翻译记忆交换标准的文档,还可以导入SDL XILFF双语文档、TRADOStag和SDLEdit这些软件以前版本按照自身标准定制的翻译记忆格式文档,而其他形式的翻译记忆文档则需要先转换成TMX格式,然后才能导人翻译记忆库。Déjà Vu x 7.5创建的翻译记忆库文件后缀名是.dvmdb,是典型的mdb数据库格式文件,具有极强的兼容性。它的记忆库可以直接导入带分隔符的文本文档、微软办公软件的Access 9x/2000/XP和Excel 9x/2000/XP文档(包括后缀名是.cvs的文档)、Trados译者工作站的翻译记忆库文件以及TMX格式的文档;此外,针对早期Déjà Vu 2.x/3.x版本的翻译记忆库文件,还可以使用7.5版自带的文件格式转换功能,将其转换成新版的翻译记忆库文件,供翻译时使用。WFC 6.0的翻译记忆库使用的是Woffast本身的翻译记忆库格式,兼容TMX格式的翻译记忆库文档;WFP 2.1.8创建的翻译记忆库文件是文本文件,可以向其导入Wordfast本身自有格式的文档,同时兼容TMX格式;WFA 1.5.0除了可以导入早期版本的Wordfast翻译记忆库文件外,还兼容了Trados、Idiom和SDLX软件的翻译记忆文件格式。雅信CAT3.5使用库维护来维护翻译记忆库,生成的文件后缀名是.mem,兼容Exce1 8.0、文本文件、TMX文件和雅信2.5翻译记忆文件(后缀名是.rec)的格式。从上述分析可见,就翻译记忆库的使用情况来说,兼容性最差的是WFC 6.0,兼容性最强的是DéjàVu X7.5。

3.1.2对齐工具比较

CAT软件只有随着翻译记忆库里的内容不断增加,才能发挥越来越大的作用。换句话说,翻译记忆库中存储的内容越多,则翻译的可重复使用率就越高,因而使用CAT软件的译者就可以不断提高自己的翻译效率。翻译记忆库有两种扩充方法:①将自己翻译好的译语文本与源语文本存入翻译记忆库;②将收集好的各领域的源语文本及其对应的译语文本导人翻译记忆库。我们在上面3.1.1小节中就导入四种软件的翻译记忆库文件格式进行了简单比较,而这些文件的成功导入,离不开CAT软件中的另一重要模块――对齐工具。SDL Trados Studio 2009的使用者需使用SDLTrados 2007的WinAlign模块将原文与译文以句子为单位对齐后才能导入翻译记忆库,使其成为翻译记忆库的翻译单元。图2是SDL Trados 2007版WinAlign的对齐工具界面,实线连接的是已经确定的对齐单位,虚线连接的是尚未确定的对齐单位。

Déjà Vu x 7.5本身带有对齐工具,可以直接使用。WFC 6.0本身不带对齐工具,如果需要使用对齐功能,必须安装免费的PlusTool工具。该工具作为Word的插件可进行对齐处理,但是这个工具只能在Word 2003及其以前的版本中运行。WFP 2.1.8中也没有对齐工具,后来的版本中带了Wordfast Aligner,但没有整合到WFP界面中,需要单独启动。WFA 1.5.0则使用自带的、仍在测试阶段的模块Wordfast Au―toAligner进行对齐,使用者可免费上传待对齐的文档,该模块会通过智能推断进行对齐处理,然后将对齐结果以三种格式(文本文件、Excel文件和TMX格式)的文件发送到用户的注册邮箱中。雅信CAT3.5本身没有对齐工具,需要安装单独的CAM模块来实现对齐。四种软件操作步骤相似,都是通过一定的分隔符,对文本分割后再行对齐,但都会无法正确处理一对多或多对一的情况,所以对齐处理后的文本都需要进行人工修正。我们通过对自己翻译的一家企业介绍的英语源语Word文档和汉语目标语Word文档进行对齐,发现整体上SDL Trados 2007的WinAlign和WFA 1.5.0的Wordfast AutoAligner的对齐效果较好,可以通过文档中的一些锚点(比如数字等节点词)调整切分单位,而Déjà Vu x 7.5的对齐结果基本上是几个源语单词对应几个译语词汇,效果不是十分理想。

3.1.3术语管理工具比较

计算机辅助翻译软件的另一个重要模块是术语管理工具。它是用于创建、维护和管理术语库(TermBank,简称riB)的工具。译者可将特定行业里的专业术语储存到其中,在之后的翻译中提取使用,同时在翻译过程中也可不断更新术语库,其与翻译记忆系统的运行机制相似。二者最主要的区别是术语库中存储的是词汇或短语,而翻译记忆库中存储的是句子或段落。翻译记忆系统与术语管理工具的整合使用可进行预翻译,能大大提高翻译速度,同时还能够确保译文术语的一致性,从而保证翻译量。可见,翻译记忆技术与术语工具在CAT软件的各种功能中居于首要地位。

本文比较的四种CAT软件中,除了雅信CAT3.5自带74个专业术语词库以外,其他三者的术语库都是“空壳”,需要用户在翻译过程中自行添加,或者将别人做好的、现有的专业术语表导入本地的术语库,增加术语库的库容。

SDL Trados Studio 2009的术语管理工具Multi.Term是单独模块,需配套购买才可使用,它提供了可以将Excel等格式的术语表转换成TBX格式的转换器(SDL MultiTerm 2009 Convert)以及术语提取工具(SDL MultiTerm 2009 Extract),功能非常强大。

Déjà Vu x 7.5的术语管理工具极具特色。它是分级的,包括术语库(Terminology)和项目词典(Lexi―con)两个层级。其中,项目词典与当前进行的翻译项目紧密相关,更具针对性。因此,在实际翻译过程中,Déjà Vu会首先搜寻项目词典,然后再搜寻术语库,最后才搜寻翻译记忆库(徐彬,2010:60)。这种分层式地术语搜索查询和管理体系,更适应翻译的实际情况。

WFC和WFP都是通过“Terminology”菜单进行术语管理,而WFA则通过“Glossary Panel”添加术语,并无特殊之处。

雅信CAT3.5是通过“库维护”选项卡来实现术语库的管理。“库维护”不仅可以添加单条术语,还可以批量添加术语词条。点击“库维护”下的“批量添加”菜单,通过“批量定义”界面,可将术语批量地定义和添加。这一点跟上述三种软件的导入功能一样,只是名称不同。

3.1.4项目管理工具比较

翻译项目管理是指利用CAT软件对翻译项目文件进行导入、分析(字数统计)、预翻译(确定翻译重复率和项目的专业领域)、量检查(语法和拼写检查)以及导出的过程。面对繁重的翻译任务,特别是大型翻译项目时,由于翻译时间有限,规范化的翻译项目管理流程对提高翻译效率至关重要。

SDL Trados Studio 2009通过创建项目后导人待翻译的文件,利用“项目”界面下“批任务”下拉菜单中的“分析文件”选项卡进行分析,确定翻译的工作量和重复率,并利用已有的翻译记忆库及术语库来对项目进行“翻译字数计算”和“预翻译”;翻译项目完成后可利用“工具”栏下拉菜单中的“拼写检查”和“验证”功能,对译文进行拼写、语法及术语一致性的检查,之后便可导出翻译好的文件。

使用Déjà Vu X 7.5完成一个新的翻译任务时,与SDL Trados Studio 2009类似,必须要先创建一个翻译项目文件夹(里面包括项目文件、翻译记忆库文件和术语库文件),然后才能将待翻译文件导入机辅翻译工具中,之后所有的翻译项目管理活动结果都可以保存在该项目文件夹中。Déjà Vu X 7.5的字数统计、预翻译和量检查功能与SDL Trados Studio 2009相似,但是其“分析”菜单不仅可以计算出重复率,还可显示模糊匹配的情况,有利于译者更好地预测翻译进度。

WFP 2.1.8必须安装项目管理器(Project Manag-er,简称PM)插件,才能实现完整的项目管理功能。WFC 6.0和WFA 1.5.0的量保证(Quality Assur―ance,简称QA)功能都需要点击各自软件中的相关图标进行有关参数设置。WFC 6.0需要接着点击“Setup(设置)”选项卡,然后选择“QA”选项卡,对量保证参数进行设置;而WFA 1.5.0则需要接着打开“Pan―dora’s box(功能参数设置框)”,然后点击第四个功能参数设置变量“Configure Document’s translation with proofreading(配置翻译文本的校对功能)”,弹出配置校对功能对话框进行设定以后方可使用。WFC 6.0的QA功能中没有预翻译功能,而WFA 1.5.0在导人翻译记忆文件和术语表后可进行预翻译。

雅信CAT3.5借助Word软件自带的语法和拼写检查工具,没有字数统计和预翻译功能。雅信的项目管理属于单独的功能模块,由项目管理员运用雅信的有关软件完成。

3.2易用性

3.2.1界面的有效工作面积

界面是衡量CAT软件易用性的重要参数。在办公软件领域,大多是Microsoft Office,特别是Word文件格式(文件后缀名为.doc和.docx),所以各种CAT软件都会兼容这些格式,甚至与这些办公软件集成整合为一体,用Word的界面作为翻译工作的界面。本文所比较的四种CAT软件在操作界面上基本上可以分为三种:①无独立界面,作为插件完全附属于Word软件;②半独立界面,与Word整合协同使用;③完全独立界面,即完全在软件自己的独立界面中完成翻译任务。

使用SDL Trados 2007进行翻译时,该软件与Word协同使用,属半独立界面。译者在使用该CAT软件时,主要的翻译工作都在Word界面中完成,译者工作站作为一个后台程序运行,前台只显示与待译文本匹配的翻译记忆与术语的例证。但是,译者工作站和Word两者同时运行显然会给翻译活动带来不便,因为译者工作站大概占据了整个屏幕的四分之一,这样就大大减小了有效的工作面积。SDL Trados Studio2009将Workbench和Word整合到同一个界面中,即使用一个完全独立的机辅翻译界面,这样就克服了2007版界面给翻译活动所造成的一些不便。

WFC的界面属于第一种,没有独立界面,它的软件主体就是一个Word的插件,完全基于Word的宏功能运行,译员的翻译活动全部在Word中完成,启动运行也非常便捷,可谓是CAT软件中最具特色的一种。而WFP和WFA都采取了独立界面,即第三种类型。WFP要求使用者在软件的独立界面中进行翻译,而WFA则要求译者使用浏览器在网页上进行翻译活动。

Déjà Vu软件的操作界面属于第三种,它的各个版本,一直以来都不依赖于Word软件。它所有的翻译活动都是在自己的独立界面中完成的,其原文和译文工作区以及各功能区的大小都能根据用户的需要进行调整。在Déjà Vu X 7.5的工作界面中,所有功能都集中在里面,如同表格一般清晰,最左侧为原文、中间为译文、最右侧为其他辅助翻译功能(如术语查找等)。

雅信CAT3.5严格地说是属于第二种类型,它与Word协同工作,其界面布局与其他三种CAT软件也不太一致,共有四个部分,即原文区、译文区、参考例句区和Word窗体(占据屏幕一半左右的面积),在这种界面中操作起来比较直观,可以方便地在译文区与Word界面中同步完成翻译。雅信CA33.5的工作界面如图3所示。

3.2.2中文界面

除了有效的工作面积以外,对于国内用户来说界面是否可以设置为中文也是CAT软件易用性的一个重要体现,因为中文界面可以使机辅翻译软件的运行和系统设置都变得更加容易。SDL Trados Studio 2009和雅信CAT3.5都具有中文界面,Déjà Vu X 7.5本身不带中文界面,必须安装国内软件本地化人员制作的汉语语言包才可以显示中文界面,而Wordfast的各个版本都没有中文界面。

3.3独特与不足之处

我们比较的四种CAT软件除了在上述功能性和易用性方面体现出一些相同与相异之处外,还具有各自的一些独特与不足之处。

3.3.1SDL Trados Studio 2009

SDL Trados Studio 2009是唯一一种可以不经过文件格式的转换而直接处理PDF文档的CAT软件。此外,它还搭售一种本地化工具软件――SDL Passolo2009,能够对可执行文件、资源文件和XML格式的文件在“所见即所得”的可视化窗口中进行本地化翻译,省去了将文件中的源语文字取出来、导入计算机辅助翻译工具中进行翻译、在翻译完成之后再导回到原文件的复杂过程。也就是说,SDL Passolo能够让译者直接在文件中进行翻译,然后直接编译成与原文件功能一样的文件。

3.3.2 Déjà Vu X 7.5

添加Déjà Vu x 7.5的翻译记忆和术语时,可以用“自动发送”方式添加,方便而快捷,且其翻译记忆库和术语库是以数据文件的形式储存,可以移植,有利于团队工作时通过交流保证术语以及翻译风格的一致性。它同时兼容SDL Trados的翻译记忆库和术语库。

3.3.3Wordfast系列

Wordfast系列软件中,最具特色的是其在线版,即WFA,译者可以免费注册使用,不受任何版本或时间的限制。但其翻译记忆库一次只可以添加500个翻译单元,不太适合大型翻译项目的操作。此外,WFA的注册用户不仅可以使用自己的本地翻译记忆库,还可以匿名使用其免费的公共超大翻译记忆库(Very Large Translation Memories,简称VLTM)。

3.3.4雅信CAT3.5

雅信CAT3.5在翻译时可以屏幕取词,将术语库或词库给出的解释直接插入到需要编辑的地方,这一点在整个CAT软件界是独树一帜的。它自带的英汉和汉英词典,收词量高达七百多万条,这也是其他“空壳”式的CAT软件所没有的。在翻译过程中,遇到超过系统设置的匹配值的待译句子,雅信机辅软件会自动给出参考例句(参见图3)。在该软件原文区中出现的对译句,其实是目标语对译词语按照源语词语的出现顺序呈现出的简单线性排列,这对简单的句子翻译具有一定的参考价值,而对那些稍微复杂的文本内容就会出现逐字死译的弊端,需要使用者花时间去纠正,因此对职业译者(特别是从事文学翻译的译者)来说反而是浪费时间。

4 结论与启示

综上所述,本文关注的四种CAT软件各有优缺点。SDL Trados Studio 2009功能强大,能够处理日益广泛使用的PDF格式文件;但是它由于模块众多,不太容易让初学者迅速上手使用,因此较适合对软件本地化要求较高的翻译公司或大型机构的专职译员选择使用。Déjà Vu X 7.5功能齐全,术语管理工具极具特色,翻译记忆库和术语库可移植性强,利于团队协作,适合自由职业译者选择使用。Wordfast的经典版功能简单,虽然没有中文界面,但是软件小巧,操作简单且运行速度快,适合那些经常翻译Word文档的译者使用。雅信CAT3.5具备了CAT软件的主要功能,且本身自带74个专业词库,省去了积累术语的漫长过程,但对于学生译者而言,在使用时翻译课教师要特别提请他们注意批判性地对待软件系统词库提供的对译词条,不能加重他们逐字死译的陋习。

在实际教学中,选择使用何种机辅翻译软件,还有一个非常重要的因素需要考虑,那就是价格问题。一般来说,功能全面、模块化程度高的CAT软件,像SDLTrados,价格昂贵;而功能简单、操作便捷的CAT软件,如作为Word软件插件使用的WFC,则价则便宜。而对学生译者来说,WFA这样的免费在线机辅翻译工具则是他们平时翻译时的首选。

翻译软件范文第8篇

10月25日,微软首席研究官、微软研究院院长里克·雷斯特博士在天津举办的“21世纪计算大会”中展示的微软最新的研究成果——同声传译,向世人描绘了一幅“跨越语言,沟通无碍”的美好蓝图。

吸引眼球的同声传译

在美国热播了40年的科幻电视剧《星际迷航》中,有一个非常“打眼”的工具——宇宙翻译器。星际舰队成员把它别在胸前徽章里,整个星际联邦都广泛使用它将所有的已知语言翻译为听者所懂的语言,对其余的未知语言也可通过对简短几句话的分析而进行转换。按照剧中设定,宇宙翻译器要到22世纪才能发明。

不过,在雷斯特的设想中,这种翻译器的出现可能不用等那么久,他日前展示的“同声传译”就是通往宇宙翻译器的重要一环。

在这个10分钟左右的演示中,雷斯特一直中速讲英文,他背后有两个大屏幕。现场观众都看到其中一个屏幕把他讲的话以英文文本的形式展示出来,速度大概只比他的声音慢小半秒。

在另一个屏幕上,上半部把英文文本中的单词提取出来,并对应中文单词,而下半部按照中文语序已经排列成中文句子。

随后,最令人激动的时刻到来了,翻译完的中文句子以普通话的形式“说”了出来,声音听起来与雷斯特本人很像,速度基本上是他一说完英语,机器就“说”出仿真声音的中文翻译,听起来就像雷斯特在给自己做同声传译。

他表示,微软的同声传译不仅能英译汉,还能翻译西班牙语等26种语言。虽然目前还没有走出实验室,未来却可能做成同声传译器,以至有人惊呼学同声传译的人岂不是要失业么?

语言识别离完美还有多远

这个吸引眼球的演示第一步就是用计算机识别雷斯特的英文发言,但是这可能也是最难的一步。

雷斯特介绍,最开始的语言识别采用简单的模式匹配,计算机检查语音产生的波形,并尽量与已知相关的特定单词相匹配。不过这一方法失效率太高了。

直到七八十年代,隐式马尔科夫模型(HMM)被广泛应用,它利用来自多个人的培训数据建立更为稳健的统计语音模型,成为语言识别的主流。

“不过,直到今日,即使是最佳的语音系统,在任意语音上的单词出错率还高达20%~25%。”雷斯特说。

“两年前,我们和多伦多大学的研究人员使用一项名为深度神经网络的技术,仿照人脑行为,语音的错误率比之前的方法降低30%。这意味着之前四五个单词中就会出现一个错误,而现在七八个单词中才会出现一个错误。”

虽然技术细节仍未透露,不过中科院声学研究所语言声学重点实验室副主任潘接林表示,这一技术还是建立在HMM的框架上,改为用神经网络模拟语音特征分布,从八九十年代就有应用。

只是现在计算能力提高,能把模型做得更细,也就更“深度”。

这种方法的准确率与数据积累有很大关系。清华大学计算机系教授黄连生告诉记者,计算机越来越多地学习、掌握更多数据,就会更聪明,这就是“机器学习”,不过机器学习依然有限度。

对此,潘接林也表示认同,“如果是针对专人的优化‘学习’,语言识别的性能会提高得多一些”。

机器翻译能代替人工翻译?

说话人的语言被识别了,如何英译汉也是个大问题。数据显示,近几十年来,因机器翻译质量存在问题,一直无法成为翻译的主流。我们经常会使用软件翻译页面,所得文本之凌乱不言而喻。

雷斯特表示,他的演示中英译汉需要两个步骤。“第一步是提取我说的单词,然后找到相应的中文,虽然这并不简单,但确实是比较简单的一步。第二步是重新调整单词的顺序,使之符合中文习惯,这是语音正确翻译的重要一步”。

哈尔滨工业大学机器智能与翻译研究室曹海龙研究员介绍,雷斯特所说的步骤与目前机器翻译的方法是一致的。难点就在于译文选择和调序,不同语言语序不同,一个词翻译成另一种语言也可能有多个候选译文,所以机器翻译结果有时漏洞百出。现有提高正确率的方法需要依靠统计学。

雷斯特也承认,微软的同声传译在文本方面还有很多错误,而且翻译结果可能很搞笑。不过,他表示,统计技术和大数据的引入将使文本翻译有翻天覆地的变化。

然而,黄连生并不这么乐观。他认为,机器翻译只能在某个特定领域达到较高的准确率,比如法律或经济领域能达到80%到90%的准确率,这是因为在特定领域词义有了明确界定。而在通用领域,机译准确率不会很高,还是要依赖人工翻译的经验。

模仿的声音有多像?

“数年后我希望打破人与人之间的语言障碍” ,当雷斯特用英语说出这句话的一秒钟后,微软同声翻译机模仿他的声音用中文说出。台下的观众报以热烈的掌声。

确实,如果能在翻译中保留说话人的语调,交流将会更顺畅。雷斯特也表示,他这个不会说中文的人以自己的声音“说”出中文实在令人兴奋。

他介绍,要达到这一效果,需要一个文本到语音的系统,包含数小时中国人说话的语音。

此外,他还要预先录制1小时的英文语音数据用来提取自己的声音属性,最后得到仿佛自己在说中文的效果。

潘接林表示,这是一个个性化语音合成技术。一般情况下,机器通常只需模仿固定的男女两种声音,而要得到针对专人的仿声,则需要获得他/她的语音数据,提取发声相关的特征参数,比如节奏、频率、语气,也就是专业术语说的基频等等。当合成系统适应后,就可以输出仿真声音了。

翻译软件范文第9篇

【关键词】机器翻译软件;适用性;局限性

中图分类号:TP391.2 文献标志码:A 文章编号:1007-0125(2016)12-0270-02

机器翻译是利用计算机技术智能化地把一种语言转换成另一种语言的过程。1954年IBM公司首次完成了俄英双语机器翻译的实验。随后,很多国家,如前苏联、英国、日本、中国等也相继进行了机器翻译试验。如今,市场上已出现了多种基于不同原理的机器翻译软件。

很多学者都对机器翻译的技术原理进行了分类,总体可以将机器翻译系统从方法上大致分为四类:基于规则的机器翻译、基于实例的机器翻译、基于统计的机器翻译和混合式机器翻译。基于不同原理的翻译软件各有所长,译者可根据不同的翻译需求合理选取这些机器翻译软件。

基于规则是通过语法、语义等语言习惯约定一种规则,通过对源语言语句的此法、语义、语法和句法进行判断分析,按照一定的规则重新排列组合,生成目标语言。基于规则的机器翻译系统擅长于翻译符合规则的内容,翻译的质量较高,然而有效规则的形成过程通常具有很高难度。而基于实例的机器翻译的本质是“以翻译实例为基础,基于相似原理的机器翻译”,这种实例既可以是不加修饰的翻译原型,也可以是一种经过加工的翻译实例。基于统计的机器翻译技术本质上也是一种基于语料库的翻译技术,它可以将语料库中的实例抽象成一种统计模型,翻译过程即为对这种统计模型的重新解码。基于统计的机器翻译系统具有通用性,自动从语料库中学习语言知识,这种翻译技术通过概率统计的理论建立包含各种句型的双语对照资料库,并在翻译过程中不断完善、优化、修改这个资料数据库,在翻译时,软件自动从这个数据库中提取相似的例句、短语等,并模仿该句型实现源语言和目标语言的转换。

目前的商业化机器翻译软件,多数采用了多种翻译技术混合的模式。从最初的简单规则,到如今千变万化的复杂规则,依靠长期翻译训练中积累的大量语料库和在长期翻译实践中通过译者的反馈和测试不断优化的语料库,很多翻译软件已具有较高的翻译成功率,被广泛应用于文件浏览、信息查阅、数据检索等方面。

一、机器翻译译文质量及错误模式分析

机器翻译系统的评价主要有七大因素:译文的质量、应用效率、工作方式、使用环境、维护性和扩展性、机器翻译系统性能价格比、鲁棒性(robustness)。其中译文的质量是最主要的考量因素。

在科技文翻译中,罗季美等人以汽车技术科技文献的翻译为例,统计得出各种句法错译发生的概率,如图1所示。事实上,半个世纪以来的机器翻译研究在句法处理上已经取得了很大的成就,机器对被动语态、大部分主要时态及某些特殊句型等的处理都达到了相当高的准确率(10.3%)。而该统计的错误率也从侧面反映出语言的千变万化对机器翻译的巨大考验,在机器翻译软件中为每一种语句应用的特例都制定规则是不现实的,而长期的机器翻译应用和人工比对修改也是机器翻译不断进步的必不可少阶段,从而逐步更合理限定词汇处理范畴,提高机器翻译的准确率和效率。

二、机器翻译软件的适用性与局限性

机器翻译软件的优势在于翻译速度快、运用范围广、成本低和无需专业译员等;局限性在于机器翻译的译文比较粗糙、文体风格难以掌控以及语言表达不够地道等。翻译标准的差异及机器翻译软件的原理决定了机器翻译非文学材料的适用性比文学材料要强。一般情况下,翻译界都认为科技翻译易于文学翻译。理论上,若输入计算机中的规则和语言材料越多,翻译的质量就越高。如果把人类所有的语言规则和语言现象都输入计算机中,那么机器翻译完全可以取代人工翻译。但是语言的应用千变万化,尤其在文学作品中,语言的多样性使得语义规则多到无法估量,而即使建立了非常庞大的语料库,也不可能完全涵盖语言的所有用法,更别提语言中的文采、多义化表达等文学作品特有的性质,使得机器翻译软件在有较高需求的文学翻译中几乎不可能代替人工翻译。

而在翻译要求相对较低的其他场合,有效的机器翻译可节省大量的资料阅读时间,极大地提高了工作效率。然而,如何建立一个有效的翻译规则,并逐步完善翻译语料库,是翻译工作者和计算机软件开发者面临的共同难题。

根据日常生活中大量浏览性阅读需求,机器翻译软件在多个层面开发了相应的应用功能,如在线翻译、网页自动翻译、图片翻译、语音翻译等。从使用者的角度来看,用户在打开外语网页时,可以选择“翻译该网页”功能,直接将原网页文字翻译成另一种文字,这种功能的实现并非来自于原网站服务器中的数据,而是一种基于网页应用层面的机器翻译技术。当今,机器翻译软件还可以借助OCR(屏幕识别技术)翻译出非文本格式的图片文件,甚至还可以借助于语音识别技术,识别出用户所讲的内容,并迅速翻译成另一种语言。

可以预见的是,机器翻译技术将来还会与更多技术相结合,进一步丰富其在日常生活、工作中的需求。同时,机器翻译技术也将这种理念运用在了更复杂的未知语言探索中。

三、结论与展望

机器翻译经过长达半个世纪的发展,如今已成为人们日常工作生活中不可或缺的翻译技术工具。语言既是一种建立在一定规则基础上的表达方式,也具有千变万化无法捉摸的特点,这使得机器翻译软件不仅需要制定一定的规则,也需要在投入运用的过程中,不断改善技术,并和语言学知识相结合,提高机器翻译的译文的准确性和翻译效率,降低人工译员译后编辑的劳动量。如今的商业化机器翻译软件经过几十年的发展,已经在很多场合证明了其适用性。同时,由于语言的多样性和随机性,目前的机器翻译软件尚无法完全替代人工翻译,具有一定的局限性,尤其在要求较高的翻译场合,仍非常依赖于人工翻译。

随着大数据技术在各行各业的不断渗透,以及人工智能技术的起步,未来机器翻译软件势必会更加智能,借助于各种现代化应用型技术,一方面可以更轻松完成日常翻译工作;另一方面,甚至可以通过人工智能技术,进行自我学习和感知,逐步涉足更复杂、更多变的翻译工作。

参考文献:

[1]罗季美,李梅.机器翻译译文错误分析[J].中国翻译,2012(5).

[2]王内.文学材料与非文学材料机器翻译适用性比较研究[D].湖南师范大学,2012.

[3]冯志伟,徐波,孙茂松.机器翻译的现状和问题[M].北京:科学出版社,2003.

[4]胡清平.机器翻译中的受控语言[J].中国科技翻译, 2005(8).

[5]Arnold D. & Lee H Machine Translation: Special Issue on Evaluation of MT system[A]. In Arnold D. & Louisa S. Evaluation: An Assessment[C]. Dordrehct: Kluwer Academic Publishers, 1993.

[6]Peter F. Brown, John Cocke, Stephen A. Della Pietra, Vincent J. Della Petra, Fredrick Jelinek, John D. Lafferty, Robert L. Mercer, and Paul S. Roossin.A Statistical Approach to Machine Translation [J]. Computational Linguistics. 1990,16(2): 79-85.

[7]⒔.超文本语境下的翻译形态变化研究[D].华东师范大学,2014.

翻译软件范文第10篇

关键词: 水利工程英语 翻译软件 研发与应用

近年来,随着经济的发展和对外开放的深入,国内的大型水利工程建设中常常引入涉外项目。特别是在江西省委省政府提出建设鄱阳湖生态经济区战略后,鄱阳湖生态水利枢纽工程的前期工作在有条不紊地推进当中。开发一套水利工程译通软件,建立统一、规范的翻译项目管理体系,可使企业高效率地完成翻译工作,同时为引进国外先进的水利工程建设模式、管理经验及成熟技术解决语言沟通障碍,使国内的大型水利工程建设及其相关技术文献的翻译、存档更加智能化、高效化、国际化。

就研究现状看,德国TRADOS公司生产的TRADOS翻译辅助软件,因支持57种语言的双向互译,在国际上已成为行业标准;国内的雅信、华建也在不断开发机器翻译软件;由笔者所在的项目小组设计的软件则着眼于水利工程领域,拥有专门的水利专业语料库,对涉外水利技术文献进行翻译存档,填补国内水利行业无专业工程翻译软件的空白。

据水利部官网显示:2011年全国水利投资再创新高,达到3341亿元,中央水利投资首次突破千亿元大关。其中水利工程领域的国际项目合作越来越紧密,呈逐渐增长趋势。例如:大到国内著名的小浪底水利枢纽工程,鲁布革水电站;近到江西省与荷兰撒克逊大学签订的鄱阳湖水利科技合作项目,都需要借助翻译的媒介。该项目组成员设计的水利工程译通软件是专门针对在水利工程领域有翻译任务的单位及个人开发的辅助翻译工具软件,帮助水利工程建设管理方及翻译人员在保证翻译质量的前提下,使劳动强度变小,翻译速度提高,高效地完成翻译工作。从市场预测结果看,该产品销售单价定位适中,具有相当大的市场潜力和价格优势。

此外,该软件的广泛应用同时还会带动其他工程领域翻译软件的细化研发,如土木建筑、核能开发等国际合作项目,从而使得工程翻译的机器化发展再上一个新台阶。

一、软件研发的原理与内容

基于项目管理的水利工程英语翻译软件的开发是根据数据库原理,将翻译过的所有水利工程文献以句子为单位存入数据库,翻译时系统会自动对原文的电子文档进行分析,与数据库中匹配的句子作自动替换,部分匹配的句子可以根据匹配度提出翻译建议,完全新的句子可以通过系统提出的翻译建议进行人工翻译,每一次翻译的又作为积累的新句子被添入数据库。因此对于大型水利工程项目,需要翻译的文献往往有几百万字,甚至更多。这样,在开始阶段,由于输入的专业术语或句子都是新的,没有相应的目标语与之匹配,翻译速度会慢一些;但是等专业语料库积累一定数量的水利专业词汇和表达时,该软件便会直接译出目标语甚至目标句,翻译速度将会大大加快,质量也更能得到保证。研究表明,大型水利工程翻译资料中的平均重复工作量可高达40%~50%,通过运行该工程译通软件,便可实现“相同的句子永远无需人工翻译第二遍”,从而大大提高翻译效率。

二、软件研发的过程与阶段

该程序软件的开发是一个连续的系统过程,共包括五个阶段,涉及调查法、分析计算法、统筹归纳法等。

1.系统调研、资料整理阶段:收集翻译软件、水利工程语料库、文字编辑软件、用户管理软件所需要的数据信息、技术资料。

2.系统分析阶段:项目启动进入系统分析阶段,项目负责人负责全程的需求管理,组建需求分析小组,了解并协调所需软件目标,信息编辑平台、管理平台,测试与验收标准,交付期需求,预算限制,资源限制等。确定明确具体的需求,包括软件开发环境与技术,软件设计、编程、测试的需求和标准,具体工程项目的应用需求,质量保证需求,项目风险及降低风险的策略。

3.系统设计阶段:系统设计是开发过程中的核心环节。在这一阶段中,我们采用流程化、工程化的翻译任务管理方法,将整个工程翻译过程分成四个阶段:

第一阶段是工程翻译文件的任务化。可以将要翻译的文件作为现有工程的一个任务添加到平台中,也可以新建一个翻译工程并以此文件为初始任务。文件任务化后,管理人员可以利用工程管理平台对文件进行任务指派和分发。

第二阶段是任务的预翻译。一方面,通过工程管理平台提供的水利专业术语管理接口,将与文件相关的水利行业术语一次批量地导入到平台中。另一方面,通过语料对齐平台提供的术语语句对齐接口,从与文件相关的翻译篇章中自动获取翻译记忆。

第三阶段是任务的实际翻译。这个过程是借助译通翻译平台实现的。译通翻译平台提供了灵活的翻译方法,既可以进行全文或批量翻译,又可以进行逐句翻译。翻译修改操作通过平台的跟踪记忆机制自动记录,翻译记忆也在这个过程中逐步学习积累。

第四阶段是任务的提交阶段。翻译人员通过任务反馈,将完成的翻译任务提交到工程管理平台,管理人员通过工程管理平台对所提交的任务进行审核,并反馈给水利工程的管理部门。

工程翻译处理流程如下图所示:

4.系统实施阶段:根据合同的要求或双方协商的结果,确定实施时间,进度安排、验收准则,主要做好软、硬件环境和资源、平台选择配置、操作系统配置、数据库配置、语言环境等方面的配置,整体部署成功后需对整个流程、各种软件接口进行测试,对于复杂的翻译流程,如有必要,可进行适当培训,以使整个系统达到稳定高效的目的。

5.系统维护及文档整理阶段:系统投入运行后,水利工程建设部门应设系统维护管理员,专门负责软件系统的日常维护工作。一方面利用系统建立专用水利工程语料库,使企业最大限度地利用现有翻译资源,高效率地完成翻译工作,另一方面对所翻译的技术文献进行整理分类,以备查阅更新。

三、软件研发的创新点及关键技术

1.基于ActiveX的插件模型:可实现多格式文件的所见即所得编辑,将WORD、EXCEL、POWERPOINT软件作为默认编辑软件。

2.基于格式解析的“所见即所得”模型:通过对解析后文件的显示、编辑、翻译及译后浏览和校对,实现整个HTML翻译过程的所见即所得。

3.建立人员和权限管理:针对不同的级别,用户可以具有不同的操作权限,例如库的创建权限、添加权限、修改权限、删除权限等。

4.建立水利工程术语语料库:翻译系统允许用户批量导入和单个添加专业术语,并且在平台中提供术语导出、修改(校对)、查询、删除等管理操作。

5.语料对齐平台:可以将现有的多语言信息抽取到知识库中,这样在以后的翻译中就可以充分利用已经存在的知识信息,提高工作效率和速度。

四、软件研发的意义

本项目组成员设计的水利工程英语翻译软件是专门针对在水利工程领域有翻译任务的单位及个人开发的辅助翻译工具软件,帮助水利工程建设管理方及翻译人员在保证翻译质量的前提下,使劳动强度变小,翻译速度提高,高效地完成翻译工作。从市场预测结果看,产品销售单价定位适中,具有相当大的市场潜力和价格优势。该软件的广泛应用还会带动其他工程领域翻译软件的细化研发,如土木建筑、核能开发等国际合作项目,从而使得工程翻译的机器化发展再上一个新台阶。

参考文献:

[1]华德荣.TRADOS翻译软件及在大型工程项目资料翻译中的应用[J].川化,2006(1):25-28.

[2]王华伟,王华树.翻译项目管理实务[M].北京:中国对外翻译出版社,2013.

[3]王立松,王雪.在线翻译工具辅助科技论文翻译的使用流程探析[J].天津大学学报(社科版),2011(5):240-243.

[4]韦忠和.2012年及未来几年语言服务行业的发展趋势[J].中国翻译,2012(3).

上一篇:办公软件范文 下一篇:画图软件范文