依存关系正确理解的基础上的日中翻译

时间:2022-09-23 06:26:09

依存关系正确理解的基础上的日中翻译

(山形大学,日本)

摘要:中文向其他语言翻译时,常常因为中文句法结构认识上有出入而造成翻译上的错误。该文利用正确分析后的依存关系语句,进行短语划分,对短语进行中日机器翻译,并组合成句子。以此证明,正确句法分析在解决机器翻译现有问题中的重要作用。

关键词:机器翻译;依存关系;句法分析;中日翻译

中图分类号:TP393文献标识码:A文章编号:1009-3044(2009)28-8011-03

Chinese-Japanese Machine Translation on the Basis of Correct Analysis of Chinese Syntax

WANG Li-qun

(Yamagata University, Japan)

Abstract:When translate from Chinese to other language, it always happens that because of the analysis of Chinese syntax, the result of translate is wrong. This paper using correct analysis result of Chinese syntax to cut the phrase, and use the phrase to translate from Chinese to Japanese. After translating, we combine the phrase to one sentence. From this paper, we can understand the importance of analysis of Chinese syntax in machine translation.

Key words: Machine Translation;dependency phrase;syntax;Chinese-Japanese translation

机器翻译就是利用计算机自动进行一种自然语言文本到另一种自然语言文本的翻译。目前机器翻译的结果还不能达到令人满意的效果。本文在对机器翻译错误结果进行分析后,发现很多错误令读者不能领会原文的意思。而这样的错误常常是因为句法分析上出现了错误造成的。由于自然语言具有复杂性和不确定性,目前的完全句法分析器还无法达到令人满意的效果[1]。目前对依存关系的研究有些是着眼于利用对译文中的对应的短语,使源语言和目的语言的依存关系模型化[2,6]。本文将只针对原文(中文)句法方面进行分析。坚信只有在正确理解原文的基础上,才能正确进行翻译。此外,本文主要应用依存关系句法分析进行中日机器翻译的新尝试。

1 句法分析中存在的问题

本文列出的各种错误只针对依存关系的错误给出例文,对非依存关系的错误本文不进行深入讨论。

例1:认真的学习外语まじめな学の外国Z

原文结构:认真的(学习外语)译文的结构:(认真的学习)外语

从例句不难看出,句子结构认识上的错误常常导致翻译后的译文很难理解,导致很多不符合常理的句子的出现。就如南辕北辙一样,从句法分析的根就是错的,译文也一定不对。因此,本文特别强调对原文句法分析的重要性。

下面针对句法分析中常见的错误进行总结:

1)“的”依存关系的认识错误。如例1。

2)并列句的认识错误。

例2:

原文:在1998年来临之际,我十分高兴地通过中央人民广播电台、 中国国际广播电台和中央电视台,向全国种族人民,向香港特别行政区同胞、澳门和台湾同胞、海外侨胞,向世界各国的朋友们,致以诚挚的问候和良好的祝愿!

译文:1998年のご光Rのr、私は非常にうれしく中央人民放送局、 を通します中国国H放送局と中央テレビ局、全国の人Nの人民に向って、香港特e行政区の同胞、マカオと台湾の同胞、海外同胞に向って、世界の各国の友_に向って、\gな挨拶と良好な祈を申し上げます!

原文结构:在1998年来临之际,我十分高兴地{通过(中央人民广播电台、 中国国际广播电台和中央电视台)},

译文结构:在1998年来临之际,我十分高兴地{(通过中央人民广播电台)、 (中国国际广播电台和中央电视台)},

可见并列关系的起始位置没有正确的认识就会造成一部分并列关系的语句被遗露,独立在句子成分之外,语义的理解就会造成偏差。

3)存在句法歧义的句子。

例3:

结构1:可恶的狐狸的故事(可恶的狐狸)的故事

结构2:可恶的狐狸的故事可恶的(狐狸的故事)

这两种结构在语法和语义上都没有任何问题,对这样的句子的区分,只能借助于上下文进行区分,难度较大。

4)修饰关系的错误。

例4:

原文:按照“一国两制”、“港人治港”、高度自治的方针保持香港的繁荣稳定。

译文:“一国二制度”、“香港人による香港のy治”、高度な自治の方によって香港の安定した繁绚蚓S持します。

原文结构:香港的(繁荣)(和)(稳定)译文结构:香港的(稳定(的)繁荣)

例4将两个并列关系的词,理解为修饰关系。造成了句法理解上的错误。

5)否定的对象认识不清

例5:你现在还不回屋睡去?あなたは今まだ家にらないで寝ていきますか?

原文结构:你现在还不((回屋)(之后)睡)去。

译文结构:你现在还(不回屋)(睡去)。

“回屋”是用来修饰“睡”的,因此,“不”否定的是睡而不是回屋。

另外,双重否定的理解错误的例子也在此给出。

例6:没有不佩服他的人彼に感心しないのではない人

原文结构:没有(不佩服他的人)。

译文结构:(没有(不佩服他))(的人)。

双重否定,对否定的对象的理解,难度又加深了一层。

6)省略句的认识错误。

例7:原文:这两个顾客,一个是给口袋不要,一个是要口袋不给。

译文:この2人の客、ひとつはポケットに要らないので、ひとつはポケットを要してあげないのです。

原文结构:给口袋(不要)。

译文结构:给(口袋不要)。

原文中的意思没有在译文中表达出来的主要原因是没有对“给口袋不要”省略的部分正确理解。补足原句为:“给(他)口袋,(他)不要”。补足后得出正确译文:“彼にポケットをあげて、彼は要りません”。

7)同位性成分理解上的错误。

例8:人家小梅她自己早有主意了。人の梅(さん)は彼女は自分でもっと前に考えがありました。

小梅和她都是指的小梅这个人。重复翻译出来之后,造成读者不能清楚理解原文。

8)词性认识错误。

例9:曹雪芹的生平及其创作。曹雪芹の一生及び作します。

原文结构:曹雪芹的(生平及其创作)。

译文结构:(曹雪芹的生平)及其(创作)。

创作在这个句子中指的是曹雪芹创作的作品,译为动词则无法正确理解。

9)主谓认识不清。

例10:我画的是荷花私はかきますのハスの花です

原文结构:我(画的是(荷花))。

译文结构:(我画)的(是荷花)。

10)比较类的依存关系错误。

例11:好看多了。たくさんていることができます。

原文结构:(好看)多了。

译文结构:好(看多了)。

11)偏口语化的句子更难正确理解。

例12:妇女们把他围了个严严实实。女性_は彼をしっかりとに欷撙蓼筏俊

此例“围了个”。没有正常理解。“个”字被单独翻译了。

当然,以上只列举出了错误的一小部分,还有很多类似的依存关系认识错误的例子,没有举出来。通过以上实例,我们不难看出,无论对单词翻译的多么精确,对句子的句法理解错误,将导致读者不知译文所云。因此,在机器翻译成外国语之前对句子句法关系的理解,是机器翻译正确性的一大关健问题。

2 试验及结果

针对以上例句,本文进行了依存关系处理,具体流程如图1。

具体实例操作如下 :

例:网络翻译结果:认真的学习外语まじめな学の外国Z

首先对原文进行分解,如图2所示。

从上例看出,根据原文的正确分析结果翻译出来的译文,从语义来讲,读者还是可以正确掌握原谅思想的。从这方面看,此种方法的改进还是有效果的。

通过以上分析,针对正确的依存关系,相信一定能得出正确译文。

3 结束语

本文主要针对机器翻译中造成翻译结果错误的主要依存关系错误进行探讨,举出了很多错误实例,志在号召机器翻译研究在进行翻译之前,提高对原文理解的精确度,这将大大提高翻译结果的可信度。并通过对正确依存关系,利用翻译系统进行实验,将翻译结果的正确率大幅提,以此,证明了本文观点。以下是对今后的研究的展望:首先,对依存关系理解上应用多种方法,使依存关系的正确理解大幅提高。在此基础上,对目前依存文法的存储方法及内容(例:依存关系网如图3)进一步改进。使之在理解句意方面,更加实用,更加便利。希望通过对依存关系认识的改进,对机器翻译起到一定的推动作用。

注:

本文中所有的日文译文均来自参考文献[3]的译文。

本文中的例文很多来自参考文献[4]。

参考文献:

[1] ,赵颖泽.汉语功能块自动分析.[J].中文信息学报,2007,21 (05):18-24.

[2] 中擅裘鼽\虻夫,”句の依存vS_率モデルを用いたy的U文アライメント”, 言语处理学会第15回年次大会集,2009,3月:865-868.

[3] excite翻Uwww.excite.co.jp/world/chinese/.

[4] 吴竞存,梁伯枢.现代汉语句法结构与分析[M].语文出版社.2000年5月第3次印刷.

[5] 郭艳华,周昌乐. 一种汉语语句依存关系网分析策略与生成算法研究[J].浙江大学学报(理学版), 2000,(06).

[6] Toshiaki Nakazawa and Sadao Kurohashi. Linguistically-motivated tree-based probabilistic phrase alignment. IN In Proceedings of the Eighth Conference of the Association for Machine Translation in the Americas(AMTA2008),2008.

上一篇:基于DNS服务器动态域名系统的实现与分析 下一篇:一种新的基于试题模块库的组卷方案