使用RSTTool分析科技英语长句

时间:2022-06-15 08:59:22

使用RSTTool分析科技英语长句

RST理论命名和定义了20多种关系,原则上来讲,语篇关系的种类和数量是无限的,以前从未出现过的关系类型也可能在新的语篇关系中出现,但在实际应用中,用为数有限的关系就可以分析一种语言的大部分语篇,如大多数英语语篇都可以用20多种关系[3]来描写。2001年,由DanielMarcu博士主持的研究小组以RST理论为支撑创立了语篇标注语料库。其研究成果将定义关系扩展到了78种,包括53种单层核心关系和25种多层核心关系,并将这78中定义关系分成16个组别,每组都具有相同的修辞功能[4]。修辞关系有两个主要的特点:(1)关系结构内部具有同质性。RST认为从小句连接到语篇,各个结构段之间是有层次的,两个小句之间,几个小句和几个小句之间,再到段落与段落之间,直至整个语篇,都是有层次的。而且,层次的多少也是不固定的。关系结构同质性的特点,使得从小句连接到语篇本身的所有层级结构共用一套相同的关系模式,不会因为结构段的等级变化而不同,因此不同的分析者也会取得较高的一致性。(2)修辞关系的结构关系是功能关系,可用不同的效果类型来描写,比如可从作者的交际意图或作者对读者情况的假定等角度来描述。结构段(span)是指语篇结构中任何具有RST结构的、功能完整的片段。两个独立的结构段根据其在相互关系中的核心或辅助地位,具体可分为“核心结构段”和“辅助结构段”,核心结构段可分为单核心结构和多核心结构。但多核心结构关系实际没有核心与辅助之分,各部分是并列关系。结构段的划分可以结合语篇中的逻辑关系采取自上而下,也可以自下而上或两者兼用的方法。任何一个完整连贯而又符合逻辑的语篇都是由体现为小句、句子、语段、段落的结构段按一定的语义关系排列组成的,是动态的语义单位。结构段具有等级性的特点,因而结构段是相对于所在的功能整体来划分的。RST关系可用认知图示来说明各结构段之间的逻辑关系。Mann和Thompson[5]认为,认知图式可决定一个语篇中所有成分的结构性排列。它由3个要素组成:一定数量的成分性结构段;结构段的关系说明;某个结构段(核心结构段)与语篇整体的关系说明。(1-n)代表结构段范围;横线及下面的数字,如1、2或者1、2、3、4、5代表具体的结构段;弧线代表结构段之间的关系,如“证据关系”、“序列关系”;在核心-辅助关系中,箭头指向核心结构段,如“证据关系”指向结构段1;在非核心-辅助关系中,弧线不带箭头,如1、2、3、4、5之间的序列关系。

RSTTool

RSTTool是以修辞结构理论为理论框架,为语篇的修辞结构关系提供计算机分析的工具。该文本分析工具是澳大利亚人MickO’Donnell博士研制开发的,可以在Windows、Macintosh、Unix和LINUX多种操作系统下运行。其界面友好,可以对篇章结构进行切分和标示。其结构关系开放性的特点允许用户修改、添加、删除和重新命名等操作。其统计分析功能可以直接显示各项百分比,从宏观上把握各种篇章类型的特点,核心与辅助关系的次序也用数据显示,这样更方便读者和译者发现体现语篇要旨的核心篇位。其应用范围广,适用于多种语言分析。现在网络上最常见的是RSTToolVersion3.45[6]。RST工具有四个操作页面[7]:(1)文本界面(TextSegmentationInterface):用于结构成分切分。(2)文本结构关系界面(TextStructuringInterface):用于标示结构关系。(3)结构关系编辑界面(RelationEditor):用于编辑和维护结构关系。(4)数据统计界面(Statistics):用于统计分析数据。RSTTool的具体操作在下文中的实例分析中进行详细阐述。

科技英语长句的RSTTool操作

科技英语(EnglishforScienceandTechnology,简称EST)叙述客观、表达确切、流畅自然、逻辑严密,但其中长而复杂的句子,往往给阅读和翻译带来很大的困扰。本节将概述科技英语长句的句法特点,运用RST工具进行实例分析,呈现该工具的操作方法。

科技英语长句的句法特点针对自然现象的实验观察、数据分析以及定理式的逻辑推理证明,科技英语具有技术性、抽象性、客观性和信息高密度性的语域特征。从句法上看,科技英语组句较长,成分复杂,结构严谨。主要表现为:大量使用名词、名词短语、悬垂结构及分词、不定式等非限定分句说明事理;频繁使用介词词组和短语准确而简练地实现时间、空间、目的、理由、因果等逻辑关系;表征目的、条件、因果等不同逻辑关系的从句交错重叠;遵守英语句子末端重心原则,较长的分句移到句末,句子前后长度保持平衡。由此可见,科技英语的长句“长”在句子内部语义关系产生的多层次复杂性。目前,国内对于科技英语长句的研究与分析始终停留在词汇、语法层面,描述科技英语长句的翻译技巧,包括结构分析法、顺译法、倒译法、中译法、分译法和综合法,但没有论述技巧背后的语义机制[8][9][10][11]。需要指出的是,杨坚定[12]运用修辞结构理论提出以修辞结构段作为动态翻译单位,并对一段科技英语篇章原文和译文的修辞关系对等进行了分析和解释,这可看作是修辞结构理论应用于科技英语翻译的成功尝试。2.RSTTool的操作展示下面以一个航空航天英语[13]句子为例,展示RSTTool的具体操作。BecauseShuttlesystemperformancerequiredahighlyefficientascentpropulsionsystem,anewrocketenginewasdeveloped—onethatwoulddeliversubstantiallyhigherperformancethanitspredecessors,couldbethrottledoverawidethrustrange,andcouldbeusedmanytimeswithoutmajormalfunctionoroverhaul.1)文本导入RSTTool只识别和处理文本文件(txt).,在导入一个新文件之前,应转换为该格式。需要特别注意的是中文文本必须在保存和导入时选择相同的编码格式(英文文本默认的即可),例如文本格式保存时使用的是utf-8,那么在导入RST工具时,应在encoding处选择utf-8。2)文本切分文本导入之后,进入文本界面(如图),该界面有两组操作命令,一组是Modes(方式),移动鼠标可以在文本切分和文本编辑之间转换。另一组是Segment(切分),可以在句子和段落的处理之间转换。其中Segment可以输入标点,定义所要切分的位置。段落的切分是自动完成的,只要在“切分”(segment)状态下,点击段落切分,就出现段落标记符。RST工具只识别空行的段落,所以在输入文本时,用户要在段落之间做空行标记。句子的切分可以是自动完成,也可以是用户手工完成的,因为有时候RST工具不能识别非常规的标点符号。一般情况下,在RST分析中,根据Mann&Thompson的应用实践,分析单位的大小是任意决定的,但无论是大是小,这种单位必须具有独立的功能完备性,据此独立的短语、子句、句子都可以成为修辞结构的分析单位。在本文中,为了简化操作和便于识别,笔者在导入之前就先把文本进行了编码和切分。1BecauseShuttlesystemperformancerequiredahighlyefficientascentpropulsionsystem.2anewrocketenginewasdeveloped—.3Aonethatwoulddeliversubstantiallyhigherperformancethanitspredecessors.3Bcouldbethrottledoverawidethrustrange.3Candcouldbeusedmanytimeswithoutmajormal-functionoroverhaul.导入RSTTool之后,如下图3所示。3)结构关系集的选择和编辑在标示结构关系之前,要先进入关系(Relation)界面,导入(load)一个关系集,最常用的是第一个和第二个。第一个ClassicMT.rel是Mann&Thompson1998版,第二个ExtMT.rel是Mann&Thompson修订的2000版[6]。在图4这个界面,用户可以增加、删除或重命名关系。4)结构关系的标示结构关系的标示过程,是RST分析的重点和难点。在判定两个结构段之间的关系时,分析者在每一步都要考虑关系定义运用的是否得当,要尽可能的做到客观。点击Structurer键,就会进入如图5的界面。在标示单核心结构时,按下Link(连接)按钮,从辅助结构段按住鼠标左键拖动到核心结构段,松开鼠标,出现结构关系菜单中的关系选项,选择所要定义的关系,两个结构段就被连接起来,在连接线上方标记为选中的结构关系。在标记多核心结构的时候,点击AddMultiNuc按钮,按照上述同样的方法拖动鼠标,就会出现多核心结构关系的菜单,选择所要定义的关系。然而,这只是第一步。多核心关系需要两步操作,这时需要再次点击Link按钮的条件下进行选择,在想要添加的结构段上按住鼠标左键拖到上一步出现的结构段上方的数字处松开,又会出现另外一个对话框(如图7所示),然后选择multinuc,多核心结构的关系定义即完成。Addspan的按钮可以将核心结构段和所有的辅助结构段连接起来,操作也很简单,点击“addspan”,在核心结构段处点一下即可。标示完毕后,图式可以储存、打印或转换显示格式,也可以在结构菜单下,选择将图式粘贴到剪切板,使分析和阐释更为方便和直观。个结构段———新型火箭发动机的研制。本句包括三个结构段1、2和3,3又包括3A、3B、3C三个结构段。1和2是意愿性的原因关系,3B和3C是联合关系,为3A的说法提供证据,因而3B、3C和3A是证据关系。3A、3B、3C都是对2的进一步阐述,是详述关系。从句法的角度来看,3A和3B、3C之间是并列的,但从语义上来看,后者为前者提供了证据支持。

科技英语长句的RSTTool分析

在科技英语篇章中,长句的出现频率很高,如上所述,科技英语的长句“长”在句子内部语义关系产生的多层次复杂性。下面运用RSTTool3.45试析几个长句内部的功能语义关系,尤其是隐性逻辑语义关系,从而展示理解和分析科技英语篇章的一种有效途径。本节的航空航天英语例句也均选自严俊仁[13]。

例1:StimulatedandstrengthenedbytwoWorldWarsthebabyisgrowingupandthecommunityunderstandsveryfullythefoolishusesforwhichaircraftcanbeexploited—buttherearewiseusestoo,eventhoughtheymaynotbesoreadilyapparent.1AStimulatedandstrengthenedbytwoWorldWars1Bthebabyisgrowingup2andthecommunityunderstandsveryfullythefoolishusesforwhichaircraftcanbeexploited3Abuttherearewiseusestoo,3Beventhoughtheymaynotbesoreadilyapparent.从图10所示关系图解可以看出,该长句分为3个结构段。第一个结构段分为1A和1B两个次结构段,它们之间的关系是隐性的非意愿原因关系;第三个结构段由3A和3B两个次结构段构成,由于“eventhough”的存在,它们之间是显性的让步关系;结构段2和3之间是显性的对比关系;1与2、3之间则构成了隐性的背景关系。结构段1和2由连词“and”连接,似乎是并列的关系,但在语义上,结构段1为2提供了良好的背景知识,帮助读者更好地理解结构段2的内容。

例2:Thisismadepossiblebythefactthatallthepilot’sinputsarefirstprocessedbyahighspeedcomputersystem;itthenpassesthemtotheaircraft’sflightcontrolsascommands,allowingATTAStoassumetheflightcharacteristicsofanotheractuallyexistentaircraftorofahypotheticalaircraft.1AThisismadepossiblebythefactthatallthepilot’sinputsarefirstprocessed1Bbyahighspeedcomputersystem;2itthenpassesthemtotheaircraft’sflightcontrolsascommands3allowingATTAStoassumetheflightcharacteristicsofanotheractuallyexistentaircraftorofahypotheticalaircraft.如图11所示,此结构关系图式分为3个结构段1A和1B之间是显性的方式关系,由by表示;结构段1和2存在着明显的序列关系,而作为核心结构段,结构段3是前2个结构段所要达到的目的。

例3:Therecanbenodoubtthatthesecond50yearsofpoweredflightholdsachallengemoreforbidding,thoughnolessinteresting,thanthefirstbutthesuccessachievedwillnotbemeasuredbymanlandingonthemoonbutbywhetherintheprocesswehavelearnedwisdomandindoingsohavestoredthefreeexchangeofknowledgewithinandbetweenallcommunitiesonthesurfaceoftheearth.1ATherecanbenodoubtthatthesecond50yearsofpoweredflightholdsachallengemoreforbidding…thanthefirst1Bthoughnolessinteresting,2Abutthesuccessachievedwillnotbemeasuredbymanlandingonthemoon2Bbutbywhetherintheprocesswehavelearnedwisdom2Candindoingsohavestoredthefreeexchangeofknowledgewithinandbetweenallcommunitiesonthesurfaceoftheearth.由该关系结构式(见图12)可知,该句分两个结构段。结构段1包括1A和1B两个次结构段,其中1B在句子结构上属于插入成分,二者之间是显性的让步关系;2B和2C是联合关系,2A和2B、2C之间是对照关系,作者观点是对后者的肯定;结构段1和结构段2之间是非意愿性原因关系,由于but的存在,看上去似乎是一种显性的让步关系,但是从深层语义来看,结构段1的出现使得结构段2中阐述的衡量成功的标准发生了变化,所以它们之间是隐性的非意愿性原因关系。

结语

修辞结构理论从动态交际功能的角度出发,摆脱了关联词语、语法结构、类型结构等表层语言形式的束缚,研究“目的”“、意义”等抽象体的结构关系模式,从而更清楚地呈现科技英语长句内部隐含的逻辑语义关系,更好地表达作者的交际意图,有利于读者更好地理解和把握文章主旨。上述实例分析表明,运用RSTTool标示科技英语长句各部分之间的关系,清晰、明了、易于理解,在很大程度上降低了理解的难度,为进行基于语料库的RST科技语篇修辞结构标注和定量统计分析提供了有益启示。

作者:董敏高文睿单位:北京航空航天大学外国语学院

上一篇:县司法局二0一三年工作意见 下一篇:全县普法依法治理实施要点