中、英英语新闻语料库中类联接的对比研究

时间:2022-09-25 06:47:49

中、英英语新闻语料库中类联接的对比研究

[摘要]当今中国,英语新闻不仅在对外信息交流中扮演着重要的角色,而且越来越成为广大英语爱好者所欢迎的读物。然而,在阅读过程中,读者会感到中国的英语新闻与本族语英语新闻的语言表达有差别,但无法道明其中原因。为探究差别所在,本文从类联接的角度对“路透社”和“中国日报”两个新闻语料库中有关happen和incur的部分语料进行了对比研究。本文采用FoxPro程序检索关键词,并用X2检验、处理数据。此外,本文还就语义韵和类联接考察了六本现代英语辞典,检验这两类信息是否在辞典中得到恰当体现。本文的研究结论是:(1)类联接对英语的地道性起到重要作用;(2)本研究中涉及的全部或多数词汇的类联接存在显著性差异;(3)现代英语辞典,尤其是被考察的英汉辞典,没有提供充分的类联接信息。上述发现对英语词汇教学、辞典编纂及语料库在第二语言教学中的运用都有所启示。

[关键词]类联接;新闻语料库;显著性差异

[中图分类号]H315 [文献标识码]A [文章编号]1009-9646(2009)06-0077-03

一、研究背景和目标

在当今中国,英语新闻不仅在对外信息传递中扮演重要角色,而且越来越为中国读者所喜爱,成为提高英语水平的得力工具。以中国日报为例,中国读者占到了其发行量的83%,阅读的主要目的是用以提高自身英语水平(郭,2003)。这就提升了英语媒介的教育角色,尤其是对年轻一代而言。

但在阅读这些主要由中国记者撰写的英语新闻时,读者感到它们与地道英语有所差别,却又无法道出其中原因。单单从语法和意义的正确与否也无法阐释这些差别。这就提出了一个问题:究竟是什么原因使这些意义和语法均无可挑剔的句子不被认同为“纯正”英语呢?本文试图从类联接角度考察中国英语新闻和本族人英语新闻之间存在的差异,以期所获得的信息能为词汇教学和学习提供帮助。

二、文献综述

传统词汇学习局限于音标,语法,词义几大类别,以及词汇之间的关系,尤其是近义和上下义关系。Hoey(2003)对这一学习模式提出挑战,并提出了在语境下词汇分析的可行框架。他认为词汇研究应把类联接作为首要考虑因素之一。本研究将从类联接的角度分析两类英语新闻之间的差别。

Firth首先提出类联接的概念,用以指词项的典型语法型式。Hoey(1997)给出了如下具体解释:

(1)无论是在词组或更高一级中,一个词项保持或避免的语法伙伴

(2)一个词项喜欢或避免的语法功能

(3)一个词项在序列中喜欢或避免的的位置

同时,Hoey认为类联接可以从语篇位置和语法背景两个层面上来分析。语篇位置指的是词项的位置倾向性,换句话说,一个词项强烈的倾向于出现在一定的语篇位置,例如句子的开头或结尾。比方说,50%的conse-quence喜欢以as a consequence或in conse-quence的形式出现在一句话的开头。

语法语境指的是词项与特定的语法范畴共现。还以consequence为例,Hoey(1997)发现只有4%的consequence用作宾语,而32%的preference和use出现在宾语位置上。相反,25%的consequence更喜欢用作补语,而只有7%的preference和use出现在这一位置。

总之,类联接不是语法类别的简单合并,而是客观地记录语言的自然发生,包括词项的语法型式以及在语篇中的特定位置,因而对地道英语的产生具有重要意义。

三、研究方法

1 研究工具

本研究采用Foxpro程序提取语料库数据,使用SPSS13.0来检验统计数据的显著性。

2 数据收集

人民日报语料库是收集了从2003年7月至2003年11月的《人民日报》新闻建成的,共3,270,000字。本研究选用《人民日报》基于以下原因:(1)作为中国的第一份英文报纸,其语言风格最具代表性,是被引用最多的报纸,包含了国内政社新闻,社论,经济,体育,国际新闻等各类新闻。(2)报纸样本较其它新闻媒介更容易获得。对比语料库路透社语料库是从现成的语料库ReutersRCV 1中提取出来的。Reuters RCV 1语料库包含了自1996年8月20日至1997年8月19日的路透社发表的806,791条新闻。本研究提取了该语料库自1996年8月至1996年11月的新闻而建成路透社语料库,共3,290,000字。此外,本研究第二阶段的重要数据来自6本现代英语辞典,其中绝大多数是近十年来发行的。

3 研究过程

本研究分为两步。第一,对比路透社语料库和中国日报语料库。本研究选取了以下四个词项:动词happen和incur以及名词de-alings和effect。原因是名词和动词比其它语法有更多的类联接形式,因而更有利于我们发现差异。限于篇幅,本文仅选取了有关动词happen和incur的研究。第二,对六本英语辞典进行考查,检验它们是否提供了充分的语义的信息。所考察的词项是happen和incur。

本研究采用KWIC方法检索关键词,跨距为5:5。卡方检验用以分析差异是否具有显著性。

四、语料库结果和分析

1 happen的类联接

在Reuters中,总共有300个happen的索引行,其中主要有两个类联接:N+v和PRON+v。Chinadaily共有287个happen的索引行,类联接型式与Reuters相同。

在Reuters中,PRON+v占了绝大多数(77.4%),其中what是最显著的搭配词,与关键词共现达总数的30%。而在Chinadaily中,PRON+V仅占51.4%,而N+V显然更为常用,占总数的42%。卡方检验显示两语料库在happen的类联接上具有显著性差异。Chinadaily显然过度使用了N+V类联接。统计数据如表4.3所示。

Tab,4.3Comparison ofhappen’s Collig-ations Between Two News Corpora

2 incur的类联接

Reuters总共产生59个incur的检索行,共有4个主要类联接:V+N,N+Ved,N+N+V和N+be+Ved。

Reuters建立了incur的两个主要类联接V+N和N+Ved,分别占总数的35.6%和40.7%。而在Chinadaily中,更经常使用的是V+N,占总数的60%。卡方检验显示两语料库在V+N这一类联接上存在显著性差异,表现为V+N类联接在Chinadaily中的过度使用。统计数据如表4.5所示。

Tab,4.5Comparisonofincur’sColligations

Between Two News Corpora

五、辞典考察结果及分析

作为参考书,辞典应客观记录词汇的用法并向学习者提供充分的类联接信息。为观察这类信息是否在现代英语辞典中得到恰当体现,本研究进行了一个小型调查,把辞典提供的信息和第一阶段得到的结果进行比较。所考察的词汇为happen和incur,使用的辞典为4本英英辞典和2本英汉辞典。由于篇幅所限,本文只就incur一词进行分析比较。

在Reuters中,两个主要类联接V+N和N+Ved分别占总数的35.6%和40.7%。对于V+N类联接,所有辞典都提供了相应例句,例如incurlosses/debts,incursomeone’swrath/displeasure。但除了CollinsCobuild辞典,所有辞典都缺失了另一更为常用的典型类联接N+Ved。

综上所述,语义韵和类联接作为两类有价值的信息,在大多数辞典中并没有得到恰当体现,尤其是所考察的两本英汉辞典。比较起来,CollinsCobuild辞典因为是基于语料库数据而编纂的,因而更加精确,客观,可靠。

六、结论和启示

综上所述,本研究主要得出以下结论:所有被观察的词项的全部或多数类联接存在显著性差异。多数现代英语辞典没有提供充分的语义韵和类联接信息。

新闻记者可以被认为是高级英语学习者的代表,他们在类联接知识上的欠缺反映了英语习得上存在的问题。它解释了为什么学习者感觉已经认识掌握了词汇却依然写不出地道英语的原因,因而应引起我们的重视。我们从本研究中可以得出以下启示:

Chinadaily语料库所表现出的类联接知识的欠缺是显而易见的,这足以说明类联接对语言学习者的重要性。因而,应通过检索来学习类联接的方法,这种数据驱动的方法可以直接向学习者展示语言是怎样自然发生的。

应把类联接信息纳入现代英语辞典。作为参考书,辞典在二语学习中扮演重要角色,应该向学习者提供更准确更充分信息。但上述调查发现大多最近出版的英语辞典中,类联接信息并没有得到重视,这势必成为英语学习和翻译的障碍。而造成这一不足的一个重要原因就是辞典编纂没有借助大型语料库的帮助。大型语料库的获得以及检索软件的开发能发现更多人类直觉所察觉不到的信息,因而从中所获得的数据应该为辞典编纂者所运用来作为编纂工作的基础。

七、本研究的局限性

尽管本研究发现了两语料库的一些不同,但还只是一个尝试性的小型研究。因为数据主要来自新闻语料库,我们还无法作出普遍意义的结论。选词的主观性以及有限数量也会给数据带来一定误差。因此。在今后的研究中,我们有必要在更大的普通英语语料库中观察更多的词项,进而作出更深入的分析。

上一篇:Walmart Seeks Bigger Slice of Brazil 下一篇:INVESTMENT