同义词词典范文

时间:2023-11-04 08:16:20

同义词词典篇1

摘 要:同义词群是指围绕相同义素所形成的词的集合。它把意义相同、相近,或类同的词聚合在一起构成一个系统。系统中的词语因具有词群的群义特征而相互联系,同时又因具有独特的个性意义特征而相互区别。建立军语同义词群可保证《军语》词目收录的系统性和释义的完整性。

关键词 :军语 同义词群

一、同义词群的涵义

同义词群是指围绕相同义素所形成的词的集合(萧国政,2007)。在同义词词群中,相同义素即语义基元是词群的纲,它把意义相同、相近,或类同的词聚合在一起构成一个系统。系统中的词语因具有词群的群义特征而相互联系,同时又因具有独特的个性意义特征而相互区别。例如:“进攻”类军语词群以军语“进攻”为核心,把军语中“攻击、攻占、强攻、强击、袭击、急袭、奔袭、侧击、尾击、夹击”等众多与之意义相同、相近、类同的词语聚合起来就形成了具有同一语义因子的“进攻”类军语同义词群。

二、军语同义词群的构建

在同一个词群中,各个成员的地位是不平等的,其中有一个成员处于核心地位,它的周围聚集了该词群的其他成员,它的意义对于其他成员都是共同的,我们将这个处于词群核心地位的词语称为基元词(伍莹,2011)。例如,在“进攻”类军语词群中,我们将“进攻”视为基元词,把与之意义相同、相近、类同的军语聚合起来并按照一定的原则进行分类。从认知角度看,“攻防”行动的显著结构特征包括:1.对抗性的作战双方;2.作战所处的战场和战场环境;3.作战使用的战略、战术等。我们依据上述三个特征对“进攻”类军语同义词群进行分类。

第一类是按进攻的主客体划分。进攻的主客体包括进攻的作战力量、进攻的对象或目标。按作战力量划分有空军进攻、海军进攻、陆军进攻、联合进攻等术语。按进攻对象态势域划分有:对阵地防御之敌的进攻、对机动防御之敌的进攻、对立足未稳之敌的进攻等术语。

第二类是按进攻所处的战场和战场环境划分。战场是敌对双方进行作战活动的空间。分为陆战场、海战场、空战场、太空战场,以及网络战场、电磁战场等。战场环境是战场及其周围对作战活动有影响的各种情况和条件的统称。包括地形、气象、水文等自然条件,交通作战设施建设、作战物资储备等战场建设情况等。例如,按“进攻”的自然条件划分有以下术语:

1.战场域:陆上进攻(地面进攻)、海上进攻、空中进攻、立体进攻等。

2.战场环境域:山地进攻、荒漠草原地进攻、水网稻田地进攻、江河地区进攻、岛屿进攻、高寒山地进攻、热带山岳丛林地进攻等。

第三类是按进攻采用的手段、规模、行动方式等进行划分。例如:

1.行动方式域:开进、展开、冲击、突破、穿插、迂回、包围、追击、“突击”类、“攻击”类等。

2.规模域:战略进攻、战役进攻、战术进攻等。

3.手段域:信息进攻(导弹部队信息进攻等)、电子进攻、导弹进攻等。

三、在《军语》词典编纂中的应用

(一)建立军语同义词群可保证《军语》词目选录的系统性

从《军语》词典的宏观结构来看,建立军语同义词群可保证《军语》词目选取和收录的系统性。《军语》词典的宏观结构指的是词典的整体结构安排,其中包括军语类目的安排、军语词目的选择以及军语词目排列原则等。在军事概念体系中,有许多同类概念是相互对应的,比如陆军战略、海军战略、空军战略,陆军战役、海军战役、空军战役等等。原则上同类词目收入不可或缺,同类词目释文框架也应相对一致。但由于在词目审定环节,调整、平衡词目的过程是人工完成的,费时耗力,在同类概念的收入上难免会出现缺失现象或不平衡现象。比如在2011年版《军语》中,“进攻、防御”类的术语分布在战争战略、作战(综合)、战役·战役法、战斗·战术、信息对抗、陆军、海军、空军、第二炮兵等9个类目中。通过前面建构的“进攻、防御”类同义词群,我们会发现《军语》收词的不平衡性,比如,“进攻”包括战略、战役和战术范围的进攻,2011年版《军语》只收录了“战略进攻”,却没有在其他相应类目中收入“战役进攻”和“战术进攻”。在军语体系中,“战略进攻”“战役进攻”和“战术进攻”是同位概念,属同类词目,若收则俱收,若弃则俱弃。同样,“防御”包括战略、战役和战术范围的防御,我们发现2011年版《军语》只收录了“防御战略”“防御战役”,而没有收录“防御战术”。同义词群按照语义基元将具有同一语义的术语聚合分类表示,若建立相对完整的军语系统同义词群后,则便于专家迅速查找,避免收词的缺失和不平衡现象。

(二)建立军语同义词群可保证《军语》释义的准确性

《军语》词典的微观结构是指词典中单个词目义项的划分和释义等。撰写军语定义,应当首先明确被定义概念的上位概念,并据此确定被定义概念在其概念体系中的准确位置,也就是说,要确定被定义概念所反映的客体属于哪一类,才便于在同一类对象中进行比较,找出被定义概念所反映的客体与其他对象的区别性特征(李苏鸣,2009)。例如,“袭击”的定义为“出敌不意或乘敌不备突然实施的攻击。”这一定义中的“攻击”就是“袭击”的上位概念。每个以基点词位为起点的同义词群,均是由上位概念集合、同位概念集合和下位概念集合共同形成的同义词群体系。确定了被定义军事概念的上位概念后,就可以在其军事概念体系中通过对同位军事概念的比较,找出并描述它们之间的区别性特征,从而完成对该军事概念的定义。术语学认为,内涵定义是用上位概念和区别特征描述概念,而外延定义则是用下位概念来描述概念。我们对军语内涵的定义通常采用以下基本模式进行描写:军语定义=上位军事概念+用于区分所定义军事概念同其他并列军事概念的区别特征(张国君,2009)。在军语内涵的基本模式中,等号左边是“被定义项”,等号右边是“定义项”,是对定义的语言描述。在军语同义词群的构建中,为确保同义词词群的界限,要求该范畴的全部成员至少具有一个共同的关键属性,也就是语义基元,它是把词群中所有具有同一语义的军语联系起来的纽带。确定了基点词位,一个同义词群中所有变体词位的语义内涵都可以用“语义基元+区别性特征”进行描写。这一模式用于军语内涵定义的描写中可使军语内涵定义的描写更为便捷。

(三)建立军语同义词群可避免《军语》义项收录偏废

比如有些军语具有多个义项,收入该军语词目时在释文中通常按义项分别进行解释。比如,“口令”是一个传统军语,其主要义项一是“口语命令”,如队列和装备操作中的口语命令;二是“口语暗令”,如简易通信中的联络口语。1997年版《军语》对“口令”地释义就较好地照顾到这两个义项,但是,2011年版《军语》对“口令”的释义则只着眼于通信用语“识别敌我的问答暗语”,而没有顾及队列和装备操作中的“口语命令”。此外,“口令”的两个主要义项分属不同类目:解释为“口语暗令”时属于通信类,解释为“口语命令”时属于训练类或其他类。因此,实际上应当将其视为两个军语。如何对同形异义军语进行合理归类,是军语词典编纂需要解决的一个特殊问题,建立同义词群将很好地解决这一问题。

参考文献:

[1]萧国政.动词“打”本义的结构描写及其同义词群建构——一种人机共享的“词群-词位变体”研究初探[A].中文计算技术与语言问题研究-第七届中文信息处理国际会议论文集[C].北京:电子工业出版社,2007:3~4.

[2]伍莹.基于“词群-词位理论”的现代汉语形容词语义网络构建[J].长江学术,2011,(2):168~171.

[3]李苏鸣.军语导论[M].北京:军事科学出版社,2010:152~168.

[4]张国君.略谈军事术语定义的撰写[J].中国科技术语,2009,(5):17~21.

[5]刘国语.中国人民解放军军语[Z].北京:军事科学出版社,2011.

同义词词典篇2

一、典故词的词义特征

典故词除了其构词等有别于汉语一般语词外,其词义主要有以下五个方面的特征,这是词典对典故词进行释义所必须把握的。

(一)典故词是文化词语,因而典故词的词义只是文化意义。

词义从其生成的角度分,可以分为两类:一类是语言意义,亦即词目字面自身所具有的意义。它一般包括词的本义及其引申义、通假义等。词的语言意义是语言形成发展过程中约定俗成、逻辑演绎的一种必然结果,如“封”,本义是堆土植树为界,引申有聚土、土堆、隆高之物体及高、大、厚诸义,如“蚤”假借为“早”等等。另一类是文化意义,它是特定的社会文化背景造成的、有别于其语言意义的一种意义。这种意义如离开对形成它的特定社会文化背景的了解便无法认识和掌握。

具有文化意义的词语亦可分为两类:一类是文化词语,另一类是一般词语。一般词语在词义的引申过程中有时会与某种特定的社会文化背景发生勾连,如“封”之引申而有“爵诸侯之土”义,这当与土地私有及分封诸侯这样的文化背景有关,这样的引申义则是文化意义。

词语的语言意义与文化意义是相对而言的。从广义上说,语言本身也是文化的产物,所以词的语言意义也是文化意义。我们在这里对词义的这种区分,将语言意义从文化意义中划开,所取用的“文化”这一概念当然只是狭义的:它踢开了语言自身形成发展的文化,专指人类社会生活中上层建筑领域部分对语言中词语的形成及词义的发展所起的作用。wWW.133229.Com

典故词是文化词语中的一类。因为典故词有较为明确的典籍源头,其构词及词义等均与其源头密切相关,而典籍无疑是上层建筑领域的产物,所以典故词只能属诸文化词语而不属于普通语词。文化词语一般都只具有文化意义,如词义有所引申,当然也只能是文化意义上的引申。

典故词语作为文化词语,其不同于一般词语是显见的,因为文化词语有特定的文化背景,而一般词语则没有。不仅如此,典故词语与一般词语乃至其他文化词语的词义有着甚多的不同,大致归纳起来有如下数端。

(二)典故义有较为明确的源头。

如前述,典故词语有较为明确的典籍源头,因此,其词义的发端也比较清晰。

就目前出版的典故辞书看,关于典故概念大家的认识还并不怎么统一。关于这个问题,我在第一章《为典故正名》一文中,曾有所论及。事典,大家似乎并无多少争议,关键是语典和典制词语,目前的典故辞书分歧较多。

以此我在这里对典故词的把握再提出以下两条标准:

一条是文化意义。具不具备文化意义是区分语典词语与普通词语的一条重要标志。我将离开源出语言环境便无法理解、具有源出语言环境义的词语定为语典词,如“伐柯”之用言作媒,“而立”之指代三十岁,就是因为其取义不是其字面义,而是由《诗·豳风·伐柯》之“伐柯如何,匪斧不克。娶妻如何?匪媒不得”及《论语·为政》之“三十而立”这样源头中的具体语言环境所规定的。

另外一条即是典故词语有确切源头可考,这样即把典制词语与一般文化词语区分了开来。如“沙堤”出于唐代典制,史籍有明确的记载,后世用来写宰相,自然可将之视为典故词;而“左券”、“左契”,从《老子》而后的许多典籍看,虽然也是文化词语,甚至可以视作典制词语,但是我们无法弄清其确切的源头,因为它可能是古代有文字而后至纸张出现之前长期存在的一种事物。那时契约都是刻之于竹的,负债人及债权人剖之为二,负债人执右片,债权人执左片。“左券”、“左契”即债权人所收执的作为索偿的一种凭证(关于这一点尚有争议),这样的词语实际上也可能就没什么源头可考,要考,也只能是“事物纪源”一类。如果说它一定源于《老子》,自然不合事理,只不过从现存典籍看,《老子》使用这一文化词语较早罢了,所以我们便不宜把它看作典制词语。

我与二三同人耗时三十多年所编之《典故大词典》基本上是基于以上的把握来收录语典的。至于典制词语,我们为把典故和掌故区分开来,则只收典制词语中有借代、喻指等义的一类。

语典和事典一般都有确定的典源。一般都出于某一固定的典籍,后世典籍在征引时虽或有异,甚至于其异处又能出现新的词目、词义,但典源总是十分清晰的。纵使多书记载或有不一,典故词目及词义亦或因之而变,但这些源头本身与这些词目及词义之间都有明确的脉络可寻。

典故词的源头有规定典故义的作用,也即说典故词取义一般不会超出其源头取义所规定的范围。

如源出于《易·系辞上》之“二人同心,其利断金;同心之言,其臭如兰”中的“金兰”这一语典词目,其取义则只能是“同心”这一范围内的意思;源出于《太于御览》卷六八八所引鱼豢《魏略》之“殿中御史簪白笔,侧阶而坐,上问左右:‘此何官?’侍中辛毗对曰:‘此谓御史,旧簪白笔以奏不法,今但备官耳’”中的“白笔”这一事典中的典制典故词,其取义亦只能是“御史”、“奏不法”、“备官”;源出《礼记·檀弓上》“孔子之卫,遇旧馆人之丧,入而哭之哀,出,使子贡税骖而赙之”中的“税骖”这一事典典故词,其取义亦必然与故人亡故有涉。

正是因为典故义与典故源头的这种特殊关系,所以典故词十分注重溯源。

非典故词的文化词语及一般词语具有文化意义,其源头一般都不甚清晰,也即说其文化意义的产生虽然有其文化背景,但这一背景的来龙去脉往往难以确考。

如“帖”,《说文》:“帛书署也。”意为写在丝织物上的标签,其有文化背景是可肯定的,但正如“左券”、“左契”然,无所谓有什么源;一般语词如“龙”之指代帝王义,从目前学界所公认的观点看,我们只能说它很可能与我们的祖先对龙的崇拜有关。大皞 氏、共工氏等部落都曾以龙为其图腾。《史记》称秦皇为祖龙,谓刘邦母与蛟龙交而生刘邦,又史言隋文帝杨坚出生,其母曾见其头上有角,遍体是鳞,凡此等等,只能说明“龙”之指代帝王肯定与中国所特有的文化背景有关,究竟它与龙图腾而来的一切龙崇拜记载如何勾来连去,委实让人有扑朔迷离之感。

(三)典故义与典故词的字面义差距较大,相距较远。

典故词从字面上看,有的可以说通,如“昭王坠履”,典源是楚昭王在战败时丢失了一只履,又回来拣起了它。仅就字面看,我们只能知道昭王掉了履;有的有歧义,如“覆瓿”,典源是刘歆言扬雄所著《太玄》将为后人覆盖酱瓿,仅就字面看既可理解为覆盖瓿器,也可理解为打翻瓿器;有的则不知所云,若“株守”,言守株待兔事。字面上看此二字当疑“株”乃状词,然以“株”状“守”,取义自是难解;有的根本说不通,如“友于”出“友于兄弟”语,用称兄弟,字面上根本不能成词。

整个说来典故词除事典词语字面或可让人感知一点典源事实外,多数典故词字面都让人不甚了了。至于典故词的取义与其字面义间的差距则更是明显:语典取义是源出语言环境所赋予的意义,典制典故词的取义是典制义,如语典“乔木”用指故园、故土;典制“彻悬”表示对灾变的忧戚等等。事典词语与上不同的是其字面义或可让人感知一点典源事实。但事典取义并非是典源事实本身,而是事实的寓意。典源事实对典故词词义的规定作用当只是对事典而言,而且其所指亦是对寓意义域的规定。如“昭王坠履”取义只是留恋故旧事物、不忘故旧;“覆瓿”取义是表示著作无人理解、不被重视或用言毫无价值;“株守”取义只是墨守狭隘经验、不知变通或坐以待成,所以事典词义与字面义不同亦是十分明显的。

普通语词的词义则往往是字面义的综合,而典故词而外的文化词语,其在构词之初亦往往注意了其字面义的认可。至于普通词语在词义引申过程中所掺杂进来的文化意义亦往往与一般引申义有所相似,因为民族、时代背景往往长时间地影响着人们的观念,容易在我们分析词义时被忽视,容易将其文化意义误认为语言意义。我们只有通过对人类所共有的思维模式、心理活动特征的探索,通过对具有民族特征、时代特征的文化背景的认知才能把握普通语词哪些义是引申义,也即语言意义,哪些义是掺杂进来的文化意义。因为从理论上说,人类的思维模式、心理活动特征的主导方面总是相似的,表现在词语方面,其所反映的概念相近,由之而派生出的若干词义也必然相近。有些词语其反映的概念所派生出的词义一旦与他民族有异,与词义衍绎的规律不合,这时我们当要考虑到它是否有什么民族的或时代的背景,以此我们方可识别它们究竟是属于哪一类词义。前述“龙”的指代帝王义,即是有民族背景的例子。另外如“婉”,《说文》:“顺也。”词义是顺从、温顺,由于古代中国人伦理、审美意识的背景,女子以柔顺为美,所以“婉”产生了“美好”这一文化意义;“徽”,《说文》:“ 幅也。”即绑腿,其所以亦能衍绎出“美好”义,可能与绑腿乃约束之物、儒家有“克己复礼为仁”这样一种影响中国文化的观点有关。诸如以上这样的文化意义与典故义相较,其离词语的字面义显然要近得多。

典故词语,特别是事典词语一般说来谈不上词性,因为典故词语多数都具有词组性质,从其结构上分析,有的是主谓结构,如“庄舄越吟”、“竹化龙”、“耳顺”等;有的是动宾结构,如“绝韦编”、“祝网”、“伐柯”等。另外还有少量的状谓结构,如“跨下走”、“七步咏”等。普通语词这类结构甚少,且其解释亦多可从分析其结构入手,亦即说词义与结构的关系甚为密切。典故词语则不然,其词义与其结构的

关系并不太大。特别是一些偏正结构的名词性词组,它们并不像普通名词那样表示事物名称,如“君平肆”、“孟光案”、“庾亮楼”等等,往往用以概其出典。凡上这些典故词语别于普通词语的特征亦从另一个方面说明,典故词义与字面义间的差异。

(四)典故词义的横向考察——事典词语在具体的语言环境里取义具有多维性。

典故词的取义如前所述,一般都受到典源的规定。语典词、典制词由于典源一般比较单一,其词义有如一般语词或一般文化词语在具体的语言环境中比较确定。

事典词语的情况则要复杂一些。事典一般由人、地、物、事四大要素构成,如词语涉及的因素较多,词义往往就比较复杂。这里所说的词语涉及因素并非是词目字面所涉及的因素,而是指词目内涵所涉及的因素。另外事典典源亦有简单、复杂之分,事的寓意亦有多寡之别。有些词目由于内涵所涉及的因素较多,寓意较杂。很多事典词语作者借用它只是为了唤起读者对典源画面的一种联想,从而感知画面所提供的义域,读者可从画面的不同角度作各种不同的推想。这样的词语取义往往具有多维性,也即在一个具体的语言环境里词义并不是单一的、确定的,而是多种多样的,义界并不是十分清晰的。

由于我们已经习惯于接受为语言学界所公认的“在一个具体语言环境中词的取义是单一的、确定的”这样一种理论,又未能正确认识典故词作为文化词语其词义的这种多维性质,很多辞书多仍旧取用解释普通语词的释义方式,对每一典故词目因例而给予一个“相应”的解释,并且将各书例附于“有关”“义项”下,其结果不是对某些词采取删繁就简,挑选词义比较单一、比较确定的书例以作解释的办法;便是“王顾左右而言他”,避开典故义而释语词义、专科义;或只引源而不释义,等等,这些不是科学地对待典故词词义的做法,从一个侧面也反映了以语言学界所公认的那个前述理论套入典故词释义是行不通的。有人以“诗无确诂”为由,认为对典故词“强为之解,势必会失于泥”。将典故词视为“无确诂”的词,显然亦反映了取用传统的对普通语词的那种释义方式,其结果是要失败的。

为了论证上面的说法,我们可随便举一些例子:孟浩然《冬至后过吴张二子檀溪别业》诗:“闲垂太公钓,兴发子猷船。”“子猷船”用王徽之雪夜访戴逵典。句中既有朋友相思相访义,亦有表示洒脱任诞、随兴会所至义;李白《秋浦歌》之七:“醉上山公马,寒歌宁戚牛。”“宁戚牛”用宁戚饭牛而歌为桓公所用典,句中既有有才未遇义,亦有自荐求仕义;苏轼《次韵张甥棠美述志》诗:“甥能锄我青门瓜,正午时来休老手。”“青门瓜”用秦东陵侯邵平于秦破后种瓜长安青门典,传说其瓜五色,味道甚美。《汉语大词典》对此词未作释。有人在其文章中释为“指美瓜,名瓜。”而实际上由诗题“述志”看,当亦寓有安贫归隐之意。以上数例还是词义较为简单的,像这样的例子实际上随处可见。至于一个书例,词义兼有三、四者亦不乏有之。我在三十多年来对事典词语释义中,每每苦于具体书例中词义的难以包罗,有时只好取顾大端而在释义之末赘一“等”字以概之,这实是不得已而为之的一种做法。

典故词语,主要是事典词语在运用中多数具有“缘情造境”的作用,这造成词义具有多维性和义界的模糊性,所以对这类词语我们在释义时就必须使用一些能够适应它们的用语,诸如“借写”、“表示”一类。因为如仅用现有辞书常用的那些解释普通语词的用语,一来往往释不通,二来则很可能因释之过死而感到有失于“泥”。

(五)典故词义的纵向考察——引申的单一性。

典故词的词义就总体来说属于修辞义一类,它与一般语词的修辞义一样,向纵深方向发展的可能性并不太多。因为修辞义本身在理解上即需要有一个周折:一般语词需要首先知道它的原义,典故词需要首先知道它的典源。所以,从人类思维特点的共同性言,其如再作纵深上的更多引申自然难予让人接受。而且典故词的修辞义源于典籍,而一般语词的修辞义源于词义,典籍较之于词义,其为人们所熟知的程度自然要差得多,所以在纵深上引申的前景又要更少。

同义词词典篇3

关键词:语料库;《现代汉语词典》(第6版);核心词;义项分布

中图分类号:H164 文献标识码:A 文章编号:1672-3104(2013)06?0252?07

一、词典与核心词的选取

(一) 词典的选取①

本文的“汉英词典100核心词义项数目比较表”中详列有我们选取的词典。其中《现5》指《现代汉语词典》(第5版)[1],《现6》指《现代汉语词典》(第6版,本文简称《现汉》)[2],《现学》指《现代汉语学习词典》[3],《汉大》指《现代汉语大词典》[4],《牛4》指《牛津高阶英语词典》(第4版)[5],《牛7》指《牛津高阶英语词典》(第7版,本文简称《牛津》)[6],《简明》指《牛津简明英语词典》(第10版)[7],《韦氏》指《韦氏高阶英语词典》[8],《郎文》指《郎文高阶英汉双解词典》[9],《麦克》指《麦克米伦高阶英汉双解词典》[10]。

为什么选上述几部词典中的100核心词呢?这是因为除《汉大》②外,上述几部词典的类型基本一致。把同类型而又隶属于不同国家的词典中的100核心词的义项数目及其分布进行对比,易于发现不同国家的词典编纂者对同类词释义的不同处理方法,易于找出不同国度的同类词典在义项划分中的差异,从而达到取长补短的目的。认定词典类型是否一致应从词典的性质及其收词和释义等3个方面分析。

(1) 从词典性质来看,上述词典都是语文性词典。《现汉》《现学》《牛津》《韦氏》等分别是中国、英国、美国的代表性词典,它们都是共时性的所在国的权威性中型语文词典。例如:《现代汉语学习词典》的编者就把该词典定为“是国内第一部真正意义上的‘内向型’汉语学习词典,开学生‘学习词典’之先河,汉语‘牛津高阶’之楷模。” 这表明该词典的编纂者认为《现学》和《牛津高阶英语词典》是同一类型的。

(2) 从词典收词来看,除《汉大》外,上述几部词典收词量基本相当,都以一般词汇为主,同时还收录了大量科技、历史、文学等专业及百科词汇,也收新词语。例如:《现汉》收词69 000余条,词典正文共1 755页;《韦氏》收词65 000余条,词典正文共2 257页;《牛津》收词89 000余条,词典正文共1 780页③。

(3) 从词典释义来看,上述词典的释义都是以语文性释义为主百科性释义为辅,对词的释义以人类的认知经验为参考,适当吸收科学因子。

根据以上3条标准,我们认为,在《牛津》系列词典中,与《现汉》同类型的词典不是《牛津初阶英语词典》《牛津中阶英语词典》,而是《牛津简明英语词典》或《牛津高阶英语词典》。同理,《现汉》和《韦氏》《麦克》《朗文》等以高阶命名的词典是同类词典。

(二) 核心词的选取

美国语言学家莫里斯・斯瓦迪士在二十世纪四五十年代,从统计学的角度通过分析不同的语言(主要以印欧语系语言为主)得出一个有200核心词的斯瓦迪士核心词列表(Swadesh list)。他认为,基本上所有语

言的词汇都应该包含这200个词语,正因为该词表有上述特点,所以我们从斯瓦迪士200核心词列表中选取100个核心词,然后按照语义场理论予以分类,这样就会很容易地通过比较找出这100核心词在《现汉》《牛津》《韦氏》等汉英词典中义项分布的不同,并且也可以在一定程度上比较上述词典对100核心词释义的异同。

词义引申不仅受词义的内部构成要素的影响而且也受词义的外部要素,诸如民族、社会、文化等因素的影响,因此在不同的语言中,词义的引申有同有异,异大于同。共时的分布规律往往显示历史的演变规律,因此,我们还是可以找出不同语言中具有相同特点的一类词的引申往往具有具有一些共同的义项分布规律,相应地隶属于不同国度的同类型词典也应有一些共同的释义规律。本文主要对比汉英100核心词在中、英、美各国的权威性词典中义项数目的不同及其义项分布规律的不同。

二、义项分布对比研究

经过处理,我们得出100核心词在《现汉》(第5版)、《现汉》(第6版)、《牛津》《韦氏》等词典的义项数目④,具体如表1。

据表1我们可以得出以下结论:

(1) 在不同的民族语言中,一些词的本义虽然相同,但由于这些词在各民族的语言中占的地位不同,因此它们的词义引申就有所不同:词在语言交流中占的地位越重要,它的引申义就越丰富越复杂,这种现象反映在词典中就是词在语言交流中的地位越重要它的义项就越丰富。例如:

《现汉》(第6版)、《牛津》(第7版)、《韦氏》等3部词典中:

“花”在《现汉》中有17个义项,与“花”相对应的英语单词“flower”在《牛津》中有7个,《韦氏》有5个。

“吃”在《现汉》中有8个义项,与“吃”相对应的英语单词“eat”在《牛津》中有2个,《韦氏》有4个。

“掷”在《现汉》中有1个义项,与“掷”相对应的英语单词“throw”在《牛津》中有20个,《韦氏》有20个。

(2) 在100核心词的义项数目方面,《现汉》(第6版)义项数目明显少于《牛津》(第7版)、《韦氏》。例如:

《现汉》有17个核心词的义项数目略微多于《牛津》《韦氏》,《现汉》17个核心词的义项总数是156个,平均义项数是9.2个,与《现汉》17个核心词对应的《牛津》有96个义项,平均义项数是5.6个,《现汉》高于《牛津》3.6个;《现汉》有11个核心词的义项数目多于《韦氏》,《现汉》11个核心词的平均义项数是104个,平均义项数是9.4个,与《现汉》11个核心词对应的《韦氏》有66个,平均义项数是6个,《现汉》高于《韦氏》3.4个。

反过来看,《现汉》有83个核心词的义项数目低于《牛津》,《现汉》83个核心词的义项总数是399,《现汉》83个核心词的平均义项数是4.8个,与《现汉》83个核心词对应的《牛津》有个951义项,平均义项数是11.4个,《现汉》低于《牛津》6.6个;《现汉》有89个核心词的义项数目低于《韦氏》,《现汉》89个核心词的平均义项数是451个,平均义项数是5.1个,与《现汉》89个核心词对应的《韦氏》有1077个,平均义项数是12.1个,《现汉》低于《韦氏》7个。

另外,根据“汉英词典100核心词义项数目比较表”,我们还可以得出以《现汉》(第6版)为代表汉语词典的义项数目远远低于以《牛津》(第7版)为代表的英语词典的结论,例如:

《现汉》(第5版)100个核心词共有534个义项,平均5.3个。

《现汉》(第6版)100个核心词共有555个义项,平均5.5个。

《现学》100个核心词共有590个义项,平均5.9个。

《现代汉语大词典》100个核心词共有766个义项,平均7.7个。

《牛津》(第4版)100个核心词共有825个义项,平均8.2个。

《牛津》(第7版)100个核心词共有1047个义项,平均10.5个。

《牛津简明》100个核心词共有1281个义项,平均12.8个。

《麦克》100个核心词共有1168个义项,平均11.7个。

《韦氏》100个核心词共有1143个义项,平均11.4个。

《朗文》100个核心词共有835个义项,平均8.3个。《朗文》100个核心词共有1792个义项,平均17.9个。⑤

表1 汉英词典100核心词义项数目比较表

作 汉 现5 现6 现学 汉大 英 牛4 牛7 简明 韦氏 麦克 朗文

吃 8 8 13 13 eat 2 2 3 4 3 3-16

喝 2 2 2 1 drink 3 5 8 10 7 4-6

唱 3 3 3 6 sing 3 3 8 9 13 5-7

说 6 6 9 7 say 2 7 9 12 13 11-47

咬 7 7 8 8 bite 12 12 15 15 14 15-26

吸 3 3 3 5 suck 5 6 7 6 8 4-7

呼 3 3 3 5 breathe 4 5 7 6 6 4-11

笑 2 2 2 3 laugh 4 5 5 6 3 4-16

看 9 9 11 9 see 17 18 15 13 20 18-46

听 4 4 4 6 hear 5 6 7 4 9 4-16

闻 4 5 5 5 smell 7 9 11 14 11 8-12

读 4 4 4 4 read 12 17 17 16 16 9-19

作 洗 9 9 9 10 wash 12 8 22 14 11 10-17

打 24 24 31 32 hit 9 20 18 17 26 19-36

拿 9 10 8 11 take 39 42 36 48 41 31-47

推 10 10 11 10 push 8 14 16 12 12 12-19

挖 2 2 3 3 dig 4 6 15 7 3 10-11

擦 5 5 5 5 scrape 7 9 13 9 10 6-7

掷 1 1 1 2 throw 16 20 23 20 13 10-38

抓 6 6 6 7 scratch 9 12 17 13 16 8-16

作 跑 6 6 5 5 run 32 54 48 48 50 35-72

走 10 10 10 17 walk 8 10 20 12 19 8-18

站 1 1 2 4 stand 13 28 30 24 30 19-43

坐 11 11 14 11 sit 8 9 13 14 9 6-13

跳 4 4 5 10 jump 15 15 23 24 25 14-28

来 12 13 17 19 come 13 15 16 13 13 12-32

切 2 2 3 10 cut 19 32 30 36 33 23-40

作 玩 3 3 3 5 play 22 25 31 31 19 12-39

睡 1 1 2 2 sleep 5 5 8 7 6 5-16

躺 1 1 2 2 lie 9 9 8 8 9 7-16

住 3 3 6 4 live 15 16 15 9 20 10-36

刺 7 7 7 11 stab 3 5 7 7 10 5-8

杀 6 6 6 9 kill 9 6 13 12 13 8-18

爬 3 3 3 5 climb 6 12 9 7 16 13-14

给 7 9 5 6 give 21 19 21 35 28 21-46

作 爱 5 5 5 7 love 10 9 11 10 13 9-22

想 4 6 6 4 think 8 11 8 9 19 3-6

记 6 6 6 7 remember 6 6 5 5 6 6-8

死 7 7 8 14 die 3 5 8 6 4 5-17

作 浮 8 8 10 10 float 12 13 16 11 18 12-13

游 5 5 5 8 swim 6 7 8 5 7 3-5

落 11 11 14 22 fall 21 21 24 28 29 20-55

流 8 8 10 12 flow 9 12 9 14 14 11-13

飞 6 6 7 24 fly 12 21 20 17 21 18-44

续上表

词 自

物 水 6 6 8 10 water 10 12 19 9 10 15-15

海 7 7 8 7 sea 4 4 4 6 5 2-5

云 1 1 1 1 cloud 8 9 8 8 11 2-12

要素 骨 3 3 3 10 bone 4 4 7 5 4 2-8

蛋 2 3 3 4 egg 3 4 5 3 6 4-7

角 7 8 10 9 horn 5 6 14 7 8 5-9

尾 4 4 6 7 tail 6 9 21 11 8 6-14

羽 3 3 3 6 feather 3 2 6 3 1 1-3

素 手 7 7 8 12 hand 10 12 17 15 12 7-40

脚 4 4 6 9 foot 6 8 13 8 10 5-24

嘴 3 3 3 4 mouth 7 9 11 8 8 5-14

头 13 13 11 17 head 21 25 31 24 20 16-47

耳 3 3 3 3 ear 2 4 3 4 3 3-14

发 1 1 1 5 hair 1 3 3 3 3 4-13

血 4 4 4 7 blood 5 6 8 5 6 4-13

肤 2 2 2 3 skin 6 7 16 9 10 7-15

肉 4 5 4 9 meat 3 2 4 3 3 9-21

属 父 2 2 2 3 father 7 7 13 8 5 8-8

母 5 5 6 7 mother 5 3 9 9 4 4-10

男 2 2 2 4 male 4 6 5 5 6 6-6

女 2 2 3 3 female 5 7 5 7 4 5-5

夫 4 4 4 3 husband 1 2 2 2 1 1-1

妻 1 1 1 1 wife 1 1 2 1 2 1-1

物 蛇 1 1 1 1 snake 2 2 4 5 5 2-3

人 8 8 9 12 people 7 10 8 8 9 5-11

鱼 1 1 1 2 fish 3 6 9 5 6 4-13

鸟 1 1 1 1 bird 3 3 3 3 4 2-7

狗 1 1 1 4 dog 4 8 14 8 6 7-18

虱 1 1 1 1 louse 2 2 5 3 2 2-2

虫 2 2 2 2 worm 3 7 13 6 6 3-8

物 木 6 6 6 11 wood 3 4 5 8 4 4-5

树 3 3 3 5 tree 2 1 7 8 2 2-2

果 2 5 4 1 fruit 5 5 7 3 5 2-8

叶 2 2 2 5 leaf 5 6 7 4 5 5-5

根 10 10 10 8 root 10 13 19 11 12 8-13

花 17 17 15 19 flower 5 7 5 5 6 4-6

种 5 5 2 10 seed 7 8 15 8 9 7-11

草 4 8 8 11 grass 7 6 9 4 7 3-5

词 人

性 好 15 15 16 15 good 23 26 18 37 39 21-73

坏 6 6 7 6 bad 10 16 10 18 14 9-33

美 5 5 5 7 beauty 2 4 5 6 6 3-5

丑 3 5 3 6 ugly 2 2 2 4 4 2-3

新 7 7 7 8 new 5 13 10 13 12 8-18

恶 3 3 4 5 evil 4 6 4 3 8 6-7

色 绿 1 1 1 1 green 13 13 16 13 16 10-16

黑 5 7 8 8 black 14 13 22 13 12 9-13

黄 7 7 9 7 yellow 3 5 10 8 4 3-4

白 9 10 8 9 white 9 7 17 12 14 12-12

红 5 5 7 20 red 6 8 14 8 7 6-13

性 长 6 6 6 7 long 10 11 18 17 18 13-39

宽 5 5 8 9 wide 5 10 12 8 10 8-12

直 10 10 9 9 straight 14 18 17 24 19 18-24

圆 7 7 8 11 round 23 31 37 23 32 14-19

钝 2 2 3 4 blunt 3 4 6 4 4 4-4

尖 8 8 7 12 sharp 12 20 26 21 15 18-20

滑 4 4 4 5 smooth 7 9 8 12 10 11-13

《现汉》(第5版)100核心词中的每个核心词的义项数目平均比《牛津》(第7版)少收5.2个,比《韦氏》少收6.1个;《现汉》(第6版)100核心词中的每个核心词平均比《牛津》(第7版)少收5个,比《韦氏》少收5.9个……

上述现象表明:长期以来中国词典的编纂者乃至研究现代汉语词汇的学者忽视了现代汉语100核心词乃至更多常用词义项的研究。

(3) “汉英词典100核心词义项数目比较表”还表明《现汉》(第6版)的修订者并没有把常用词义项的丰富与补充作为重点修订的对象。

本文所选的100核心词在《现汉》(第5版)、《现汉》(第6版)中义项数目基本一样:《现汉》(第5版)100个核心词共有534个义项,平均5.3个;《现汉》(第6版)100个核心词共有555个义项,平均5.5个。这表明,《现汉》(第6版)并没有把丰富补充常用词的义项作为重点修订对象。

相反,《牛津》词典的历次修订版显示《牛津》词典的修订者一直把丰富并补充常用词的义项作为重点修订对象。根据笔者手头有《牛津》(第4版)和(第7版),由于语料库技术的参与,《牛津》(第7版)中常用词的义项和《牛津》(第4版)相比有了大幅度地增加,《牛津》(第7版)中100核心词的平均义项要比《牛津》(第4版)多2.3个。例如《牛津》(第4版)中run有34个义项,而(第7版)引进语料库技术后,run则有54个,多了20个。

(4) 如果把同类词放在一起比较,更容易发现《现汉》释义存在的问题,本节主要从词类分布这一角度对比。100核心词在《现汉》(第6版)、《牛津》(第7版)、《韦氏》3部词典中,动词44个,名词38个,形容词18个。每类词的平均义项数目分别如下:

a. 动词44个:《现汉》(第5版)共有259个义项,平均5.9个;《现汉》(第6版)共有265个义项,平均6.0个;《牛津》共有591个义项,平均13.4个;《韦氏》共有647个义项,平均14.7个。

在44个动词的义项分布中,和《牛津》《韦氏》相比,《现汉》(第6版)漏收的义项更多,《现汉》(第6版)平均6.9个,《牛津》平均13.4个,《韦氏》,平均14.7个。与形容词、名词相比,《现汉》(第6版)动词漏收的义项最多。例如:

根据我们对英语词典的查阅,发现类似汉语“跑”的“run”在《牛津》中有33个义项,《韦氏》有72个义项,而《现汉》(第6版)仅有6个。《现汉》(第6版)义项①对“跑”的解释是“两只脚或四条腿迅速前进”,而随着自行车、汽车、飞机、轮船等现代化交通工具的出现,现代汉语中出现了大量下列句子“他骑着自行车满大街跑。”,“他开着轿车在公路上跑。”“他坐着飞机全世界跑”,“他开着轮船在海上跑。”等等,很明显《现汉》(第6版)已有“跑”的义项不能涵盖上述“跑”的含义。

b. 形容词18个:《现汉》(第5版)共有118个义项,平均6.5个;《现汉》(第6版)共有123个义项,平均6.8个;《牛津》共有216个义项,平均12个;《韦氏》共有244个义项,平均13.5个。

在18个形容词的义项分布中,和《牛津》《韦氏》相比,《现汉》(第6版)漏收的义项次之,《现汉》(第6版)平均6.5个,《牛津》平均12个,《韦氏》平均13.5个。事实上在现代汉语上述18个核心词的义项并不比英语中少,我们以表颜色核心词的义项为例:

在《牛津》《韦氏》《麦克》《朗文》等英语词典中类似汉语中表颜色词“绿”的green有5个或10个义项,而《现汉》(第6版)中“绿”只有一个义项“① 像草和树木茂盛时的颜色,由蓝和黄混合而成”。根据我们对CCL现代汉语语料库中出现的33 798条、共160万字的“绿”字语料的穷尽性分析,认为按照《现汉》已有释义原则“绿”字条漏收了以下5个义项:“便捷地、快速地”“无公害、无污染;能源损耗低”“泛指绿色植物”“泛指各种颜色。此外,根据我们对现代汉语其他常用颜色词的初步研究,《现汉》(第6版)还漏收了以下义项:“黑”漏收2个义项“脏”和“不光彩”;“白”漏收义项“洁净、纯洁”;“黄”漏收6个义项“娇嫩”“年龄小,涉世浅”“成熟”“枯萎”“(人脸)干枯,(年龄)大”“警告,预警”等等。

c. 名词38个:《现汉》(第5版)共有157个义项,平均4.1个;《现汉》(第6版)共有167个义项,平均4.4个;《牛津》共有240个义项,平均6.3个;《韦氏》共有252个义项,平均6.6个。

在38个名词的义项分布中,和《牛津》《韦氏》相比,《现汉》(第6版)的义项最少,《现汉》(第6版)平均4.3个,《牛津》平均6.3个,《韦氏》平均6.6。在汉英词典中,名词的义项都普遍较少,但是很明显《现汉》(第6版)还是漏收了一些义项,我们以表动物类核心词义项的漏收为例:

“蛇”“鱼”“鸟”“狗”“虱”等表示动物的核心词在《现汉》(第6版)中只有一个义项。但语言中的实际情况是这些词常常发生词义引申,它们常常引申出与之相应的动物的特性以及与它们类似的人或其他动物,动物类核心词的引申规律常常是由物及人,上述引申规律在《牛津》《韦氏》等词典的释义中能够体现出来,而《现汉》(第6版)没有体现出来。在语料库中有大量上述动物核心词的引申义,《现汉》(第6版)应予以补充。

三、核心词义项数出现差异的原因

从理论上讲,汉语的义项应该比英语还要多,这是因为英语是屈折语,有词形变化,所以英语的100核心词中多是动词性、名词性、形容词性兼类,介词性、副词性等虚词的义项往往发生词形变化,成为一个新词,例如:形容词smooth的副词形式是smoothly;名词mouth的副词形式是mouthful。而汉语的100核心词除了动词性、名词性、形容词性可以兼居一词外,介词性、副词性等虚词性义项也可以兼居一词,例如:“死”7个义项,1个动词性义项,4个形容词性义项,2个副词性义项;“拿”有10个义项,其中有3个是介词性义项;“给”有9个义项,只有2个动词性义项,其余的有6个介词性义项,1个助词性义项。

英语的词形变化分担了词性变化引起的义项增加,而汉语不能。因此,从理论上讲汉语100核心词的义项要比英语多才对。

为什么100核心词的平均义项数目在《现汉》等汉语类词典中比同类型的《牛津》《韦氏》等英语类词典少呢?我们认为主要有以下原因:

(一) 语料库技术

国外,从20世纪80年代开始,语料库技术就已经广泛应用于词典的编纂与研究中了。目前,占据英语辞书主要市场的牛津、韦氏、朗文、剑桥、柯林斯与麦克米伦等英语词典,都是在语料库的基础上编成的。

国内,20世纪90年代以来,我国相继建设了一批汉语语料库,如国家语委的“现代汉语平衡语料库”、北京大学中国语言学研究中心研制的“CCL语料库”可以说,目前我国的语料库已经初步具备了词典编纂所需要的规模。

尽管如此,把语料库技术和词典编纂结合起来,用定量与定性相结合的方法把收词、立目、义项排列建立在语料库基础上进行编纂的词典在我国还不多见,这就不可避免地导致我国已有词典在收词和义项取舍方面困难重重,不利于我国词典编纂者对旧词新义或新用的发现和甄别。

(二) 编纂历史

作为一部综合英语词典的前身是塞缪尔・约翰逊编纂的《英语大词典》,该词典最早于1755年由朗文出版公司出版,由此算来朗文词典的历史距今已经有250年的历史了。《牛津简明英语词典》初版于1911年,《牛津简明英语词典》第10版出版于2001年,《牛津高阶英语词典》初版于1948年。《韦氏高阶英语词典》初版于1831年。《现代汉语词典》1978年第1版,如果算上具有现代语言学意义的词典《国语辞典》(1936年开始出版)⑥,中国的词典编纂历史也才有70多年的历史。

由此可见,具有现代意义的词典,中国的词典比英国的词典晚250多年,比美国的词典要晚100多年⑦。相对来讲,词典编纂的历史长积累的历史经验就多,因此英语词典的义项比汉语词典的义项丰富。

(三) 语言学理论

与以欧美语言学为主的世界语言学理论相比,目前中国的语言学理论很是落后,同样与国外词典学理论相比,国内的词典学理论也很是落后。如果我们仔细阅读《牛津》《韦氏》等国外词典,就会发现英语词典的释义与汉语词典相比更加注重规律性和系统性,它们的词典编纂者能够有意识的把诸如词的内涵意义、联想意义、搭配意义、同词反义、词义虚化等词义理论应用于词典义项的划分中,而《现汉》在这方面则稍逊一筹。

在上述3个原因中,语料库技术是最主要的原因。如果把上述100核心词放在语料库中检验,我们会发现汉语中核心词的义项数目基本和英语中相当。例如,笔者撰写的《语料库视野下的现代汉语“绿”义项分布研究》《语料库视野下的现代汉语“黄”义项分布研究》《语料库视野下的现代汉语“跑”义项分布研究》等一系列论文就从事实和理论方面说明了核心词的义项数目在汉语英语中中基本相当的情况。

注释:

① 为了说明本文所选词典是同一类词典,所以在统计表中统计了100核心词在《现汉》《现学》《汉大》《牛津》《韦氏》《汉大》《简明》《麦克》《朗文》等9部词典11个版本的义项数目,在具体比较义项分布规律时,则以《现汉》(第6版)、《牛津》《韦氏》为代表。另外,《郎文高阶英汉双解词典》直接脱胎于《郎文当代高级英语词典》(第3版),这是一部专为中高级英语学习者设计的词典;《麦克米伦高阶英汉双解词典》直接脱胎于《麦克米伦高阶英语词典》,它是由1834年成立于英国伦敦的麦克米伦出版公司出版,是一部专为高级英语学习者设计的词典,由于,笔者没有上述两部辞书的英语版,所以取它们的英汉双解版。

② 《汉大》是指《现代汉语大词典》,其出版说明介绍:“分上下两册,共收单字条目(含繁、异体字)1 500余条,多字条目10万余条,凡850万字,是我国目前同类词典中规模最大、收条最多、信息量最丰的大型语文工具书。”从规模和容量看,《汉大》都是《现汉》等汉语词典和《牛津》等英语词典的两倍之多,从这个方面说,《汉大》100核心词的义项应该非常丰富才是,然而正如“汉英词典100核心词义项数目比较表”显示《汉大》100个核心词的平均义项比《现汉》(第6版)仅高出2.2个,比《牛津》(第7版)少2.8个,比《牛津简明》少5.1个,这说明汉语类词典编纂者忽视了对词典中100核心词乃至常用词义项的丰富与补充。

③ 《牛津》(第7版)封底并没有明确介绍该版收词量是多少,但是《牛津》(第4版明确说明该版收词5700余条,《牛津》(第6版)收词80 000余条,在(第7版中有介绍说(第7版)比(第6版)多收9 000余条,据此我们推断《牛津》(第7版)收词89 000余条。

④ 义项数目统计说明:《现汉》等汉语词典不包括同形同音字的义项,不包括姓氏的义项;《牛津》等英语词典包括同形异义词的义项,在《牛津》等英语词典中,把不属于同一词性的词分列为两个词,但它们是同一个词引申出来的,所以我们看作一个多义词。另外,在《牛津简明英语词典》《麦克米伦高阶英汉双解词典中》在一些主义项下面又分列了次义项,这些次义项我们也计算在内。

⑤ 《朗文》在解释多义词时,如果一个单词在短语中具有独特意义,那么该词典也作为独立的义项列出。因此,《朗文》一列的数字有两个,“-”前的数字是《朗文》不包含短语中具有独特意义的单词的义项数目,“-”后的数字是包含短语中具有独特意义的单词的义项数目。

⑥ 《国语辞典》1936年开始出版,直到1945年编辑完成并全部出齐。尽管中国早在2 000多年前就开始了字典、词典的编纂工作,如东汉许慎的《说文解字》、清代的《康熙字典》等,但它们并不是现代语言学意义的词典。

⑦ 《现汉》(第5版)、《现汉》(第6版)核心词的姓氏义项不计算在内,同形同音词的义项不计算在内。

参考文献:

中国社会科学院语言研究所. 现代汉语词典[Z]. 北京: 商务印书馆, 2005.

中国社会科学院语言研究所. 现代汉语词典[Z]. 北京: 商务印书馆, 2012.

商务印书馆辞书研究中心. 现代汉语学习词典[Z]. 北京: 商务印书馆, 2010.

阮智富, 郭忠新. 现代汉语大词典(套装上下册)[Z]. 上海: 上海辞书出版社, 2009.

霍恩比. 牛津高阶英汉双解词典(第4版)[Z]. 李北达, 译. 北京: 商务印书馆, 1997.

霍恩比. 牛津高阶英汉双解词典(第7版)[Z]. 王玉章, 译. 北京: 商务印书馆, 2009.

韦迈乐. 牛津高阶英语词典(第7版)[Z]. 北京: 商务印书馆, 2007.

德拉・汤普逊. 牛津简明英语词典(第10版)[Z]. 外语教学与研究出版社引进出版, 2001.

梅利亚姆?韦伯斯特公司. 韦氏高阶英语词典[Z]. 北京: 中国大百科全书出版社, 2009.

英国培生教育出版集团. 郎文高阶英汉双解词典[Z]. 何银银,等译. 北京: 外语教学与研究出版社, 2006.

麦克米伦出版公司. 麦克米伦高阶英汉双解词典[Z]. 杨信彰,等译. 北京: 外语教学与研究出版社, 2005.

An investigation of the distribution of meaning items about the 100 core words in the Chinese and English dictionaries

LI Shichun

(Chinese Literature Department, Guangxi University, Nanning 530004, China)

Abstract: This paper first points out that the “the Contemporary Chinese Dictionary”, “Oxford”, “Webster ” etc are the same kind of the dictionary. Second, it briefly compares the 100 core words’ senses number and their distribution of meaning item. Finally, the author points out that 100 core words’ sense division is careless in the Chinese dictionary.

Key Words: Corpus; the 6th Edition of the Contemporary Chinese Dictionary; Core Word; the distribution of meaning item

收稿日期:2013?05?29;修回日期:2013?11?24

基金项目:广西大学“211四期区域文化传承创新与交流学科群”研究项目(211QYWH13Z04)

同义词词典篇4

关键词:完形理论 词典释义 完整性

一、序言

在一定的语言和社会环境中,自然词汇的出现与特定的语用情景和使用者的心理意图紧密相关。人们一旦接受这些词汇进入语言系统,那么对这些词汇进行释义时,必须要准确、完整地反映其意义。词典中的词语释义是我们理解词义的一条重要途径。语言哲学和认知语言学研究的不断深入,为词典释义提供了理论基础,改变了人们传统的语言观。在相关理论的影响下,词典学转向了认知研究。研究者们纷纷主张从认知的角度去重新考虑词典的设计、编纂、使用和评估。H.A.哈利森说过:“词典编纂工作极端令人厌烦,要求十分苛刻。这是一项大得难以置信的工程。”这说明了词典编纂的巨大难度,当然也包括释义的困难。如何做到词典释义的准确性、逻辑性和完整性是词典编纂实践不断完善的基本要求。

二、释义

“释义是人类抽象思维发展的结果,哪怕是一个最简单的词,只要按照合乎逻辑的方法认真释义,对此的理解就会超越感性认识的阶段。这不是‘自找麻烦’,而是极好的思维操练,也是帮助读者掌握明确概念的有效手段。”(黄建华,2001:90)由此不难看出释义在词典编纂中的重要性。词典编纂的核心内容就是释义,它是一本词典的精髓所在,也是词典编纂者最主要最困难的工作。正如兹古斯塔说:“词义是词典编纂者所关注的中心问题。因为词典编纂者所有的裁夺,几乎都与在词典中如何处理词义有直接、间接的关系……”

词典释义就是对一个词的意义进行表述,释文就是语义的一种形式表达式。(章宜华、黄建华 1999)。词典释义机制是人类认知机制的一部分,是人类心智活动的产物。认知语言学的研究表明:语言能力是指说本族语的人对语言感知和理解,具体反映为大脑对生成和理解无限多的句子的能力。语言是人类理性思维和认知的产物,要有效地解词释义,就必须了解这一认知系统的结构和构造成分,通过科学地处理概念范畴来实现准确释义

意义问题是词典研究的核心问题,语义学的研究促使辞书工作者寻求更准确、更全面的释义方式。因此,“词典工作者最好还是要重视语义学领域的各种研究:他们对语词意义特征了解越多,他们的工作就会越出色”(Zgusta,1971)。由于受传统释义理论的影响,现在的词典释义存在表义欠准确甚至错误、语义信息与知识信息混淆、同义释义的冗赘与矛盾、释义太宽泛、限制不足等缺陷。如何避免这些不足,寻求一套更准确、更合理、更全面的编写体系是词典编纂者不懈追求的目标。

三、完形理论

完形理论因其德文音译又称“格式塔理论”,发端于西方一个重要的心理学派。该学派最初研究知觉,尤其是运动知觉,但是它的一些理论逐渐应用在物理学、教育学、文学以及美学等许多领域当中。所谓“完形”,即一种由主体认知所组成的整体。一个格式塔既是一个可以感知的整体,也是一个功能的整体。心理学的完形感知可以追溯到格式塔原则,它主要包括邻近原则、相似原则、封闭原则和连续原则。邻近原则是指距离相近的成分容易被看成一个整体;相似原则是指每一个相似的成分都有构成一个共同片段的趋向;封闭原则是指一个倾向于完形而尚未封闭的图形容易被看作一个完整的整体;而连续原则是指如果成分之间不存在着干扰,感知就是一个连续不断的整体。心理学家指出这四项原则决定完形感知,符合完形原则的组合显示出和谐协调的特征。在卡夫卡的理论体系里,他要求尽善尽美的“优格式塔”。在这种“优格式塔”里,各个组成部分并非简单的集合,而是相互依存相互作用,并保持整体意义和整体效应。

由此看来,格式塔心理学的理论基石包括:整体性、直觉性、异质同构、完形压强。整体性是最基本的理论。格式塔学派强调经验和行为的整体性,认为整体不等于且大于部分之和,主张以整体的动力结构观来研究心理现

象。在词典释义的完整性方面,完形理论又具有怎样的指导意义呢?

四、完形的整体与词典释义的完整性

(一)语义与概念

语义形成的过程就是大脑对客观映像概念化的过程。认知科学在词典释义中的应用,使语义的分解和表达更能够反映人们言语活动的心理表征和自然语感。语义属于语言的范畴,概念属于思维的范畴,二者各具不同特征。概念只是对客观事物本质属性的概括;而词义是人们对客观事物的感性认识和理性认识综合的产物,既包括对客观事物本质的概括,也包括对客观事物形象的认识,还隐含人们对客观事物的主观感受和体验。概念是词的真实内容,而词是概念的符号。

认知语言学认为一个格式塔就是一系列的概念整体,而不是一些成分要素的集合。概念是释义的基础,词的释义主要是由概念意义构成,所以词典中的词被看作为语言的标本和典范,而词典义就是从各种用法中概括出来的,有多种义项的意义。在自然语言中词语意义的各种要素是一个有机的整体,是相互关联的语义网络。词典释义不再孤立地表述一个词的意义,而是被放到整个语义系统中来考虑,全面完整地揭示词义。费里德曼在他的《双语词典中的词的语义结构分析》一文指出:“双语词典中对词的加工不在于罗列译文及解释,而在于有机地揭示词义结构……在针对俄罗斯人的外俄词典中只有通过对词条的这种分析才能形成对外语词的鲜活的、完整的概念。这会在整体上使双语词典具有实用工具书及研究语言科学资料的价值”(张金忠,2002)。《当代法语详解组配词典》作为理论研究型词典,是对释义内容进行全面描述的典型例子。《组配词典》把词条内容都看作是释义内容,为释义服务,也即是一个格式塔,包括语义单元、词汇组配单元、句法组配单元、例证单元和结构短语单元。每个词目所有可能的词汇组配形式都是由这些单元综合表述,并在建立语法配价表的基础上列出了词目一切可能与不可能的句法组配结构。

(二)整体观与完整性

描写主义和规定主义是词典编纂中两个根本对立的编写原则。传统的编纂的原则是将两者相结合。在新的形势下,词典编纂应将重心置于描写的成分。描写主义奉行的信条是“词典编者的责任是记录‘活的语言’而不是‘最好的语言’”(Lodwig,1973:154)。词语的多义现象是普遍存在的,一个词目有多种释义,本着描写主义的原则,应最大限度记录语言的发展、变化。完整性一方面指一个词目释义的完整性,即释义要全面,要多角度、多层面反映词义,给读者以完整概念;同时注释要完整、例证要典型、插图表义还要鲜明;而另一面指新的释义加入到某词目中和旧的释义的剔除。随着越来越多自然词汇的积累,词典释义的义项就有可能陆续增加,同时那些旧的词义也可能逐渐消亡。例如常用词green,它的本义指一种颜色。随着环保运动的兴起,green在现代英语中有了新的意义:related to or concerned with the protection of the environment (Collins COBUILD English Dictionary,1995)。该词已大量出现在报章杂志中,如:a green household、 trying to persuade governments to adopt greener policies。相反,在莎士比亚的作品King Lear中有这么一句话:“…mice and rats and such small deer”,这里deer不是指路“鹿”,而是指“动物”,现在的词典释义中几乎没有deer表示“动物”这一义项。

认知心理学认为,“事物显著度的差异有一些基本规律,例如,一般情况下,整体比部分显著,完形结构就要比其构成部分显著”。因此释义需要以完形形态出现。语言学家为了研究的方便把语言单位的构成要素割裂开来,词典在对一个词目进行解释时,往往也以被切割后的语言单位部分相继地出现,如该词的发音、词性、语义等。这些差异性特征只是对词目进行了部分分析,可是,整体并不是其组成部分的简单相加,“无论是知觉、思维和理解,整体要大于部分之和。整体可能有这样一些属性,它们不是对孤立部分中推断出来的,因此不能通过对各部分的分析来认识整体的全部性质。”(沈家煊,1999b:2-3)相反,对部分的认识通常需要从整体上来把握。利用构成完形手段的形式来提高释义的整体性,从而实现完整性,如:

make /meikmek/ verb,noun 1 ~sth (from/ (out) of sth )―~sth into sth―~sth (for sb)―~sb sth to create or prepare sth by combing materials or putting parts together 制造;做;组装:[VN] to make a table/dress/cake 做桌子/连衣裙/蛋糕 to make bread/cement/paper 制作面包;生产水泥/纸张 She makes her own clothes. 她自己做衣服。

IDM make like... (AmE,informal) to pretend to be,know or have sth in order to impress people(为给别人留下印象)假装,装出……

on the make (informal,disapproving) trying to get money or an advantage for yourself 谋取利益

显然,make的释义方式是一种完形建构方式,从整体上帮助认识释义对象。首先该词分别附加了固定的搭配词from、into和for,以此说明通常情况下是在词组搭配组成的整体中意义才完整。不仅如此,一些词一旦与某些词语搭配使用后,其个体意义难以孤立地进行解释,这尤以英语成语最为典型,如make like和on the make,我们只有从整体上来对它进行释义。同时,依靠句子这一具有整体性特征的结构形式来加强作为部分的被释义对象的理解,不难发现这些句子不仅显现于例子中,还隐藏于释义内容本身,比如:

make vt. 5 [VP6A] eat,have (a meal):吃,进(餐)

从此义项我们可以看出,make被解释为“吃”和“进”时,它在“施事-动作”这一句子完形结构中充当“动作”一角,而加以括注是为了在这一认知框架里将词目的语义激活。其表述的完整性超出了只以动作为内容的释义。

传统词典学认为,释义只能在概念层面上处理语言,它无法也不能涉及任何特定的语义。词典认知论认为词典中的词目词决不是“杂物”清单,而是互为联系的网络系统。因此一个词目的真正涵义只有通过分析比较词目与词目之间的语义关系才能确定,只有这样意义的揭示才更具完整性。莱昂斯说,一个词的词义是指这个词在语言词汇中其他词所构成的系列关系中所在的位置。因此将单个的词目放在语义场中进行解释较之一个词目一个词目解释的方法,更准确、更完备。虽然这种释义方法从表面上看来是对元素主义的反驳,但是它可以弥补传统释义理论的缺陷。被定义词目之释义语义场与词目词义构成了整体与部分之间互决互补的解释学关系网。与如成中英所说,“对整体的直观和理解会引起对部分的澄清,再从部分的澄清引起整体性的展现,部分和整体相互决定,并逐渐走向一个整体结构系统,整体和部分是在一个动态的过程中相互弥补和相互决定的。”

在英语里存在一些词形简单但使用频率却很高的词。make就属于这一词义较弱的动词,其典型特征是词无定义。对这样的词进行释义往往比较困难。如果我们把它置于一个语义场,那么原本模糊的词义通过特定的语义场而得以明确界定。《牛津高阶双解词典》在处理make的释义时,第3、第4、第16义项中,名词bed、mistake、money和make之间构成了词汇横组合关系,这一关系也即是一个语义场,make不太明显的词义因此变得准确突出。同样地,在第9义项中,decision、guess、comment等和make共同构成了另外一个语义场,因为decision、guess、comment等词在意义上存在着联系,它们共同出现在相同的语境中。在这一语义场中,各名词之间词义相互制约的作用下,make的词义被界定为“做,作出”;后面加以括注将搭配项展示出来激活语义,从而使make的词义具体化为“做,作出(决定、估计等)”。如果我们把这些义项当作整体来看,make的词义便寓于这个庞大的语义场中。每一个语义场构成一个格式塔,每一个格式塔都符合四项完形原则,成为一个“优格式塔”。在这种“优格式塔”里,任何局部的改变都将影响它作为整体的性质。Cowie指出,最常用词的词义(包括其最常用用法)趋于模糊和依赖;使用频率的增高,词义随时间变化而趋于失去自立。这样,词目便不是一系列孤立的形式,它连同解释项形成一个词汇综合体,因此,在对词目释义时需要从整体上考虑。

五、结束语

一本收词量恰到好处,释义精确详尽,例证生动丰富,设计高雅精美的词典必然赢得读者的钟爱。美国词典家赫尔伯特(1989)说:“词典编纂家已经把释义工作发展成为一门艺术……他们可以不求助于只对专家才有意义的术语解释清楚。”释义既是词典的主要内容,释义的质量也是衡量词典水平的根本标志。好的释义应是:提供的对应词能包括所有可能的基本语义成分并有机结合地表达出来(魏向清,1992)。但是从理论上来说释义极难做到尽善尽美。一般说来,任何时代的词典编纂总是自觉不自觉地受到当时语言理论的影响。综观近二三十年英美主流词典的编纂,尽管语言学理论对词典编纂实践的适用性是有限的,我们也不难发现词典编纂实践大量吸收和借鉴了语言学理论的研究成果。完形理论注重系统性、整体性的研究,因此对于词典释义的影响突出表现在完形整体观对释义完整性的指导意义。就单个词目而言,释义结构都是以完形结构出现的,不仅是词目本身还是对词目进行解释的内容都处于一个格式塔。一种语言是由许许多多的语义场组成,词与词之间就存在于这个庞大复杂的语义关系网内,它们相互作用相互制约,因此我们在对自然词汇进行释义时必须将词目置于不同的特定的语义场,从宏观的整体把握词典释义,这样解释才更具完整性。词典释义的完整性就是在这些整体与部分之间相互作用,相互补充体现出来的。正如卡夫卡说过:“知觉本身显示出一种整体性,一种形式,一种格式塔,在力图加以分析时,这种整体性就会被破坏。”同样地,在对词汇意义进行解释时如果非要将词目按照传统释义理论加以解析理解,恐怕很难对这些词汇进行全面地释义。

参考文献:

[1]Hartmann R. R .K & James D. Dictionary of Lexicography. London,New York:Rutledge,1998.

[2]Lyons,John. Semantics [M]. Cambridge:Cambridge University Press,1977.

[3]Oxford Advanced Learner’s English- Chinese Dictionary (Sixth Edition).Oxford University Press,Oxford,2004.

[4]Ungerer F & Schimid H. J.An Introduction to Cognitive Linguistics. Addison Wesley :Longman Limited,1996.

[5]兹古斯塔・拉迪斯拉夫.词典学概论.商务印书馆,1983年.

[6]成中英.论中西哲学精神.上海:东方出版中心,1991年.

[7]黄建华.词典论.上海:上海辞书出版社,2001年.

[8]李明,周敬华.双语词典编纂.上海:上海外语教育出版社,2001年.

[9]苏宝荣.词义研究与辞书释义.商务印书馆,2000年.

[10]沈家煊.语法研究的分析和综合.外语教学与研究,1999b.

[11]张金忠.试论词典的分层次释义法.辞书研究,2002年.

[12]赵彦春.认知词典学探索.上海:上海外语教育出版社,2003年.

[13]章宜华.学习词典释义结构与释义方法初探.外国语,1999,(3).

[14]章宜华.语言学理论对词典释义的影响.现代外语,2000,(1).

同义词词典篇5

关键词;认知语言学;词典编纂;义项排列

【中图分类号】H030

【文献标识码】A

【文章编号】1006-2831(2011)08-0141—3 doi:10:3969/j.issn.1006-2631.2012.03.037

近年来,在相关研究者和词典编纂家的共同探索努力下,词典学的研究成果层出不穷,尤其是在语言学研究理论成果的支持与指导下,词典的编纂实践得到了不断的深入与革新。在词典(本文所提及的词典均指学习型词典)的编纂过程中,词典词条义项的排列问题是一个非常棘手而重要的环节。词条义项以不同方式进行排列将在很大程度上影响词典使用者的查阅速度和学习者尤其是二语习得者的学习效率和学习效果。现代的语言学家和词典编纂家们普遍认为,一部优秀的词典必然要采用并体现一定的语言观。本文以语言学的重要分支认知语言学的视角,探究词典的词条义项排列问题,以便为词典编纂者和第二语言学习者提供一些参考和借鉴。

1 传统词典词条义项的排列方法

因为词典词条的义项排列是词典编纂中如此关键而复杂的问题,所以词典编纂家们在编纂实践中不断地思考和探索多种方法来改进和革新,以便最大限度地满足学习者的学习需求。纵观传统的词典词条义项排列主要有以下几种:

1.1义项发展逻辑顺序排列法

这是一种按照每个词语的词义发展逻辑顺序对词条义项进行排列的义项排序方法。依照这种排序方法,词语的本义排在最前,词语的派生义、引申义等按照与本义的语义联系的紧密程度依次排序。Thorndike Engfish Dictionary即主要是采用此种义项排序的方法进行词典编纂的。这种义项的排序方法便于词典使用者更好地了解各个义项之间的逻辑关系,尤其是对于词性相异的各个义项之间的关系有一个更加直观的了解。但是,这种排序方法有其不可避免的弊端,即极大地增加了检索的难度;而且这种义项排列方法忽略了语言的实际使用情况,往往排在词典最前面的意义并不是实际生活中最为常用的义项,为第二语言学习者的学习增加了困扰。

1.2词义发展演变的历史顺序排列法

此种义项排序方法以词语词义的发展顺序为主要脉络,同時考虑语义在历史发展过程中的演变顺序。此种义项排序法也存在着诸多的弊端。首先,一个词语有多种意义,每一个意义的演变都有快慢之分,就像家族传承,同处一个辈分的不同的人可能年龄相差极大,所以仅通过顺序来断定词义的演变并不科学;其次,词义的历史顺序大多以具体的文献史料为参考依据,随着考古文献的发现,已经编成的排列顺序可能会发生很大的变动;再次,一个词语的意义演变过程中,出现最早的意义往往并不是人们日常生活中最常用的意义,也就不便于外语学习者的查阅和学习使用。

1.3义项使用频率顺序排列法

这是一种充分考虑学习词典使用价值的一种词典词条义项排列方法。这种排序方法中,词语义项在日常生活中使用频率最高的义项排列在词条的最前面,比较少见的义项则排在后面。Random House Dictionary即主要是采用此种义项排序方法进行词典的编纂。此种义项排序方法的优点在于能让学习者直观明了地知晓哪些义项是词语的常用意义,哪些是罕见意义。但是,对于一个词语的义项哪一个是常用的,哪一个是不常用的,缺乏一个科学准确的界定,往往多为词典编纂者的主观臆断;其次,这种排列方法不能很好地体现出各个义项之间内在的逻辑关联,对词义的发展演变过程也缺乏反映,不利于学习者系统掌握词语的含义和深层理解词语的蕴义。

总之,传统的这三种词典词条义项排序方法各有其优越性和不足之处,为了最大程度地提高词典的查检速度,最大限度地提高学习者的学习效率,本文认为,在词典的编纂过程中应该综合运用多种义项排序方法,以便优化词典的编纂工作。

2 认知语言学视角下的词典词条义项排列

早在上世纪四、五十年代就已经出现应用语言学理论成果进行词典编纂的案例。通览当代英汉学习字典,可以十分肯定地说,每一部字典编纂的成功都离不开语言学理论的支撑与指导。

2.1何为认知语言学

认知语言学是伴随着认知科学的不断发展而逐渐诞生并发挥影响的。它反对主流生成语言学,强调语言是人类从事认知活动和实践的产物与反映,人的语言学习和使用能力是认知能力不可分割的组成部分,同样受到人类认识世界的方法和规律的指导和约束。所谓认知语言学,指的是“一个以我们对世界的经验以及我们感知这个世界并将其概念化的方法、策略作为基础和依据进行语言研究的语言学学派”(张敏,1998)。认知语言学在经历720多年的发展和深入研究后,其理论成果不仅促进了人们对语言的认识,更积极影响了应用语言学的发展,其中与词典学的有机结合就是一个重要的方面。

2.2认知语言学对词典的释义与义项排列的影响

学习型词典最大的功用在于帮助语言学习者通过最小的努力获得最大的语言知识和语言运用能力。词典的词条义项排列应该充分考虑学习者的认知基础和认知能力水平。因此,词典的编纂者们在词典的编纂过程中,必须按照词典释义的基本原则,根据学习者的认知能力与认知水平进行词条义项科学有机的排序,从而实现其社会文化功能和学习效益。

同义词词典篇6

关键词 语文辞书 五种思潮 思潮的主次

引言

辞书,是文化大厦的顶梁柱之一。从原型论看,辞书的中心成员是最常用的中小型语文辞书(例如《简明牛津英语词典》、《小罗贝尔词典》、《俄语词典》[奥热果夫主编]、《现代汉语词典》、《新华字典》)。辞书的次中心成员,是大型语文辞书(例如《法兰西学院词典》、《牛津英语词典》、《德语词典》、《美国英语词典》、《汉语大词典》)和常用的其他类型语文辞书(例如《常用词词典》、《成语词典》),中小型百科辞书(例如《辞海》),普及的专科辞书(例如《语文知识词典》、《语法修辞词典》、《哲学辞典》)等。辞书的一般成员,是大型百科全书(例如《中国大百科全书》、《不列颠百科全书》),高级专科辞书(例如《哲学大辞典》、《中华实用法学大辞典》)。辞书的边缘成员,是不常用的有各种专门用途的辞书(例如《唐五代语言词典》、《通鉴大辞典》)。以上这些等次的划分,主要有三条标准:它们所包含的文化知识有中心以至边缘的区别;它们在人们获得文化知识过程中的作用有早晚之别、主次之分;它们在人们获得文化知识过程中的使用频率有大小或多少的不同。本文论述的是语文辞书的中心和次中心成员。

世界辞书编纂的历史,已经有3000多年了。主要存在过五种思潮:实用主义,描写主义,规范(规定)主义,历史主义,理性主义。五种思潮都必须把客体世界、科学、民族社会、历史、文化、政治、思想作为自己的宏观整体背景。

在历史上,五种思潮并不是截然分开的,也不是依次出现的,更不是同时出现的,而是在历史长河中大体有个出现次序,而一经出现至今都有生命力,只不过生命力的强弱有些区别。在某个历史阶段或在某一部辞书里,不可能同时平均用力贯彻多个主义,而常常以一两种思潮为主,兼顾其他。

一、实用主义

人类文明从畜牧时代转向农业时代,即青铜器时代,产生了辞书的雏形。任何一个民族最初阶段的辞书,都开始于经验、直觉和实用,即初始的实用主义。辞书的“实用”有多种多方面:启蒙、释难、交流(翻译)、读经、正音、正形、辨义、识字、用词、选词、查考、推广标准语,等等。

世界各国,最早体现实用主义的辞书,主要有三类:难词词典、启蒙词典和交流词典。

(1)难词词典(glossary),也叫难语词典。例如《尔雅》,约于2300年前的中国战国时代开始编纂,秦汉间已经正式使用。还有约在公元前1000年,印度编出了第一批词典,其中主要是婆罗门教经典《吠陀经》难词注释。约在公元前5世纪,希腊人普罗塔哥拉斯编出了《荷马史诗难词表》。公元8世纪编出了《盎格鲁一撒克逊难字表》(拉丁语各行中间注上英语)。公元8世纪末到9世纪初阿拉伯语言学家西巴维伊希编出了《真主的书》(为教徒读经解释难词)。1623年科克拉姆(H.Cokeram)的《英语词典》的副标题就是《难词汇释》。

(2)启蒙词典。例如《史籀篇》,约于公元前800年,中国周朝宣王时代已经成书;《急就篇》编成于公元前40年,西汉元帝时代。

(3)交流词典,包括方言词典即方言间或标准语方言间的对照词典、双语或多语对照词典。

方言词典,这里要说的仅是方方对照词典。公元前后、东汉末年的扬雄编出《方言》,收词675条,按意义分编为13卷。英国赖特的《英语方言词典》6卷,1898-1905年出版,主要对照4种方言的10万个词。1999年出版的《汉语方言大词典》5册,许宝华、宫田一郎编,收录古今南北方言20万条。

双语词典。早在3000年前,亚速人到了巴比伦(今伊拉克境内),看不懂苏美尔文字,就编了最早的苏亚对照的双语词典(常称syllabary,即苏美尔音节文字)。英国最早的词典也是拉英对照的双语词典。欧洲11世纪编出了《阿拉伯—波斯语词典》,1596年拉夫连季·济扎尼编出了《俄语注释斯拉夫语简明词汇》,1627年巴姆瓦·贝伦达编出了《斯拉夫俄罗斯词汇》,后来约翰逊(s.Johnson)等编出了《波斯语—英语词典》、《阿拉伯语—英语词典》、《拉丁语—英语词典》。

中国的特殊国情决定了双语词典产生得较晚。到了唐代,才有和尚义净(635-713)编的《梵语千字文》(梵汉对照)。明洪武15年即1382年才有火原洁编出《汉蒙译语》,后收入明清两代总汇的《华夷译语》(含30多语种)。现当代各国双语对照词典,成千上万。

多语词典。例如,《拉丁语词典》是八种语言对照的,即用七种语言解释拉丁语。这类词典,较早的有1073-1074年突厥语学者马哈茂德·卡什加尔斯基编成的多卷本《土耳其诸语言汇编》(该书1912-1915年才被发现,后在伊斯坦布尔出版)。1598年阿达姆·韦列斯拉温编纂并出版了《拉丁语—捷克语—德语—希腊语词典》。1704年俄国出版了《俄拉希三语大词典》。

俄国女皇叶卡捷琳娜二世(1729—1796)还是公主的时候就热衷编纂万国词汇,执政后动员国内外有关人员,并令俄国科学院院士彼得·巴拉斯(1741—1811)负责整理,于1786—1787年出版了《全球语言的比较词汇》,收集了285个基本词,对应了欧洲51种、亚洲149种,共200种语言。该书第二版(1790—1791),由米里耶和主编,扩充为四卷,对照语言也增多了:亚洲185种,欧洲52种,非洲28种,美洲15种(多为美国总统华盛顿令州长和将军帮助收集),总共280种。例如“姐妹”一词共列出67种语言的对应词,其中知名的语言依次有:波兰语、爱尔兰语、古希腊语、拉丁语、意大利语、西班牙语、葡萄牙语、近代法语、英语、日耳曼语、丹麦语、瑞典语、荷兰语、匈牙利语……还有一些国家的方言。

西班牙僧侣罗林左·赫尔伐斯(1735—1809)编出了《已知各民族语言目录及其编号和各种语言及方言的分类》(1800—1804年马德里版)汇集了307种语言的词汇。

18-19世纪之间,产生了历史比较语言学,促使辞书界出现了一批新成果:他们貌似语言交流对照词典,实际上体现了历史比较语言学的新成果。例如:

斯拉夫语言学专家弗兰茨·米克洛希奇于1862-1865年出版了极具学术价值的《古斯拉夫语一希腊语一拉丁语词典》。

德国语文学家费克(1833-1916)的《民族分裂前印度一日耳曼基础语词典》1868年出版,第二版(1870-1871)改名为《印度日耳曼语系语言比较词典》,第三版(1874-1876)扩充为四册,第四版(1890)又更新了许多材料。

后来以“学习词典”为代表的一些辞书也在不同方面和程度上体现了实用主义。一部辞书最好突出一两个“实用”目的,适当兼顾其他。

实用主义,老而不衰,时至今日又焕发青春。实用的理念,促使语文词典突出应用,吸收“句典”长处,通过典型句子说明典型用法,即具体语境中的词义或功能——语用意义。

二、描写主义

描写主义,是教人全面认识、理解语言,以解码为己任。曾经存在过早期的不清醒的描写主义,后来也产生了晚期的清醒的描写主义。

18世纪末以前,世人对语言的历时演变和共时分布还没有科学认识。因此,反映在词典上的描写主义,也不是科学的。例如阿拉伯语言学家菲鲁扎巴季(1329-1414)编了一部描写辞典,名为《海洋》,其描写主要体现在它兼收了标准词、方言词、比较通用词、带诗意的新词,等等。

19-20世纪之间,德国新康德主义者文德尔班(W.Windelbad)倡导跟“规范”相对的“描述/描绘/描写”理念,与此相关在几个学科兴起了科学的描写主义。描写主义辞书的代表作有:1828年出版的韦伯斯特《美国英语词典》,描写了美国英语的特点;《达里辞典》,即《大俄罗斯活的语言详解词典》,1863-1865年第一版,1880-1882年第二版,收20多万条词,注重方言和口语、谚语和俗语,第三(1903-1909)、四版由库尔德内主编,增加2万条词;1961年出版的《韦氏第三版新国际英语大词典》,力求客观描写当代英语词汇,抛弃规范主义和历史主义。

这些描写主义辞书都尽可能地反映语言单位的五个方面的情况:(1)词音——语音常体及变体,即现代标准音、古旧音、方俗音、书面音、口语音、重音、轻音、变音;(2)词形——词形常体及变体,即古旧形、方俗形、常用形、罕用形、讹误形;(3)词义——词义常体及变体,即现代语言义、古旧义、方俗义、常用义、罕用义、言语义;(4)语法——词的语法常体及变体,词性及其活用,常规及变异形态,句法标准功能及变异;(5)语用——词的语用常体及变体,音形义的修辞用法,从言语向语言的过渡用法。描写主义的宗旨是全面、系统、客观地记录活语言的真实情况(不是记录最好的语言),取材不限于典范作品,还有口语、广播、报刊、文艺作品等。“编词典的人只记录事实,他们无需有自己的思考,也不应该有自己的思考”(赵元任2002:890)。查词典的人,可以从中找到某词尽可能多的信息:读音、形体、意义、用法及其变体等。这一作用,常被称为“镜子效应”(the mirror effect)。

描写给实用提供了多种可能性,给规范或标准化提供了广泛的基础。

三、规范主义

规范主义,也叫规定主义。规范,是一个历史范畴。在古代的语文学阶段,多半把语言看作古代圣人造就的不变的标准体系。近代、现代意义的规范,形成于17世纪初期,一直延续到今天。近现代早期,受欧洲新古典主义(neo-classicism)影响,辞书编者多以“立法者”自居,追求语言的“纯正、标准”。其辞书代表作有:1612年意大利科学院编出的《意大利语词典》,1694年初版的《法兰西学院词典》(又名《法语词典》,1638-1694年编,它是法文捍卫者建立的一些语言使用规则,固定了法文的一些表达法,例如计数表达法),1755年初版的约翰逊的《英语词典》,1789年初版的《俄罗斯科学院词典》,1911年的《简明牛津英语词典》,1949年的《俄语词典》,1960年的《现代汉语词典》等等。规定主义的宗旨是保持语言的纯洁、正统、正确、稳定,扬弃偏误、谬误,取材于典范作品。梳理千变万化、千差万别的语言,分出正误,指导人们宗正匡谬。这一作用,常被称为“梳子效应”(the comb effect)。

词典的规范主义,主要体现在“五定”等方面:(1)定词,多收标准语,少收方言、俗语、土语、俚语、术语、行话、时髦词、外来词等;(2)定形,定出标准词形,适当给出常见变体;(3)定音,定出标准音,有限度地给出口语音,一般不给出残留的方音、古音、旧音等;(4)定义,给出标准语基本的和附属的意义,一般不给方言义、古旧义、时髦义、术语义等;(5)定用,只给出标准语用法及用例,不给方言用法、古旧用法、时髦用法、术语用法等。过度的规范,曾经受到柏林科学院第一任院长莱布尼茨(G.w.VOn Leibniz,1646-1716)的尖锐批评。文德尔班及后来语文学者所倡导的规范,应该是科学的、符合历史趋势的,至少需要遵守下列十二个原则:

(1)非逻辑原则,不能用狭义的逻辑苛求活生生的语言;(2)历史原则,承认语言的历时演变;(3)习惯原则,多应从俗从众;(4)系统原则,兼顾个体及其相关系统;(5)科学原则,合于历时和共时学理或规律;(6)功能原则,最能体现语言功能的单位是首选;(7)权威原则,权威的文本、用法常被公认;(8)刚柔原则,语言要素的取舍、推广范围等都要注意硬性规定和弹性幅度;(9)民族原则,外来词及其用法尽可能民族化;(10)国际原则,术语、符号和用法宜国际化;(11)准确原则,能指反映所指应无偏差;(12)经济原则,用较短的形式反映较多的内容。历史告诉我们,上述这些原则,都是互相关联的。少数是双向关联,多数是多向关联。规范辞书应该尽可能兼顾上述原则。语言的标准化,是对实用、描写、变化的积极规约,是各国共同语的社会性需要。

四、历史主义

17-18世纪的欧洲,在语言哲学中占主导地位的是反历史主义的“语言机械论”。深受康德等哲学思想影响的思想家和语言学家洪堡特极力反对这种思潮,他认为“语言的历时只是整个文化史的一部分”,“语言是一种活动(energeia),而不是一件已经完成的行为(ergon)”。他的功绩在于,促使传统语文学让位给科学的历史语言学。德国著名语言学家格林(J.Grimm),在19世纪就有一个著名命题:“我们的语言也就是我们的历史。”19世纪70年代出现的青年语法学派正式提出了历史主义,强调语言是随时间变化的现象。辞书的历史主义,主要体现在六个方面:(1)收词求全:足本收各个历史阶段的专名之外的全部词语,反映词语的产生、发展、消亡、存活情况。(2)词形尽录无遗:始出形(年代)、变体形(不同拼法,年代)、通用形,以通用词形统领历史上各种变体词形。(3)讲究词音时序:古读,今读,异读,习惯读法,方音。(4)适当反映构词时序,即词族史:必要时给出某些同干词、派生词。(5)讲究书证时序:一个义项中的书证按早、中、晚(及更细的分期)排列,甚至注明年代。(6)释义历史原则有更丰富的内容:义序——原始义/本义/词源义、先后出现的各个引申义,历史义位及其变体,附属义,修辞义,语用义,语法义,历代的方言义,俗语义,术语义,行话义。

历史主义辞书代表作有:《德语大辞典》(又称《格林词典》)1838年开编,1854年出一卷,1960年出齐,1965年新版,共33卷,首创历史原则。《牛津英语词典》原来的名称就叫《依照历时原则的新英语词典》,1857年倡议,1884年出第一卷,1928年出第一版,1933年出新版,1972年补遗4卷,总20卷,1.5万页,收词50万条,默雷等主编。《日本国语大辞典》自20世纪60年代始编,1972-1976年出版,共20卷,1.5万页,收词50多万条,200多万个例证。《汉语大词典》1975年开编,1986-1994年出版,共13卷,收词37万条。

在历史主义思潮中,也产生了一些历史比较语言学词典。例如奥·贝特林格和鲁·罗特合编的《圣彼得堡梵德大词典》(7卷,1853-1875年出版)。历史主义辞书都是收词在20万以上的足本,具有特别明显的词库性和研究性。

五、理性主义

这里的“理性”,不是黑格尔哲学核心的“理性”;“理性主义”也不是哲学史上的“唯理论”。这里的“理性”和“理性主义”都是广义的:是指认识的高级阶段和能力,是感觉、意志、情感等心理活动的升华,能用概念、判断、推理等进行的思维活动;更广义的是指这样的思想倾向或观点——在思想文化各领域推崇理性,反对神秘主义、信仰主义、直觉主义等非理性主义。辞书编纂水平的高低悬殊,主要在于设计师的理念。理念的不断更新,推动了辞书的不断发展。历史的事实告诉我们:先哲的理念演绎出不朽的辞书,现代大师的理念演绎出现代样板辞书,当代新理念正在演绎各种新辞书。历史上的理性主义辞书的代表作,主要有以下几类:

1.义类辞书。

也叫概念词典或题材词典,事物分类观念演绎出义类辞书。传统义类辞书分类较粗,不便检索。如《尔雅》(编于2300年前的战国时代,定于秦汉)将2074组词,分为19类:释诂(多是古代同义词,177组)、释言(多是常用词,其中同义词234组)、释训(多是叠字,137条,同义词36组,另有非叠音的15组)、释亲、释宫、释器、释乐、释天、释地、释丘、释山、释水、释草、释木、释虫、释鱼、释鸟、释兽、释畜。《通雅》(成书于1573年以后)分52类。《通俗编》(成书于1788年前)分38类。1920年中华书局出版的《作文类典》,把作文能用的古旧词语按国家、法律……人事、妇女等分为31类,附有部首索引。还有准义类词典,即所谓的“类书”,如较早的唐《艺文类聚》分46类,727小类。较晚的清《渊鉴类涵》分43类,2536小类。类书,海纳古代各类事物,精选俪词骈语。以上这些义类,属于古典范畴,跟柏拉图式的知识分类没有本质区别。

现代义类辞书,分类比较科学。其语义分类,从哲学上继承了培根、圣西门和黑格尔等人的思维成果,从自然科学上继承了现代研究成果。1852年,受到现代语言学“联想关系”影响,英国皇家学会会员罗瑞(P.M.Roger)医生主编出版了ThesauTus of English Words and Phrases(常译作《英语词汇宝库》,准确的译名应该是《英语词语和短语义类词典》),收25.6万个词语,因为科学、宏富,所以它150多年以来畅销不衰,1992年又推出第5版,至今已经印刷了100多次。后来,多国多次效仿该书:1859年罗伯逊(T.RoberTson)的《法语概念词典》、1862年波斯尔(P.Bossiere)的《法语类比词典》、1877年以前桑代尔斯(D.Sundares)的《德语词汇》、1881年施列辛(schlessing)的德语《适当的词语》(1927年修订本改名为《德语词语及同义词手册》)、1934年德恩赛夫(F.Dornseiff)的《德语分类词典》(又译《按类义群划分的德语词汇》或《德语词汇的题材组列》,分20个义类)、1936年马奎特(ch.Maquet)的《分类词典》、1942年卡萨雷斯(J.Csates)的《西班牙语义类词典》(又译《西班牙语概念词典》)、1963年哈里格(P.Harlig)和瓦尔特堡(w.WarTburg)的法语《作为词汇基础的概念体系》、1981年《朗曼当代英语词库》等。在中国有1982年梅家驹等的《同义词词林》、1985年林杏光等的《简明汉语义类词典》、1991年竺一鸣等的《俄语同义词词林》,近十几年又出版了几部现代汉语分类词典。

现代义类辞书,跟传统义类辞书相比,功用明确而突出——在“辞穷”、“辞乏”的时候,为寻辞、选辞等表达(写作、翻译、作文)提供了一个备用词库,帮助提高一语或二语学习者的表达能力。正如罗瑞《英语词汇宝库》副标题所显示的——本书的分类和排列对于思想表达和文学写作大有帮助。《德语词汇》也有近似的副标题:德语写作人人必备的修辞手册。语义类别跟科学类别,是理性思维下的两套体系。

2.词源词典。

对词的理据,自古以来就有两种观点:一种观点认为名称和事物之间具有内在或自然联系,名称取决于事物的本质(physei),这种观点叫“本质论”。以苏格拉底(Socrates,公元前469—前399)、柏拉图(Plato,公元前427—前347)等为代表。中国战国中后期成书的《管子》说“名生于实”也属于本质论。另一种观点认为,名称和事物之间没有内在或自然联系,名称取决于人们的协商、约定习惯或规定(thesei),这种观点叫“规定论”。以亚里士多德(Aristotle,公元前384—前322)和荀子(公元前313—前238)为代表。

本质论和规定论的争论,一直延续到近现代。词源词典从古到今都包含这两种思想。其中凸显人类的一种理性思维成果——词的理据。例如中国东汉末年,公元213年以前出版的刘熙的《释名》、公元1650年的《法语词源词典》(1694年、1750年再版)、1669年的《意大利语词源》(1685年再版)、1721年的《通用英语词源》、1769年的《瑞典哥特语词汇》、1854年德国语言学家弗里德里希·季次出版的《罗曼语词源词典》、斯拉夫语言学专家弗兰茨·米克洛施(F.Miklosich,1813—1891)1886年出版的《斯拉夫语词源词典》。

跟词源观念相关的,应该有中国东汉许慎的《说文解字》(约成书于公元100—120年)。其理性主义主要表现在三个方面:(1)继承。主要继承了以孔子为代表的多位先哲对许多汉字微观结构的字源分析。(2)对足量材料的认识。许慎对成千上万个汉字微观结构、理据一个个分析、归纳、概括。(3)科学重构。许慎对汉字体系宏观结构的创造性的认识、思考、研究,产生了六书文字观,用540个部首统率万字,堪称千古创举,后来注解、研究《说文解字》的书有近300种,形成小学里的首位显学。总之,既有对材料的感觉、经验,也有演绎、推理、创造,更有用思想重构科学世界。

3.一般词典。

其中的理性主义产生得较晚。因为真正的科学词汇研究,在欧洲开始阶段是15—17世纪:意大利从15世纪中叶开始,法国、英国、波兰、捷克、匈牙利从16世纪开始,德国、丹麦、俄国、乌克兰、葡萄牙从17世纪开始。“这些欧洲新语言的研究工作的开展,同各民族文学语言的巩固和统一有着密切的联系,那是在对语言的规范性和反历史主义的理解的标志下进行的。”(汤姆逊1960:117)

现代科学、现代语言学,特别是现代词汇学、现代语义学,促使现代大师产生了新理念——词汇系统、语义系统新观点,跟传统编纂法分道扬镳,因而演绎出具有系统观的现代样板辞书。在英国有《牛津英语词典》重要编者中的福罗尔(H.w.Fowler/F.G.Fowler)兄弟1911年出版的《简明牛津英语词典》,至今已经出到第11版。在法国有罗贝尔(P.Robert)主编,1972年出版的《小罗贝尔词典》。在俄国有《俄语详解词典》主要编者、《现代俄罗斯标准语词典》编委奥热果夫主编、1949年出版的《俄语词典》。在中国有吕叔湘主编、1960年试印的《现代汉语词典》,吕先生在《现代汉语词典编写细则》里详尽地阐释了中型现代汉语词典编写的崭新的系统思想,因此才演绎出《现代汉语词典》。

现代意义的语文词典和百科辞典的分野,应该始于17世纪末。1694年第一次出版了分别代表两类辞书的姊妹篇《法兰西学院词典》和《工艺科学词典》[科尔内耶(T.Cor-neille)主编]。它们早于《康熙字典》22年,当时中国正在古典主义中爬向乾嘉高峰。而欧洲正处于文艺复兴时期之后,从古典主义进入到浪漫主义前期(1660-1798年),语文性和百科性两类辞书带着新思想走出两条新轨迹。300多年的事实证明,语文词典渐渐向百科辞典靠拢,增加科学因子,显出一定的兼容性。靠拢的步子有大小,兼容的程度有强弱。以收百科条目为例,《现代汉语词典》(以下简称《现汉》)第2版占25%,收1.47万条,1972年版的《小罗贝尔词典》占60%,1978年的《小罗贝尔词典》占21%。以释义的百科因子为例:“红”,《现汉》第5版只释出物色义“像鲜血的颜色”,而《简明牛津英语词典》第8版除了给出物色义(血色至桃红或橘红),还给出光谱因子。正如J.R.赫尔伯特所说:“词典编纂家已经把释义工作发展成为一门艺术……他们可以不求助于只对专家才有意义的术语而把词义解释清楚。”(黄建华等2001:214)

20世纪70年代,语言学及与其相关的辞书学进入了新觉醒时代。80年代,电子计算机使辞书界进入了一个全新时代。因此辞书编纂出现了许多新理念、新体例。简介如下:

(1)多维理念

较早的词典都是两维的,现在已经发展到多维。请看下表:

维度 二 三 四 五 六 七 八 九 十

内容词目+释义二维+注音三维+例证四维+语法五维+语话用六维+文化七维+间源八维+相关词群九维+图示

当代单语词典和双语词典,都演化为多维知识网络结构体系。其宏观结构包括篇幅容量(足本和非足本)、各类词语比例结构、释语要素及方式、例证的类别及标准。其微观结构包括词条的信息结构:语义基义为主,其余为辅——语义陪义、语法意义、语用意义、文化意义及图示。

(2)整体理念

19世纪末以来,哲学、心理学、语言学、辞书学等学科的主导思想,由原子论转向整体论。《简明牛津英语词典》、《小罗贝尔词典》、《小拉鲁斯词典》、《俄语词典》、《现汉》就是这一思潮的代表作。表面上看来,它们的词条都是按字母顺序排列的,词汇整体处于分割状态,实际上词汇和词义是个内在的强化的有机整体。其整体观至少体现在下列方面:①宏观整体观——跟世界相联系;②相关条目的参见系统;③以词条为光源,适当辐射语义、语法、语用等相关信息知识;④词条和释语的意义等值;⑤词义和例证的功能等值;⑥在纯形式(音序等)编排前提下,适当兼顾词场整体,尤其是同、反、类义词;⑦通过词素立目,把相关词条或义项联系成整体,提供构成新词的手段和方法。

(3)现代语义理念

辞书的释义,直接受现代语义学的推动。从19世纪20年代以来,洪堡特、密尔、弗雷格、索绪尔、萨丕尔、奥格登/理查兹、布龙菲尔德、兹古斯塔、利奇、诺维科夫、莱昂斯、吕叔湘等,对词义渐渐产生了二分观、三分观、四分观、五分观等。词义包含着如下要素:第一是所指或外指意义(指物、指概念/观念等),第二是系统价值或内指意义(跟相关词的义差、用差、语法差别等),第三是各种附属意义(感情、语体、语域等),第四是语法意义(词性、结构、变化、功用等),第五是语用意义(语境义、义位变体、常用、罕用)。其中第二、第三要素最应注意。反映出第二、三以及第四、五要素的,属于释义现代化。这些现代语义理念,先后演绎出《简明牛津英语词典》(1911)、《小拉鲁斯词典》(1948)、《俄语词典》(1949)、《现汉》(1960)、《小罗贝尔词典》(1972)。

(4)元语言理念

元语言,一是指用来释义的自然语言的两三千常用词,叫“释义元语言”或“义元”(primitive);二是指代表义素的人工设计的语言,叫“形式语言”。

前一理念演绎出1978年的《朗文当代英语辞典》(用2000个常用词释义),后一理念演绎出1982年卡拉乌洛夫等的《俄语语义词典》(约计分析出7800个义素)。未来的汉语词典,义元应该用4000左右常用词较为合适。

(5)语料库理念

语料库理念,已经产生了半个多世纪。利用“英国国家语料库”开发了《柯林斯COBUILD英语词典》、《牛津高阶英语词典》、《朗文当代英语辞典》、《钱伯斯基础英语词典》等。现代语料库必须含有断代(含几个时期)的、多地域、多作者、多学科、多语域、多语体的书籍和报刊,代表活语言的真实文本,由此产生的词典才能是活语言的缩印本。

4.学习词典

现代英语坐着帝国的战车向国外扩张,当代英语搭载科技飞船向全球挺进。美英在1938—1948年已经拿走了诺贝尔奖项的一多半,于是学习科技和英语,成了当务之急,这就促使学习英语的新理念产生——把词作为语义、语法、语用统一体,突出语用,提示惯用法。外语习得在强调正确性(correctness)基础上更突出得体性(appropriateness),于是1948年演绎出世界上第一部外向型学习词典——Oxford Advanced Learner's Dictionary of CurrentEnglish(《牛津高阶当代英语学习词典》,由霍恩比主编)。70年代进入信息时代,英、法、美、德涌现出了十多部学习词典。中国至今没有一部理想的学习词典。语文性词典向学习型词典靠拢,吸取其释义优点。《简明牛津英语词典》新版、《朗文当代英语辞典》在这方面获得了极大成功。

5.基础词典

各种、各类、各层次的语言交际,都共有一个基础词汇常量——约4000个词。掌握了这些基础词汇,大体可以懂得一种语言。例如,根据Fries统计,英语常用词4000-5000个占书面语用词的95%,最常用词1000个占书面语用词的85%。(Landau 2005:301)掌握汉语3000常用词,就能懂得一般语言材料的86.7%。(《现代汉语频率词典》1986:1490)由此演绎出《基础法语词典》、《基础英语词典》以及多部常用词词典。

6.搭配词典、配价词典

现代意义的搭配研究,标志应该是20世纪50年代Firth第一次提出科学概念——搭配(collocation),后来他的学生Halliday提出词语学(lexis)及相关的三个概念:词项(lexicalitem)、搭配、词语集(lexical set)。此后从语义、语法、语用的角度研究出固定搭配、典型搭配、常见搭配、特殊搭配等。同时,语料库也促使一些科学意义的搭配词典产生,如:1968年《BBI英语搭配词典》,1984年《现代俄语详解组配词典》,1992年《现代汉语实词搭配词典》,1997年《BBI英语词语搭配词典》,2002年《当代英语搭配大词典》,2006年《牛津英语搭配词典》。

法国语言学家特斯尼耶尔(L.Tesnière,1893-1954)的依存语法,倡导动词核心说,并以此为基础,于50年代初将化学的配价理论引入语言学,渐渐发展出配价语法。德国语言学家恩格尔(U.Engel)认为“配价是含有语义的句法范畴”。由这一理念演绎出了配价词典,如1973年、1974年、1977年出版的《德语动词配价词典》、《德语形容词配价词典》、《德语名词配价词典》,1992年出版的《英语配价词典》,中国也编了一部《德语配价词典》(华宗德等)。《动词用法词典》、《现代汉语实词搭配词典》也包含了配价理念。

结语

同义词词典篇7

关键词电子词典检索纸质词典数字化

引言

20世纪40年代中期,随着对机器翻译研究的深入,电子词典的开发也逐渐进入人们的视野,尤其从20世纪80年代中后期开始,随着计算机技术尤其是微型处理器的发展及个人电脑的普及,电子词典开始步入其黄金发展期。虽然电子词典已为公众所认识和使用,但使用者和研究人员对电子词典仍未形成统一定义。Hartmann等(2000: 47―48)将其界定为“一种基于计算机技术将数据信息呈现于显示器上的方式。”Landau等(2001: 102―103)则将其定义为“借助计算机读取使用以二进制代码的数字化方式存储的文本及多媒体图文声像信息的工具”。有些学者甚至将机器词典,即供机器翻译或自然语言处理用的编码计算机语言词典也纳入电子词典的范畴。(Wright J. 1998: 62―63)可以看出,电子词典是依靠计算机及其技术建立的,这是它与纸质词典的本质区别。我们认为,电子词典是数字化的辞书,但它不是将纸媒词典文本简单电子化或机械照搬印刷辞书的文本内容,而是以电子计算机技术为依托,以数字化语料库(即文本型数据库)、多媒体数据库(如图像数据库、音频数据库、视频数据库等)等为核心的具有自动化性质的语词信息查询检索系统。电子词典按其用途可分为学习型与研究型词典,按其使用介质可分为芯片词典、手机词典、计算机词典和网络词典等。

电子词典功能模块一般包括数据库、检索、界面设置(如语言设置等)、附加功能(如生词本、历史记录、收藏、信息统计等)、系统帮助等。电子词典作为一个以查询检索为主要任务的系统,检索必然是其中的重中之重,是其核心功能模块,其检索性能直接决定其质量的高低。词典检索就是根据用户需要从词典信息集合中找出所需要信息的过程和技术。传统纸质词典的检索方式非常有限,词目字符构成形式往往是其唯一的检索依据,如汉语一般只有笔画、部首、拼音等检索途径,而英语一般只有字母顺序检索,对于这些检索模式,纸质词典的前言、后附页等往往会给出提示,学习者在学习过程中一般也会受到相关的指导。而电子词典的检索功能却要多得多,同时使用者也很难得到较为系统的检索知识与指导。Hill等学者(1989: 83―93)也曾指出,电子文字信息检索系统必将替代纸质词典检索。目前,对电子词典检索模式进行分析的文章国内仅有2004年源可乐的《词典的突破――谈谈光盘词典的特殊检索功能》一文,而国外也鲜有学者对电子词典的检索功能展开探讨。

电子词典检索功能不断发展,除了早期就支持的对检索框中输入语言的自动识别搜索、多语言互查、短语检索等最基本的检索功能外,近年来还发展出了多种便利、高效的检索模式。因此,本文将对目前电子词典的其他主要检索功能做一个较为详尽的综合性分析,并对其未来发展做出一些构想。

一、 电子词典检索模式综合分析

目前,电子词典已构建了较为完备的检索体系,为用户提供多种非常实用的检索功能,其科技化与人性化并重的多元检索模式或路径大大提高了词典信息检索的性能,为使用者提供了极大的便利。下面笔者将就这些方面对当前的电子词典检索模式进行综合分析。

(一) 追踪检索与跨典检索

追踪检索与跨典检索是电子词典使用频率最高的两大基本检索功能与重要特色。

在电子词典中,任何出现在释义和例句中的单词都是一个超链接,可以指向该单词的详细解释,追踪检索技术就是基于这种可以通过程序自动生成的单词之间的超链接性。(孙东云,邱东林2009: 106―114)章宜华(2007: 1―13)也指出:“电子词典实际上是由语言数据、相关语料和语言处理技术构成的超文本语言文字信息框架。”学习者在查阅电子词典中某个单词的释义和例句时,如要对其中的相关目标信息(如新词等)继续深入检索,只需直接点击即可跳转到相应词条的正文,查询完毕后按后退键就可退回到原先页面,这就是追踪检索,亦可称追加搜、连续查询、交叉查询或跳查。使用纸质词典时,要满足同样的需求,使用者只能按照字母顺序再次检索单词,这样的重复操作费时费力;而这种词与词之间的互查功能优势突出,它可以帮助学习者按照语义关联性或自己的兴趣、思路而非线性顺序去主动、迅速查阅并习得更多词汇,这无疑比纸质词典方便得多。这给词典的使用方式开辟了一个新途径,也带来了根本上的改变。(Aust R et al. 1993: 63―73)需要指出的是,这种追踪查询的检索模式目前主要为计算机词典、手机词典及部分芯片型电子词典(如卡西欧、步步高E900)所有,而大多数在线词典与早期开发的EBWIN等电子词典则不具备这种超文本性检索功能。

一部电子词典往往收录整合多部大型、权威词典,包括综合型(如《牛津高阶英语词典》《麦克米伦英语词典》等)、专业型(如《金融和商业英语词典》《计算机术语词典》等)和百科型(如《英文维基百科》《神话百科全书》等)词典。一些甚至可以收纳上百部如巴比伦、灵格斯等PC版电子词典,这是基于目前大部分电子词典所具有的词库开放性,即使用者可根据自身需求下载安装词典并自由设定其使用和排列方式。纸质词典和早期的电子词典通常一次只能查一部词典,而目前的电子词典往往可以在同一界面上同时呈现数十部词典关于某个词语的释义和例句,即实现了跨典检索。跨典检索实现了多部词典内容的完全共享,有效减少了检索上的盲区,扩展了电子词典的功能和范围,显然要比在多部纸质词典中查询同一单词或短语高效便捷得多,信息丰富得多。学习者若遇到不能确定意义的词汇,就可以通过跨典检索综合参照对比这些词典的相关释义后做出恰当选择。同时在电子词典中,上述追踪检索不但能直接链接至同一收录词典的某一相关单词,而且还能直接链接至其他收录该相关单词的众多词典内,这又进一步深化了对跨典检索的具体应用。

(二) 操作符检索

操作符检索,指搜目标词语时,若使用者记忆不清,只能确定其中部分,就可以借助电子词典的各类逻辑运算符和通配符来限定检索范围进行模糊检索,这些逻辑运算符和通配符大都源自计算机程序中的通用操作符。电子词典中的常用通配符包括:“?(问号)”――代表单个字符如一个任意英文字母或汉字;“*(星号)”――代表任意长度字符串,如一个或若干个任意英文字母或汉字。常用逻辑运算符包括:“AND”――表示并列或需同时满足的要求,即组成项必须要同时包含某些字符;“OR”――表示对所列条件满足其一即可,即组成项中只要包含某个字符即可;“NOT”――表示排他性条件,指明确排除项即限定组成项中不出现某个字符,有时亦用“-(减号)”表示。学习者在使用纸质词典时,必须知晓目标词语的正确拼写或构成,否则很难查到,而电子词典的操作符检索功能使学习者在无法确认词目的确切构成或对词目没有把握的情况下,依然可以利用操作符检索到单词。例如,若学习者对reconciliation一词中到底是“e”还是“i”不确定,就可直接输入通配符问号替换得出结果,若对到底是“ci”“ce”还是“si”或“se”无法确定时,则可直接输入通配符星号替换来锁定结果;若学习者对中文“一蹴而就”的“蹴”写法不熟悉或只能确定“一……就”也可用此法解决其查询问题。同时,这种操作符查询检索模式也有利于对同一类型的词,尤其是相同词根或词缀的词进行归类比较,例如学习者可输入“*scibe”从而对含有scibe词缀的英文单词进行归纳总结,也可对相同构式的词组进行查询,如输入“一?一?”就可以查出含有这种构式的所有中文词语,如“一心一意”“一生一世”等。另外,字符串运算符“+(加号)”也会被用于电子词典的操作符检索,它是以中文的汉字或英文的单词为基本单位,一般被用于查询较长的短语或句子,如输入“踏破+10功夫”就可从全库语料中查出“踏破铁鞋无觅处,得来全不费功夫”,或输入“All work and no play+5”就可查出“All work and no play makes Jack a dull boy”。上述各种操作符可被组合起来,通过设置更加多样的检索条件,从而更精确地得到所需要的查询结果。例如,输入“*day* AND *night*”,可以检索到词库中包括day和night两个词的所有条目和例句,输入“*old OR new trick*”,可以检索到词库中包括old trick和new trick两个词的所有条目和例句。这种组合检索方式可以在写作中用来查询某种概念的表达式,如想找夏天开黄花的植物,就可输入“*summer* AND *yellow flower*”,然后通过搜索到的释义反查概念。目前,绝大部分计算机词典、芯片词典和网络词典都有这种操作符检索功能。

(三) 修正检索

修正检索主要包括两类――还原式检索和纠错式检索。其一,电子词典为了更精确地查询,在对用户提交的查询式进行检索时一般都会进行预处理,即自动识别并滤去词形变化或屈折变化和词缀,还原至目标语的原形或标准形式,这就是还原式检索,它主要适用于英语等具有词形屈折变化的语言。电子词典可以直接过滤屈折变化和词缀等元语言知识,如将resembling自动还原成resemble,scarves还原成scarf,involved 还原成involve。学习者使用纸质词典查询时,由于语言知识和推导能力方面的局限,其去屈折变化和词缀过程存在一定变数,容易对生词产生误判,如遇到“considerable”时去查consider,遇到“cunning”时去查cun。电子词典这种还原式检索不仅能减少学习者对屈折变化和词缀的误判,也能减少学习者的认知负荷。(De Schryver, GillesMaurice 2003: 134―199)其二,当使用者输入不够准确以致在词库中检索不到目标词汇时,电子词典会自动将纠错提示标示出来,并提供一组供用户参考的拼写建议,这就是纠错式检索。一般而言,这组备选项与用户输入的查询项很相似或接近,仅有少量词语成分不同。在纠错建议的帮助下,使用者可以极大地节省自己的时间和精力,并获得满意的查询结果。例如要查询“expense”而错误输入“expence”时,电子词典即可提示出“expense”。目前,计算机词典和网络词典一般都能够轻松应对“查无此词”的情况,能提供对错词的纠正建议,而芯片型电子词典由于其硬件配置方面局限,一般不具备这种自动纠错功能。除了根据词形相似度纠错外,部分电子词典还会基于Soundex或Metaphone 语音算法技术,根据发音相似度给出近似输入的选择。(Phillips L. 1990: 39)如《柯林斯高级英语词典(第五版)》光盘版以及微软的英库在线词典等都具备中英文同音校正功能,此外英库还能给出英文的近音词,如欲查询“peasant”而错误输入了“pesant”时,英库除了给出同音目标词“peasant”外,还会列出“pleasant”“present”等近音词。需要指出的是,目前的在线词典尤其是一些搜索引擎自带的在线词典,会结合对搜索引擎相关输入查询中纠错数据的统计分析,向使用者推荐一组高质量的相关搜匹配,供用户参考,帮助用户轻松地获取满意的检索结果。

(四) 递进式检索

当电子词典使用者输入目标语时,输入栏下方下拉选单会自动出现可供选择的词汇提示滚动列表,学习者可以直接从中点击选取目标词汇,显示窗就会出现关于该词汇的词条正文信息,这种自动填充功能就是递进式检索,亦称接近性检索。这些下拉选单中的词汇一般按字母或拼音顺序排列,随着输入信息的不断增多,这种提示信息也会逐步减少,这使使用者能迅捷准确地查找到目标词。目前大部分电子词典均具备这种边输入边检索的查询提示功能。如使用巴比伦词典查询“pleasure”时,输至“plea”时,下拉选单中会出现“pleach”“plead”“please”等数十种选择,而输至“pleas”时就仅剩“please”“pleased”“pleasant”“pleasing”“pleasure”五个选项,使用者可以很方便地选取目标对象而无需继续输入。递进式检索主要是基于输入内容与词库中目标词汇逐渐扩大的相似度。还有一种特殊的递进式检索模式,它是基于用户在实际应用中的搜历史记录的数据库,在用户输入搜条件时,电子词典按照以往的搜条件自动筛选并推荐给用户一些匹配的选项,从而促进信息检索的完成。如灵格斯词典,它会自动为本地使用者的搜历史建立一个本地数据库,并依据该历史记忆处理后续相应的词汇扩展以便于该特定用户的二次查询。大部分在线词典则会基于所有用户及具体使用者历史查询行为的统计分析(如查询词共现概率、查询者兴趣学科归类等),为使用者提供更为个性化、更为有效的信息检索指导或查询扩展。目前,大部分电子词典都将历史性检索融入普通递进式检索,且将历史性检索置于普通递进式检索结果之前,如用百度在线词典以未登录身份查询“plateau”一词,当输入“pl”时,下拉列表前面依次出现“plot”“plug”“plum”“plaza”这些被检索频率较高的词,其后才是按照字母顺序排列的“PLA”“place”等词。可见,通过递进式检索,使用者更容易得到符合自身查询意图的检索结果。

(五) 发音检索

除了通过词形检索之外,语音检索也为电子词典提供了新颖的检索途径。发音检索主要包括音标输入检索与语音输入检索。首先,音标输入检索是指通过在电子词典中键入目标词的音标检索到相关词目,它主要针对英文的查询检索。目前具备音标输入检索的电子词典不多,主要限于发音词典的电子版,如《剑桥英语发音词典(光盘版)》《朗文发音词典(光盘版)》等。这些发音词典将英语中所有的单元音、双元音、辅音等分别罗列出来并做成按钮形式,使用者只需按顺序将音标点击输入进去就可查到符合该读音的词,例如输入/w/+/e/+//+//就可检索出weather与whether两个单词。音标输入检索都支持通配符“*(星号)”检索功能,使用者对不清楚或模糊的语音可用其代替进行检索,如输入/d/+/i/+*+//+//+/s/就可检索出delicious一词。另外,英库在线词典为不懂英语音标的使用者开发了一种基于字母直接拼读的输入检索模式,即使用者可以输入与英语发音相近的汉语拼音代码,如输入“maosi(音节处加上连接符)”,英库词典就可自动给出与该拼音相似的英文单词“mouse”。其次,语音输入检索是指一些电子词典融入了目前刚刚流行起来的语音输入技术,如有道词典手机版、金山词霸手机版等,其界面上一般有录音话筒标志,点击之后,进入录音状态,使用者录音完毕之后电子词典就会自动识别检索。由于目前智能手机语音识别技术的软硬件配套均较完备,所以为其开发的手机词典有不少融入了语音输入检索功能,而电脑端词典大多尚未融入此功能,但用户可单独下载安装语音输入软件并配备语音输入设备后将其作为附加功能使用。发音检索使查询方式更加灵活和全面,它使使用者在学习过程中,尤其是学习外语的过程中(如听广播、观看外语影视节目等)可以通过把握一个陌生语词的发音进而查到其含义,从而避免了按单词发音猜拼写这种传统方法带来的低效率。语音检索将成为电子词典检索的一个新亮点。

(六) 提取式检索

除了传统拼写检索(包括键盘/虚拟键盘拼写、复制粘贴和手写输入)以及发音检索方式外,电子词典还支持提取式检索。最先出现的提取式检索是屏幕取词检索,又称“鼠标取词检索”或“即指即查”等,指使用者可以实现对屏幕上任意位置的词汇进行实时抓取与检索,包括文档、图片、浏览器页面、软件界面、flas等的文字内容,即将光标定位到该单词所在处便可查询到该词的释义和用法。目前大部分具有该功能的电子词典(如必应词典桌面版、金山词霸PC版等)仍主要借助Windows操作系统的hook(钩子)技术及API拦截技术等在Windows环境下实现屏幕取词检索,但该检索模式局限性较为明显,即仅适用于Windows操作系统的电子词典及检索处理结果还受文档加密等因素影响。目前随着OCR(光学识别)技术的普及与推广,它也正被逐渐融入电子词典检索技术中,如有道词典就加入OCR检索模块,该检索模式的优势就在于其摆脱了前者的限制因素。此外,伴随着智能移动终端(如智能手机、平板电脑)的普及运用,另一种全新的提取式检索――摄像头取词检索也应运而生。由于智能手机普遍配备了自动对焦摄像头,一些手机电子词典借助此功能加上OCR技术,开发出了摄像头取词检索功能,如北京文通科技有限公司开发的基于安卓平台的慧视手机词典,使用者只需将手机摄像头对准或扫一下目标词即可实时检索,这种检索基本不受目标词载体所限制,不管目标词出现在纸质书籍、电脑屏幕、标示牌抑或其他介质上。市场上还出现了一种扫译笔,如蒙恬扫译笔、QuickLinkPen Elite电子扫译笔和汉王速录翻译笔等,其实质也是一种提取式检索的电子词典,它们也是借助光学扫描设备和OCR技术实现检索,但其局限性比较明显,即仅适用于印刷文本。另外,提取式检索除了使使用者免于输入词汇,还能自动识别处理短语,如使用金山词霸或巴比伦对“regard”一词进行提取式检索,而该词前后分别为“with”和“to”,那么当光标置于regard位置或点击该词时,词典会直接识别并查询出该词组,而非先进入regard一词的整个释义。提取式检索功能符合数字化环境下使用者的学习习惯,较大地提高了查词效率,因而在电子词典中得到广泛的应用。

(七) 语义联想检索

若学习者对检索目标词汇只知概念含义,却不知其词形与发音时,也可以通过一些电子词典提供的语义联想检索功能,根据意义相关的词汇检索到其目标词,这就是语义联想检索。最早提供这种语义联想检索功能的是普林斯顿大学心理学家、语言学家和计算机工程师联合开发的一种基于认知科学的WordNet,该研究型电子词典实质上就是一个覆盖范围宽广的英语词汇语义网,它将语义作为其组织与检索原则,使用者通过它可集中搜某一语义场下所有相关单词即同义词、上位词或者下位词等。随后,一些学习型电子词典也采用了这种语义联想检索功能,如《牛津英语联想词典(光盘版)》《麦克米伦高阶英语词典(光盘版)》《朗文英语联想活用词典(光盘版)》等,它们大都为这种语义联想检索设置了专门的类义词词库(即与目标词同一个语义场的相关词语库),将英语词汇按意义归类,虽然涵盖范围不及WordNet,但它们也搭建起了一定规模的以同义关系为中心角色的语义互连辐射网。如使用者欲查询某种颜色的英文,自己未掌握但同时手头的汉英词典又查询无果时,可以在语义联想型电子词典中输入“color”,其类义词词库就会显示出数十余种颜色的英文单词,使用者可以通过追踪检索这些单词的具体含义,从而做出正确选择。再如,使用者若在翻译或写作中对选择“咆哮”的英文对应词没有把握,便可输入“shout”通过语义联想检索查找出“roar”“yell”“bawl”“bellow”等相关表达式,进而可基于此做出辨析选择。可见,这种以义聚类的语义联想检索模式符合使用者的认知规律与习惯,为使用者理解掌握词汇提供了相当的便利与支持。

(八) 通库例句检索

通库例句检索是指电子词典利用数据挖掘技术(通常是以Lucene开源全文检索引擎作为后台检索模块),实现在整个词库文本中对涉及某个特定单词、词组或其他表达式的集中式例句检索,即使用者只需输入一个单词、词组或其他表达式,电子词典就会自动把含有该单词、词组的例句无一遗漏地搜索显示出来,其实质是一种语料库索引。例如,使用者只需在巴比伦词典例句检索框中输入“undertake”一词,电子词典就会把词库中所有包含“undertake”一词的例句显示(如《英汉大词典》中找到28例、《牛津搭配词典》25例等)并高亮显示关键词,这是纸质词典无法做到的。此外,操作符检索也常常被融入全库检索中,如用户输入“growth AND economy”可检索到词库语料中所有包含这二者的内容。大部分计算机词典(如《牛津高阶英汉双解词典(光盘版)》、金山词霸)和部分芯片型电子词典(如卡西欧EWV2800H)具有通库例句检索功能。通库例句检索使电子词典实现了词目和词条内容的双向苏遥使词库信息得到了充分有效的利用,例句的集中显示让使用者能接触到目标表达式的更多实例与共现规律、丰富语境和文化信息,其感性认识与语用知识会被进一步加强与扩充。若词库中包含双语或双解词典,那么对其高质量语料库的通库检索也将会对积极言语活动如翻译、写作产生很好的指导作用,使双解词典产生逆向效应,如英汉词典反过来就成了内容丰富的汉英词典。

(九) 网络释义检索

网络释义检索功能指利用强大的搜索引擎后台及先进的网页萃取等技术从海量的网页数据资源中抓取提炼大量平行语料,并根据其在不同网页中的共现频次、网页可靠度等来缜密分析判定相关表达式的最佳、最精准的语义匹配关系,从而自动生成一个庞大的、自动实时更新的动态词库。人类语言不断发展变化,文化交流和信息社会的发展更是大大推动了新表述的产生,仅网络上每天就有数十个新词产生,因此无论质量多高、词库多大的词典都难以涵盖所有这些信息,即使是更新速度最快的在线词典词库搜集新词也需要一定的更新时间,因此网络释义检索功能主要是针对那些电子词典本地离线词库或在线词库均尚未收录的各类词汇或新用法等,提供及时、强大的网络词库补充与支持。有道词典率先推出了网络释义检索功能,它利用有道搜索引擎对数十亿网页进行数据挖掘和技术分析,获取了大量存在于网络,但普通词典中查找不到的流行词汇、外文名称和缩写,包括很多影视作品名称、品牌名称、名人姓名、地名、专业术语等。随后,爱词霸、海词、QQ云词典、必应词典等也相继推出了网络释义检索功能,实现了同步搜索互联网上出现的新鲜表述,及时反映了新词语和新用法。如IMHO这一网络热词,在现有普通离线词库或在线词库均无法查到,而在必应词典中输入后直接就跳出了网络释义检索结果“依本人愚见(In My Humble Opinion);以我个人的浅见而言;依愚人之见”,必应词典中其他词典也均未显示任何结果。同样,若在有道词典中输入“腐女”一词,显示出来的仅有网络释义检索结果“英语: Yaoi fandom;日语: 腐女子;法语: Fujoshi”。可见,网络释义检索功能具有很强的实用性,它也将成为大数据和云计算环境下电子词典的重要特色之一。

二、 电子词典检索模式的发展构想

目前的电子词典检索技术虽然已经比较成熟,但仍有待改进与提升之处。笔者下面就这些方面对未来电子词典的发展提出一些构想与建议。

(一) 多媒体数据检索

信息技术和互联网的发展大大推动了多媒体数据的产生、传播和存储。面对海量的多媒体数据,智能的多媒体数据处理技术已成为信息科学的一个重要研究课题。由于多媒体数据能生动形象地体现语言的语用性,在电子词典领域,借助网络大量的音视频构建多媒体词库也必将成为发展趋势,即通过相关音视频材料对目标词进行释义和例句展示。因此,如何对这些多媒体数据进行检索也必将成为重要的研究课题。电子词典用户必然希望能像文本检索一样检索音视频文档并找到感兴趣的信息。相比于音视频数据而言,文本式数据更具可把握性。因此,对于多媒体词库的检索,笔者认为基于语音输入的内部转换机制将成为解决音视频检索的主要途径之一,即电子词典通过内置的语音输入设备自动为音视频文档添加对应文本,这样对音视频的检索实质上就转换为了对文本的检索。当然,对于多媒体词库,词库构建者也可以在构建之初就为其中的音视频文档配备对应的电子文本文档,但是在大数据的环境下,笔者认为要构建大规模的多媒体词库,这种模式显然费时费力,难以跟上数据发展要求。常规的语音识别(如语音输入检索中的语音识别)是人直接与机器的交流,语音的速度通常为正常语速甚至略慢,若说话者语速过快,语音识别系统的识别准确度就会降低。因此,对于电子词典内置的以音视频文档作为识别音源的语音识别应具备目前许多视频播放器具备的变速不变调的性能,即能做到对目标降速不变调,从而确保语音识别的准确度。另外,鉴于目前国内外字幕影视的迅猛发展,电子词典未来的多媒体数据词库也可与其结合,依据从字幕影视中提取出来的字幕进行检索,这样也会非常便利。

(二) 检索结果的聚类排序

检索结果的聚类排序对电子词典未来的发展也相当重要。首先,目前电子词典中的义项排列仍主要参照纸质词典,要么主要遵循历史发展原则,即按词义发展的先后大体时间顺序或词义历史演变过程编排词条的各个义项(如《韦氏新世界词典(第三版)》《牛津英语大词典(第二版)》等),要么遵循逻辑联系,即把关联义项按与本义的联系紧密程度排列(如《美国传统词典》《美国传统学生词典》等),要么遵循使用频率原则,即按常用性或使用频度由高到低排列义项(如《朗文当代英语词典(第三版)》《简明牛津词典(第七版)》等)。这三种义项排列一旦确定就基本固定不变。虽然三者优势都很明显,但也都存在不足,如遵循历史发展原则的词典中,有的目标义项虽然常用,却排在诸多古旧废弃义项后,这就会大大降低词典的查询效率;遵循逻辑联系会造成对语言实际使用情况的忽视;遵循使用频率原则就会造成对逻辑联系的忽视,不利于使用者对词项各义项的理解和记忆,当然三者之间也存在一定程度的重合。义项排列在词典学界历来是个大难题,笔者认为未来的电子词典可以借助设立二次检索功能使使用者对义项排列自行选择(如淘宝购物选项排序一样),即通过融合三大排序原则来满足不同学习者对义项检索的要求。其次,例句的优选排列。电子词典由于其数据载体的特殊性,其所承载的数据信息量极其庞大,这突出体现在其例句的翔实方面,但这也会给使用者造成例句选择上的困惑与麻烦,因此,未来电子词典必须建立一定的例句筛选功能,即学习者可以根据自身水平、学科范围、所含目标词汇语法类别和使用区域(如澳大利亚、美国)等通过电子词典的二次检索从例句信息库中筛选出相应难度、对应语域中最切合自身需求的例句,当然词典用户还可以结合其他要素设定更为复杂、灵活的例句综合检索系统。这种个性化分级分类优选模式可以加强与用户的互动,将是印刷型辞书固定式例句呈现所无法企及的。

此外,需要补充的是,目前一些检索功能并未在所有电子词典中普及,所以如何将这些优势很好地融合在一起进行深层次的开发与利用,也将是电子词典发展中的一个重大问题。

三、 结语

电子词典是现代科技与传统词典编辑相结合的产物,是一种具有革命性意义的词典形式、学习工具,它具有广泛的发展前景和潜力, 它是信息时代中非常重要且必不可少的词典形式。现代科技有力地推动了电子词典的发展,但电子词典不是纸质词典的简单翻版,它除了利用数字介质的特点来承载数据信息外,更是充分发挥了数字技术强大的检索功能和优势,使词典单一的线性检索方式发生了深刻变革,不断朝智能化、多元化、个性化、层次化方向发展,从而实现与数字化潮流、大数据环境的高度兼容。本文重点综述了近年来产生的电子词典特有的主要检索模式,对其做了一个较为系统的定义归纳与分析,同时针对现有的不足探讨了对未来电子词典检索模式的一些构想,希望能为电子词典检索系统的优化研究提供一个良好的开端,同时也希望对电子词典用户在查询活动中最大限度地利用现有资源起到一定的促进作用。

参考文献

1. 孙东云,邱东林.电子词典的超文本性与词汇直接学习.辞书研究,2009(5).

2. 源可乐.词典的突破――谈谈光盘词典的特殊检索功能.辞书研究,2004(1).

3. 章宜华.关于计算词典学理论框架的探讨.辞书研究,2007(6).

4. Aust R, Kelley M J, Roby W. The Use of Hyperreference and Conventional Dictionaries. Educational Technology, Research and Development, 1993(41/4).

5. De Schryver, GillesMaurice. Lexicographers Dreams in the Electronic Dictionary Age. International Journal of Lexicography, 2003(2).

6. Dodd S. Lexicomputing and the Dictionary of the Future. Lexicographers and Their Works, 1989(6).

7. Hartmann R R K, James G. Dictionary of Lexicography.北京: 外语教学与研究出版社,2000.

8. Landau S I. Dictionaries: The Art and Craft of Lexicography. Cambridge: Cambridge University Press, 2001.

9. Phillips L. Hanging on the Metaphone. Computer Language, 1990(7).

同义词词典篇8

[关键词]英语学习词典 编纂趋势 以读者为本

[中图分类号]H316[文献标识码]A[文章编号]1009-5349(2011)10-0042-02

英语学习词典是提供给非英语母语学习者使用的学习词典,它必须考虑到学习者的英语程度和他们的学习需要,这样编纂出来的词典才会受到学习者的欢迎,因此学习词典应如何以读者为本这个原则便很值得我们探讨。

20世纪90年代起,英语学习词典如雨后春笋层出不穷,更新速度也很快。众所周知的是《牛津高级英语学习词典》(以下简称《牛津》)和《朗文当代英语词典》(以下简称《朗文》)是最受英语学习者欢迎的两种学习型词典。前者先后推出了七个版本,后者于1978年问世,打破了《牛津高级英语学习词典》长达三十多年的一统格局,分别推出了四个版本,与其平分秋色。在新版本的推出过程中,它们都在前几版的基础上吸收了同时代其他词典的一些长处,不断进行改进,体现了英语学习词典编纂的最显著趋势:以读者为本,更方便读者的使用与学习。

具体表现在以下几个方面:

一、释义

两本词典都有限定释义用词范围,这样读者不必为了一个词目词的意义而多次查阅词典,同时两本词典为达到词典释义中准确、清楚、充实、简洁四项释义标准而做出了相应的努力。

《牛津高级英语学习词典》在《牛津一版》中就指出释义要尽量简单,难以用简单文字释义的词常用图表表示。只是《牛津五版》之前并没有对释义词汇量进行限制。经过长时间的实践后,开始尝试使用释义词汇量。《牛津五版》使用了3500个释义词,《牛津六版》将派生词都算在内,更是减少为3000词,比第五版少用了500词,释义更简洁,易懂。

《朗文当代英语词典》的一大特色就是用2000常用词来释义,而且用的是最基本最常用的词义,这样的定义通俗易懂,很大程度上满足了用户的理解能力。《朗文三版》沿袭头两版的传统,用2000常用核心词来释义。而实践证明该做法非常有效,以致1995年出版的其他三本学习词典《牛津现代高级学生词典》《科林斯合作词典》《剑桥国际英语词典》也纷纷仿效。前二版的释义均是孤立的单词或词组,《朗文三版》开始对释义方式进行了大刀阔斧的改革,部分借鉴了科林斯合作词典的特色做法,就是对部分词目词用完整的句子进行释义。这种做法通俗易懂,不但提供了语境,还指出了与词目词搭配的典型主语和宾语。《朗文四版》则更多地对词义使用整个句子来释义的方法。较之前三版,《朗文四版》的这种做法更突出了朗文一贯坚持的“读者至上”的编纂宗旨。

二、义项划分和排列

义项是词典微观结构的核心内容,义项的排列和划分也就备受关注。

义项的划分要以词典学、语法学、语义学、语用学等学科理论为依据,再结合考虑词典编纂的目的和服务对象。而其划分的标准是什么呢?黄建华先生在《词典论》中说:“一条释义就像一个界标,在词义连绵不断发展的长河中,如何沿用它去树立界标,即划分义项,词典编者有很大的自由。”就目前词典编纂的现状而言,义项划分在概括性的总原则之下,的确还没有一个绝对的操作标准。

《牛津》的义项划分比较偏重词素义或词的基本语义,因此每个义项的外延意义较宽,具有很强的概括性。《朗文》的义项划分比较偏重于词的语用义,因此其义项划分比较细,也比较实用,相当一部分单词的固定搭配、文化内涵差异、文体差异、科技方面的语义,甚至比较常见的口语表达法等被单独立项。且《朗文》根据今年来词使用频率适当的增加义项,《朗文四版》甚至在有些定义后提供了反义词,增加了词义的理解和产出性信息。两本词典虽然在划分的标准上有所不同,但出发点都是为了使读者更好地运用词典,达到方便使用的效果。

而义项的排列方面,从读者至上的角度分析,《牛津》的查阅效果就不如《朗文》了。《牛津》一直沿袭初版,以词的历史发展为序,其义项的排列解释了词义的发展过程。而词义是随时代变化的,最常用的往往不是最早出现的词义。《朗文》从第一版起就坚持义项的排列以使用频率为序,频率高的在前,频率低的在后。《朗文三版》更是基于语料库分析而按使用频率的先后顺序来安排义项、成语、搭配和例句等,即最常用的排最前面,使一般读者更有效地使用词典,省去无谓的时间去浏览并不常用的词义。试比较两部词典对动词change的部分词义亮相情况:

《牛津六版》中将它按9大类(Become/make different, Replace, Exchange, Clothes, Baby, etc)分成了13个小义项,然后再列出关于change的惯用搭配。《朗文四版》中也将change分为13个义项,不过根据词频排列且从第8个义项起就是惯用搭配的释义与说明。比较两本词典的第一个义项,《牛津》中就是简单的:to become different;而《朗文》详细地释义为(from, to)to make or become different, give, or begin to have a different form, nature or character.

三、例证和插图

为帮助学习者提高英语理解与表达能力,学习词典都尽可能提供词语的全面信息。而丰富的例证与插图能很好的帮助学习读者理解和记忆词目信息。

例证是学习词典最重要的组成部分,例证的多寡、典型性和真实性决定了学习词典的优劣。牛津从初版起就始终保持例证的丰富性。由于庞大的语料库的辅佐,《六版》在例句提供上更为丰富,共列举出8.2万条例句,每条语法信息下都有充分的例证,使释义、语法标注、例证相互照应,形成一个完整的配套系统。读者很容易理解词语的释义及其前后标注的各种语法信息。同时还尤其重视各词语的关联意义,各词性都有各自完整的搭配例证。

《朗文一版》的例证许多来自SEU语料(Survey of English Usage), 提供单词在英语中的实际用法以及其他信息。《二版》的例句部分改动很大,绝大部分都是新的,其所用的例句大都来自“朗文引文语料库”,共收例证75000以上,选用自然、典型的例证帮助用户理解和使用词义,读例证往往就能找出最接近要寻找的某个意义的义项。《三版》全部例证都是基于朗文语料库,直接引用或稍作修改,去掉难词,对一些词目词则是针对性地杜撰。《三版》充分利用例证解释或补充说明词义,既有助于读者加深理解词义,以满足学习者的“求解”需求,同时表明词的常用搭配方式,又有助于他们模仿造句,以满足学习者的“求用”需求。到了《四版》,更把例证和搭配信息放在首要的地位。在《四版》的“Guide”中写道:“例证有特殊的功能,即提供典型语境、显示语法、显示搭配关系”,可以更好地帮助读者记忆并理解所查阅的单词,而且例证中所蕴涵的丰富的语言和文化信息更是语言学习所不可或缺的。

插图能补充说明释义不容易解释的问题,且插图生动、形象、帮助学习者加深印象,方便记忆。大量使用插图也是学习词典中以读者为本,《牛津六版》增加大量插图,共约一千七百条词目附有插图,还有16页彩图集中表现不同主题。《朗文三版》有2300个词目附有插图,还有24张全页彩图,按closes,kitchen,house,sounds等主题详细介绍有关词汇,甚至动作。

四、结语

《牛津高级英语学习词典》和《朗文当代英语词典》虽然在释义、义项划分和排列、符号、例证和插图等方面都有其各自不同的特色与编纂标准,但都在创新中求得自身的发展与完善,在满足英语学习者的需要方面取得了巨大成功,被英语词典接誉为最优秀的两本英语学习词典,体现了词典编纂中“以读者为本”的显著趋势。但是,即使是最好的词典,也存在其一定的局限性与可待完善的缺陷,不可能做到十全十美。笔者在此对这两本词典的同一编纂趋势进行分析,将其特色展现在读者面前,就是希望能更有效地使用这两本词典,以期对词典的编纂有所启示。

【参考文献】

[1]黄建华.词典论[M].上海:上海辞书出版社,1987.

[2]吕云芳.《牛津高级学生英语词典》的新发展[J].辞书研究,2002(4):97-104.

[3]李荫华.可喜的突破[J].外语教学与研究,1998(2).

[4]钱厚生.语义分析与双语词典[M].见:黄建华,章宜华.亚洲辞书论集[M].上海:上海辞书出版社,2001.

[5]源可乐.论英语教学型词典中的搭配信息[J].现代汉语,2001(3):259-266.

上一篇:三年级日记怎么写范文 下一篇:锻炼英文范文