学科交叉视角下的隐喻识别研究进展

时间:2022-09-24 06:58:41

学科交叉视角下的隐喻识别研究进展

摘 要:隐喻目前已经成为一个涉及认知语言学、心理学、教育学、逻辑学、计算机科学等多学科交叉的研究领域。本文将从认知语言学和计算机科学的交叉角度对隐喻识别所涉及的理论和方法进行探究,以期让更多的研究人员不仅停留在技术层面,而是更多地关注计算机技术背后的认知语言学理论基础,同时为语言教育者提供一些计算思维和计算机网络环境下语言教学新的思路和方法。

关键词:隐喻识别;多学科交叉视角;计算思维;语言教学

中图分类号:TP31

隐喻普遍存在于人类语言中。早在两千多年前,古希腊哲人亚里士多德就在《诗学》中把隐喻归入到修辞学领域中进行了描述。汉语隐喻的历史也非常悠久,最早的诗歌总集《诗经》中就出现了“譬”(metaphor)的纯熟运用。20 世纪30年代,出现了以Richard& Black为代表的语义互动隐喻学派,他们认为人的思维是隐喻生成机制的主要动因,为隐喻从修辞格向认知领域的过渡打下了理论基础。到了70年代,Lakoff & Johnson[1]在《我们赖以生存的隐喻》一书中指出,隐喻是一种思维方式,是人类理解抽象概念、进行抽象思维的重要途径。此后隐喻的认知功能和在思维中的中心作用得到了学术界的普遍认可。90年代著名认知语言学家Turner & Fauconnie[2]创建了概念整合论(The Conceptual Integration Theory),对Lakoff & Johnson的概念隐喻理论进行了整合完善,具有更广泛的解释性。近几年随着计算机科学的迅猛发展,隐喻又成为了自然语言处理的研究热点。目前学者们在多学科研究的基础上对隐喻的识别理解进行多种尝试[3-5],试图推动对自然语言更深层次的认知和理解。隐喻已经成为了一个涉及认知语言学、心理学、教育学、逻辑学、计算机科学等多学科交叉的研究领域。

隐喻自动识别关键的第一步是要解开人类对隐喻理解的认知机制,建立语言的形式化模型,使之能够以计算机能够识别的形式表示出来。这一过程很大程度上需要依赖认知语言学理论的指导。目前关于隐喻计算研究的综述性文章主要针对隐喻模型设计、知识库和数据资源建设及隐喻处理的应用方面进行介绍,而本文将从认知语言学和计算机科学的交叉角度对隐喻识别所涉及的理论和方法进行探究。以期让更多的研究人员不仅停留在技术层面,而是更多的关注计算机技术背后的认知语言学理论基础,同时为语言教育者提供一些计算思维和计算机网络环境下语言教学的新思路和方法。

本文的结构安排如下:第一部分探讨认知语言学视角下的隐喻的本质、识别机制;第二部分介绍计算机科学视角下的隐喻识别的研究进展。第三部分讨论了隐喻识别对于计算机专家及语言学家和外语教育者的启示和展望。

1 隐喻识别的认知语言学视角

1.1 隐喻本质

在认知语言学背景下,隐喻被普遍认为是一种思维方式和认知模式。概念隐喻理论认为隐喻是利用一种概念表达另一种概念,需要这两种概念之间的相互关联。这种关联是客观事物在人的认知领域中的联想。概念隐喻观运用源域与目标域之间的映射以及意象图式来解释隐喻现象,认为隐喻的本质是以一种事物去理解另一种事物的手段,从一个比较熟悉,易于理解的源域映射一个不太熟悉、较难理解的目标领域。人类对隐喻识别是指在语境中发现隐喻表达,找出源域、目标域及映射域的关系。束定芳[6]归纳了人类对隐喻识别的两种基本方法:(1)基于文本线索;(2)基于语义冲突。

1.2 基于文本线索的识别

隐喻表达的特征之一是具有一定的语言标记,可以把这些语言标记作为隐喻识别的线索。这种研究思路在隐喻识别中非常直观,起到一种“路标”的作用,具有较高的价值。通过隐喻标记语的明确指示,做出不能对该话语做字面意义理解而应做隐喻意义理解的明确引导。由于隐喻标记语的介入,人类对隐喻进行推理的时候,就能很容易地领会蕴藏的意图,从而作出正确的隐喻识别。因此,隐喻标记语的使用明示了话语的语义逻辑关系,对隐喻的人脑推理过程起到了明示的语用制约,从而帮助理解与识别。束定芳[7]总结了隐喻表达的七种文本线索标记:

(1)领域信号或话题标志。如intellectual stagnation(智力上的停滞)、psychic eddy current(心理旋涡)、时间隧道、历史悲剧。(2)元语言信号。直接用metaphor,metaphorical,metaphorically或“比如”等字眼。(3)强调词信号。In fact,literally,actually,really,汉语中的几乎、差不多、简直等。(4)模糊限制词。如英语中的a little,practically,汉语中的“有点”“某种意义上”等。(5)表示隐喻转换的上义词。如sort of,type of,“某种”等。(6)明喻。明喻是隐喻的一个种类,其比喻词like,as,“好像”,“仿佛”等明确表明这是隐喻式话语。(7)引号。

根据上述认知语言学理论,在隐喻计算机自动识别领域,有一些研究工作是针对文本中的线索而进行的。本文第3.1节将介绍相关研究方法和技术。

1.3 基于语义冲突的识别

多数隐喻的出现并没有什么明确的信号或标志,需要通过对语义冲突的理解来识别隐喻。语义冲突也称为语义偏离(deviation),指的是在语言意义组合中违反语义选择限制和常理的现象,是隐喻产生的基本条件。语义冲突可以产生在句子内部,也可以产生在句子与语境之间。Ortony[8]认为某一语言表达成为隐喻的第一要素是从语用角度或从语境角度看,它必须是异常的,即从其字面意义来理解有明显与语境不符合之处。人类需要根据话语的字面意义在逻辑上或与语境形成的语义和语用冲突及其性质,判断某一种用法是否属于隐喻。

人类对隐喻的理解首先建立在上下文语境的基础上,根据语言认知系统知识库及涉身概念知识库,对语言形式和字面意思进行分析,确定源域与目标域的语义冲突,并运用概念联想提取机制判断出映射关系,最后作出概念隐喻的判断[9]。如图所示:

2 隐喻识别的计算机科学视角

2.1 基于文本线索的方法

国内外很多学者对隐喻标记及其使用进行了分类和归纳总结[10-12],旨在通过文本线索的方法对隐喻进行自动识别。很多建立在对语料库(如British National Corpus)中隐喻标记统计的基础上,把标记隐喻的语言信号分为若干类别,并考察其在文本中的出现频率与隐喻的使用关系。研究表明,虽然带有语言标记的隐喻句在隐喻句总数量中存在的比例并不大,但是存在隐喻标记语的书面语中隐喻的比例达到了大约1/2的比例。除了隐喻标记语的词汇层面,Ferrari[13]还把句法分析作为文本线索进行隐喻识别的研究。例如,通常作为隐喻标记的单词metaphor,在句子“A metaphor is a figure of speech where comparison is implied.”中作为主语出现,此句不再是隐喻,metaphor也失去了标记的功能。这种方法概括起来就是利用规则约束与机器学习相结合,从语料库中统计隐喻的语言标记和句法信息出现的概率,以此作为文本线索进行隐喻计算机自动识别。

因为更多的隐喻不具有明显的语言标记,所以这种基于文本线索的方法只能作为一种辅助来提高识别效果。在前面1.2节中认知语言学中提到的语义冲突关键作用基础上,接下来探讨从计算机自动语义分析角度进行隐喻的识别。

2.2 基于语义知识的方法

由于技术的局限,对这种方法的研究很少到应用认知语言学中的语言系统知识库和系统概念知识库,只是把字面上出现的语义或者逻辑不一致当作隐喻进行识别。例如:对于隐喻句“my car drinks gasoline”,由于动词drink的语义优先公式为((* ANI SUBJ)(((FLOWSTUFF)OBJE)(MOVE CAUSE))),发出drink这个动作的主语即drink应是生命体,而car属于不具备生命体的语义类别,与系统中汽车文本中语义框架中出现的例如“消耗”等语义并不相符,因此造成了语义类搭配异常,形成隐喻的识别。

Fass[14]对基于语义知识的方法进行了早期的研究,建立语义冲突分类体系,并手工建立了语义知识库,但对大规模的语料分析具有局限性,也耗时耗力。Mason[15]通过大规模语料库自动获取词汇的优选语义,从领域语料库获得词汇的语义特征,对比特征语义冲突完成概念映射的优选。但由于领域知识库规模不足,此方法只能处理与动词相关较简单的概念隐喻,对于复杂映射具有很大的局限性。

利用词典和语义搭配知识是基于语义知识方法的另一项应用。如Krishnakumaran利用英语词典word-Net得到语义知识,计算词语在语料库中语义搭配的概率[16] 。同样,杨芸利[17]用《同义词词林》和《词语常规搭配库》来识别汉语语义搭配型隐喻。

另外,机器学习方法是隐喻自动识别研究的一个新方向,在处理海量信息上有着明显的优势和广泛的应用[18-19]。面对日益增多的数据与计算机技术迅速发展,广泛地尝试探索基于机器学习的隐喻识别研究十分必要。基本上,此方法把隐喻识别的问题转化成文本分类问题,最终达到识别目的。

3 总结与展望

3.1 语言学家与计算机研究者携手共进

语言学与计算机科学对于隐喻识别,有着共同的研究处理对象及共同的奋斗目标――揭示人类语言中隐喻的秘密,开发人类语言智能的功能。利用计算机对隐喻进行识别,基于规则和统计相结合的办法是有效办法之一,只利用任何一种方法都有它的局限性。计算机固然可以迅速地从大规模的语料中获取隐喻知识,解决系统的一些具体问题,但是却不能解释确切的运行机制和其中的规则到底是如何建立的。所以需要语言学家对语言进行描述与规则制定,实现计算语言的形式化,这些都是跟语言学的基础理论分不开的。同样,语言学也需要进一步现代化。而计算机隐喻识别所提出的一系列新的方向与需求,一方面启发语言学家从新的角度去思考和探索,这必将深化语言学的理论知识;另一方面,通过计算机改造语言学理论,可以促进语言描写的形式化、科学化和精密化。计算机科学的发展,不但为语言学提供了现代化的研究手段,而且扩展了语言学的研究视野。因此,语言学家与计算机研究者加强合作与支持,才能促进隐喻研究的重大突破。

3.2 隐喻知识库与英语教学

隐喻的各种计算模型往往需要一个或多个知识库的支撑,这是由隐喻的认知性所决定的。国外在隐喻知识库方面发展比较迅速,代表性的隐喻知识库有Sense-frame、Master Metaphor List、MetaBank和Metalude。在语言学教学实践中,隐喻知识库中所包含的词条、对隐喻的描述以及例句、规则、分析等给学生提供了实际语言运用中的真实语言材料。这类知识库所提供的语言学习材料,帮助学生理解和分析隐喻系统,提高英语语感、促进语言习得。“教材中非真实语料的例句往往对学生有误导作用,教学中应更多地使用地道的英语”[20]。例如,Master Metaphor List 知识库的词条 force下,隐喻类别示例如下:

Force is a substance contained in affecting causes

Put more force in to your punches.

Each sentence contained the force of an order.

Her death hit us with a lot of force.

Related metaphors: related to Causes are Forces.

Source domain: substance,contents,container,hitting.

Target domain: force.

知识库中除了三个例句,还给出了与force类别相关的隐喻类别(Related metaphors:related to Causes are Force)。指出了隐喻的源域(substance,contents,container,hitting)和目标域(force),另外还有简要分析的以帮助理解( note)。例句中都包含概念隐喻的影子。借助概念隐喻可以认识到隐喻表达形式的根源,将原本分散的形式内涵按根源进行归类。隐喻知识库所提供的概念隐喻系统使语言学习者了解到隐喻生成机制的原理,利用映射原理对知识系统分类整理。隐喻知识所提供的实例分析和分类帮助学生形成系统的理解和有序的逻辑思维,分清隐喻表述的各部分关系,代替死记硬背的学习方式,遵循有效的认知规律,从语言学习的根源和理论上整体把握,从而提高对语言深层次的理解,提高学习的效果,增强英语语感。

参考文献:

[1]Lakoff,G.,Johnson,M.Metaphors We Live By [M],Chicago: University of Chicago Press,1980.

[2]Turner,M.,Fauconnier,G.Conceptual Integration and Formal Expression[J].Metaphor & Symbolic Activity,1995,10(3):183-204.

[3]Derrida.Margins of Philosophy[M].Chicago:The University of Chicago Press,1982:31.

[4]Shen,Y.,&Gadir,O.How to interpret the music of caressing:Target and source assignment in synaesthetic genitive constructions[J].Journal of Pragmatics,2009,41(2):357-371.

[5]胡壮麟.认知隐喻学[M].北京:北京大学出版社,2004.

[6]束定芳.隐喻学研究[M].上海:上海外语教育出版社,2000.

[7]束定芳.认知语义学[M].上海:上海外语教育出版社,2008.

[8]Ortony,A.(ed).Metaphor and Thought[M].Cambridge University Press,1979.

[9]黄孝喜.隐喻机器理解的若干问题研究[D].浙江大学博士论文,2009l:51-52.

[10]Wallington,A.M.,et al.Metaphoricity Signals:A Corpus Based Investigation [D].Technical Report CSRP203205,University of Birmingham,2003.

[11]Barcelona,A.On the plausibility of claiming a metonymic motivation for conceptual metaphor[A],2000b.In A Barcelona,2000.

[12]Croft,W.The role of domain in the interpretation of metaphors and metonymies[J].Cognitive Linguistics,1993:4-4:335-371.

[13]Ferrari,S.Using Textual Clues to Improve Metaphor Processing[C].Proceedings of the 34th Annual Meeting on Association for Computational Linguistics Student Session.Santa Cruz,California,1996.

[14]Fass,D.Met 3:A Method for Discriminating Metonymy and Metaphor By Computer [J].Computational Linguistics,1991,17(1):49-90.

[15]Mason,Z.CorMet:A Computational,Corpus2basedConventional Metaphor Extraction System[J].Com2putational Linguistics,2004,30(1):23-44.

[16]Krishnakumaran,S.,Zhu,X.J.Hunting Elusive Metaphors Using Lexical Resources[C].Proceedings of the ACL 2007 Workshop on Computational Approaches to Figurative Language,2007:13-20.

[17]杨芸.汉语隐喻识别与解释计算模型研究[D].厦门大学博士学位论文,2008.

[18]Pasanek,B.Sculley,D.Mining Millions of Metaphors[J].Literary and Linguistic Computing,2006,23(3):345-360.

[19]戴帅湘.汉语隐喻分类识别的计算方法研究[D].厦门大学硕士学位论文,2005,6.

[20]Kittay.E. Metaphor:Its Cognitive Force and Linguistic Structure [M].Oxford: Clarendon Press,1987.

作者简介:张冬瑜(1977-),女,博士,讲师,主要研究方向:自然语言处理;樊宇(1966-),女,辽宁大连人,讲师,学士,主要研究方向:英语教学、教育管理;李映夏(1978-),女,辽宁大连人,讲师,硕士,主要研究方向:应用语言学。

作者单位:大连理工大学软件学院,辽宁大连 116620

基金项目:中央高校基本科研业务费专项基金资助项目(DUT132W432)。

上一篇:不同冲突因素引发的无线网络故障排查技术分析 下一篇:探析网络背景下的信息检索教学设计