《理智与情感》的语料库检索分析

时间:2022-07-16 11:42:05

《理智与情感》的语料库检索分析

摘 要: 语料库语言学作为一门新兴学科,可以应用于文学批评领域来分析文学文本。本文用语料库方法分析简・奥斯汀的《理智与情感》,揭示小说情节、人物塑造,以及作者的写作技巧。

关键词: 《理智与情感》 语料库检索 分析

一、引言

最近几年来语料库语言学正以其独特的优势得以迅猛发展,语料库已经被广泛应用于与语言学相关的各个领域。语料库检索软件在语言学领域,尤其是在文本分析中已被广泛使用。语料库检索结果就是从一个语料库中抽取一个文本的一个检索词及其出现的语境按字母顺序罗列出来,语料库检索软件是提供这些词的罗列结果的系统,使用既简单又省时,因为它可以快速有效地显示出检索词的搭配词频。作为一种建立在庞大的数据基础上的极有威力的假设检验设置,语料库索引可以使文本隐含的结构显现出来,同时还激发人的想象力,并检验文本对读者的感染力,具有很强的客观检验性。语料库语言学不仅仅用于语言学,更能用于文学批评领域来分析文学文本。我旨在探讨语料库检索软件在分析文学文本中的应用,选用英国著名小说家简・奥斯汀的小说《理智与情感》,对其情节、人物和写作风格用语料库检索软件进行分析,希望读者能领略语料库检索软件在文学批评分析中的魅力。使用的语料库检索软件是Wordsmith。

二、用Wordsmithl软件对《理智与情感》文本进行统计,通过得出的数据,从三个方面对该文进行分析。

1.运用Wordsmith分析小说的语言特色。

通过该软件,我们可以发现小说共有112359个词,其中有11966个不同的词。表1为出现频率前50的词。不难发现,同一个词的某些形式出现的频率较多。比如,过去式“was”出现了1629次,而原形“is”出现了680次;“were”排在48位,而“are”根本就不在前50个词当中。这表明,作家在创作小说时,经常使用过去时态来讲述故事发展情节。而且列表当中某些词类出现得比较多,如“that”、“which”、“what”这些指示代词,这可以说明小说的语言中有很多从句,而且句子的结构也远比口语中句子结构要复杂。这是英语书面语的另一特征。我们还可以从这张表中获得一些信息。比如“her”和“she”这两词排名都比较靠前,一个排在第5,一个排在第11。“her”的使用次数比“she”多出很多,可以推测“her”有时候是作宾格使用,有时候是作物主代词使用。再如“I”排在第7,而宾格的“me”排在第44。这些代词在小说中频繁出现,必然跟小说的内容息息相关。我们可以推断,故事中会有很多女性,否则作者不会如此频繁使用女性代词主格、宾格和物主代词。再根据词语列表中的第30位的词,即“Elinor”,这很明显是个女性名字,因此,在这些女性当中,Elinor必定是一个主要的角色。我们还可以作出一个推断,即小说中必然有很多人物对话因为在对话中,人们会经常使用第一人称,现在第一人称的I和me都出现得比较多,所以小说中人物对话也不会少。语料库软件可以印证这个事实。在concordance中搜索“I”就会列出“I”出现的所有的上下文。如果我们利用软件中的“concordance plot”功能,我们还可以得到每一章中“I”出现的位置和数量。这样我们就可以知道哪一章的对话较多,同时这一章中,哪一块的对话比较集中。根据词频列表,我们可以分析推断得出小说上述的时态、句式、语体等方面的特色,其它更为详尽的内容还需要进一步的阅读与分析。

通过分析,还能得出以下一些简略的统计数字:

标准句长:25.01

在这个文本中,从其字节数,形符数和句子数可以断言这是个较短的文本,把其类符形符比10.65与标准类符形符比数45.05想比较,可以推断此文本的词汇变化量大。单纯的形符数和类符数不能反映语篇的本质特征,但两者的比率却在一定程度上反映了语篇的某种本质特征,即用词的变化性。它的句长为26.32,与标准句长25.01相比,它比一些简易文本句子要长.它段落长为1742.82,比平均段落长730.96要长些。如果我们把一个字母的词,两个字母的词,三个字母的词和四个字母的词加起来,就可以知道少于四个字母的词为67932,而这个文本的形符数是112359个,这样整个词汇的60.5%都是多于四个字母的词。因而可以推断这个文本属中等难度水平,句子较长,段落较长。

2.通过语料库语言学统计工具分析小说的情节发展。

要理解一部小说的精髓,必须掌握其行文的脉络和贯穿始终的情节。这种对情节发展的把握可以通过对原著的通读来完成。本文要使用的方法是通过使用Word Smith语料库检索软件中的Wordlist和Plotting功能对小说文本的情节进行统计分析。

通过对全篇小说keyword的总结,可以得出小说的主人公之一为Elinor的结论。Elinor出现的频率最高,为582次。

3.运用Word Smith加工整合小说的人物描写,分析作者笔下的人物特色。

通过语料库检索软件中的Concord功能,我们可以穷举出所有人物出现时的上下文,就如同制作一幅幅的人物特写。通过这种方法,可以搜罗有关所分析的人物的所有描摹,对于研究人物性格,作者对人物的写作手法,都有不可或缺的重要性。 我将结合语料库Concordance软件统计出的分析结果,就小说中主人公进行语料库分析。

首先,先进入对主人公Elinor(埃莉诺)的分析,Concordance统计出了全小说共582处。接下来是对Marianne(玛丽安)的分析,Concordance统计出了全小说共459处。小说主要描写埃莉诺和玛丽安的爱情故事。她们的爱情经历了很多曲折,但是经过理智与情感的挣扎,这对姐妹终于获得了幸福。

三、结语

以上运用语料库检索对小说《理智与情感》进行了分析,准确清晰地把握了小说结构,并对其语言特色、情节发展和人物塑造特点等方面进行了统计分析。当然用语料库作为工具对文本的分析不能代替文学本身出发的鉴赏,但毕竟为我们认识作品提供了佐证。因此,将自然科学中的计算机技术与文学中的文本进行结合,可以为文学研究另辟蹊径,即以图形、列表、统计等量化的方法分析文本,从而得到对文本更加理性的诠释。

参考文献:

[1]Douglas Biber,Susan Conrad,Randi Reppen.Corpus Linguistic[M].北京:外语教学与研究出版社,2000.

[2]Jenny Thomas,Mick Short.Using Corpora for Language Research[M].北京:外语教学与研究出版社,2001.

[3]Sinclair,John.Corpus Concordance Collocation[M].Shanghai:Shanghai Foreign Language Education Press. 2001.

[4]郭放.《快乐王子》的语料库检索分析[J].乐山师范学院学报,2004,(6).

[5]Rowling,J.K.Harry Potter and the Half-Blood Prince[M].Bloomsbury Press,2005.

[6]王雁.《傲慢与偏见》的语料库检索分析[J].江苏教育学院学报(社会科学版),2007.3.

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

上一篇:公共文化视角下的乡镇文化站的功能与定位研究 下一篇:中美文化差异下的影视表现差异