俄语名词的计量特征研究

时间:2022-06-01 01:06:39

俄语名词的计量特征研究

[摘 要] 传统语法主要采用定性方法对语言作出描述,而计量语言学采用统计方法,利用(经过句法标注的)语料库对语言进行定量分析,是对语言进行精确研究的有效途径。以俄罗斯科学院编制的STR树库为数据来源,通过从树库中提取由名词充当支配词构成的名词性结构的相关数据,对名词性结构的基本类型、词序特征及其句法功能进行统计分析,得到了三个研究结果:一是验证了传统语法中已有的定论;二是使这些定论得到了更为精确的阐释;三是发现了传统研究方法难以发现的一些俄语名词的结构规律。由此可见,采用计量方法对词类的句法进行研究,不仅可以从定量的角度对传统语法中的有关论述加以补充与完善,而且具有语言类型学的意义。

[关键词] 俄语; 名词; 计量特征

在语言学研究中,统计方法的运用并不鲜见,研究者借助定量分析得出定性的结论,已成为自然语言信息处理的基本方法。在俄语研究中,语言学家早在20世纪初就已开始采用统计方法,但主要集中在文体、音素、语素、词汇等方面,其中尤以文体研究为最。波利万诺夫(Л.Поливанов)的《俄语亚历山大诗体》(1892)被认为是运用统计方法对文学作品进行语言分析的开山之作[1]878。至19世纪20―30年代,别雷(А.Белый)、布里克(О.Брик)、维诺库尔(Г.Винокур)等学者在诗体的计量研究上取得了一定的成就[1]878。雅尔霍(Б.Ярхо)在该领域作出的贡献尤为突出,他撰写的《精密文学研究方法论》(1935)及其他学术论著使其成为“文学批评传统方法的改革者”[1]xviii,因为他“首次在运用定量方法建构文学流派的类型学上做了尝试”[1]xix。近年来,俄罗斯学者延续了这一传统,采用定量方法研究诗律、音位、词汇等语言单位和语体特征,取得了一些新的成果[2

4]。

与此同时,在西方语言学界,随着齐夫(G.Zipf)所著《语言的心理生物学》一书[5]的出版,计量方法开始被广泛运用于语言研究,并逐渐形成独立的语言学分支学科――计量语言学[6]。在我国,已有一些研究将计量语言学方法运用于汉语研究,在词类的句法功能以及汉语句法结构的统计特性等方面取得了一定的成果[7

10]。研究表明,利用经过句法标注的语料库(也称为树库)对语言进行定量分析是一种卓有成效的方法。刘海涛认为:“基于依存句法的树库,除能进行一般的词类定量分析外,也可以进行依存关系、依存距离和加权配价模式的统计分析……这样的定量分析不仅可用于汉语句法研究,而且也可用在语言教学方面。”[7]250

251

2009年,俄罗斯科学院信息传输问题研究所的计算语言学实验室完成了俄语的句法标注树库(the SynTagRus Treebank of Russian,以下简称STR树库),为我们运用定量方法研究俄语句法提供了可靠的资源。该树库采用依存句法对句子进行句法标注,形成句子的依存树,树中节点为句子中的词,边为词间的依存关系 STR树库原文为“句法关系”,但其实质与依存语法中的依存关系相同。为同英语和汉语的计量研究中采用的术语一致,本文统一用“依存关系”表示。,树中也包含词的形态及句法功能等信息。根据这些信息,我们可以借助定量方法对俄语各词类的构成及其功能进行分析,验证传统语法定性研究得出的结论,并对词类的使用频率、各词类可以构成的结构类型、词序特征以及句法功能作出较为精确的阐释。与此同时,采用计量方法也可以更客观地从语言类型学的角度比较各种语言,进而能够对人类语言的个性和共性作出更精确的描述与解释。

本文将以俄语名词为例,从STR树库中采集相关数据进行统计分析,对以下几个问题展开研究:名词结构的主要构成类型;名词结构中支配词和从属词的词序特征;名词结构的长度(依存距离);名词结构的依存关系及其句法功能。希望以此发现传统研究方法难以发现的一些俄语名词的结构规律,或者对传统语法中的有关论述从定量的角度加以补充与完善。

一、 STR树库

(一) 理论依据及依存树构成

STR树库的句法结构标注以梅尔丘克(И.Мельчук)等提出的意义―文本语言学模型(MTT)为理论依据[11]196。MTT理论是一种分层次、基于依存关系的语言学理论 有关依存关系和依存语法理论的论述详见刘海涛《依存语法的理论与实践》,(北京)科学出版社2009年版;Я.Г.Тестелец, Введение в общий синтаксис, Москва: РГГУ, 2001。。该理论将句法层分为“深层句法”和“表层句法”,采用“有向的、二元的关系”构成“表层依存关系”,“选用依存树作为描写自然语言中句子的表层句法结构的形式手段”[12]214。因此,在表层依存关系中,“一个成分是主导词……另一个是从属词……箭头从主导词指向从属词” “词组由主导词和从属词形构成,前者在语法上居支配地位……后者在语法上处于从属地位。”见信德麟、张会森、华劭编《俄语语法》,(北京)外语教学与研究出版社1990年版。梅尔丘克所用的“主导词”沿用了传统语法的术语,而在依存语法中通常称为“支配词”,本文除了引文,统一采用“支配词”这一术语。[12]211。

据此编制的STR树库,一个句子构成一棵依存树。其中树的顶端为树根,该词为全句的支配词;从属词可以同时构成下一层从属词的支配词;词与词之间的依存关系标注在连线上;连线的箭头表示其依存方向。如句子:Маленькие машины шумят совсем на других частотах.(小轿车轰鸣的频率完全不同。)其句法结构在STR树库中的形式如图1所示:

图1中,左侧是句中按线性次序排列的所有词,右侧为据此编制的一棵依存树。除了词的句法功能信息,还包含了词与词之间的依存关系信息。这棵依存树由三层构成。第一层由支配词(树根)шуметь(轰鸣)支配两个从属词:名词машина(轿车)和前置词на(以……),前者同支配词构成述谓关系,而后者则同支配词构成疏状关系;第二层由第一层的两个从属词充当支配词,其中машина支配形容词маленький(小的),从属词与支配词构成定语关系,而на则支配副词совсем(完全)及名词частота(频率),前者为限定关系,后者为前置词短语关系;第三层由第二层的从属词частота支配形容词другой(另一种),两者构成定语关系。由此看出,基于依存关系编制的句法树清晰地揭示出了词与词之间的依存关系、结构层级(依存方向)及句法功能。

(二) 名词在STR树库中的数量及功能构成分布

无论是汉语、英语、俄语、法语、德语、西班牙语还是其他语言,在绝大多数人类语言的语法书中,名词都是最先描述的词类。这并非偶然,因为“名词表示的事物是广义的,包括物体的名称,人的名称,物质的名称,动物和生物的名称,事实、现象、事件的名称,以及当作独立事物看的非过程性与过程性特征(性质、动作、状态)的名称”[13]248。换言之,世界是由事物构成的,而名词则是万物表述的载体。

哈德森(R.Hudson)指出,“书面英语中……有47%是名词……”①。刘海涛根据自建树库对词类频率进行统计,得出汉语名词(包括代词)占书面用语的4147%[7]251。在俄语句法树库中,名词的使用频率同样高居榜首。

① 转引自刘海涛《依存语法的理论与实践》,(北京)科学出版社2009年版,第252页。

② 传统语法中,俄语有10大词类,树库根据编制需要,调整为12类,代词被拆开并入名词或形容词,另增的3类数量很少,且与词类的句法功能鲜有关联,所以不列入研究范围。参见信德麟、张会森、华劭编《俄语语法》,(北京)外语教学与研究出版社1990年版。本文所涉及的9大词类采用通用的缩写词,对应如下:S=名词,V=动词,PR=前置词,CONJ=连接词,A=形容词,ADV=副词,NUM=数词,PART=语气词,INTJ=感叹词。如图2所示,在各词类中,无论是充当支配词还是从属词,名词的出现频率都遥遥领先。数据显示,在树库的58 270个支配词中,名词有24 427个,占4192%;其次是动词,有18 318个,占3144%。两者相加,占到了支配词总数的7336%。而在50 662个从属词中,名词有20 276个,占4002%;其次是动词和形容词,各有7 558个和7 492个,占1492%和1479%。这表明名词具有重要的句法地位,因为名词充当从属词的数量意味着它在整个文本中所占的数量,而充当支配词的数量即为其占主要地位依存关系的数量。表1为树库中的依存关系列表,可以从另一个角度证明这一点。

树库共有60种依存关系,总计50 662个。位列前4位的分别是定语关系、第一补足语关系、前置词短语关系和述谓关系,分别占1369%、1292%、1150%和991%。在这些依存关系中占主导地位的结构分别是:A(w)+S(g), V(g)+S(w), S(g)+S(w),PR(g)+S(w)。在定语关系中,A(w)+S(g)结构有6 003个,占定语关系的8655%,其中名词是支配词。第一补足语关系的主要结构是V(g)+S(w)和S(g)+S(w),前者有2 539个,占3879%,支配词是动词,从属词为名词;后者有1 534个,占2344%,支配词和从属词均为名词。构成前置词短语关系的支配词100%为前置词,且绝大多数为PR(g)+S(w)结构,在该依存关系的5 828个构成中,从属词为名词的有5 659个,占9710%。构成述谓关系的主要是V(g)+S(w)结构,共计3 769个,占7509%,支配词为动词,从属词为名词。由此可见,在这些出现频率较高的依存关系中,名词都是不可或缺的组成部分,或者充当支配词,或者充当从属词,从而成为依存关系构成的重要词类。这也充分证明了名词在发挥句法功能中的核心作用。

基于以上分析,本文选取名词为研究对象,以STR树库为研究数据的来源。我们从STR树库中随机选取了3 509个句子,形成了一个便于操作的含有54 170个词次(不计标点符号)的俄语依存树库,该树库平均句长1768个词。我们从树库中提取了名词充当支配词时的相关数据并对之进行统计分析。由于名词支配从属词构成的是名词结构,因此,通过分析可以得到名词结构的词序特征及其句法功能。

二、 名词结构的词序分析

“通常有一种说法,认为俄语中的词序是自由的,句子成分在句中是没有固定位置的。”[14]117对这种看法,语法编写者指出,俄语中的词序在很大程度上取决于其在不同语体中发挥的功能[13]575[14]117。那么,俄语的词序究竟有哪些特征?它到底有多大的自由度?为了找到这些问题的答案,我们首先计算出树库中词与词之间的依存距离,之后,对这些数据进行统计和分析。

“依存距离指的是支配词和从属词之间的线性距离,即一个句子中存在依存关系的两个词之间的词位置之差。”[7]252据此,如果从属词位于支配词前,则该值为正向,反之则为负向。我们也可以将依存关系的这种前后特征称为它的依存方向。利用一种语言中所含这两种方向不同的依存关系的比例,可以研究语言的语序类型特征[15]1569。在STR树库中,依存距离大于等于1(即支配词位于从属词之后)的有18 034个,小于等于-1(即支配词位于从属词之前)的有32 629个。这说明俄语是一种从属词后置的语言,有64.41%的从属词位于支配词之后。这与汉语的句法结构恰好相反。统计数据表明,“汉语是一种偏向于支配词居后的混合型语言……只有三分之一的从属词位于其支配词之后”[7]255。俄语名词的句法结构同样反映出这种后置的特征,这点可以从图3中看出。

在图3中,0以上为居于名词之前的从属词分布,0以下为居于名词之后的从属词。无论是正向还是负向,主要集中在0上下,即紧靠支配词的位置,虽然支配词和从属词的依存距离最大可达36和-39,但为数不多;此外,负向的面积明显要大得多,即后置的从属词远多于前置的从属词。为了作出更精确的分析,我们将图3的相关数据列在表2中。

表2显示,当支配词为名词时,同样是从属词后置居多,有8 901个,占5288%;从属词前置的有7 930个,占4712%。这种分布特征与树库中所有词类的整体分布情况吻合。另外,绝大多数从属词与支配词相邻,即从属词直接位于支配词之前或之后(依存距离等于1或-1)。依存距离为1的有6 172个,占所有正向依存距离从属词的7783%;依存距离为-1的有4 769个,占所有负向依存距离从属词的5358%。总体而言,俄语名词同其从属词之间的依存距离并不大,平均依存距离为157,其中正向的平均依存距离为147,负向为208。

那么,从属词前置或后置是否有一定的规律?是否与名词结构的句法功能有关?我们对受名词支配的从属词词类进行了统计,结果见图4和表3。

名词充当支配词的总数为16 831个。图4显示,受其支配的从属词囊括所有9大词类。数量最多的是形容词,有6 136个,占3646%;其次是名词,有5 719个,占3398%;之后是前置词和动词,分别为1 521个和1 229个,占904%和730%。这说明名词结构的内部构成类型主要有:形容词(包括代形容词)+名词;名词+不带前置词的名词间接格;名词+带前置词的名词间接格;名词+动词(动词不定式或形动词)。

表3列出了名词结构主要类型的构成及其依存距离。数据表明,当支配词是名词时,主要句法结构为S(g)+A(w) 和S(g)+S(w),这两种结构占所有名词句法结构的7044%;其次是S(g)+PR(w)和S(g)+V(w),这与名词的指物特性相关,因而受其支配的从属词通常表示该事物的所属或限制特征。当从属词为形容词时,构成支配词名词的一致定语,表示其特性;当从属词为名词、前置词或动词时,构成名词的非一致定语,表示事物的所属、性质或行为的直接补语(当支配词是动名词时)。

在S(g)+A(w)结构中,正向依存距离占压倒性多数,有5 922个,占9651%,依存距离的均值为129。在前置的从属词中,大部分与支配词相邻,即直接位于支配词之前,其依存距离等于1,有4 919个,占所有正向从属词的8306%。如:последние(最新的)[w] исследования(研究)[g], известный(著名的)[w] ученый(科学家)[g],свое(自己的)[w] имущество(财产)[g]。与此相比,从属词后置的只有215个,其中依存距离为-1的有91个,如:время(时代)[g] это(这个)[w], мысль(想法)[g] такую(这种)[w], вопросы(问题)[g] кардинальные(根本的)[w]。负向的依存距离均值为-285,S(g)+A(w)结构的平均依存距离为134。由此可以看出,俄语同汉语一样,形容词说明名词时通常应前置,构成一致定语;但与汉语不同的是,俄语的形容词还可以后置,这种词序通常是一种修辞手段,发挥特殊的句法功能,突出强调人或事物的特征,或具有口语色彩等。

与S(g)+A(w)相比,S(g)+S(w)结构的从属词则以后置居多。依存关系为负向的有5 217个,占9122%,并且同样以相邻词序为多,依存距离为-1的有2 845个,占后置名词总数的5453%。如:экспорт(出口)[g] продукции(产品)[w],проблема(问题)[g] утечки(流失)[w],спасение(挽救)[g ]усадеб(庄园)[w]。但间隔词序也不少,不过以中间间隔1个词的为主,依存距离为-2的有1 536个,占29.44%。如:лауреаты(获得者)[g] ...премий(奖项)[w],воссоздание(重建)[g] ...памятника(纪念碑)[w],уменьшение(减少)[g] ...числа(数量)[w]。后置从属词与支配词的依存距离均值为186。前置从属词只有503个,其中依存距离为1的有229个,占前置从属词总数的45.53%,其均值为2.49。可见,在名词修饰名词组成名词结构时,正常的词序是从属词后置。此外,其平均依存距离为192,比S(g)+A(w)结构的依存距离大,这意味着前者的结构不如后者紧密。

充当从属词构成名词结构的还有前置词和动词不定式。这两种结构同第二种结构一样,从属词通常为后置词序。如表3所示,当前置词修饰名词构成S(g)+PR(w)结构时,主要位于名词之后,依存距离为负向的有1 467个,占9645%,其中两个词相邻的词序有1 089个,占后置前置词的7423%。如:транзит(运输)[g] между(……之间的)[w] ...,информация(信息)[g] по(……方面的)[w] ...,участиe(参加)[g] в(在……里)[w] ...。后置前置词与名词之间的依存距离均值为161。修饰名词的前置词极少位于名词之前,且依存距离较大,其均值达541。S(g)+PR(w)结构的依存距离均值为174。而在1 229个修饰名词的动词中,后置的有847个,占6892%,如:возможность(可能性)[g] видеть(看见)[w],способ(方法)[g] найти(找到)[w],желание(愿望)[g] довести(做到底)[w]。但直接位于名词之后的只有80个,仅占后置动词的945%,依存距离等于-2的却有234个,等于-3的有158个,因此,其依存距离的均值较大,为425。前置的383个动词则以相邻词序为主,依存距离等于1的有217个,占5666%,其依存距离的均值为202。S(g)+V(w)结构的依存距离均值为355,充分证明俄语的曲折语特征为其较为灵活的词序提供了便利条件。

通过对名词结构主要构成的分析,我们验证了传统语法的以下两点定论,并使这些定论更为精确:(1)当形容词充当从属词修饰名词时,从属词通常为前置词序;而当修饰名词的是名词、前置词或动词时,则多为后置词序;(2)俄语词序的自由是相对的,从属词基本倾向于同支配词相邻,其位置也相对固定,即使词序发生变化,也取决于是否发挥特殊的修辞功能。借助对名词结构中支配词和从属词之间依存距离的统计分析,我们确定了名词结构不同构成的紧密度排列,其中紧密度最大的是名词支配形容词的结构,最小的是名词支配动词的结构。此外,通过与汉语中名词结构的对比,我们从类型学上证明俄语名词结构的词序较为自由,且依存距离较大。

三、 名词可支配的依存关系特征

(一) 名词支配的依存关系分布

如果说从名词与其从属词的依存距离可以分析名词结构的词序特征,那么,通过对名词可支配的依存关系的统计分析,可以研究名词结构的句法功能特点。统计数据表明,名词结构中,名词与修饰名词的从属词之间可以构成的依存关系有47种,是所有词类中最多的 其余8大词类可支配的依存关系数量分别为:V(36),A(30),ADV(25),NUM(16),PR(16),CONJ(14),PART(6),INTJ(1)。。图5所列为其中比例高于2%的依存关系。

如图5所示,位列第一的是定语关系,有6 815个,占4049%,这意味着在名词支配的依存关系中,由形容词充当从属词构成的一致定语关系是最活跃的关系。如:белые(白色的)волосы(头发), честный(兢兢业业的)работник(工作人员), черный(黑色的)лебедь(天鹅)。其次是由名词充当非一致定语构成的准施为关系,即从属词是支配词的行为或事物主体。如:стратегии(策略)развития(发展的), заявление(申请书)Николая(尼古拉的), число(数量)жителей(居民的)。这种关系有2 112个,占1255%。与准施为关系旗鼓相当的是第一补足语关系,从属词同样以名词为主,构成支配词的第二题元即其直接补语,填补述谓词的配价。从属词中有不少名词是动名词,此外,也有前置词和动词不定式。如:принятие(作出)решения(决定), страсть(迷恋)к...(对……), задача(任务)догнать(赶上)。这种依存关系有2 111个,占1254%。紧随其后的是限定关系,有1 167个,占693%。名词和从属词构成非一致性定语,修饰名词的从属词有名词间接格形式、前置词和副词。如:сотрудничество(合作)между(在……之间的);специалисты(专家) университета(大学的); конструкция(结构) протяженностью(长达……的) 。

如果说上述四种依存关系均为定语结构,从属词对支配词具有限定功能,那么在随后的并列、同位语、数量、相关以及限制性等依存关系中的功能就不同了。在并列依存关系中,从属词绝大多数是并列连接词,由该并列连接词支配的从属词同支配连接词的名词构成同位语关系,如:образование(教育)и(和),цифры(数字)или(或),алкоголизм(酗酒)либо(或者)。同位语依存关系中,从属词和支配词构成人名或同位语的两个组成部分,如:Елизавета(伊丽莎白)Николаевна(尼古拉耶夫娜),Вадим(瓦吉姆)Дубнов(杜布诺夫),врач(医生)Михаил(米哈伊尔)。数量依存关系的从属词均为数词,表示确定或模糊的数量意义,从属词始终位于支配词之前,如:десять(十)лет(年),несколько(几个)сетей(网络),120 рублей(卢布)。相关依存关系中,从属词是从句的最高点,因而通常是从句的述谓词,如:цель(目的)..., ... должен(应该)...;фонд(基金)..., ...выделяет(分配)...;день(日子) ..., ...президент(总统)...。而限制性依存关系体现了语气词的区分限制功能,充当从属词的语气词起到限制或突出强调支配词的作用,如:только(只有)члены(成员), даже(甚至)предположения(推测), просто(就是)освобождение(解放)。

以下将详细分析上述依存关系中的前四种类型,在数据统计的基础上揭示各种依存关系中的词类分布、依存方向、依存距离以及句法功能 因从属词词类比较集中,以下表格中仅列出前三种词类,具体分析则集中在其中的高频词类上。。

(二) 名词支配的定语依存关系特征

表4表明,在定语依存关系中发挥功能的主要是一致性定语,以A[w]+S[g]及V[w]+S[g]结构为主,前者是由形容词修饰名词构成的一致性定语,有6 003个,占8809%;后者由动名词修饰名词构成一致性定语,有658个,占966%。两者相加,占到了从属词总数的9775%。

在A[w]+S[g]结构中,前置的形容词占压倒性多数,有5 910个,占9845%;其中以与支配词相邻的为主,依存距离等于1的有4 915个,占前置形容词的8316%。如:научное(科研的)предприятие(企业),наши(我们的)отношения(关系),первые(最初的)шаги(几步)。后置的形容词很少,它们通常发挥实义切分功能,起到强调从属词的作用,此时,形容词修饰的名词语义较为概括。如:вещь(物品)дорогая(贵重的),дело(事情)политическое(政治上的)。此外,某种特定结构中的形容词也要后置,如:ничего(没有什么)плохого(不好的),чтонибудь(任何事)рискованное(冒险的),нас(我们)всех(大家)。

在V[w]+S[g]结构中,从属词大多是形动词,在句法功能上和形容词相同,但受动词性质的影响,在依存方向上与前一种结构有所区别。如表4所示,从属词位于支配词之前的有361个,占该结构总数的54.95%,略多于半数。可见,由该结构构成的定语依存关系的依存方向分布较为均匀。树库显示,依存距离等于1的有217个,如:устаревшие(陈旧的)законы(法律),описанная(所描述的)методика(方法),окружающий(周围的)мир(世界);最大的正向依存距离为11,如:назначенный(定于……的)...саммит(峰会)。依存距离等于-1的有3个,等于-2的则有201个。形动词后置时,通常支配一个短语,因此不能直接位于名词之后,而要用标点符号相隔,如:люди(人们), овладевшие(掌握……的);поэт(诗人), сделавший(作出了……的);боль(疼痛), вызванная(由……引起的);最大的负向依存距离达25,如:письмо(信) ...озаглавленное(题为……的)。依存距离为-1的形动词只修饰名词все(一切),如:все написанное(所写的), все попадающее(落下的), все приобретенное(所获得的)。

在表5所列的准施为依存关系中,支配词是由述谓词构成的名词,即动名词,从属词则实现该动名词的第一价,即指向行为主体。因此,从属词以名词居多,有2 048个,占9697%;还有为数不多的前置词和形容词。无论哪种词类修饰名词,都是后置词序为主。如表5所示,名词修饰名词的依存距离为负的有1 903个,占9292%;前置词和形容词修饰名词的数量虽然不多,但100%后置。这与名词在非一致性定语中发挥的功能有关,作为行为主体,通常位于述谓词之后,即使该述谓词构成动名词同样如此,如:отстутствие(缺席)министерств(各部委),существование(存在)цивилизации(文明),совместимость(相容)членов(各成员)。前置的从属词很少,而且均为在树库中划归名词的代名词,如:его(他的)жизнь(生活),их(他们的)работы(工作),ее(她的)деятельность(活动)等。

(四) 名词支配的第一补足语依存关系的特征

在支配词为名词的条件下,第一补足语依存关系连接的是动名词及其第二句法题元。如前所述,在准施为关系中,从属词指向支配词的主体,而在表6所列的第一补足语依存关系中,从属词则指向支配词的客体,如:распределение(分配)ресурсов(资源)。此外,这种依存关系的从属词也能发挥填补支配词其他配价的功能,如:работницы(工作人员)библиотек(图书馆),цена(代价)войны(战争)。树库的数据显示,充当从属词的主要是名词,有1 534个,占7267%,构成S+S结构;其次是前置词,有435个,占2061%,构成S+PR结构。两者相加,占到了从属词总数的9328%。这两种结构中,从属词均以后置为主。依存距离为负向的在S+S结构中有1 495例,占该结构的9746%,如:усиление(增加)интенсивности(强度),описание(描写)внешности(外表),метод(方法)визуализации(视觉化);前置的名词均为代名词,其性质决定它必须前置,如:его(他的)высказывания(话语)。依存距离为负向的在S+PR结构中有425例,占该结构的9770%,如:переписка(通信)с(和……),успехи(成就)в(……方面的),ответственность(责任)за(对……的);依存距离为正向的仅10个,如:к(对…) ...любовь(爱),за(对……) ...контроль(监督),на(靠) ...средств(资金),它们通常发挥交际功能或修辞功能。名词结构к ...любовь中的前置词发挥修辞功能,在语句中起到突出强调其从属词люди(人们)的作用;而结构 за ...контроль和на ...средств中的前置词则发挥交际功能,因为前置词短语是已知信息,因此被置于句首,构成语句的主位,而名词则是语句的重心,是新的信息,因而被置于句尾,构成述谓。

(五) 名词支配的限定依存关系的特征

表7显示,在限定依存关系中,充当从属词的主要有前置词和名词,前者有717个,占6144%;后者有400个,占3428%。从属于名词的前置词同时又构成另一个前置词短语的支配词,整个前置词短语起到修饰名词的作用,如:город(城市) у(……附近……) 。而充当从属词的名词通常为第二格或第五格形式,构成非一致性定语,如:доцент(副教授)МГУ(莫大);площадь(广场)размером(面积为……的)。

无论是前置词还是名词充当从属词,绝大多数均位于支配词之后。其中前置词充当从属词修饰名词的负向依存距离有709个,占该结构的9888%,如:технология(工艺) в(在……方面的),лампочки(小灯)для(用于……的),процессы(程序)по(……方面的);而正向依存距离的从属词仅有9个,而且最小的依存距离为3,即同支配词相隔较远。名词为从属词的负向依存距离有348个,占该结构的87%,如:метры(米)дистанции(距离),эксперт(专家)института(学院),биржа(市场)труда(劳务);而正向依存距离的从属词只有52个,基本为代名词,如:их(他们的)сотрудник(同事),его(他的)адвокат(律师),ее(它的)создатели(建造者)。

通过对名词可支配的依存关系的分析,我们证实了名词结构中最为活跃的句法功能是一致性定语和非一致性定语,并确定了一致性定语和非一致性定语在句法功能中所占的准确比例。此外,也从定量的角度揭示了名词结构的依存方向特征,通常情况下,一致性定语的依存方向为正,即从属词前置;非一致性定语的依存方向为负,从属词后置。

四、 结 语

综上所述,在语言学研究中,计量方法的运用有助于我们对语法现象作出精确的描述和分析,而根据依存语法编制的树库是计量研究的重要数据来源。本文提取了名词充当支配词的相关数据并结合具体问题进行分析研究,从计量分析的角度对传统语法的以下结论作出了精确的阐释:(1)俄语是一种从属词后置的语言,有64.41%的从属词位于支配词之后;(2)名词结构的主要类型为一致性定语关系和非一致性定语关系,它们在名词结构中所占的比例为4049%和3202%;(3)名词结构中,支配词和从属词的词序遵循一定的规律,A(w)+S(g)结构多为从属词前置的词序,占9845%,其余三种结构多为从属词后置的词序。此外,本文通过对名词结构的依存距离进行统计分析,发现了各种结构词与词之间不同的紧密度。而通过对频率较高的依存关系的构成进行分析,证明了名词在句法功能中的重要作用。如果说动词是“形成句模的核心元素”[7]54,那么,名词就是句模实例化及形成依存关系的主角。

由于STR树库包含的文本类型很多,有文学作品、新闻报道、日常口语、科技论文等不同语体的语料,本文在数据的采集和分析过程中未作区分,因此,根据这些数据得出的结论带有普遍性。在下一步研究中,可以将不同语体的文本分类进行分析,对名词在各语体中的句法特征作出更为精细的阐释,从而通过与其他语言的比较发现语言的个性和共性。

[参 考 文 献][1]Б.И.Ярхо, Методология точного литературоведения.Избранные труды по теории литературы, Москва:Языкислав, 2006.[B.I.Yarcho, The Methodology of Precise Literary Study, Selected Works on Literary Theory, Moscow: Yazykislav, 2006.][2]А.М.Белов,″Феномен квантитативной ритмики в современных фонологических теориях,″Вопросы языкознания, No.5(2010), pp.25

43.[A.M.Belov,″Treatment of Quantitative Rhythmics in the Modern Linguistic Theories,″ Journal of Linguistics, No.5(2010), pp.25

43.] [3]А.А.Кретов, И.А.Меркулова & В.Т.Титов,″Проблемы квантитативной лексикологии славянских языков,″ Вопросы языкознания, No.1(2011), pp.52

65.[A.A.Kretov, I.A.Merkulova & V.T.Titov, ″Issues in Slavic Quantitative Lexicology,″ Journal of Linguistics, No.1(2011), pp.52

65.][4]В.И.Подлесская,″Структурная и линейнопросодическая целостность именных групп по данным корпусного исследования: сочиненные и комитативные группы с личным местоимением первого лица в русском языке,″Вопросы языкознания, No.1(2012), pp.42

65.[V.I.Podlesskaja,″Structural, Linear and Prosodic Integrity of NPs: Coordinate and Commutative Constructions with 1st Personal Pronouns in Russian (A Corpusbased Study),″ Journal of Linguistics, No.1(2012), pp.42

65.][5]G.K.Zipf, The PsychoBiology of Language: An Introduction to Dynamic Philology, London: G.Routledge & Sons Ltd., 1936.[6]刘海涛、黄伟: 《计量语言学的现状、理论与方法》,《浙江大学学报(人文社会科学版)》2012年第2期,第178

192页。[Liu Haitao & Huang Wei,″Quantitative Linguistics: State of the Art, Theories and Methods,″ Journal of Zhejiang University(Humanities and Social Sciences), No.2(2012), pp.178

192.][7]刘海涛: 《依存语法的理论与实践》,北京:科学出版社,2009年。[Liu Haitao, Dependency Grammar: From Theory to Practice, Beijing: Science Press, 2009.][8]Liu Haitao,″Probability Distribution of Dependencies Based on Chinese Dependency Treebank,″ Journal of Quantitative Linguistics, No.3(2009), pp.256

273.[9]Liu Haitao, Zhao Yiyi & Li Wenwen,″Chinese Syntactic and Typological Properties Based on Dependency Syntactic Treebanks,″ Pozna Studies in Contemporary Linguistics, No.4(2009), pp.509

523.[10]高松: 《基于依存树库的现代汉语名词语法功能的计量研究》,《华文教学与研究》2010年第2期, 第54

60页。[Gao Song,″A Quantitative Study on Syntactic Functions of Nouns in Mandarin Chinese Based on Chinese Dependency Treebank,″ TCSOL Studies, No.2(2010), pp.54

60.][11]Ю.Д.Апресян и др.,″Синтаксически и семантически аннотированный корпус русского языка: современное состояние и перспективы,″ В кн.: Национальный корпус русского языка: 2003

2005 ― Результаты и перспективы, Москва: Индрик, 2006, pp.193

214.[V.Y.Apresyan,″The Syntactic and Semantic Annotated Russian Corpus: The Modern State and the Prospects,″ in Russian National Corpus: 2003

2005 ― Results and Prospects, Moscow: Indrik, 2006, pp.193

214.][12]И.А.Мельчук, Опыт теории лингвистических моделей 《СМЫСЛ ТЕКСТ》, Москва:Школа 《Языки русской культуры》, 1999.[I.A.Meluk, The Practice of the Theory of ″Meaning Text″ Linguistic Model, Moscow: Наука, 1999.][13]信德麟、张会森、华劭编: 《俄语语法》,北京:外语教学与研究出版社,1990年。[Xin Delin, Zhang Huisen & Hua Shao(eds.), Russian Grammar by the Academy of Sciences of the USSR, Beijing: Foreign Language Teaching and Research Press, 1990.][14]王德孝等编: 《现代俄语理论教程》下册,上海:上海外语教育出版社,1992年。[Wang Dexiao et al.(eds.), Theory Course of Modern Russian(Ⅱ), Shanghai: Shanghai Foreign Language Education Press, 1992.][15]Liu Haitao,″Dependency Direction as a Means of Wordorder Typology: A Method Based on Dependency Treebanks,″ Lingua, No.6(2010), pp.1567

1578.

上一篇:搭建沟通桥梁实现合力育人 下一篇:干旱区PS加固土建筑遗址风化耐久性现场试验研...