词汇判断中汉语多义词识别的优势效应

时间:2022-09-28 11:28:09

词汇判断中汉语多义词识别的优势效应

摘要运用词汇判断任务,考察了汉语双字词识别中的多义性效应。实验一运用2个真字任意组合构成的假词(如:镜社)作填充材料,发现多义词识别的优势效应仅仅存在于错误率中。实验二运用与源真词(如:冲锋)同音形似的假词(如:冲烽)作填充材料,促使被试更多地在语义水平上做出判断,结果发现很强的多义词识别的优势效应,这种效应主要表现在低频词上。两个实验结果表明,在词汇判断中用不同的假词作填充词会影响被试的词汇判断策略,从而在不同水平上通达词义。最后,用反馈模型对实验结果进行了解释。

关键词多义词,多义性效应,词汇判断,反馈模型。

分类号B842.1

1引言

多义词的识别问题是认知心理学中争论较多的一个问题。这一问题的探讨对于建立心理词典中语义的提取机制、形成多义词识别的模型,解决智能机器翻译的一个难点――多义词的翻译问题具有重要的理论意义。研究发现,对多义词的识别快于单义词或少义词[1~5]。这就是多义词识别的优势效应。

在拼音文字中,研究多义性(意义数)效应最常用的是词汇判断任务。研究发现,在合法非词(legal nonword)和同音假词(pseudohomophones)作填充词的条件下,有多义词效应;而在不合法非词(illegal nonword)条件下则没有多义词效应[5]。用合乎正字法规则的假词作填充材料,观察到了多义词优势效应;而用不合乎正字法规则的非词作填充材料,没有发现多义词识别的优势效应[2]。由此可见,多义词优势效应发生在语义水平上,而不是发生在正字法水平上。研究还发现,词的多义性和词频之间没有交互作用,即高、低频词都产生了多义词识别的优势效应[3]。

汉语多义词不同于拼音文字中的多义词。汉字是表意文字,不存在拼音文字中的形音对应规则;汉语双字多义词是由两个词素构成的,词素的特点可能会影响到整词的通达;每个词的意义数比英语词少得多。因此,用词汇判断任务研究在语义水平上是否存在汉语词汇识别的多义性效应,不能照搬拼音文字中常用的同音假词,而应当用2个真字随机混合产生的假词(在形、音上都不与任何真词相似,如:铄钮),或与源真词形似的假词(形似、但发音不与任何真词相同,如:予盾),或与源真词音同(或音近)、且形似的假词(如:优郁)。同音假词(与源真词不同形,也不形似)不能使被试通达源真词的语义,因而不会影响被试的词汇判断策略。而形似假词(假词与源真词形似)将会影响被试的词汇判断策略。使用形似假词比使用非形似假词时,被试对真词的反应将更慢。

基于上面的讨论,本研究要考察的问题是:在不同的假词条件下(实验一采用2个真字任意组合产生的假词,实验二采用与源真词形似同音的假词),被试在词汇判断任务中是否存在多义词识别的优势效应?这种效应可能的机制是什么?

2实验研究

2.1实验准备

2.1.1刺激词的初步选择

采用与Kellas[1]、Hino[3]、陈宝国等[6]人类似的方法来确定多义词。首先,从《现代汉语词典》[7]中选择出多义词;然后,参照《现代汉语多义词词典》[8],删除在词典定义中有争议的多义词;最后,根据《现代汉语频率词典》[9],从《现代汉语词典》中与每个多义词逐一配对选择首字声母的发音相同,词频、具体性、首字频、首字笔画数、末字频、末字笔画数相当的单义词。初步选定180对多义词和单义词。

2.1.2对刺激词的主观评定

为确信所选的词具有心理上的有效性,分3次请被试评定了词的多义性、熟悉性和具体性。将360个词编成问卷,请20名北京师范大学的本科生对每个词的意义数进行5点量表的主观评定,将评定为多义词的人数比例超过80%,且所有被试评定的词的平均意义数超过1.8的词作为“多义词”,将评定为多义词的人数比例小于20%,且所有被试评定的词的平均意义数小于1.5的词作为“单义词”。结果得到96对多义词和单义词。其次,先后各请20名北京师范大学的本科生对上述96对多义词和单义词的熟悉性、具体性进行7点量表的主观评定。在评定词的具体性时,由于多义词可能同时具有具体的和抽象的意义项,被试以自己最先想起的那个意义项来确定这个词的具体性,而不必将几个意义项的具体性的评估值平均化。

2.1.3对刺激词的统计处理和匹配

从96对多义词和单义词中选择80个词,平均分成4组,4组词的特征数据见表1。2个实验的自变量为词频和多义性,因变量为反应时和错误率。

为确信4组词的实验条件得到严格的匹配。用2(高频、低频)×2(多义、单义)的方差分析对词频、首字频、首字笔画、末字频、末字笔画、熟悉性、具体性、平均意义数进行了统计处理。对词频分析的结果表明,频率主效应显著,F(1,19)=39.971,p<0.001(此处及以后的分析之显著性水平设置为0.05);多义性主效应不显著,F(1,19)=0.274,p>0.1;二者的交互作用不显著,F(1,19)=0.174,p>0.1。对熟悉性的评估值的分析表明,频率主效应显著,F(1,19)=22.606,p<0.001;多义性主效应不显著,F(1,19)=0.076,p>0.1;交互作用不显著,F(1,19)=0.594,p>0.1。对具体性的分析结果表明,频率主效应不显著,F(1,19)=0.032,p>0.1;多义性主效应不显著,F(1,19)=0.006,p>0.1;交互作用不显著,F(1,19)=0.006,p>0.1。对多义性的评估值的分析结果表明,多义性主效应显著,F(1,19)=392.565,p<0.001;频率主效应不显著,F(1,19)=4.129,p>0.06,交互作用不显著,F(1,19)=0.241,p>0.1。在其它无关变量(首字频、首字笔画、末字频、末字笔画)的方差分析上没有发现有意义的差异。这说明,材料的匹配符合实验要求,即实验材料的高低频率、意义数(多义和单义)存在显著差异,其它无关变量得到了控制。

2.2实验一

考察用2个真字任意组合构成的假词为填充词时,词汇判断任务中是否存在多义词识别的优势效应。

2.2.1被试

29名北京师范大学的本科生,母语均为汉语,视力或矫正视力正常,被试参加实验获得少量报酬。

2.2.2实验设计与材料

采用2(高频、低频)×2(多义、单义)被试内设计。实验材料为40对多―单义词,其中20对为高频词,20对为低频词。80个填充词是用2个真字任意组合构造的双字假词,如“镜社”。各个双字词在实验中随机呈现。

2.2.3实验程序

被试坐在微机屏幕前,眼睛距离屏幕约50厘米,将右手的食指放在“是”键上,左手的食指放在“否”键上,要求被试尽量快而准确地判断屏幕中心出现的2个字符是不是词。是词,按“是”键,不是按“否”键。实验开始时,首先在屏幕中央出现一个“十”字形的注视点,持续时间约500毫秒,“十”字消失后立即呈现刺激项目,被试按键反应使刺激消失。计算机记录下刺激开始呈现到被试开始反应之间时间。正式实验前,被试进行10个项目的练习并得到反馈结果;正式实验后,被试不再得到反馈。

2.2.4结果与分析

数据处理中,当反应时小于300ms或大于1500ms时,当作错误处理。总计有8个数据(0.345%)被当作错误从反应时的数据中去掉。然后,去除平均数加减3个标准差以外的数据,总计有39个数据(3.48%)被去除。实验结果见表2。

对反应时数据进行两因素(多义性、词频)重复测量的方差分析,结果表明:词频主效应以被试为随机变量的方差分析显著,F1(1,28)=62.34,p<0.001;以项目为随机变量的方差分析显著,F2(1,19)=21.72,p<0.001。多义性主效应的被试分析不显著,F1(1,28)=0.08,p>0.1;项目分析不显著,F2(1,19)=0.164,p>0.1。词频与多义性的交互作用均不显著,F1(1,28)=0.507,p>0.1;F2(1,19)=0.07,p>0.1。

对错误率进行两因素重复测量的方差分析,结果表明:词频主效应被试分析显著,F1(1,28)=18.738,p<0.001;项目分析不显著,F2(1,19)=3.940,p<0.08。多义性主效应被试分析显著,F1(1,28)=23.256,p<0.001;项目分析不显著,F2(1,19)=4.189,p<0.06。词频和多义性的交互作用不显著,F1(1,28)=0.043,p>0.1;F2(1,19)=0.006,p>0.1。

实验一的结果表明:在词汇判断任务中,中文双字词的识别存在显著的频率效应,但多义词识别的优势效应仅仅存在于错误率中; 频率和多义性之间没有交互作用。

实验一用真字假词作填充词,被试在词汇判断中可能会形成某种策略,如可以根据构词规则、词形或音的熟悉性等做出真假词判断,不一定要通达真词的语义,因而在词汇判断中没有充分激活多义词的语义,多义词识别的优势效应在反应时中不明显。为了促使被试更大程度地通达语义,实验二改用了与源真词形似音同的假词为填充词。

2.3实验二

用与源真词形似音同的假词为填充词,进一步考察词汇判断中是否存在多义词识别的优势效应。

2.3.1被试

北京师范大学的29名本科生,母语均为汉语,其视力或矫正视力正常,被试参加实验获得少量报酬。

2.3.2实验设计与实验材料

实验设计、实验刺激材料与实验一完全相同。80个填充词为形似同音假词(由真字组成的、发音与某个真词相同,并且,通过至少改变源真词中的一个形似字使词形与源真词相似。如:冲烽,拉圾),80个假词按所对应的真词的频率和多义性也分为4组。各个双字词在实验中随机呈现。

2.3.3实验程序

同实验一完全相同。

2.3.4结果与分析

数据处理中,当反应时小于300ms或大于1500ms时,当作错误处理。总计有17个数据(0.733%)被当作错误反应从反应时数据中去掉。然后,去除平均数加减3个标准差以外的数据,总计有34个数据(1.47%)被去除。实验结果见表3。

对反应时数据进行两因素(多义性、词频)重复测量的方差分析,结果表明:词频主效应显著,F1(1,28)=56.5,p<0.001;F2(1,19)=12.25,p<0.05。多义性主效应显著,F1(1,28)=12.888,p<0.001;F2(1,19)=7.494,p<0.05。两者交互作用的被试分析临界显著,F1(1,28)=2.965,p<0.1;项目分析不显著,F2(1,19)=0.178,p>0.1。进一步的简单效应检验表明,多义性主效应在高频词中被试分析不显著,F1(1,28)=3.26,p=0.08,项目分析不显著,F2(1,19)=1.58,p>0.1;在低频词中被试分析显著,F1(1,28)=10.23,p<0.05;项目分析临界显著,F2(1,19)=3.45,p>0.05。

对错误率数据进行两因素重复测量的方差分析,结果表明:词频主效应显著,F1(1,28)=60.826,p<0.0001;F2(1,19)=5.974,p<0.05。多义性主效显著,F1(1,28)=56.901,p<0.0001;F2(1,19)=10.137,p<0.01。两者交互作用的被试分析显著,F1(1,28)=19.016,p<0.0001;项目分析不显著,F2(1,19)=2.102,p>0.1。进一步简单效应检验表明,多义性主效应在高频词上的被试分析显著,F1(1,28)=4.55,p<0.05,项目分析不显著,F2(1,19)=0.92,p>0.1;在低频词上均显著,F1(1,28)=62.40,p<0.0001,F2(1,19)=6.65,p<0.05。

实验二反应时和错误率的分析结果表明了显著的多义词识别的优势效应,且主要表现在低频词上,高频词上效应很微弱。与实验一相比,实验二在与源真词形似音同的假词条件下,被试难以从词形和词音上做出真假词判断,不得不更多地通达词的语义,并利用语义的反馈作用对词的形、音进行校对。词的语义在词汇判断中的作用或权重增加了,在这种条件下出现了显著的多义词效应。

3综合讨论

实验一发现了显著的词频效应,但多义词识别的优势效应仅仅存在于错误率中。这一结果与前人的研究结果基本一致[6]。当填充词是由真字构成的假词时,如“叉婷”,被试可以凭借字形或字音的“熟悉性”判断它为假词,不一定要通达真词的语义,因而词汇判断中语义激活的程度可能不高。

实验二发现,多义词识别的优势效应主要表现在低频词中,高频词中效应很微弱。这和汉语中多义词识别的优势效应的有关研究结果[6]基本一致,而和Hino等的研究结果[3]不完全一致。原因可能是,在两者的实验材料中,高、低频率的切分标准存在差异。在Hino的材料中,高低频的切分值是10/300万,高、低频词的平均频率分别为38.60、3.12;而在我们的实验材料中,高低频的切分值是30/131万,高、低频词的平均频率分别为103.50,10.85。前者的高频词的频率明显偏低,这可能是高频词也存在多义词识别的优势效应的原因。

在拼音文字中,有关多义性效应的理论模型主要有两类:局部表征模型和分布表征模型。局部表征模型假定,词汇信息被表征在与单个词汇对应的特定单元里,多义词识别的优势效应是因为多义词得益于心理词典中的多个词条(entries)。分布表征模型[4]假定了词的形、音、义3种水平的单元,每个水平都包含有分布表征,不同单元通过隐单元互相联结。例如,Hino和Luper提出反馈模型(the feedback accounts),认为多义词产生较多的语义激活,语义激活又反馈到语音单元和正字法单元,导致多义词在正字法单元更高水平的激活,词汇判断主要基于正字法单元的激活[3]。按照这种解释,当用不合法的非词或假词作填充词(如实验一)时,词汇判断较容易,反馈没有多大影响;而当用形似假词或同音形似假词作填充词时(如实验二),被试难以从语音和词形上做出真假词判断,不得不更多地通达词的语义,在迅速激活源真词的语义表征后,利用语义的反馈作用对词的形音进行校对,语义激活的增加使从语义到正字法或语音的反馈激活增加,因而引起了更显著的多义词识别的优势效应。

为什么多义词识别的优势效应只发生在低频词中?我们认为,高频词形、音的联结较强,它倾向于独立表征、整词通达[10],词形很熟悉,识别很迅速。词的语义的反馈激活来不及发挥作用,真假词判断就已经完成了。相比之下,低频词是分解表征和通达的[10],词形不熟悉,形、音间的联结较弱,仅仅根据形、音难以完成判断任务,语义反馈激活充分发挥了作用,故显示了较强的多义词识别的优势效应。

实验后发现,本研究没有控制意义项间的相关性[11],也没有控制词素的语义数和语义透明度。这些因素都可能影响到词汇判断的反应时。为了进一步分析本实验材料意义项间的相关性,我们把多义词的所有意义分别进行两两配对,然后请北京师范大学的28名大学生进行了七点量表的意义联系程度的主观评定(1代表意义联系程度很低,7代表意义联系程度很高)。最后算出各配对评定等级的平均数,作为意义间联系程度的指标。结果表明,高、低频多义词的意义联系程度评定值分别是3.77和4.39,两者差异显著,t=-2.725,p<0.05,因此,低频词中的多义性效应也可能是低频词中语义相关性更强引起的,或者多义性与语义相关互作用的结果。

4结论

(1)在词汇判断任务中,当用2个真字任意组合构造的假词作为填充词时,发现多义词识别的优势效应仅仅存在于错误率中。

(2)当用与源真词形似同音的假词作为填充词时,发现了很强的多义词识别的优势效应,且主要表现在低频词中,多义性和词频存在交互作用。

参考文献

1 Kellas G, Ferraro F R, Simpson G B. Lexical ambiguity and the time course of attentional allocation in word recognition. Journal of Experimental Psychology: Human Perception and Performance, 1988, 14(4): 601~609

2 Borowsky R, Masson M E. Semantic ambiguity effects in word identification. Journal of Experimental Psychology: Learning, Memory and Cognition, 1996, 22(1): 63~85

3 Hino Y, Lupker S J. Effects of polysemy in lexical decision and naming-alternative to lexical access accounts. Journal of Experimental Psychology: Human Perception and Performance, 1996, 22, 1331~1356

4 Jastrzembski J E. Multiple meaning, number of related meaning, frequency of occurrence, and the lexicon. Cognitive Psychology, 1981, 13, 278~3059

5 Rueckle J G. Ambiguity and connectionist networks: Still setting into a solution: Commentary on Joordens and Besner(1994). Journal of Experimental Psychology: Learning, Memory, and Cognition, 1995, 21, 501~508

6 陈宝国, 彭聃龄. 汉语双字多义词的识别优势效应. 心理学报, 2001, 33(4): 300~304

7 现代汉语词典(修订本). 北京:商务印书馆, 1997

8 袁晖. 现代汉语多义词词典. 书海出版社, 1990

9 现代汉语频率词典. 北京: 北京语言学院出版社, 1986

10 王春茂, 彭聃龄. 多词素词的通达表征:分解还是整体. 心理科学, 2000, 23(4): 395~398

11 Azuma T, Van Ordan G C. Why SAFE Is Better Than FAST: The relatedness of a word′s meaning affects lexical decision time. Journal of Memory and Language, 1997, 36, 484~504

上一篇:句子加工中语义关联性和句法歧义性实验研究 下一篇:信息表征形式对解决贝叶斯推理问题的影响