新疆少数民族预科生汉语口语中介语语料库建设的构想

时间:2022-03-25 12:14:26

新疆少数民族预科生汉语口语中介语语料库建设的构想

摘 要:本文主要阐述了当前国内外中介语语料库建设的基本状况,建立新疆少数民族汉语口语中介语语料库的意义,以及建设的目标、内容、思路等。建设本语料库的意义主要在于:填补新疆地区中介语语料库建设的不足,为少数民族汉语口语教学研究提供详实的研究材料和科学定量研究的方法;为口语的教学、教材、测试等提供科学的参考依据。通过本语料库的建设,汉语口语教学与研究将走上更加严谨和科学化的道路。

关键词:新疆少数民族汉语 口语 中介语 语料库

一、中介语语料库建设的相关概念及状况综述

(一)中介语、语料库及语料库语言学

美国著名语言学家赛林克在1969年首次提出了“中介语”这一概念。“所谓中介语是指在第二语言习得过程中,学习者通过一定的学习策略,在目的语输入的基础上所形成的一种既不同于第一语言,也不同于目的语,随着学习的进展向目的语逐渐过渡的动态的语言系统。中介语的研究能帮助我们发现第二语言习得的不同发展阶段,探索学习者语言系统的本质,揭示第二语言的习得过程,以及第一语言对二语习得的影响。”①可以说对中介语的研究是第二语言习得理论研究的重要突破。“语料库是指一个按照一定的采样标准采集而来的,能够代表一种语言或者一种语言的变体或文类的电子文本集。而语料库语言学则是以语料库为基础的语言研究方法。”②语料库按照应用的方向可分为“通用型语料库”和“专用型语料库”;按用途,可分为“笔语语料库”和“口语语料库”;按语言属性,可分为“单语”“双语”“多语语料库”;按语言变体,可分为“本族语”“译语”“学习者中介语语料库”;按时间,可分为“共时”和“历时”语料库;按照语料状态,可分为“静态语料库”和“监控语料库”。本研究将要建设的语料库属于学习者的口语中介语语料库,是为汉语的第二语言口语教学服务的专用型语料库,所收集的语料属于单语共时语料。

(二)国内外研究现状述评

1.国外研究

中介语的研究离不开语料。最初中介语研究的语料大多数是研究者个人收集和统计的,很难对中介语进行科学的统计分析及定量研究。这就对中介语语料库的建设提出了要求。因此到了20世纪90年代,在计算机技术发展的基础上,中介语语料库建设也得到了快速发展。一大批关于第二语言学习者的中介语语料库先后建立。如:朗曼出版集团建立的“朗曼学习者语料库”、剑桥大学出版社建立的“剑桥学习者语料库”、美国蒙特克莱尔州立大学建立的“美国的英语学习者语料库”等。这些语料库的建设和使用为第二语言习得理论的新、英语在世界范围内的第二语言教学研究、教材编写等提供了有力的支持。

2.国内研究

(1)国内英语学习者语料库建设

在国外中介语语料库建设的影响下,国内中介语语料库的建设也蓬勃发展起来。其中英语学习者语料库建设走在了前列,取得了丰硕的成果。例如:1994年香港大学教育学院建立的“香港初中生英语教学语料库”;1996年何安平建立的“中国英语教育语料库”;1999年桂诗春、杨惠屮建立的“中国学习者英语语料库”;2005年杨惠中、卫乃兴建立的“中国学习者英语口语语料库”;2005年文秋芳、王立非、梁茂成等建立的“中国英语学生口笔语语料库”等。

(2)留学生汉语中介语语料库建设

与此同时,在对外汉语教学领域,以留学生汉语习得为基础的汉语中介语语料库也开始建设,经过20年的发展取得了一些成果。如:1995年北京语言学院建成的“汉语中介语检索系统”加工精语料104万字;北京语言大学“HSK动态作文语料库”,语料字数424万字;2008年中山大学“留学生中介语语料库”,加工字数近75万字;2009年南京师范大学“外国学生汉语中介语偏误信息语料库”共计收入各类语料90多万字;暨南大学华文学院“留学生汉语中介语语料库”规模达到300万字。以上大多为书面语语料库,近年来,口语语料库建设逐渐成为热点。目前有:北京语言大学的“汉语学习者口语语料库”;暨南大学华文学院的“留学生口语语料库”已建成,但均为生语料库;北京语言大学的“留学生动态口语语料库”;香港中文大学的“语言习得汉语口语语料库”正在建设中。

这些语料库的建设一方面为研究者提供了可靠的中介语语料,另一方面也促进了语言教学研究、教材建设、语言测试等工作的发展。使语言的研究和实践工作都建立在科学统计分析和定量研究的基础上,更加客观地反映语言学习者的习得规律和过程。

3.疆内的中介语语料库建设

疆内的中介语语料库建设也取得了一些成果。如:新疆大学建设的“中介语语料库”对维吾尔族学生学习汉语的语料进行了收集、输入、归纳、分析,建成了一个容纳100多万字的中介语语料库系统;伊犁师范学院建立的“哈萨克族学生汉语中介语语料库系统”共收集了50万字的哈萨克族学生的汉语语料,并对语料中的字、词、句、段落、篇章、语料属性进行了计算机处理,实现了机器检索和提取;新疆农业大学的“维吾尔语学习者中介语语料库”也正在建设之中。

虽然国内、疆内中介语语料库建设取得了一定的成果,但也存在一些问题。如:语料库总体数量较少、规模较小;书面语语料库多,口语语料库少;成熟公开的语料库很少,资源不能共享等。

二、新疆少数民族预科生汉语口语中介语语料库建设的意义

(一)本语料库建设可以填补新疆地区中介语语料库建设的不足,为少数民族汉语口语教学研究提供详实的研究材料和科学定量研究的方法。

通过大量资料研究,我们发现,目前第二语言的口语习得研究大都采用实证的方法,以计算机和其他仪器设备作为研究工具,最终研究成果的获得必须建立在对大规模语料库样本进行定量分析的基础上。因此,建立口语中介语语料库进行口语教学研究逐渐成为新的发展趋势。可是在汉语教学界,尤其是新疆汉语教学界,目前汉语口语中介语语料库还处于空缺状态,有关口语习得的研究,不仅数量质量稍显不足,而且大多数研究方法依然是沿袭传统。或者语料收集范围小,数量不足;或者抽样调查规模小,数据有限,导致研究结果缺乏说服力。因此,十分有必要建立具有一定规模的汉语中介语口语语料库。

(二)本语料库的建设可以为教学实践、教材编写、口语测试等提供科学的参考依据。

第一,目前我们的口语教学还具有一定的盲目性。教学者对学习者现有的语言状态缺乏了解,因此教学过程中的难点和重点都很模糊,简单的跟读和模仿常常解决不了学生的实际问题,最后的结果往往是,教师费了很大的力气,口语课堂很难组织,学生却感到自己的口语表达能力提高有限,课堂教学的有效性很差。通过汉语中介语的口语语料库,可以确定学生真正的问题在哪里,从口语的语音、词汇、语法、语气语调、表达手段等不同层面去发现问题,找到难点和重点,有针对性地解决存在的问题。

第二,目前使用的口语教材在编写方面也存在一些问题,主要表现为口语语料的选取随意性大,表达方式书面化,突出不了口语表达的特点和难点,一方面使得学生的模仿学习产生盲目性;另一方面解决不了实际使用中的问题。这种情况下,中介语口语语料库的真实语料能给教材的编写提供把握重难点的可靠依据。

第三,目前口语测试的随意性也很大,这与教材的随意性是一致的,考与学存在脱节现象,中介语口语语料库同样有助于增强考试的科学性。

三、本语料库建设的目标、内容、思路及图示

(一)建设目标

本研究的目标是建设一个以维吾尔族预科生为对象的汉语口语中介语语料库。根据语料来源的不同,本语料库分为两部分,即“基于课堂的汉语口语中介语语料库”和“基于口语考试的汉语口Z中介语语料库”。第一部分语料以对话语料为主;第二部分语料以朗读和成段表达为主。这是一个为汉语的第二语言教学服务的专用型语料库,其基本特征是:来源广,涵盖高中低不同汉语水平,背景信息全、语料样本多、标注内容丰富,能够进行检索,能反映学生汉语口语的概貌和学生在预科阶段口语学习的过程,可以满足汉语口语教学和研究、教材编写等众多需求。

(二)建设内容

本语料库建设的内容主要包括:1.口语中介语语料库建设的本体研究,包括语料库建设标准、口语语料的转写规则、语料标注规范、语料管理软件和检索系统;2.口语语体研究;3.语料库整体设计;4.语料采集;5.口语语料转写;6.语料标注;7.语料检索;8.语料统计与分析。

(三)研究思路

少数民族预科生汉语口语中介语语料库的建设以中介语、语料库语言学的理论和方法为基础,搜集不同背景维吾尔族预科生的口语语料,转写为文本储存,然后利用计算机对语料属性、词汇、语法以及重复、停顿、修正等各种口语特征进行处理,形成熟语料,最终实现机器检索和提取,寻找维吾尔族预科生汉语口语中介语的特征和习得规律。1.语料收集对象主要是新疆高校维吾尔族预科生。2.语料来源是学生在口语课堂和口语考试中的对话、朗读、成段表达的内容。3.语料转写是将口语的录音和录像内容转写为文字形式储存。4.语料标注包括“基础标注+偏误类型标注”。基础标注是标注语料中正确的语言现象,包括:分词和词类标注;句型、句式、句类标注;停顿、重复、修正标注等。偏误标注则是对错误的标注。5.语料库结构主要包括生语料库、熟语料库、统计信息库、相关信息库等四部分。生语料库存放未经任何标注的语料,包括语音库和转写文本库。熟语料库存放经过标注加工过的中介语语料。统计信息库存放各种统计数据,比如词信息统计、各类语法范畴的统计、口语特征统计等。相关信息库存放学生相关背景信息和语料相关信息,学生背景信息包括:姓名、性e、族e、身份、年级、班级、所在学校、汉语等级等内容;语料信息包括:主题、时间、语料来源、语料类e等内容。6.语料库管理和检索,设计开发相应的管理软件和检索软件,便于对语料进行管理和检索。

四、结语

在新疆少数民族学生的汉语学习中,口语学习是薄弱环节,直接影响到了少数民族学生平等参与社会竞争的机会。根据统计分析发现,在大学预科班,一个班未通过汉语水平考试的学生中有大约60%是因为口语表达不过关。在毕业招聘中,少数民族学生因为汉语口语表达的问题而无法通过面试的情况屡见不鲜。这与我们重读写、轻听说的教学传统有关,也与我们的教学科研手段滞后有关。因此,现实需要我们采用更科学的方法深入研究口语习得的规律,探索有效的教学方法。而少数民族的汉语口语中介语语料库正满足了这一需要。本语料库建设将使汉语口语教学与研究走向更加严谨和科学化的道路。

(本论文为新疆维吾尔自治区十二五教育规划课题“新疆少数民族预科生汉语口语中介语语料库建设”[课题编号:145052]的研究成果。)

注释:

①王建新.计算机语料库的建设与应用[M].北京:清华大学出版

社,2005.

②杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,

2002.

参考文献:

[1]武金峰.关于建立“哈萨克族学生汉语中介语语料库系统”的设

想[J].伊犁教育学院学报,2002,(4).

[2]杨翼.建立汉语学习者口语语料库的基本设想[J].汉语学习,

2006,(3).

[3]张宝林.汉语中介语语料库建设的现状与对策[J].语言文字应

用,2010,(3).

[4]崔新丹.语料库偏误研究现状及新疆少数民族习得汉语语料库偏

误分析研究的价值[J].喀什师范学院学报,2011,(1).

[5]杨.建立维吾尔语中介语语料库基本设想[J].新疆大学学报

(哲学・人文社会科学版),2013,(3).

[6]张宝林,崔希亮.“全球汉语中介语语料库建设和研究”的设计

理念[J].语言教学与研究,2013,(5).

(于丽 新疆乌鲁木齐 新疆医科大学语言文化学院 830011)

上一篇:普京直播连线中模糊修辞的语用分析 下一篇:基于平行语料库的《论语》核心哲学术语翻译研...