“中文信息处理”实践教学探索

时间:2022-06-05 06:21:50

“中文信息处理”实践教学探索

摘要:从中文信息处理课程的特点出发,在分析课程实验案例的基础上,提出中文信息处理课程互动式教学法和项目教学法。结合课程资源建设等其他措施,在中文信息处理实验教学方面开展了有益的尝试,取得了良好的效果,受到学生好评,该课程目前已被评为校级精品课程。

关键词:中文信息处理;实践教学;互动式教学;项目教学法

采用计算机技术来研究和处理自然语言是20世纪40年代末、50年代初才开始的,50多年来,这项研究取得了长足的进展,成为当代一门重要的新兴学科――自然语言处理(Natural Language Processing, NLP)。我国在该领域的探索始于1956年俄汉翻译机的研究,至今已有50多年的历史。由于中文在诸多方面都与英文有很大差异,因此专门针对中文处理的学科――中文信息处理越来越受到研究者的关注。所谓“中文信息处理”指的是用计算机对汉语进行转换、传输、存储、分析等加工的科学。它是一门与语言学、计算机科学、信息论等学科相联系的边缘交叉性学科,是自然语言处理的一个分支。

在信息爆炸的时代,从大量文本信息中挖掘潜在的、有价值的信息成为研究热点。中文信息处理正是研究计算机如何理解中文的关键技术,包括中文文本理解的基本理论、方法和应用。国外著名大学,如MIT,Stanford,CMU等均开设了自然语言处理课程。目前,我国已有部分大学开设了该课程。我校开设“中文信息处理”课程已有10多年历史,该课程的目标是通过理论学习和实践教学,使学生系统地掌握中文文本处理的基本理论和方法,中文信息处理的具体应用,并引导学生了解中文信息处理方面的最新进展和发展趋势,为今后从事该领域的研究、开发奠定良好的基础。

针对该课程理论性强、研究性高和应用性广的特点,我们在广泛调研和总结授课经验的基础上,进行了一系列的课程建设工作,下文将介绍我校在该课程实践教学方面的一些探索和尝试。

1互动式教学

所谓“互动式”教学就是把教育活动看作是一种师生的交往和沟通,把教学过程看作是一个动态发展的教与学统一的交互影响和交互活动,通过师生的相互作用,形成和谐的师生互动强化,以产生教学共振,提高教学效果的一种教学模式[1-2]。

斯塔克等人认为,借助“听”的学习,有时是学习,而通过经历的学习几乎总是学习。这里包含了两层意思:一是,把课堂教学仅仅理解为教师讲解,学生听讲,这是非常片面的,而且教师讲了多少和学生学了多少并不确定,而仅仅是“有时候”学生学了。二是,代替教师讲解的办法有很多,而其中让学生经历解决问题,寻找答案的方法最为有效,因为,这个办法使学生“总是在学习”。很多研究都表明,教师讲解的内容中,学生当场能把握的是很少的。而经历学生的自行思考和寻找答案,进一步由老师点评的过程,学生对所学知识就会有更深的印象和更全面的理解,同时培养了学生探索式学习的好习惯[3]。

我校中文信息处理课以互动式教学理念为出发点,在理论讲授和实验环节均按照基本理论知识讲授学生寻找思考题答案(实验方案)老师点评助教个别辅导4个环节进行。基本理论知识讲授是保证有效互动的前提;老师给学生布置思考题或者实验是互动的一个重要步骤,思考题和实验的选择恰当与否是保证互动的关键;教师的合理点评是保证互动的必须;课后由助教个别辅导是互动成果巩固的保障。这种互动式教学可使学生更多地参与和接触实际,在参与寻找答案的经历中学习。在这种模式下,我们结合中文信息处理课程的重点和难点,设置了5个实验[4],由学生独立或分组完成,如表1所示。

以“自动分词”一章为例,说明我们的讲授过程:

1) 老师讲授该章节的主要内容,包括分词规范、分词词典的构造方法、基本机械分词方法(正向最大匹配、逆向最大匹配、邻近匹配、最短路径匹配等)等。

2) 布置课后思考题“请查阅资料找出现有的主要分词算法,并列出实现这些分词算法分别需要的资源(包括语料资源、是否需要词典、软件工具集等)”,每组学生(约4~5人)提交一份报告。

3) 在后续课堂上,老师总结学生提交的报告,对现有的多种分词算法进行全面总结。同时布置“自动分词”一章的实验作业“每个学生实现至少2种自动分词算法,并比较各算法的分词效果”。

4) 学生在纠正和补充已找到答案的基础上,根据自己的编程水平和现有知识程度,选择适合自己难易程度的两种算法加以实现。在实验完成过程中遇到问题,可以利用答疑时间或在网上向助教请教。

5) 挑选优秀的作业,请学生在课堂上讲解自己的实现过程。

这种互动式、探索式的学习过程,学生不仅可以更深入地理解教学内容,还可以了解到与本课程相关的研究进展和技术动态,快乐地学习理论知识。

2项目教学法

德国的项目教学法是教师将授课内容寓于项目中,辅助和引导学生实施和完成项目,学生在项目实施的过程中自主学习,学生完成这一项目,教师也完成了教学内容。这个过程不是简单地让学生按照教师的安排和讲授去得到一个结果,而是在教师的指导下,学生去寻找得到这个结果的途径,最终得到这个结果,并进行展示和自我评价,学习的重点在学习过程而非学习结果,他们在这个过程中锻炼各种能力[5-6]。

我们在课程实验环节设置了两项项目实践“中文文本分类系统”和“中文信息处理应用研究报告”,下面以编制“中文文本分类系统”为例,说明我们的课程项目实践过程。

1) 实验设置:将学生分为3~5人的小组,每组实现一个完整的中文文本分类系统,包括文本输入、特征选择(CHI和IG)、文本表示(VSM模型)、分类器(KNN、Bayes、SVM)及分类效果评测(F1)等模块。

2) 教师示范:完成该项目需要掌握中文自动分词、特征选择方法、分类原理等理论知识。因此,本项目是在讲解完分词、标注、句法分析等基本知识和文本分类等章后布置的。为了让学生顺利地完成项目,教师首先将往届学生的优秀作品展示给学生,并剖析其中的关键步骤,给出完成项目所需的资源,包括中文文本分类语料库,分词工具,SVM、Bayes、KNN等分类器的软件包。

3) 学生实践:学生在梳理知识点的基础上,在小组内讨论分工及项目进展的时间节点。学生在此过程中遇到问题,可以向老师或者助教请教。对于完成项目确有困难的小组,助教给予重点指导。

4) 项目总结与展示:教师总结学生完成项目的情况,指出学生在完成项目中存在的问题。同时,教师挑选优秀的项目,请完成人在课堂上给同学展示,教师点评。

5) 项目优化:在教师点评的基础上,学生修改和优化项目,最终形成完整的系统和文档。

在以上项目的实践中,教师已经不是教学中的主导者,而成为学生学习过程中的引导者、指导者和监督者。这样的方法具有以下优点:

1) 能极大地调动学生的积极性。让学生按小组实施项目的过程中,学生时常感受到成功的喜悦,这更能强化学生的学习积极性。

2) 能培养学生的合作能力。学生实施项目实验的过程分为小组讨论、项目实施、小组汇报、总结评价等。小组内及小组间的充分交流、讨论、决策等,可以提高学生合作能力,强化学生的团队意识,而合作能力和团队意识恰恰是当前社会化大生产所要求的基本素质。

3) 能促进课程间的整合。中文信息处理课需要概率统计、离散数学等课程的理论支撑,课程实践还需要数据结构作为前修课程。项目实施过程中,学生需要综合运用到以上多门学科的知识。一个完整的项目实践可以培养学生运用专业理论知识解决问题的能力,促进课程间的融会贯通。

3其他教改措施

为了保证中文信息处理课程实践环节的顺利进行,我们还采取了以下措施来保证教学效果。

首先,我们编写教材,制定实验大纲。为了充分体现课程的应用性,我们编写了《中文信息处理的原理及应用》,制作了配套课件,设计了很多实例,采用动画、多媒体等手段加以展示,尽量将深奥的理论寓于生动的课件中。在打好理论知识的基础上,我们制定了课程实验大纲,明确规定了实验目的、任务、内容、要求等,为实验环节的执行提供保证。

我们十分重视实验资源建设。本课程的实验大都需要标注的文本语料库和一些常用算法的代码包,我们对现有的资源进行挑选,给学生指定了一些适合于课程项目实践的语料库和公认效果较好的算法包,这可使学生在完成实验的过程中少走弯路,加快实验的进展。我们还积累了历届学生项目实践的优秀作品,供以后的学生借鉴,这样可以不断提高学生项目的质量。

另外,我们在教学中尽量做到合理划分小组,明确分工。由于学生的能力和特长不同,我们在学生自由组合的基础上进行调整,采取互补的原则,合理搭配小组成员结构,尽量做到每组均由“程序实现能力强的学生+善于表达的学生+成绩较差的学生+较内向的学生”组成。这样的搭配有助于同学间相互学习、相互带动。但必须做到分工明确,各自发挥所长,协作完成项目,避免出现依赖思想。

最后,多方位指导,强化考核是课程实践环节顺利完成的保证,我们为学生提供了强有力的“技术支持”,除了课堂讲解、实例演示和课后答疑,我们还请研究生担任助教,在网上实时解决学生的问题,并对确有困难的学生进行面对面的指导。实践作业的成绩以30%的比例直接计入最终成绩。

4结语

“中文信息处理”实践环节教学是一项综合的教学任务,如何将抽象的理论知识和实际应用问题很好地结合起来,始终是需要我们思考的问题。科学技术的迅猛发展将不断给我们的教学提出新的挑战,我们只有与时俱进,适时地调整和改进教学内容和教学方法,才能使这门课始终成为受学生欢迎的课程。

参考文献:

[1] 屈林岩. 推动学习创新 提高大学生的学习能力[J]. 中国高等教育,2008(2):31-33.

[2] 何静媛,朱征宇. 高校计算机专业实践教学改革研究[J]. 计算机教育,2010(2):25-27.

[3] Joan S. Stark ,Lisa R. Lattuca:Shapping the Coolege Curriculum:Academic Plans in Action[R], Boston:Allyn & Bacon,1997:31-33.

[4] 苗夺谦,卫志华. 中文文本信息处理的原理与应用[M]. 北京:清华大学出版社,2007:317-318.

[5] 陆杰,苗夺谦. 实验教学中注重过程的认识与实践:同济大学-飞思卡尔微控制器教学联合实验室建设与实践的思考[J]. 计算机教育,2009(15):120-122.

[6] 廖勇,琚生根,周刚,等. 高校计算机专业实验室建设探讨[J]. 实验技术与管理,2009(5):155-157.

Explorations on Practical Teaching of Chinese Information Processing

MIAO Duo-qian, WEI Zhi-hua, WANG Rui-zhi, ZHANG Zhi-fei

(Department of Computer Science and Technology, Tongji University, Shanghai 201804, China)

Abstract: Chinese Information Processing is a theoretical course closely combined with applications. Focusing on the characteristic, the paper proposes interactive teaching method and program teaching method for this course. Some attempts have been made in our practical teaching in Tongji University. The results show that students are appreciating it.

Key words: Chinese Information Processing; practical teaching; interactive teaching; programming teaching method

上一篇:面向应用型人才培养的开放式实验教学模式 下一篇:让实践教学成为学生创新思想的展示平台