数字出版中的汉语学习资源构建研究

时间:2022-08-13 04:18:09

数字出版中的汉语学习资源构建研究

【摘 要】

数字出版是 “云终端+云服务”移动学习的典型应用模式之一。如何实现资源的有效管理和高效共享,以满足海量资源下用户的个性化需求是数字出版领域中的核心问题。细粒度、对象化资源是关联高可用性教学资源和有效资源共享环境建设的关键。本文通过分析汉语学习的需求和汉语学科知识的特点,结合对象化资源设计的理论,应用细粒度、元数据描述的策略,提出面向数字出版的汉语学习资源的构建方法。

【关键词】 数字出版;流语学习资源;学习对象;本体;细粒度

【中图分类号】 G40-034 【文献标识码】 A 【文章编号】 1009—458x(2013)07—0083—05

一、问题提出

云计算以其为大规模用户提供“按需使用,随需应变”的“云+端”服务为特征,给人们的生活、工作方式和商业模式带来了根本性的改变。云服务形态适应了移动互联网时代人们的需求,满足了任何人可在任何时间、任何地点通过任何终端分享“碎片化”信息的需要。“云+端”的环境支持细粒度和变粒度的信息按需服务,同时也催生出移动终端的新型数字资源应用模式——数字出版。为此,《国家“十一五”时期文化发展规划纲要》和《新闻出版业“十一五”发展规划》已明确将其列入我国政府在新时期振兴现代出版业的重点工程。

数字出版丰富了出版物的内容和形式,同时也改变了人们的阅读方式和消费模式,人们对数字出版提出了更高的要求。面对移动终端按需服务的个性化和多元化发展趋势,数字出版环境中的信息资源细粒度和变粒度的问题也日益凸显。在教育信息化中,细粒度学习需求一直伴随着互联网的发展进程,学习个体对学习资源的服务需求因其知识背景、知识水平、学习目标和学习条件的不同而千差万别,学习者在学习过程中需要处理不同粒度的信息。因此,为学习者提供细粒度和变粒度服务是学习资源服务的基本方式,资源的细粒度处理和构建是数字出版中面临的挑战。为了更好地服务于学习过程中学习者在不同粒度上对数据、信息和知识的加工和处理需求,数字出版中的资源必须具有满足学科中最细粒度学习资源的需求能力。

由此可见,在“云+端”新一代网络应用环境下,粒度、粒度划分以及对其描述是数字出版的信息资源构建的关键,结构化、碎片化资源可以根据需要对知识重新组织定义,便于资源的重组和再次利用,为数字出版的有效存储和分发等“按需使用”提供了便利。在汉语学习资源的建设实践中,证明学习对象和领域本体理论为解决源细粒度和变粒度的问题提供了理论依据,使数字出版中的汉语学习资源构建变得更加合理。

二、学习资源的对象化构建及其发展

网络学习资源的重组利用是实现其高效共享的重要标志。学习对象理论为构建高可用性的数字化教学资源环境提供了可能。学习对象(Learning Object,LO)最早是结合面向对象的计算机科学思想提出的,它是一种新型的计算机辅助教学构件,能够在多种情境下重复有效地使用。从广义上看,学习对象是指在技术支持的学习中被利用、重用或参考的数字或非数字实体[1]。随着eLearning的深入发展和应用,学习对象的内涵也在不断发展,融合了教育教学原理,成为“具有教育单元含义”的数字化教学资 源[2]。对象化资源设计的基本理念是教学设计者可以建立适当大小的数字化教学构件,这种构件在不同学习情境下易于获取且能多次重复使用。由此可见,对象化的资源具有“独立”、“可重构”、“适当大小”等特征。

近年来,随着云计算、语义网、移动技术等新技术的发展,以“构件”、“学习对象”进行资源构建的技术也在不断完善。在学习理念和信息技术发展驱动下,基于“学习元”的资源设计更加关注学习的情境性、个性化、非正式等特点,将学习活动、人际信息、生成性信息、语义本体信息等要素纳入到学习资源的共享范围,可以实现知识的自我与协同建构、人与人之间的联通、平台间学习信息的共享以及语义层面的资源描述[3]。

因此,学习资源的对象化构建是提高资源可重用性的基础,通过对资源内容的结构化、细粒度和元数据描述,实现资源的共享、重用/重组和可定制化,从而达到内容的动态更新和重新组合,满足学习者对细粒度和变粒度服务的需求。

三、基于本体的学习资源设计

基于数字出版资源的细粒度服务,必须有支持学习的独立的细粒度资源。这种“细”资源具有独立的、完整的“学习”意义,也就是能体现一定的学习目标。可见,细粒度学习对象实体是数字出版资源构建的基础,学习对象粒度的划分要依据本体知识的特征规律,完成领域学习任务,从而保证细粒度学习对象同时具有“学习”的意义。

(一)基于本体的学习资源粒度设计原理

本体(Ontology)在哲学上指的是“世界的本原或基质”,其实就是一种概念体系,关于相关领域的知识,是实现概念化和语义化的关键环节之一。在信息技术中,本体指的是“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”[4]。利用本体分解和描述学习对象,是因为“本体是一种能在语义和知识层次上描述信息系统的概念模型建模工具”[5]。领域本体知识的特征往往决定了学科领域的知识结构、知识分类以及知识的认知规律,因此,将“本体”引入到学习对象的表示、描述和管理,可以更好地建立学习对象中各个相关知识以及知识间的关系。

面向数字出版的细粒度资源服务需求,我们可以针对相关领域的知识,分析领域知识的结构、层次和知识间的关系,确定学科知识点的粒度划分;确定相关领域共同认可的词汇,通过本体规范化的描述,实现知识相关联以及与资源之间的映射关系,为领域知识共享提供可能;本体知识连接了学习对象和学习者所需的学习资源,通过本体可以扩展学习对象元数据的语义功能。

(二)基于本体的细粒度学习资源的对象化设计步骤

对象化资源的设计是以本体知识为基础,具体设计步骤如下(图1):

1. 建立学习任务与本体知识的关系

教师和专家通过分析学习任务,确定主题任务和对应的领域知识。主题任务具有明确的学习目标,依据建构主义学习理论,学习是知识构建的过程,可以将主题任务分为几个子任务,满足学习循序渐进的需要,并通过主题词表来描述主题任务。主题词表是一些规范化的、有组织的、体现主题内容的、已定义的名词术语的集合体。

2. 建立具有学习目标的领域知识和知识点之间的映射关系

按知识的分类,一般将知识分为陈述性知识和程序性知识[6],陈述性知识包括基本概念、原理、术语等,程序性知识指的是问题解决的方法、策略等。从某种意义上说,良好的陈述性知识是构建程序性知识的基础。知识间存在层次性和相关性,层次性体现在知识有不同的层次,相同层次的知识点往往也有一定的逻辑关系;相关性则表现为在完成相关任务时,知识点与任务间的关联程度不同。因此,可以通过构建概念图来表示知识点间关系的强弱,从而建立知识点之间的语义关系,反映出知识间的映射。

3. 划分基于本体的知识粒度,并建立知识点之间的关系

按照本体知识的特征可以划分学习对象的粒度,结合主题任务,可以使细粒度的学习对象具有“学习目标”的意义。

4. 选择可以完成学习目标的媒体类型

学习对象是通过具体的媒体承载的,可以通过文本、图像、音频、动画、视频等媒体形式来表示,不同的媒体具有不同的知识表征功能。

5. 制作细粒度资源,对语义元数据进行描述

图1 基于本体知识的学习资源设计

四、汉语学习资源对象化构建分析

近年来,世界范围内的“汉语热”正持续升温,世界汉语教学面临新的机遇和发展。随着汉语学习者多元学习需求的凸显,云终端和云服务环境下移动学习方式越来越受到汉语教学界的关注。移动技术促使学习者可以随时随地学习,分享海量的汉语学习网络资源。然而,作为云环境下的数字出版这一典型的应用模式,资源该如何构建才能真正有效地满足多元学习需求是关键。经研究表明,根据汉语学习者的需求、移动终端的特性,构建面向云环境下的汉语数字出版资源还必须遵循汉语知识体系特征与汉语学习的认知规律。

(一)汉语本体知识分析

1. 汉语知识具有可微型化和层次性的特征

汉语本体知识可以分为汉语基本要素和语用知识:汉语基本要素包括语音、汉字、词汇、语法;语用知识包括言语规则、语体和修辞,最常见的语体有书面语和口语。

汉语本体知识的单位由小到大,有字、词、短语、句子、段落、篇章等不同的层次,粒度越小,提供的语言信息就越多,应用的价值也越大。音节是人们听觉上最容易分辨出来的语音单位,一般来说,一个汉字就是一个音节。音节可分为声母、韵母和声调,根据不同的拼写原则可以形成所有汉字读音的组合。汉字是汉语的书面交际工具,是记录汉语的载体。汉字包括字形、字音、字义,字形是汉字的形体结构,包括结构、偏旁部首、笔画和笔顺。词汇是语言交际的最小单位,分为实词和虚词两大类,根据词性的不同又可进一步分为形容词、动词、副词等。词作为最小的交流单位,依据交际功能理论,围绕某一学习主题的情景话题是由相关的核心词表和句表组成,这些核心词表和句表是构建汉语细粒度知识库的基础。汉语语法是汉语的构造规则,制约着汉语词语和句子组合的合法性。

在前文提过,对象化学习资源的重要特征是重组性,汉语语言要素之间的层次关系使得汉语知识的学习具有可微型化的特点,学习者可以根据学习时间的长短自由决定学习容量的大小。例如一个汉字的学习可以划分到读音、字形、笔顺、字义、组词等方面。

在汉语作为外语的学习中,学习者的学习能力、认知程度、母语背景等是影响汉语学习的关键因素,这些因素要求学习内容应根据学习者的需求做弹性处理。汉语本体知识的独立微型化特征可以满足这种需求,实现知识点的可重组。

2. 汉语知识间的形式语义

汉语语法是汉语本体知识的重要组成部分,通过一定的构造规则,制约着字与词语、词语与短语以及句子之间组合的合法性。此外,汉语语法还反映了汉语字与字之间、词与词之间、句与句之间的语义形式。汉语学习内容包含着丰富的元素,这些元素之间通过一定规则可以构成整体的汉语知识系统。如学习“打篮球”这一表述,可以将这个运动场景作为一项联结元素,联结到其他说法,如“玩篮球”、“打比赛”等;也可以以“打+球类运动项目”为联结元素,扩展出“打羽毛球”、“打排球”等。一个情境下的内容包含着很多微型化的知识点,这些知识点可以与其他知识点建立语义关系。

3. 汉语知识可多符号表征

语言是人类交流的工具,汉语语言学习的特性之一在于情景性,语言的实际应用需要依赖一定情景。在语言知识的讲解中,通过应用多媒体技术表征汉语知识内容,可以创设相应的情景,增加学习者的注意力。多媒体的应用还有助于听、说、读、写等技能的训练,例如在汉字教学中,由于汉字的“形”与“义”有着紧密的关系,大多数汉字具有外界事物图形化的特点(如山、鸟、象等),因而词语的意义往往也可以通过直观的图像来表达。

从以上对汉语本体知识的分析可以看出,汉语知识具有可微型化、层次性、有形式语义以及内容可多符号表征的特点。结合学习对象的内涵分析,汉语知识是符合可重组特点的,语义特征的描述更有利于实现学习资源的聚合。因此,在对汉语本体知识进行层次划分的基础上,可以进行细粒度学习对象的构建,这一特点也适应了移动学习的需要。

(二)汉语学习资源的构建

在对汉语本体知识分析的基础上,可以将细粒度的汉语知识库分为表征知识点的媒体层、细粒度汉语知识层、语用规则和应用层(如图2)。

图2 细粒度的汉语学习资源

1.表征知识点的媒体层

表示知识点素材的媒体类型包括:文本类素材、图形图像类素材、音频类素材、视频类素材、动画类素材、题库、课件与网络课件、网络课程等八类。每种媒体对不同的知识具有不同的表达功能。

2.细粒度汉语知识层

汉语的学习内容具有可微型化和层次性特征,汉语学习对象如何划分,划分以后如何组织、整合,是实现汉语资源有效共享和高效利用的前提。我们知道,划分的粒度越小,提供的语言信息就越多,应用的价值也越大。尽管汉语能划分的最小语言单位是语素,最小语音单位是音素,但在实际的交际中,词被认为是完成交际的最小单位。也就是说,以词为颗粒才能具有“学习”的含义。汉语本体知识体系内,用字组词,用词组句,用句组篇,具有由较小的语言单位形成较大的语言单位的规律。汉语各类表达式,尤其是句子表达式的深层部分实际上就是“一种逻辑结构”。应用词法和句法规则可以判断字与字、词与词之间的关系。

3. 规则层

除了汉语形式上的规则外,从汉语字、词、句到语篇,还受到语用规则的制约,如言语规则、修辞规则等。

4. 应用层

语言学习的最终目的是为了交际,语言交际能力包括听说读写四个方面。我们知道,在第二语言学习中,“语音、文字、词汇、语法”等语言知识通过练习和训练将转化成为学习者的“听、说、读、写”四项言语技能。“听”是其中最首要的一项技能。听力技能是指人们利用听觉器官理解别人口头表达所传递的信息的能力,是一种话语理解能力,听力理解的过程是一个综合应用多种听力技能对言语信号进行接收、识别、理解、判断和解码等信息实现的复杂的创造性思维过程。因此,在学习语言知识的基础上转换为实际的应用技能是汉语教学所要实现的目标。

(三)细粒度的汉语学习资源的表示

根据上文汉语对象化资源构建的分析,可以构建细粒度汉语学习对象(如表1)。

1. 知识层次

在本文中,根据布鲁姆认知领域关于知识水平级别的论述,考虑到汉语作为外语学习的特殊性,即语言知识的学习最终服务于交际这一目的,将汉语知识水平定为识记、理解、应用三个层次。

表1 构建细粒度汉语学习对象

[汉语

知识点\&细粒度

知识点\&学习资源

媒体类型\&学习对象

文件格式\&知识

层次\&汉字\&读音\&音频\&MP3\&识记\&部首\&图片\&Jpg\&笔顺\&动画\&Swf\&组词\&文本\&Txt\&合成\&多媒体集成\&Swf、PPT、HTML\&词语\&读音\&音频\&Mp3\&识记\&词性\&文本\&Txt\&词义\&文本(目的语/中介语)\&Txt\&理解\&图片\&Swf\&例句\&多媒体集成\&Swf\&应用\&合成\&多媒体集成\&Swf、PPT、HTML\&应用\&句法\&读音\&音频\&Mp3\&识记\&结构\&文本\&Txt\&理解\&例句\&多媒体集成\&Swf\&应用\&合成\&多媒体集成\&Swf、PPT、HTML\&应用\&语篇\&音频\&Mp3\&识记\&文本\&Txt\&理解\&图片\&Jpg\&应用\&多媒体集成\&Swf、PPT、HTML\&应用\&]

2. 汉语学习资源呈现方式

不同的媒体在汉语知识的呈现方式上具有不同功能,相同的汉语教学信息还可以应用不同的媒体来呈现。相同的汉语教学内容可以用不同的符号和不同的教学媒体,以不同的教学目的(可以是语言知识的、文化知识的或者是言语技能的)从不同角度进行多维度揭示知识的关联性。如汉字“长城”是表示其“形”,并作用于视觉;图像“长城”表示其“义”,作用于视觉;语音“长城”则是表示其“音”,作用于听觉。视频则可以同时呈现 “形”、“义”和“音”。因此,汉语教学信息可以通过不同的教学媒体从不同角度来呈现,不同教学媒体可以揭示知识的多种关联,从而实现汉语学习者对同一教学内容多方面的认识和理解。

(四)细粒度的学习对象语义描述

学习对象元数据是实现学习资源共享和重组的基础。学习对象元数据用统一的方式对内容模型中的微单元、可共享内容对象和内容聚合体的属性分别进行描述。结合前文的分析,学习资源本体元数据包括三部分,即描述学习材料内容的元数据、描述学习材料使用上下文情境的元数据和描述学习材料结构的元数据,包括语篇元数据、字库元数据、词库元数据、句库元数据和交际任务资源元数据。(由于篇幅所限,见另一论文《面向数字出版的汉语学习资源语义元数据描述》)

五、结语

数字出版是 “云终端+云服务”移动学习的典型应用模式之一,满足海量资源下用户的个性化需求是数字出版领域中的核心问题。数字出版的对象、采用的手段以及提供的服务是细粒度的,这样才可以更好地满足服务对象的个性化和多元化需求,有利于用户对数据、信息和知识进行不同粒度的加工和处理。面向数字出版的学科学习资源粒度的划分要遵循学科本体特征,并通过对象化的构建实现资源的有效管理和高效共享,才能满足在云环境中移动学习的个性化需求。

[参考文献]

[1] Wiley,D.A.Connecting learning objects to instructional design theory: A definition, a metaphor, and a taxonomy[DB/OL]. http: //reusability. org/read/chapters/wiley. doc.2000.

[2] 李玉顺,武林,顾忆岚. 基于学习对象的教学资源设计及流程初探[J]. 中国电化教育,2012,(1).

[3] 杨现民,余胜泉,王志军. 学习元与学习对象的多维比较研究——学习资源聚合模型发展新趋势[J]. 开放教育研究,2010,(6).

[4] Gruber TR. A Translation Approach to Portable Ontology Specifications. Knowledge Acquisition5,1993 (2).

[5] S Castano, A Ferrara S Montanelli G Racca. Matching Techniques for Resource Discovery in Distributed Systems Using Heterogeneous Ontology Descriptions. Proceedings of the International Conference on Information Technology: Coding and Computing (ITCC'04). 2004

[6] Anderson,J.R..Language ,memory and thought .Hillsdale,NJ: Erlbaum,1976.

收稿日期: 2013-02-25

作者简介:熊玉珍,博士,副教授,硕士生导师;张文雯,硕士研究生。暨南大学华文学院(510610)。

上一篇:英语课改中如何落实高效课堂 下一篇:主动提供动力支持 克服“远程教育缺陷”