基于知识地图的知识组织

时间:2022-07-08 01:52:55

基于知识地图的知识组织

摘 要:当前知识地图的研究主要关注的是理论层面的相关问题包括概念、分类、功能等和具体领域的构建、应用和展示,对于知识地图的知识组织层面缺乏系统、深入的阐述。文章提出了基于知识地图知识组织的概念模型,并以该模型为指导,以CSSCI学术资源为例,阐述了如何通过知识抽取、知识关联、知识表示和知识存储来实现基于知识地图的知识组织。

关键词:知识地图 知识组织 知识关联 知识表示 知识存储

中图分类号: G302 文献标识码: A 文章编号: 1003-6938(2013)05-0012-04

1 引言

随着信息化社会的不断迫近和大数据时代的到来,信息呈爆炸式增长,人类被淹没在信息的海洋中。如何从海量的信息中获取知识并进行有效的组织,为用户提供知识服务成为了情报工作者需要重点研究的问题。知识地图作为一种知识管理的有力工具,它以可视化的方式展示知识的分布及知识之间的关系,使得知识的获取变得更加容易,实现了知识的重用、共享与知识创新。但以往对知识地图的研究更多是把知识地图作为一种可视化的展示工具来对待,主要关注概念辨析、针对各领域的需要所进行的构建研究等内容,鲜有从知识组织的角度来认识知识地图。

知识地图的展示只是知识地图的外在功能特性,更为重要的是如何从多种类型的知识资源中抽取知识,经过处理后,采用适合的方式表示出来。知识的抽取、处理、表示是知识地图展示功能的基础,本质上就是对知识的有效组织。本文试图在知识地图文献回顾的基础上,构建基于知识地图的知识组织模型,并利用CSSCI学术资源进行了实证研究。

2 知识地图概述

知识地图能够有效地整合分散在组织内的相关知识,使之有序化、便于管理和利用,它实际上就是把一个组织中的知识资源进行汇集、整合、关联,形成组织的知识集合和知识流。运用知识地图,可以按图索骥,得到寻找知识的途径,有效的缩短知识获取的时间,加速知识循环,实现知识的共享与创新。知识地图的研究经历了一个从概念辨析、构建方法到实际应用的一个逐渐明晰的过程,文献[1]对2008年以前的知识地图的理论研究进行了全面的梳理,阐述了知识地图的概念、特点、分类、功能等方面内容;文献[2]对知识地图及相关的概念包括知识图谱、概念图、主题图进行了辨析,对研究进展进行了综述并对研究前景进行了展望。知识地图更多的研究集中在构建技术和具体领域的应用研究上,文献[3]对知识地图的构建方法的理论基础进行了研究,文献[4,5]分别将本体技术和社会网络分析方法引入到知识地图的构建中并进行了实证研究;文献[6,7]关注了隐性知识地图的构建问题,与显性知识相比,隐性知识的社会化无疑更具创新价值,相关文献对于专家知识地图的研究本质上也是体现了对于隐性知识的关注;文献[7-10]等从语义对等网环境、产品开发、网络日志等不同的领域和角度研究了知识地图的构建和应用。

总体来看,当前知识地图的研究呈现以下几个特点:(1)将语义网的本体技术引入到知识地图的构建中,以期通过本体的语义描述能力建立知识单元之间的语义关联,进而形成知识地图网络。(2)知识地图的构建已从早期的概念型知识地图、流程型知识地图、职称型知识地图等显性知识地图向以基于社会关系网络的隐性知识地图发展,这是因为隐性知识才是组织核心价值所在,隐性知识的社会化对于促进知识创新具有更为重要的意义。(3)知识地图的应用研究从企业组织向社会图书馆、大学图书馆扩展,这一方面是图书馆等科研支撑部门对于提升知识服务的迫切需要,另一方面也反映了知识地图的知识导航和方便知识获取的优点受到广泛认可和关注。通过分析,笔者认为当前的知识地图研究也存在一些不足:(1)主要探讨了知识地图的理论层面的相关问题包括概念、分类、功能等和具体领域的构建、应用和展示,对于知识地图的知识组织层面缺乏系统、深入的阐述。(2)知识地图的构建方法在宏观上缺乏通用性,仅适用具体的应用领域,即未建立知识地图的知识组织概念模型用于指导通用的知识地图的构建。

3 基于知识地图的知识组织

知识组织的本质是使知识序化,便于知识的查找、使用和共享。信息技术高速发展和大数据的时代背景下,信息量与日俱增、信息存储分散和无序,而人们从中获取知识的能力却是有限的,在这种情况下,从知识层面对信息资源进行组织并使其利于获取使用就显得尤为重要。以分类法、元数据、主题词表等为代表传统的知识组织方法多局限于文献和信息层面,无法满足人们对于知识的需求。知识地图是以可视化技术实现的组织知识目录及其语义关系的组合体和组织领域专家的导航系统,使得知识的获取更加便利。

基于知识地图的知识组织,首先要对来自组织内的各种类型资源进行收集整理,对于组织需要的或者是与组织内的资源有重要联系的外部资源(比如Internet上的信息)也必须纳入进来,确保知识地图的信息资源的完备性和全面性。然后从各类资源中抽取知识元,经过处理以后,采用适合的方法进行知识表示,建立知识元之间的关联关系。基于以上知识表示,采用可视化技术展示知识节点及其之间的关联关系,形成知识地图。知识地图是一种有效的知识组织方式,它以直观、便捷的方式为用户提供知识服务,以更好的实现知识的共享与重用,最终实现知识创新的目的(基于知识地图的知识组织的概念模型见图1)。

(1)信息资源层:信息资源层是基于知识地图知识组织的基础,也是知识地图的信息源。知识地图的一个重要的特点就是不直接表达知识内容,而是展示知识所在的位置,而知识资源层所包含的内容就是知识的具体的存储位置。信息资源层是知识收集的结果,它包含了组织内所有的结构化、半结构化数据,也包括了隐形知识的载体人。

(2)知识表示层:知识表示层是信息资源层和地图展示层的中介,也是实现基于知识地图知识组织的关键所在。知识表示层实现了对信息资源层所有资源中所蕴含知识的抽取,以知识元形式表示,定义它们之间的语义关系,并定量化的描述它们之间的关联度。所有知识表示存储在知识库中知识表示表中。同时知识库中还包含知识链接表存储知识元所指向的具体信息资源,知识表示表与知识链接表通过知识元ID主键关联。知识表示层和信息资源层通过知识链接实现知识元与其具体存储位置的信息资源之间的关联。

(3)地图展示层:地图展示层是根据具体应用基于知识表示层所形成的视图,它是基于知识地图知识组织的外在呈现。地图展示层根据具体的应用需求通过检索知识库中的知识表示表中的相关知识元,根据它们之间的语义关系绘制知识地图。地图展示层由知识节点和知识关联组成,这里的知识节点可以是知识元本身也可以是知识元的进一步概括和抽象所形成的知识对象,比如:苏新宁是作者这个知识对象的一个实例我们称之为知识元,在建立南京大学老师之间的学术关联知识地图中利用的是知识元本身作为知识节点,当建立南京大学、武汉大学、北京大学等高校老师之间的学术关联知识地图时,就需要对知识元进一步的概括和抽象,以南京大学老师作为知识节点。知识关联用于反映知识节点之间的语义关联关系和关系度。关系度的计算则根据不同应用的需要采用不同的算法。地图展示层通过知识检索获取知识表示层存储的关于知识节点和知识关联的知识表示。

4 知识地图的知识组织——以CSSCI为例

中国社会科学引文索引(Chinese Social Science Citation Index,CSSCI)是由南京大学中国社会科学评价中心研发的引文数据库,它从中文人文社会科学学术性期刊中精选出学术性强、编辑规范的期刊作为来源期刊,收录了这些期刊1998年以来的来源文献和引文文献数据,这些数据基本能反映当前我国人文社科领域的研究进展和研究成果。通过对CSSCI学术资源基于知识地图进行知识组织,可以使得我们从多角度分析CSSCI学术资源所蕴藏的隐含知识,用于帮助和指导我们的科学研究和科研规划与管理。比如:通过基于主题之间的关联关系进行的知识组织,能够发现当前和潜在的研究热点;通过基于学科之间关联关系的知识组织,能够发现学科交叉研究的情况;通过对作者之间关联关系的知识组织,能够发现作者之间研究的相似性,用于探索合作研究的可能性等。

4.1 CSSCI的知识映射和知识关联

由于CSSCI数据源单一,存储在结构化的关系数据库中,所以CSSCI知识组织知识抽取较为容易。通过分析CSSCI数据库中的各个字段,抽取主题、作者、机构、期刊、学科和基金六个知识对象作为研究对象。基于知识地图的CSSCI学术资源的知识组织的目标如图2所示,基于有意义的知识对象之间的关联关系研究知识表示、知识存储和知识展示,从而形成一个综合的知识地图。文献[4,11,12]已从不同的角度阐述了CSSSI知识地图的绘制与展示,本文重点论述知识映射、知识关联、知识表示和知识存储,即知识表示层的相关内容。CSSCI的知识表示本质上是建立信息资源层的文献到知识表示层知识的映射,实现文献到知识的转化。从文献中的抽取的知识对象分为两类:一类可以从数据库中直接提取,包括:作者、机构、期刊、学科和基金;另外一类是主题对象,主题并不包括在CSSCI的关系数据库中,需要对相关学科文献关进行统计分析结合领域专家知识对关键词进行归并获得。

基于有意义的知识对象之间建立的关联关系也分为两类:一类是同类知识对象之间的关联,包括:作者间的关联,主题间的关联,机构间的关联,学科间的关联,期刊间的关联。通过研究作者之间的主题共现、合作、互引、同被引、同机构来建立作者之间的关联关系,发现学者之间的依赖关系和处于关键节点的专家学者,探索学者间交叉合作的可能,促进学术的交流和发展;文献的关键词能够反映它的主要内容同即主题,通过对关键词共现次数的统计计算建立主题间的关联,以此来发现当前和潜在的研究热点;同样,通过对机构、学科和期刊之间的关联研究,可以发现机构之间的合作情况,学科之间的交叉研究情况和期刊之间紧密关系。另外一类是不同类知识对象之间的关联,包括:作者与主题的关联,作者与机构之间的关联,基金与主题的关联,基金与期刊的关联,期刊与主题的关联,期刊与学科之间的关联,主题与学科的关联(限于图示的清晰直观,部分不同类知识对象之间的关联并未在图2中显示)。通过建立以上不同类知识对象之间的关联关系,可以获得一些有价值的结论,比如:通过主题和作者的关联关系,关注领域专家所研究的内容,可以了解该领域的研究前沿,同样,建立期刊与学科之间的关联,可以发现期刊特别是综合性期刊相对青睐哪个学科的文章,可以用于指导学者的投稿。机构与学科以及其他不同类之间的关联并无太多实际意义,无需建立。

4.2 CSSCI的知识表示和知识存储

设G为知识元集合,它是所有知识对象实例的集合,例如:苏新宁作者,知识地图主题,大学图书馆学报等都是它的元素。定义三元组k=作为CSSCI知识表示方式,其中,g1,g2∈G,d为g1与g2的关联度,它通过统计计算得到,用于衡量g1,g2之间的紧密关系。以作者间的关联度计算为例,作者间的关联关系,主要通过合作、主题共现、互引和共被引来体现,设定作者间合作的权值为0.4,非合作主题共现权值为0.3,互引权值为0.2,共被引权值为0.1,则d=0.4*合作的文章数+0.3*主题共现次数+0.2*互引次数+0.1*共被引次数。根据知识对象关联的不同情况,分别计算出所有知识对象知识元间的关联度,形成其知识元的三元组表示,其中作者与机构之间的关联较为简单,若存在属于或拥有关系则为1,否则为0。

定义知识表示表,将每一个知识对象间的关联关系存储到一个知识表示表中,共计12个知识表示表。以作者与主题关联的知识表示表为例,Def(三元组ID(字符型),作者知识元ID(字符型),主题知识元ID(字符型),关联度(数值型)),其中ID为主键,用于唯一定位该三元组表示。同时为每一个知识对象建立一个知识链接表,共计6个表。以作者知识链接表为例,Def(作者知识元ID(字符型),作者知识元名称(字符型),知识所属文献ID(字符型))。CSSCI数据库中一个文献作为一条记录文献ID是其主键。知识存储与知识链接如图3所示。知识表示表和知识链接表位于知识表示层的知识库中,文献信信表位于信息资源层的数据库中。知识表示表用于存储知识对象间的关联关系,地图展示层通过检索动态检索知识表示表动态生成知识地图;为提高动态生成的效率,也可以将之前生成的知识地图进行保存以供下一次使用。知识链接表用于将抽取的知识与文献信息源相关联,以实现通过知识地图能够获取具体资源信息的目的。

5 结语

当前知识地图的研究主要关注的是理论层面的相关问题包括概念、分类、功能等和具体领域的构建、应用和展示,对于知识地图的知识组织层面缺乏系统、深入的阐述。本文在深入分析当前知识地图研究的基础上,概括了当前知识地图研究的特点和存在的不足,进而提出了由信息资源层、知识表示层和地图展示层构成的基于知识地图知识组织的概念模型。并以该模型为指导,以CSSCI学术资源为例,阐述了如何通过知识抽取、知识关联、知识表示和知识存储来实现基于知识地图的知识组织。

参考文献:

[1]司莉,陈欢欢.国内外知识地图研究进展[J].图书馆杂志. 2008,(8): 13-17.

[2]唐钦能,高峰,王金平. 知识地图相关概念辨析及其研究进展[J].情报理论与实践. 2011,(1): 121-125.

[3]叶六奇,石晶. 知识地图的构建方法论研究[J].图书情报工作. 2012,(10): 30-34.

[4]王昊,杨建林. 基于本体的CSSCI学术知识地图构建研究[J].情报理论与实践. 2009,(12):106-111.

[5]刘彤,时艳琴. 基于社会网络分析的专家知识地图应用研究[J].情报理论与实践. 2010,(3):68-71.

[6]吴才唤.社会网络分析在隐性知识地图构建中的应用[J].图书馆. 2010,(1):48-51.

[7]吴才唤.知识地图研究进展:从显性知识地图到隐性知识地图[J].图书情报知识.2012,(5):94-100.

[8]赵捧未,冯娟,窦永香. 语义对等网环境下基于大众标注的社区知识地图构建研究[J].图书情报工作. 2013,(5):129-133.

[9]苏海,蒋祖华,伍宏伟. 面向产品开发的知识地图构建[J].上海交通大学学报. 2005,(12):110-115.

[10]张梅,段建勇,徐骥超. 基于网络日志的知识地图构建与应用[J].图书情报工作. 2012,(18):117-121.

[11]梁勇,章成志,王昊. 基于CSSCI的期刊知识地图的构建[J].现代图书情报技术. 2008,(2):58-63.

[12]胡元蛟,王昊. 面向CSSCI的学者知识地图构建与分析[J].现代图书情报技术.2011(3):38-44.

作者简介:郑昌兴(1979-),男,南京大学信息管理学院博士研究生,南京政治学院讲师,研究方向:智能信息处理;刘喜文(1983-), 男,南京大学信息管理学院博士研究生,研究方向:数据挖掘和本体技术。

上一篇:勃拉姆斯和他的《匈牙利舞曲》第五号 下一篇:大数据环境下面向知识服务的数据清洗研究