知识发现在数字图书馆服务中的应用研究

时间:2022-08-21 08:34:55

知识发现在数字图书馆服务中的应用研究

摘要:本文通过对知识发现进行深入的研究,阐述知识发现的功能及一般过程,探讨将知识发现引入数字图书馆的积极意义,并据此探索数字图书馆中基于知识发现的知识检索服务、个性化知识推送服务以及参考咨询服务。

关键词:知识发现 数字图书馆服务 应用

中图分类号:G2507文献标识码:A文章编号:1009-5349(2016)23-0019-02

随着网络环境和数据库技术的迅猛发展,人类进入到数字化信息时代,人们对于世界的认识越来越全面及深入。相应地,各种数据信息呈指数级的增长,并涵盖到我们生活中的方方面面。在这些浩如烟海的数据中,隐藏着大量的、有重要价值的信息。目前的数据库技术虽然能高效、便捷地实现对数据的查询功能,但依据现有的数据检索机制和统计分析方法仍无法满足某些高层次的需求,也不能从用户的需求出发,实现用户获取准确信息的意图,个性化的主动知识服务就更无从谈起。“数据虽然丰富,但信息仍旧匮乏”,用户们仍然在信息超载的环境下面临艰难抉择。数字图书馆作为集数据、信息、知识为一体的知识宝库,也面临上面所述的一系列问题,如何将知识发现技术应用于数字图书馆的建设中去,全面提升数字图书馆的知识服务价值和创新能力是新时代、新形势下带给图书馆人的挑战。

一、知识发现

(一)知识发现的概念

知识发现(Knowledge Discovery in Database)一词是在1989年召开的国际联合人工智能学术会议上首次提出的,其定义有多个版本,目前被业界广泛认可的是法耶兹(Fayyad)提出的。知识发现是指从大量数据中获取有效的、未知的、有潜在价值的并最终可理解的模式的高级处理过程。知识发现是一个交叉的学科,在计算机技术、数据库技术、机器学习技术、人工智能、统计学技术等多学科不断深度融合发酵中发展起来的。知识发现实质上是一个系统化过程,其核心是实施对大量的数据仓库、知识库、数据库的分析处理及深入挖掘,找寻数据间潜在的关联、规则、模式、趋势。帮助用户发现数据背后潜藏知识与信息,与传统信息检索相比,知识发现获取到的信息是有先前未知性、有效性和实用性三个特征。

(二)知识发现的功能

知识发现不同于传统的数据库定向查询、检索、调用,它会对数据进行分析、统计、归类及推理,以此为基础指导实际问题的求解,并力图发现事务间的相互联系,依据这种数据间的关联对未来的活动作出预测。知识发现技术可以从海量的、芜杂的数据中根据特定的算法,筛选出有价值的、高质量的相关联数据。

(三)知识发现的一般性过程

关于知识发现的过程,目前尚存在分歧,有的学者提出“五步说”,也有学者提出“六步说”,本文认为知识发现的过程应分为九个步骤。①用户调查,用以了解用户的需求。②数据收集,创建目标数据集,该数据集可以来自现有系统,也可以来自数据仓库。③数据预处理及清理,对上一步数据库进行纠错及除去冗余数据,并将处理结果转化为数据采集工具所需的标准表达形式。④数据的简化和投影,找出数据挖掘目标的有效特征,降维处理或用其他变量等价表示,以减少变量的有效数目。⑤根据目标选择恰当的数据挖掘方法。⑥根据模式类型选择适当的数据挖掘算法。⑦利用选定的数据挖掘方法及算法进行数据挖掘,挖掘出用户感兴趣的模式。⑧评价和解释发现的模式并将其可视化。⑨知识整理及应用,把挖掘出来的知识发现结果应用到用户的系统中去。以上步骤可进一步归纳为三个部分:数据准备阶段、数据挖掘阶段及数据挖掘后处理阶段。

二、数字图书馆引入知识发现系统的意义

(一)有利于提高数字图书馆资源的利用率

在传统的数字图书馆资源建设中,只是单纯地注重资源建设本身及检索传递能力,而忽视了用户对于资源使用的效率问题,导致了数字图书馆的资源利用率普遍偏低的现状。知识发现系统的引入,使得数字图书馆在原有资源的基础上,通过关联分析、分类、聚类等方法,获取与原有信息存在一定关联并潜藏于文献、资料、数据背后的有价值的知识。区别于传统模式,知识发现系统在用户获取知识A的同时,也会将与其存在一定相关性的知识B推送给用户,以供用户选择。这种推送不仅增加了知识B的利用率,也使得用户发现了单纯依靠本人能力无法获取到的、所需要的知识B。由此我们可以看出,知识发现的核心是对知识的挖掘,它是应用户的需求而存在的,在知识服务模式中,应该是知识寻找用户,而不仅仅局限于用户寻求知识。知识发现系统的应用,有效地提高了数字图书馆资源的利用率。

(二)为用户提供个性化的知识服务

进入新世纪以来,数据、信息、知识产生的速度越来越快,数量越来越多。根据统计表明,全世界每天约产生2EB的数据量(2EB既10亿GB或1000PB),加之以前积累起来的数据,简直不可胜数。在如此海量的数据中充斥着相当一部分的垃圾数据(包括虚假数据及冗余数据),这些数据不但无法满足用户的需求,还会对其造成困扰。知识发现系统通过收集、关联分析、聚类、分类等方法,对网站结构、资源内容及用户情况进行深入挖掘,找出信息特点与信息关联并加以合理利用,提高知识服务水平,进而促进用户的信息素养能力。另外,数字图书馆知识发现系统通过跟踪并分析用户信息及其知识行为特征,运用关联分析、分类、时间序列分析等方法,挖掘其存在的规律和特点,以此作为数字图书馆资源智能化关联和聚类的依据。通过知识发现技术对可用知识进行关联和升值,进而利用这些数据和规律对用户未来的活动进行合理的预测,从而向用户推送知识,以满足用户对于知识的实际和期望的需求,实现从信息获取到知识服务的跨越。

(三)进一步推动数字图书馆资源的开发和数据库的建设

数据资源的价值是非常宝贵的,通过知识发现系统找出资源中潜在的特征和规律,向用户提供符合用户需求的、高效的知识获取手段,使用户获取藏匿于数据背后的潜在的、全新的、有价值的知识,实现对资源的利用达到最大化,杜绝出现知识资源不必要的浪费,并以此为目标指导数字图书馆资源优化配置。知识发现系y从技术上加强了对现有数字资源的开发力度,多维度挖掘资源间的潜在联系,从而减少盲目的资源购置行为,减少现有资源不能充分利用的现象。通过对用户信息、行为特征的分析,了解用户的需求,进而指导数字图书馆资源的开发和数据库的建设、更新及优化。

三、知识发现在数字图书馆服务中的应用

(一)基于知识发现的知识检索服务

知识检索不同于信息检索,它在语义层面进行标引,建立知识库。通过信息的语义概念,揭示信息的内在含义,而非字面上的模式匹配。从根本上解决了检索结果冗余严重、检索率低、用户获取知识成本高等问题。数字图书馆借助知识发现技术,分析用户检索行为,挖掘其感兴趣的知识,构建用户信息模型。对用户进行聚类分析,通常可将其分为清晰查询、半模糊查询、模糊查询。其中,知识发现的检索服务可以提高后两种查询的查询质量。在数字图书馆检索体系中,知识发现揭示了知识在深层次的关联情况,对于增强其交互性,突破知识传播和共享的时空限制,使一站式知识检索服务成为现实。

(二)基于知识发现的个性化知识推送服务

通过用户使用记录、用户行为挖掘、用户特征分类和用户反馈分析等方式,经过模式识别和机器学习,分析并预测用户感兴趣的知识领域。根据构建的用户兴趣模型将相关的知识推送给用户,也可以通过聚类、分析、关联等规则,找到兴趣相投的用户加以归类,并将上述知识推送给相似需求的用户。知识发现运用智能分析,实现数字图书馆对用户的个性化推送服务及个性化定制服务,并依据用户对于推送或定制服务的反馈,进一步调整策略,进而满足用户的需求、提高用户的体验。

(三)基于知识发现的参考咨询服务

参考咨询服务最早要追溯自马里兰大学的“参考服务的电子化访问”项目。传统的浅层次的参考咨询服务是无法满足用户的需求,个性化的知识增值服务在数字图书馆服务中处于主动地位。知识咨询服务立足于数字图书馆丰富的智力资源和信息资源,依托知识发现系统为用户提供的原始知识或是经过深度加工的知识。通过知识发现系统对用户进行需求定位,挖掘用户的潜在需求,以便为用户提供更为精确的知识服务。基于知识发现的⒖甲裳服务不受时间限制、地域限制,以多种形式展开,更主要的是能为用户提供高效的、便捷的、深层次的知识服务。

四、结语

知识发现服务是数字图书馆知识服务未来的发展方向,推进知识信息的积累、组织和整理,促进新知识的创造及共享,不断丰富资源和服务,必将成为数字图书馆体系结构中不可或缺的一部分。知识发现系统在数字图书馆的广泛应用将进一步丰富和优化图书馆的信息资源,使图书馆的知识服务能力发生质的变化。

参考文献:

[1]张为江.基于用户需求分析的数字图书馆知识发现系统研究[J].图书馆理论与实践,2014(9).

[2]王芙蓉.基于知识发现的高校图书馆机构知识库模型的建立[J].图书馆学刊,2016(8).

[3]史海燕.基于知识发现的数字图书馆个性化信息服务研究[J]图书馆学研究,2010(10).

[4]靳晓恩.数字图书馆的知识发现研究[D].湘潭:湘潭大学,2008.

[5]周杨姊.基于知识发现的数字图书馆个性化信息服务[J].中国成人教育,2010(17).

[6]邵慧丽.基于知识发现数字图书馆知识服务研究[J].图书馆,2016(2).

[7]樊红侠.知识发现及其在数字图书馆的应用[J].现代情报,2008(8).

上一篇:着力推进农民工等人员返乡下乡创业 下一篇:法国学前教育立法及对我国的启示