数据挖掘技术在读者服务优化中的应用

时间:2022-09-24 01:04:12

数据挖掘技术在读者服务优化中的应用

摘要:数据挖掘技术是图书馆用户行为分析的重要方法和工具。在探讨数据挖掘技术在图书馆读者服务中应用的必要性的基础上,构建数据挖掘模型,通过个性化图书推荐、指导制定书籍采购计划、优化书库书架管理及读者借阅信用管理等措施,可以有效地优化图书馆面向读者的服务工作。

关键词:数据挖掘;图书馆;读者服务

中图分类号:F49文献标识码:A文章编号:16723198(2013)23016402

0引言

21世纪是知识经济时代、信息化时代,最重要的一个特点就是信息爆炸、信息超载、信息过量。在此形势下,图书馆业务尤其是数字图书馆信息资源也表现出快速增长的态势,大量的数据被收集且存储在图书馆管理系统中,但在图书馆资源极大丰富的同时,图书馆用户也陷入了“信息迷茫”之中。何不被海量信息而淹没?作为阅读主体,如何使图书馆服务更加适合用户的阅读需求,也随之成为图书馆读者服务工作中的新课题、新挑战。在这一关键时刻,数据挖掘(Data Mining)或称为数据库知识发现技术(Knowledge Discovery in Database,KDD)应运而生,为我们指明了一个很好的解决问题的方向,在现有图书馆数字管理系统的基础上,利用数据挖掘技术为读者提供个性化服务,无疑可以最大限度地满足读者需求,同时也契合了图书馆信息化建设的基本方向。

1数据挖掘技术在图书馆读者服务中应用的必要性分析

随着信息技术在图书馆管理服务中的广泛应用,图书馆的功能发生了巨大变革,服务范围不断扩大,服务方式走向多样化。提高图书馆信息服务质量、实现图书馆资源的最优化配置和最大化利用,成为图书馆管理与服务面临的新问题。为此,多数图书馆已建成了数据库管理系统,每年、每月乃至每天都在产生着大量的图书流通数据、读者对资源的历史访问数据等,它们对图书馆的采购、检索、咨询、流通等业务有着很强的指导作用。但另一方面,快速增长的过量的数据收集往往会变成“数据坟墓”,失去其指导意义。数据挖掘正可以解决这一难题,利用数据挖掘技术,可以从图书馆自动化系统中的借阅历史记录、检索查询等数据中主动剖析数据中隐藏的关系和规则,预测读者的信息需求,甚至发掘理解读者的兴趣、爱好,变被动为主动,为图书馆读者服务提供更有力的技术支持和更准确的决策管理资料。

2构建数据挖掘模型

运用数据挖掘和知识发现实现信息服务,优化图书馆读者服务,重点是要抓好信息采集、信息聚类、数据挖掘及知识发现等步骤。

2.1信息采集

读者服务是图书馆工作的核心内容,信息采集也应当首先采集与读者相关的信息和图书馆资源信息并放入数据库中,形成原始数据库,这是进行数据挖掘的基础和源头。需要收集的读者信息主要包括:读者的基本信息;检索查询、借阅记录;图书馆资源使用频率、种类和方式;等等。这些信息是大量的、杂乱无章的,要进行数据挖掘,必须先进行数据准备,按标准提取转换成相同格式的数据。

2.2信息聚类

信息采集后,需要对数据库中的信息进行聚类分析。目前,较常用的方法如:结合图书馆集成管理系统整理所得的读者信息、借阅信息、图书馆流通日志等,或通过发放纸质问卷确定增加馆藏资料的急需程度。

2.3数据挖掘

通过数据挖掘可以将聚类信息中的隐性知识或信息提炼出来,形成知识信息,或进一步推理,发现信息之间的关联,为指导图书馆的下一步工作提供科学依据。较常用的数字挖掘技术有关联分析、分类分析、聚类分析、序列分析等,其中以关联分析应用最为广泛。利用关联规则(经典Apriori 算法或其改进算法),可以帮助图书馆管理者发现读者与图书,图书与图书,图书大类间的关联,或者通过利用聚类分析,将读者群体细分以清晰把握不同读者群体的信息需求,根据读者对文献资源的利用状况及利用文献的活跃程度,合理优化图书馆资源配置,为读者提供个性化资源信息服务和推荐工作。

3基于数据挖掘的图书馆读者服务优化措施

通过对图书馆的资料仓库中储存的海量信息进行聚类分析、数据挖掘可以帮助图书馆优化读者服务提供行之有效的技术支持,其应用范畴主要集中在以下几个方面:

3.1个性化图书推荐

图书推荐是图书馆为读者提供个性化服务的一个重要举措。利用数据挖掘技术获取的信息,比如读者的借阅历史记录、阅读兴趣或研究方向,可向其推荐相关专题或专业的最新资料;或者通过数据挖掘关联规则方法的使用,为读者检索提供关联借阅的信息,使读者检索含有A关键字的书籍时,能够得到诸如“借阅过该图书的会员还借阅了”之类的信息,节省检索的时间和精力。此外,对于某些缺少借阅经历或刚刚涉足专业学习的读者来说,很大的一个困惑就是不知道要借阅什么书,图书馆可以图书流通日志挖掘出各大类、分类书籍中借阅量最大的前几名书籍,作为图书推荐,或组织专家撰写各专业学习的书单,动态更新相关专业的优秀文献书目,以供读者借阅参考。

3.2指导制定书籍采购计划

传统的图书采购计划制订主要采用专家法与经验法,但这种计划制订容易受到主观因素尤其是个人喜好的影响,花费大量资金购置的图书也可能并不能很好地满足读者的阅读需求。那么,怎样才能将有限的资金用到最紧缺的资源上去呢?运用数据挖掘技术分析图书馆的借阅流通记录、检索请求,以及文献拒借集和频繁借阅集,就能够很准确地获得信息采集的目标,进而有针对性的补充文献书籍并增加馆藏复本。

3.3优化书库书架管理

图书馆文献资料集中,藏书量往往有上百万册甚至更多,所藏资料囊括了各个专业领域,为读者的学习提供服务。由于藏书量大、种类繁多,科学、人性化的排架管理对于优化馆藏建设十分重要,数据挖掘技术的应用可以为图书管理员提供文献借阅量的变化趋势、购置时间的先后顺序,进而预留架位,避免频繁倒架,增加管理员工作量和读者的检索时间。对此,数据挖掘技术的应用步骤主要如下:

(1)回归分析历年文献借阅日志或图书流通日志,从中找出不同学科以及二级学科文献借阅的周期性变化;

(2)分类分析最近一阶段的图书馆流通借阅日志,区分借阅频次较高、借阅量增幅较大的图书类别;

(3)综合回顾分析与分类分析的结论,将借阅量大和借阅频次高的图书类别优先放在易于查找的书架上,借阅量增幅较大的图书可建议增加采购,并在上架时预留架位,避免频繁倒架;

(4)去旧更新,分类分析历年所购藏书文献数据,其中残缺破损不利阅读的图书、已有新版的旧版图书,或借阅量较少的复本图书应进行统计,酌情作下架处理,并将信息反馈给相关部门,及时购置新书,为读者提供最新的文献资料。

3.4读者借阅信用管理

图书资源作为公共财产,要保证有限的图书资源为尽可能多的读者服务,必须加强读者的借阅信用管理。可以对逾期还书信息进行聚类分析,将多次逾期归还图书、借阅信用较低的读者纳入一个单独的群集,减少单次可借阅图书数量,并设立按时提醒还书的服务,通过手机短信、Email等途径提醒借阅者按时还书以方便其他读者的借阅。

4结语

网络时代的图书馆读者服务不再局限于简单层次的信息查询与反馈,拓展数字挖掘技术的应用范畴,更深层次地发掘广阔的信息源中蕴藏的读者信息,主动分析读者的特定需求,为其提供经过集成的、相对完整的信息集合,可以更好地解决图书馆信息资源快速增加与资源利用效率低不相匹配的问题。可以预见的是,随着技术的成熟与管理方法的改进,数据挖掘技术必将在图书馆管理工作得到越来越普遍的应用,并成为图书馆读者服务工作中的重要手段和方法。

参考文献

[1]施晓华.数据挖掘技术在图书馆学科数据馆藏分析中的应用[J].情报杂志,2011,30(1):164168.

[2]李文阔,李永先.数据挖掘在毅字图书馆中的应用研究综述[J].新世纪图书馆,2012,(2):3033.

[3]黄辉.谈数据挖掘技术在图书馆工作中的应用[J].西北工业大学学报(社会科学版),2007,(3):9193.

[4]张炜,洪霞.基于OPAC读者行为的知识发现研究[J].图书馆论坛,2011,31(1):1719.

[5]柯青.以用户为中心的研究范式——理论起源[J].情报资料工作,2008,(4):5155.

上一篇:基于JSP的网上书店设计与实现 下一篇:企业档案管理创新与服务模式研究