浅谈数据挖掘技术在高校图书馆个性化推荐系统中的应用

时间：2022-10-04 09:08:19

摘要：该文利用Clementine数据挖掘软件，结合数据挖掘理论知识，对某高校的图书馆借阅记录实施关联规则挖掘，并对挖掘结果进行分析归纳。高校图书馆个性化推荐系统有了分析归纳数据的支撑，就能实现根据每一位读者提出的要求，提供个性化的图书推荐服务。

关键词：数据挖掘；高校图书馆；个性化推荐

中图分类号：TP311 文献标识码：A 文章编号：1009-3044（2013）35-7901-03

1 课题背景

随着Internet技术及信息技术的快速发展，高校图书馆传统的借还服务方式也面临着新的挑战。读者已不满足于图书馆提供的图书借还和资料查询的简单服务方式，他们希望图书馆能够通过认真分析读者的个人特征和图书借阅数据，来发现读者的潜在需求，根据每位读者的不同需求提供应的图书推荐服务。因此，高校在这样的需求下，开发一个图书馆个性化推荐系统是极为必要的。

2 高校图书馆个性化推荐系统结构设计

2.1结构设计

高校图书馆个性化推荐系统根据需求分析可以分成界面层、个性化服务层和基本数据库层。如图 1所示。

2.2功能描述

1）界面层

界面层既可以让读者输入个性化需求，又可以将个性化推荐结果输出。

2）个性化服务层

个性化服务层主要是从图书信息库和读者信息库，采集图书信息、读者信息和读者的借阅信息，并利用数据挖掘技术对采集到的信息进行挖掘和归纳分析，根据归纳分析结果，为每位读者推荐感兴趣的图书。该层分为数据采集、数据挖掘和个性化推荐三个模块：

1）数据采集模块：用于从图书信息数据库、读者信息数据库和借阅记录数据库。采集图书馆的图书信息、读者的基本信息和读者的借阅信息。

2）数据挖掘模块：对数据采集模块采集的信息实施关联规则挖掘，建立规则库。

3）个性化推荐模块：实现将读者的基本信息和借阅信息与规则库进行比对，进而预测读者的兴趣爱好，向读者主动推荐符合其兴趣爱好的图书。

3）基本数据库层

用于存储图书信息，读者信息和读者借阅信息，这些信息能够为个性化服务层提供基础数据。

3 利用关联规则挖掘实现个性化推荐

3.1 借阅信息收集

本次数据挖掘的对象是某高校图书馆系统中的真实借阅数据，先利用Clementine软件从借阅记录信息库提取出读者的借阅信息。部分读者借阅信息如图2所示。

3.3实施关联规则挖掘

在Clenmentine软件中，关联规则是通过设定支持度和置信度的阀值，计算各类图书之间的关联程度的大小，从而发现图书之间的潜在关联性。本次Clenmentine关联规则算法中Apriori节点的参数设置情况如图4所示，即先找到所有前项支持度大于最小支持度的项集，这里最小支持度设置为1%；然后从找到的项集中产生期望的规则，即置信度大于20%的规则，最后产生关联规则结果。

以第一条规则为例，借阅《独行侍卫》的读者中有21.429%的读者也借阅了《王中王》，是所有读者中借阅《王中王》阅读率的93.929倍。从业务角度来说，在《独行侍卫》读者中有阅读《王中王》倾向的用户比例会比所有读者中有阅读《王中王》倾向的用户比例高。图书管理系统可利用此规则，在做《王中王》图书推荐时，优先向有借阅《独行侍卫》书籍的读者进行推荐，从而达到提高推荐命中率，提升读者满意度的效果。

4 结论

本文首先对某高校图书馆个性化推荐系统进行结构设计，然后利用Clenmentine软件提取某高校图书馆的真实借阅信息，进行数据转化和实施关联规则挖掘，最终建立规则库。高校图书馆个性化推荐系统通过将读者的基本信息和借阅信息与规则库进行比对，来预测读者的兴趣爱好，为不同的读者提供个性化的图书推荐服务。

参考文献：

[1] 潘旭武.陈玲洪.基于数据挖掘的图书馆读者需求分析[J]. 浙江高校图书情报工作，2008，24（3）.

[2] 李玮平.关联规则数据挖掘方法的研究[D].西安：图书馆论坛，2007.

[3] 赵群礼.数据挖掘在数字图书馆中的应用研究[D].西安科技大学，2007，6（9）

[4] 张凤巧.数据挖掘在图书馆工作中的应用[J]. 农业图书情报刊，2008

[5] 刘晓东.网络环境下高校图书馆个性化信息服务现状与发展对策[J]. 情报杂志，2006（17）.

浅谈数据挖掘技术在高校图书馆个性化推荐系统中的应用

文档上传者

热门标签更多>

热门推荐更多>

精品范文更多>

浅谈数据挖掘技术在高校图书馆个性化推荐系统中的应用

文档上传者

热门标签 更多>

热门推荐 更多>

精品范文更多>

热门标签更多>

热门推荐更多>