移动环境下特色数据资源个性化推送系统的构建方法

时间:2022-10-02 06:00:59

移动环境下特色数据资源个性化推送系统的构建方法

摘 要:绍了在移动环境下数据资源个性化推送系统的构建方法。该系统通过对用户的反馈意见、用户的浏览记录、每篇文章的评分和下载量统计以及用户对每篇文章打上的标签等综合考虑并给定一个评分值,然后通过加权二部图算法,最终实现对特色数据资源的个性化推送。

关键词:个性化推送技术;特色数据资源;移动环境;加权二部图

中图分类号:TP311.52

特色数据库是图书馆在充分利用自己的馆藏特色基础上建立起来的一种具有本馆特色的可供共享的文献信息数据库[1]。它重点关注某一领域,并尽可能地将该领域内的有价值的信息收录进来,体现了数据库的专题性和独特性[2]。2009年,学校针对贵州省经济社会发展需要开展综合性学科科学研究等方面有所突破,重点开展山地经济、生态经济、反贫困问题研究等领域的研究,提升学校在省内外和国家层面上的科技竞争力。

虽然特色数据库的信息量相对有限,但是其中有价值的数据仍然相当多,因此,我们迫切希望找到一种能够在信息海洋中自动获取实用、准确、精炼和优质的方法。而利用个性化信息推送技术在移动网络环境下开展信息推送服务无疑是一种最好的选择。

1 系统概述

本系统首先进行数据拉取,即用户注册时收集用户的身份,专业,研究方向,感兴趣的内容等个人信息,然后通过在学者查找资源过程中根据查看记录适时地进行数据推送,并且以后再定期的将新的符合条件的资源信息进行数据推送(数据推送即主动将学校特色数据库中学者可能感兴趣的论文,书籍,视频等信息通过该系统传送到用户的手机中)根据用户的反馈意见、用户的浏览记录、每篇文章的评分和下载量统计以及用户对每篇文章打上的标签等信息来建立用户的兴趣模型,而在这个推送过程中,该系统还能根据学者对手机情景模式的设置来决定是立即还是延迟提示学者对这些推送信息进行查看。

2 技术要点

2.1 分众分类法

它是互联网时代的一个创造词,表示一种由非专业信息人员创造的分类法,分众分类法与传统结构严谨的金字塔式的文献分类法和信息分类法不同,它强调的是一种自下而上的、社会性的、用户共同创造的、自由的分类法。分众分类法就是由用户将自己感兴趣的信息加以组织整理,自由选择关键词为信息贴加标签,具有强烈的个人背景特色。

2.2 手机的个性化推送

(1)Web数据挖掘

Web数据挖掘从表征Web的超链接结构、网页内容和使用日志中探寻有用的信息。虽然Web挖掘使用了许多数据挖掘技术,但是它不仅仅是传统数据挖掘的一个简单应用。在过去20年中,许多新的挖掘人物和算法相继发明。依据在挖掘过程中使用的数据类别,Web挖掘人物可以被划分为三种主要类型:Web结构挖掘、Web内容挖掘和Web使用挖掘。

Web结构挖掘:Web结构挖掘从表征Web结构的超链接中寻找有用的知识。

Web内容挖掘:Web内容挖掘从网页内容中抽取有用的信息和知识。

Web使用挖掘:Web使用挖掘从记录每位用户点击情况的使用日志中挖掘用户的访问模式。这项任务也使用了许多数据挖掘算法。其中一项重要的议题是点击流数据的预处理,以便生成可以用来挖掘的合适数据。

Web数据挖掘过程和数据挖掘过程十分相似,区别通常只是数据收集。在传统数据挖掘中,这些数据经常是收集并存储在数据仓库中的。而对于Web挖掘而言,数据收集是一项艰巨的任务,尤其是进行Web结构挖掘和内容挖掘的时候,需要爬取大量的网页。

(2)移动环境下的个性化推送

它是指服务器根据用户需求定向将信息实时送达手机的服务。当有信息需要发送到手机时,它通过手机与服务器的网络连接将信息发送给用户,而这些信息,则是使用Web数据挖掘中的相应算法整理出来的。

在本系统中,为了进一步发挥特色数据库的科研作用,让系统中的数据挖掘算法能够针对不同的用户及时推送他们需要的文献、书籍、视频,我们可以充分发挥出移动环境特有的便捷性,及时性等优势,使用户通过手机能够及时收到这些推送信息。

(3)基于加权二部图的推荐算法

二部图是一种特殊的网络,它包含两类结点,一类是用户结点;另一类是项目结点,例如论文、特色数据资源等信息资源[3]。而加权二部图是在二部图的基础上衍伸而来的,它考虑用户-项目之间的权重,首先,项目将资源按照项目用户之间的边权与该项目边权之和的比分配给用户,然后按照同样的方式按照用户项目边权与该用户边权之和的比例将资源返回给项目。

3 本系统的特点以及解决的关键问题

3.1 本系统的特点

(1)将推送技术和传统的拉取技术结合。采用数据挖掘的方法和技术,从拉取到的信息中提取有用的知识,发现隐藏在大量数据中的内在规律,从而可以根据数据挖掘的结果向对学者有针对性地、及时地主动的推送信息。

(2)使用分众分类法和其他与数据信息资源相关的属性(如:时效性,研究方向等)对其进行分类,该方法是向用户提供一种协同构建与共享各自网络资源标签的开放式平台,通过用户自己制定分类标准和提交资源标签来实现,最后,由用户群体定义的频率来确定资源的类别。

(3)现有的基于“山地经济、生态经济、反贫困问题研究”领域特色数据库只将资源分类为下列四种:山地经济,经济史,反贫困问题,生态经济。故首先对资源根据学者评分,专业方向等进行进一步细粒度的划分。然后研究该特色数据库的注册用户,并将他们的身份,喜好,研究内容,上网习惯,用户评分等重要指标一一调查并列举,然后进行评分,这样能将用户进行进一步细分,选择一个合适的开发平台并构造适合该数据库的个性化推送的算法。

3.2 系统所解决的关键的问题

(1)确定用户的关键需求信息,这些需求信息能为学者的个性化信息推送提供参考依据。我们主要采用调研的方式,对本系统的潜在用户进行实地问卷调查,最后根据对用户的调研结果来设计本系统的用户注册信息。

(2)需要最大程度的为用户推送他们想要的,感兴趣的资源,并且在保证个性化推送准确性的前提下,合理推送一定数量的资源。本系统通过对用户信息以及用户对资源的操作信息的拉取,采用加权二部图的个性化推送算法,构建“用户―特色数据资源”二部图。其中,用户信息主要是用户的注册信息,用户对资源的操作信息主要是用户的反馈意见、用户的浏览记录、每篇文章的评分和下载量统计以及用户对每篇文章打的标签。

(3)建立学者兴趣的动态模型。在学者定制好一个自己的描述文件之后,系统必须根据学习的信息源分析当前学者的行为,从而调整学者兴趣的权重或者调整学者兴趣层次结构。根据学习的信息源,学者跟踪的方法分为两种:显式跟踪和隐式跟踪。显式跟踪是指系统要求学者对推荐的资源进行反馈和评价, 从而达到学习的目的。隐式跟踪不要求学者提供什么信息, 所有的跟踪都由系统自动完成。

4 结束语

本文利用数据挖掘中分类的思想和加权二部图的推荐算法提出了一种移动环境下特色数据资源个性化推送系统的构建方法。目前,贵州省大部分高校都建设了符合自己图书馆馆藏的特色数据库,但是,这些学校的图书馆都没有针对移动环境建立个性化的资源信息推送系统。手机使用方便灵活快捷的特性和信息推送的主动性和个性化的特点[4],决定了在移动环境下建立资源的信息推送系统是非常有必要的[5]。

参考文献

[1]李育嫦.国内学科信息门户发展现状分析[J].情报科学,2008(6).

[2]刘竟.面向概念检索的农史信息门户的设计与构建[D].南京农业大学,2008.

[3]张新猛,蒋盛益.基于加权二部图的个性化推荐算法[J].计算机应用,2012,32(3).

[4]徐青云.信息推送在个性化信息服务中的发展趋势[J].现代情报,2010(3).

[5]詹勋武.论图书馆的信息推送服务[J].四川理工学院学报:社会科学版.2009,24(2):98-101.

上一篇:网络信息系统在医院信息化管理中的应用分析 下一篇:企业信息化与精益化融合的应用研究