大数据环境下图书馆信息服务走向

时间:2022-07-29 02:34:11

大数据环境下图书馆信息服务走向

【摘要】本文从大数据的概念,特征入手,进一步论证了大数据环境下图书馆信息服务的走向。

【关键词】大数据;图书馆;信息服务;走向

1.大数据

1.1 概念

目前大数据的概念没有标准定义,一般认为它是一种数据量很大,数据形式多样化的非结构化数据。Informatica中国区首席顾问但彬认为大数据是海量数据加复杂类型的数据。Gartner公司提出:大数据是高速度、大容量和多样化的信息集合,需要新的处理方式以提高决策能力、洞察力、实现流程优化。维基百科则定义为:大数据是指无法在一定时间内用常规工具对其内容进行抓取、管理和处理的数据集合。笔者认为大数据是一种大规模,多样化的数据集合,是对数据高速采集、分析、处理以提取知识价值的技术构架与过程。

1.2 特征

从数据的角度看,大数据有以下特征:

(1)数据总量巨大。目前不同类型的数据在快速递增,数据量从TB级跃升至PB级甚至ZB级,传统的集中存储与计算已经无法有效处理与解决它们的激增问题。

(2)数据增长迅猛。很多领域的数据持续呈指数级别增长,而且动态性强,要求分析处理快速,否则这些数据结果会很快过时。

(3)数据来源和类型多。目前大数据的类型不仅包括文本、动画、音频、视频和照片等,还包括网络日志、位置信息、链接信息等新型数据,同时,伴随着云计算、物连网、车连网、社交网、传感网、移动互联网等新技术的发展与应用。

(4)数据价值巨大。通过对海量的大数据的挖掘、处理、整合分析,可以发现新知识,创造新价值,提升企业的竞争力,为许多行业的发展带来新的商机和发展机遇。

2.服务走向

2.1 集成服务

由于大数据信息环境下信息系统的分布式,数据结构的异构化,大数据源分散在各个不同网络节点中。要使这些孤立的数据信息联系起来,图书馆就需要建立一个公共的集成化数据信息环境,提供方便、统一、透明的访问界面,屏蔽异构数据间的差异,把位于分布系统中的异构数据信息合并起来,便于统一的查询、检索和利用。由于大数据的数量巨大,图书馆应采用分布式协作策略开展数据信息集成,按照学科领域对数据资源空间进行划分,构建若干数据子空间,再针对子空间分别建立相应的系统进行数据分析,构成分布式协作数据集成体系。

2.2 数据分析与挖掘

大数据时代,图书馆间的竞争不仅是文献信息的竞争,更多是多类型数据的拥有、融合、挖掘与利用水平的竞争,即大数据的分析与获取能力的竞争,数据分析与挖掘逐渐成为图书馆信息服务研究的重点。图书馆在大数据分析与挖掘中需要做以下工作:

(1)要让数据关联起来。

大数据环境下的数据类型繁多,结构复杂,联系松散,数据分析的第一件事是为这些缺少联系的数据建立紧密的关联,为进一步分析利用提供基础。

(2)要让休眠数据活起来。

当前包括图书馆系统在内,许多信息系统内存在着大量的未被使用或未被发现的休眠状态数据,其中有不少是非常有价值的,如何让这些休眠数据发挥出活力,是图书馆大数据分析的重要工作内容。

(3)把高价值的数据知识挖掘出来。

要充分利用数据分析技术从大量的、有噪声的、不完全的、模糊的、随机的大数据中提取隐含在其中的、事先不知的、潜在有用的知识和观点。

2.3 新型资源的收集

随着计算机网络应用的深入,大数据环境下出现了许多新型的信息资源媒体形式。特别是构建在Web2.0技术上的,允许用户创建交换信息内容的社会化媒体资源成为大数据的一个重要资源类型。这些新型媒体形式依托于网络技术,以用户为中心,围绕用户喜好收集、传播、组织信息资源,信息还可以是用户创造性的观点和言论。由于社会化媒体信息的快速性,易用性和易获取性等特点,它们正迅速成为人们信息交流的重要途径,并改变着社会的公共话语权。这些高度多样化的新型资源及其网络交流体系,为分析和洞察公众对某一主题的观点,预测未来发展,研究社会现象提供了丰富的信息数据来源。大数据环境下的图书馆应该重视利用信息结合其他类型的数据,形成新的信息情报研究服务领域。

2.4 服务内容时效性

在大数据环境里,人们需要的往往是实时信息。大数据并不可怕,问题是要实时处理信息数据,因为任何延时都有可能造成数据信息的过时而失去价值。大数据环境下的图书馆信息服务应更加重视信息、情报的时效性,应当实时监控大数据动向,动态收集、分析与处理,获取对短期内行动提供决策支持的动态信息和知识。目前越来越多的用户通过社会化网络来获取最新信息,大数据环境下用户信息利用方式的变化提高了用户对图书馆信息服务的时效性要求,图书馆服务必须走向时效性。

2.5 用户分析

大数据环境下,人们的日常信息行为日益频繁,无法避免地在图书馆内外各类信息系统中留下各种行为数据,图书馆应当将这些散落在不同信息系统间的用户信息数据进行整合与分析,通过对大量的用户数据挖掘,分析得出图书馆所需的决策参考。而对大数据基础上的用户行为分析,不仅关注用户信息行为习惯本身,还会系统关注与用户信息有关的整体行为方式,并从中寻找影响他们利用图书馆的相关因素。通过对用户日常的自发行为的分析,更真实的反映用户的信息需求、偏好以及行为模式。

2.6 移动互联网

当前,移动互联网以其无处不在的无缝接入能力,个性化服务内容与互联网开放式创新相结合,在服务模式、业务形态、用户利用方式上产生了革命性变化,显示出巨大创新活力,必将成为大数据环境下图书馆信息服务的主导方式。而图书馆正在大力发展移动图书馆,它和社会广泛使用的Twitter、微薄、微信等移动互联网应用手段有效的结合在一起,使得用户的界限变得日益模糊,加之无处不在的智能终端,随时在线的网络交流,频繁互动的社交网络,让用户可以随时获得第一手信息与数据。传统的图书馆数据库资源及半结构化网页与移动互联网资源比较,移动互联网的信息更具有预见性和针对性,因此图书馆信息服务必走向与移动互联网的结合。

参考文献

[1]刘高勇,等.大数据时代竞争情报发展动向探析[J].图书情报知识,2013(2):106-110.

[2]张玉峰,等.面向Deep Webde的动态竞争情报智能采集策略[J].情报学报,2008(8):625-628.

[3]韩翠峰.大数据时代图书馆的服务创新与发展[J].图书馆,2013(1):121-122.

作者简介:张平(1968―),女,副研究馆员。

上一篇:基于VMware环境下网络模拟软件NS2的安装 下一篇:利用Civil 3D纵断面动态更新功能进行风电场道...