数字图书馆馆藏资源可视化研究

时间:2022-08-09 11:58:56

数字图书馆馆藏资源可视化研究

关键字:[HTK]数字图书馆;馆藏资源可视化;可视化模块设计

摘要:[HTK]文章简述了目前数字图书馆馆藏资源的可视化现状及现有的可视化技术,分析了馆藏时间结构模型、馆藏学科分类结构模型、馆藏等级结构模型,提出了数字图书馆馆藏资源可视化服务系统设计方案,并重点介绍了系统的总体架构设计、结构模块设计、覆盖率模块设计、利用率模块设计及数据通信与接口模块的设计。

中图文分类号:G250文献标识码:A论文编号:1003-1588(2015)06-0080-03

[FQ(3*2\.172mm,ZX-W]

[KH*3D]

收稿日期:2015-04-30

作者简介:[HTK]莫耀评(1975―),南宁职业技术学院图书馆馆员。[FQ)][HT]

把查询到的馆藏资源数据信息以视觉的形式展现出来,达到数据信息资源的沟通和传达直观化,即是图书馆馆藏资源的可视化技术。馆藏数据资源的可视化使读者不但可以了解数据的最基本特点,还能看到以多种技术手段展现的目标信息,这样用户可以很明确地了解到其所需求的目标数据信息的状态。

[BT3]1数字图书馆馆藏资源可视化现状分析

1.1大数据时代给资源可视化带来的挑战

世界权威组织机构统计的调查曾指出:网络产生数据信息资源以每年50%的速度在增长。随之出现的云计算技术也点燃了人们对大数据的研究热情,在图书馆馆藏资源可视化技术的研究过程中,大数据所占的比重也越来越大。图书馆馆藏信息数据资源不仅数量在不断增加,其复杂程度也在不断增强,因此如何将大量纷繁复杂的馆藏资源信息数据清晰直观地展现在用户面前是当前图书馆馆藏资源可视化研究的一大挑战。

海量且结构复杂的数据信息的存储、传输、并行化和不确定的量化等是可视化研究的难题所在。首先,馆藏资源数据信息的存储所存在的问题是数据数量大、结构复杂,因此存储时所需要的相应空间就大,对空间结构的要求较严谨。其次,馆藏资源数据信息的传输对所需传输速度和所占宽度要求更高。目前图书馆馆藏资源的传输速度难以满足用户需求是大数据下馆藏资源可视化技术研究的难点。

1.2馆藏资源越来越丰富引发的问题

目前即使互联网发展迅速、应用广泛,可在一些领域特别是在科研院所,首选的信息资源还是图书馆馆藏资源。因为图书馆经过这么多年的积累和沉淀不仅有浓厚的文化氛围,更有系统的专业知识和丰富的馆藏资源,这是互联网资源无法可比的。

随着人们对与数字图书馆相关的多媒体大数据信息研究的深入,图书馆与网络技术的结合也逐渐成为一种趋势。现在,人们对馆藏资源可视化的研究主要包括可视化检索研究与可视化检索结果研究。数字图书馆信息资源可视化的过程中,馆藏资源的数字化也是个大问题,有些资源的保存介质是很久以前的纸,这些信息数据的数据库录入工作并不容易,在很大程度上影响到数字图书馆馆藏资源的可视化过程。

[BT3]2数字图书馆馆藏资源可视化现有技术研究

2.1基于几何的数据可视化技术

数据的表达形式采用几何或几何投影的方法称为基于几何的信息数据可视化,该方法的采用使用户能很容易找到目前信息(见图1)。从图中可以发现,信息量大且复杂的数据比较适合基于几何的数据可视化技术。因为该技术能清晰地表达出大量复杂数据之间的逻辑关系,能为用户勾勒出一幅流程清晰、逻辑明确的几何图像。当然该方法也有不足之处,有时由于信息数据过于复杂,数据量又特别大,这样勾画的几何图像有重叠的可能,这样一来用户会很难读懂图形的含义。

2.2面向像素的数据可视化技术

可视化系统VisDB开发应用充分证明了面向像素数据可视化技术的强大优势。该技术原理简单易懂,如图2所示,右边设为一个数据项,经过某种映射变换对应到特定的屏幕上,与这个屏幕上的像素对应,一个数据项能对应几个屏幕上的窗口表示不同的数据属性值。

[3]有两种方法可以实现面向像素的信息资源可化技术,一种是单独查找,另一种是利用查找。第一种方法主要是对数据项进行排序,排序的依据是数据项的属性值,然后在显示屏上显示排序后的数据值,这种方法使用起来既方便又有很有效果。第二种方法通过数据值与所查目标数据的一致程度对颜色进行匹配。该方法的流程非常切合实际,它采用特定的距离函数来估算数据项的属性值和查询值从而得到匹配值。这种方式能如实地反映两者之间的符合程度,距离函数的值越小说明所查找的数据越接近目标信息数据。

2.3基于图标的数据可视化技术

[3]把数据集中的各个数据项都映射成图标的方式被称为基于图标的数据资源可视化技术,该技术在可视化技术中也是非常重要的。这种技术中的图标部分是由数据项的维数决定的,数据项是几维该图标就有几部分,图标的部分与数据项的维数是一一对应的关系。

近年来,基于图标的可视化技术不断发展,并逐渐形成多个分支,其中最典型的当属Chemoff-faces,它是目前基于图标的可视化技术中应用最广的。通过应用该技术能将数据项的两个维度映射当作显示的两个坐标,其他的维度映射成具体的形状。

2.4基于层次的数据可视化技术

[2]该项技术比较适合应用在层次关系比较明确的数据集合中,这一点从基于层次的数据可视化技术的名称中就能看出。树图是基于层次的数据可视化技术的一种,具有代表性。该技术中树上的每个节点代表着数据项的属性值,各个子节点相加的和等于父节点的值。该技术能够把复杂的数据集进行分层处理,能够理顺数据的结构。

[BT3]3数字图书馆馆藏资源可视化结构模型研究

3.1馆藏时间结构模型

数字图书馆馆藏时间结构模型主要是对馆藏时间顺序的研究,该模型有助于对数字图书馆的各类图书信息进行整理和规范。通过对馆藏资源信息的整理能够发现馆中图书量的增长情况,能够如实反映图书馆的图书使用情况。

3.2馆藏学科分类结构模型

随着现代信息技术的不断发展变化和科学技术学科间的交叉及渗透,在高校及相关教育部门内出现了各种各样的学科分类新标准,更值得一提的是,这些学科还在不断地细化及分解。馆藏数据信息资源学科分类在很大意义上是为了观察并及时反映图书文献资源的内容和信息能否为现代信息化教育事业、科学技术研究及社会职业分工等提供一些数据,为决策者服务。馆藏资源学科分类模型可以利用图书分类信息表去了解城市图书馆及高新图书馆内文献的学科覆盖范围,特别是重点学科文献的种类和数量的变化情况,为图书管理者对图书文献的使用及采购决策提供依据。

3.3馆藏等级结构模型

现代数字图书馆馆藏数据资源由于管理和科研的需要被人为地划分为一些特定的等级,如目前比较流行的划分原则有图书馆藏的作用、图书馆特定的相关功能需求、图书阅读人员的文化水平情况等。图书馆藏数据资源信息等级结构模型不但能表现出现存图书文献资源的利用情况,还能反映出阅读者对知识文化需求的解决情况。世界各地的图书馆管理者对馆藏数据文献资源的等级具有各不一样的划分标准,目前我国较多地方的图书馆部门及相关院校的图书馆机构采用五等级法,即划分为甲、乙、丙、丁、戊级。现阶段教育部对大多数本科院校馆藏数据资源的评估主要是依据其藏书的数量评定的,如大于180册/人为A级,大于150册/人为B级,大于100册/人为C级。我们可以通过这些馆藏数据资源的等级结构模型来分析图书馆内阅读者的平均可借阅文献种类和数量,同时还能看出这些数值随着时间的推进或是随着馆藏资源学科信息分类后的变化情况,能更好地实现馆藏资源的可视化。

[BT3]4数字图书馆馆藏资源可视化服务设计

4.1可视化服务总体架构设计

笔者在考虑图书馆学习者的实际需求的情况下,在原来B/S系统的基础上设计了一种面向用户的可视化服务构架。该系统是在图书馆馆藏资源的基础之上设计的一种面向用户的可视化服务架构,主要有可以用来展示可视化服务所有类型的服务效果情况的前台浏览器UI;可以作为请求馆藏所有数据资源的可视化服务情况的中间数据通信部分;可以用来组织、整理监控馆藏资源数据库和其模型库的后台服务器部分(见图3)。

如上图所示,图书馆馆藏可视化服务系统需要设计的模块有:结构可视化设计、馆藏资源覆盖率可视化设计、馆藏资源利用率可视化设计及数据模型管理及其通信部分设计等。

4.2图书馆藏结构可视化模块设计

针对现代图书馆内馆藏资源的结构及其数据模型的可视化主要是在几何元素的基础上建立的可视化相关理论技术。目前较多利用的方法是平行坐标法,但具体实现这种方法的工具是报表,这是因为馆藏数据资源模型的影响因素较多、纵横坐标的参数值特别复杂且具有不确定性。但这种方法使用的报表的结构形式与以往其他形式的老版本报表有很大不同,主要体现在此报表有动态变化的数据、趋势性的参数值、报告和表格融合成一体的结构。

馆藏资源数据结构模型的可视化报表的图表内容包括图书的种类数量、每类型图书的册数量、各种类型之间的比例关系、平均每人可借的最大数量图书比例等。报表中的图和表分布代表不同的意思,其中条状的图形表现的是图书的类型数量和册数量;线状的图形表示的是比例情况。值得一提的是,图书馆可视化报表方便了人们对每个维度表示内容的数据形式的了解,还具有直接联机打印数据可视图片的功能。

4.3数据通信与接口模块的设计

要想实现图书馆馆藏数据的可视化,前台界面效果和系统后台管理服务器应直接连接起来,其需要系统具有数据资源间的相互通信及其间的数据接口。此模块设计中的数据接口功能主要是:①利用对集成电路芯片的封装来显示图书馆馆藏资源信息数据。②由外观页面显示平台对上面的数据接口进行数据和信息的技术访问。③资源服务系统平台的数据接口接到访问信息后便与后台服务器进行数据和资源信息的交互,实现数据的相互传递。其中,可视化系统平台提供的数据服务形式是已经经过封装后的具有相对统一的标准格式的数据,其通过服务器再传递到前台显示界面内,此时具有可视化特定显示要求的信息数据已被传递结束(见图4)。

[T0523.TIF,B]

[TS(][HT5”SS][Z]图4数据通信接口模块框架图[TS)]

图书馆馆藏资源信息可视化服务系统设计因为有了数据通信接口这个特定的模块,从而使系统内部前后台的设计研发具有相对可以分开的效果,因此使用过程中如果发现系统有任何不足和需要改进的地方,都可以对此可视化服务系统进行性能优化和功能改进以及系统信息扩展。

[BT3]5结论

随着可视化技术的不断发展和逐步完善,数字化图书馆馆藏资源的可视化也会逐渐成熟。并且,可视化技术的应用将会进一步提高数字图书馆信息服务系统的服务能力,从而使其能更好地发挥数字图书馆信息服务的功能。

参考文献:[HTK]

[1][ZK(#]吕红,邱均平,李小涛,等.国内馆藏资源可视化研究进展分析.情报资料工作,2014(1):57-60.

[2]邱均平.专题:馆藏资源可视化研究.情报资料工作,2014(1):24-30.

[3][3]刘晓娟,周建华.数字资源可视化的理论、技术及方法研究.图书杂志,2015(2):102-108.

[4][3]王洪娟.高校数字图书馆馆藏资源建设与维护发展研究.绥化学院学报,2013(2):59-64.

[5][3]贺德方,曾建勋.基于语义的馆藏资源深度聚合研究.中国图书馆学报,2012(7):12-17.

[6]张洋,谢卓力.基于多源网络学术信息聚合的知识图谱构建研究.图书情报工作,2014(12):32-37.

[7]侯婷婷.图书馆藏书质量评价指标体系优化分析.才智,2012(20):336-341.

[8]刘文远.基于雷达图表示的多维数据可视化分类方法.系统工程理论与实践,2010(1):178-183.

[9]刘慧.图书馆馆藏资源建设评估研究.农业图书情报学刊,2015(2):55-61.[ZK)]

[Y](编校:严真)

上一篇:数字图书馆信息资源绩效评价体系构建研究 下一篇:函授学生的信息素养教育缺陷及弥补思路探讨