基于XML语言的图书馆共享数字资源存储的实现

时间:2022-10-30 11:17:49

基于XML语言的图书馆共享数字资源存储的实现

摘 要 图书馆共享数字资源的检索和存储是图书馆数字资源建设的重点。在云存储模式下,如何有效管理庞大的数字资源,尽快有效检索到所需资源,减少资源共享中的重复存储?提出一种基于XML语言的数字资源存储格式,这将使得对已经存在的书籍资料的整序和应用变得较为简单,方便检索,在共享资源存储时具有一定优势。

关键词 数字资源;XML语言;图书馆

中图分类号:TP312 文献标识码:B 文章编号:1671-489X(2013)09-0069-02

Design of XML-based Shared Library Digital Resources Storage//Tang Wenling, Li Chunyan

Abstract Retrieval and storage of the shared library digital resources is the focus of the construction of the library digital resources. Based on cloud storage mode, how to manage a huge digital resources effectively, retrieved as soon as possible, and reduce duplicate resource storage, this paper propose a storage format based on the XML language, which will make the books already exist collation of information and applications become more simple, convenient retrieval, has certain advantages in shared resource storage.

Key words digital resources; XML; library

1 前言

高校图书馆在高校信息化建设中发挥着重要作用。随着图书馆信息量的剧增和“数字化文献”载体形态的迅猛发展,图书馆必须开始运用起数字化技术贮存和传递文献信息。当今大部分高校图书馆都实现了资源数字化,但因开发软件不同,在运用时会针对不同的格式要求下载不同的阅读软件,给读者带来一定的不便。存储的格式也各种各样,使检索资源的有效性降低。各高校图书馆资源建设存在大量的重复,如今信息化社会步入云时代,高校图书馆资源共享已经成为图书馆发展的大趋势,如何实现图书馆资源的共享和减少数字资源开发的重复?基于XML语言的图书馆共享数字资源存储格式的开发将为解决上述问题提供参考。

2 XML的特点

XML(Extensible Markup Language),意为“可扩展标记语言”,是用于标记电子文件使其具有结构性的标记语言。

2.1 简单

XML仅仅是存储数据。事实上XML与其他数据表现形式最大的不同是:它极其简单。通过XML可以用纯文本文件来存储数据,它可以用来在文件或数据库中存储数据。

XML在数据的交换、存储和共享方面有着独特的优势。现在市面上的数据库种类繁多,虽然数据库之间大多可以相互转换,但是它们并不兼容,搜索多样的不兼容数据库更是无法实现的。但是XML可以将不同来源的结构化数据很容易地结合在一起,后台数据库和其他应用得来的数据就能够在中间层的服务器上进行集成了。

2.2 易于结合

XML的简单使其易于在任何应用程序中读写数据,这使XML很快成为数据交换的唯一公共语言,意味着程序可以更容易地与Windows、Mac OS、Linux以及其他平台下产生的信息结合,然后可以很容易加载XML数据到程序中并分析,以XML格式输出结果。

2.3 灵活

XML保留了SGML(标准通用标记语言)的结构化功能,这样就使得设计者可以定义自己的文档类型。XML同时推出一种新型文档类型,开发者可以不必定义文档类型,这使得XML极其灵活。

3 设计方式

3.1 XML文档处理

在图书馆检索系统中(以北京邮电大学图书馆为例),检索要素包括题名、出版社、索书号、作者、标准号(ISBN)、主题词、图书条码、分类号、题名缩写,这些基本上也就是一本图书在检索时会用到的全部要素,当然不同的图书馆检索系统中要素可能不完全相同,检索要素还可以包括出版时间、字数等。

以北京邮电大学图书馆检索系统中用到的图书要素为例,一本图书的DTD定义如下:

< ! ELEMENT book (title , author+ , callnumber , press , isbn , keyword ?, barcode , clc , owner+) >

< ! ELEMENT title (name , abbreviation ) >

< ! ELEMENT name (# PCDATA ) >

< ! ELEMENT abbreviation (#PCDATA ) >

< ! ELEMENT author (#PCDATA )>

< ! ELEMENT callnumber (#PCDATA )>

< ! ELEMENT press (name , date? )>

< ! ELEMENT name (# PCDATA ) >

< ! ELEMENT date (#PCDATA ) >

< ! ELEMENT isbn (#CDATA ) >

< ! ELEMENT keyword (#PCDATA ) >

< ! ELEMENT barcode (#CDATA ) >

< ! ELEMENT clc (#CDATA ) >

< ! ELEMENT owner (#PCDATA )>

这个DTD完整地表述了一本图书所包含的主要信息:题名及缩写、一个或多个作者、索书号、出版社名字及出版时间、ISBN标准号、主题词(关键字)、图书条码、中图分类号。作者后面的“+’表示至少应有一个作者,主题词及关键字后的“?”表明可以省略,#PCDATA表示为字符串型。

由于图书检索系统与论文期刊检索系统一般是独立的,所以论文期刊的DTD也可另行设计,实际上与图书的DTD大同小异,但在元素设置上略有不同。期刊论文的检索要素更多,以知网中国期刊全文数据库检索项为例,除了图书的这些要素外,还包括关键词、摘要、刊名、参考文献、基金、ISSN等。

一个论文期刊的DTD可以设置为:

< !ELEMENT article ( title , author+ , abstract? , keywords? , content , reference ) >

3.2 显示

当需要将图书格式化输出显示在屏幕上时,就要将XML文档变换为HTML文档,可采用XSLT将XML文档格式化显示。XSLT是扩展样式表转换语言(Extensible Stylesheet Language Transformations)的简称,这是一种对XML文档进行转化的语言。

大部分软件如FrameMaker、Microsoft Office中的MS Word、Excel等都支持XML,所以XML文件转换为其他格式文件也相当方便。

4 基于XML存储方式的优势

4.1 扩展方便

对于不同高校图书馆图书要素定义不同的情况,或是图书本身要素不全的情况,此格式扩展非常方便。例如:若有出版时间这个要素,将其作为press的子元素date并标记为可以省略,这样有些图书有出版时间这个要素,有些出版时间不明的则可以省略。在此DTD基础上,可以加入其他各要素,方便管理及查询。

4.2 在共享资源时减少重复存储

相关图书馆间可构建共享空间,将数字资源放于存储资源层,用户只需将电子设备连接至互联网,就可访问和获取所需的任何数据。在实现共享资源时,会因为重复资源而浪费大量存储空间。DTD中有一项owner元素表明了此资源的拥有者,“+”表示至少有一个拥有者。

增加此元素后,若发现有重复资源,将资源拥有者都加入此表项后,重复资源即可删除,为存储更多其他资源做准备。资源拥有者为各大高校图书馆,可以用各高校缩写或是更为简洁的标号来表示。

4.3 兼容性好

随着云计算技术的发展,云存储模式下图书馆数字资源的建设成为当今热门讨论话题。在云存储模式中,当用户提交一个查询请求时,云存储的管理系统将调用云中的所有服务器和存储设备同时搜索众多的数据库,然后将结果返回给用户。另外,除了使用PC外,用户还可以通过PDA、手机等终端方便、快捷地获得云存储中的相关信息和服务,无需考虑使用的是哪个数据库、哪个存储设备。

而XML满足了两个基本的需求:将数据和表达形式分离;在不同的应用之间传输数据。

5 结束语

基于XML的存储方式能更好地帮助各高校实现共享资源,不仅方便大家交流和查找资料,而且能实现资源高效利用,减少资源浪费现象。

参考文献

[1]曾祥文.云存储模式下图书馆数字资源建设[J].软件导刊,2011(12):165-167.

[2]刘姝.对高校图书馆建设数字资源存储系统的思考[J].大学图书馆学报,2008(6):75-78.

[3]邵泳兵.基于XML的考试系统的设计[J].中国科技信息,2006(5):86-87.

上一篇:试谈我国税收流失问题及治理对策 下一篇:中国第五大省