机构知识库长期保存模式选择研究

时间:2022-10-04 10:15:38

机构知识库长期保存模式选择研究

摘 要 机构知识库的长期保存是数字资源长期保存的重要内容,也是开放存取顺利开展的重要保障。本文在介绍长期保存模式的基础上,分别从大学、公共图书馆、研究机构和政府部门四个领域机构知识库长期保存模式的选择来分析机构知识库长期保存的问题。

关键词 机构知识库 数字保存 长期保存 保存模式

中图分类号:G250 文献标志码:A

一、前言

由于机构知识库中存有大量的非正式的科研资料,对于一个机构知识库来说长期保存功能是保证其开放存取顺利开展的重要保障。由于不同机构知识库创建模式的不同、创建目的的差异造成机构知识库选择的保存模式也不尽相同。本文主要从机构知识库保存模式的角度来分析机构知识库长期保存的问题。

二、长期保存模式

纵观国内外长期保存项目,数字资源长期保存活动的组织方式主要有三种:(1)政府主导方式,如美国国会图书馆建立的国家数字信息基础结构和保存项目;(2)资源联盟方式,如英国JISC进行的FAIR项目;(3)成员加盟方式,如美国的LOCKSS项目 。

联合国教科文组织在《数字遗产保存指南》中将数字资源长期保存模式分为集中分布合作保存模式、平行分布合作保存模式、高层分布合作保存和独立保存 。

三、不同机构知识库长期保存模式选择

机构知识库一般由大学、公共图书馆、研究机构、政府部门等创建和维护,并提供专门服务 。对于不同机构知识库长期保存模式的选择笔者主要从以下四个部门进行介绍。

(一)大学。

大学机构知识库主要是为了本机构师生研究成果和教学资源的共享和保存,体现机构教学特色、打造学校品牌,所以大学机构知识库的建设带有一定的普遍性,即以本机构为核心,每个独立机构以其下属院系、部门为基础,构建属于本机构的OA机构知识库。这种创建模式的优点体现在便于资源的集中管理、易于实现政策的统一、体现机构的个性化特色。但这种创建模式的缺点也不言而喻,比如建设成本高、收录资源有限等。国内外很多机构知识库都是采用这种本体创建的模式,例如国内的厦门大学机构知识库、国外的英国南安普顿大学机构知识库、美国麻省理工学院机构知识库等。

大学机构知识库也可以选择集中合作的保存模式,由一个大学机构知识库牵头负责数字资源长期保存活动的总体规划与数字资源的长期存储计划,同时多家相关机构,按有关规定联合对数字资源进行存档与建设。在E-Scholarship计划中,加利福尼亚大学的数字图书馆为各学院的图书馆、研究机构、实验室以及博物馆都设置了节点,为用户提供本地保存服务,但同时要按照CDL分布式系统的要求实现公共保存的需求。

(二)公共图书馆。

公共图书馆作为一个国家的基础公共服务设施,相对于大学图书馆和专业图书馆有着自己独有的特征。首先它不以营利为目的,其次经费主要由国家财政拨给。公共图书馆也是机构知识库的创建者之一,它的主要目的就是充分实现资源的开放存取,最大程度地实现数字资源的广泛传播和共享。

随着图书馆机构知识库数字资源的爆炸式增长,存储系统必须具备充足的存储空间和灵活的扩展性,才能适应目前对海量数据的保存要求。

对于这些不利因素,在公共图书馆的机构知识库长期保存中要从系统的可扩展性、协同工作、支持适时备份和迁移、低成本几个方面考虑。笔者针对公共图书馆的机构知识库发展需求将云存储的概念引入长期保存解决方案中。云存储是在云计算概念上延伸和发展出来的一个新的概念。它是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统 。云存储主要提供的是存储服务,通过网络将本地数据存放在存储服务提供商(SSP)提供的在线存储空问里。原本需要存储服务的用户不再需要建立本地的数据中心,通过向存储服务提供商申请存储服务,避免因存储平台重复建设而支付昂贵的软硬件基础设施投资。

Fedorazon项目是基于云存储的一个机构知识库实际应用案例。该项目主要是为了寻找一种解决方案,来处理大规模的机构仓储所面临的系统存储数据量不断增加和数字资源长期保存的复杂性不断增加的问题,用以帮助英国高等教育和继续教育(UK’s HE and FE)机构库的建设。

该项目的技术思路是在亚马逊的云平台上部署Fedora Commons机构库的软件。首先在计算层EC2(Elastic Compute Cloud,弹性计算云服务)上,为服务使用者创建一个虚拟的 AMI(Amazon Machine Image,亚马逊机器映像)。然后在API(Application Program Interface,应用程序界面)上面对机构库运行的软件环境进行部署和设置配置,具体包括机构库运行所需的服务器类型、操作系统的版本和相应的应用程序等等。在存储层,将需要保存的数据通过EBS存放到亚马逊云平台的简单服务S3上,最后在保存层开放的API将S3中存储的数据备份到LOCKSS系统中。

(三)研究机构。

研究机构创建机构知识库的目的之一是发表自己的科研成果,通过知识的传播和共享来树立自己在这一领域的学术地位,其次实现领域间知识的共享与交流,提升本机构的科研实力。

随着研究机构之间的交流与合作的加强,很多研究机构通过联盟的形式合作创建机构知识库,一方面可以实现资源的共享共建,另一方面也可以互相依托,增强建设实力。笔者认为研究机构知识库的创建可以采用以下模式:首先各机构知识库成员分别建立本研究机构的知识库并保证能够实现独立搜索;其次在各研究机构之间构建统一检索平台,构建一个集中的采集并存储元数据的搜素数据库,但仍然把原始数据保留在各研究机构的知识库之中,这种模式下,每个成员都保持独立性,各研究机构负责对本机构的知识库进行内容管理以及政策制定,但必须强调的是各联盟成员之间要保证遵循相关协议。

(四)政府机构。

随着互联网的快速发展,电子政务、办公OA系统使政府信息很多都是以电子格式产生。虽然数字格式的资源更有利于资源的共享,但与其他实物载体的政府信息资源相比,电子格式的信息更为脆弱、消失速度更快。

政府机构知识库长期保存应该以OAIS开放档案信息系统参考模型为标准,构建政府机构知识库长期保存系统。OAIS参考模型作为数字资源长期保存领域一个重要的参考模型,它提供了各种框架,包括对存档概念理解的框架、数字资源保存机构涉及的功能框架、提供包括命名和概念在内的框架。其次,它提供了数字信息保存的环境模型、信息模型和功能模型。环境模型主要涉及系统内部同外部环境的关系,信息模型涉及的是对系统内的信息流的描述和定义,功能模型涉及到系统内部构成及各功能模块的实现。

四、结论

综合上述分析,笔者认为不同创建模式的机构知识库在长期保存模式的选择上不尽相同。对于那些资金有限,或同样隶属关闭的中小型机构来说,集中合作的保存方式不仅能够实现知识库资源的共享,还能节约建设和保存成本,共享技术与资源;对于国家层面的资源的共享共建来说,不妨采用分布式合作保存的模式,这样既可以将管理压力分散到本地机构知识库,同时还能最大范围实现资源的统一集中管理。对于高校或科研机构既可以独立管理资源也可以形成联盟,集中管理。但是,无论应用哪种组织和保存模式,是独立的还是合作的,是集中的还是分布的,在模式背后都需要一整套完善的运行机制来保障其可持续发展。

(作者:河北大学研究生,研究方向: 信息行为研究、数字资源长期保存)

参考文献:

[1]陈月婷,李春明.开放存取资源长期保存模式探析.图书情报工作,2008(5):33-36

[2]宛玲.数字资源长期保存的管理机制.北京图书馆出版社,2006:204.

[3]蔺梦华.基于OA的开放仓储.情报资料工作,2005,(6):61-62

[4]唐箭.云存储系统的分析与应用研究.电脑知识与技术,2009,(20):5337-5338

上一篇:中小企业信息化项目建设启动前需预研究的问题... 下一篇:完善社会保障 改善收入分配探讨