档案基础数据库建设及其对提高数字化档案利用效果的作用

时间:2022-07-07 09:20:13

档案基础数据库建设及其对提高数字化档案利用效果的作用

档案基础数据库建设是实施档案信息化和建设数字档案馆的基础性工作之一,是实现档案信息资源的集成共享,统一管理,高效检索和方便利用的基础信息存储结构,更是国家信息资源数据库建设的重要内容。

一、档案基础数据库建设的紧迫性

今天,我们处于信息技术快速发展的知识经济时代,国家、城市综合服务资源库的建设是社会发展的需要,是加强政务公开、实现便民服务的一项基础性工作。我国已经在人口、法人、自然资源与宏观经济四大数据库的建设方面取得较大成效,档案作为人类社会活动的历史记载,档案资源的开发利用和档案基础数据库的建设已经成为国家信息资源建设的重要组成部分。可以说,档案基础数据库的建设已经成为各级各类档案馆面向社会提供档案资源利用服务的基本职能,成为我国整合档案信息资源、弘扬民族文化、提高民族素质的历史性课题,同时也是我们档案工作者采用现代化手段记忆当今社会改革、建设、发展真实过程,支撑社会经济发展的历史性责任和义务,更是政务公开,提高办事效率和促进科学决策的依据。

美国、加拿大、澳大利亚、德国、韩国等一些发达国家已经在档案数字化、文档一体化、数字资源长期保存、数字档案馆等方面开展了一些预言性、前瞻性和应用性研究,相继制定了电子文件管理的元数据格式与规范,研究开发档案管理信息系统、档案资源共享的网站系统的建设思路和方法。2003年2月国际档案理事会档案著录标准特别委员会正式公布了新修订的第二版《规范记录著录规则》,于2004年第十六届国际档案大会上正式颁布修订后的第二版《规范记录著录规则》,该档案著录规则对规范档案目录数据库的检索服务,建立高质量的目录中心具有重要的参考价值。发达国家的经验告诉我们,建设基础数字资源库的宗旨是遵循国际标准,构建跨区域的开放档案的共享资源库,针对公众对档案资源的利用需求提供高效率的查准、查全服务机制。

目前在我国,也有一些省市级档案馆开展数字档案馆建设,制定了符合各地区自己需求的数字档案的元数据格式规范,建立了档案目录中心,提供部分开放档案信息的检索服务功能,具有典型示范作用的有福建省档案基础数据库建设,它是基于分布式数据库,在原来单机和局域网络的基础上开发完成,它连接了若干分布式数据库,并建立了档案目录数据库,档案内容数据库,等。但是多数档案馆还没有真正建立全面的、系统的、面向公众查档需求的档案基础数据库,而只是建立了一些专门的特定主题的档案数据库,只能满足一些局部的特定的用户需求,特别是开放的档案信息资源没有实现集成,信息结构不统一,档案数据不系统、不完整、不共享,更为严重的是没有形成一个统一的能够描述数字档案资源的格式规范和建设档案基础数据库的标准方法、实现档案资源的整合、组织与存储的技术方案和行之有效的建设思路;另外,还由于建设档案基础数据库的关键技术,如海量、非结构化的数据存储解决方案,基于知识管理的数据仓库和数据挖掘等技术尚未在档案信息化领域得到广泛应用,这些因素都大大降低了档案基础数据库建设的速度和质量,致使各类档案资源难以形成一个统一的资源库整体,限制了档案资源的深层次挖掘和广泛化利用。

因此,研究档案基础数据库的元数据标准集、数字化档案信息的格式规范以及档案基础数据库建设的思路和方法、各类结构化和非结构化档案数据的组织、存储和检索利用的关键技术及整合应用方案,以及提供档案信息检索服务的有效机制将成为当前档案馆基础数据库建设的重要的基础性工作。

二、档案基础数据库建设的工作内容

建设档案基础数据库是一个长期的、复杂的系统化工程,它包括各类标准规范的制定、档案信息的组织与存储、档案资源的整合与集成、数据存储服务器和提供数据检索服务的软硬件平台的建设以及开展基础数据库建设的组织与团队及其长效服务机制的形成。而在众多的数据库建设工作中,标准规范与数据资源的滚动建设则是最基本的也是最重要的内容。

1.标准规范体系建设。包括元数据格式规范、管理规范和业务工作制度三大方面。制定数字化档案的存储标准与格式规范,明确档案数据库的存储与访问方法。包括各门类数字化档案元数据的组成、结构、描述方式、著录规则与要求;各种类型档案内容(包括文本、图形、图像、音频、视频以及非结构化信息)的描述方法、格式要求、存取方式、访问机制等;档案内容与档案元数据之间关联模型的定义、检索方式的确定;档案目录数据库和内容对象的分级存储、统一管理、集成共享方式和要求。

制定档案基础数据库建设的管理规范和制度,明确数据库建设过程中的程序化和规范化操作方法。主要包括数字化数据库的建设步骤、方法和要求;数字化档案信息的网络存储、离线备份和灾难备份与恢复的功能、性能、技术规范和管理规定;数字化档案信息的安全管理规范、备份方式与要求;备份的数字化档案信息的管理方法等;档案基础数据库的原始性保障措施,规定如何采用身份认证、数据加密、电子签名等技术确保档案的真实、完整、有效和凭证性作用;数字化档案信息的授权访问制度,定义开放档案、控制使用档案、档案的分类存储和授权管理与访问制度。

制定档案基础数据库建设的业务规范和制度,明确接收数字化档案信息和开展馆藏档案数字化加工的工作要求。主要包括数字化档案的归档、移交、接收的工作制度和内容、范围、方式、方法及安全保障要求;开展馆藏数字化加工的全过程工作方法、安全制度、保密措施、人员要求等;档案基础数据库的滚动建设与完善制度和工作要求。

2.档案信息资源滚动建设。主要包括数据库平台的建设以及数据著录、数据处理、数据整合与数据备份系统的建设。数据库平台是指存储档案数据的软硬件存储系统,包括网络存储设备的选型、安装、调试和使用,数据库管理系统,存取数据的软件平台,多门类档案数据存储方案的确定和实施,以及数据存储系统的升级、维护与持续服务的计划和工作要求等。档案数据存储系统的建设主要涉及到需求分析、方案确定、设备的购买及其与服务器的连接等内容,网络存储设备一般应与服务器的购买同步考虑。多数服务器供应商提供存储解决方案,并提供服务器与存储设备之间的集成与互联。

数据著录系统是获取档案信息的门户应用,包括档案内容信息、档案目录和标引等的录入、修改、保存以及电子文件的上传等内容,著录系统的建设主要是要将标准规范加以实施,在数据入口处将不合规范的数据进行预处理,真正将符合档案管理和保存要求的数据捕获到数据库存储系统中。

数据处理系统是实现批量数据导入、导出、挂接和规范性校验的自动化数据著录系统,一般由技术支持人员来完成,系统的建设需要根据档案业务工作的需求,总结和预先定义数据处理的标准和自动处理规则。

数据整合系统是在数据处理之前,根据档案资源管理的需要,对档案信息资源进行分门别类的整理与规范化处理,以方便实现档案信息资源的集成与共享。

数据备份系统建设的目的是提高数据的安全性,根据备份方案的不同,可以采取在线备份、脱机备份两种方式。建设数据备份系统,一方面要建立实施备份的软硬件支撑平台系统,一方面要制定备份的策略和计划,并在工作中实施和维护,同时还需要对备份的数据实行全面的管理,这三方面内容缺一不可。

三、档案基础数据库建设是实现档案资源共享、开展社会化服务的基石

社会信息化使档案信息资源面临着一个全新的生存环境与发展空间。美国档案学者杰拉尔德・汉姆先生曾指出:档案应该记载“人类生活的方方面面”,档案工作者要“创造一个反映普通百姓生活喜好、需求的全新的文献材料世界”,档案馆藏是反映“人类生活的广阔领地” ①。因此,档案资源唯有回归社会,得到最大限度的利用,才能体现档案保管的价值和作用。事实告诉我们,实现档案信息资源的集成化管理和共享化利用是档案贴近公众、服务社会的最佳解决方案。

要实现档案信息资源的共享化利用,首先必须在档案基础数据库的建设上下功夫,而档案基础数据库的建设必须在档案的形成、存储和提供利用的各个环节加以重视。档案的形成是一个从个体知识到组织知识,再到社会知识转换的文化积累、动态跟踪和滚动发展的历史记忆过程,档案的开发与利用则是人类传承文明、创新发展的进步与成长的历史形成过程。如图1所示。这两个相互衔接、彼此推动的过程,循环往复、推陈出新构成了人类社会的知识化动增长(Adaptive)和社会化自适应的档案资源形成过程模型。这表明了档案文化通过“传―承―积累―发展―传”这样一种类似于文化加工厂的生产工序,随人类自身的代代繁衍而形成民族文化的生生不已、无始无终的传承环链②。

图1档案资源的知识化共享和社会化服务过程模型

进入21世纪,我国的电子政务与各行各业的信息化已经进入了以知识管理为核心的快速提升和综合运营的重要发展阶段,信息技术的发展也把知识管理推到了一个核心重要的位置,“以知识为基础的经济社会” 的提法更表明了人们对知识和技术在经济增长中的作用有了更充分的认识。可以想象,未来的互联网是一个丰富多彩的“知识网”,是一个储存综合知识的文化资源大仓库。档案作为人类社会活动的原始记录者和忠实承载者,记录了人类的社会成果的同时也揭示着人类文化,它是民族文化遗产的重要组成部分。同时档案在文化传承中占据着举足轻重的地位,发挥着不可替代的作用, 正如张辑哲在其《维系之道―档案与档案管理》著作中所谈:“正是由于有了档案与档案管理,人类才能够不断地在继承中存在、发展,在存在、发展中延续,不断使自己真正成为一个连续的时空整体。档案与档案管理是人类社会时空统一性和连续性的维系之道……”。

档案信息资源必将会成为未来“知识网”中不可或缺的重要组成部分,因此,在开展档案信息化建设过程中,首要重要的事情是建设高质量的档案基础数据库,充分利用数据挖掘、数据分析工具提供快速检索与服务,实现档案信息资源的社会化共享,才能真正体现档案保存的价值和意义。

注释:

①.F.杰拉尔德,汉姆,刘越南译,档案边缘,《山西档案》,1999年第1期.

② 黄萃、薛四新,民族文化的传承与档案资源建设的思考,《档案与建设》,2003年第9期.

(作者单位:陈永生:中山大学信息管理系广州510275;薛四新,清华大学档案馆北京100084)

上一篇:着眼社会需求 提高利用效率 下一篇:纸质档案数字化加工中的几个问题