新常态下档案数字化问题研究

时间:2022-08-29 12:58:25

新常态下档案数字化问题研究

摘 要:本文对在新常态下档案数字化,应解决的主要问题做了剖析,进一步明确了怎样解决还原原件,保存数字化的成果及加工存储的成本和有效管理等几个方面,对做好档案数字化提供有益的帮助。

关键词:新常态;档案数字化;研究

在信息化高速发展和利用的时代,档案数字化工作中存在这许多问题,在工作中最影响档案数字化成果的问题主要有,怎样保证数字化档案的能够忠实地还原原件,怎样保证数字化档案的长期保存,怎样减少数字档案加工、存储和利用的成本,怎样对数字化档案进行管理是档案数字化值得研究的课题。

一、科学管理,确保数字化档案真实反映原件面貌

纸质档案数字化工作目的。一是长期保管,即“替代性保管”,使用数字化复本替代原件长期保存和使用和“复本保管”即为重要档案原件制作异地保管的数字化复本。二是以利用为目的的档案数字化同样区分为两种情况:网络利用和非网络利用。非网络利用范围相对有限,主要集中在文献资料的出版和发行;而网络利用是数字化档案利用的主要形式。

档案数字化以利用为主。无论是利用还是保管,图像格式必须具有良好的还原性、安全性,即识读、显示出来的数字文件在内容上应与原件完全一致,能够通过数字签名等技术固化数字文件的内容,防止保管、利用过程中的信息篡改。此外,所选格式必须预期较低的迁移频率和迁移损耗,否则,数字档案会随信息迁移而失去原真性,甚至成为无法利用的“数字垃圾”。目前很多地方的数字化图像以黑白和灰度图像为主,彩色图像多用于照片档案,且分辨率很低。各档案馆进行数字化加工时,基本上遵照“纸质档案扫描方式主要采用黑白(二值)方式扫描。当黑白方式扫描清晰度较差时,采用灰度方式扫描,灰度方式一般采用256灰阶。……照片档案扫描方式可选择彩色或者灰度两种方式扫描”的原则进行,采用的图像格式以TIFF/G4、TIFF/LZW、JPG和PDF为主。对于普通纸质档案,其扫描分辨率一般定为150dpi左右,部分档案馆标准更低,只有50~100dpi。照片档案扫描分辨率一般定为300dpi左右。

二、严格管理,确保数字化档案安全长期保存

数字化文件的要长期安全保存,主要抓好管理系统的保护和维护和文件格式的制度化标准化。

(一)建立起一个能够承担长期数字档案长期维护的一个可信数字仓储TDR系统。传统的档案管理系统显然已经无法满足这样的需求,而OAIS参考模型是数字仓储和数字保存领域重要的国际标准,为数字资源保存提供了全面一致的框架。TDR遵循这一模型,有利于在一个统一的概念、术语和模型框架下,进行TDR的规划建设,易于开展分布式TDR之间数字资源的共享,以及规范化的管理和发展。在TDR中,一个非常重要的功能就是对AIP的维护、更新、技术仿真以及迁移。要做到这点,必须从标准规范和技术手段同时入手。技术标准的是一个不管地自我进化的一个实体,我们在建设TDR时需要考虑到对原有标准的继承和过度,我们应当关注虚拟化技术。

虚拟化技术不仅仅能够为我们节省运维成本,在TDR系统中,更为重要的功用是能够对原有的系统环境进行模拟和测试,使得我们面对突然的技术升级时有充分的适应期和缓冲期。目前,我们已经全面对服务器进行了虚拟化,未来将对存储系统进行虚拟化,通过计算资源和存储资源的统一虚拟化,通过内容管理平台进行系统管理,为构建TDR系统打下一个良好的基础。

(二)采用开放的格式标准,规范制度管理。标准规范方面我们认为国家档案局颁布的《电子文件长期保存版式文件技术规范》是一个非常好的起点,它从标准的角度明确了电子文件的长期保存格式,为未来我们统一归档格式打下了一个良好的基础。不足之处在于仅规范了原生型电子文件的格式规范,而未对其他类型的电子文件的格式规范做出要求,所以尽快针对数字化加工的格式标准和规范进行重新修订和增补非常重要。同时在标准的制定上,应积极地参与国际标准的制定。用制度来规范数字格式的标准,确保标准不走样。

三、多家竞争,科学选择,减少成本,保证质量

一是外包公司要多家选择。最好通过服务外包的形式大力培育中介机构来完成此项工作,以某市为例,该市已有档案服务中介机构30多家,是一个完全竞争性的市场。在一个完全竞争性的市场状态下,商品的价格会自发地限定在一个价格范围之内,而且价格是比较低廉的。该市纸质档案数字化加工的成本约每页0.25元(包括了前处理、加工、质检等环节)。通过市场的完全竞争使得我们在数字化加工上的成本降到了一个相对合理的位置。但随之而来的问题在于,众多的中介服务机构出于对市场的争夺以及自身业务素质等因素,会出现恶性压价以及加工质量较低等问题,而行政许可法的设立使得档案局无法限制这类服务机构的市场准入。做法是对中介服务机构采取登记备案制度。同时,考虑今后将定期对中介机构服务水平和质量的分析评定报告,以期各家服务机构提升自己的业务素质和服务水平。

二是采用了简洁Djvu各式,极大地节省了存储资源。该市完成约XX个全宗约800万页档案的扫描,而仅占据了大约600GB的磁盘空间,由于采用了虚拟服务器,能够非常灵活地分配存储资源,所以我们的存储系统资源利用率非常高。由于Djvu文件小,便于在网络快捷利用,完全能够满足在1Mbps带宽的ADSL线路上的浏览和传输。采取多家竞争,科学存储可在合理的范围减少成本,为推进档案数字化打下基础。

四、规范管理数字化了的档案,是档案数字化的重要环节

有效地管理数字化档案是一个非常重。从电子文件的定义去分析,纸质档案数字化文件也可被视之为一种电子文件。既然是属于电子文件,那么纸质档案数字化文件也应当要遵循电子文件的管理模式,也同样要遵循电子文件管理的原则,也同样要前端控制、全程控制、全过程元数据记录和行为跟踪记录。目前部分的数字化文件的管理不到位,主要原因是不规范。

一是加强混合式档案管理。 在ICA的《电子文件管理系统建设规范及功能需求》中,明确地提出了ERMS系统要能够进行混合式档案管理。所谓混合式档案管理,就是指能够对原生型电子文件、间接型电子文件以及实体档案进行统一的管理。同时,在建设ERMS系统时,我们要考虑各类安全措施的应用,如访问控制、数字签名、防扩散的使用。通过构建一个安全的系统环境来保证其产生和管理的电子文件,无论是原生型的,还是间接型的,在未来都能够保证其凭证作用。

二是存储系统的法规建设。尽管目前我们国家还未出台类似于塞班斯法案SOX或者美国联邦健康保险携带和责任法案HIPAA,要构建一个安全的软件系统环境,如何构建一个安全的、遵循法规的硬件系统环境同样值得关注。

五、结语

在新常态下,档案数字化成为不可逆转的趋势,对其在数字化过程中存在问题的研究,为提升档案数字化的质量、存储和管理及利用有着重要意义。

上一篇:贴近市场需求的服装实践教学改革与创新 下一篇:基于GPS数据的出租车路径选择研究及应用