提高档案数字化加工质量对策

时间:2022-10-06 07:40:33

提高档案数字化加工质量对策

档案数字化加工质量的好坏,将直接影响档案信息的开发利用。作者以中原油田档案馆数字化加工实践为例,谈谈自己的看法:

1 档案数字化加工成果存在的主要质量问题及原因

目前,数字化加工成果存在的主要质量问题是:图像处理不彻底、不清晰;文字识别率不高;有漏页、正文与底稿未分开等。导致这些问题的原因,主要有:

1.1 档案原件质量问题。由于档案原件内容不清晰、纸质不适应扫描、破损等原因,造成扫描图像不清晰、文字识别率不高。

1.2 操作人员业务技术不够熟练。由于操作人员技术不熟练,对分辨率选择不正确,造成图像不清晰、文字识别率不高。

1.3 软件功能不够完备。由于数字化加工软件版本低,缺少必要的处理功能。

1.4 操作人员工作粗心,图像处理不彻底,出现黑边、偏斜、污点等。

2 提高档案数字化加工质量的对策

2.1 邀请专业技术人员对操作人员进行业务技能培训,使其掌握数字化加工的流程、设备操作方法、技术标准,熟练掌握分辨率的选择技巧等,能针对不同图像、不同幅面的档案原件选择合适的分辨率,以保证图像质量处理;会对破损严重、无法直接进行扫描的档案进行技术修复,折皱不平影响扫描质量的原件进行压平或烫平等相应处理。

2.2 组织操作人员认真学习《纸质档案数字化技术规范》、《照片档案管理规范》、《电子文件管理规范》等规范和标准化文件,使其熟练掌握标准要求,在工作中减少盲目性,降低出错的可能性。

2.3 配备多种新型扫描设备。(虹光AV3300)高速扫描仪,有平板扫描和自动送稿器连续多页扫描(高速扫描)两种工作模式。该设备适合纸型统一,且小于A4的纸张。虽然,它也有平板扫描的功能,但必须要求纸型小于A4。对于档案中很多的统计报表、工资发放表、报告及图册等(多为A3纸)则不适合。还有一些档案原件经专业印刷厂印制,装订精美(如各种汇编材料),不宜拆分,纸张虽然小于A4,能在该扫描仪上手工逐页扫描,但要长时间占用高效率的扫描设备,完成效率较低的工作。而(虹光 FB 6000E型)平板扫描仪,则专门用于扫描不适合高速扫描的档案。这样,可以针对不同的扫描原件选择合适的扫描设备,以确保扫描质量。

3 扫描方式的选择

3.1 根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描设备(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案采用小幅面扫描后的图像再拼接的方式处理。

3.2 对纸张状况较差,过薄、过软或超厚的档案,采用平板扫描方式;纸张状况好的档案采用高速扫描方式以提高工作效率。

3.3 对页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,视需要,采用彩色模式扫描。

3.4 在分辨率选择上以满足纸质档案OCR识别要求,方便档案查询、利用为标准。对特殊纸张或档案原件清晰度不高的,通过增加分辨率,调整亮度、对比度等技术参数,直至扫描图像清晰为止;对于同一份档案,清晰度不同,特别是铅笔、钢笔等同时存在的,以文件主要部分的清晰为准;对部分字体很小、字迹密集的情况,可适当提高扫描分辨率,选择灰度扫描或彩色扫描,采用局部深化技术解决;对字迹与表格颜色深度不同的,采用局部淡化技术解决;图纸根据利用需要采用了矢量化扫描加工处理。

4 做好档案数字化的全程控制。在档案数字化过程中,注重全面的质量检查,加强数据的质量控制。

4.1 对数字化前的档案整理检查。要求进行数字化的档案原件须完整、排序正确,无缺码、缺页、重码,对破损、折损严重影响扫描质量的原件应预先修整。

4.2 数字化后的数据质量、图像质量检查。扫描后的文件图像应保持档案的原貌,字迹清楚不失真,幅面摆放正确,亮度适当,既没丢失信息,又无增加信息,无错扫、漏扫。不符合图像质量要求重新处理。

4.3 数据联接检查。通过机读目录数据库与已扫描的档案扫描图像文件进行联接,形成一一对应。

5 强化责任意识。将任务目标分解,责任落实到人,组长作为责任人对数字化加工成果质量严格把关,对档案文件数字化内容的完整、准确、规范性负总责。由操作人员作为档案数字化加工的直接责任人,保证数字化加工成果的质量。

(作者单位:中原油田档案管理处 来稿日期:2012-08-18)

上一篇:企业社会责任建设 下一篇:重要档案异地备份问题及对策