图像自动修正技术在档案数字化领域的应用案例分析

时间:2022-04-06 03:14:48

图像自动修正技术在档案数字化领域的应用案例分析

摘要:数字档案是当前政务信息化建设领域的一项重要基础资源建设工作,如何高质量的完成数字档案采集转化工作是其中的重要环节,面对已经实施的数字档案建设项目,充分利用计算机图像自动修正技术实现数字档案的质量控制可大幅提高工作效率,该技术在未来电子政务建设领域必将发挥日益重要的作用,将为全面推进国家电子政务建设提供重要技术支撑。

关键词:图像;自动修正;数字档案

中图分类号:TB

文献标识码:A

文章编号:16723198(2015)22022601

1引言

随着信息技术的不断发展,越来越多的无纸化应用环境正逐步走进人们的日常生活,各级政府部门的行政管理工作亦逐步向着电子化管理的方向迈进,越来越多的网络信息化平台为政府部门发挥公共管理职能提供了极佳的信息共享及交流渠道。但在实际的工作中,由于大量的原始凭据仍然是以纸质档案的形式保存,难以适应现代化公共管理服务的需要,必须进行批量的档案数字化转换工作来实现集中化管理,目前,通行的做法是通过扫描、拍照等形式将原始档案转换为数字图像,一方面便于传输与检索,另一方面能够在需要的时候,能够以各种形式再次转换为纸质文档,同时数字档案还能为下一步实现图像内容识别如OCR(Optical Character Recognition,光学字符识别)奠定基础。

2档案数字化工作的常见问题

目前,绝大多数的纸质档案数字化工作均采用扫描仪、数码相机等图像采集设备来完成,而相对专业的档案数字化服务机构往往配备高速扫描仪设备来满足高效、批量的数字化转换需求。不同于常见的平板式扫描仪,高速扫描设备通常采用滚筒式的自动进纸器来负责纸张的传送功能,除了速度比普通平板扫描仪速度提升数倍外,最突出的问题是纸张在经过机械传送的过程中很容易发生偏移,从而产生倾斜的扫描图像,这类图像虽然不影响一般肉眼辨识,但是会严重影响图像后续识别处理的速度和精度,例如对倾斜度要求较高的OCR文字识别技术,会大大降低识别的成功率,需要人工干预进行纠偏处理操作方可顺利完成,无形中增加了工作强度与人力成本。而对于传统平板扫描仪采集的图像,由于纸张与反射盖板之间的间隙以及漏光等多种因素,容易在扫描幅面与纸张边界之间形成黑色外框,严重影响图像美观,甚至在一定程度上会增加档案图像的大小,浪费计算机存储空间,这在大批量的档案数字化工作中体现的尤为明显。

相较传统商用领域的数字化档案加工服务,国内电子政务信息化建设亦在不断加快推进档案数字化进程,以组织机构代码数字档案采集工作为例,一般用户通过受理窗口办理组织机构代码业务,需提交营业执照(事业法人登记证、社团法人登记证等各类成立批文)、法定代表人身份证、申请表等多种类型的纸质文书,业务受理人员需要实时的将用户材料进行扫描建档,在熟练操作的情况下,考虑到人工时效性以及设备等各类因素,极容易产生各类倾斜、黑边、缺边缺角等各类数字档案质量问题,必须经过人工二次审核后方能符合归档要求,浪费了大量的人力物力,由此带来的采集效率低下等问题亦阻碍了数字档案的推广与应用工作。

3图像自动修正技术

考虑到数字图像在采集过程中可能产生的各种不确定性问题,各类图像修正技术正逐渐受到信息化建设单位的重视,根据工作机制来看,可大体分为基于图像采集硬件设备的自动修正技术和第三方软件提供的自动修正技术两大类。

基于硬件的自动修正技术主要是通过图像采集设备驱动程序入手,对从光学传感器获得的数字信号直接进行分析,通过特定的算法对标志位像素点进行计算后输出至计算机,其优点是响应速度快,与应用系统无关,可以很容易获得质量较为统一的数字图像,而缺点则是功能较局限、对原始档案质量要求较高、可定制性较差、设备初期投入大等等。目前国内外专业的扫描设备制造商如富士通、柯达等厂家均提供该类型解决方案。

基于软件的图像修正技术种类繁多,而应用比较广泛的自动修正技术均支持无人值守操作且可随应用系统集成。从技术原理上来看,基于软件的图像修正技术基本上是对已经生成的图像文件进行二次处理分析,其中的主要技术包括对图像本身的滤波计算、二值化处理、跃点计算等算法的复用与集成,并通过分析某一区域像素点的分布趋势来完成对图像边界的确认、倾斜角度计算等关键指标的确立,并以此对原有图像进行旋转、像素填充等操作,从而完成整个图像自动修正过程。该方法的优点是适应性广、扩展性好、部署灵活且投入低,非常适合与各类信息化系统进行集成。

4应用案例分析

从以上两类图像自动修正技术的可行性来看,基于软件集成方式的图像自动修正技术显然更加适合各类电子政务信息系统的应用环境,这里仍然以组织机构代码数字档案采集工作为例,分析该技术在数字档案数字化领域产生的实际效益。

组织机构代码数字档案采集工作自2005年在全国范围内启动,经过十年的不断完善,已经建成了覆盖

各类法人机构的组织机构代码数字档案库,已采集的

数字档案图像超过1亿份,并且通过专用网络24小时不间断实时更新。对于如此庞大的基础信息资源,其建设历程横跨了多个信息化发展阶段,其中不可避免的会出现各类问题,主要包括:早期采集倾斜图像未纠正、不同时期图像采集分辨率混乱、黑边裁减或有或无、不同设备采集图像幅面大小不一、人工审核工作量大等问题。以上问题在早期电子政务的信息化建设项目中均具有普遍性和代表性,并且多数是由于早期信息化制度不完善所导致的历史遗留问题,因此迫切需要通过一定的技术手段在保障工作持续性的基础上有效解决图像质量问题。

根据以上的功能需求,基于软件的图像自动修正技术能够完整的实现存量和新增数字档案图像的自动图像质量控制功能,一方面可以通过编写第三方软件的形式,自动对存量数字档案进行遍历扫描,对发现的倾斜角度、黑边、缺边缺角等不符合质量要求的图像进行自动校正。另一方面,通过实时监控新增档案图像的方法,及时对新增档案进行核查,对发现的不合格档案及时进行报警或者直接修改校正,从而实现与业务系统的无缝衔接,将系统的改造成本降到最低。该方法的最大特点还体现在部署的灵活性方面,不但能够通过软件接口支持众多主流的数字图像类型,同时能够利用分布式计算原理,通过改变图像处理客户端数量,灵活调整图像处理能力,在充分利用现有资源的基础上最大限度的保护基础设施投入。

5效益分析

通过自动修正技术的引入,能有效提高数字档案的图像质量,使图像采集效率至少提升35%以上,大大降低了人力成本投入,并且能够避免由于人为操作失误产生错误的概率,增强了数字图像的可靠性,使原有图像采集系统易用性显著提高,避免了二次改造成本,为进一步开展数字档案交换共享提供必要基础。

数字图像自动修正技术集中体现了图像采集处理优化的过程,为传统的纸质档案转化提供一项高效、便捷的技术手段。由于其涉及的应用面非常广泛,可为各类原始档案数据的流通共享提供了一条便利的捷径,对促进政务信息化、提高办事效率、激发市场主题活力,降低行政成本具有重要的意义。

6结语

总体看来,数字档案工作是各类涉及电子政务信息化系统建设中的重要一环,而依赖于人工图像采集难免会出现档案质量参差不齐,可用性较差等诸多问题。行业内的相关标准规范在对图像倾斜、黑框、白边等问题仅提出了原则性规定,在具体执行过程中很难达到完全的统一。

参考文献

[1]杨有,李晓虹.基于线结构分析的档案图像倾斜校正[J].计算机科学,2007.

[2]王海杰.文档影像图像处理中的纠偏与降噪研究[D].杭州:浙江大学,2008.

[3]朱学芳.计算机图像信息资源管理研究[J].现代图书情报技术,2004.

上一篇:±800 kV特高压直流输电系统无功功率研究 下一篇:以职业健康安全管理体系推动安全生产标准化建...