基于OCR技术的商业银行事后稽核系统

时间:2022-10-16 10:12:47

基于OCR技术的商业银行事后稽核系统

[摘要] 为适应商业银行稽核中心的需要,以OCR技术为基础,设计了一套事后稽核系统,可以完成银行票据扫描、识别和查询功能,并能够将提取的票据信息存入银行源数据库,实现银行柜台业务的自动勾兑稽核。该系统可以极大提高商业银行的稽核效率,节省大量的人力和物力成本。

[关键词] 银行稽核 金融票据 字符识别

一、引言

近年来,随着我国金融业计算机应用水平的不断提高,金融电子化得到了长足的发展,但稽核手段和内控制度的建设相对滞后。现有的集中稽核工作沿袭了传统手工稽核方式,需要对票据凭证二次录入,这项工作几乎占整个稽核工作量的一半以上。并且由于银行原始票据档案资料只有一份,无法实现共享。存放于档案库中的纸质票据不易保存,查询起来也非常困难。这些因素在数据大集中的商业银行中尤其突出,成为制约稽核工作的瓶颈。

针对稽核工作中的票据管理问题,本文借助于目前日益成熟的光学字符识别(Optical Character Recognition,OCR)技术,设计开发出一套商业银行事后稽核系统,能够批量扫描各种银行业务票据,自动识别票据上的印刷和手写字符,建立票据信息库。并能够将票据信息与银行业务系统的流水信息进行核对,实现核算业务的自动稽核功能。该系统可以极大提高商业银行的稽核效率,节省大量人力和物力成本。

二、系统功能

现阶段商业银行事后稽核业务大多数采用手工监督或手工与计算机并行的处理方式,即各地中心支行所辖机构网点将产生的各种票据在当天封包后,于次日或规定时间内送至省会或地市中心支行事后稽核中心,由事后稽核中心的工作人员按业务发生的流水号整理票据,人工审核票据信息。然后按业务流水号,手工或者录入微机勾兑流水。审核完毕后,下发会计差错检查通知,将票据装订入库保存。

本系统不仅需要完成上述传统手工方式下的稽核业务,还应该发挥计算机处理票据的优势,提高稽核效率,降低票据处理成本。总的来说,本系统的主要功能包括:

1.批量扫描各种银行票据。

2.应用OCR技术,自动提取票据信息,存入票据信息库;分拣出无法识别的票据,由工作人员手工补充录入票据信息。

3.勾兑票据信息和业务流水记录,输出业务审核清单。

4.将一定数量的票据图像自动刻录成光盘保存在光盘库中;光盘库系统能够根据需要读出指定光盘号的内容。

5.以C/S模式在Internet上和局域网内提供票据、稽核结果查询。

三、系统流程及结构设计

1.系统流程。商业银行事后稽核系统的使用者是稽核中心工作人员,以及各种查询人员。系统的输入包括各支行的票据封包和稽核人员补充录入的票据信息,系统输出结果包括稽核结果清单、票据信息库、票据光盘库、稽核信息库和光盘索引库。该系统的主要工作流程包括:

(1)银行稽核中心接收到各支行的票据封包,由检查人员审核票据的批次,以及票据的完整性,然后在系统中添加票据接收记录。

(2)票据交给扫描工作站,由扫描人员将票据批量扫描。稽核系统根据系统内的票据模板,分类识别票据信息,存入票据信息库。对无法识别的票据,输出票据流水号清单,由工作人员根据票据图像,补充录入票据信息。

(3)一个批次的票据扫描完毕后,系统从票据信息库中提出新记录,与业务流水库中的记录进行勾兑审核,输出发生错误的业务记录清单,同时存入稽核信息库。对不能识别的票据,工作人员在补充录入之后,可以手工启动勾兑审核。

(4)勾兑完毕后,光盘库系统检查票据信息库,如果已经到达刻录容量,启动光盘库系统的刻录模块,将记录保存在光盘上,同时删除票据信息库中的记录。光盘库系统为新的光盘生成光盘索引,保存在光盘库系统中。

(5)在银行稽核中心内部局域网内,以C/S模式提供票据信息查询服务。客户端查询模块发出查询请求,服务器端查询光盘库系统和票据信息库,返回查询结果。在Internet上,考虑到银行业务的安全性,只提供稽核结果查询。各支行可以在网上查询最近的稽核情况。

2.系统结构。系统可以分成票据封包登记模块、扫描识别模块、手工补录模块、业务审核模块、光盘刻录模块、光盘管理模块、查询服务模块、票据查询模块、稽核结果查询模块和用户管理模块。各模块的具体功能为:

(1)票据封包登记模块,在票据检查工作站运行。稽核中心收到各支行的票据封包后,检查人员需要在该模块中登记票据的来源银行、流水号的起止范围,以及票据的完整情况,数据存入票据信息库中。

(2)扫描识别模块,在扫描工作站运行。扫描人员将一个批量的票据放入文档扫描仪内,该模块从扫描仪读取票据图像,使用OCR技术和系统内的票据模板,识别票据上的信息,存入票据信息库。对本批次不能识别的票据,在票据信息库中注明,然后输出不能识别的票据流水号清单。一个批次的票据扫描识别完毕后,由该模块向业务审核工作站发出审核请求,并调用光盘刻录模块。

(3)手工补录模块,在手工补录工作站上运行。在稽核中心当前扫描识别工作之后,工作人员启动该模块,依次查看每张无法识别的票据图形,手工录入票据的信息,存入票据信息库,同时清除对应记录上的标记。工作人员退出该模块后,由该模块向业务审核工作站发出审核请求,并调用光盘刻录模块。

(4)业务审核模块,在业务审核工作站运行。该模块被调用后,从票据信息库中查询出还未审核的票据记录,应用业务稽核规则,审核业务流水库中的记录。对票据和业务流水库中不符的记录,输出错误清单,并将稽核结果存入稽核信息库。

(5)光盘刻录模块,在光盘刻录工作站上运行。该模块被调用后,从票据信息库中查询出信息完整的票据记录,如果已经达到规定数量,则启动光盘库开始刻录光盘。自动为新光盘编号,并在光盘索引库中添加光盘信息。

(6)光盘管理模块,在光盘管理工作站运行。该模块与光盘库连接,可以浏览光盘库的数据,查看光盘使用情况。

(7)查询服务模块,在查询服务器上运行。该模块能够处理局域网上查询工作站查询票据信息的请求,以及Internet服务器查询稽核结果的请求。对查询票据信息的请求,首先查询光盘索引库确定票据信息的位置,然后查询光盘库和票据信息库,返回查询结果。对查询稽核结果的请求,直接查询稽核信息库,然后返回查询结果。

(8)票据查询模块,在查询工作站上运行。该模块是局域网内查询票据信息的客户端,功能是接收用户输入的查询请求,发送给查询服务模块,显示返回的查询结果。

(9)稽核结果查询模块。该模块由动态网页组成,运行在Internet上客户的浏览器上。用户在网页上填写查询条件,向稽核中心局域网上的Internet服务器发出查询请求。Internet服务器调用查询服务模块,然后将查询结果返回给用户。

(10)用户管理模块。各工作站都需要运行该模块,其功能是管理用户权限和验证用户权限。

上述模块均分布在银行稽核中心的局域网和Internet上,组成一个分布式系统,兼有C/S模式和B/S模式。系统的网络结构如下图所示。

四、系统实现

1.硬件设备。硬件设备中,票据检查工作站、手工补录工作站、查询工作站、光盘管理工作站和用户管理工作站可以使用普通微机,业务审核工作站、查询服务器和Internet服务器需要使用中高档服务器设备。

扫描工作站除需要一台微机外,还需要连接一台高效的文档扫描仪。文档扫描仪是系统工作瓶颈之一,其进纸槽容量不应低于100页,日扫描量不应低于5000页。在目前市场上,可以适用的成熟产品主要有柯达i820/i830/i840扫描仪系列、富士通高速文档扫描仪系列和佳能高速文档扫描仪系列等。

另外,系统还需要一台光盘库,用于刻录和管理光盘。光盘库应该具有换盘速度快、支持跨盘检索、支持网络无缝的数据刻录等功能。光盘库一般配置有多台驱动器,可以是只读CD/DVD-ROM驱动器,也可以是CD-R/DVD-R刻录机,或者是DVD-RAM可擦写驱动器。系统访问光盘库时,自动换盘机构首先将驱动器中的光盘取出并放置到盘架上的指定位置,然后再从盘架中取出所需的光盘并送入驱动器中。自动换盘机构(机械手)的换盘时间为秒级。

2.核心软件技术。本系统的核心是票据扫描识别技术,目前国内外已经对印刷体和手写体字符的识别展开了广泛的研究。银行票据虽然规格不一,但是票据种类有限,并且每种票据的格式非常统一,因此可以为每种票据建立一个模板,对票据中的待识别区域采用不同的切分方法实现对字符较为准确、快速的切分,从而保证整个识别模块的识别性能和速度。

在识别票据信息之前,首先对待识别票据图像进行预处理,然后根据存在的模板文件对待识别票据进行票据类型识别,找到票据对应的模板。然后进行待识别区域的定位,对待识别区域进行字符切分,切分结果送入字符识别单元进行单个字符的识别。

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。

上一篇:从专利保护角度为我国中药产品“出海护航” 下一篇:一种分布式温度监测系统的设计和应用