OCR:让文档输入更精彩

时间:2022-09-30 07:47:35

OCR:让文档输入更精彩

无论采取何种方式进行图表、文字资料的数字化,都必须首先以图像的方式将文字资料从纸质媒体转换到电子媒体之中。而对于这类资料,最好的方式便是转化为文本信息,这样就可以方便地实现全文检索,并能够节省大量的存储空间。在由图像到文本的转换过程中,主要依靠的便是OCR(光学字符识别)技术。

当今社会的信息资源就像是放在两块相互分隔的大陆之上,一块是纸质媒体,另一块是电子媒体。从技术上看,我们可以把电子媒体上的信息印刷到纸张上,也可以把纸质媒体上的信息数字化放在电子媒体之中,这两块大陆似乎已经可以连接起来了。特别是印刷出版业的电子化使这种沟通得到革命性的发展,告别了铅与火,走向了光与电。但这个过程并不对称,图文资料的数字化过程遇到的技术难度远远超过前者。但当OCR技术日渐走向成熟的今天,将信息从纸质媒体转向电子媒体,这种沟通变得不再困难。

理清OCR脉络

追本溯源:OCR是英文Optical Character Recognition 的缩写,中文意思就是通过光学技术对文字进行识别。OCR概念的产生是在1929年,德国的科学家Tausheck首先提出了OCR的概念。几年后,美国科学家Handel也提出了利用技术对文字进行识别的想法。但这种梦想直到计算机的诞生才变成了现实。现在这一技术已经由计算机来实现,OCR的意思就演变成为利用光学技术对文字和字符进行扫描识别,转化成计算机内码。

国内的OCR研究:我国在OCR技术方面的研究工作起步较晚,在70年代才开始对数字、英文字母及符号的识别进行研究,70年代末开始进行汉字识别的研究,到1986年汉字识别的研究进入一个实质性的阶段,取得了较大的成果,不少研究单位相继推出了中文OCR产品。我国OCR都是由OMR演变过来的,我国的一些研究部门在 80年代初就开始对OCR识别进行研究,如汉王科技的刘昌平博士、清华大学的丁晓青教授、北京大学的顾小凤教授等,都是我国OCR研究开发队伍中的导航人。二十多年的研究开发积累了大量人才,专家就有上百人。仅在中关村地区, OCR专家多达20多位,他们也为我国的信息领域留下了自己奋斗的足迹。

中文OCR技术现状:中文OCR即采用扫描仪、数码相机等输入设备,把中文印刷体的文稿送入计算机并以计算机文档表示出来的高新技术,主要用于文字和表格输入,可以用扫描仪将整页的印刷文稿或者表格输入计算机,由计算机上的识别系统自动生成汉字文件,替代人工键入汉字和表格的工作。

中文OCR有普及版和专业版之分,现在市场上扫描仪捆绑的OCR软件均为普及版。目前印刷体OCR的识别技术已经完全达到实用的程度,即使对印刷质量较差的文字的识别率也达到95%以上。由于手写体OCR技术的限制,专业型OCR系统的产品多是面向特定的行业,即适用于每天需处理大量表格信息录入的部门,如邮政、税务、海关、统计等等。这种面向特定行业的专业型OCR系统信息格式较为固定,识别的字符集相对小,经常与专用的输入设备结合使用,因此具有速度快、效率高等特点。这些技术在国外已经被广泛地应用,充分发挥着作用。

随着我国计算机应用的普及深入,这方面的需求已经出现。专业版 OCR有批处理功能,性能更加优化,识别率也不同于普通版OCR。国家的“863计划”对OCR技术的研究给予了很大的资助,加快了OCR技术的进步。如作为国家“863”计划重点支持项目的汉王OCR,在技术就已经非常成熟,并取得了较高的应用成就。它的特点主要是:识别率大幅度提高,尤其是对中英文混排文稿,识别率为99%。可识别宋、仿宋、楷、隶、行等八种印刷字体,对手写体、数字、标点符号的识别也可点可圈;对表格识别也有了重大的突破,无论横版、竖版、中文表格、图文混排文件都能识别,版面还原、自动版面分析和识别功能也大大加强。

应用,显现OCR之“美”

应用才是硬道理,好用才是好产品。这些最简单的描述也许是高科技产品能够成为成功产品的主要的评判标准,对于OCR来说同样如此。目前市场上基于OCR技术的产品已经不少,在国内OCR技术领域占领先地位的汉王科技新近推出的“文本王”就是其中的典范,充分体现了OCR技术应用于文字、表格录入上的优越性。此外,清华文通等公司也推出了类似的产品。

高速准确是OCR输入应用的最基本特色,也是其最大的魅力所在。许多的机关企业都有大量的文字处理工作要完成,诸如,人事档案的处理、各类文件的整理分发等。这些工作的技术难度虽然不大,但却要耗费大量的人力物力,而且文字、图表的录入速度太慢,一直是影响企业文字工作效率的主要因素之一。而如果采用OCR录入系统,以上问题迎刃而解。比如汉王新近推出的“文本王”,它可以不间断地批量识别输入1000页稿件,全自动识别百余种中文简繁,以及英文、数字、表格、图片混排的稿件,识别速度每分钟高达6000字。

操作简便也是OCR技术日益凸显的特色。高科技产品往往都戴着神秘的“面纱”,让普通人很难与其“沟通”。将OCR技术应用于文档录入再合适不过了,但也有人认为,以前的产品没有建立起简洁有效的人机交流机制,在客观上要求操作人员要具有比较高的技术应用能力。但汉王文本王等现在的不少产品在这方面都有了明显的改观,甚至只需对扫描仪录入键轻轻一按,即可在WORD文档中直接完成录入工作,真正实现与WORD无缝连接和“傻瓜”操作,使高科技产品的操作更简单,方便用户使用。

图表输入是OCR技术的拿手好戏。依靠鼠标键盘完成图表的计算机录入比纯粹文字的录入更加复杂,而日常工作中对表格的处理却是少不了的。各类报表信息的搜集整理、各类文件的传达都对处理设备提出了极高的要求。OCR录入技术的成熟完全解决了这一难题,无论是文本还是表格,他都能瞬间为你经营转化成为电子文档。

有过文字处理工作经验的人可能都知道,完成资料的扫描只是全部工作的一个很小的部分,更多的工作还是在后期的校对、整理和保存,这也正是文字处理工作比较繁琐的主要原因。后期的工作往往不受重视,可是后期工作完成的好坏将直接影响整体工作质量和效率,其意义重大。许多OCR技术产品都为广大的文字工作人员提供了及其简单但效果出众的校对功能,无形之中帮助工作人员节省了时间,提高了工作效率。其中文本王能够使录入后版面格式保持原样,既精确保留了原版面格式,准确恢复文本原貌,又与录入稿形成清晰对比,实现快速准确的超强校对。这将为用户节省大量的时间。另外,目前市场上许多OCR录入系统还加入了声音校对功能,可对录入后的文字进行朗读校对,全部真人发声,校对者只需看着原稿即可,这样极大的提高了工作效率。

OCR的应用前景

随着各行业OCR技术的应用,相应的OCR产品形态日益丰富,从而启动了一个更为广阔的市场空间。以汉王OCR为例,不仅在扫描仪捆绑软件中占有了大部分市场份额,而且还推出了一系列OCR应用产品,例如“名片通”、“文本王”、“OCR录入工厂”、“票据识别系统”……等等,还有许多产品则广泛应用于银行、政府、工商税务、公安、图书出版、教育、交通等行业,真正做出了OCR的声势。

而在国外,OCR技术也在金融、保险、税务等领域广为应用,比如,在日本的金融行业中,大量的存单、储单、保单以及户籍登记都是通过OCR技术来实现的; 而在美国,其大规模的人口普查、针对个人的信贷业务、个人所得税申报等,也都采用了OCR技术。

我们有理由相信,经过众多专家或专业人士的努力,OCR会很快地进入到信息化产业的各个领域,并会有更多的新产品奉献给用户,OCR技术产业化之路定会实现质的飞跃。

上一篇:医院数字化先锋 下一篇:“万维易化软件工程管理平台”