手写数字识别的前景与难点

时间:2022-07-14 10:33:00

手写数字识别的前景与难点

摘 要:手写数字识别是利用机器或计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。由于阿拉伯数字通用,并且数字识别和处理也常是一些自动化系统的核心和关键,所以对手写体数字识别的研究通用性强,且意义重大。

关键词:计算机 字符识别 手写数字识别

中图分类号:TP391 文献标识码:A 文章编号:1003-9082(2013)10-0007-01

一、字符识别概述

字符识别是图像识别领域中的一个非常活跃的分支,一方面是由于问题本身的难度使之成为一个极具挑战性的课题,另一方面,是因为字符识别不是一门孤立的应用技术,其中包含了模式识别领域的其它分支都会遇到的一些基本的、共性的问题。也正是由于字符识别技术的飞速发展,才促使模式识别和图像分析发展成为一个成熟的科学领域。

一般地,字符识别可以从几个方面进行分类:从采用的输入设备来分,字符识别可以分为联机识别和脱机识别;从待识别字符的字体来分,脱机字符识别又分为印刷体和手写体字符识别;从识别对象来分,又可以分成手写数字(阿拉伯数字)识别,手写字母识别,手写汉字以及其它各国文字识别等等;其中对于文字识别而言,根据文字类的多少,又分为限制性或非限制性识别。

在联机手写字符识别中,计算机能够通过与计算机相连的手写输入设备获得输入字符笔划的顺序、笔划的方向以及字符的形状,所以相对脱机识别来说它具有更多的可用信息,从而识别相对容易一些。但是,联机识别有一个重要的不足就是要求输入者必须在指定的设备上书写,然而人们在生活中大部分的书写情况是不满足这一要求的,比如人们填写各种表格资料,开具支票等。如果需要计算机去认识这些己经成为文字的东西,就属于脱机识别技术了。比起联机识别而言,脱机识别对书写者没有输入设备的限制,它使用的输入设备可以是任何一种图像采集设备,如扫描仪、数字相机等。通过使用这类采集设备,脱机识别系统将书写者已经写好的文字采集成图像输入到机器中,然后进行自动识别。根据识别的对象不同可以设计不同的识别系统,一般对于阿拉伯数字0到9就是需要把目标分成10类进行识别;而英文字母识别就要分成26类。另外由于汉字的多样性,针对具体应用有所不同。例如,大写金额汉字就只需要识别十几类汉字(壹、贰、……、拾、圆、角、分、整)即可。

二、手写数字识别的应用前景

脱机情况下手写数字识别不但具有很高的应用价值,同时也具有很高的理论价值。首先,由于经济的发展,金融市场化进程的日益加快,票据业务发展很快,票据数量也与日俱增。其中个人凭证,支票,发票,进账单等等票据均需要处理大量的信息。而目前,票据录入仍然依赖人工处理方式,因而使得票据管理工作也相对落后。如果能通过手写体字符识别技术来实现信息的自动录入,无疑会大大有利于解决传统人工处理方式中存在的工作量大、成本高、效率低、时效性差等问题。因此,手写数字的识别研究有着重大的现实意义和十分广阔的应用前景,一旦研究成功并投入应用将产生巨大的社会和经济效益。其次,由于数字是全世界通用的符号,识别种类较小,有助于作深入分析及验证一些新的理论。由于手写数字识别的方法很容易推广到其它一些相关问题上,例如英文字母、汉语拼音等文字的识别,所以它逐步成为模式识别的一个热点的研究领域。从50年代开始,许多的研究者就在这一研究领域开展了广泛的探索并为模式识别的发展产生了积极的影响。可以说,手写数字识别的研究将有助于模式识别、机器理解、机器人技术的发展,具有很大的理论价值。

目前手写数字识别主要的应用领域有:(1)手写数字识别被应用在大规模数据统计中。例如,人口普查、成绩单录入、行业年检、财务报表录入等应用中,需要输入大量的数据,以前完全靠手工输入,耗费大量的人力和物力。若使用手写字符识别技术将大大提高这方面的工作效率。(2)手写数字识别被应用在财务、税务、金融领域应用。随着我国经济的快速发展,每天会有大量的财务、税务、支票等需要处理。如果使用计算机进行自动化处理,无疑会节省大量的时间和金钱。当然,该领域对识别的精度要求很高,因此对预处理和识别的算法要求就很高。(3)手写数字识别被应用到邮件分拣系统中。传统的邮件分拣主要是由人工来实现的。随着经济的发展,各种私人和商务信件会越来越多,一些大城市每天处理的邮件高达几百万件。因此邮件的自动分拣成为大势所趋。

三、手写数字识别的难点

一般情况下,当涉及到数字识别时,人们往往要求识别系统有很高的识别精度(又称可靠性),特别是有关金额的数字识别时,如支票中填写的金额部分,更是如此。因此针对这类问题,就要求手写数字识别系统具有高可靠性和高识别率,因此其难点主要在于以下几方面:

1.阿拉伯数字的字形信息量很小,不同数字写法字形相差又不大,使得准确区分某些数字相当困难。

2.数字虽然只有10种,而且笔划简单,但书写上带有明显的地域特性,同一数字写法千差万别,不同地域的人写法也不相同,所以很难做到兼顾各种写法的极高识别率的通用性数字识别系统。

3.在实际应用中,对数字的单字识别正确率的要求要比文字要苛刻得多。这是因为,文字组合一般都存在上下文关系,但数字组合存在极少的或没有上下文关系,所以每个孤立数字的识别都至关重要。而且数字识别经常涉及的财会、金融领域,其严格性更是不言而喻的。因此,对手写数字识别系统的要求不仅仅是单纯的高正确率,更重要的是极低的、千分之一甚至万分之一以下的误识率。

4.由于脱机手写数字的输入只是简单的一副图像,它不像联机输入那样可以从物理输入设备上获得字符笔划的顺序信息,因此脱机手写数字识别是一个更具挑战性的问题。

参考文献

[1]高鹏. 基于神经网络方法的手写体数字识别. 吉林工业大学学报, 1997(1).

[2]杜彦蕊. 手写字符的径向贯穿特征码提取的研究. 应用科技, 2003, 30(4).

[3]张重阳. 基于轮廓和统计特征的手写体数字识别. 计算机工程与应用, 2004(9).

上一篇:利用多媒体技术构建高效物理课堂 下一篇:信息全透明时代下轿车4S店销售模式