一种基于字符分割与字符识别的LPR方法

时间:2022-05-14 10:01:06

一种基于字符分割与字符识别的LPR方法

摘 要:对车牌识别(LPR)系统中字符分割与字符识别方法进行探讨。根据车牌字符的特点,首先利用投影法采用水平扫描和垂直扫描进行字符分割,接着对字符图像进行归一化处理,实现对字符的完全分割。在此基础上,利用BP神经网络识别算法实现车牌字符的识别,从而提高系统的识别速度和识别率。数字仿真的识别结果验证了该方法的正确性和有效性。

关键词:车牌识别(LPR);字符分割;字符识别; BP网络

中图分类号:TP391.41文献标识码:A

1 引 言

随着国民经济的不断发展,国内的高速公路,收费站、停车场越来越多,为了加强这一领域的管理自动化,智能交通系统 (Intelligent Transportation Systems, ITS) 的发展也就显得日益迫切。车牌识别(License Plate Recognition, LPR) 是ITS 的一个重要组成部分,它能从一幅图像中自动提取车牌图像,自动分割字符图像,进而对字符进行识别。车牌识别系统的成功开发必将大大加速ITS 的进程。智能车牌自动识别是一项利用车辆的动态视频或静态图像进行车牌号码、车牌颜色自动识别的神经网络识别技术[1]。 其硬件基础一般包括触发设备(监测车辆是否进入视野)、摄像设备、照明设备、图像采集设备、识别车牌号码的处理机(如计算机)等,其软件核心包括车牌定位算法、车牌字符分割算法和神经网络字符识别算法等。

2 智能车牌自动识别系统

一个完整的车牌识别系统应包括车辆检测、图像采集、车牌识别等几部分。字符分割和字符识别是智能车牌自动识别过程中的两个关键步骤,已有的处理方法或多或少地都存在一定的不足和局限性。文献[2]采用阈值分割的方法分割车牌字符,仅仅考虑了图像的灰度信息,忽略了空间信息,难以解决背景复杂的图像分割问题;文献[3][4]采用边缘检测方法测得车牌边缘,分割车牌字符,该方法要求图像边缘的连续性好,但是实际系统中摄像头拍摄的车牌边框往往是时断时续的;另外,Paolo Comelli以收费站实时拍摄的汽车准静态图象为处理对象[5],但系统的成功实现大大受益于国外牌照的规范统一。本文主要对字符分割和字符识别方法进行探讨。

计算技术与自动化2007年6月第26卷第2期张 剑等:一种基于字符分割与字符识别的LPR方法

3 车牌字符分割

3.1 车牌区域特征

根据1992年中华人民共和国机动车号牌GA36-92标准,汽车前车牌有以下特征:

1)外廓尺寸:440×140(mm);

2)颜色:小功率汽车所用的蓝底白字牌照,大功率汽车所用的黄底黑字牌照,军用或警用的白底黑字、红字牌照及国外驻华机构用的黑底白字牌照;

3)标准样式:・x1x2・x3x4x5x6x7,其中x1是各省、直辖市的简称,如“京"、“津"、“沪"、“鲁"等,x2是大写英文字母,如“A",“B",“C"等,x3x4x5x6x7可能是英文字母A-Z,也可能是阿拉伯数字0-9,每个字宽45mm,字长90mm,间隔符宽10mm,每个单元间隔12mm。

所有牌照图像都有一些共同特征,归纳如下:

1)图像上有大量长短不一类似直线与长方形的区域,还有一些灰度特征类似于文字区域的汽车厂商标志区域,如奥迪车的图像类似于4个O组成的标志。

2)车牌文字周围有一个类似于长方形的边框,其厚度不一,而且有断裂处,有时候弯曲度比较大。

3)文字大小统一,排列成行,由于拍摄原因有一定程度倾斜,文字与背景之间有明显灰度比。

3.2 车牌字符分割方法

系统在读进来的图像(如图2)中一般会含有多个数字,识别的时候只能根据每个字符的特征来进行判断,所以还要进行字符分割的工作,这一步工作就是把图像中的字符独立的分割出来。字符分割是字符识别的基础,它决定孤立字符的状况。

通常的字符切分有以下几种方法:

1)间距、间隙切分法

利用字符间隙(相邻字符间的间隔)和字符间距(相邻字符中心的距离)进行字符切分。这里要求字符的宽度和字符间隙基本相同,故对输入图像质量的依赖性很大。

2) 投影法

利用水平和垂直投影来进行字符切分。水平投影特征是每一行中心黑色素点的总和;垂直投影特征是每一列中心黑色素点的总和。这种切分有速度快的特点,但对不规范的字符会出现误切分的情况。

3)识别切分法

其切分标准是识别的信度,其信度由单字符识别模块给出[6]。一般,识别信度还可以由后处理的词法、句法、语义分析给出。

本文主要利用二值化后的投影信息,辅以各种判断条件来进行字符分割,也就是上面介绍的第二种方法。由于车牌字符区有一定的高度,所以事先进行水平投影,这样可以利用水平投影信息将相当一部分非字符候选点抹去,再经过归一化使之成为规范图像输出给字符识别部分。

3.3 字符分割的具体算法

第1步,先自下向上对图像进行逐行扫描直至遇到第一个黑色的像素点。记录下来。然后再由上向下对图像进行逐行扫描直至找到第一个黑色像素,这样就找到图像大致的高度范围。

第2步,在这个高度范围之内在自左向右逐列进行扫描,遇到第一个黑色像素时认为是字符分割的起始位置,然后继续扫描,直至遇到有一列中没有黑色像素,则认为这个字符分割结束,然后继续扫描,按照上述的方法一直扫描直至图像的最右端。这样就得到了每个字符的比较精确宽度范围。

第3步,在已知的每个字符比较精确的宽度范围内,按照第一步的方法,分别进行自上而下和自下而上的逐行扫描来获取每个字符精确的高度范围。

3.4 过宽块和过窄块的处理

具体过程如下:

1)求出区域的平均宽度,算法类似于求字符的平均宽度,或是以字符宽度代替区域的平均宽度。

2)分析过大的区域,看其是否由两个字符组成,如是则将其分成两块区域。

3)分析过小的区域,看其是否可以跟左右区域合并。

通过以上步骤可以得到分割的字符,然后对字符定出邻接矩形,对其归一化处理。

3.5 图像的归一化处理

因为扫描进来的图像中字符大小存在较大的差异,而相对来说,统一尺寸的字符识别的标准性更强,准确率自然也更高,标准化图像就是要把原来各不相同的字符统一到同一尺寸,在本系统中是统一到同一高度,然后根据高度来调整字符的宽度。具体算法如下:先得到原来字符的高度,并与系统要求的高度做比较,得出要变换的系数,然后根据得到的系数求得变换后应有的宽度。在得到宽度高度之后,把新图像里面的点按照插值的方法映射到图像中。车牌字符归一化结果如图3所示。

4 车牌字符识别

字符识别方法目前主要有基于模板匹配算法和基于人工神经网络算法。基于模板匹配算法首先把待识别字符二值化并将其尺寸大小缩放为字符数据库中模板的大小,然后与所有的模板进行匹配,最后选最佳匹配作为结果。由于这种匹配算法稳定性较差、时间花费也较大,因此在此基础上提出了基于关键点的匹配算法。此算法先对待识别字符进行关键点提取,然后对关键点去噪,最后再确定字符的分类。这种匹配算法只利用了字符的关键点进行匹配,因此提高了识别速度又具有较高的识别率。基于人工神经网络的算法主要有两种:一种是先对待识别字符进行特征提取,然后用所获得的特征来训练神经网络分类器;另一种方法是直接把待处理图像输入网络,由网络自动实现特征提取直至识别出结果。前一种方法识别结果与特征提取有关,而特征提取比较耗时,因此特征提取是关键。后一种方法无须特征提取和模板匹配,随着相关技术的进步,这种方法更实用。鉴于以上两种识别方法的比较,本文采用基于人工神经网络进行字符识别。

4.1 人工神经网络的概述

人工神经网络是指利用工程技术手段模拟人脑神经网络的结构和功能的一种技术,它的目的是使机器具有人脑那样的感知、学习和推理功能[7]。

神经网络用于图像识别具有以下优点:神经网络的信息分布式存储于联结权值系数中,使网络具有很高的容错性,而图像识别中往往存在噪声或输入图像部分损失,因此神经网络可以较好地解决图像识别问题。另外,神经网络的自组织和自学习功能,大大放松了传统图像识别方法所需的约束条件,使其对图像识别问题显示出极大的优越性。

网络不仅有输入节点,输出节点,而且有隐层节点(可以是一层或多层),如图4所示。对于输入信号,要先向前传播到隐节点,经过作用函数后,再把隐节点的输出信息传播到输出节点,最后给出输出结果。节点作用函数通常选取Sigmoid函数:

4.2BP神经网络算法

BP算法的过程,由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐单元层逐层处理,并传向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转入反向传播,将误差信号沿原来的连接通路返回,通过修改各层神经元的权值,使得误差信号最小。神经网络的反馈调节,在误差信号的反向传播中,网络不断地修正各个节点的权值。

设有n个节点的BP网络,采用S型激励函数。为简单起见,可以假设网络只有一个输出y,任一节点的输出为Oi,并设有N个样本(xk,yk),k=1,2,3,…,N,对某一输入xk,网络的输出为yk,节点i的输出为Oik,节点j的输入为:

使用平方型误差函数:

其中,yk为网络之实际输出,定义如下:

设计BP网络的关键之处在于高效的特征提取方法、大量有代表性的训练样本、高速稳定收敛的学习方法。

4.3 识别效果

由于缺少配套的图像采集设备,所采集到的车辆图像不十分理想,并且得到的图像是在阴雨天气下拍摄的,所以在识别过程中难免会出现误差。此外,神经网络结构也有待优化,需要进一步探讨和研究。对于图1所示车牌图像,其识别效果如图5所示,能够完全实现车牌字符的识别。

图5 识别效果[JZ)]

5 结 论

智能车牌自动识别技术主要包括图像预处理、车牌的定位与分割、字符分割和字符识别四大部分,本文着重对字符分割与字符识别方法进行了探讨。

字符分割是将车牌区域分割成单个字符。本文采用水平扫描和垂直扫描进行字符分割,获得较好的效果。字符识别是对分割的字符进行识别,这里采用BP神经网络算法,提高系统的识别速度和识别率。

智能车牌自动识别系统是解决公路交通配套设施效率瓶颈问题的有效措施之一,具有广泛的应用前景和商业价值,必将为我国公路交通事业的发展做出更为重大的贡献。

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。

上一篇:基于知识资源管理的电子商务集成系统模型 下一篇:空间态势信息保障系统功能分析与结构设计