基于DM642的字符识别系统

时间:2022-04-09 09:06:30

基于DM642的字符识别系统

摘要:设计与实现了一种基于TMS320DM642平台的的字符识别系统,通过纸币冠字号识别案例来阐述该系统所具有的特征。系统通过用接触式图像传感器(CIS)获得的图像,以TMS320DM642处理器为核心建立硬件平台,完成纸币的倾斜角,字符定位,字符分割,并运用支持向量机进行字符识别等一系列算法。测试结果表明基于TMS320DM642的字符识别系统简便、准确、有效,很有应用前景。

关键词:字符识别 DM642 支持向量机

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2016)11-0104-02

DM642 (TMS320DM642)型处理器是TI推出的面向多媒体处理领域的数字信号处理器(DSP),给多媒体设备的实现提供了另一种有效的手段。DM642建立在C64x DSP核基础上采用德州仪器公司开发的第二代高性能的先进的超长指令字结构VeloeiTl.2TM,在600MHz的时钟频率下,DM642每秒可以 进行24亿次16位的乘累加或48亿次的8位的乘累加。这样强大的运算能力使得DM642可以进行实时图像处理。它的增强型直接内存存取 (EDMA)对DSP图像处理系统是非常重要的,它可以在没有CPU参与的情况下完成映射存储空间中数据搬移。灵活使用EDMA可以大大提高数据传输效率。近年来在科学研究、工业生产和管理部门中得到越来越多的应用。在目标跟踪、机器人导航、自动驾驶、交通监视等领域中的应用也极大地促进了实时图像处理技术的发展。实时应用要求实时图像处理系统必须具有强大的运算功能。以DM642为例,在金融机具中采集纸币的冠字号的过程,本文重点阐述一下在DM642平台上进行图像处理的算法过程。

1 DM642图像处理平台

无论是清分机还是ATM机,系统都可以通过用接触式图像传感器(CIS)获得的图像,以TMS320DM642处理器为图像核心处理硬件平台,具体的硬件架构如图1所示。

通过FPGA控制CIS1与CIS2,在纸币分别采集纸币的上下两个面。

2 图像预处理

2.1 边缘检测

边缘检测经过以下步骤:

(1)寻找纸币边缘点。由于这个硬件平台上采用单一光源采集到的图像,所以生成的都是灰度图像,然后分别横向和纵向扫描,例如一个横向线点的右面及包括这个点连续三个都大于这个点左面的点,并且满足差值大于某一个阈值,这样就认为这个点很大可能是图像中左边界,以此类推,就可以找到图像上下左右的边界,当然以上这样步骤不是每一行和每一列都要扫描的,本系统采用一定的间隔跨行或者跨列的扫描,但至少保证每条边上检测到的边缘点数量大于设定的阈值。如图3所示,红点和绿点就是扫描得到的边界点。

(2)用线性回归方程拟合边缘线。找到图像的边缘点后,用一元线性回归方程,采用最小二乘法就能拟合出这条直线。一元线性回归方程原理图2所示。

最终根据这种拟合的直线求出纸币的边缘,如图3所示。同时得到四条边的交点即四个顶点的坐标。

(3)计算图像的倾斜角。由步骤2中计算出的纸币上下边缘倾斜斜率可以求出倾斜角α,计算公式如下:

其中(X1,Y1)为绕图像中心点旋转后的坐标,(X0,Y0)为初始坐标,为旋转矩阵。如图4所示就是校正后的。

2.2 冠字号区域处理

基于预处理的结果,现在就能准确的定位冠字号区域,并且将冠字号区域提取出来,具体步骤如下:

(1)切割冠字号区域,如图5;(2)将冠字号区域根据大律法(Otsu)二值化,如图6;(3)根据二值化图像冠字号字符区域,如图7;(4)根据二值化后的图像进行水平投影找单个字符的左右边界,如图8;(5)根据以上步骤求得单个字符的坐标,如图9;(6)根据取得的单个字符坐标分割灰度图像中的图像并进行归一化处理,如图10。

根据上述的步骤将归一化后的单个字符的灰度图像作为字符模板,这样系统就逐步建立了自己的字符模板。

2.3 字符识别分类器

支持向量机(SVM)方法是20世纪90年代初Vapnik等人根据统计学习理论提出的一种新的机器学习方法,它以结构风险最小化原则为理论基础,通过适当地选择函数子集及该子集中的判别函数,使学习机器的实际风险达到最小,保证了通过有限训练样本得到的小误差分类器,对独立测试集的测试误差仍然较小。支持向量机中对于非线性可分的情况,可使用一个非线性函数把数据映射到一个高维特征空间,在高维特征空间建立优化超平面,判决函数变为:

一般无法知道的具体表达,也难以知晓样本映射到高维空间后的维数、分布等情况,不能再高维空间求解超平面。由于SVM理论只考虑高维特征空间的点积运算,而点积运算可由其对应的核函数直接给出,即,用内积代替最优分类面中的点积,就相当于把原特征空间变换到了某一新的特征空间,得到新的优化函数:

Max:

Subject to ,

求解上述问题后得到的最优分类函数是:

b是分类阀值,可以用任一个支持向量求得,或通过两类中任意一对支持向量取中值求得。其中核函数可以有多种形式,常用的有:

(1)线性核,Linear:;线性分类时使用;(2)多项式核,Poly:,d是自然数;(3)径向基核,Radial Basis Fuction(RBF)核。(4)sigmoid核:,其中k,δ均是常数。

根据SVM的描述,本系统采用BRF核函数,并进行批量字符训练和识别。

3 结语

经过目前产品的大量测试及实践应用,目前本系统冠字号识别率基本维持着99.5%以上,字符识别正确率在99.9%,并且得到相关机构的认证和认可,系统结构设计简洁,应用效率也得到了很好的提升。根据现今技术的发展,本系统也不仅仅应用在纸币冠字号识别,还可以应用在车牌识别等领域。

参考文献

[1]田文娟.基于支持向量机的人民币序列号识别方法研究[D].山东:山东科技大学,2010.

[2]刘灏.基于DSP的人民币序列号高速识别研究[D].湖北:华中科技大学,2011.

[3]江一帆.纸币识别与涂鸦检测技术研究[D].浙江:浙江大学,2016.

上一篇:GPU在无人机影像处理中的应用述评 下一篇:基于智能终端的移动审批应用研究