基于射影矩阵变换的名片透视图像矫正

时间:2022-08-22 04:54:13

摘要:目前的名片OCR系统普遍采用Hough变换法和K最近邻簇法来检测和矫正名片图像倾斜角度,但是这些算法无法矫正名片的透视图像,该文从射影几何角度提出了基于射影矩阵变换的算法:利用名片图像固有的边缘直线信息,将名片与名片图像之间的透视变换矫正为仿射变换,再将仿射变换矫正为相似变换,此相似变换实际上是对名片进行旋转和全局缩放的结果,消除其中的旋转因素,就得到一个与名片仅差一个缩放因子的正交名片图像,以便于后续的字符处理。

关键词:名片; 透视图像; 透视变换; 仿射变换; 相似变换

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)25-5711-05

从射影几何的角度看,二维图像就是三维物体在投影平面上的一个透视矩阵变换。我们可以把相机的成像平面看作物体的投影平面,如果名片平面平行于投影平面且名片边缘平行于CCD边缘,此时拍摄的图像称为正交名片图像,它和名片自身尺寸仅相差一个缩放常数因子,我们日常摄影所希望得到的就是正交图像,它是OCR系统的最佳处理对象,但是OCR系统实时处理的图像不可能总是理想的,实际的名片图像有可能是透视变换形成的四边形,如图2所示,这就需要对图像进行透视矫正以便于下一步的字符分割,目前多数文献[1][2][3][4][5]使用Hough变换矫正图像的倾斜,主要做法是:用Hough变换检测出直线并求出其斜率,以此斜率为依据矫正整幅图像。

上述算法存在一个共同缺陷:必须要求名片与其图像之间是仿射变换关系,只有在仿射变换中,才能保持名片各边缘之间的平行不变性,从而保证斜率的唯一性。由于透视变换不具有平行不变性,上述算法失效。针对这一缺陷,该文提出了一种具有通用性的透视图像纠正算法。

1 算法介绍

名片:用[I]表示,它是被投影的平面。

透视名片图像:与[I]之间存在透视变换关系,用[I(p)]表示,透视变换最具有普遍性,[I]发生形变、错切、缩放和旋转,透视变换中[I]上的平行关系可能发生变化。

仿射名片图像:与[I]之间存在仿射变换关系,用[I(a)]表示,仿射变换中[I]发生错切、缩放和旋转变形,但[I]中的平行关系不变,它是特殊的透视变换。

相似名片图像:与[I]存在相似变换,用[I(s)]表示,相似变换中[I]发生缩放和旋转变形,它是特殊的仿射变换。

正交名片图像:名片与相机的CCD成像平面平行且名片边缘平行于CCD边缘拍摄的图像,用[I']表示,正交变换中[I]仅发生缩放变形,它是特殊的相似变换,也是理想的OCR操作对象。

3 算法总结

需要说明的是:本算法在第二步使用了Hough变换检测直线,但是目的不同于其他算法[1][2][3][4][5],其他算法假定名片图像上下边缘平行,检测出一个直线斜率并进行后续操作,但在名片的透视图像中上下边缘不再平行,检测出的斜率并不是唯一的,这就使其算法仅适用于仿射图像,而本算法检测出上下边缘的两个直线斜率,目的是将透视图像矫正为仿射图像,所以本算法具有普遍适用性。需要注意的是:在求解矩阵[Hx]和[K]时,要提高算法的稳定性。

4 实验与结论

本算法以射影几何理论作为根据,研究对象是名片透视图像,这使得本算法具有普遍适用性和很高的成功率,我们用数码相机拍摄了80幅透视实验图像用于矫正实验,其中76幅图像成功的矫正为理想的正交图像,4幅图像之所以失败,是由于图像上的名片与背景未能有效分割,所以未能正确检测出名片的边缘,实验证明:只要采用合理的预处理手段,正确地检测出边缘,就能够矫正为正交图像。

上述算法也可以用来矫正其它平面物体的透视图像,只要透视图像满足两条先验信息即可,例如:LED数字显示屏图像、车牌图像等等。

参考文献:

[1] 周景超, 陈锋. 车牌字符分割的研究与实现[J]. 计算机工程,2006,32(5):238-240.

[2] 陈振学, 汪国有. 一种新的车牌图像字符分割与识别算法[J]. 微电子学与计算机, 2007, 24 (2):42-44.

[3] 潘武模, 焦阳. Hough变换在中文名片图像倾斜校正中的应用[J]. 中文信息学报, 2001, 15 (3):50-57.

[4] 杨立刚, 张兴会. 车牌照字符倾斜校正方法的研究[J]. 仪器仪表学报,2004,25(4)70-74.

[5] 张云刚, 张长水. 利用Hough变换和先验知识的车牌字符分割算法[J]. 计算机学报, 2004, 27(1):130-135.

[6] Hartley R I. Multi Viewpoint Geometry in Computer Vision[M]. Cambrige, UK: Cambrige University Press. 2000.

[7] 张丽. 均值加速的快速中值滤波算法[J]. 清华大学学报,2004,44(9):1157-1159.

[8] 倪臣敏,叶懋冬. 一种改进的自适应中值滤波算法[J]. 中国图象图形学报, 2006, 11(5): 672-678.

上一篇:浅析利用Excel与Word生成固定格式文档的方法 下一篇:基于VOI的虚拟终端技术研究