一种文本图像倾斜校正的方法

时间：2022-05-20 11:53:57

一种文本图像倾斜校正的方法

摘要: 文档图像倾斜检测与校正是文档分析的预处理的重要环节.提出了一种基于像素点的方法来检测文档图像的倾斜问题，并通过迭代运算来准确的实现倾斜文档图像的校正.实验结果表明，本算法速度快，精确度高，具有较强的实用性.

关键词: 文本倾斜; 倾斜检测；倾斜校正

中图分类号:TP391

文献标识码:A文章编号:1672-8513(2010)03-0232-03

An Approach to Document Skew Detection and Correction

WANG Hui，MU Hongxin，WANG Jiamei，LIANG Zhimao

(School of Electrical and Information Technology，Yunnan University of Nationalities, Kunming 650031，China)

Abstract:

Skew detection and correction of document images is an important step during the preprocessing of document analysis. The paper puts forward a method of skew detection based on pixel, and the iterative algorithm is introduced to solve the problem of document skew correction. Experimental results show that this approach is fast，accurate and practical.

Key words:

skewed document; skew detection; skew correction

目前对文档图像倾角检测的方法主要有基于Hough变换的方法［1］、基于交叉相关性的方法、基于投影特征的方法、基于Fourier变换的方法和基于K-最近邻簇的方法.

Hough变换是最常用倾斜角检测的方法，但基于Hough算法的计算量非常大，现在有很多种改进的Hough算法，文献［2］提出了一种改进Hough变换的方法.虽然改进Hough变换算法的核心思想是减少Hough变换的数据量，但Hough变换本身的计算量很大，因此仍然存在速度慢的问题.近年来相关研究人员提出了基于最小二乘法的倾斜检测方法，基于直线拟合的文本倾斜检测算法等方法，这些方法与基于Hough变换的方法相比计算量上有所减少但存在着精度不够高的问题［3-7］.文献［8］较为系统地研究了基于图像分割的古彝文字识别系统.

交叉相关算法是一种基于等距离的水平（竖直）平行线上像素点的相关性的方法。相关矩阵可以由下式来描述：

上式中L0(x,y)，L1(x,y)为2条平行线， d是L0和L1的间距，s是平移变化的最大值.对1幅竖排的文本图片而言，当存在倾斜问题时，文本列在2条平行线上的像素点会发生平移.当我们以2条平行线上的像素点建立相关矩阵，并对矩阵在水平方向上作投影，投影图的全局最大值就是对应的倾斜角度.这种方法在d和s较大时，虽然计算得到的准确率高，但相关矩阵的计算量也很大.特别是为了确定唯一的全局最大值，d的值会发生相应的改变，重新计算相关矩阵和投影，计算量会更大.

本文在总结上述各种算法的基础上，提出了一种基于对像素点的操作方法来检测文本图像的倾斜角度.通过将一幅文本图像横向（本文以竖排的文字为例）分割成多个子块，搜索并记录每个子块最左端的文字列边界信息，统计分析这些边界的坐标值计算出整幅图像的倾斜角度并校正，通过多次的迭代运算提高了校正的精度.

1 文本图像倾斜角度检测算法

1.1 竖排文字图像倾斜角度检测问题的描述

图1为扫描得到的1幅古彝文字图片.对于这样1幅存在倾斜的文本图像，通过对整幅图像横向分块就得到多个子块图像，搜索每个子块图像的左边界得到整幅图像左边界信息点的多个坐标值，如图1中的点E，F，G即为图像的左边界信息点.根据2个边界信息点的坐标就可以得出图像的倾斜角.

王辉，牟宏鑫，王嘉梅，等：一种文本图像倾斜校正的方法

1.2 基于像素点的文本图像倾斜角度检测的算法

算法的流程如图2所示.具体步骤如下：

1)将图像在行方向上分成n段（n=s/m，s是整幅图像的高度，m是段的高度，s，m都是以像素点为单位来度量）；

2)搜索并记录每个子块图像左边界的位置.方法是：在横向扫描的过程中当第列没有像素点存在而进行到第i+1列时有搜索到像素点则记录下i+1第列的位置，对每个子块都重复上述操作，将得到的每个子块的坐标值都存储在数组w中；

3)计算图像的倾斜角度并对图像进行倾斜校正.倾斜角度的计算方法是：angle=(w(m1)-w(m2))/(v×m)(180/π)其中m1=n/2+2,m2=n/2-2，v=|m1-m2|，m是每个子块图像的高度.计算过程中取w(m1),w(m2)为整幅图像中间段的子块图像的左边界坐标值，这样处理是考虑到图像存在着顺时针方向倾斜和逆时针方向倾斜2种不同的情况；

4)再次检测经过步骤3）校正后的图像的倾斜情况；一般情况下，对图像进行1次校正很难得到较高精度的校正结果，因此需要作进一步的检测；

5)如果经过步骤3）的初步校正后图像仍然存在较大程度的倾斜，则采用迭代的方法作进一步的校正，直到满足事先设定的校正精度为止.具体的处理方法是：对校正后得到的图像重新进行分块操作，每次迭代运算时作如下处理：m1=m1+1,m2=m2+1这样当图像质量较差时可以遍历所有的子块图像.需要说明的是，如果设定的校正精度μ过高，当遍历所有的子块图像后仍然达不到μ的值，则选择遍历过程得到的最高精度值作为最终结果.

2 实验结果

实验是在Matlab仿真环境下进行的.以1幅竖排的古彝文字文本图片为例，对该倾斜的文档图片进行倾斜校正.图3是通过基于像素点操作的方法对倾斜的文本图像进行校正的结果.表1是本文算法与HT算法、交叉相关算法仿真得到的对比结果.

前言部分在讨论HT算法（Hough算法）、交叉相关算法的时候,我们知道这些算法的计算量都很大，这样在校正的过程中耗时也会很长.另外，在校正的精度上标准偏差是体现算法精确的一个重要指标，HT算法的标准偏差为0.06707，交叉相关算法的标准偏差为0.03944，而本文提出算法的标准偏差仅为0.02966.可见本文提出的算法的精度很高.同时通过仿真测试得到的数据表明，本算法的最大绝对误差为0.07，最小绝对误差为0，均要好于HT算法与交叉相关算法.

3 结语

本文提出了1种基于像素点的方法来检测倾斜文档图像及其校正的问题.该算法通过对1幅文本图像进行分块操作得到图像中文字左边界的坐标值（本文主要考虑竖排的文字），只需2点的坐标就可算出文档的倾斜角.在数学上通过2个点的坐标来确定1条直线的斜率是非常方便的，与其它方法相比该算法计算量得到很大地减少.同时本文在倾斜校正过程中采用了迭代的方法，迭代过程可以遍历每个子块的左边界信息，从而得到较高的校正精度.实验结果证明了本算法的精确度，标准偏差仅为0.02966.

参考文献:

［1］李政，杨扬，颇斌，等.一种基于Hough变换的文档图像倾斜纠正方法［J］.计算机应用，2005，25（3）：583-585.

［2］周冠玮，平西建，程娟.基于改进Hough变换的文本图像倾斜校正方法［J］.计算机应用，2007，27（7）：1813-1816.

［3］王妹华，李佐，蔡士杰.基于最小二乘法的文档图像倾斜检测方法［J］.计算机应用于软件，2001，13（9）：43-46.

［4］陈波，王加俊，吴陈.基于页面前景和最小二乘法的倾斜校正［J］.计算机工程，2007，33（15）：202-204.

［5］张晓芸，朱庆生，曾令秋.基于直线拟合的文本倾斜检测算法［J］.计算机应用研究，2005，9（6）：251-253.

［6］岳宁，段会川.新的文本图像倾斜检测及校正算法［J］.计算机应用研究，2005，9（6）：251-253.

［7］李庆峰，付忠良，刘琴.一种高效的倾斜图像校正方法［J］.计算机工程，2006，32（21）：194-196.

［8］王嘉梅，文永华，李燕青,等.基于图像分割的古彝文字识别系统研究［J］.云南民族大学学报:自然科学版，2008，17（1）：76-79.

一种文本图像倾斜校正的方法

热门推荐更多>

精品范文更多>

一种文本图像倾斜校正的方法

热门推荐 更多>

精品范文更多>

热门推荐更多>