数学公式的图像分割处理研究

时间:2022-10-23 01:43:55

数学公式的图像分割处理研究

摘要:该文通过对包含有数学公式的图片进行二值化、灰度化等图像预处理,为了要精确的进行数学公式分割,需要精准的提取出数学公式的各种特征。每个字符的主要特征就是它的骨架,通过对数学公式字符图像进行数学形态学的细化处理,然后接着进行字符骨架提取,最后使用轮廓投影的方法对图片进行分割,最后把分割的结果进行归一化处理。

关键词:数学形态学;数学公式;图像分割

中图分类号:TP391.41文献标识码:A文章编号:1007-9599 (2011) 03-0000-01

Image Segmentation Processing Research of Mathematical Formula

Zhang Baoying,Wang Chuanchao

(Beijing University of Chemical Technology Institute of the North,Beijing101601,China)

Abstract:This paper contains a mathematical formula by the image binarization,gray level image pre-processing and so on,in order to split the precise mathematical formula,you need precise mathematical formula to extract the various features.The main features of each character is its skeleton,through the characters in the image on the mathematical formula of the refinement of mathematical morphology,and then followed by the character skeleton extraction,the final contours of the projection methods used to segment the picture,the final results of the segmentation Normalized.

Keywords:Mathematical morphology;Mathematical formula;Image segmentation

一、数学公式识别系统简介

一般一个数学公式的识别系统由图像预处理、字符切分、字符识别和后续处理四个部分组成,如图1所示。系统输入的是数学公式的扫描图像,多为BMP和JPEG格式的图片,最后经系统处理完后输出的是文档格式的数学公式。本文主要讨论图像预处理和字符切分这两个部分。

二、图像预处理

同其他的系统一样,公式的识别系统,首先需要将印写在纸上的字符,通过光电扫描从而产生模拟电信号,然后通过模数转换为带灰度值的数字信号输入电脑。所以,识别之前,要对所要处理的图像进行图像预处理。预处理一般包括二值化、去噪声、倾斜校正、规范化等。不同的识别方法,对预处理的图片格式要求有所不同。

(一)彩色图像灰度化。通过扫描获取的各种格式的公式图像大部分都是彩色的图片。对于数学公式识别系统来说,首先要把彩色的图像转变为灰度图像,灰度图像就可以以提供细致的图像信息,而且便于预处理算法的实现。

(二)二值化算法。很多的文档的识别和识别的算法都是基于二值图像的,相对于256个灰度级的图像或彩色图像,二值图像的算法更加的简单,更加的适合图像识别,所花费的空间和时间代价也更少。二值化的方法很多,但又没有对任何对象都普遍适用的方法,必须因情况而定。

本文的实验采用自适应阈值法进行二值化,得到的大多数图像都很清晰,噪声相对的较少,可是考虑到背景较为复杂的图片,在二值化后可能存在点状噪音等,所以在进行图像二值化处理后,本文采取中值滤波的算法对图片进行去噪处理。

(三)倾斜校正算法。在对数学公式的灰度图像旋转到一定角度时,图像中每一个象素的数值都要发生变化。数字图像的坐标值是整数,可是经过这些变换运算之后的坐标不一定是整数,因此要对变化之后的整数坐标值的象素值进行估算,除了空间变换的本身算法,还要进行灰度级插值的运算。插值是从已有的数据点产生新的数据点的技术。图像插值技术是插值技术在二维或高维空间的扩展,在图像相关的应用中获得了广泛的应用。

(四)形态学细化算法。为了能够精确的分割字符,需要准确的提取出字符的典型特征。每个字的主要特征就叫做它的骨架。可以采用数学形态学的细算法对数学公式的字符图像进行细化处理,然后用形态学的骨架提取算法抽去其骨架。试验结果显示本方法能够准确完整的抽取数学公式的主要特征,从而能够实现数学公式的分割。许多数学形态学的算法都是依赖于击中击不中变换的算法思想。图像运算的数学形态学细化算法便是一种常见的使用击不中击中变换的基本形态学算法。它的基本思想是:在根据要求选定具有一定形状的结构元素后,顺序循环的删除满足击中变换的象素。

三、数学公式图像的字符切分

在进行完预处理的公式图像,本文采用轮廓投影的方法对其进行分割。一些分布在同一水平线上的子表达式构成数学公式,通过进行垂直轮廓投影分割可以将大部分分割开来,接着使用水平轮廓投影分割方法,可以将经过垂直轮廓投影分割后得到的像素块再进行n次分割,从而得到更小的像素块。重复执行上述算法直到垂直和水平轮廓分割不能再分割出更小像素块。经过递归的垂直、水平轮廓投影分割之后,大部分可以分割出来,使用轮廓投影分割后会有一小部分的像素块无法处理,将这小部分的像素块提取出来,进行后续处理。

(一)投影法。水平投影法就是用一条水平黑线记录每一个像素行的黑色点的个数,黑色点的个数越多,则黑线的长度越长;竖直投影法的方法类似。投影法是一种很自然的方法,有点像灰度直方图。为了得到更好的效果,投影法经常和闭值化一起使用。由于噪声对头应有一定的影响,所以处理前最好做一次平滑,取出噪声。

(二)行、列切分。字符分割的目标是将单个符号的图像提取出来,送入识别器进行识别,得到相应符号的代码。目前,一些比较成熟的字符识别技术已能得到满意的结果。但是把它们用于数学公式的字符识别,识别率一般会下降6%。因而,对数学公式而言,一个好的图片分割算法是非常重要的。

(三)紧缩重排和归一化。对于经过分割处理的图像,各个单独的字符大小是不一致的,会对后续的识别造成影响,因而需要把字符图像的大小进行归一化的图像处理。简单的描述就是对不同大小的符号图像进行尺度变换,处理为归一化图像(也就是处理为小相同的符号图像)。通过大小归一化之后,识别算法就对于符号的大小不敏感。从而提高分割的正确率。数学公式进行分割识别前都要进行大小的归一化,这样提取出来的字符特征具有尺度的不变性,对于提高分类器的识别率起着重要的作用。

四、结论

表明发现公式识别算法识别率不高,数学符号并不能被百分之百分割,这也影响了结构分析的准确性,提高算法的识别率将是下一步工作的重点。

参考文献:

[1]靳简明,江红英.印刷体数学公式处理研究现状[C].2001年中国智能自动化会议(昆明).北京:清华大学出版社,2001:69-74

[2]吴俊飞.基于特征字符印刷体公式识别研究[D].哈尔滨:哈尔滨土程大学,2006

[3]肖敏,黄磊,刘迎建.数学公式识别系统[C].2001年中国智能自动化会议(绍兴).北京:清华大学出版社,2001:31-37

上一篇:浅议临汾市气象信息网络安全与维护 下一篇:刍议银行计算机安全管理策略