一种改进的字符图像分割方法

时间:2022-10-08 07:32:48

一种改进的字符图像分割方法

摘要:针对文本图像中字符图像分割问题,该文介绍了一种基于局部阈值分割的LLT算法,给出了相应的数学模型,然后进一步分析了算法的关键参数设置,并给出了相应的改进方法。实验结果证明,该文方法不仅可以有效的降低背景噪声的影响,还对具有不同字符宽度的文本图像分割具有很强的适应性。

关键词:字符图像;二值化;图像分割

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)04-0844-02

An Improved Segmentation Method for Character Images

SUN Yang-guang

(College of Computer Science,South-Central University for Nationalities, Wuhan 430074, China)

Abstract: For characters segmentation problem in document images, this paper introduces the LLT algorithm based on local threshold and its mathematical model. By further analyzing the key parameters setting, an improved segmentation method for character images was proposed in this paper. Experimental results demonstrated the improved method not only decreases the influence of noise, but has the feasibility for document images with different character widths.

Key words:character image; binaryzation; image segmentation

图像分割问题是图像处理领域的关键问题之一,该问题也一直都受到相关领域专家的深入研究。近年来,随着计算机技术和网络技术的迅速发展,文本字符图像的分割问题受到了人们的广泛关注。目前,已有多种图像分割算法被提出去解决相关应用问题,其中阈值分割法因其简单高效的特点在不同的领域有着广泛的应用[1]。此类算法中阈值的选取至关重要,它直接决定了图像分割的最终结果,因此如何获取一个最为合适的阈值是此类方法应用的关键点和难点。

根据阈值作用范围的不同,阈值分割法可分为全局阈值分割法、局部阈值分割法和自适应阈值分割法[2]。针对文本图像中字符图像分割问题,该文介绍了一种基于局部阈值分割的LLT算法,给出了相应的数学模型,然后进一步分析了算法的关键参数的设置,并给出了相应的改进算法。该文方法不仅可以有效的降低背景噪声的影响,还对具有不同字符宽度的文本图像分割具有很强的适应性。

1 LLT算法

由于受光照条件影响和图像保存的问题,实际图像往往存在大量的噪声、斑点和阴影。这不仅降低了目标和背景的对比度,造成了图像具有不同程度的复杂背景,也使得采用统一的单阈值进行图像分割势将不能得到满意的结果。因此,需要根据图像中各局部的灰度分布情况,采用适合的阈值来进行分割。

Logical Level Technique (LLT)算法作为一种局部阈值算法是通过在局部区域中通过设定的阈值来实现目标图像的分割[3]。通常对于同一幅文本图像来说,其字符图像往往具有相对固定在一定范围内变化的笔划宽度。进而以该字符图像中笔划的宽度来设置待处理的窗口大小,这样既可以去除大块的背景区域,同时也降低了噪声对分割结果的影响。因此,对于复杂背景下字符笔划宽度均匀一致的字符图像分割,该算法取得了较好的应用。

若笔划宽度范围的为[[0,w]],则局部窗口大小为[(2w+1)×(2w+1)]。对于图像中一点[(x,y)]来说,[f(x,y)]为该点的灰度值。设P为局部窗口的中心点,其坐标和灰度值分别为[(xP,yP)]和[g(x,y)],相邻的八个邻近像素分别为[Pi(i=0,1,2,…,7)],则其平均像素灰度值为:

[AVE(P)=-w≤i≤w-w≤j≤wf(xP-i,yP-j)(2w+1)2] (1)

LLT算法通过将局部区域的中心像素[P]与周围八个邻近像素的灰度平均值[AVE(P)]相比较,然后通过逻辑判断值[b(x,y)]来确定该像素是否为字符图像中的像素,即:

[L(P)=1,AVE(P)-g(x,y)>T0,AVE(P)-g(x,y)≤T] (2)

[b(x,y)=1,ifi=03[Pi)?L(P'i)?L(Pi+1)?L(P'i+1)?]istrue0,otherwise] (3)

其中,[P'i=P(i+4)mod8,(i=0,1,2,…,7)],[T]是预先给定的阈值。

2 改进的LLT算法

由上述LLT算法可知,若当前局部窗口的灰度平均值较低,则当前局部窗口往往为低对比度区域。在该区域内目标和背景像素间的灰度差值比较低,这也表明该像素的局部阈值[T]在低对比度区域应是一个较低的值。因此,我们可利用当前局部窗口内的像素最大值、最小值和局部均值来自适应确定局部阈值。

设[fmax]和[fmin]分别为当前像素局部窗口内的最大和最小灰度值。[AVE(P)]是当前窗口的局部灰度平均值,[T]是当前取样像素点的局部阈值,[α]是修正参数。这里,令[fAVEmax=|fmax-AVE(P)|]和[fAVEmin=|fmin-AVE(P)|],则:

[T=fmin+AVE(P)2?α,fAVEmax>fAVEminAVE(P)?α,fAVEmax=fAVEminAVE(P)+fmax2?α,fAVEmax

上式说明当局部灰度均值靠近局部窗口最小值和最大值时,阈值就选取最小值和最大值分别与均值之间的中值。通过上述运算,可以确定当前像素点的阈值[T],然后再根据LLT算法中字符像素判定方法,进一步由式(2)和式(3)判定当前像素点是否为字符像素。因此,这样就可通过利用当前像素和局部窗口内多个灰度信息自适应的获得局部阈值。

如果在式(4)中没有修正参数[α],不难看出当像素点的灰度值和局部窗口的灰度平均值都很高时,局部阈值[T]本应该是一个很低的值,但是在这种情况下,将会得到一个较高的局部阈值,这时获得的阈值[T]是一个不合理的阈值。而若当前像素点的灰度值和局部窗口的灰度平均值都比较低时,修正参数太小将会使算法得到一个更小的局部阈值,这样的局部阈值并不能有效的分割出字符图像。因此,通过设置动态参数[α]来对局部阈值[T]进行修整,修正参数可依经验设定,一般情况下,其取值范围是0.1到1之间。当图像的灰度值的变化范围在[0,255]之间时,该文依据文本图像特点做如下设定:

[α=1ifAVE170] (5)

这里通过把图像灰度变化范围等分,使得当前像素点局部窗口的灰度平均值在不同的灰度变化范围时,修正参数的值也随着变化,从而获得更适合的阈值。因此,修正参数的使用,可以减少上述没有使用修正参数时对计算局部窗口阈值的影响,使得所获得的局部阈值能够适应不同的具有复杂背景的字符图像。

3 实验结果与分析

本文将采用如图1(a)所示具有不同字符笔划宽度的文本图像进行实验。实验所用的文本图像大小为660×612,字符宽度w设定为15。图1(b)和(c)分别给出了运用LLT算法和本文算法所获得实验结果。从实验结果可以看出,对于具有不同字符笔划宽度的文本图像,LLT算法可以将文本图像中的字符图像分割出来,但分割图像中存在大量的噪声点,影响字符图像的分割效果。而本文的改进算法则较好地分割出字符图像,不仅准确地分割出字符图像,而且对噪声点有很强的抑制作用,获得了较好的字符分割效果。

4 结论

针对文本图像中字符图像分割问题,该文介绍了一种基于局部阈值分割的LLT算法,给出了相应的数学模型,然后进一步分析了算法的关键参数的设置,并给出了相应的改进方法。该文方法不仅可以有效的降低背景噪声的影响,还对具有不同字符宽度的文本图像分割具有很强的适应性,对文本字符图像分割具有一定的参考价值。

参考文献:

[1] 章晋毓.图象分割[M].北京: 科学出版社,2001.

[2] 周鲜成.图像分割方法及其应用研究综述[J].信息技术, 2007, 12:11-14.

[3] 胡建明,吴立德.一种改进的文字/图形图像的快速分割算法[J].模式识别与人工智能, 2001,14(2): 201-205.

上一篇:网络行为主体虚拟学习社区环境下知识迷航与对... 下一篇:Excel多种数据汇总方法分析