地图扫描影像中文字自动提取的方法研究

时间:2022-08-14 08:21:38

地图扫描影像中文字自动提取的方法研究

摘要:地理信息的数字化是建立地理信息系统的重要步骤,其工作量占整个开发环节的50%以上。为满足GIS的快速发展, 需要对地图的各种要素进行提取、分割以及识别,其中对文字要素的提取是相当重要的。该文将彩色图像转换成灰度图像,然后在灰度图像的基础上,利用直方图确定阙值,并用此阙值对地形图中的文字进行提取,最后对图像进行平滑,锐化,去噪处理。

关键词:图像处理;文字识别;地理信息系统

中图分类号:TP391文献标识码:A文章编号:1009-3044(2011)22-5405-02

Research on Automatic Distilling of Character in Map Scanned Image

KONG Li-hong, YOU Xiao-ming

(College of Electronic and Electrical Engineering, Shanghai University of Engineering Science, Shanghai 201620, China)

Abstract:Digitalization of geographic information is an important step in establishing Geographic Information System which accounts for more than 50% of whole development. it is required to distill、divide up and recognize kinds of map essentials in order to satisfy development of GIS. It is very important to the distilling of the character in it. The paper transfer color images to gray images,realizes the distilling of the word in the topographic map by means of histogram, finally realizes the smoothing,sharpening,erasing the noise of the images.

Key words: image processing ;distilling of character;GIS

在当前的信息社会中, 仍有大量的地图信息或类地图信息以纸质的形式保存、管理和使用着。而将这些纸质地图 的信息进行计算机管理、存储和使用, 并建立相应的数据库,通过对地理数据的集成、存储、检索、计算、操作、分析和更新,生成并输出各种地理信息,从而为土地利用、资源管理、环境监测、交通运输、经济建设、城市规划等地理研究和地理决策提供服务,是必然的发展趋势,具有重要的社会和现实意义。

早期实现这一过程主要采用数字化仪将纸质地图信息采集到计算机, 同时实现矢量化处理,但是这种方法工作量非常大, 难以满足实际应用的需求。目前很多单位主要采用扫描仪将纸质图信息转化为数字图像,然后再利用MapInfo、ArcInfo等GIS软件对数字图像采用逐点逐线跟踪的方法建立道路、文字、河流等各种地理信息图层,然而这种方法的工作量也大。

针对传统方法工作量大的问题,本文根据数字地图的特性,设计算法先将彩色图像转换为灰度图像,在灰度图像的基础上用灰度直方图确定文字提取合理的阙值,接着对文字进行提取,然后对提取后的文字进行平滑,锐化,去噪等后处理,可以得到一幅与原有图像大小一致,但是图像上只有文字的清晰图像,为地图文字图层的自动建立做好准备。

1 RGB颜色模型

一幅由扫描仪得到的数字图像通常是24位真彩色图像,采用的是RGB颜色模型。RGB颜色模型通常用于彩色阴极射线管等彩色光栅图形显示设备中,它是我们使用最多、最熟悉的颜色模型。它采用三维直角坐标系,红、绿、蓝为原色,各个原色混合在一起可以产生复合色。RGB颜色模型通常采用如下图1所示的单位立方体来表示,在正方体的主对角线上,各原色的强度相等,产生由暗到明的白色,也就是不同的灰度值,(0,0,0)为黑色,(1,1,1)为白色。正方体的其它六个角点分别为红、黄、绿、青、蓝和品红,需要注意的一点是,RGB颜色模型所覆盖的颜色域取决于显示设备荧光点的颜色特性,是与硬件相关的。

2 彩色图像转换成灰度图像

由于RGB模型的红、绿、蓝颜色模型用起来不太方便,它与直观的颜色概念如色调、饱和度、亮度等没有直接的联系。通常我们对彩色图像处理时会把采用RGB模型的图像转换成用其他模型表述的图像,或者转换成灰度图像进行处理。而采用RGB彩色模型的图像每一个像素点要占用3Byte,一般一幅500*400的图像大小在1000Kbyte左右,虽然保存了很多颜色信息,但是大大增加了运算量和存储量,因此在本文中需要把彩色图像转换成灰度图像进行下一步的处理。转换公式为:

p=0.114*R+0.587*G+0.299*B (1)

其中p代表图像中某点的灰度值,R,G,B分别代表彩色地图中对应像素点的RGB模型中的R,G,B分量的值。

将彩色地图中每个像素值按照公式(1)进行运算,即可将彩色图像转换成灰度图像。

3 利用直方图确定阈值实现文字提取

为了得到图像中的文字,一般先要得到灰度图像的直方图,通过直方图确定合理阈值,再采用阈值分割技术实现文字提取。

灰度分布的直方图,简称直方图,是一种统计图,是数字图像处理中一个简单有用的工具,描述了一幅图像中的色彩分量或灰度值出现的频度。它用横坐标表示灰度值,用纵坐标表示图像中相应灰度值出现的点数,或是取这种灰度值的点数与总点数的比值。直方图能给出该图像的概括性描述,例如图像的灰度范围,整幅图像的亮暗程度及对比度情况。有两个峰的直方图称为双峰直方图,反映出图像中可能存在两个不同性质的区域,利用这种直方图可以确定它们的分割阈值。

阈值分割法分为全局阈值分割法和局部阈值分割法。局部阈值分割法是将原始图像划分成较小的图像,并对每个子图像选取相应的阈值,在阈值分割后,相邻子图像之间的边界处可能产生灰度级的不连续性,因此需用平滑技术进行排除。全局阈值分割方法在图像处理中应用比较多,它在整幅图像内采用固定的阈值分割图像。

由于局部阈值分割法对技术要求较高且存在许多缺点,故本文采用全局阈值分割法来提取灰度图像中的文字,以灰度直方图为研究对象来确定分割的阈值,但是通过阈值分割法提取出的文字图像还会存在躁点,模糊,断裂等现象,必须进行平滑,锐化,去噪等后处理。

4 图像后处理

图像平滑处理在消除或减弱图像噪声和假轮廓的同时,对图像细节也有一定的衰减作用。因此,图像平滑的直观效果是图像噪声和假轮廓得以去除或衰减,但同时图像将变得比处理前模糊了,模糊的程度要看对高频成份的衰减程度而定。就同一种平滑方法而言,去除或衰减噪声和假轮廓的效果越好,图像就越模糊,因而图像的细节损失越大。本文采用邻域平均法的平滑技术,可以消减麻点状噪声,可以针对不同的图像由用户决定采用公式(2)或公式(3)中的两个模板中的任意一个进行平滑处理。

图像锐化就是加强图像中景物的细节和轮廓,使图像变得较清晰。本文的锐化模板主要有5个,可以针对不同的图像采用不同的锐化模板。公式如下:

容易看出这些模板的作法,先将自身与周围的像素相减,表示自身与周围像素的差别,再将这个差别加上自身作为新像素的灰度。可见,如果一片暗区中出现了一个亮点,那么锐化处理的结果是这个亮点变得更亮,增加了图像的噪声。

本文对图像的去噪采用的是中值滤波法。所谓中值滤波,是指把以某点(x,y)为中心的小窗口内的所有像素的灰度按从大到小的顺序排列,将中间值作为(x,y)处的灰度值,若窗口中有偶数个像素,则取两个中间值的平均。

5 实验及结果分析

本实验是在Windows环境下利用C++Builder来进行的,为了检测本文方法的实用性,实验使用了多幅地图进行实验,图2为彩色扫描地图,图3为转换为灰度图像后的灰度图,图4为利用直方图确定阈值后得到的二值图像,图5为经过平滑、锐化、去躁后的结果图像。

6 结束语

分析了彩色扫描地形图的特征,设计了一个算法将彩色图像转化为灰度图像,在实验过程中取得了较好效果。

通过得到灰度图像的直方图,并以其作为目标的特征描述,从而确定阈值得到文字的二值图像,最后对二值进行平滑、锐化、去躁等处理,实验结果表明该方法是有效的。

参考文献:

[1] 贾永红,岳庆兴,付修军,等.基于数学形态学的扫描地图点状符号识别方法[A].光电探测与制导技术的发展与应用研讨会论文集[C].北京:中国宇航学会光电技术专业委员会,2007:311-314.

[2] 章毓晋.图象处理和分析[M].北京:清华大学出版社,2008.

[3] 孔丽红,范亮彬,范毅俊,等.彩色地形图的自动分色以及二值化研究[J].上海:教育发展研究,2010(12):123-125.

[4] 孔丽红,满佳雯,乐琼华,等.车辆牌照自动识别预处理方法的研究[J].上海:电气自动化,2009,31(6):44-46.

[5] 阮秋琦.数学图像处理学[M].北京:电子工业出版社,2007.

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文

上一篇:高职青年教师科研素质的培养与提高 下一篇:抢救数据 修复U盘