书籍图像背景灰度非线性畸变校正

时间:2022-05-21 02:00:14

书籍图像背景灰度非线性畸变校正

摘要:提出一种图像扫描技术,解决书籍扫描时图像背景灰度不均匀,并呈现非线性畸变情况。这个方法不依赖扫描仪的参数。通过对图像的预处理,选取适当的采样窗口,用函数曲线逼近拟合背景灰度因子分布,来消除跳变误差,或重新定义背景灰度采样窗口和背景灰度估计。

关键词:图像处理;非线性畸变;灰度校正

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9599 (2012) 18-0000-02

用于普通扫描仪器扫描的书籍的时候由于装订线部分的部分无法与玻璃板紧贴,从而会使得扫描图像失真,不仅不利于阅读,也不利于光学识别(orc)。为了解决这个问题必须对这个图像进行校正。

基于以上分析,本文提出了一种图像校正方法,解决了包括背景灰度不均匀非线性畸变的校正方法,效果良好。

1 背景灰度非线性畸变校正

因为书籍的书脊部分远离扫描平面,并且有一定的倾斜角度,所以无法完全反射扫描仪发出的光,会出现扫描图像对应部分亮度下降的问题,造成靠近书脊装订线的部分页面出现黑影,并且明暗不均。越靠近中间书脊线的部分,越暗,灰度值越低,整个灰度值变化呈水平方向变化。

1.1 背景灰度畸变校正相关算法

目前主要的背景灰度畸变校正算法是采用背景灰度直方图估计法,来修正背景灰度值的分布。

背景灰度直方图估计法的原理:

首先估计出原始图像背景灰度分布,根据与标准图像背景灰度分布的比较,计算对比因子。然后根据灰度对比因子,恢复原始图像的背景灰度值至标准图像背景灰度。

对于原始图像背景灰度分布估计主要有两种方法:

(1)通过采样法,估计灰度分布。图像背景灰度不均匀分布,越靠近装订线背景越暗,灰度越小。在水平方向某一位置上,由于垂直方向上页面离开玻璃平板的距离基本一致,所以垂直方向上图像背景灰度也基本一致,所以空变的背景灰度只是在水平方向变化的一个函数。我们取一个采样窗口,以窗口内像素灰度直方图计算该处的背景灰度,采样窗口的设置需要符合两个标准:(1)每个区域内的像素点足够多,以使统计直方图有意义。(2)区域不要太大,区域内明暗应是基本均匀的。对于给定的采样窗口,背景是窗口中出现频率大的灰度区域,为此选取采样窗口内像素的灰度直方图中频率最大的15个灰度值,并由此计算这些灰度值上的像素平均灰度。此值为该处的背景灰度。随着采样窗口沿水平方向移动,可以得到一系列直方图,从而算出不同列上的背景灰度,为了把暗的背景校正为正常的背景灰度,定义背景灰度因子: , 为第n列的背景灰度, 为书页紧贴玻璃平板处的各列图像背景灰度的平均值,即为标准图像的背景灰度。那么根据扫描结果得出的空间变化的背景灰度因子 ,就可以使用这个公式 进行校正恢复。其中f(m,n)为原始畸变样图灰度值,g(m,n)为校正后的图像灰度值。

(2)通过投影法,估计灰度分布。根据图像分布的特点,第一步为去除图像四周的黑色区域。这里采用垂直和水平投影(即在水平或者垂直方向上求出像素的累加和)的方式,通过LoG算子找到突变区域为黑白分界线的位置。第二步为估计图像照度分布。由于扫描图像的对称性特点,照度的变化主要体现在水平方向的变化上。所以对图像做垂直投影,得到图像在水平方向的亮度变化曲线。对曲线进行高斯平滑,滤除字符和噪声等的干扰,再将曲线归一化到0~255的范围内(即根据最大值和255的比值对曲线进行缩放),再扩展为图像大小的矩阵,使矩阵的每一行等于刚才求得的曲线,即得到照度图像。根据照度图像对原始图像进行照度归一化(即,照度不足的区域使其变亮,照度充足的区域不变),即可达到消除阴影的目的。

2 背景灰度畸变校正的改进算法

基于对上述两种主要背景灰度畸变校正算法的研究,针对其不足之处,本文作出了一些改进,使其效果更好,效率更高。改进算法具体描述如下:

(1)提取背景灰度因子分布;

(2)对窗口采样法和投影法分析研究;

(3)采样法校正后会在部分页面出现灰度不连贯的块状条纹。

投影法校正后会使得部分页面区域灰度过白,过亮,特别是在书籍文字内容区域。

从比较中可以知道,造成图像校正效果误差的原因主要是来自背景灰度估计的不连续性。从图中的小波峰,小波谷,和锯齿跳变可以看到因为书籍文字内容的分布不均匀,造成背景灰度采样和投影的估计会出现跳变和误差。

采样法主要通过设置采样窗口,然后统计窗口内像素灰度直方图,选取采样窗口内像素的灰度直方图中频率最大的15个灰度值,并由此计算这些灰度值上的像素平均灰度。此值为该处的背景灰度,水平移动得到整个图像的背景灰度分布。因为在远离书脊中线的两边部分页面是紧贴扫描平板的,所以定义远离书脊中线的部分页面背景灰度像素值为标准背景灰度值。通过整个图像背景灰度和标准背景灰度值做比较,得到背景灰度因子分布图。

所以关键之处是在于背景灰度因子的估计,而背景灰度因子的估计主要取决于采样窗口的灰度直方图。

我们可以分析到,在采样窗口内由于部分文字内容的灰度像素值也会出现较大的频率,而我们选取了采样窗口内像素的灰度直方图中频率最大的15个灰度值,所以很大程度会对背景灰度的估计产生误差,这也是部分页面出现块状条纹的主要原因。这也是我们改进的主要部分。

投影法主要是通过对每列像素值进行投影累加,然后选取投影累加后像素和最大的为标准背景灰度,再用每列的投影累加后的像素和去和定义的标准背景灰度去对比,得到照度分布。也是由于书籍中部分文字内容分布不均,有黑体字,所以造成部分列的投影出现偏差,得到的照度就会出现跳变,造成校正的效果有部分页面出现过亮现象,部分文字模糊.而投影法定义的对每列投影累加,使得改进的地方很少,所以选取采样窗口法对非线性灰度畸变进行校正。

在走势和变化上,可以看到除开两边由于黑边的灰度值造成的分布曲线急剧下降的部分,其中间主要变化分布曲线,是和倒立的正态分布函数曲线十分相似,我们有理由相信可以用变换后的正态分布函数曲线去逼近拟合背景灰度因子分布。并且黑边部分的灰度因子也用正态分布函数曲线的延伸部分去代替,因为黑边的灰度像素值是0,灰度因子取多少都对像素值为0的黑边没影响。

正态分布函数:

上一篇:群体性暴力事件研究初探 下一篇:科学简化信息中心日常安全运维工作之实践