图像识别预处理在扫描病案自动分类中的应用

时间:2022-09-11 11:23:07

图像识别预处理在扫描病案自动分类中的应用

摘要:利用扫描后的病案图像的特征进行预处理,加快识别和归档的效率。首先用大津法对图像进行二值化,然后用Radon进行倾斜检测,最后用数学形态学开运算减少干扰,用投影法框定待识别标题位置。

关键词:二值化;Radon变换;数学形态学开运算;投影

中图分类号:TP391.41文献标识码:A

文章编号:1001-9081(2007)04-1020-03

0引言

随着科技的发展,不少系统要求实现档案管理电子化,但对于以前的历史档案多为纸质文件,需要对其进行扫描后保存为数字图片,再分类管理。比如医院就存在大量的历史纸质病案文件,通过扫描将纸质病案文件变为数字图片文件后,由于历史病案数量大,一份病案中包含的各种单据数目和种类繁多,如果进行人工归档,比较费时费力。可以利用光学字符识别(OpticalCharacterRecognition,OCR)技术来完成扫描病案的自动归档。为了提高效率和准确率,只需要对病案资料中的部分内容,即病案资料的页标题进行识别,而不用整页识别。为了正确的提取病案资料中的待识别信息,需要对病案图像进行预分析处理。

通过对病案资料的仔细分析发现,所有的图像均有较粗的页标题线或表格线,且要识别的部分均在图像上端的1/4之内,这为转正图像和快速准确的提取与归档相关的部分内容提供了十分有利的条件。

本文设计的扫描病案自动分类系统的工作流程如下:

扫描图片图像二值化倾斜校正版面分析,框定识别部分OCR自动归档

1扫描图像二值化

该式右边括号内实际上就是类间方差值,阈值g分割出的目标和背景两部分构成了整幅图像,而目标取值μ0(t),概率为ω1(t)、背景取值μ1(t),概率为ω0(t),总均值为μ,根据方差的定义即得该式。因为方差是灰度分布均匀性的一种度量,方差值越大,说明构成图像的两部分差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。因此使类间方差最大的分割意味着错分概率最小,这便是大津方法的真正含义[2]。

1.2实际应用

2倾斜校正

由于印刷或扫描过程的偏差,可能导致图片倾斜,这直接影响了后面的识别和浏览效果,所以需要检测倾斜角度,并转正图像。文献[3]提出了一种基于投影的倾斜检测方法,但主要针对文本图像,病案图像可能仅有少量文本,还有很多图片及书写符号,直接采用这种方法来检验倾斜角度效果不好,精度也不高。但是文献[3]给我们提供了一条思路。通过对于病案资料的分析发现,所有的病案资料都有较粗的标题分割线或者框格线,所以可以用直线检测的方法来得到图片倾斜的角度,然后转正。Radon变换是一种基于投影思想的变换,可以用于直线检测,且精度较高[4,5]。

2.1Radon变换原理

Radon变换的原理是将原始图像通过线积分的形式变换到另外一对参数域内,有许多表达方式[5],下式便是其中的一种:

δ函数内的表达式为直线参数方程,表明该变换是沿着该直线进行积分的。用Radon变换可以实现Hough变换的功能,可以用它来检测图像中的直线的方向。计算不同的g(r,θ),找出Radon变换数值最大的值,它所对应的θ值代表了图像中最长直线的方向。

2.2歪斜病案的快速检测

为了提高检测效率,对图像进行了一些处理。首先,充分应用了病案图像的先验知识,所要找的标题线或者表格线均在图像上端的1/4之内,这里以医嘱记录为例,如图1。

所以只用针对图片的这部分做Radon变换。其次,对于上面截取的部分,为了减少周围字体对待检测线的干扰,按以下方式消除表格中的文字和图像[6]:先搜索每一行中的连续黑色像素串,如果长度小于某一阈值,则将这一黑像素串变为白色像素,这样几乎留下的就是标题线和表格线及较长的横线,如图2。

再对剩下的部分作Radon变换,找到θ值,进行图像转正。图3为图2作Radon变换后的结果。

图中清楚可见在degree=87的地方有一个点,说明此处变换数值最大,即图2中最长的倾斜的表格线与垂直的y轴的夹角为87°,与x轴夹角为3°。知道倾斜角度后就可以将图像进行转正。

3版面分析,框定识别部分

版面分析非常重要,只有分析正确,找准了待识别部分,才能识别出正确的信息。文献[7,8]提出了基于神经网络和多层次可信度的版面分析方法,两种方法处理的精度虽然较高,但第一种方法需要大量训练,第二种方法处理步骤比较复杂,时间消耗都比较大,我们力求寻找一种简单高效的方法。通过再次分析病案图像的先验知识发现,待识别的部分是该页病案的标题,该标题一定在标题线或最上面的表格线上,即肯定在图像上部1/4以内,且字体比其附近的字体大,即笔画粗,可以用数学形态学[9]的方法来去掉附近的小字体和其他噪声的干扰,然后将处理过的这部分通过横竖投影来确定其位置。

3.1数学形态学开运算

数学形态学中定义了膨胀和腐蚀两个基本运算:

其中A为被运算图像,B为结构元素。开运算具有消除比结构元素小的图案和噪音的作用[10],这里利用它来消除标题字周围的小字体字符和其他噪声干扰。图4为转正后的图,图5为进行了开运算后的图。

3.2投影获取范围

首先通过水平投影来确定图片中标题的水平位置,如图6。这时可以对原图在相应的水平范围内作垂直投影,进一步缩小识别区域,最后将确定的识别区域图像送与识别,图7为分割出来的图像。识别结果即为该扫描页的类型,这为分类入库提供了资料。

4结语

主要通过大津法对扫描的灰度图像进行动态二值化,根据图像特征选择Radon变换法对图像进行倾斜角检测转正,最后利用数学形态学开运算和投影方法分割出待识别部分,送与识别,提高了识别处理和归档的速度,并且大量的节约了人力。由本文设计思路开发的软件正在开发应用之中。

本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。

上一篇:基于分箱核密度估计的非参数多模态背景模型 下一篇:多操作系统平台可移植Mobile IPv6协议栈设计与...