分割技术范文

时间:2023-03-20 18:45:25

分割技术

分割技术范文第1篇

关键字:图像分割;阈值;图像处理;图像分析

中图分类号:TP317.4 文献标识码:A 文章编号:1674-7712 (2014) 04-0000-01

一、引言

在图像研究方面,人们研究的对象主要针对图像中的部分感兴趣,这些部分称为目标或前景(其他部分称为背景),人们一般对应图像的特定区域,具有独特性质的区域。为了容易辨识和分析目标,通常将图像进行分离提取出来,在此基础上才有可能对目标进一步研究。图像分割就是指把图像分成特定的的区域,对感兴趣的目标进行研究的过程。主要特性有是象素的灰度、颜色、纹理等,预先定义的目标可以对应单个区域,也可以对应多个区域。常见的图像分割算法有:阈值分割、边缘检测和区域提取法。本文着重研究基于阈值法的图像分割技术。

二、阈值分割

三、阈值分割方法的分类

基于阈值的分割方法,可以是单阈值,也可以是多阈值;局部阈值法是把原始的整幅图像分为几个小的子图像,再对每个子图像应用全局阈值法分别求出最优分割阈值。根据阈值法的原理可以将阈值选取技术分为3大类:

(一)基于点的全局阈值方法。基于点的全局阈值算法与其他几大类方法相比,算法时间复杂度较低,易于实现,适合应用于在线实时图像处理系统。

(二)基于区域的全局阈值方法。对一幅图像而言,不同的区域,比如说目标区域或背景区域,同一区域内的象素,在位置和灰度级上同时具有较强的一致性和相关性。

(三)局部阈值法和多阈值法。局部阈值(动态阈值)当图像中有如下一些情况:有阴影,照度不均匀,各处的对比度不同,突发噪声,背景灰度变化等,如果只用一个固定的全局阈值对整幅图像进行分割,则由于不能兼顾图像各处的情况而使分割效果受到影响。

局部阈值分割法虽然能改善分割效果,但存在几个缺点:(1)每幅子图像的尺寸不能太小,否则统计出的结果无意义;(2)每幅图像的分割是任意的,如果有一幅子图像正好落在目标区域或背景区域,而根据统计结果对其进行分割,也许会产生更差的结果;(3)局部阈值法对每一幅子图像都要进行统计,速度慢,难以适应实时性的要求。

全局阈值分割方法在图像处理中应用比较多,它在整幅图像内采用固定的阈值分割图像。考虑到全局阈值分割方法应用的广泛性,本文重点讨论全局阈值分割方法。

四、阈值分割的特点

(1)针对研究目标与背景对比度较强图像分割特别有效;(2)计算量简单;(3)能用封闭而且连通的边界定义不交叠的区域;(4)具有并行性;(5)可以推广到非灰度特征,如果物体同背景的区别不在灰度值,而是其他特征,如纹理等,可以先计算那种特征,再转化为灰度图,然后就可以利用阈值分割技术。

五、结束语

阈值分割法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术.已被应用于很多的领域。图像阈值化分割是一种最常用,同时也是最简单的图像分割方法,它不仅可以极大的压缩数据量,而且也大大简化了分析和处理步骤,因此在很多情况下,是进行图像分析、特征提取与模式识别之前的必要的图像预处理过程。图像阈值化的目的是要按照灰度级,对像素集合进行一个划分,得到的每个子集形成一个与现实景物相对应的区域,各个区域内部具有一致的属性,而相邻区域布局有这种一致属性。这样的划分可以通过从灰度级出发选取一个或多个阈值来实现。

参考文献:

[1]陈海.数字图像处理[M].科学出版社,2009(6):234-236.

[2]张丽.基于图像处理的压载水微生物统计的算法研究[D].大连海事大学,2008.

[3]耿楠.判别分析法确定最佳阈值的快速算法[D].西北农林科技大学,2010.

分割技术范文第2篇

[关键词]图像;数据;分割;可视媒体;方法;技术

doi:10.3969/j.issn.1673 - 0194.2016.22.084

[中图分类号]TP391.41 [文献标识码]A [文章编号]1673-0194(2016)22-0-02

1 图像分割概述

图像分割就是将一张图分割成相似但不相交区域的过程,在可视媒体的应用当中,高质量的图像分割是后续更高水平操作如语义解释、识别等的前提。

在计算机视觉和图像处理领域分割是非常重要的操作,它代表着处理图像底层的第一步。以数字图书馆来说,大量图像视频的收藏需要按照图像视频的内容构建目录、排序及存储,实现最有效率地浏览和检索可视媒体数据。在图像视频的底层属性当中颜色和纹理是最重要的两个,所以为实现上述目的可基于颜色和纹理进行分割构建目录和索引。另一个典型的例子是使用互联网传输信息,互联网上大规模的多媒体数据流需要传输,数据压缩成为有限使用带宽来完成的关键,当前使用的编码方法就是通过模仿人类视觉来减少由于压缩所带来的缺陷,也就是将场景在视觉上细分为有意义的区域去寻找语义表示,这显然涉及了图像分割。

颜色表示法在彩色图像处理当中最为常用,比如:常见的RGB空间,其色彩由红蓝绿成分以及透明度表示,例如用Photoshop打开一张图片,在上锁状态下显示的是RGB通道,解锁后有四个通道即红蓝绿通道以及Alpha通道。这是基于直角笛卡尔空间的,这与人类视觉系统当中3个不同种类感光圆锥细胞(三波段滤过器)获得彩色图像三色理论一致。可惜的是RGB空间并不能够完全实现颜色感知的高层次处理。

2 图像分割的基本方法

2.1 EM算法

期望最大化算法(Expectation-Maximization,EM)在解决数据残缺问题方面十分出色。事实上,数据集当中通常会少一些变量或是观察不到的隐含变量的模型均可归属于数据残缺,这类问题中观察不到变量,对于所有可观察对象均是未知的。EM算法是一种在残缺数据中计算极大似然估计的迭代统计技术,其基础是模型聚类方法当中的统计方法。也就是将某个数学模型和给定的数据进行最佳拟合。以高斯混合模型对图像颜色分布建模为例,假设混合分布产生一系列的观察值,该分布有多个同方差高斯分布组成,若取其中一个独立同方差高斯分布,并由此产生一个样本获取数据点,设定多个这样的数据点为指定的数据集,在多S空间中找到数据集对应的点,作为一定分布样本值。那么该分布就能够由多个高斯密度函数的加权平均值所表示的概率密度函数来描述。多个高斯密度函数的有限集合也就是高斯混合模型。

EM算法作为迭代算法,每次迭代均由求期望和极大化两个步骤组成,前者用于计算对数似然函数的期望,后者用于选择期望最大参数,然后代入前者再次计算期望,如此循环往复,直到获得最优解。

2.2 马尔可夫随机场

马尔可夫随机场理论(Markov Random Field,MRF)的应用已经十分广泛,它通过直接方便的方法用概率描述图像像素的空间相关特性。数据统计当中马尔可夫过程保持离散的时间和状态,这个过程称为马尔可夫链,条件概率决定这个过程的统计特性。它很好地描述了平面网格结构中图像像素间的空间相关性。因此在二维平面上,可以将图像看作二维随机场,必须考虑空间相关性。

根据上述分析,条件分布可以用来描述马尔可夫随机场,其中条件分布表示随机场的局部特性,不过这样一来通过局部特性定义整个随机场很困难,所以Besag将Gibbs与马尔可夫随机场联系起来,提出了关于方形网格的数据统计模型,获得了实际应用方法。

在实际的运用当中,马尔可夫随机场常与估计理论和同级决策结合,按最优原则确定目标函数,比较常用的是MAP(最大后验概率)。二者结合形成MAP-MRF体系。若观测图像和原始图像同属于二维平面上的随机场,进行图像分割,原始图像成为标记场,通常情况下,观测图像会受到关照条件、系统原因或是随机噪音的影响出现图像失真现象。所以,要直接由观测图像得到原始图像几乎不可能,只能给出一个估计,此时利用MAP计算最大值。事实上MAP估计是一个优化问题。

2.3 ICM算法

寻求条件概率最大数的迭代方法(Iterated Conditional Modes,ICM)算法中,Modes为众数,ICM是确定松弛的方法,其目标在于减少随机退火的计算负担,速度快,但选取初始值比较关键,因为仅允许干扰负增长,所以常出现局部最小的局面。典型的随机松弛方法是随机退火算法,速度慢,迭代过程当中新计算结果在接受过程中会产生随机扰动,理论上能够得到全局收敛。

2.4 区域生长算法

这种算法的基本思想就是集合相似性质的像素点构成区域,即先将要分割的区域找一个起始点像素作为生长点;然后将周边与生长点像素有相似性质的像素集合到同一个区域内;再将这些新添加的像素作为生长点继续上述操作,直到所有满足条件的像素均被包含进来,这样就获得了一个完整的区域。

值得注意的是,实际应用中需要解决以下问题:一是起始点像素的选择;二是选取周边相似特性像素的准则;三是生长停止的规则和条件。

可通过具体问题的特点选取起始点像素,也就是用迭代方法由大到小依次收缩最终找到想要的像素点,这种方法适用于2D图像和3D图像,比如:军用红外图像,通常检测目标辐射大,其亮度就会比较高,所以可选择最亮的像素作为生长点。如果没有具体问题先验知识,可以利用生长所用准则计算每个像素,若结果显示出聚类特点,那么可选择最为接近聚类中心的像素作为生长点。

在区域生长过程当中,还需注意一个要素――堆。因为区域生长过程中起始点像素周边像素要不断依照生长准则来判断,确定其是否具备同起始点像素相似的特性,若是则需要进行关键字排序,并作为新的生长点。堆排序中,每个需要排序的记录仅占一个存储空间。

HeapAjust堆调整,这个步骤是保持堆特性的关键,其输入参数是一个数组及其元素的索引,调整前要保证以二叉树为根的子树保持堆特性。不过索引的元素值可能会比其下属节点的值小,可能破坏堆特性,HeapAjust就是将索引节点下滑使索引的节点为根的子树符合堆特性。

Heap_min小顶堆,可以利用由下到上的方法,调用HeapAjust将数组转化成堆。

Delete_min删除堆顶元素,然后将剩下的堆内元素重构小顶堆。

3 实现技术研究

上文对图像分割技术的基本方法进行了研究,基于这些内容,下文利用Matlab软件+C语言的方式来实现图像分割。

MATJWORKS公司的Matlab数学软件将数值分析、矩阵计算、图形显示和信号处理集成为一体,含大量函数可以调用,功能强大,其使用解释性语言,在执行速度方面有待改进而且开源在算法和保密方面不利,运行环境受限。C语言成熟,速度快但比Matlab复杂,将二者结合起来,协同工作,应用范围更广。

要实现二者的结合,Mex文件必不可少,这是一种能够在Matlab中调用的C语言衍生程序,使较大规模的C语言程序能够易于在Matlab中调用,无需重写Mex,如果出现不可避免的循环计算瓶颈时,可用C语言重写Mex文件来解决。

如图1中的(a)(b),(a)为原始灰度图像,(b)为求反显示结果。

在使用Mex文件时要注意:第一个输入宗量是原始图像数据,prhs[]是p精度指针,所以做double处理,然后作为第一输入宗量;API函数同样返回双精度指针,所以通过Mex得到的图像需进行uint8处理,这样才能显示。

利用上述方法,只需对Mex文件稍作调整就可以在Matlab软件当中,利用上文提供的基本方法实现图像分割。

4 结 语

图像分割作为数据分割高级应用的第一步,一直是焦点也是难点,同时图像分割也是图像处理转变为图像分析的关键。所以本文将图像分割作为研究对象,研究可视媒体数据分割技术。本文分析了图像分割技术当中的EM算法、MRF算法和区域生长,并利用Matlab/C混合编程实现图像分割,有一定的参考价值。

主要参考文献

[1]钱吟,曲建峰,郑巧英.多种媒体特色资源的可视化应用研究[J].图书馆杂志,2016(3).

分割技术范文第3篇

关键词:图像分割、阈值、边缘检测、区域分割

中图分类号: TN957.52 文献标识码: A

1引言

随着图像分割技术研究的深入,其应用日趋广泛。凡属需要对图像目标进行提取、测量的工作都离不开图像分割。图像分割是图像处理、模式识别和人工智能等多个领域中一个十分重要且又十分困难的问题,是计算机视觉技术中首要的、重要的关键步骤。图像分割结果的好坏直接影响对计算机视觉中的图像理解。现有的方法多是为特定应用设计的,有很大的针对性和局限性,到目前为止还不存在一个通用的方法,也不存在一个判断分割是否成功的客观标准。因此,对图像分割的研究目前还缺乏一个统一的理论体系,使得图像分割的研究仍然是一个极富有挑战性的课题。

2图像分割方法

图像分割(Image Segmentation),简单地说就是将一幅数字图像分割成不同的区域,在同一区域内具有在一定的准则下可认为是相同的性质,如灰度、颜色、纹理等。而任何相邻区域之间其性质具有明显的区别。

2.1基于灰度特征的阈值分割方法

阈值分割技术是经典的、流行的图象分割方法之一,它是用一个或几个阈值将图像的灰度级分为几个部分,认为属于同一个部分的像素是同一个物体。

这类方法主要包括以下几种:

(1)单阈值法,用一个全局阈值区分背景和目标。当一幅图像的直方图具有明显的双峰时,选择两峰之间的谷底作为阈值。

(2)双阈值法,用两个阈值区分背景和目标。通过设置两个阈值,以防单阈值设置阈值过高或过低,把目标像素误归为背景像素,或把背景像素误归为目标像素。

(3)多阈值法,当存在照明不均,突发噪声等因素或背景灰度变化较大时,整幅图像不存在合适的单一阈值,单一阈值不能兼顾图像不同区域的具体情况,这时可将图像分块处理,对每一块设一个阈值。

2.2 边缘检测分割法

基于边缘检测技术可以按照处理的顺序分为并行边缘检测和串行边缘检测两大类。常见的边缘检测方法有:差分法、模板匹配法及统计方法等。由于边缘灰度变化规律一般体现为阶梯状或者脉冲状。边缘与差分值的关系可以归纳为两种情况,其一是边缘发生在差分最大值或者最小值处;其二是边缘发生在过零处。

2.3基于区域的分割方法

基于区域的分割方法利用的是图像的空间性质。该方法认为分割出来的某一区域具有相似的性质。常用的方法有区域生长法和区域分裂合并法。该类方法对含有复杂场景或自然景物等先验知识不足的图像进行分割,效果较好。

区域生长方法是把一幅图像分成许多小区域开始的,这些初始的小区域可能是小的邻域甚至是单个像素,在每个区域中,通过计算能反映一个物体内像素一致性的特征,作为区域合并的判断标准。区域合并的第一步是赋给每个区域一组参数,即特征。接下来对相邻区域的所有边界进行考查,如果给定边界两侧的特征值差异明显,那么这个边界很强,反之则弱。强边界允许继续存在,而弱边界被消除,相邻区域被合并。没有可以消除的弱边界时,区域合并过程结束,图像分割也就完成。

2.4结合特定工具的图像分割技术

20世纪80年代末以来,随着一些特殊理论的出现及其成熟,如数学形态学、分形理论、模糊数学、小波分析、模式识别、遗传算法等,大量学者致力于将新的概念、新的方法用于图像分割,有效地改善了分割效果。产生了不少新的分割算法。下面对这些算法做一些简单的概括。

2.4.1基于数学形态学的分割算法

分水岭算法是一种经典的借鉴了数学形态理论的分割方法。该方法中,将一幅图像比为一个具有不同高度值的地形,高灰度值处被认为是山脊,底灰度值处被认为是山谷,将一滴水从任一点流下,它会朝地势底的地方流动,最终聚于某一局部最底点,最后所有的水滴会分聚在不同的吸引盆地,由此,相应的图像就被分割成若干部分。分水岭算法具有运算简单、性能优良,能够较好提取运动对象轮廓、准确得到运动物体边缘的优点。但分割时需要梯度信息,对噪声较敏感。

2.4.2基于模糊数学的分割算法

目前,模糊技术在图像分割中应用的一个显著特点就是它能和现有的许多图像分割方法相结合,形成一系列的集成模糊分割技术,例如模糊聚类、模糊阈值、模糊边缘检测技术等。

这类方法主要有广义模糊算子与模糊阈值法两种分割算法。

(1)广义模糊算子在广义模糊集合的范围内对图像处理,使真正的边缘处于较低灰度级,但还有一些不是边缘的像素点的灰度也在较低灰度级中,虽然算法的计算简明,且边缘细腻,但得到的边缘图会出现断线问题。

(2)模糊阈值法引入灰度图像的模糊数学描述,通过计算图像的模糊熵来选取图像的分割阈值,后用阈值法处理图像得到边界。

2.4.3基于遗传算法的分割方法

此算法是受生物进化论思想提出的一种优化问题的解决方法,它使用参数编码集而不是参数本身,通过模拟进化,以适者生存的策略搜索函数的解空间,它是在点群中而不是在单点进行寻优。遗传算法在求解过程中使用随机转换规则而不是确定性规则来工作,它唯一需要的信息是适应值,通过对群体进行简单的复制、杂交、变异作用完成搜索过程。由于此法能进行能量函数全局最小优化搜索,且可以降低搜索空间维数,降低算法对模板初始位置的敏感,计算时间也大为减少。其缺点是容易收敛于局部最优。

2.4.4基于神经网络分割算法

人工神经网络具有自组织、自学习、自适应的性能和非常强的非线性映射能力,适合解决背景知识不清楚、推理规则不明确和比较复杂的分类问题,因而也适合解决比较复杂的图像分割问题。原则上讲,大部分分割方法都可用 ANN(attificial neural network)实现。ANN 用于分割的研究起步较晚,只有多层前馈NN,多层误差反传(BP)NN,自组织NN,Hopfield NN以及满足约束的NN(CSNN-Const raint Satisfaction Neurat Network)等得到了应用。使用一个多层前向神经网络用于图象分割,输入层神经元的数目取决于输入特征数,而输出层神经元的数目等同于分类的数目。

2.5图像分割中的其他方法

前面介绍了4大类图像分割较常用的方法,有关图像分割方法和文献很多,新方法不断产生,这些方法有的只对特定的情形有效,有的综合了几种方法,放在一起统称为第5类。

(1)标号法(labeling)是一种基于统计学的方法,这种方法将图像欲分割成的几个区域各以一个不同的标号来表示,用一定的方式对图像中的每一个像素赋以标号,标号相同的像素就合并成该标号所代表的区域。

(2)基于Snak模型的分割方法,基于Snake模型的分割是通过对能量函数的动态优化来逼近图像目标的真实轮廓的

(3)纹理分割,由于新的数学工具的引入,纹理分割技术取得了一些进展,张蓬等人将小波分析应用于纹理基元提取。

(4)基于知识的图像分割方法,直接建立在先验知识的基础上,使分割更符合实际图像的特点。该方法的难度在于知识的正确合理的表示与利用。

3图像分割性能的评价

图像分割评价主要有两个方面的内容:一是研究各分割算法在不同情况下的表现,掌握如何选择和控制其参数设置,以适应不同需要。二是分析多个分割算法在分割同一图像时的性能,比较优劣,以便在实际应用中选取合适的算法。分割评价方法分为分析法和实验法两大类。分析法是直接分析分割算法本身的原理及性能,而实验法是通过对测试图像的分割结果来评价算法的。两种方法各有优劣,由于缺乏可靠理论依据,并非所有分割算法都能够通过分析法分析其性能。每种评价方法都是出于某种考虑而提出来的,不同的评价方法只能反映分割算法性能的某一性能。另一方面,每一种分割算法的性能是由多种因素决定的,因此,有可能需要多种准则来综合评价。

4图像分割技术的发展趋势

随着神经网络、遗传算法、统计学理论、小波理论以及分形理论等在图像分割中的广泛应用,图像分割技术呈现出以下的发展趋势:(1)多种特征的融合。(2)多种分割方法的结合。(3)新理论与新方法。

参考文献

[1] [美]RC冈萨雷斯.数字图像处理(第二版)[M].阮秋琦,等译.北京:电子工业出版社,2003

[2] 章毓晋.图像分割[M].北京:科学出版社,2001.

[3] 李弼程,彭天强,彭波等.智能图像处理技术[M].北京:电子工业出版社,2004.

分割技术范文第4篇

关键词:图像分割;计算机视觉;图像解析

中图分类号:TP391文献标识码:A文章编号:1009-3044(2009)35-10066-03

Image segmentation Technology Analysis and Prospect

JIANG Bin, SHI Zhi-gang

(Management & Information Department, Nantong Vocational & Technical Shipping College, Nantong 226010, China)

Abstract: Image segmentation is a key image processing techniques, is also a classic problem. This article of image segmentation method appeared in recent years gave a more comprehensive analysis, and discussed image segmentation research directions ,and also have some instructive effects on image processing, learning and research staff.

Key words: image segmentation; computer vision; image parsing

所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内,表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的讲,就是在一幅图像中,把目标从背景中分离出来,以便于进一步处理。

在图象分割领域还没有出现对任意图象都适合的分割算法,如何根据不同行业图像的特点,找出适应行业具体需求的图像分割算法,是我们追求的目标。本文旨在对近几年出现的图像分割算法的分析总结的基础上,对图像分割技术研究的方向作出一些展望。

1 图像分割常用的五种方法

1.1 对图像特征、空间做分类的方法

常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征

1.1.1 颜色特征

颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。

1.1.2 纹理特征

纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。但是,纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。

1.1.3 形状特征

各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索,但它们也有一些共同的问题,包括:①目前基于形状的检索方法还缺乏比较完善的数学模型;②如果目标有变形时检索结果往往不太可靠;③许多形状特征仅描述了目标局部的性质,要全面描述目标常对计算时间和存储量有较高的要求;④许多形状特征所反映的目标形状信息与人的直观感觉不完全一致,或者说,特征空间的相似性与人视觉系统感受到的相似性有差别。另外,从 2-D 图像中表现的 3-D 物体实际上只是物体在空间某一平面的投影,从 2-D 图像中反映出来的形状常不是 3-D 物体真实的形状,由于视点的变化,可能会产生各种失真。

1.1.4 空间关系特征

所谓空间关系,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。

空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。另外,实际应用中,仅仅利用空间信息往往是不够的,不能有效准确地表达场景信息。为了检索,除使用空间关系特征外,还需要其它特征来配合。

1.2 基于区域的方法(如区域生长分割法、分裂合并法、分水岭分割法等)

1.2.1 区域生长分割法

所谓区域生长(region growing)是指将成组的像素或区域发展成更大区域的过程。从种子点的集合开始,从这些点的区域增长是通过将与每个种子点有相似属性像强度、灰度级、纹理颜色等的相邻像素合并到此区域。它是一个迭代的过程,这里每个种子像素点都迭代生长,直到处理过每个像素,因此形成了不同的区域,这些区域它们的边界通过闭合的多边形定义。

区域生长分割算法的关键是初始种子点的选取和生长规则的确定。算法的优点在于计算简单,对于均匀的连通目标有很好的分割效果,缺点是需要人为设定种子点,对噪声敏感,可能导致区域出现空洞。

1.2.2 分裂合并法

分裂合并法的基本思想是从整幅图像开始通过不断分裂合并来得到各个区域。分裂合并算法的关键是分裂合并准则的设计,这种算法对复杂图像的分割效果较好,但算法复杂,计算量大,分裂可能破坏区域的边界。

1.2.3 分水岭分割法

分水岭分割法,是一种基于拓扑理论的数学形态学的分割方法,其基本思想是把图像看作是测地学上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每一个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭。

分水岭分割法对微弱边缘具有良好的响应,具有很强的边缘检测能力,正是由于其对微弱边缘的良好响应,此算法可以得到比较好的封闭连续边缘。但是同时对于图像中的噪声、物体表面细微的灰度变化,该算法也会产生“过度分割”的现象。

1.3 基于边缘的方法(边缘检测等)

图像的边缘是指图像局部区域亮度变化显著的部分。该区域的灰度剖面一般可以看做一个阶跃,即从一个灰度值在很小的缓冲区域内急剧变化到另一个灰度相差较大的灰度值。图像的边缘部分集中了图像的大部分信息,图像边缘的确定与提取对于整个图像场景的识别与理解是非常重要的,同时也是图像分割所依赖的重要特征。

边缘检测主要是图像的灰度变化的度量、检测和定位,边缘检测的基本思想是先利用边缘增强算子,突出图像中的局部边缘,然后定义像素的“边缘强度”,通过设置阈值的方法提取边缘点集。但是由于噪声和图像模糊,检测到的边界可能会有间断的情况发生。

1.4 基于函数优化的方法(贝叶斯算法-Bayesian等)

贝叶斯(1702-1763) Thomas Bayes,英国数学家,在数学方面主要研究概率论。他首先将归纳推理法用于概率论基础理论,并创立了贝叶斯统计理论,对于统计决策函数、统计推断、统计的估算等做出了贡献。

贝叶斯决策理论方法是统计模式识别中的一个基本方法。贝叶斯决策判据既考虑了各类参考总体出现的概率大小,又考虑了因误判造成的损失大小,判别能力强。

1.5 综合考虑边缘和区域信息的混合分割方法

这类方法既可以很好的提取出图像中目标的边缘又可以使得算法的计算相对简单,对于均匀的连通目标有较好的分割效果。

2 图像分割的研究方向

2.1 图像匹配

在图像识别的过程中,常需要把不同时间、不同成像条件下对同一景物获取的两幅或者多幅图像在空间上对准,或根据已知模式到另一幅图中寻找相应的模式,这就称为图像匹配。

图像匹配主要可分为以灰度为基础的匹配和以特征为基础的匹配。

1)灰度匹配:灰度匹配的基本思想:以统计的观点将图像看成是二维信号,采用统计相关的方法寻找信号间的相关匹配。利用两个信号的相关函数,评价它们的相似性以确定同名点。灰度匹配通过利用某种相似性度量,如相关函数、协方差函数、差平方和、差绝对值和等测度极值,判定两幅图像中的对应关系。

2)特征匹配:特征匹配是指通过分别提取两个或多个图像的特征(点、线、面等特征),对特征进行参数描述,然后运用所描述的参数来进行匹配的一种算法,基于特征的匹配所处理的图像一般包含的特征有颜色特征、纹理特征、形状特征、空间位置特征等。特征匹配首先对图像进行预处理来提取其高层次的特征,然后建立两幅图像之间特征的匹配对应关系,通常使用的特征基元有点特征、边缘特征和区域特征。 特征匹配需要用到许多诸如矩阵的运算、梯度的求解、还有傅立叶变换和泰勒展开等数学运算。基于图象特征的匹配方法可以克服利用图象灰度信息进行匹配的缺点,由于图象的特征点比较像素点要少很多,大大减少了匹配过程的计算量;同时,特征点的匹配度量值对位置的变化比较敏感,可以大大提高匹配的精确程度;而且,特征点的提取过程可以减少噪声的影响,对灰度变化,图象形变以及遮挡等都有较好的适应能力。所以基于图象特征的匹配在实际中的应用越来越广泛。所使用的特征基元有点特征(明显点,角点,边缘点等),边缘线段等。

3)两者的比较:特征匹配与灰度匹配的区别:灰度匹配是基于像素的,特征匹配则是基于区域的,特征匹配在考虑像素灰度的同时还应考虑诸如空间整体特征、空间关系等因素。

特征是图象内容最抽象的描述,与基于灰度的匹配方法相比,特征相对于几何图象和辐射度影响来说更不易变化,但特征提取方法的计算代价通常较大,并且需要一些自由参数和事先按照经验选取的阀值,因而不便于实时应用。同时,在纹理较少的图象区域提取的特征的密度通常比较稀少,使局部特征的提取比较困难。另外,基于特征的匹配方法的相似性度量也比较复杂,往往要以特征属性、启发式方法及阀方法的结合来确定度量方法。

2.2 纹理分割和纹理合成

纹理分割是将纹理图像依据同一纹理的一致性特征或不同纹理之间的特征差别,分割成若干有意义的区域的一种图像分割技术,如何提取有效的纹理特征是其关键点和难点。

纹理合成是为了解决纹理映射中存在的接缝走样等问题而提出的,目前纹理合成方法可分为两类:一类为过程纹理合成(PTS),另一类为基于样图的纹理合成(TSFS)。

过程纹理合成通过对物理生成过程的仿真直接在曲面上生成纹理,如毛发、云雾、木纹等,从而避免了纹理映射带来的失真。这种方法可以获得非常逼真的纹理,但对每一种新的纹理,却需要调整参数反复测试,非常不便,有的甚至无法得到有效的参数。自然界中存在大量的纹理,这些纹理往往具有自相似性,即一小块纹理就能反映整体纹理的特点。这就促使人们着手研究基于样图的纹理合成方法以取得更有效的成果:给定一小块纹理,生成大块相似的纹理。

基于样图的纹理合成(texture synthesis from samples,TSFS))技术是近几年迅速发展起来的一种新的纹理拼接技术,它基于给定的小区域纹理样本,按照表面的几何形状,拼合生成整个曲面的纹理,它在视觉上是相似而连续的。TSFS技术可以克服传统纹理映射方法的缺点,又避免了过程纹理合成调整参数的繁琐,因而受到越来越多研究人员的关注,成为计算机图形学、计算机视觉和图像处理领域的研究热点之一。利用TSFS技术还可以进行纹理填充(如修补破损的图片,重现原有图片效果),纹理传输,扩展到时域则可以用一短段视频图像,生成任意长度的非重复的视频动画等。所以纹理合成技术在图像编辑、数据压缩、网络数据的快速传输、大规模场景的生成以及真实感和非真实感绘制等方面具有广泛的应用前景。

2.3 图像解析(Image Parsing)

自然图像本质上是由大量随机生成的视觉模式构成,图像理解的目的是将输入图像解析成构成它的不同的视觉模式。

根据我们所感兴趣的不同类型的模式,图像解析问题分别被称为:图像分割(对均匀灰色、彩色和纹理区域的处理)、知觉组织(对点、线和一般图形的处理)、目标识别(对文本和对象的处理)。

3 总结

图像分割是图像理解与计算机视觉领域国际学术界公认的将会长期存在的最困难的问题之一,到目前为止既不存在一种通用的图像分割方法,也不存在一种判断是否分割成功的客观标准。图像分割之所以困难的一个重要原因是其并不完全属于图像特征提取问题,它还涉及到各种图像特征的知觉组织。从一般意义上来说,只有对图像内容的彻底理解,才能产生完美的分割。

参考文献:

[1] Gonzalez R C. Digital Image Processing Using MATLAB[M].阮秋琦,译.北京:电子工业出版社,2005.

[2] 孙即祥.图像分析[M].北京:科学出版社,2005.

分割技术范文第5篇

关键词: 脉冲耦合神经网络; 图像分割; 熵; 参数调整

中图分类号: TN919?34 文献标识码: A 文章编号: 1004?373X(2014)02?0038?04

图像分割是图像处理中重要的课题。图像分割在医学、军事、通信等领域起着非常重要的作用,故此精确的图像分割在生活中非常重要。图像分割的方法很多,包括聚类算法、小波变换、马尔科夫模型、图论方法、人工神经网络方法等。在其人工神经网络图像分割的方向中,由于人工神经网络本身具有的分类特性,因此具有很好的区域分割性能。而脉冲耦合神经网络(Pulse Coupled Neural Networks,PCNN)是根据猫等哺乳动物的视觉特性研究建立的模型,在应用到图像分割中时,与其他的任何分割方法相比,它具有显著的特点是:用 PCNN 进行图像分割[1]时,会产生脉冲簇,从而可以实现区域性分割,因此PCNN方法进行图像分割更为便捷。

PCNN图像分割技术到目前为止已经取得了很大的进步,PCNN图像分割技术主要有下述几个方面。

1 基于图像熵函数的PCNN图像分割

熵表示的是不确定性的量度。信息论的创始人香农(Shannon)在其著作《通信的数学理论》中提出了建立在概率统计模型上的信息度量。为了减少图像分割后信息的损失,引入了大量的信息论中的熵作为评价准则,包括最大信息熵、最大模糊熵、最小交叉熵等。这些评价准则应用在PCNN模型中使图像分割得到非常好的效果。

1.1 基于最大信息熵函数的PCNN图像分割[2]

PCNN在图像分割时,计算其分割输出的图像为一个二值[n]阶矩阵[Y[n]],[Y[n]]中含有的信息量即为[H1(P)]熵:

[H1(P)=-P1log2 P1-P0log2 P0]

式中[P1]、[P0]分别表示[Y[n]]为1,0的概率。

当[H(P)]达到最大时,即分割后的图像从原图像中得到的信息越多,得到的分割后的图像越精确。2002年,马义德等首次提出运用最大信息熵函数与PCNN相结合的方法对植物细胞图像进行分割[3?4],利用 PCNN 的脉冲特性,能缩小相近的灰度的分割后的差别,结合最大信息熵函数的原则来达到图像分割的新算法。实现了植物细胞图像的自动分割。

1.2 最大模糊熵函数的PCNN图像分割

H.D.Cheng等人提出了基于模糊最大熵原则的多阈值分割。最大模糊熵准则,就是在灰度空间上搜索一组参数,通过在此参数的确定划分下达到图像分割的目的,类似于最大信息熵。一般而言, 一幅具有[m]个灰度级的灰度图像[I],其灰度级范围为[l0],[l1],[…],[lm-1]。

各灰度级的概率[P]为:

[Pl(lk)=hk, k=0,1,2,…,m-1]

设[U=(A1,A2,…,An)]为有限模糊分类级,Zadth提出模糊熵用[H(U)]表示为:

[H(U)=i=0m-1μA(li)P(li)log(P(li))]

模糊熵的求取中常要选择合适的隶属函数。对于二值图像分割时,设置[r]为分割的值使得图像分为黑(dark)与白(white)两个集合。因此,这两个模糊集的隶属函数[μd(k)],[μw(k)]可分别定义如下形式:

[μd(k)= 1, k≤a1-(k-a)2(c-a)×(b-a), a

当[μd(k)=μw(k)=0.5]时,达到最优阈值,其中[k]就是使得图像模糊熵最大时的最优阈值[Topt]。刘勍等提出了最大超模糊熵结合ULPCNN的方法[6],一般模糊熵是根据图像的目标与背景区域建立的隶属函数,而超模糊熵是其隶属函数的上、下限建立的函数,它是分割阈值的函数,根据分割阈值的变化而变化,因此其结果比准则函数是最大香农熵和最小交叉熵准则函数的分割具有较好的效果。

由于熵函数比较多,故产生大量结合PCNN图像分割的方法。张煜东提出的基于二维Tsallis熵的改进PCNN图像分割[7],不仅修正了动态门限项的下降速度, 使得PCNN收敛更快,还利用二维Tsallis熵准则,分割结果与最大香农熵和最小交叉熵相比取得了非常好的效果。

除此之外如:交叉熵[8]、互信息熵[9?11]最大香农熵与最小交叉熵结合[12]等在不同的领域都取得了非常好的分割效果,这里主要运用的是熵函数的特性来达到好的分割效果。

但是对于复杂图像利用熵函数未必得到原图像中的信息,对其后续的评价带来影响,所以准确的熵函数的选取值得考虑。

2 基于准则函数的PCNN图像分割

由于在使用熵函数进行图像分割时,使用了大量的对数或者指数运算,使运算复杂。而且,复杂图像中由于各种原因导致背景和目标难以分离且直方图具有多峰性,因此细节难于得到分割,常造成过(欠)分割。针对以上问题,一些准则函数引入到PCNN图像分割中。

2.1 最大相关准则

1995 年,Yen提出最大相关准则[13],此准则主要是寻找使目标和背景图像的相关性达到最大的阈值且计算量较小。设[X]是离散的随机变量,且[S=X0,X1,X2,…],[Pi]表示的是[X=Xi]的概率。根据图像的统计信息,有目标[O]与背景[B]的相关数分别表示为:

[SO(t)=-lni=0t-1PiP(t)2, SB(t)=-lni=tl-1Pi1-P(t)2]

准则函数[TS(t)]取[SO(t)],[SB(t)]之和:最佳阈值分割为[t?=argmaxTS(t),t∈[0,l]]。与图像的熵类似,当相关数[TS(t)]越大,说明得到的图像与原图像越相近,分割的效果也越好。邓灵博提出了最大相关准则与PCNN相结合的图像分割算法,并应用到红外图像的分割中,得到非常好的效果[14]。聂仁灿等在图像分割时,先对图像进行预处理,后利用最大相关准则来控制PCNN迭代的次数的图像分割,使分割结果更为精确[15?17]。

2.2 基于类内最小离散度准则

类内离散度表示的是图像中各个灰度值之间的相似程度,类内离散度越小, 说明各部分的灰度值越相近,因此分割的效果会越明显。根据图像的像素特性,把图像分为两个大类[C0]和[C1],其中[μ0]代表[C0]类的像素灰度均值,[μ1]代表[C1]类的像素灰度均值,定义其离散度为:[Dk=k类|X(i,j)-μk|,k=0,1],则图像的类内离散度为:[D=D1+D2]。齐永锋等利用类内最小离散度准则与PCNN相结合对图像进行分割,计算目标与背景的类内离散度,得到很好的效果[18]。目前还有利用类间方差准则[19]、最大方差比准则[20]、类内最小散度类间最大方差相结合[21]等等结合PCNN对图像进行分割,都取得了不错的结果。

3 基于模型中参数调整的PCNN图像分割

传统的PCNN图像分割时,采用的是人工调整的方法,不仅耗费人力还有时间,所以为了能够在进行图像分割时,自动的调整参数,省去人工的麻烦,参数调整方法得到了大量的研究。主要针对参数设置有两种,一种是参数自动调整,另一种是无需参数调整方法。

3.1 参数自动调整

针对传统PCNN图像分割的劣势,参数自动调整方法得到了如下的研究:

首先是基于智能算法对参数优化的图像分割最早得到研究。如基于遗传算法[22]、微粒群算法[23?24]、微分进化算法[25?26]、量子粒子群算法[27]、文化算法[28]、克隆选择算法[29]、人工蜂群算法[30]都达到自动分割的效果。贾时银等人提出各向异性扩散特性和遗传算法相结合的分割程序[31],利用具有保护图像边缘作用的各向异性扩散特性确定模型的链接权值参数,用遗传算法求解模型的链接强度参数和衰减阈值参数,从而实现图像分割的目的。赵峙江等人通过对灰度?信息量直方图的分析,提出了估算PCNN时间衰减参数的自适应算法,算出网络的时间衰减参数[32],以最少的迭代次数获取最佳分割,有效的控制了系统运算量。还有基于图像本身空间和灰度特性和模糊特性[33]的PCNN图像分割,其效果优于传统的OSTU方法。杨娜等人利用神经网络中的Hebb学习规则对脉冲耦合神经网络模型的链接权值矩阵进行更新,然后利用图像局部区域的均方差自适应确定神经元链接强度系数,应用于运动车辆图与传统 PCNN分割算法相比,车牌区域分割清晰边缘信息保存完好[34]。除此之外,还有基于模型的理论推导,完成参数的自动设置,表现出了很好的鲁棒性[35]。

3.2 无需参数调整

针对无需参数调整的PCNN图像分割中,在以往提出的经典解决方法大多需要预设一个较高的迭代次数,且部分依靠参数设定,严冬梅设计了一种仅需 2次迭代,参数设置自适应于图像统计特征的 PCNN图像分割算法该方法的分割结果明显优于基于图像最大熵结合PCNN图像分割的方法[36]。顾晓东等采用基于单元链接脉冲耦合神经网络(Unit?Linking PCNN)模型,此方法不仅能实现自动分割还无需考虑PCNN中的参数的选取[37]。

在运用PCNN进行图像分割时,参数的选取直接会影响到分割效果的好坏,因此关于参数的自动选取和无需参数的调整尤为重要。

4 基于改进的PCNN图像分割

PCNN进行图像分割时不仅仅基于参数的选取和结合准则函数,PCNN本身模型的改进也得到广泛的研究。Stewart等为了体现模型的本质,对模型进行了改进[38]。马义德等针对 Stewart 模型进行了讨论并改进,验证了模型的实用性和正确性[39]。从对模型的改进理论上来看,苗军等人的基于区域增长的PCNN图像分割也取得了好很好的效果[40]。严春满等人提出的基于双层PCNN模型实现图像分割,双层PCNN的前级以简化PCNN模型为基础,获得区域生长的种子,后级采用区域生长机制,征募区域内灰度相似像素,完成前级种子的生长[41]。在改进的PCNN模型进行图像分割中,除结合区域特性的分割外还包括如:彭真明等人利用并行点火的PCNN模型进行图像分割,解决了受光照影响灰度均匀缓慢变化的图像分割难题[42]。石美红等人摒弃了原有脉冲耦合神经网络模型中的时间指数下降机制,利用灰度直方图的知识直接获得PCNN的分割门限, 同时保留了弥补空间罅隙和灰度微小变化的优点[43]。 使分割得到的目标区域更加完整。张军英等人根据象素及其周边区域的信息量大小发放不同值的脉冲,从而自适应地将图像分为多个不同等级的高低信息区域, 较好地仿真了人类视觉系统特性[44]。还有如自动迭代算法[45]的引进取得了非常好的效果。但有些方法仍处于实验探索阶段,应用领域尚不广泛。

5 结 语

从近些年的研究成果上看,无论是利用熵函数、准则函数、参数调整结合PCNN还是改进的PCNN的图像分割方法,都没有给出一种最优的分割方法及其模型。但从模型本身的特点和图像分割要求来看,基于区域特性的 PCNN 图像分割方法和 PCNN 结合经典的数学理论的图像分割是未来PCNN研究的主要方向。

参考文献

[1] KUNTIMAD G, RANGANATH H S. Perfect image segmentation using pulse coupled neural networks [J]. IEEE Transactions on Neural Networks, 1999, 10(3): 591?598.

[2] 马义德,戴若兰,李廉.一种基于脉冲耦合神经网络和图像熵的自动图像分割方法[J].通信学报,2002,32(1):46?51.

[3] MA Yi?de, DAI Ruo?lan, LI Lian, et al. Image segmentation of embryonic plant cell using pulse?coupled neural networks [J]. Chinese Science Bulletin, 2002, 47(02): 167?172.

[4] MA Yi?de, LIU Qiong, QIAN Zhi?bai. Automated image segmentation using improved PCNN model based on cross?entropy [J]. Proceedings of 2004 International Symposium on Intelligent Multimedia. [S.l.]: ISIM, 2004: 743?746.

[5] 赵勇,陈立潮,张英俊,等.基于模糊熵的改进型PCNN图像分割方法[J].计算机技术与发展,2009,19(10):141?144.

[6] 刘勍,许录平,马义德,等.一种超模糊熵ULPCNN图像自动分割新方法[J].西安电子科技大学学报:自然科学版,2010,37(5):817?823.

[7] 张煜东,吴乐南.基于二维Tsallis熵的改进PCNN图像分割[J].东南大学学报:自然科学版,2008,38(4):579?583.

[8] 刘勍,马义德,钱志柏.一种基于交叉熵的改进型PCNN图像自动分割新方法[J].中国图象图形学报,2005,10(5):579?584.

[9] 魏伟一,李战明.基于改进PCNN和互信息熵的自动图像分割[J].计算机工程,2010,36(13):199?204.

[10] 刘勍,许录平,马义德,等.基于互信息改进型脉冲耦合神经网络多值图像分割[J].光子学报,2010,39(5):923?928.

[11] 陈立雪,顾晓东.利用直方图及边缘乘积互信息的PCNN图像分割[J].计算机工程与应用,2012,48(7):181?183.

[12] 聂仁灿,周冬明,赵东风.基于 Unit?Linking PCNN 和图像熵的图像分割新方法[J].系统仿真学报,2008,20(1):222?227.

[13] YEN J C,CHANG F J,CHANG S. A new criterion for automatic multilevel thresholding [J]. IEEE Transactions on Image Processing, 1995, 4(3): 233?260.

[14] 邓灵博.基于PCNN和最大相关准则的图像分割算法[J].弹箭与制导学报,2008(23):237?239.

[15] 谭颖芳,聂仁灿,周冬明,等.基于 PCNN 和最大相关准则的图像分割[J].仪器仪表学报,2007,28(8):370?374.

[16] 邓成锦,聂仁灿,周冬明,等.PCNN 和最大相关准则相结合的图像分割方法[J].计算机工程与应用,2011,47(14):177?179.

[17] WANG Xin?chun, YE Qing, YUE Kai?hu, et al. A new image segmentation algorithm based on pcnn and maximal correlative criterion [C]// Proceedings of 2010 IEEE 10th International Conference on Signal Processing. Beijing, China: ICSP, 2010: 873?876.

[18] 齐永锋,火元莲,张家树.基于简化的PCNN与类内最小离散度的图像自动分割方法[J].光电子·激光,2008,19(9):1258?1264.

[19] 王红梅,张科,李言俊.一种基于PCNN的图像分割方法[J].光电工程,2005,32(5):93?96.

[20] 辛国江,邹北骥,李建锋,等.结合最大方差比准则和 PCNN模型的图像分割[J].中国图象图形学报,2011,16(7):1310?1315.

[21] 火元莲.一种基于PCNN的图像自动分割方法[J].自动化与仪器仪表,2008(6):97?99.

[22] 马义德,齐春亮.基于遗传算法的脉冲耦合神经网络自动系统的研究[J].系统仿真学报,2006,18(3):722?725.

[23] 卢桂馥,刘金飞,王勇,等.基于微粒群算法和脉冲耦合神经网络的图像分割算法[J].计算机技术与发展,2008,18(7):90?92.

[24] 卢桂馥,王勇,窦易文.一种参数自动寻优的PCNN图像分割算法[J].计算机工程与应用,2010,46(13):145?157.

[25] 罗美淑,刘世勇,石磊.基于微分进化的PCNN图像分割方法[J].计算机工程,2010,36(21):225?227.

[26] 朱冰,祝小平,余瑞星.基于最大熵和PCNN的图像分割新方法[J].红外技术,2008,30(5):259?267.

[27] 许新征,丁世飞,史忠植,等.一种基于QPSO的脉冲耦合神经网络参数的自适应确定方法[J].模式识别与人工智能,2012,25(6):909?915.

[28] 沈蔚,赵峙江,李晓刚.基于文化算法的PCNN自动系统的研究[J].应用科技,2008,35(1):32?35.

[29] 毕晓君,施展.基于克隆选择算法的PCNN参数自动选取算法研究[J].控制理论与应用,2009,28(2):4?8.

[30] 温长吉,王生生,于合龙,等.基于改进蜂群算法优化神经网络的玉米病害图像分割[J].农业工程学报,2013,29(13):142?149.

[31] 贾时银,周冬明,聂仁灿,等.脉冲耦合神经网络模型参数优化及图像分割[J].云南大学学报:自然科学版,2010,32(5):521?525.

[32] 赵峙江,赵春晖,张志宏.一种新的PCNN模型参数估算方法[J].电子学报,2007,35(5):996?1000.

[33] 毕英伟,邱天爽.一种基于简化PCNN的自适应图像分割方法[J].电子学报,2005,33(4):647?650.

[34] YANG Na, CHEN Hou?jin, LI Yan?feng, et al. Coupled parameter optimization of pcnn model and vehicle image segmentation [J]. Journal of Transportation Systems Engineering and Information Technology, 2012, 12(1): 48?54.

[35] 于江波,陈后金,王巍,等.脉冲耦合神经网络在图像处理中的参数确定[J].电子学报,2008,36(1):81?85.

[36] 严冬梅.无需设置参数的快速 PCNN图像分割[J].应用科技,2013,40(2):35?39.

[37] 顾晓东,张立明,余道衡.用无需选取参数的Unit?linking PCNN进行自动图像分割[J].电路与系统学报,2007,12(6):54?59.

[38] STEWART R D, FERMIN I, MANFRED O. Region growing with pulse?coupled neural networks: an alternative to seeded region growing [J]. IEEE Transactions on Neural Networks, 2002, 13(6): 1557?1562.

[39] 马义德,刘映杰,夏春水,等.基于改进模型的PCNN动态行为的实验研究[J].中国生物医学工程学报,2006,25(5):137?142.

[40] LU Yun?feng, MIAO Jun, DUAN Li?juan, et al. A new approach to image segmentation based on simplified region growing PCNN [J]. Applied Mathematics and Computation, 2008, 205: 807?814.

[41] 严春满,郭宝龙,马义德,等.一种新的基于双层PCNN的自适应图像分割算法[J].光电子·激光,2011,22(7):1102?1106.

[42] 彭真明,蒋彪,肖峻,等.基于并行点火PCNN模型的图像分割新方法[J].自动化学报,2008,34(9):1169?1173.

[43] 石美红,张军英,张晓滨,等.基于改进型脉冲耦合神经网络的图像二值分割[J].计算机仿真,2002,19(4):42?46.

[44] 张军英,樊秀菊,董继扬,等.一种改进型脉冲耦合神经网络及其图像分割[J].电子学报,2004,32(7):1223?1226.

分割技术范文第6篇

与其它图像分割一样,传统的医学超声图像分割从整体上可分为两大类,即基于边缘检测的方法和基于区域生长的方法。基于边缘检测的方法首先检出图像中局部特性的不连续性或突变性,再将它们连成边界,这些边界把图像分成不同的区域;基于区域生长的方法是将象素按照某种特征归于不同的区域,而相邻区域具有不同的均匀性。因此这两类方法互为对偶,相辅相成,在实际应用中往往需要结合起来运用以获得更好的分割效果。

1·1基于边缘检测的方法

基于边缘检测的分割方法是通过检测相邻象素特征值的突变性来获得不同区域之间的边缘。边缘点的判定是基于所检测点的本身和它的一些邻点,主要包括局部微分算子,如Roberts梯度算子,So-bel梯度算子和Canny算子等,当然,针对不同的超声图像,还有许多其它不同的算子、手段来检测出这些边缘点。例如,Fan等人[2]利用非线性小波阈值法对植入式超声图像中的腔内膜—内壁和外膜等形成的边界进行了检测,Aarnink等人[3]利用非线性Laplace滤波器实现了对前列腺超声图像的自动分割。一个好的边缘检测算子不仅具有微分特性以获得灰度变化信息,它还应该能够根据需要适合任何尺度下的边缘检测,因为图像中的灰度是以不同尺度发生变化的。通过实验发现,边缘检测方法获得的边缘信息往往会因这些信息不够突出而产生间隙,不能形成包围物体的封闭曲线,这就要求根据这些离散的边缘点采用一定的跟踪、连接算法勾勒出有意义的物体边界。另外,边缘检测分割方法对噪声较大的图像还会产生较多的伪边缘,为去除噪声提出了较高的要求。这个问题在医学超声图像分割中显得尤为突出。

1·2基于区域生长的方法

基于区域生长的方法是依据区域内部的均匀性实现图像的分割,主要包括基于分裂和合并的技术及基于随机场的技术。基于分裂和合并技术的区域生长法主要分为三种,即合并、分裂及合并-分裂相结合。合并的方法是,图像首先被分成许多小的基本区域,然后根据特定的均匀性判据而合并,形成大的区域。分裂的方法是将整幅图像作为原始分割结果,只要当前的分割结果不能保证足够的均匀性,就将其分裂成四个方形区域。合并-分裂相结合的方法是将相邻且具有相似特征的区域合并,而将具有明显不均匀特征的区域进行分裂。这几种方法对图像的质量,特别是同一物体内部的灰度均匀性要求较高,否则很容易出现过度合并和过度分裂。对于医学超声图像,很少有人使用这种方法,即使使用也常与其它方法相结合,所以这样的参考文献[4]也很少。基于随机场技术的图像分割方法是利用空间区域相互作用模型如Markov随机场(markovrandomfield,MRF、Gibbs)随机场等对图像进行建模,结合一些概率论知识和模拟退火等优化方法对图像进行分割[5]。这种方法有时易产生误分类,对纹理边界难以分割,所以在超声图像分割中的应用有待进一步的研究。

1·3其它分割技术

图像分割是一具有丰富内涵的领域,多年来众多的研究人员不仅从以上几方面研究图像分割,而且还积极引进其它学科的知识来对图像分割进行尝试,如建立在积分几何、随机理论、模糊理论和时频分析等基础上的数学形态学法、神经网络法、模糊聚类法、小波变换法等,并取得了一定的研究成果[8]。作为图像分割的一个重要分支,医学超声图像分割的研究几乎涵盖了所有这些分割技术,但效果往往难以令人满意,目前也难以在临床应用中加以推广、应用。

2形变模型医学超声图像分割

为解决上述传统图像分割技术中存在的问题,近十年来,研究者们对基于形变模型的图像分割算法进行了广泛的研究和使用,并取得了许多令人鼓舞的成果。下面将分别就动态规划模型、活动轮廓模型和水平集模型的超声图像分割方法作一些讨论。

2·1基于动态规划模型的医学超声图像分割动态规划(dynamicprogrammingDP)算法的基本思想是:首先在原始图像上人工选择一些特定的点作为初始点和终止点,并对原始图像进行一定的变换得到初始代价阵,其中目标边缘部分对应位置的代价较低,而其它区域的代价较高,然后由初始代价阵和给定的初始点计算出累积代价阵,最后从终止点方向反向跟踪至初始点,从而获得所需的边缘轮廓线。文献[6,7]中利用DP算法对不同的医学超声图像进行分割并得到了不错的分割结果。本文也对这一算法在医学超声图像的分割做了一定的实验,结果如图1所示。通过实验我们发现该算法不仅能够获得全局最优解,而且具有一定的抗干扰能力,但是仍然存在着以下几方面的问题:①运算量较大:主要是累积代价阵的计算需要较多的时间,是运算“瓶颈”;②容易误入“歧途”:超声图像由于本身固有的物理特性,噪声较大,所以存在着较多的伪边缘,在代阶阵中表现为条纹状的低代价槽,这就会对本算法造成干扰,从而难以得到正确的结果;③初始点和终止点的选择对结果有着不可忽视的影响,这一点可从图1(b)~(d)中不同初始点和终止点所形成的不同分割结果可以看出。

2·2基于活动轮廓模型的医学超声图像分割

活动轮廓线模型,又称Snake模型,自Kass等人[8]于1987年提出以来,已广泛应用于数字图像分析和计算机视觉等领域。活动轮廓线可以表示为定义在s∈[0,1]上的参数曲线:X(s)=[x(s),y(s)],及其能量函数ESnake=∫10(Eint(X(s))+Eext(X(s)))ds(1)式中Eint(X(s))=12(α|X′(s)|2+β|X″(s)|2)为内部能量函数,其中α、β为控制参数,分别控制参数曲线的弹性和刚性(或说,连续性和光滑性),X′(s)和X″(s)分别为X(s)对s的一阶导数和二阶导数。Eext(X(s))为外部能量函数,它由图像能量函数或其与其它能量函数组成:Eext(X(s))=Eimage(X(s))+Econstrain(X(s))。Eimage(X(s))反映了图像的某些本质特征,如边缘等。对于灰度图像I(x,y),一般采用以下几种外部能量函数:E1image(X(s))=±Δ(Gσ(x,y)·I(x,y))(2)E2image(X(s))=±I(x,y)(3)E3image(X(s))=-|ΔI(x,y)|2(4)E4image(X(s))=-|Δ(Gσ(x,y)·I(x,y))|2(5)其中Gσ(x,y)为标准差为σ的二维高斯函数,Δ为梯度算子。由上述几种图像能量函数可以看出,图像边缘处的能量最小。

主动轮廓线的运动过程就是寻找能量函数最小点的过程,从人工定义的初始位置开始,在使能量函数递减的算法的驱使下产生形变,直到到达目标的边缘。近年来的大量研究表明,主动轮廓线模型具有良好的提取和跟踪特定区域内目标轮廓的能力,因此非常适用于医学图像如CT、MRI和超声图像的处理,以获取特定器官及组织的轮廓。Yoshida等人[9-15]基于一定的活动轮廓模型,对医学超声图像分割作了较为深入的研究。本文基于梯度矢量流主动轮廓线模型[15],对软组织中的肿瘤超声图像的分割作了一些尝试,并达到了一定的效果。从大量的参考文献和自己的初步试验可以看出,活动边缘检测算法不仅能够保证所检测边缘线的连续性和闭合性,而且较动态规划算法的运算量小得多。

另外,该算法在序列图像跟踪分割算法中有着独到的优势。但是活动边缘检测及其各类“变种”算法仍存在着以下一些问题:①要给的初始点较多,且需要在实际目标边缘附近,否则难以搜索到目标边缘;②本算法所求得的是局部最优解,而非全局最优解,受伪边缘及噪声的影响较大,容易陷入局部最小解,或产生振荡,从而导致无法收敛到要求的边缘;③对B超图像的边缘特征信息,即图像能量函数难以给出,这也是包括动态规划算法和常规分割算法在内的各种图像分割算法都有的一个非常关键的问题,若解决了这个问题,其它许多问题都能够得以很好地解决。所以图像能量函数一直是医学超声图像分割的重要内容。

2·3基于水平集模型的医学超声图像分割

水平集是几何形变模型在图像分析和计算机视觉研究中应用较多的一种模型。目前图像分割中的水平集模型一般是根据Osher等人[14]建立的模型而建立起来的。设定运动曲线为X(s,t)=[X(s,t),Y(s,t)],其中s为任意参数,t为时间,用N表示曲线的单位法向量,κ表示曲率。曲线沿其法向量的进化可用偏微分方程表示为Xt=V(κ)N(6)式中V(κ)为扩展速度。为解该偏微分方程,引入水平集的概念。设水平集函数为(x,y,t),而且运动曲线X(x,t)由其零值集合表示,即[X(x,t),t]=0。对其求导得t+Δ·Xt=0(7)式中Δ为的梯度。假设在曲线内部为负,外部为正,则曲线的单位法向量为N=-Δ|Δ|(8)由式(7)和式(8),我们可重写式(6)t=V(κ)|Δ|(9)其中,零值集表示的曲线上的曲率为κ=Δ·Δ|Δ|=xx2y-2xyxy+yy2x(2x+2y)3/2(10)式(6)和式(9)之间的关系便构成了用水平集方法解决曲线进化理论的基础。水平集模型的图像分割方法在医学图像分割中得到了广泛的应用,但是用于超声图像的分割还很少[16-17]。究其原因,可能有两个方面。其一为医学超声图像噪声太大,运动速度难以设定;其二为终止条件难以给定。所以,水平集模型在医学超声图像分割中的应用还有待进一步深入研究。

3讨论和展望

分割技术范文第7篇

Abstract: As the special application environment of coal fields, the image segmentation technique is commonly used to directly cut the surveillance image of the underground coal mines video, but it often does not get the desired effect. This paper provides comparisons and analysis of several commonly used image segmentation algorithms in the applications for coal mine environmental requirements.

关键词: 图像分割;图像去噪;煤矿生产

Key words: image segmentation;image remove noise;coal production

中图分类号:TP391 文献标识码:A 文章编号:1006-4311(2012)11-0151-02

0 引言

近年来,视频图像处理技术的应用越来越广泛,图像处理算法的改进或创新成为了热门研究领域之一。视频图像分割是视频处理领域中的重要组成部分,对于图像理解、图像分析、模式识别、计算机视觉等具有重要的意义。目前,在图像分割理论与技术方面已经取得了丰硕的研究成果,运动目标分割技术根据算法采用特征主要分为四类[1]:基于变化检测的方法、基于光流估计的方法、基于模型的方法和时空分割算法。然而,针对煤矿领域特殊环境的应用的算法却比较少,本文从煤矿领域环境出发,对常用的几种图像分割算法进行深入比较分析。

1 常用的噪声去除算法

由于工作环境的限制,图像中往往含有大量的噪声,因此需要对采集的原始图像进行去噪处理,常用的处理技术是基于空间滤波。空间滤波是借助模板在图像空间内完成的领域操作,空间滤波器的工作原理是抑制图像在傅里叶空间某个范围内的分量,而其他分量不受影响,以改变输出图像的频率分布来达到增强的目的。滤波处理过程中既要保存图像的轮廓及边缘信息,又要使图像具有清晰的视觉效果。图像的滤波方法可以被分为频率域法和空间域法[2]。滤波方法中将输入和输出像素邻域像素是线性关系的称为线性滤波,如均值滤波和高斯滤波;否则为非线性滤波,如中值滤波。

高斯滤波根据高斯函数的形状来选择权值,对服从正态分布噪声的去除很有效。为了克服边界效应的影响,高斯滤波的加权平均值的中间权重比邻近像素的权重更大。采用3×3掩模的高斯滤波公式如下:

g(x,y)={f(x-1,y-1)+f(x-1,y+1)+f(x+1,y-1)+f(x+1,y+1)+

[f(x-1,y)+f(x,y-1)+f(x+1,y)+f(x,y+1)]*2+f(x,y)*4}/16(1)

其中f(x,y)为(x,y)像素点的灰度值,g(x,y)为经过高斯滤处理后的值。

中值滤波在某些条件下既可以去除噪声又能够保护图像的边缘信息,它的基本原理是将像素邻域内各点值的中值代替该像素点的值。中值的定义如下:

一组数x1,x2,x3,…xn,把n个数按值的大小顺序排列如下:

xi1xi2xi3…xin(2)

则序列x1,x2,x3,…,xn的中值表示为:

y=Med(x1,x2,x3,…,xn}=x , n为奇数x+x,n为偶数(3)

二维中值滤波表达式为:

g(x,y)=Med{f(x-k,y-l),(k,l∈W)}(4)

其中,f(x,y)为原始图像,g(x,y)表示处理后的二维图像。W为二维模板,模板通常为2×2、3×3区域,也可以是不同的形状,如方形、十字形、线形、圆形、菱形等。

虽然中值滤波器对脉冲信号很有效,但仅采用简单的中值滤波将会丢失图像的细节,造成视觉效果的模糊。于是又有研究者提出了一些改进的方法,如基于个数判断的脉冲噪声的中值滤波器、自适应门限的中值滤波器、多窗口下的自适应中值滤波器等等。

均值滤波是指在图像上给定目标像素的模板,此模板包括当前像素点及其周围的八邻域像素点,以模板像素点的平均值来代替原当前像素点。

均值滤波属于线性滤波的一种,其基本原理是用当前像素的领域均值代替原图像中当前像素值,即对图像的当前像素点(x,y),选择一个模板,该模板由其八个近邻的像素组成,求模板中所有像素的均值,再以该均值代替当前像素点(x,y),作为处理后图像在该点上的灰度值g(x,y),方程表示如下:

g(x,y)=f(x,y)(5)

m为该模板中包含当前像素在内的像素总个数。均值滤波能够平滑图像且速度快,算法简单。但只能减弱噪声,无法予以去除。

2 图像分割算法介绍

经过多年的研究,图像分割方法已经有很多种,根据算法采用特征主要分为四类:基于变化检测的方法[3]、基于光流估计的方法[2]、基于模型的方法和时空分割算法。

2.1 基于变化检测的图像分割研究 基于变化检测的方法通过对视频帧间差图像的检测实现运动目标的分割。常用变化检测的方法有帧差法和高阶统计量检测法,帧差法利用图像帧间的变化进行运动目标的检测,该算法简单易实现,实时性强,但容易出现空洞现象,通常结合其它方法应用。高阶统计量的检测法是由Neri[3]提出的,高阶统计(HOS)量主要利用图像信息的四阶累积或者四阶矩对运动区域进行提取。运动区域的提取过程中,首先要计算局部估计信息的帧差零延迟四阶矩;其次,进行自适应地设定阈值,该阈值要能够随背景相适应的变化;再次,将得到的阈值与计算出的四阶矩相比较,以区分运动区域和背景;最后,提取出不同于背景波动和噪声的运动区域。提取过程需要注意两个方面:一方面是阈值的设定,如果阈值设定不当,将会导致部分噪声不能被消除;另一方面,由于物体内部纹理信息的一致性,检测过程中会出现信息内部的空洞现象,为此还要进行边缘提取和区域填充等。

下面将分别给出随机变量的高阶矩和高阶累积量。

随机变量x的k阶矩通常可用x的特征函数(s)在原点的k阶导数来表示:(s)=f(x)edx=E{e}(6)

(0)=E{x}=m(7)

这里也把(s)称为x的矩生成函数,将函数φ(s)=ln(s)称为x的累积量生成函数,随机变量x的k阶累积量ck定义为它的累积量生成函数φ(s)的k阶导数在原点的值,表示为:

c= (8)

高阶统计量最初应用于信息处理领域,然而由于具有抑制加性高斯噪声的能力,可以避免高斯噪声对图像的影响的特点,已经被很多研究者引入到图像滤波、图像分割等图像处理的不同研究领域。该方法能够较完整地分割出运动目标,但只适用于静止背景环境下。

2.2 基于光流估计的图像分割研究 光流估计的方法通过光流场的运动估计实现分割的目的。光流场估计经典方法有Horn和Shuck利用光流的假设条件求解光流[4],相应的光流约束方程如下:

Ixu+Iyv+It=0(9)

式中,u=,E(C),Ix、Iy、It分别为图像I在x,y,t方向的偏导数。

光流估计能够适合背景变化的场景,但计算复杂。利用光流场对运动进行估计是一种常用方法,但由于应用过程中存在的空洞问题和遮挡问题,所以也存在估计的不确定性。对于煤矿领域的图像,由于噪声含量较大的原因,基于光流估计的图像分割很少被应用。

2.3 基于模型方法的图像分割研究 基于模型的方法通过建立对象模型,利用模板匹配的方法实现运动目标的分割。常用基于模型的方法有Snake模型、C-V模型等,Snake模型使初始曲线通过外部约束力及图像内部能量的相互作用进行演化,通过图像的边缘信息实现图像的分割;Chan和Vese提出不依赖图像梯度信息的图像检测算法[5],该算法可以克服在图像光滑边界上分割效果不好的问题。C-V模型水平集其能量函数是,定义域为Ω的图像I(x,y)被闭合边界C划分为目标、背景2个区域Ca,Cb其平均灰度分别为ca,cb。表达式如下:

E(C,ca,cb)=μL(C)+vSa(C)+λa1-cdxdy+λ1-cdxdy(10)

其中,L(C)是闭合轮廓线C的长度;Sa(C)是C的内部区域,即Ca的面积;μ,v0,λa,λ>0是各个能量项权重系数。只有轮廓线位于2个区域边界时,E(C)才能达到最小值。

对于运动图像的分割,由于模型方法需要借助其他方法进行引导,并且演化速度较慢等原因,不便于实时系统的应用,在煤矿领域应用也较少。

2.4 时空分割算法的研究 时空分割算法在运动目标分割中引入图像区域分割,首先根据某种方法得到基于区域的图像信息,再根据时域信息确定区域的运动,最后合并运动区域实现运动目标的分割。Mech和Wollborn提出利用二次空间分割实现对运动目标的准确分割[6],分割过程中利用数学形态学消除噪声,并结合了边缘信息。郑河荣等提出基于时空注意模型的视频分割算法,通过显著性映射构造时空注意特征,并采用分层条件随机场进行视频分割[7],算法不仅能够分割复杂动态背景下的运动目标,还可以去除摄像机运动等所导致的误分割问题。由于时空分割算法能够得到理解的分割效果,且满足实时性的要求,得到了广泛的应用。

3 实验结果分析

为了验证四类分割算法的效果,本文选用一组煤矿地面输送带视频图像进行分析。算法由matlab7.1实现,图1(a)和图1(b)为视频图像中两幅原始图像,图1(c)为高阶统计量分割图,该算法能够较准备的分割出运动目标,但图中仍然含有一定的误分割,且计算时间较长;图1(d)为光流场分割图,该算法不仅计算时间较长,而且不利于实现准备分割;图1(e)为帧差法引导的C-V水平集分割图,随然能够分割出运动目标,但C-V水平集演化过程很慢,且会出现过度分割现象;图1(f)为时空结合算法的分割图,该图中能够分割出较理想的运动目标,且计算速度较快,易于实现实时性较高的要求。

4 总结

针对煤矿应用领域的环境要求,分析了按特征分类的四种分割算法,并根据工作环境对图像的影响分析了常用噪声去除的方法,通过比较实现分析了四种分割算法的分割效果。

参考文献:

[1]Neri A, Colonnese S, Russo G, et al. Automatic moving object and background separation[J].Signal Processing,1998,66(2):219-232.

[2]HADDADI S, FERNANDEZ C. Luminance and texture variation analysis for motion detection[J]. SPIE, 1997, 33(9): 1008-1018.

[3]B D Lucas,T Kanade. An Iterative Image Registration Technique with an Application to Stereo Vision[C]. Processing of the International Joint Conference on Artificial Intelligence, 1981.

[4]M Pardas. Relative Depth Estimation and Segmentation in Monocular Schemes[C]. Picture Coding Symposium, Berlin, Germany, 1997,367-372.

[5]刘珂,张宪民,付永会.一种改进的Hausdorff距离目标跟踪算法[J].上海交通大学学报,2001,35(2):223-227.

[6]Roland Mech, Michael Wollborn. A Noise Robust Method for 2D Shape Estimation of Moving Objects in Video Sequences Considering a Moving Camera[J]. Signal Processing, 1998,66(2):203-217.

分割技术范文第8篇

关键词:视频检索;镜头分割;镜头渐变;镜头突变

中图分类号:TP391 文献标识码:A 文章编号:1009-2374(2013)13-0085-02

随着经济社会的快速发展和科学技术的飞速进步,视频等多媒体格式的信息量越来越大,来源也更为广泛。视觉成为人类接受外界信息的重要来源,其中,图像视频信息是视觉信息的主要表达方式,它所包含的信息量也是海量的,远远超过了文本、图片等数据格式。图像视频在具体、生动、确切、高效等方面有许多优点,由于这些特点就使得人类最重要的通信方式主要为基于视频信息的通信方式和以视频格式传输或携带的信息通信方式。这种视频信息方式更形象、更生动、更直观,更能够贴近或者还原于实际。计算机传统上存储数据的方式是基于文本的。视频数据信息已成为我们日常生活中不可或缺的重要内容,但由于它携带的信息量较大,也成为阻碍其发展的瓶颈,如何提高视频资源的检准率、检全率,其现实意义将非常重大,视频检索的第一步就是镜头。

1 镜头分割在基于内容的视频检索中作用

帧是指在数据和数字通信中,按某一标准预先确定的若干比特或字段组成的特定的信息结构。镜头是构成视觉语言的基本单位。它是叙事和表意的基础。在影视作品的前期拍摄中,镜头是指摄像机从启动到静止这期间不间断摄取的一段画面的总和;在后期编辑时,镜头是两个剪辑点间的一组画面;在完成片中,一个镜头是指从前一个光学转换到后一个光学转换之间的完整片段。场景是指电影、戏剧作品中的各种场面,由人物活动和背景等构成。连续的图像变化每秒超过24帧(frame)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面;看上去是平滑连续的视觉效果,这种连续的画面叫做视频。

视频序列由数个视频场景组成,通常指单独的某个视频文件或者视频片段。场景通常由一个或者多个镜头构成。镜头由多个连续的图像帧构成。图像帧指单幅静态的图像,是构成视频文件的最小单位。

在播放视频时,定格时的每一个画面就是一个图像帧。摄像机拍摄物体时产生的一段连续图像就是镜头,由多个帧组成。拍摄对象运动、光源亮度变化或摄像头运动等都能引起镜头内部图像发生变化。场景是连接视频底层数字特征与高层语义的桥梁,它由语义相关的若干个镜头所组成。这些镜头不一定是连续的,但是必然在语义上有某种相关性,例如:不同镜头中人物所处的相同场所、不同事件发生时所在的相同地点等。场景一般可以代表特定的子事件,而众多的子事件组成了一个视频序列所代表的整体事件。

镜头分割(Shot Segment),即把视频文件分割成若干个镜头。由于镜头与镜头之间一般有很清楚的边界,成为边界帧。则镜头分割的主要任务就是把这些边界帧从构成视频文件的所有帧中找出来,也就是使用计算机来顺序的检测视频文件的每一帧,判断其是否是镜头边界帧,这项工作亦称为镜头边界检测(Shot Boundary Detection)。

分割后的每段视频片段都是一个独立的镜头,其中包含了能代表每个对应镜头的关键帧,这样就能通过提取关键帧来建立索引。因此,首先需要把视频序列分割成单个的视频镜头,然后再进行提取关键帧、提取视频片段整序、提取视频序列识别等。这有助于对视觉媒体从低层到高层进行处理、分析和理解的过程获取其内容并根据内容进行检索。

2 基于内容的视频检索中镜头分割方法

镜头间转换一般包括渐变(gradualtransition)和突变(cut transition)两种方式。所以相对应镜头间的转换,镜头检测研究方法也大致可分为镜头渐变和镜头突变检测研究两种研究方法。

直接将两个镜头连接就是镜头突变,它们中间不添加任何特效且不使用视频编辑技术。与之相反,镜头渐变则通过在两个镜头中间添加视频特效联接两个镜头。按照所添加的镜头间编辑特效的不同,镜头渐变技术包含溶解(dissolve)、叠化(Dissolve)、映射(Map)、擦除(Wipe)、划变(wipe)、划像(Iris)、淡入淡出(fade)等多种形式。

当前,主流的镜头边界检测算法可分为两类:基于压缩域的方法与基于象素域的方法。基于像素域的镜头切分主要是依据所拍摄对象的形状、纹理、颜色等特征从而实现镜头边界检测的原理。

总之,要实现视频镜头的分割,常用的方法就是计算视频中各连续帧之间底层视觉特征的帧差值F,再将F与预先设定或者自适应的域值T作比较,若F>T,则镜头边界不存在,若F

近些年来,使用智能计算与机器学习的方法检测镜头边界的算法已经逐渐兴起。由于在镜头渐变过程中,在内容上相邻帧的图像没有明显的突变,明显的切换点是难以检测到的。因此,渐变镜头的检测比切变镜头的检测更复杂,还有较多的问题亟待解决。利用单一的特征检测并不能很好解决两个镜头间变化多样的情况。2007年的TRECVID会议报告[48]指出渐变检测算法的查准率和查全率需要深一步提高,两者值均只介于70%~80%之间。提高渐变检测算法的查准率和查全率对于实现基于内容的视频检索系统有很大的应用价值和理论价值。

3 基于OpenCV的视频帧特征提取系统结构

由于视频流的数据量大,又是一种非结构性的数据,需要对它进行一些预处理。镜头是视频流在编辑制作和检索中的基本结构单元,最为有效的预处理方法之一就是分镜头,它首先把这一段视频流,根据其组成的镜头,找出镜头的突变和渐变的切变点,进而标出每个镜头的起始帧号和结束帧号,然后从中挑出这一个镜头内的代表帧。后续的浏览与检索以及更高一级的视频结构化受镜头分割效果的直接影响。所以视频检索的第一步就是镜头,视频结构化的基础就是镜头的自动分割,视频分析和检索过程中的首要任务就是有效的视频镜头分割技术,也是人们研究的热点。

参考文献

[1] 孔祥鹏,马立和.基于H.264压缩域的运动对象快速分割方法[J].智能计算机与应用,2012,(8):2-4.

[2] 韩冰.基于智能软计算的视频镜头分割算法的研究

[J].西安电子科技大学学报,2006,(2):36-41.

[3] 梁薇.基于DSP的运动目标检测系统[J].计算机与网络,2012,(4):12-16.

[4] 许高程,张文君,王卫红.支持向量机技术在遥感影像滑坡体提取中的应用[J].安徽农业科学,2009,(6):3-5.

[5] 李东瀛,尉凯征,张.基于内容的视频检索技术

[J].信息系统工程.2011,(12):14-17.

分割技术范文第9篇

关键词:字符分割;垂直投影法;先验知识 ;车牌识别

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)31-0183-02

1 引言

城市交通的完善为车辆的运行提供的基础,也进一步地增加了城市车辆的数量,这也就给城市车辆管理带来一些不便。车辆识别系统主要是根据车辆的车牌完成对车主相关信息的调用和读取,还能完成对车辆的定位。字符分割对车牌识别的作用显著,如果字符分割的效果不够理想,就会引起的车牌识别和定位出现失误。故此,需要借由的一种新型的车牌字符分割算法技术,完成对这些不良因素的控制,保障识别的真实性。

现阶段,城市交通中的智能监控系统的范围日渐扩大,可以全面完成对城市交通的监控和管理。对于车牌识别,如果不能有效地完成识别,必然不能对车辆完成定位和管理工作。国内的车牌主要是由汉字英文字母和数字这些部分构成。但是,受到人为因素和剐蹭、光照等因素的影响,导致的车牌识别的结果不够准确,甚至可能会出现失误的情况,严重影响相关服务和管理工作。本文采用基于垂直投影的分割算法技术,完成对不同情况下的字符分割,并可以摆脱这些不良因素的干扰,确保车牌识别的准确性。再通过相关实验完成对基于垂直投影的分割算法的检验,经过检验结果的导致,该算法切实能够完成对不同干扰情况下的车牌识别,具有较高的实用价值,值得推广实践。

2 垂直投影法

2.1 车牌字符分析

国内的主要是由字母、汉字和数字构成,共有7个字符,且采用统一规格,达到便利识别的目的,其中车牌字符的具体参数如下表1所示。

车牌字符作为辆识别的重要部分,其规格必须按照归家统一标准进行应用。另外,车牌在实际的应用中,可能会受到一些外界因素的干扰,导致车牌字符的出现识别不佳的情况,其中这些因素主要有:光照问题;安装问题和字符分割问题。

2.2 垂直投影法的原理

本文的车牌字符分割算法技术是建立在垂直投影法的基础上,垂直投影法主要是将经过的处理的灰度图进行灰度垂直投影,并对相关图像进行观察。通过的对车牌的灰度图像的垂直投影,可以得到7个的区域,而这7个区域内部则代表的车牌的基本字符,想要得到的具体的字符情况,只需要对的所有字符的左右边界即可。其中获取的字符边界主要是借由的字符区间内部的白色像素个数的波谷,借由这类方式,即可完成对字符边界的获取。鉴于垂直投影法的效果可靠,能够完成对车牌字符的分割,故此,可以有效地应用到的车牌字符分割中。

其中垂直投影实际的应用中,主要的是按照横向投影的方式,由左向右侧展开检测,并将黑色像素设为0,白色为1。通过对检测结果中1的个数分析,就可以得到的车牌中白色像素的基本情况。鉴于车牌中白色像素所占的区域少,可以采用波谷作为边界,从而完成边界的获取。但是,这类方式对车牌的字符分割的仍旧存在一些不足,需要对其进行改善。本文采用先展开垂直投影的方式,先得到图像,并先进行域值的定义,定义域值为T,如果投影的值

2.3 垂直投影法的实现过程

车牌定位后,提取了车牌的特征值,就能找到垂直投影的分割线位置,具体步骤如下

⑴分别设定参数与,完成对字符宽度的计算,公式如下:

⑵根据上述公式的基本情况,完成对的计算和分析。计算得出后,需要合理的对垂直投影特征函数进行计算,具体的计算公式如下:

⑶借由垂直投影的特征函数,可以完成求出特征值和垂直投影,结合如下公式,完成对的分割线的选择。

⑷上述步骤的分割线等参数求解完成后,需要合理的对间距进行的选择,了解最大间隔位置P的具体情况。其中分割区域的特征主要包含投影数量、规格等信息。

⑸最大间隔的位置P获取完成后,需要完成对最大间隔特征的提取,结束后,对两个信息的进行同时应用,从而完成对车牌字符的分割。采用垂直投影―先验知识结合的方法分割字符,可以有效地减少各类干扰因素的对图影像的影响,且投影效果良好,及时的车牌受到一定程度的损坏,也可以完成对字符的分割,进而为车牌的识别提供基础,保障识别的质量。

3 实验结果分析

对停车场车辆车牌、高速公路路口抓拍的车牌以及公路行驶车辆抓拍的车牌进行测试,这也是目前字符分割普遍采用的方法。其中停车场车牌可以实现99%以上的分割正确率,其余2种的分割正确率也在98%左右,对字符进行分割,为了达到改善识别的效果,还需要对字符的宽度因素进行考虑。但该方法在研究过程中也存在缺陷,就是当字符褪色严重或有干扰信息时会影响分割的质量。

本文通过运用垂直投影法进行实验,对车牌图像库中的图像进行字符测试,图库中共有60幅图(400个样本),其中35幅作为训练集(320个样本);25幅图作为测试集(280个样本)。

实验结果表明,该方法可以有效完成对不同影响因素下的车牌识别情况,可以解决拍摄到的车牌图像出现模糊不清的问题,但算法存在某些局限性,故此,需要进一步的对实验进行研究和分析,从而推动车牌识别的效果和质量。

参考文献:

[1] 段娜,刘力政.基于最大间隔符号特征的车牌字符分割算法[J].西安科技大学学报,2014(9).

[2] 姜周恩.车牌字符分割算法研究[J].辽宁师范大学,2010(6).

[3] 傅建强,冯瑞.基于条件随机场的低图像质量车牌字符分割[J].计算机应用与软件,2013(10).

[4] 陆建华.基于垂直投影与卷积相结合的车牌字符分割算法[J].计算机时代,2013(11).

[5] 潘中杰,谭洪舟.模板匹配和垂直投影法相结合的一种新的车牌字符分割方法[J].应用技术,2010(4).

分割技术范文第10篇

【关键词】GPU;图像分割;3D技术

近年来,图形处理器(Graphics Processing Unit,GPU)在各领域中的应用越来越广泛,从最初简单的图形处理功能,发展到现在已经发展到现在可以进行编程计算。针对GPU高级编程语言,可以对其进行编程控制从而带来更加方便快捷的用户体验,并应用在渲染之外的通用计算方法。与中央处理器((CentralproeessingUni,CPU)的计算模式不同,GPU是一种高度并行的流处理器,浮点计算能力更强,在信号模拟以及分析等许多领域,具有非常优越的实用性,可以通过编程在GPU中进行分析计算,尤其可以解决三维图像处理中的难题,而且提高算法的执行效率也是一个十分有应用价值的研究内容,下面就对基于GPU的自动3D分割技术的应用进行深入研究。

一、GPU的结构特点

图形处理器(Graphics Processing Unit,GPU)是利用计算机软件对系统信息进行转换驱动,然后向显示器提供行扫描信号并进行正确显示,可以说GPU 是实现“人机对话”的核心环节。显卡作为电脑主机里的一个重要组成部分,承担输出显示图形的任务,对于从事专业图形设计的人来说显卡非常重要。GPU的微架构是面向适合于矩阵类型的数值计算而设计的,其内部拥有大量重复设计的计算单元,这些计算单元可以分成众多独立的数值计算,即大量数值运算的线程,而且数据之间没有像程序执行的那种逻辑关联性。

利用GPU做通用计算的主要目的是为了提升运算速度,在并行性方面,GPU中有1~30个流多重处理器,可在多个流多重处理器间进行粗粒度的任务级或数据级并行,或在流多重处理器内部进行细粒度数据并行。相对于计算机集群,GPU为很多应用提供了一个十分廉价的并行方案,特别是对于图形本身的应用而言。在高密集的运算方面,GPU有多个存储器控制单元,如GIX28O就有8个,每个控制器控制两个位宽32bit的显存,使总的存储器位宽达到512bit,更适合于大块数据传输。GPU缓存主要功能是用于过滤对存储器的请求,减少对显存的访问,这些优势使得它比CPU更适合于流处理计算,处理逻辑分支简单的大规模数据并行任务,使应用得到加速。

二、基于GPU的自动3D分割技术的应用

图像分割技术是图像处理和分析的关键技术之一,本文研究的基于GPU的自动3D分割技术,就是将原始的3D图像划分成不同性质的区域,然后再将目标图像提取并显示出来。在各领域中,3D分割技术的应用十分广泛,以医学领域为例:在临床诊断、患者的病理分析以及后期治疗过程中都有涉及。

临床医疗使用的图像本质上都是模糊的,这些图像的纹理、灰度以及区域边界给图像分割技术造成了极大的困扰。近年来,Graph Cuts 算法框架得到了普遍的关注,其应用领域包括图像复原、多目视觉、图像分割等计算机视觉研究的各个方面。基于 Graph Cuts 的图像分割算法,可以求出全局最优解,可以轻易的从二维扩展到三维甚至更高维的图像分割上,因而具有良好的效果和广阔的应用前景。

在基于GPU的自动3D分割技术的研究中,主要针对非刚性图像配准,而且采用正则化梯度流的方法,使得两幅图像之间的能量函数沿着规则化梯度方向递减至最小值,达到配准目的。该方法没有采用循环搜索策略,而是通过在GPU中求解变分偏微分方程,以数据流的形式进行并行处理。利用GPU对三维数据进行投影,并通过投影数据之间的相似度求解配准参数。随着图形硬件在性能和可编程性等方面的改进,使得图像配准算法在GPU中的实现变得更加方便和快捷,根据GPU的新特性本文提出了新加速策略,实现快速基于互信息的三维医学图像刚性配准算法。

本文研究的基于GPU的自动3D分割技术包括较多的判断语句以及各搜索方向之间的相互承接,属于计算量小但控制复杂的运行模式,采用普通的CPU编程模式比较容易实现。以空间变换参数为变量的互信息计算在优化搜索过程中需要反复执行数百次甚至更多才能完成一次配准过程,因此提高互信息值的计算速度将能从根本上缩短图像配准时间。互信息的计算过程可以分为两个步骤,第一步执行3D空间变换和三线性插值,第二步计算两幅图像之间的联合直方图,并由联合直方图计算联合墒、边缘墒,进而得到互信息值。这些理论研究成果,经过实践测试后,有着非常显著的图像处理效果,因此基于GPU的自动3D分割技术将是未来医院图像处理领域主要的研究方向。

结论

综上所述,利用目前GPU的可编程能力以及高强度并行计算能力,在进行图像分割过程中有非常显著的效果。随着科学技术的发展,超级计算机、地震勘探、医疗设备等产生了大量的三维体数据,有效的数据分析已经成为迫切需要解决的问题。在过去的十年中可视化技术始终是科学研究的一个热点。体绘制可视化技术可以基于体素显示具有半透明效果的真实三维物体,目前,已经逐渐成为主要的体数据分析手段。然而要获得体数据中隐藏的重要信息,除了能够产生高质量的绘制图像,体绘制技术还必须具有很好的交互性能。因此,高质量的体绘制技术和高性能的交互分析工具的研究对科学计算和医学研究等众多领域具有重要意义。

作者简介:邓惠俊(1978-),女,安徽无为县人,万博科技职业学院讲师,硕士,研究方向:计算机辅助设计, 计算机可视化,网络安全。

参考文献:

[1]欧阳鹏.可重构视觉处理器关键技术研究及VLSI实现[D].清华大学,2014.

上一篇:互动媒体艺术范文 下一篇:射频消融术范文

友情链接