分割技术范文

时间:2023-10-20 19:56:22

分割技术

分割技术篇1

关键词: 数字图像处理; 图像分割; 分割算法; 机器视觉

中图分类号:TP3 文献标志码:A 文章编号:1006-8228(2015)01-26-03

Research and application of image segmentation technology

Wang Wei1, Zeng Xiaoneng2

(1. Changsha Information technology School, Changsha, Hunan 410116, China; 2. Central South University)

Abstract: Image segmentation is about decomposing an image into a number of mutually non-overlapping region while having the same attribute. It is a key technology of digital image processing, which directly affects the effectiveness of segmentation accuracy of subsequent tasks, hence having important significance. The existing segmentation algorithm achieved success to some extent, but the image segmentation problem is far from being solved, research in this area still faces many challenges. The existing problems of image segmentation methods are analyzed. The classical algorithm for image segmentation is improved. A new segmentation method is given and applied to the machine vision-related products which achieve good results.

Key words: digital image processing; image segmentation; segmentation algorithm; machine vision

0 引言

图像分割是数字图像处理中的一项关键技术,它通常用于对图像进行分析、识别、编码等处理之前的预处理环节,其分割的准确性直接影响后续任务的有效性,因此具有十分重要的意义。自上世纪70年代以来,已经出现了多种图像分割方法,而每一种图像分割方法都是为了解决一些特定的应用问题。该技术成功地应用于许多领域,例如:交通路口的电子警察、光学字符识别(OCR)、指纹识别、机动车牌号识别等等。

图像分割是指将一副图像分解为若干互不交叠的有意义且具有相同属性的区域。好的图像分割应具备的特性:①分割出来的各区域对某种性质如灰度、纹理而言具有相似性,区域内部比较平整;②相邻区域对分割所依据的性质有明显的差异;③区域边界上是明确和规整的[1]。

大多数图像分割方法只是部分满足上述特征。如果强调分割区域的同性质约束,则分割区域很容易产生大量小孔和不规则边缘;若强调不同区域间性质差异的显著性,则易造成不同区域的合并。具体处理时,不同的图像分割方法总是在各种约束条件之间寻找一种合理的平衡。

虽然图像分割方法已经有了很大的发展,但由于它的复杂性,仍有很多问题没有很好地得到解决。因此,人们至今还一直在努力发展新的、更有潜力的分割算法,以期实现更通用、更完美的分割结果。实践表明,对图像分割理论与技术的进一步研究仍然具有非常重要的意义。

本文首先对数字图像分割的一些经典分割方法作了概述,然后分析了现有项目开发中使用的图像分割方法所存在的问题,最后基于经典算法进行技术改进,实现了一种新的分割方法,并将其应用到实际的产品当中,取得了良好的效果。

1 图像分割方法的现状

从上世纪五十年代开始,学者一直热衷于研究图像分割技术。迄今为止,已提出上千种图像分割算法,依这些算法对图像处理的特点,主要可分为以下几类方法[2]。

1.1 阈值分割法

阈值分割法作为一种常见的区域并行技术,它通过设置阀值,把像素点按灰度级分若干类,从而实现图像分割。由于是直接利用图像的灰度特性,因此计算方便简明、实用性强。显然,阈值分割方法的关键和难点是如何取得一个合适的阈值,而实际应用中阈值设定易受噪声和光亮度影响。近年来关于阈值分割法主要有[3]:最大相关性原则选择阈值法、基于图像拓扑稳定状态法、灰度共生矩阵法、熵法、峰值和谷值分析法等。其中,自适应阈值法、最大熵法、模糊阈值法、类间阈值法是对传统阈值法改进较成功的几种算法。更多的情况下,阈值的选择会综合运用两种或两种以上的方法,这也是图像分割发展的一个趋势。例如,将图像的灰度直方图看作是高斯分布的选择法与自适应定向正交投影高斯分解法的结合,较好地拟合了直方图的多峰特性,从而得到了更为准确的分割效果。阈值法的缺陷主要在于它仅仅考虑了图像的灰度信息,而忽略了图像的空间信息。对于非此即彼的简单图像处理(如一些二值图像的处理)是有效的,但是对于图像中不存在明显的灰度差异或各物体的灰度值范围有较大重叠的图像分割问题则难以得到准确的分割效果。

1.2 基于边缘的图像分割法

边缘总是以强度突变的形式出现,可以定义为图像局部特征的不连续性,如灰度的突变、纹理结构的突变等。边缘常常意味着一个区域的终结和另一个区域的开始,图像的边缘包含了物体形状的重要信息,它不仅在分析图像时大幅度地减少了要处理的信息量,还保护了目标的边界结构。对于边缘的检测常常借助空间微分算子进行,通过将其模板与图像卷积完成。两个具有不同灰度值的相邻区域之间总存在灰度边缘,而这正是灰度值不连续的结果,这种不连续可以利用求一阶和二阶导数检测到。

当今的局部技术边缘检测方法中,主要有一次微分(Sobel算子、Roberts算子)、二次微分(拉普拉斯算子等)和模板操作(Prewitt算子、Kirsch算子和Robinson算子)等。这些边缘检测器对边缘灰度值过渡比较尖锐且噪声较小等不太复杂的图像可以取得较好的效果,但对于边缘复杂(如边缘模糊、边缘丢失、边缘不连续等)的图像效果不太理想。此外,噪声的存在使基于导数的边缘检测方法效果明显降低,在噪声较大的情况下所用的边缘检测算子通常都是先对图像进行适当的平滑,抑制噪声,然后求导数,或者对图像进行局部拟合,然后再用拟合光滑函数的导数来代替直接的数值导数,如Marr算子、Canny算子等。有关学者曾给出了一种基于彩色边缘的图像分割方法,这是对传统边缘分割方法只适用于灰度图像状况的一个突破。

在未来的研究中,用于提取初始边缘点的自适应阈值选取、用于图像层次分割的更大区域的选取,以及如何确认重要边缘去除假边缘将变得非常重要。

1.3 基于聚类的分割法

对灰度图像和彩色图像中相似灰度或色度合并的方法称之为聚类,通过聚类将图像表示为不同区域即所谓的聚类分割方法。此方法的实质是将图像分割问题转化为模式识别的聚类分析,如k均值、参数密度估计、非参数密度估计等方法都能用于图像分割。常用的聚类分割有颜色聚类分、灰度聚类分割和像素空间聚类分割。

颜色聚类分割实际上是将相似的几种颜色合并为一色,描述颜色近似程度的指标是色差,在标准CIE匀色空间中,色差是用两个颜色的距离来表示的。但是显示器采用的RGB空间是显示器的设备空间,与CIE系统的真实三原色不同,为简单起见,一般采用RGB色空间中的距离来表示。

灰度聚类分割就是只把图像分成目标和背景两类,而且仅考虑像素的灰度,这就是一个在一维空间中把数据分成两类的问题。通过在灰度空间完成聚类,得到两个聚类中心(用灰度值表征),聚类中心连线的中点便是阈值。显然这个概念也可以轻松地延扩至多阈值和动态阈值的情况。

像素空间聚类分割在某些特定的尺度上观察图像,比如说把图像信号通过一个带通滤波器,滤波的结果将使图像的局部信息更好地被表达。通过一个多尺度分解,轮廓信息可以在大尺度图像上保留下来,细节或者突变信息可以在中小尺度上体现,基于多尺度图像特征聚类的分割方法渐渐得到了人们的关注。

1.4 函数优化法

基于函数优化的分割方法是图像分割中另一大类常用的方法,其基本思路是给出一个目标函数,通过该目标函数的极大化或极小化来分割图像,G.A.Hewer等人提出了一个具有广泛意义的目标函数。统计学分割法、结合区域与边缘信息法、最小描述长度(MDL)法、基于贝叶斯公式的分割法等是目前几种活跃的函数优化法。

统计学分割法就是把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量,且观察到的实际物体是作了某种变换并加入噪声的结果。统计学分割方法包括基于马尔科夫随机场法(MRF)、标号法(Labeling)和混合分布法(Mixture)等。

结合区域与边缘信息法是基于区域信息的图像分割的主要方法。区域增长有两种方式:一种是先将图像分割成很多一致性较强的小区域,再按一定的规则将小区域融合成大区域,达到分割图像的目的;另一种是事先给定图像中要分割目标的一个种子区域,再在种子区域基础上将周围的像素点以一定的规则加入其中,最终达到目标与背景分离的目的。分裂合并法对图像的分割是按区域生长法沿相反方向进行的,无需设置种子点,其基本思想是给定相似测度和同质测度,从整幅图像开始,如果区域不满足同质测度,则分裂成任意大小的不重叠子区域;如果两个邻域的子区域满足相似测度则合并。

最小长度描述法(MDL)的基本思路是用一种计算机语言来描述图像的区域和边界信息,得到一个描述长度函数,以此作为目标函数,根据图像极小化描述长度从而得到分割结果。MDL准则主要应用于区域竞争中,即通过这种规则对比若干个种子区域,找出其中的坏种子。它常常与其他方法结合使用。

2 图像分割技术的研究与应用

2.1 图像扫描分割

根据实际产品的需要,要根据分割的特殊要求,采用简单的图像扫描分割。

2.1.1 算法思想

获取二值化要分割的图像,然后转换为图像指针并获取图像的左右边界、上下边界,然后再分割图像[4]。

2.1.2 分割过程实现

下面介绍基于FrameWork4.0,采用C#实现对图像进行分割处理的主要步骤。

⑴ 二值化要分割的图像

BaseFilterHandler.ImgConvertToFormat8(c_Bitmap);

BaseFilterHandler.ImgBradleyLocalThresholding(c_Bitmap);

⑵ 转换为图像指针并获取图像中的左右边界

BitmapData bmData=c_Bitmap.LockBits(new Rectangle

(0,0,c_Bitmap.Width,c_Bitmap.Height),ImageLockMode

.ReadWrite, c_Bitmap.PixelFormat);

List<int[]> widthLeftRight=GetImgLeftRight(bmData,

c_Bitmap, throldValue);

⑶ 获取图像的上下边界

int[] yValues=img.GetPicTopBottom(sourceMap, 1, sourceMap

.Height-2, widthLeft[widthLeftIndex],

widthRight[widthLeftIndex]);

top=yValues[0]; bottom=yValues[1];

⑷ 分割图像

Rectangle sourceRectangle0=new Rectangle

(widthLeft[widthLeftIndex],tempTop, widthRight

[widthLeftIndex]-widthLeft[widthLeftIndex], tempHeight);

Bitmap tempMap=sourceMap.Clone(sourceRectangle0,

sourceMap.PixelFormat);

2.1.3 实际效果

存在干扰情况下的分割效果,如图1所示。

<E:\方正创艺5.1\Fit201501\图\ww图1.tif>

图1 图像扫描分割

图像扫描分割的结果存在多干扰点,一些字符不能完整地被分割出来,多个字符连接在一起,分割效果不是很好。

2.2 findContours分割

2.2.1 算法思想

该算法是提取图像的轮廓信息,一个轮廓一般对应一系列的点,也就是图像中的一条线[5]。在算法中用序列cvSeq来保存提取到的序列集,序列中的每一个元素就是曲线中的一个点的位置。

2.2.2 分割过程实现

下面介绍采用C++实现对图像分割处理的主要步骤。

⑴ 图像的预处理(二值化、平滑处理等)

threshold(input,img_threshold,60,255,

CV_THRESH_BINARY_INV);

IplImage* input_image=&IplImage(img_threshold);

IplImage* dst_image=cvCreateImage(cvGetSize

(input_image),IPL_DEPTH_8U,0);

cvSmooth(input_image,dst_image,CV_GAUSSIAN,3,0,0,0);

⑵ 查找图像的联通区域及轮廓

Mat img_contours;

img_threshold.copyTo(img_contours);

vector<vector<Point>> contours;

findContours(img_contours, contours,

CV_RETR_EXTERNAL,CV_CHAIN_APPROX_NONE);

⑶ 对轮廓进行转换得到内容区域

vector<vector<Point>>::iterator itc=contours.begin();

IplImage* temp=&(IplImage)input;

vector<Rect> validRect;

while(itc!=contours.end()) {

Rect mr=boundingRect(Mat(*itc));

rectangle(result,mr,Scalar(0,255,0));

if(!checkSplitRect(mr,temp->height,temp->width))

{ ++itc;continue; }

validRect.push_back(mr);

++itc;

}

⑷ 图像分割

CvSize size=cvSize(rect.width,rect.height);

cvSetImageROI(source,cvRect(rect.x,rect.y,size.width,size.height));

IplImage* pDest=cvCreateImage(size,source->depth,

source->nChannels);

cvCopy(source,pDest);

cvResetImageROI(pDest);

2.2.3 实际效果

从分割结果看,该分割算法能把所有的单个图片联通区域分割出来,但是分割出的区域存在很多干扰区域,增加了实际区域提取的复杂度(见图2)。

<E:\方正创艺5.1\Fit201501\图\ww图2.tif>

图2 连通区域分割

下面将在此基础上进行改进。

2.3 改进后的算法

增加连通区域的有效性判断及过滤;

checkSplitRect(Rect rect,int height,int width)

同时对一些单字符被分割成多个字符的区域按照一定的算法及规则进行有效组合和合并;

vector<Rect> MergeImage(vector<Rect> validRect)

最后形成的分割效果如图3所示,将所有字符正确的分割出来,去除了干扰,达到了理想的效果。

<E:\方正创艺5.1\Fit201501\图\ww图3.tif>

图3 改进后的分割效果

3 实验结果

为了验证本方案的可行性和可操作性,本文使用10000张测试图像作为实验测试库,对此方案进行测试。测试结果:正确分割达到99%以上。如图4,改进后的分割正确率比改进前的分割正确率提高了将近20倍。

<E:\方正创艺5.1\Fit201501\图\ww图4.tif>

图4 分割对比

4 结束语

图像分割没有通用的理论,要根据具体情况采取有效的方法。利用已经研究出的多种图像分割方法,将多种方法综合运用,发挥各自的优势进行图像分割将成为这一领域的发展趋势。同时,由于现在所处理的图像的复杂度和固有的模糊性,传统的单一的处理方法已不能适用需要,与新理论、新工具和新技术结合起来才能有所突破和创新。

本文在原有分割技术的基础上,结合实际的使用情况,进行了算法思想的改进和创新,最终达到了理想的分割效果,在一定程度上具有良好的研究和实用价值。

参考文献:

[1] R.M.Haralick,L.G.Shaprio, "Image segmentation tech2 niques",

Computer Vision, Graphics, and Image Processing,1985.29:100-132

[2] 罗希平等.图像分割方法综述[J].模式识别与人工智能,1999.12(3):

300-312

[3] 吴一全,朱兆达.图像处理中阈值选取方法30年(1962-1992)的进

展(一)[J].数据采集与处理,1993.3:193-201

[4] 章旒晋.图像分割[M].科学出版社,2001.

分割技术篇2

    关键词:联合收割机;使用与保养;技术

    联合收割机是一种体积较大,结构比较复杂的大型农业机械。在收获季节,由于驾驶员疏于对机车的必要保养,不仅对收割机的一些部件造成损害,同时也影响其工作效率的充分发挥,结果造成巨大的经济损失。

    1 自走式联合收割机的每日技术保养

    (1)清理:每天工作前彻底清除滚筒、凹板、抖动板、清选筛上的颖壳、麦芒等附着物,清理拨禾轮、切割器、喂入搅拢、皮带和链条各转动部位的缠绕和堵塞物,清理发动机冷却水箱散热器孔的麦糠、杂草等堵塞物。

    (2)清洗:小麦收获季节气温很高,必须保证发动机散热器具有良好的通风性能。散热器经清理后,还应用具有一定压力的水冲洗干净或用毛刷清洗干净。要保证散热器格子间无杂物和附着物。

    (3)检查:切割器有无损坏,各紧固部位是否松动。过桥链耙是否松动,张紧度是否适当,及时调整紧固。检查纹杆、凹板和滚筒轴承是否松动,及时调整和更换。三角带和链条的张紧度是否适宜,带轮、链轮是否松动。检查液压系统油箱的油位情况,油路各连接接头是否渗漏,法兰盘连接与固定是否松动。检查发动机水箱、燃油箱、柴油机底壳水位和油位,不足时,应及时添加。检查电气线路的连接和绝缘情况,有无损坏和接触。检查滚筒入口处密封板、抖动板前端板、脱谷部分各密封橡胶板及各孔盖等处密封状态,是否有漏粮现象。检查转向和刹车机构的可靠性。清理发动机空气滤清器的滤芯和内腔通气道。检查驾驶室中各仪表、操纵机构是否正常。

    2 悬挂式联合收割机的每日技术保养

    拖拉机部分应按使用说明书的要求,进行班次保养和一、二、三、四级保养。应每天清理散热器和空气滤清器,清理散热器时应把网格中的杂物全部清理干净,有条件的可用高压水冲洗。空气滤清器极易堵塞,会使发动机功率下降、冒黑烟,应每天清洗。注意检查机油油位、燃油量和水箱冷却水量。若发动机负荷过大、水温过高时,应在作业中停车降温或更换冷却水。收割机部分每日保养的主要内容:清理积落在机器各个部位上的尘土、麦糠、麦草等杂物,特别是清除各传动部件上缠绕的麦草等杂物。检查紧固前后支架与拖拉机的连接固定螺栓,后支架与脱粒机的连接固定螺栓,悬挂机构的拉杆锁紧螺母。检查紧固割台主轴左、右轴承座紧固螺栓,切割器传动机构连接螺栓、割刀输送齿条固定螺栓以及传动轴端的止动螺栓。更换已损坏的动、定刀片,铆接已松动的刀片,检查调整刀片间隙。检查调整伸缩扒齿的位置,校正已变形的搅拢叶片。检查调整所有传动带、传动链条的张紧度,更换已损坏的皮带,修复已损坏的链条节。检查调整输送带的张紧度,紧固已松动的耙齿螺栓。检查钢丝绳的松紧度,调整后紧固卡头锁紧螺栓。检查维修已变形、脱焊的分禾器。检查调整已变形的拨禾轮及拨齿。检查所有传动皮带轮、链轮的键销,松动时用锤子砸紧。按班次润滑要求润滑各部位。启动发动机,使机组低速运转,仔细听有无异常响声,及时排除故障。经全面检查调整后机组确无问题,方可投入作业。

    3 联合收割机易损件的使用与保养

    (1)V形带的使用与保养

    a.装卸:安装前首先要检查主动轮、被动轮和张紧轮是否在一平面上。一般来讲,两皮带轮的中心距小于1米时允许偏差为2~3毫米,中心距大于1米时允许偏差为3~4毫米。若偏差太大,应调整到符合要求后再进行安装并张紧。装卸时应首先将张紧轮松开或将无级变速一端先拆卸下来,将带装上或卸下。当新三角带太紧难以装卸时,应先卸下一个皮带轮,套上或卸下三角带以后再把皮带轮安装好,不得硬装硬卸。一般联组V形带应卸下带轮后装卸。b.张紧:传动带的张紧度是靠张紧轮进行调整的,皮带过紧会使皮带磨损严重,过松则易产生打滑现象,使三角带严重磨损甚至烧坏。一般两轮距1米左右时,用手指按压三角带中部,应垂直下降10~20毫米。使用中应经常检查三角带的张紧度,随时调整。c.更换:三角带失效后应及时更换,若多根三角带合组使用,如果其中一根或部分失效时,其他几根应同时更换,不可新旧带一起使用。为了节约,可将磨损和拉长程度相同的皮带合在一组使用。d.清洗:三角带沾上黄油、机油等油污后易产生打滑,且加速三角带的损坏,应及时清洗,可用汽油等清洗。急用又找不到汽油时,也可用碱水等清洗剂清洗,一定不能带油作业。e.工作温度:三角带的工作温度一般不宜超过60℃,检验方法是:停止工作后,立即用手触摸三角带,若手在其上停留1分钟,而不感到很烫手,即为温度不高。若烫手以至于不能停放到1分钟,说明温度过高,应查明原因,及时排除。f.更换皮带轮:作业中皮带轮可能出现变形、开裂、轴承磨损或键松动、轴孔磨损等情况,应及时修复或更换有关部件。g.保养:每季作业结束后,对收割机进行保养时,应将三角带卸下挂在通风干燥处或将张紧轮松开,使皮带处于松弛状态。

    (2)链条的使用与保养

    a.链条拆装:安装链条时,应先将链条绕缠在链轮上,再穿人链销,穿人时应从内向外穿,以便于从外侧安装连接板和锁紧时操作方便。拆卸时,可用锤子轻轻轮换敲打同一连接板上的两个连接销,抽出销子,卸下链条。若链销头已铆头变粗,可先锉平再拆卸。b.张紧:链条的张紧度太紧易增加磨损,太松易产生冲击和跳动。一般链条一边拉紧时,另一边应在垂直方向上有20~30毫米/米的活动余量,两链条切勿贴合。若链轮张紧轮已调到极限位置,仍不能达到张紧要求,可去掉或增加链节。但一定注意新旧链节不可混用。c.更换:当链条爬齿振动和冲击过大失效时,应及时更换,有时将链条反过来使用,可产生较好的效果。更换链条时,若链轮磨损严重,可能会与新链条配合不好,应同时更换新链轮。但若链轮左右对称,将链轮反过来使用,可能会配合很好。d.润滑:应按每日保养的要求,认真搞好润滑,润滑时应将油抹到链条套筒与销子和链轮的配合面上,可用刷子均匀抹刷。一定要在停车时润滑,以防发

    生危险。e.清洗:由于链条工作中尘土较多,很容易沾满油泥,传动不畅,应定期清洗,可先在汽油或柴油中清洗干净,然后在机油中浸煮30分钟左右,涝出滴干再用。f.保养:每季作业结束后,要将链条卸下在油中浸煮后,涂上黄油包好放在干燥处,链轮应用汽油或柴油擦洗干净,涂上黄油防锈。

    (3)外球面轴承的使用与保养

    a.钢球和沟槽磨损,间隙过大,产生径向和轴向晃动,应及时更换。若个别滚珠磨损严重,可在旧的相同型号的轴承上拆卸磨损较轻、没有麻点的钢珠更换。b.应按规定加注润滑油。两端密封的自动调心轴承,使用期间不需加注润滑油,应在作业季节结束后卸下,从密封盖的小孔加注油脂润滑。c.轴承装卸时,不应硬敲硬砸,特别注意不得敲打轴承的外套,应轻轻敲打轴承的内圈。

    (4)轮胎的使用与保养

分割技术篇3

[关键词]遗传算法全局优化图像分割

中图分类号:TP3文献标识码:A文章编号:1671-7597(2009)1110130-01

一、引言

分割是指将具有相似特征的元素聚集在一起。图像分割是计算机视觉与图像识别一个重要的步骤。在图像分割方法的研究中,已经存在一些方法来解决其中的问题。

遗传算法Genetic Algorithms(GA)[2,3]是由生物进化启发而得到计算求解模型,应用于求解优化问题。遗传算法的主要特点在于个体间的信息交换,较强的搜索能力以及全局优化能力。

遗传算法的本质包括在原始群体上的复制操作,交叉操作和变异操作的优良性能和最优个体选择机制。但是遗传算法的一个主要问题在于其在求解多峰复杂问题中易于出现早熟的现象[1],这导致了算法性能的急剧下降和局部最优解的出现。

因此有必要提高遗传算法的性能以使得以更小的概率进入到局部解区域。在这篇文章中,提出了一种改进的遗传算法,即将群体多样性的计算贯穿搜索的整个过程,通过群体多样性的变化来调节算法的变异概率,使得算法的搜索具有更强的效率。改进后的算法应用于图像分割的实验表明改进的算法能够取得更好的分割结果。

二、问题描述

在灰度熵法中,Pun提出将信息论中熵的概念应用到了图像分割。基于这个方法,Kapur和Sahoo提出了KSW熵法[4],KSW熵法[4]利用了二次分布的假设。在这篇文章中,我们基于KSW熵法来研究图像分割。

三、GA和改进的GA

(一)GA简介

GA是一种基于群体智能的、鲁棒性较强的优化技术,GA的鲁棒性在于它能够寻找到多峰问题空间的全局最优解区域。在GA的搜索过程中,当旧的群体通过适应度函数评价后,适者生存的规则就会应用于评价后的群体来选择父代的个体。接着,交叉操作应用到选择出的父代个体从而产生新的子代个体,新的子代个体通过一定概率下的变异操作进行变异。变异后的新个体会加入到新的群体中。

(二)遗传算法的改进

正如在第一部分所提到的,GA的一个主要问题在于求解复杂多峰优化问题时,会出现局部收敛的现象。出现这个问题的原因在于过高的选择压力或者个体之间过多的信息交换。选择操作会使得群体多样性很快的降低,从而使得个体会停滞在局部最优解的区域而很难跳出该区域。因此,本文通过改进遗传算法的变异概率来提高算法的性能,主要思想是:通过一定的方法实时的判断群体当前的多样性,如果群体当前多样性较高,说明群体目前的解所在的位置较广,则设定本次迭代的变异概率为一个较小的值;如果群体当前的多样性较低,说明群体目前的位置是聚集在一个较小的区域,那么设置本次迭代的变异概率为一个较大的值,从而帮助群体跳出当前聚集的位置,以便为群体在更广的范围寻找合适解。该改进方法的前提在于计算群体当前的聚集程度,即判断群体的聚集程度,本文采用如下的公式来计算:

其中,Div是当前群体的多样性,N是群体的规模,即染色体的个数,

是第i个个体的适应度值,是当前群体的平均适应度值,fmax是当前群体的最大适应度值。从这个方程可以看出,当群体聚集在一个较小区域时,Div的值将会较小;反之,如果群体分散的区域较广,则Div值将会比较大。基于这样的判断,我们设定算法的变异概率按如下公式调整:

Pm1是群置较为分散时的变异概率,Pm2是群置较集中时的变异概率,这两个值的具体取值可以根据实际问题来设定,div是根据求解的具体问题所设定的判断群体聚集程度的标准值。通过这样的方法可以保持群体的多样性在一定的水平上,并能够在一定程度上防止算法陷入局部收敛。

改进的遗传算法的过程描述如下:

1.确定控制参数,包括种群规模、变异率、交叉率,进化代数,div等;

2.初始化种群,在(0,0)~(255,255)之间随机产生N对个体,形成初始群体Pop1~Popn;

3.利用适应度函数计算初始群体中每个个体的适应度值;

4.利用赌进行选择操作,形成新的群体Pop1'~Popn';

5.在群体Pop1'~Popn'中,利用设定的交叉概率进行双点交叉操作,得到新的群体;

6.根据公式计算当前群体的聚集度Div;

7.由第六步计算得到的Div来决定当前的变异概率,如果Div>div,则设定较小的变异概率,并规定变异策略为单点随机变异;反之,则设定较大的变异概率,规定变异策略为两点随机变异;

8.判断是否满足循环终止条件,满足则转步骤;

9. 否则转步骤3重复这一进化过程,如此循环往复,直至满足循环终止条件。

四、实验设置与结果

实验的程序采用MATLAB 7编制并在其中运行,实验的机器的CPU是P4 2.0G Hz,内存为512M。标准Lenna图像用来作为分割的图像。GA和IGA都应用于该图像的分割,它们的群体大小都是20,设定最大迭代次数为500,交叉概率都是0.7。对于GA,变异概率设置为0.01,对于IGA,Pm1设置为0.1,Pm2设置为0.01,div设置为1,实验均随机的执行20次。

试验的时间如表1所示。平均迭代次数与成功搜索的时间如表2所示。

从表1中可以看出,IGA使用的时间少于GA,这表明IGA的寻优速度快于GA。从表2可以看出,IGA的收敛速度也快于GA。在所有的20次运行中,IGA的分割成功率要高于GA。从这些结果可以看出,IGA在图像分割中的执行效率以及分割效果要好于GA。

五、结论

在这篇文章中,提出了一种改进的GA,改进后的GA能够有较强的能力跳出局部收敛区域,具有更强的全局搜索性能。改进GA主要通过实时的判断群体的多样性,并用判断结果来控制算法的变异概率,这使得群体的多样性可以得到控制并有更多的机会寻找到全局解的区域。通过图像分割的实例证明,IGA比GA具有更好的性能。

参考文献:

[1]Rasmus K.Ursem,Diversity-Guided Evolutionary Algorithms,Proce

edings of Parallel Problem Solving from Nature VII (PPSN-2002),pp.462-471,2002.

[2]J.H. Holland.Adaptation in Natural and Artificial systems.The MIT Press,Cambridge,Massuchusetts,1992.

[3]D.H.Goldberg.Genetic Algorithms-In Search,Optimization and Machine Learning.Addison-wesley Publishing Company,1989.

[4]T.Pun. A new method for grey-level picture thresholding using the entropy of the histogram. Signal Processing,1980,2(3):223~237.

分割技术篇4

在进入Full HD的高清影像阶段(影像分辨率达到1920×1080),HDMI更是HDTV不可或缺的一项接口。以720p的HDTV内容传输来说,需要1.485 Gb/s的传输率才能支持未经压缩的影音内容,通过HDMI,就能以每秒165 Mpixels的速度传输高达24位的影音内容,所提供的频宽可以高达4Gb/s,不仅满足1080pFull-HD,还能支持以192kHz取样频率传输高达8轨的24位音讯。HDMI 1.3版,其传输率从原先的4.96 Gb/s倍增到10.2Gb/s,将色深支持从24-bit提升到30bit、36bit以及48bit(RGB或YCbCr),具有输出一亿色以上的能力。刚通过HDMI 1.4a标准,建筑在HDMI 1.4的基础上,专门为3D立体影像传输进行升级和改进。

在HDTV及HDMI的标准浪潮不断推波助栏下,许多过去视为单纯的分割画面技术,在Full HD的高清画质条件之下,便成了在硬件上开发的挑战。为了让分割后的画质达到Full HD的水平,视讯处理核心的设计方法便成了关注焦点。尤其本文介绍以DE3 FPGA平台实现HDMI Full-HD 1080p分割画面处理核心之设计方法。

图1即为基本HDMI Full-HD 1080p分割画面处理器之设计方块与架构图。本系统接收一路HDMI Full-HD的影像输入,经过FPGA处理后,根据LCD屏幕之组合,进行水平及垂直缩放处理,输出至两个(或四个)1920×1080分辨率的LCD。图2为实际以DE3 FPGA硬件平台加上符合HDMI 1.3规范之输出入子卡所搭建之硬件配置图。

此系统由三部份组成:(1)HDMI输出入协议设定控制核心;(2)HDMI控制信号产生器;(3)HDMI影像数据流处理核心。

第一部分HDMI输出入协议设定控制核心,是图1中SOPC Builder所建立的部份,这个部份是由NIOS处理器(NIOS Processor)和I2C控制器(I2C Controller)组成,负责正确设定和控制HDMI输出入。

第二部分HDMI控制信号产生器,是由图1中系统稳定侦测器(System Stable Detector),源分辨率计数器(SourceSizeDetector)和DDR2多端口控制器(DDR2 Multi-Port Controller)所组成。系统稳定侦测器负责自动侦测不同解晰度影像源的切换,使整个系统有相对应重新设置。源分辨率计数器负责根据前端影像源和后端显示的分辨率,设定适当的缩放参数,边框大小和显示位置。

DDR2多端口控制器负责垂直分割的内存器存取控制,DDR2内存器要规划成Ping-Pong Buffer的结构(图3所示为垂直方向一分为二的例子),利用两个相同的帧储存器,一帧用来写,另一帧用来读,可避免画面闪烁(nick)和不连续(tearing)的副作用。若垂直方向是一分为二,DDR2多端口控制器,必须规划成一写二读,在写入的时候也要规划两个起始位置,一个写入上半影像,另一个写入下半影像,简化读取端DDR2控制电路的架构。在此设计上各读取的时间点若有均匀的分配,以图3为例,分配一行只有一个读取,即当写入第一行时,在读取端只有上面影像第一行的信息会被读出,而当写入第二行时,在读取端也只有下面影像第一行的信息会被读出。

依此类推,让DDR2的频宽得到最佳的分配,即使是148.5 MHz的Full-HD输入影像源,DDR2的操作频率也可以在200 MHz以下轻易达成,这样使得在垂直方向并没有分割数目的限制。

第三部分HDMI影像数据流处理核心是由缩放器(Scaler)和二维峰化器(2D-Peaking)所组成。缩放器负责将输影源依照预定输出分割画面的大小,做线性或非线性的放大。做插点动作时,参考点数越多,所得到的画质越佳,建议至少需使用Bi-Cubic的插点技术。这边若能再考虑Edge-Adaptive,在高频部份的画面越能清晰呈现。二维峰化器负责增强影像的锐利度,改善经过缩放后,变模糊的边界。在此须注意的是若前端缩放器没有处理好,经过二维峰化器之后,会放大缩放器所产生的副作用如光环(Halos)和锯齿状(Jaggies)的现象。

实验平台的搭建如图2所示,DE3 FPGA为主平台,负责实现除HDMI收发器外的所有功能,实际输入源由Sony PS3具HDMI输出的游戏机担任,产生1920×1080 Full HD1080p之影像讯号,经FPGA将原始之影像讯号分割,分别输出至两部HDMI屏幕,DE3平台上使用之FPGA为AlteraStratix Ⅲ 340器件,具34万逻辑单元(Logic Element),实验结果显示本系统可在主频148.5MHz,内存DDR Ⅱ以200MHz执行速度下完成所有任务。

以上述设计方法,可轻易由复制而设计出任意规格(如2×2、2×3、3×3、3×4)等Full-HD之分割画面处理芯片。藉由DE3平台的重组及堆栈特性,可任意搭建出所需之硬件开发平台。图4描述我们在实验室中以多片DE3及HDMI子卡搭建平台开发出之3×3 Full-HD HDMI分割画面处理器。可用于各类电视墙之应用。

分割技术篇5

摘 要: 差错复原技术已成为易发生差错信道下视频编码的重要组成部分。本文实现了一个基于数据分割和可逆变长编码的具有差错复原性能的H.263编解码器。通过利用数据分割、可逆变长编码、差错掩盖等技术,并利用第三代移动通信系统的信道差错模型对该编解码器的差错复原能力进行了实验。实验结果表明,在无线移动信道的恶劣环境下,在综合利用多种差错复原技术后,重建图像的主客观质量得到了明显的改善。

关键词: 差错复原 数据分割 可逆变长编码 H.263

点击查看全文

注:本文版权归本站所有,为黄金会员资料,只有黄金会员可以查看。

提示:您还没有登录 无法阅读全文 请先 登陆 注册 点击此处申请黄金会员

分割技术篇6

关键词:数控等离子;切割技术;应用

DOI:10.16640/ki.37-1222/t.2016.24.039

等离子切割相较于传统的切割技术而言具有无法比拟的优势,尤其对于相关数据精确度的控制,其质量效果更是具有很大的提升。为了提升该项技术对于企业的经济效益,加强对于技术方面的研究具有不可忽视的现实意义,其能够在很大程度上进一步减小成本,提升切割技术的水平。等离子切割的效率约为传统切割技术的十倍,对于众多材质的材料都可以进行良好的切割,该项技术能够很好地解决激光切割价格较高的问题,改善火焰切割精确度不高的问题,因此,在机械加工领域得到了广泛的应用。

1 数控等离子切割技术的控制

1.1 功率密度

在等离子切割中,其相关的喷嘴结构提升了冷却效果的质量,利用较长的孔道、小型的喷口,实现电流密度的提升,因此,其能够在很大程度上得到压缩性较高的电流,并且提升喷嘴横截面积内电流的通过量,并增加电弧的精确性,但是与此同时,由于电流的压缩其功率的损耗程度也会大大提升,因此,相较于实际输出的电流,真正得到使用的电流其实较小,损失程度高达四分之一到二分之一的范围内,这是影响等离子切割技术得到进一步发展的重要原因。

1.2 喷嘴高度

喷嘴高度是构成弧长的重要组成,其主要是指切割横截面与喷嘴端口之间的距离,其主要是利用陡降或电流控制的方法进行等离子的切割,而伴随着喷嘴高度的变化,电流大小、弧长以及功率损失都会发生相应的变化。当众多因素对其产生作用时,电流变化对于应用效果的影响较为明显,其能够在很大程度降低工作能量,从而使得切割能力大大减小。另外,从射流的具体形态分析,在离开端口后,电流密度的大小是不断膨胀的,并且提升喷嘴的高度会使得枪口的直径范围大大提升,因此,相对于切割效果而言,直径较小喷嘴高度能够在很大程度提升精确度,但是在高度低于一定数值的时候,喷嘴会产生双弧情况,但是使用陶瓷喷嘴能够很好地解决该问题,达到较好的应用效果。

1.3 切割速度

对于切割速度的确定应该通过相关的试验进行明确,由于材料性质、熔点以及相关导热效率等性能的不同,其相关的切割速度也不尽相同。当速度较低时,电弧会由于枪口直径的过大而导致间断,因此,良好的切割速度能够在很大程度上决定相关的工作质量。但是若切割速度过于高,就会使得切割的能量小于需要的能量范围,这样就无法使得电流具有足够的能量吹掉熔解的材料,导致工具的枪口挂渣偏多,从而进一步降低工作质量与效果。

2 数控等离子切割技术的应用

2.1 中小企业

等离子技术在我国中小企业具有大范围的应用,甚至在部分大企业也得到了一定的使用,因为该项技术相较于其他相关技术,其使用方式简便,且应用成本较低。伴随着该项技术应用规模的不断扩大,其相关的使用优势不断被更多的人了解与熟知,该技术使得企业的工作效率得到了很大程度的提升,同时对于工作人员的劳动环境以及产品质量水平等都具有很大的改善,尤其是对于材料的利用程度更是得到了一定的提升。总而言之,数控等离子切割技术对于中小企业的发展而言具有不可忽视的重要作用。

2.2 金属加工行业

目前,金属加工行业是该项技术应用最广泛的行业,火焰切割已经远远无法满足当下的工作需求,等离子切割能够应用于不同材质、不同特性的金属,因此,对于该项应用的使用程度会大大提升。但是目前我国的等离子切割技术与国际上其他国家的水平相比仍然具有较大的差别,其主要表现为:等离子切割的下料仅仅占据全部下料数量的十分之一,而在发达国家,等离子切割下料的占比则高达十分之九。这主要是因为我国该项技术的普及由于高难度的养护方式、昂贵的设备价格以及复杂的使用方式而受到限制,因此,我国需要引进国家先进的等离子切割技术,并针对我国的实际情况进行必要的调整与完善,从而实现对该项技术的普及与应用。

2.3 工业生产

在工业生产中,对于金属材料的加工主要是利用等离子切割、火焰切割等相关技术,而等离子切割相较于其他切割技术而言,则具有更为广泛的应用优势,其切割质量更高、效率更快,因此,在工业生产中受到了一定程度的重视,尤其是对于精细化的等离子切割技术,其相关的切割质量甚至可以媲美激光切割,但是其相较于激光切割而言,成本较低,这在很大程度上提升了工业生产的经济效益。在上个世纪五十年代,该项技术由美国研发成功,并得到了广泛的应用,尤其在降低人工劳动强度与提升生产质量方面更是具有很好的应用效果,因此,该项技术受到了众多工业生产厂家的青睐。

3 结论

综上所述,数控等离子切割技术在众多领域都具有极为广泛的应用,其对于我国的发展而言具有不可忽视的重要作用,目前,该项书记胡已经引起了相关技术部门的重视,因此,本文主要针对该项技术的实际应用情况,对其相关的技术控制措施进行简单的介绍,其中包括功率密度、喷嘴高度以及切割速度等方面的具体控制措施,另外,本文并详细分析该项技术在中小企业、金属加工行业以及工业生产等领域的具体应用,希望能为我国数控等离子切割技术水平的提升具有一定的帮助作用。

参考文献:

[1]张二争.影响数控等离子切割的问题分析与控制措施[J].金属加工与(冷加工),2016(01).

[2]朱庆霞.梅塞尔数控精细等离子切割机在煤矿机械生产中的应用[J].金属加工:热加工,2016(10).

分割技术篇7

[关键词]金属热切割;特点;展望

中图分类号:TG483 文献标识码:C 文章编号:1009-914X(2015)23-0348-01

一、概述

火焰切割是一种传统的切割方式,其原理是:氧-燃气加热金属,使之达到氧化铁燃烧的温度,利用燃烧的放热和火焰吹力的去渣作用,实现连续作业。主要用于切割碳钢和低合金钢,所用燃气有乙炔、液化石油气(主体成分为丙烷)、霞浦气(主体成分为丙烯)和天然气。

等离子切割的原理是利用高温等离子电弧的热量使工件切口处的金属部局熔化(和蒸发),并借高速等离子的动量排除熔融金属以形成切口的一种加工方法。可以切割碳钢、不锈钢和铝合金等有色金属。普通等离子切割:切割电流一般在100 A以下,切割厚度小于30 mm。精细等离子切割;引入诸如旋转磁场等技术,电流密度倍增,其电流稳定性增强,切割精度相当高,切割厚度也相应提升。

激光可以切割除铜以外的绝大部分金属,能实现高能量密度的空间切割,具有切割速度快、生产率高、切割质量好的特点。金属切割用激光,一般为功率0.5-3kW的CO2激光和光纤激光。

二、不同切割方式的技术经济比较

三种切割方式的技术经济比较

适宜切割厚度是指切割速度和切割质量均达到比较理想的状态

火焰切割具有切割速度慢,切割变形大的特点,很难适应高精度的需要。目前,发展的重点方向为:降低切割成本和提升设备的智能化水平。在降低成本方面:采用新型燃料和助燃剂,提高火焰温度,提升切割速度,降低燃料成本。在提升设备的智能化水平方面:利用自动套料编程软件,提高材料的利用率;开发图形智能识别软件,提高编程效率;开发误差补偿软件和特殊工(卡)具,实现产品的精确下料(如:焊接坡口、相贯线等),减少后续的加工。

普通等离子切割随着上世纪90年代中国民间造船业的发展,以其切割δ6-20mm碳钢时切割速度为火焰切割的5-8倍,切割不需要预热,穿孔时间短,切割变形小和运行成本低的特点,迅速在各大船厂推广应用。随后在钢结构、工程机械、化工容器等行业推广应用,用户对切割厚度、速度、质量和低成本运营的诉求,催进了21世纪精细等离子技术的全面发展。

激光切割具有速度快:在激光切割厚度范围内,激光的切割速度可达10m/min,是等离子速度的2-5倍,定位速度高达80m/min。激光的切割质量好,切口窄:切口宽度一般为0.10~0.20mm;定位精度高:定位精度0.05mm,重复定位精度0.02 mm;切割面光滑,无毛刺,切口表面粗糙度一般控制在Ra12.5以内,几乎没有热变形,可以进行后续加工,广泛应用于钣金加工、军工和工程机械等行业,目前,金属切割主要采用CO2激光和光纤激光。

三、不同切割方式的技术发展展望

数控火焰切割国内外技术差距不大,国内产品的主要技术经济指标已达到国外同类设备的先进水平。目前,国际最具实力的厂商为日本小池酸素(KOIKE),研发出从配件到专用切割机的系列产品,满足不同行业对管板、坡口的切割需要。国内的知名厂家有:哈尔滨四海、华威,无锡华联,深圳博利昌,北京百惠宏达等,均有自主研发能力,产品品种齐全,质量稳定。

在过去20年里,等离子切割技术经历了从第一代普通批量切割等离子技术,到第二代精细切割等离子技术,现在各家等离子厂商都在向第三代标准化平台等离子技术方向发展。第三代标准化集成系统则聚焦在经济性上,通过标准化、模块化设计,使用不同等离子电源,配套使用相同的割炬、易损件、冷却系统和气体控制系统,连电缆、水管、气管都做到统一标准,在一台电源系统上实现批量与精细二种切割模式,总之,建立“一个平台、一把割炬、一组耗材”,通过标准化,突破经济性,有效减少用户的投资,简化使用和管理流程,降低运营成本。各大设备厂商之间的竞争主要体现在等离子电源和专有技术上,如伊萨(ESAB)公司专门研发的等离子微弧微割嘴技术,凯尔贝电源的薄板切割类激光技术,在精细切割模式下,切割1~10mm的碳钢、不锈钢和铝,可以达到类似激光的品质;海宝的高质量深圆孔切割技术。国际知名品牌有:梅塞尔、海宝、伊萨、维克多和凯尔贝,国内有武汉法利普纳泽。为提高切割质量,保障员工健康,改善作业环境,设备厂商积极研发水下等离子切割系统,同时在切割气体方面,选用不同的切割气体,以实现切割效率与质量的侧重和平衡。

随着大功率光纤激光和YAG技术的成熟,给以CO2激光作为精密切割手段的用户提供更多的选择。光纤激光与CO2激光相比,在光电转换效率、金属的吸收率和运行时间具有显著的提高,大大降低了运行和维护成本,另外,变以前的“飞行光路”为光纤传输,保证了其可以很方便地跟机械手相衔接,实现柔性和智能化加工,使大板幅的切割定位精度和动态响应速度显著提升。YAG激光以其低廉设备投资,可以胜任6mm以下、稳定切割3mm以下的板材,在多品种、小批量、中低负荷的工况环境使用是一个理想的选择。激光切割设备国际上有代表性的制造商有:德国通快TRUMPF公司,瑞士百超BYSTRONIC,意大利PRIMA,美国WHITNEY公司和日本AMADA公司等,目前国内能提供平板切割机的企业有武汉华工激光、武汉天琪激光、上海团结普瑞玛公司、济南捷迈公司、深圳大族激光等,武汉华工激光代表国内激光技术的最高水平。

四、智能制造对切割技术的促进

智能制造是通过人与智能机器的合作共事,去扩大、延伸和部分地取代人类专家在制造过程中的脑力劳动。它把制造自动化的概念更新,扩展到柔性化、智能化和高度集成化。在切割领域,主要体现在通过计算信息网路、智能图像识别系统、智能误差补偿技术、自动编程排版技术、信息诊断与反馈等技术的综合应用,实现切割系统的智能化、无人化运行。

五、结论

选择和确定数控切割生产方式是采购数控切割机和等离子的首要工作,根据切割材质、板厚、精度要求和批量,决定选择不同的切割方式:

分割技术篇8

1引言

随着移动通信技术的迅猛发展,人们通过移动终端访问网页的活动日渐频繁。然而,移动终端屏幕尺寸的限制往往造成Web页面无法正常显示,给用户带来了很大的困扰。为了解决这个问题,早在20世纪90年代,研究人员便开始研究网页自适应呈现技术,提出了若干算法。这些算法可归纳为3类,即网页重构、网页转码、网页分割。其中,网页分割是实现网页自适应呈现的主流技术之一。它首先将网页分割成若干个语义相关的内容段(也称为内容块);然后在内容服务过程中,服务器根据移动终端特征,选择合适的内容段并推送给用户,以确保网页内容在移动终端上得以正常显示。网页分割技术具有两个优点:一方面,它不需要占用大量的计算资源;另一方面,用户也不需要反复拖动滚动栏查看网页内容,使网页内容的服务质量得以保证。近年来,关于网页分割技术的研究受到了广泛关注,并且取得了丰富的研究成果。其中经典算法是Cai等研究人员提出的基于视觉的网页分割技术(Vision-basedPageSegmenta-tionAlgorithm,VIPS)。VIPS根据人的视觉特点,总结出一些网页分割的规则,然后基于这些规则实现网页分割。此后,许多研究者在该方法的基础上提出了许多改进的网页分割技术,但基于规则的思想没有本质变化。目前,基于视觉的网页分割技术主要存在两方面问题:其一,网页分割结果过碎,不利于网页重构;其二,分割规则的总结需要人工参与,规则的好坏也直接影响网页分割效果。因此,如何划分网页分割的粒度,如何能减少分割过程中人工参与,从而降低主观因素影响,均是需要进一步研究的问题。本文将网页分割转化为图的最优划分问题,提出一种新颖的网页最优分割算法(Vision-basedWebOptimalSegmen-tation,VWOS)。VWOS算法首先基于人的视觉特点设计内容相似度计算模型,然后利用网页结构特征和内容相似度模型,将网页构造为加权无向连通图,并将网页分割转化为图的最优划分问题,最后基于Kruskal算法求解图的最优划分问题,实现网页最优分割。VWOS算法是一种自动算法,不需要人工参与。实验分析表明,该算法能够有效地对网页进行分割,分割效果和算法性能优于VIPS算法。

2相关研究

网页是一类特殊的文本文件,它具有内容特征、结构特征、布局特征和视觉特征。针对上述4种特征,网页分割技术可以分为4种类型:基于内容特征的分割技术、基于结构特征的分割技术、基于布局特征的分割技术和基于视觉特征的分割技术。基于内容特征的网页分割技术主要是基于网页标签。20世纪90年代末的手机浏览器不支持CSS层叠样式,也不支持JavaScript,只能访问简单的静态网页。因此,当时的学者只需基于标签的类型进行分割,即可达到很好的效果。YanleiDiao等人提出具有自学习功能的Web查询处理系统[1],利用有效标签类型(如〈p〉、〈table〉、〈ul〉、〈h1〉~〈h6〉)进行网页分割;Wai-chingWong提出标签检测算法来检测具有同类型信息的相似标签,并定义标签类型进行网页分割;EijaKaasinen与OrkutBuyukkokten仅仅利用像〈p〉〈ta-ble〉〈ul〉这样的简单标签进行Web网页分割。基于结构特征的网页分割技术采用了DOM(DocumentObjectModel,DOM)技术,将网页表示成DOM树结构,然后根据各内容块在DOM树中的位置对网页进行分割。文献均采用的是基于DOM树的分割技术,RichardRomero[8]在DOM树的基础上进行聚类分析,实现网页分割。基于布局特征的网页分割技术主要包括基于位置的网页分割技术与基于模板的网页分割技术两种。GenHattori提出的基于距离的网页分割技术,利用标签的相对位置与层级关系计算内容块的距离,以此对网页进行分割。然而HTML中某些特殊标签具有布局作用,降低了分割的准确率。通过对HTML标签的研究与分析,GenHattori于2007年提出改进技术:混合分割技术。混合分割技术将〈div〉与〈table〉作为布局信息,进行初步分割,之后将标签间的距离作为内容块的距离做二次分割。基于模板的网页分割技术的主要思想是分割前定义好各类模板,通过将欲分割的网页或内容块与模板匹配来进行分割。YuChen将网页分成上、下、左、右和中间5个部分,之后根据这5个部分的特征将网页的内容提取后纳入到定义好的特征模版中,从而实现网页分割。这种技术适合于结构标准的网页,对于其他结构的网页则无法正确分割。文献将网页归类于布局模板,之后依据网页布局(此处考虑的是标签形成的布局,而非样式信息形成的布局)与标题块进行网页分割。基于视觉特征的网页分割技术的原理是标签本身携带内容显示信息,根据人眼的视觉特征,利用这些显示信息实现网页的内容分割。DengCai提出了一种基于视觉特征的网页分割技术(Vision-basedPageSegmentationAlgorithm,VIPS),该算法具有良好的网页分割效果。VIPS存在的问题在于需要人工不断地去总结和调整分割规则,而且当新规则产生后,将影响以前的分割效果。基于VIPS算法,国内外学者提出了一系列的改进技术[14-18],这些技术在一定程度上优化了VIPS,但上述的本质问题却没有解决。此外,这些技术均没有考虑CSS样式信息对视觉特征的影响。

3VWOS算法设计

根据网页的标签,可以将网页划分为许多语义完整的原子内容块,这些内容块是网页内容的最小组成单元。基于网页视觉特征定义两个原子内容块的相似度计算公式,并利用该公式构造原子内容块相似度矩阵。因此,网页可以视为由原子内容块为顶点、相似关系为边、相似度为权的加权无向连通图,网页分割就转化为图的最优划分问题。

3.1网页最优分割模型为便于表述网页最优分割模型,对其中包含的重要概念做如下定义。通过解析网页得到内容块,并利用内容块相似度公式计算内容块两两之间相似度,得到相似度矩阵。在此前提下,网页可以构造为加权无向连通图。因此,网页分割转化为图的最优划分问题,其最优化模型如式(1)所示。式(1)的最优化模型具有3个典型性质:最优子结构、重叠子问题与贪心选择性质。最优子结构指问题的最优解包含子问题的最优解。如果上述问题的最优解包含了原子内容块n,那么其余原子内容块一定构成子问题n-1个原子内容块在组阈值为St-Sn时的最优解。如果最优解不包含原子内容块n,那么其余原子内容块一定构成子问题n-1个原子内容块在组阈值为St时的最优解。重叠子问题指用递归算法自顶而下解决上述问题时,每次产生的子问题并不总是新问题,有些子问题被反复计算了多次。贪心选择性质指所求问题的整体最优解可以通过一系列局部最优解的选择来达到。若所有原子内容块构成的集合为V,组内已确定的原子内容块构成的集合为U,s[u][v]表示原子内容块u、v间的相似度。u∈U,v∈V-U,由于U中所有原子内容块构成一棵相似度最大的生成树,根据MST性质,V的所有相似度最大的生成树中一定存在一棵包含边(u,v)。

3.2VWOS算法网页最优分割算法VWOS分为4个步骤:第一,根据手机分辨率信息,确定网页分割阈值St;第二,建立原子内容块池Pc与相似度池Ps,相似度按值从大到小排序;第三,构建网页加权无向连通图G(V,E);第四,求解图G(V,E)最优划分问题。(1)网页分割阈值确定不同手机的分辨率不同,所能呈现的信息量亦不同。因此网页分割时,需要设置不同的阈值,以达到在不影响正常显示与用户体验的情况下,子页所呈现的信息量最大化。网页分割算法采用像素面积确定分割阈值St。使用诺基亚5800W手机,随机浏览100个手机版网页,统计分析知,平均每个网页需要3.51屏显示;随机抽取100位大学生手机网民,对“手机版网页出现几屏显示时,会心生埋怨心理”问题进行调查,分析发现其平均值为2.87。考虑到用户体验的重要性,对上述两个结果以比例1:2进行加权求均值得3.08。因此,可确定最适合手机显示的网页大小为手机屏幕的3倍。由于VWOS算法所用的网页分割算法的特殊性,有时分割形成的子页结果为所设阈值的2倍。对此,将网页分割阈值St设为1.5屏,即St=1.5×水平分辨率×垂直分辨率。(2)原子内容块池Pc与相似度池Ps的建立为了更有效地实现网页分割,需要建立原子内容块池Pc与相似度池Ps。Pc中存放原子内容块算法获得的所有内容块。原子内容块相似度计算及后期建立连通分支时均从Pc中获取所需的内容块。Ps中存放采用基于网页视觉特征的相似度公式得到的相似度值,并按值从大到小的顺序排列。内容相似度基于网页视觉特征,在此将网页视觉特征定义为6维向量,根据向量中维度的不同度量属性,采用不同的计算公式计算各维度相似度值,最后用加权求和的方式计算出最终的内容块相似度值[19]。Pc存放的内容块类型为Perfect-Node,而Ps存放的相似度以本文自定义的Similarity类型标识,其类图如图1所示。对Ps而言,由于构建连通分支时,以相似度值从大到小的顺序连通各分支,因此,Ps中的Similar-ity数据是按值递减的有序队列。1Similarity类(3)连通分支构建Pc中含有网页所有的原子内容块,Ps中含有两原子内容块间的相似度值,并按值从大到小排列。对Pc与Ps采用如下算法构建连通分支,以确保每个分支的相似度权值最大,且每个分支中所有顶点的像素面积和Sk均小于分割阈值St。这样便实现了网页分割所需的每个连通分支均可转换为各个子页,这些子页不仅可在手机浏览器中正常显示,而且具有较好的用户体验。连通分支构建算法如图2所示。1)将Pc中n个内容块看成n个孤立的连通分支,并建立关联池cr。2)计算各连通分支像素面积和Sk,并与St比较:如果Sk≥St或所有边都被查看过,则将连通分支中的顶点从Pc中取出存入关联池cr中;如果Sk<St,按下述方法连接两个不同的连通分支:设查看到第s条边,若该边两端点分别是当前两个不同的连通分支T1和T2中的顶点,则用该边将T1和T2连成一个连通分支;若该边两端点在当前的同一个连通分支中,直接查看第s+1条边。3)如果所有边都被查看过或Pc中已经没有原子内容块,则连通分支构建算法结束,否则转步骤2)。需要特别指出的是,若以是否含有孤立的连通分支或查看边数是否达到n+1作为结束算法的条件,虽然可以大幅度减少算法循环次数,但是,却不能保证最后生成的连通分支不能再合并。而仅仅以判断所有边是否被查看过作为结束算法的条件,虽然可以保证Sk在小于St的情况下最大化,然而因需要过多的循环次数导致时间复杂度过大,从而影响VWOS算法的性能。通过分析与测试发现,多数情况下,各连通分支均不能再合并时,有很多边没有被查看,对此,连通分支构建算法采用“所有边都被查看过或Pc中已经没有原子内容块”作为算法结束条件,以达到在满足Sk最大化的同时性能最大化。(4)求解网页最优分割问题网页最优分割模型如式(1)所示,基于模型的最优子结构和贪心选择性质,可采用贪心策略求解该模型。因为,加权无向连通图G(V,E)可构造为一棵生成树,使生成树上各边权值最大,于是网页分割可变为在特定阈值St条件下构造子生成树的过程,每个子生成树均满足特定阈值St。采用最优化理论中的Prim算法与Kruskal算法所需的时间复杂度分别为O(n2)与O(eloge),其中e为图的边数。当e=Ω(n2)时,O(n2)<O(eloge),当e=O(n2)时,O(n2)<O(eloge)。因为网页对应的加权无向连通图G(V,E)是一张完全图,即e=n(n-1)/2=O(n2),所以用Kruskal算法比用上述其它算法时间复杂度低。因此,本文采用Kruskal算法实现网页最优分割问题求解。

4实验与分析

为检验VWOS算法的执行效果和性能,设计了一组网页分割对比实验。实验基于Web服务设计,通过移动终端访问网页。将VWOS算法和VIPS算法部署在服务器,以国家精品课程站点随机选取的100个网页为对象,移动终端采用分辨率为360×640像素的Android2.3手机模拟器,分割阈值St=1.5×360×640=3.456×e5。采用3个评价指标:平均分割块数、语义完整度和平均执行时间。其中语义完整度定义见式(2)。通过网页在移动终端的呈现结果,比较VWOS算法与VIPS算法在3个指标上的表现,评价算法效果和性能。

结果与分析本节以具体的2个网页呈现的结果为例,比较两种算法分割效果和性能,并分析其中的原因。结合专业背景,选取的网页定为北京师范大学的国家精品教育技术学导论与南京师范大学国家精品课程教育社会学。图3(a)为北京师范大学的国家精品教育技术学导论经VWOS算法分割的效果。VWOS算法将该网页分割为两个子页,如图3(b)与图3(c)所示,图3(b)为主页,图3(c)为子页。从图中可以发现,VWOS算法分割该页面后得到的两个子页语义完整且适合手机浏览器显示,具有较好的用户体验。图4为教育技术导论网页采用VIPS算法的分割结果。

VIPS将该网页分割为6个子页。其中只有表格子页的像素面积与分割阈值接近,而其他5个子页尺寸均远小于阈值。VIPS算法之所以将网页分割得过碎,主要因为其以DOM树为基础,对每个内容块用DoC(DegreeofCoherence)表示紧密程度。按照VIPS的规则,DoC在DOM树中呈现自顶而下逐渐增大的规律。而VIPS采用自顶而下的方式分割,因此当DOM树底层的内容块符合分割阈值时,上层内容块因DoC小于PDoC(PermittedDegreeofCoherence)而被过度分割。VWOS算法基于最优化理论,将网页分割看作分组最优化问题,并设计网页分割算法以自底而上的方式对网页进行分割,有效地避免了分割过碎问题。由此可以看出在分割后形成子页数方面,VWOS算法较VIPS算法内容块语义更完整,也更适合移动设备显示。图5为南京师范大学国家精品课程教育社会学分别经VWOS与VIPS分割的效果。采用VWOS算法进行分割后形成两个子页,其中图5(b)所示子页为原网页右下角部分。该部分像素面积略大于分割阈值St,按照VWOS算法设计的网页分割算法,该部分会作为一个完整子页存在。采用VIPS算法,将页面分割为3个子页,如图5(c)所示,其中黑色方框内的部分为分割后保留下的内容块。观察图5(c)很容易发现丢失了部分内容块。分析该网页的代码可发现,丢失的部分均为样式信息,该部分的样式信息存储在CSS文件中,而非HTML标签的style属性中。由此,再一次证明了由于“数据内容-样式信息”的分离,致使VIPS分割效果无法满足手机用户需求的假设,也再一次说明了网页分割预处理算法的必要性。

VWOS算法充分考虑了〈link〉、〈style〉与HTML标签style属性中的样式信息,并将样式信息与数据内容融合,以此保证内容块视觉特征的全面性与精确度。因此可以看出,在分割后形成的内容块方面,VWOS算法得到的内容块具有语义完整的特点,而VIPS算法分割过程中,会造成内容块视觉特征的丢失,甚至会造成部分内容块的丢失。此外观察图5(b)可以发现,分割形成的子页的像素面积比手机尺寸大,这主要因为该部分采用〈table〉标签进行布局,而VWOS算法并未对〈table〉标签的宽高信息进行处理。实验采用VWOS算法和VIPS算法共对100个精品课程站点网页进行网页分割,并在3个性能指标上进行统计对比,结果如表1所列。通过上述实验,初步证明VWOS算法在内容块语义完整性和网页适应性方面,比VIPS算法具有更好的性能。具体而言,VWOS算法比VIPS算法具有以下4点优势:第一,VWOS算法不需要人工参与,是一种网页分割自动处理方法;第二,在同样的分割阈值条件下,VWOS算法生成的子页数少,因此用户在各子页中遍历浏览时,不易迷航;第三,VWOS算法生成的每个子页的像素面积SP均在[St,2St)区域中,没有过度分割的子页;第四,VWOS算法充分利用视觉特征表示内容块的特征,分割得到的每个内容块均具有高度的语义完整性。结束语网页分割技术被广泛应用于网页信息获取和网页自适应呈现等领域。目前,经典的网页分割算法仍存在需要人工参与和分割过碎的问题。针对这些问题,综合视觉特征和网页结构,将网页构造为加权无向连通图,并将网页分割转化为图的最优划分问题,最后基于经典的最优化算法,结合网页分割的过程,提出了一种基于视觉特征的网页最优分割算法VWOS。实验证明,VWOS算法在语义完整性和网页适应性方面,性能优于经典分割算法VIPS。与VIPS算法相比,VWOS算法有两个优点。其一是网页分割结果没有过多的内容碎片,较好地保留了内容块的语义完整性;其二是它属于自动算法,不需要人工参与。当然,VWOS算法仍存在一些不足之处,集中表现在由于网页样式采用技术不同对构造网页无向连通图G影响较大,因此该算法的鲁棒性存在不足。

下一步研究将从3方面展开。第一,将采用更多的客观评价指标(如信息检索领域评价指标),全面对比VWOS和VIPS两种算法的性能,并以此为依据对VWOS算法做改进。第二,在算法中增加对网页样式技术的识别,并做相应的处理,提高算法的鲁棒性。第三,将以VWOS算法为核心,研究网页自适应呈现技术,以期达到Web学习资源移动访问的目标,提高Web学习资源的利用率,为移动学习服务打下技术基础。

上一篇:射频消融术范文 下一篇:互动媒体艺术范文