基于改进多尺度乘积LoG算子的仿射不变形状匹配算法

时间:2022-10-08 01:53:57

基于改进多尺度乘积LoG算子的仿射不变形状匹配算法

摘要:目标在成像过程中发生的几何变形多数情况下可用仿射变换来描述。据此,提出一种利用角点进行仿射不变形状匹配的算法。首先引入多尺度乘积LoG(MPLoG)算子检测轮廓角点,并根据角点间距自适应地提取轮廓特征点,从而获取形状关键特征;为解决目标的仿射变形问题,采用Grassmann流形Gr(2,n)来表征和度量两形状之间的相似度;最后通过迭代式序列移位匹配算法来克服Grassmann流形对起始点的依赖并完成形状的匹配。对形状数据进行仿真实验的结果表明,所提算法能够有效地实现形状检索和识别,并对噪声有较强的鲁棒性。

关键词:多尺度乘积LoG算子;角点检测;Grassmann流形;迭代式序列移位;形状匹配

中图分类号: TP391.413

文献标志码:A

Abstract:

Geometric transforms of the object in the imaging process can be represented by affine transform in most situations. Therefore, a method for shape matching using corners was proposed. Firstly, the corner of contour using Multiscale Product Laplacian of Gaussian (MPLoG) operator was detected, and the feature points based on corner interval were adaptively extracted to obtain the key feature of shape. In order to cope with affine transform, the similarity of two shapes on Grassmann manifold Gr(2,n) were represented and measured. Finally, the iterative sequence shift matching was adopted for overcoming the dependency of Grassmann manifold on the starting point, and achieving shape matching. The proposed algorithm was tested on the database of shapes. The simulation results show that the proposed method can achieve shape recognition and retrieval effectively, and it has strong robustness against noise.

Key words: Multiscale Product Laplacian of Gaussian (MPLoG) operator; corner detection; Grassmann manifold; iterative sequence shift; shape matching

0引言

形状匹配主要包括形状描述和匹配两个基本问题。

形状描述的方法很多,基本上可归纳为两类:基于区域的形状描述和基于边界的形状描述。由于目标边界含有大量的形状信息,所以目前大多数形状分析集中在后者。Belongie等[1]利用形状上下文(Shape Context)描述子对形状进行描述;Alajlan等[2]利用三角形面积(Triangle Area)描述符对形状进行描述;Adamek[3]提出了多尺度凹凸表示(Multiscale Closed Contour, MCC)的方法来对形状进行描述。但上述文献均只考虑了形状的相似性变换,而物体的成像过程是一个投影变换,其间产生的几何变形多数情况下可用仿射变换来近似,所以研究在仿射变换下的形状匹配具有非常大的应用价值。

Ahmed等[4]利用一维小波变换描述形状,并基于欧氏空间度量两形状的相似程度,从而实现了仿射变形下的形状匹配;Li等[5]利用Hopfield神经网络来实现仿射不变形状匹配;刘云鹏等[6]引入Grassmann流形Gr(3,n)来表示仿射不变形状空间,并用流形上的测地距离度量两形状之间的相似度,取得了较好的匹配效果。

本文提出了一种基于改进的多尺度乘积LoG(Multiscale Product Laplacian of Gaussian, MPLoG)算子仿射不变形状匹配算法。首先利用MPLoG算子提取角点信息,并根据角点间距对形状轮廓进行自适应采样。由于角点是图像的主要特征之一,所以采样结果相比均匀采样能更精确地描述形状。然后采用Grassmann流形Gr(2,n)进行形状特征的表征和度量,从而更准确地解决目标的仿射变形问题。最后在此基础上引入迭代式序列移位匹配方法来实现目标的旋转匹配。与已有方法相比,所提算法能够有效地提高匹配精度,并能达到较好的形状检索和识别效果。

1轮廓特征提取

1.1多尺度乘积LoG角点检测算法

角点对图像旋转和尺度变化具有很好的鲁棒性。杨丹等[7]将轮廓曲线的LoG范数的平方作为角点的响应函数来检测角点。该方法具有较强的稳定性,但容易受噪声干扰。而图像边缘信息的多尺度特性能同时达到增强边缘特征信息,抑制噪声的效果,所以本文采用多尺度乘积LoG(MPLoG)算法[8]实现角点检测。其主要思想如下。

4实验分析

为了验证本文形状描述及匹配算法的有效性,选择标准MPEG7形状数据库[11]进行实验。该数据库共有1400个样本,包含70类目标各20个样本,为近年来使用最广泛、最受欢迎的测试集之一。实验分为3部分:形状描述、形状检索和形状识别。

4.1形状描述实验

图2(a)为来自MPEG7形状数据库的形状;图2(b)为文献[6]均匀采样得到的形状描述结果;图2(c)为本文方法得到的形状描述结果。其中:虚线代表采样形状,实线代表原始形状,采样点N2=20,通过大量实验,MPLoG角点检测器取经验尺度为2,2.5,3。从图2中可以看出:形状1在均匀采样后产生了很大的变形;形状2中两端的细节比较丰富,但均匀采样后出现了两端信息丢失、中间信息冗余的现象。而本文的目标表示方法由于根据角点间距来分布采样点,所以能够更精确地描述形状。

4.2形状检索实验

在MEPG7数据库中进行形状检索实验,其检索精度的常用度量方法为bulls eye分数,并通过接受者操作特性曲线(Receiver Operating Characteristic, ROC)曲线辅助度量。测试过程中设置各采样点集合的采样点数目均为100。表1列出了本文方法与其他文献中对MEPG7数据进行仿真所得的结果比较。其中部分方法的ROC曲线如图34所示。表1和图3的实验结果表明,本文相比其他文献的方法具有更高的检索精度。

5结语

本文在MPLoG角点检测器的基础上,提出了一种基于改进MPLoG算子的轮廓特征提取方法。该方法根据角点间距自适应地提取轮廓特征点,从而能最大限度地保留形状关键信息。同时利用Grassmann流形Gr(2,n)表征和度量形状特征,并与迭代式序列移位匹配算法相结合,有效地实现了目标在仿射变形下的匹配与识别问题。实验结果表明,本文所提出的方法具有良好的形状检索和识别精度,并对噪声有较强的鲁棒性。

参考文献:

[1]BELONGIE S, MALIK J, PUZICHA J. Shape matching and object recognition using shape contexts [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(4): 509-522.

[2]ALAJLAN N, RUBE I E, KAMEL M S, et al. Shape retrieval using triangle area representation and dynamic space warping [J]. Pattern Recognition, 2007, 40(7): 1911-1920.

[3]ADAMEK T, OCONNOR N E. A multiscale representation method for nonrigid shapes with a single closed contour [J]. IEEE Transactions on Circuits and Systems for Video Technology, 2004, 14(5): 742-753.

[4]EL RUBE I A, AHMED M, KAMEL M. Coarsetofine multiscale affine invariant shape matching and classification [C]// Proceedings of the 17th International Conference on Pattern Recognition. Washington, DC: IEEE Computer Society, 2004: 163-166.

[5]LI W J, LEE T. Hopfield neural networks for affine invariant matching [J]. IEEE Transactions on Neural Networks, 2001, 12(6): 1400-1410.

[6]LIU Y, LI G, SHI Z. Affineinvariant shape recognition using Grassmann manifold [J]. Acta Automatic Sinica, 2012, 38(2): 248-258.(刘云鹏,李广伟,史泽林.基于Grassmann流形的仿射不变形状识别[J].自动化学报,2012,38(2):248-258.)

[7]YANG D, WANG H, ZHANG X, et al. LoG transform of contour curves and detection of image covariant regions [J]. Acta Automatic Sinica, 2010, 36(6): 817-822.(杨丹,王洪星,张小洪,等.轮廓曲线的LoG变换及图像共变区域的检测[J].自动化学报,2010,36(6):817-822.)

[8]LIN X, ZHOU X, LI X. Detection of rotation and scale invariant regions using contour [J]. Application Research of Computers, 2012, 29(5): 1951-1958.(林小泽,周絮语,李相军.基于轮廓的旋转和尺度不变区域的检测[J].计算机应用研究,2012,29(5):1951-1958.)

[9]EDELMAN A, ARIAS T A, SMITH S T. The geometry of algorithms with orthogonality constraints [J]. SIAM Journal on Matrix Analysis and Applications, 1999, 20(2): 303-353.

[10]ZHENG L, TSE D N C. Communication on the Grassmann manifold: a geometric approach to the noncoherent multipleantenna channel [J]. IEEE Transactions on Information Theory, 2002, 48(2): 359-383.

[11]LATECKI L J, LAKAMPER R, ECKHARDT T. Shape descriptors for nonrigid shapes with a single closed contour [C]// Proceedings of the 2000 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2000: 424-429.

[12]ATTALLA E, SJY P. Robust shape similarity retrieval based on contour segmentation polygonal multiresolution and elastic matching [J]. Pattern Recognition, 2005, 38(12): 2229-2241.

[13]DALIRI M R, TORRE V. Robust symbolic representation for shape recognition and retrieval [J]. Pattern Recognition, 2008, 41(5): 1782-1798.

[14]THOUM K, KITJAIDURE Y, KONDO S. Affine invariant shape recognition based on multilevel of barycenter contour [C]// ISCIT 2008: Proceedings of the 2008 International Symposium on Communications and Information Technologies. Washington, DC: IEEE Computer Society, 2008: 145-149.

上一篇:关于新形势下企业思想政治工作的实践和探讨 下一篇:基于多尺度分解的色调映射算法