基于投影熵特征的图像识别算法

时间:2022-09-19 12:00:57

基于投影熵特征的图像识别算法

摘 要:原始定义下的投影熵特征对于图像信息利用不够充分,而且对图像缩放变换不具有不变性,针对这两方面的不足,给出了扩展规范化投影熵特征的定义,并将规范化后图像的局部投影熵特征向量用于图像识别;在进行图像识别时,利用期望最大化(EM)算法得到训练集图像局部投影熵特征的混合高斯概率分布模型,求取目标图像的相应特征到各个混合高斯函数的Mahalanobis距离,根据距离判别法原理得到目标图像所属类别。实验采用哥伦比亚大学计算机视觉数据库中的图像对算法进行验证,结果表明该算法具有较好的识别效果和良好的并行运算特性。

关键词:图像识别;投影熵;混合高斯模型;最大期望算法;判别分析

0 引言

图像识别以研究图像的描述和分类为主要内容,其关键环节是特征提取。特征提取的好坏将直接影响到目标识别系统的准确性,选取合适的特征可以降低识别系统的难度[1]。在图像识别中,常见的特征包括灰度特征、纹理特征、边缘特征、形态学特征和不变矩特征等。

投影熵特征是将图像的投影特征与图像熵相结合而得到的一种图像特征[2-4]。文献[2]首次提出了“投影熵”的概念,并讨论了一种基于局部投影熵的图像匹配算法,该算法具有较高的匹配精度和较好的抗几何失真特性;文献[3]将投影熵与Hausdorff距离相结合作为粗匹配准则,用于确定在基准图与实时图进行N层Contourlet分解后得到的低频子图像中,图像的最佳匹配位置;文献[4]将局部投影熵与细分小波相结合用于图像匹配;文献[5-6]将局部投影熵用于人脸识别,两篇文献所讨论算法的识别效果均具有较好的鲁棒性;文献[7]对图像投影特征进行了扩展,在原有的行投影和列投影的基础上,又提出了主对角线投影和次对角线投影的概念。

本文提出一种基于投影熵的图像识别算法,首先分析了原始定义下投影熵特征的不足,对投影熵的定义进行了改进;在进行图像识别时使用图像的局部投影熵特征,利用最大期望(Expectation Maximization,EM)算法建立训练集图像特征的混合高斯概率分布模型,对于给出的目标图像,求取图像相应特征,利用距离判别法来确定目标图像的类别。

1 投影熵

1.1 投影熵原始定义

投影变换是一种常见的线性变换,对于大小为M×N 的图像,设其灰度函数为f (x,y),则图像的行投影与列投影分别为:

1.2 投影熵特点分析

投影熵特征充分利用了投影变换的降维特性,同时也很好地继承了图像熵对图像几何失真不敏感的优点,并且具有一定程度的抗噪性和较快的运算速度[2-4]。

在具有这些优点的同时,投影熵还存在以下的一些问题:

1)投影变换在降低特征维数的同时,也丢失了一些图像中的信息,因此投影熵特征对于图像信息的提取是不够充分的;

1.3 扩展规范化投影熵

对原始的投影熵定义的改进包括“扩展”和“规范化”两个部分。“扩展”是指在原始定义的基础上加入主次对角线两个方向的投影熵;“规范化”是指在进行投影熵计算之前,先对图像进行一定的规范化处理。下面对这两部分给出具体说明。

1.3.1 投影方向的扩展

为了更加充分地提取图像中的信息,提出主对角线投影熵和次对角线投影熵的概念。对于大小为N×N的图像,主、次对角线投影分别定义为

1.3.2 图像的规范化

对图像的规范化包括以下三个步骤:

1)去除图像边缘上的背景,使图像中物体的边缘与图像的边缘相切;

2)使图像的行数和列数相等。若M>N,在原图像右端补充M×(M-N)的像素空间,像素值全部为1;若M

3)规范图像大小,给定一个基准尺寸L×L,通过缩放变换将图像大小变为设定的基准尺寸。

在计算投影熵特征之前,对图像按照上述步骤进行预处理规范化,具有如下优点:

1)保证了任意图像均可按照式(6)、(7)给出定义计算图像对角线方向上的投影(该式仅给出了在图像的行数和列数相等的前提下两个对角线方向的投影的定义);

2)对图像进行这样的预处理后,再计算得到的投影熵特征中,包含了图像长宽比的信息;

3)基准尺寸的设定避免了投影熵特征对于图像的尺寸放缩不具有不变性这一问题。

2 混合高斯建模

对训练集内的图像计算投影熵特征,可得到投影熵特征集合E={ek|k=1,2,…,n,ek∈Rn}。这里利用混合高斯模型来描述集合E内投影熵特征的概率分布。

对于由l个高斯函数组成的混合高斯模型,设其第i项的权重系数为ωi,均值向量为μi,协方差矩阵为Σi,混合高斯模型的一般形式为

3 距离判别法

对于目标图像,计算得到投影熵特征xT后,根据由训练集得到的不同类别图像投影熵特征的高斯混合模型,采用距离判别法判断该图像的类别。

定义样本x到式(11)给出的混合高斯模型的Mahalanobis距离为该样本到每一个高斯分布Mahalanobis距离的加权和

4 基于投影熵的图像识别算法

图像的投影熵特征主要反映的是图像的总体信息,对于图像的细节信息表现得并不充分,而在进行图像识别时,细节信息能够更好地区分不同的物体。因此在进行图像识别时,首先将规范化预处理后的图像等分为S × S个子块,然后对每一部分子图像求取式(10)所定义的投影熵特征,并将各个子图像的投影熵特征顺序排列而得到的S×S×4维向量作为识别特征,称这一向量为图像的局部投影熵特征。与投影熵相比,局部投影熵能够更好地反映图像的细节信息。

图2给出了本文算法的基本结构。图像识别算法包括训练集图像特征的分布模型的建立和目标图像的识别两部分。

1)训练集建特征模。

①选择合适的基准尺寸,对训练集中的图像进行规范化处理;

②计算规范化图像的局部投影熵向量,得到各个类别图像的特征向量集合;

③利用EM算法得到各个类别的投影熵特征概率分布的混合高斯模型。

2)目标图像识别。

①使用与训练集建模相同的基准尺寸,对目标图像进行规范化处理;

②计算目标图像的局部投影熵特征;

③计算目标图像特征向量到备选物体的混合高斯模型的Mahalanobis距离;

④根据距离判别法原理,得到目标图像所属类别。

5 仿真实验与结果分析

仿真实验使用哥伦比亚大学计算机视觉数据库(Computer Vision Laboratory Databases)中的图像对本文提出的算法进行实验验证。该数据库中包含多组图像数据,每组为某个物体绕其一周观察的图像,每旋转5°一张,共72张。图3给出列出实验中所用到不同物体的图像。

5.1 算法对比实验

在实验中,对于每个物体,将每间隔30°选取一张图像而得到的12张图像作为训练集。每次实验将每组的72张图像依次进行识别,统计识别结果正确的次数,得到算法的识别率。实验时,首先利用各个物体训练集中的图像局部投影熵特征,建立不同物体特征向量的混合高斯概率分布模型,然后对不同物体分别用本文算法和文献[15]中的算法进行图像识别,得到算法对各个物体的识别率,实验采用Matlab R2011b编程实现。表1给出了实验结果。

从实验结果可以看出,本文的识别算法具有较好的识别性能,从总体效果上,识别效果优于文献[15]中基于不变矩的识别算法。

与原始的投影熵定义相比,本文所使用的扩张规范化投影熵的运算量有所增加,因此,在实验中,从运算时间来看,本文算法并不具有优势。然而,从投影熵的定义可以看出,行、列以及主、次对角线四个方向的投影熵相互独立,同时,在计算局部投影熵时,各个子图像之间也是相互独立的,因此,本文算法所使用的局部投影熵特征具有良好的并行运算特性。在实际工程中,采用多通道并行处理器结构的硬件体系(例如采用FPGA内嵌处理器结构)实现本文算法,可以有效地缩短识别算法的运行时间,更好地体现本文算法的优势。

5.2 算法参数选择

使用本文算法进行训练集特征分布建模时,需要对混合高斯模型中高斯函数的个数l进行设定。l的选择对训练集特征分布的描述和最后的识别率有直接的影响,l过小有可能对训练集特征的分布信息反映得不够充分,l过大则会引入一些不必要的干扰信息。设训练集中样本个数为n,令

C=l/n(17)

实验中发现,当C>0.2时,算法的识别效果会有明显的下降。图4给出在一次实验中算法识别率随C的变化曲线。在使用本文算法时,建议训练集中的样本个数n>10,l在[0.06n,0.17n]范围内选取。

6 结语

本文提出一种基于投影熵特征的图像识别算法。首先,针对原始定义下投影熵特征的不足,从“扩展”和“规范化”两个方面给出了改进的投影熵特征的定义,将图像的局部投影熵特征向量用于图像识别;在进行图像识别时,求取由训练集图像的局部投影熵特征得到的混合高斯模型和目标图像局部投影熵特征的Mahalanobis距离,根据距离判别法原理得到目标图像所属类别。实验表明:1)与传统的基于不变矩的识别算法相比,本文算法具有更好的识别效果;2)使用本文算法时候应保证训练集样本数目n>10,混合高斯模型中高斯函数的个数应在[0.06n,0.17n];3)本文算法具有良好的并行运算特性,采用多通道并行处理器结构的硬件体系来更好地体现出该算法的优势。

参考文献:

[1] 余瑞星, 孟立勋. 一种新的ICM 模型参数设置方法[J]. 西北工业大学学报, 2012, 30(2):201-205.

[2] 刘雅轩, 苏秀琴, 王萍. 一种基于局部投影熵的图像匹配新算法[J]. 光子学报, 2004, 33(1):105-108.

[3] 王红梅, 李言俊, 张科. 一种基于Contourlet变换的图像匹配算法[J]. 宇航学报, 2008, 29(5):1643-1647.

[4] GUO X J, WANG W. Image matching algorithm based on subdivision wavelet and local projection entropy[C]// Proceedings of the World Congress on Intelligent Control and Automation. Piscataway: IEEE, 2006: 10380-10383.

[5] HUANG Y Y, LI J P, LIN J, et al. Robust face recognition by combining wavelet decomposition and local hybrid projection entropy[C]// Proceedings of the 2009 International Conference on Apperceiving Computing and Intelligence Analysis. Washington, DC: IEEE Computer Society, 2009:325-328.

[6] ZHANG J S, CHEN C S. Local variance projection log energy entropy features for illumination robust face recognition[EB/OL]. [20130320]. http:///xpls/abs_all.jsp?arnumber=4547649.

上一篇:基于数据挖掘的仿真模型参数修正 下一篇:“微时代”高职院校辅导员思想政治教育工作的...