基于一类支持向量机的高光谱影像地物识别

时间:2022-08-30 07:10:26

基于一类支持向量机的高光谱影像地物识别

收稿日期:2011-01-28;修回日期:2011-03-08。

作者简介:陈伟(1983-),男,浙江杭州人,博士研究生,主要研究方向:模式识别、高光谱遥感; 余旭初(1963-),男,湖北罗田人,教授,博士生导师,博士,主要研究方向:摄影测量与遥感、模式识别; 张鹏强(1978-),男,甘肃镇原人,讲师,博士,主要研究方向:摄影测量与遥感、序列影像处理。

文章编号:1001-9081(2011)08-02092-05doi:10.3724/SP.J.1087.2011.02092

(1.信息工程大学 测绘学院,郑州450052; 2.65015部队,辽宁 大连116023;

3.北京望神州科技有限公司 销售部,北京100020)

()

摘 要:高光谱遥感影像具有丰富的光谱信息,在地物识别方面具有明显的优势。一类支持向量机(OCSVM)不仅保留了支持向量机的原有优势,而且只需要待识别类型的训练样本。为此提出了算法,通过数学模型选择、核函数设计与参数的自适应调整将OCSVM原理融入到高光谱影像的地物识别算法中,提高了识别的精度,降低了对训练样本的要求。最后利用两幅高光谱影像进行了实验分析,实验结果证明了所提算法的有效性。

关键词:高光谱影像;一类支持向量机;支持向量数据描述;地物识别;参数选择

中图分类号: TP391.413文献标志码:A

Object recognition based on one-class support vector machine in

hyperspectral image

CHEN Wei1, YU Xu-chu1, ZHANG Peng-qiang1, WANG Zhi-chao2,WANG He3

(1. Institute of Surveying and Mapping, Information Engineering University, Zhengzhou Henan 450052, China;

2. Unit 65105, Dalian Liaoning 116023, China;

3. Sales Department, Digital LandView Technology Company Limited, Beijing 100020, China)

Abstract: The hyperspectral remote sensing image is rich in spectrum information, so it has advantages in object recognition. One-Class Support Vector Machine (OCSVM) not only holds the advantages of support vector machines but also only needs the train samples of the recognized objects. The algorithm proposed in this paper selected mathematical model, designed kernel function, adjusted parameter adaptively, and added the theory of OCSVM into the object recognition algorithm for hyperspectral image which improved the precision of recognition and reduced the demand of train samples. Lastly, the experiments were conducted on two hyperspectral images, and the results prove the validity of the proposed method.

Key words: hyperspectral image; One-Class Support Vector Machine (OCSVM); Support Vector Data Description (SVDD); object recognition; parameter selection

0 引言

高光谱遥感将反映目标辐射属性的光谱与反映目标空间和几何关系的图像有机地结合在一起,续写和完善了光学遥感从黑白全色影像通过多光谱到高光谱的全部影像信息链,其图谱合一的特点为分类、探测及目标识别提供了极大的便利。其应用领域已涵盖地球科学的各个方面,除了在地质找矿和制图、大气和环境监测、农业和森林调查、海洋生物和物理研究等领域发挥着越来越重要的作用之外,还在遥感测绘领域展现出美好的前景[1]。生产突出表示某种地形要素的专题地图是测绘的重要任务,可以通过分类的方法得到感兴趣的目标地物在影像中的分布情况,但是基于分类的方法需要摄影区域中各类地物的训练样本,而在实际中获取训练样本的时间和经济成本较高。高光谱地物识别的目的与目标检测[2]相似,都是将影像分为目标地物与背景两部分,此外,与基于光谱匹配的目标检测方法类似都需要目标地物光谱的先验信息。但是,基于光谱匹配的目标检测方法并不完全适用于地物识别的场合,主要原因有以下两点:首先,基于正交子空间投影(Orthogonal Subspace Projection, OSP)的系列方法、基于最小二乘(Least Squares, LS)的系列方法和子空间匹配方法需要的不仅仅是目标地物光谱的先验信息,并且需要各类背景地物光谱的先验信息;其次,目标检测关心的多是亚像素级的小地物,并且这类地物在影像中的分布较少,而地物识别通常关心植被、水系等分布较广的地物类型,在这种情况下线性约束最小方差(Linearly Constrained Minimum Variance, LCMV)以及约束能量最小(Constrained Energy Minimization, CEM)等目标光谱信号约束检测方法虽然仅需要目标地物光谱的先验信息,但是会由于目标地物在影像中的分布过多而造成很低的探测精度。在高光谱影像处理中,通常采用光谱角度匹配(Spectral Angle Match, SAM)的方法进行地物识别,利用SAM识别地物,仅需目标地物光谱的先验信息,并且计算效率较高,但是受到光照变化、相同地物不同质地、成像噪声等因素的影响,光谱匹配方法很难满足地物精细识别的要求。

支持向量机(Support Vector Machine, SVM)技术自20世纪90年代以来异军突起,由于其处理高维小样本、非线性可分数据时的良好性能,正好满足了高光谱影像处理的要求,因此在高光谱影像分类[3]与混合像素分解[4]领域都得到了应用。但是地物识别问题与分类问题的不同之处在于,其训练样本只有目标地物,因此,普通的SVM算法无法直接应用于地物识别中。一类支持向量机(One-Class Support Vector Machine, OCSVM)是SVM的一种分支算法,与普通的SVM算法需要每个待分类别的训练样本相比,OCSVM只需要待识别类型一类的训练样本。目前,OCSVM已经在多种检测问题中得到了应用[5-6]。本文将分析OCSVM算法的原理,并将其应用于高光谱影像地物识别中。

1 算法原理与描述

OCSVM仅需利用待识别类型即正类的样本进行训练,就可将样本分为正类与外点(负类),因此它解决的是一个一分类问题,从机器学习的角度看一类SVM属于无指导学习问题。从不同的角度出发,Tax等人提出的支持向量数据描述(Support Vector Data Description, SVDD)方法[7]与Schlkopf等人设计的算法[8],是一类SVM的两条技术途径,为便于区分,在后续内容中将Schlkopf等人的算法称为1-SVM算法。SVDD的目的是计算得到在高维空间中能包含最多正类样本同时具有最小半径的超球体,而1-SVM是将一分类问题视为一个特殊的两类分类问题,并且通过在高维空间中求取正类与原点之间的最大间隔分离超平面来达到一类分类的目的。

对于高光谱影像地物识别而言,基于OCSVM的方法既具有SVM原有的优势,又有其自身的优点,概括起来主要有以下几个方面:1)仅需利用待识别地物的训练样本,有利于降低训练样本获取的成本和提高作业效率;2)非参数估计,该方法完全依赖于数据本身,而不需要事先对数据的分布进行假设;3)满足稀疏性条件,即仅需要待识别地物类型少量的训练样本,并且仅用较少的数据就可对待识别地物进行精确的描述;4)良好的泛化性能;5)由于核函数的引入使其具有非线性分类能力;6)较快的处理速度,有利于高光谱数据的实时和近实时处理。

下面,首先对OCSVM的两种主要算法的原理进行分析,然而给出基于OCSVM的高光谱影像地物识别的具体过程。

1.1 SVDD算法

SVDD的基本思想是对正类分布的支撑区域建立一个“小”而“紧”的超球面模型,该超球面需以较大的概率包含尽可能多的正类样本并尽量排除负类样本,同时该超球面应该具有较小的半径,如图1所示为最小超球面模型,落在超球面上的正类样本就是支持向量。对于线性不可分的情况,SVDD通过引入松弛变量,以及利用核函数将样本隐式非线性映射到高维特征空间的方法加以解决。

图1 SVDD示意图

由于高光谱地物识别面临的情况大多数都是非线性的,所以在此直接介绍非线性SVDD,具体方法用数学语言可以描述为:设有训练样本集T{Xi|i1,2,…,N}且Xi∈Rl,Φ(・)为原始l维空间至某个高维特征空间F的非线性映射,则SVDD在变换后的高维特征空间中计算寻找最优超球面的任务,可以表示为如下所示的优化问题:

minr,c,ζi r2+C∑Ni1ζi(1)

s.t. Φ(Xi)-a2≤r2+ζi, ζi≥0且i1,2,…,N(2)

其中:r为最优超球面的半径;a为超球体的质心;・表示欧氏距离;ζi为松弛变量,类似SVM线性不可分的情况,表示允许部分训练样本落于超球面之外;C为惩罚系数,用于调节超球面的半径与超球面包裹训练样本数量之间的关系,C的大小与超球体包含样本数量之间呈正比关系,是需要人工设置的参数。

利用拉格朗日乘子法,同时结合核函数代替高维特征空间F上的内积,可将如式(1)和式(2)所示的优化问题转化为对偶形式:

minα∑i, jαiαjk(Xi,Xj)-∑iαik(Xi,Xi)(3)

s.t. 0≤αi≤C, ∑iαi1(4)

其中k(・,・)为满足Mercer条件的核函数。利用二次规划优化方法可以求解式(3)和式(4)所示的优化问题从而得到α,如果αi0则对应的样本落于超球面内,若αiC则对应的样本落于超球面外,而满足0

f(X)sgn(r2-Φ(X)-c2)

sgn(r2-∑i, jαiαjk(Xi,Xj)+2∑iαik(Xi,X)-k(X,X))(5)

其中超球面的半径r等于任意一个支持向量到球心的距离。

1.2 1-SVM算法

不同于SVDD构造最小超球面的思想,1-SVM的出发点是在变换后的特征空间中寻找到最优分离超平面,使得正类样本和原点之间具有最大间隔。图2为表示1-SVM原理与其参数意义的示意图。

图2 1-SVM示意图

1-SVM通过引入分离超平面和最大间隔的思想,在变换后的特征空间中尽可能地使正类落于分离超平面的一侧,而使原点与其他类别落于另一侧。设有训练样本集T{Xi|i1,2,…,N}且Xi∈Rl,Φ(・)为原始l维空间至某个高维特征空间F的非线性映射,则1-SVM寻找最优分离超平面任务的目标函数可表示为式(6):

minw,ρ,ζ,b〈w,w〉+∑Ni1ζi-ρ(6)

s.t. 〈w,Φ(Xi)〉≥ρ-ζi; ζi≥0且v∈[0,1](7)

其中:w和ρ为分离超平面的参数,ρ/w代表间隔的大小;ζi为松弛变量,表示允许部分训练样本落于分离超平面的原点一侧;v的作用是调节w和ζi之间的关系,是需要设置的变量,代表了训练样本识别错误率的上限,而vN代表支持向量数量的下限[9]。

如式(6)和式(7)所示的最优分离超平面目标函数可以转化为如下所示的二次规划(Quadratic Programming, QP)寻优的对偶问题:

minα∑i, jαiαjk(Xi,Xj)(8)

s.t. 0≤αi≤; ∑iαi1(9)

求解上述QP问题可以得到最终的判别函数:

f(X)sgn(∑iαik(Xi,X)-ρ)(10)

其中:Xi都为支持向量;αi为相应的拉格朗日乘子,且αi满足0

ρ∑jαjk(Xi,Xj)(11)

1.3 SVDD与1-SVM的相关性分析

SVDD与1-SVM之间有着紧密的联系,当采用的核函数为分别如式(12)和式(13)所示的高斯径向基核以及指数径向基核这类径向基核函数时:

k(Xi,Xj)exp-(12)

k(Xi,Xj)exp(-qXi-Xj)(13)

如式(3)所示的对偶形式可表示为式(14):

minα(∑i, jαiαjk(Xi,Xj)-1)(14)

如果再认为C和为相同的变量,则此时在数学形式上SVDD和1-SVM满足等价关系[8]。

1.4 算法描述

如上所述,SVDD的惩罚系数C负责调节最小化超球体半径和包含尽可能多的正类样本这对矛盾间的关系,定性地讲C的值具有明确的含义,即C值的大小与超球体包裹的正类样本个数呈正比关系。定量地讲C值本身并没有确切的意义,所以C值的设置比较困难。与之相比1-SVM的参数v表示的是对训练样本识别错误率的上限,同时也相当于支持向量占训练样本比例的下限,具有明确的定量意义,因此在数学形式上采用1-SVM算法的最大间隔分离超平面模型,有利于参数的设置。

多项式函数、径向基函数和Sigmoid函数是三种常用的满足Mercer条件的核函数,其中最为常用的是如式(12)所示的高斯径向基核函数,这是由于其对应的特征空间是无穷维的,有限的数据样本在该特征空间中肯定是线性可分的[10]。同时考虑到核函数为高斯径向基函数时,SVDD和1-SVM两者存在等价关系,而高斯核函数适用于超球体模型[11]。因此选择高斯径向基函数作为核函数。

在高光谱影像地物识别中,对于不同的地物需要设置不同的高斯核函数的尺度参数σ。σ控制着核函数的平滑程度,并且其值应该与1-SVM的参数v相适应,以达到最好的识别效果。在此,采用Unnthorsson等人提出的方法[12]来获取参数σ的值。在这种方法中,事先规定训练样本最大错误率v以及σ的取值范围[σmax,σmin],然后利用1-SVM对训练样本进行识别得到不同σ值下的识别正确率。

如图3所示,x轴和y轴分别表示σ的取值和1-SVM对训练样本的识别正确率,取使得识别正确率第一次满足大于(1-v)条件时的σ作为最优值。此外,为了便于设置σ的取值范围,事先需将高光谱影像的DN值规范化至[0,1]。

图3 σ选择方法示意图

地物识别的目的是区分目标地物与背景,可视为一种特殊的两类分类问题。因此可借助误差矩阵,通过计算分类精度的方法作为识别精度的评价指标。分类精度评价指标包括:制图精度、用户精度、总体精度和Kappa系数。其中用户精度是从用户的角度反映分类图的可靠性,制图精度是从制图的角度反映图像上被标识为各类地物的可靠性,总体精度的计算只采用了误差矩阵中对角线上被正确分类的像素数量,因此这三种指标不能全面反映整体的精度。而Kappa系数既考虑了对角线上被正确分类的像素数量,同时也考虑到各种错分和漏分的误差,更加全面反映了分类精度[13]。由于篇幅的限制,本文不能给出每种地物识别结果的误差矩阵,结合上述的原因,利用Kappa系数作为精度评价的综合指标。

综上所述的数学模型和核函数选择、参数设置以及精度评价指标,基于一类SVM的高光谱影像地物识别过程如下:

1)将原始高光谱影像的DN值规划至[0,1];

2)选择待识别地物的训练样本;

3)设置高斯核函数参数σ的范围和1-SVM的参数v;

4)利用Unnthorsson的方法选择最优的σ值;

5)训练1-SVM得到αi和ρ;

6)利用训练好的1-SVM对整幅影像进行识别;

7)识别精度评价。

2 实验

本文进行两组高光谱数据的实验,每组数据都提供了摄影地区主要地物类型的样本,在实验中将以每种地物类型轮流作为目标地物,从该类型地物的样本中随机选择100个用于分类器的训练,剩余的所有样本则用于测试,以此来验证一类SVM算法的效果。实验中设置训练样本错误识别率上限v为0.05,并运用文献[12]中的方法确定高斯核函数的尺度参数σ。

此外,为了便于比较,本文还给出了SAM[14]方法的识别结果。由于SAM得到的是待识别样本与参考光谱间的光谱角度值,为了便于比较精度,借助测试样本得到对SAM结果的最佳分割阈值,从而以SAM的最高识别精度参与比较。

本实验采用的计算机硬件环境为Intel Core2 CPU 3.0GHz、2.99GHz,内存3.25GB,软件环境为Windows XP、Matlab 7.5。

2.1 实验1

由中国科学院上海技术物理研究所的OMIS获取的江苏太湖沿岸的影像,光谱覆盖范围0.46~12.85μm,共128波段,影像宽347像素、高513像素,实验采用受噪声影响比较小的6~64、113~128共75个波段。通过对影像目视判读,采集了7类地物的样本,其分布如图4(a)所示,样本信息如表1所示,地物样本均值光谱曲线如图5所示。各类地物的识别结果如图4(b)~(h)所示,具体精度指标如表2所示。表2中,采用SAM对太湖影像的任何一种地物进行识别需耗时8.6653s。

图4 OMIS太湖影像

图5 太湖影像样本均值光谱曲线

表1 太湖影像检验样本信息

2.2 实验2

2001年5月31日,由NASA的EO-1卫星上的Hyperion传感器获取的南非博茨瓦纳(Botswana)Okavango三角洲地区影像,影像宽256像素、高400像素,光谱分辨率大约为10nm,光谱范围400~2500nm,共242波段,经过辐射校正,去除噪声和大气吸收波段。实验采用原数据中10~55、82~97、102~119、134~164、187~220波段共145波段。地面覆盖类型的样本采集用来反映所研究地区洪水对植被的影响,样本采集根据植被测量和航空摄影测量获得,如图6(a)所示,样本信息如表3所示,地物样本光谱曲线如图7所示。各类地物的识别结果如图6(b)~(f)所示,具体精度指标如表4所示。表4中,采用SAM对博茨瓦纳影像的任何一种地物进行识别需耗时5.0715s。

表2 太湖影像地物识别精度

5道路2.180.90240.00090.5916110.85056房屋0.350.84670.00060.562390.74717水体0.350.96160.00060.5013100.9460

表3 博茨瓦纳影像样本信息

2.3 实验结果分析

本文采用的基于一类支持向量机的高光谱影像地物识别方法,对以上两组实验数据都取得了较SAM地物识别方法更高的识别精度。特别是在不同植被类型的识别这种复杂情况下,基于一类支持向量机的方法更是体现出来它的优势,与SAM相比,其精度普遍要高出10%~20%。另外,基于一类支持向量机的识别方法同时也具有较高的处理速度。

3 结语

一类支持向量机不仅保留了支持向量机方法处理高维小样本数据的原有优势,而且仅需要待识别类型一类的训练样本。它的这些特点与复杂的高光谱影像地物识别问题的要求相契合。本文分析总结了一类支持向量机的基本原理与技术

途径,并以此为基础设计了基于一类支持向量机的高光谱影像地物识别方法,最后通过实验证明了本文算法的有效性。然而,一类支持向量机方法作为一种新兴的数据分析的有效手段,其本身还有很大的改进余地,此外,它在高光谱影像分析的应用领域也不仅限于地物识别方面。因此,下一步的研究,一方面将追踪一类支持向量机方法的最新进展,用于提高地物识别的精度;另一方面还将探索其在高光谱影像聚类分析、分类和混合像素分解方面的应用。

图6 Hyperion博茨瓦纳影像

表4 博茨瓦纳影像地物识别精度

图7 博茨瓦纳影像样本均值光谱曲线

参考文献:

[1] 余旭初,冯伍法,林丽霞.高光谱――遥感测绘的新机遇[J].测绘科学技术学报,2006,23(2):130-132.

[2] 贺霖,潘泉,邸|,等.高光谱图像目标检测进展[J].电子学报,2009,37(9):2016-2024.

[3] 杨国鹏.基于机器学习方法的高光谱影像分类研究[D].郑州:信息工程大学,2010.

[4] 吴波,张良培,李平湘.基于支持向量回归的高光谱混合像元非线性分解[J].遥感学报,2006,10(3):312-318.

[5] LI KUN-LUN, HUANG HOU-KUAN, TIAN SHENG-FENG, et al. Improving one-class SVM for anomaly detection [C]// Proceedings of 2003 International Conference on Machine Learning and Cybernetics. Washington, DC: IEEE Computer Society, 2003: 3077-3081.

[6] BANERJEE A, BURLINA P, DIEHL C. A support vector method for anomaly detection in hyperspectral imagery [J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(8): 2282-2291.

[7] TAX D, DUIN R. Data domain description using by support vectors [C]// Proceedings of 1999 the European Symposium on Artificial Neural Networks. Brussel: D-Facto, 1999: 251-256.

[8] SCHZLKOPF B, PLATT J C, SHAWE-TAYLOR J T, et al. Estimating the support of a high-dimensional distribution [J]. Neural Computation, 2001, 13(7): 1443-1471.

[9] SCHZLKOPF B, SMOLA J, WILLIAMSON R C, et al. New support vector algorithms [J]. Neural Computation, 2000, 12(5): 1207-1245.

[10] 白鹏,张喜斌,张斌,等.支持向量机理论及工程应用实例[M].西安:西安电子科技大学出版社,2008:18.

[11] TAX D, DUIN R. Support vector domain description [J]. Pattern Recognition Letters, 1999, 20(11/12/13): 1191-1199.

[12] UNNTHORSSON R, RUNARSSON R T, JOHNSON T M. Model selection in one class nu-SVMs using RBF kernels [C]// Proceedings of the 16th International Conference on Condition Monitoring and Diagnostic Engineering Management. Vaxjo, Sweden: V|xj University Press, 2003: 1054-1060.

[13] 万余庆,谭克龙,周日平,等.高光谱遥感应用研究[M].北京:科学出版社,2006:123-125.

[14] 张新乐,张树文,李颖,等.基于光谱角度匹配方法提取黑土边界[J].光谱学与光谱分析,2009,29(4):1056-1059.

上一篇:基于模糊模式识别的籽棉品级分级模型 下一篇:基于基类模型模板的自动武器协同设计系统