基于SVM的乌伦古湖湿地遥感分类研究

时间:2022-10-06 11:10:08

基于SVM的乌伦古湖湿地遥感分类研究

摘要:以提取乌伦古湖湿地信息为目的,采用该地区2010年Landsat5/TM影像,使用支持向量机SVM的多项式函数对湿地信息进行分类。使用精度评估法(混淆矩阵)对分类结果进行精度评价并与传统的最大似然法(MLC)、非监督分类(ISODATA)法分类结果进行对比。结果表明,SVM分类法不仅能够很好地提取河流信息并且能够区分湖泊湿地与坑塘湿地,分类总精度达到94.000%,Kappa系数为0.932,明显高于MLC、ISODATA两种方法,同时各类别的用户精度和制图精度都在不同程度上高于传统分类方法。SVM是一种有效的提取湿地的方法,非常适用于干旱区湿地信息提取与监测。

关键词:SVM;遥感;干旱区;湿地

中图分类号:P237 文献标识码:A 文章编号:0439-8114(2016)16-4145-05

DOI:10.14088/ki.issn0439-8114.2016.16.018

湿地是由水陆相互作用形成的具有特殊功能的生态系统,具有较完备的生物多样性和生态系统功能,为人类的生产、生活提供了多种资源,被誉为自然之肾、生物基因库和人类摇篮[1,2]。干旱区内陆湿地是中国重要的湿地类型之一,但是相对于其他区域的湿地分布研究,中国西北地区的荒漠地带、干旱区湿地特别平原荒漠区湿地的研究还不够充分。

定量地提取与分析湿地信息是进行湿地研究的基础,RS与GIS技术的发展为湿地研究提供了新的思路。针对不同的湿地类型,基于遥感的湿地提取方法,有单波段阈值法,如牛明香[2]等在单红外波段阈值法基础上提出了分区分层湿地信息提取技术;多波段阈值法,如徐涵秋[3]提出用改进的归一化差异水体指数提取水体信息,肖艳芳等[4]提出的利用TM影像波段1与波段7提取水体信息等。常见的湿地信息提取模式识别技术有监督分类和非监督分类以及以此为基础提出的各种形式的混合分类法。上述方法都是基于数理统计理论,常规算法一般样本数目趋于无穷大才能获得良好的分类精度[5],故以上方法在样本数量少、特征维度低时效果欠佳。本研究采用支持向量机分类方法,在提取遥感影像NDVI、MNDWI、亮度、绿度、湿度等光谱特征的同时用较少的训练样本对乌伦古湖湿地进行了分类提取,并与最大似然分类方法MLC和非监督分类ISODATA法进行对比,为干旱区湿地自动分类和智能提取提供新的技术支持。

2 研究方法

2.1 研究区概况

乌伦古湖是中国新疆维吾尔自治区准格尔盆地北部的一个断陷湖,位于阿勒泰地区福海县城西约20 km处,夹于额尔齐斯河与乌伦古河之间,属中温带大陆性干旱气候。乌伦古湖面积约1 001 000 hm2,海拔约470 m,拥有二个大型淡水湖,北面为乌伦古湖,面积约82 500 hm2,南面为吉力湖,面积约 1 600 hm2,以及大片毗邻的淡水沼泽草地和沿乌伦古河的沼泽地,两湖串通,水源来自由阿尔泰山东部的青格里河与布尔根河汇集而成的乌伦古河。该区域内湿地资源丰富,湿地类型多样,是干旱区绿洲湿地研究的理想区域。

2.2 数据来源及预处理

9月乌伦古湖区域少云晴朗云量低于10%的比率较高,影像易于获取。本研究采用2010年9月21日Landsat5/TM 影像作为研究数据。利用ENVI软件对Landsat5/TM影像进行辐射校正,为保证数据的可靠性,将2010年Landsat5/TM与经过几何精校正的影像配准,误差控制在1个像元内,RMS=0.222 941,最后,裁切出研究区影像。

2.3 湿地分类体系

确立湿地的分类体系是进行湿地提取和研究的前提,然而中国湿地类型复杂多样,学者对湿地的界定不尽相同,研究者对湿地研究的出发点和分类目的也各不相同,要制定统一的定量分类体系比较困难。本研究根据《湿地公约》,综合考虑乌伦古湖流域特殊的干旱区地理特征,结合国内湿地调查采用的分类方法[9,10],提出了该区域内湿地分类体系(表1)。

2.4 特征提取

通过分析影像的波段相关矩阵和IOF指数,本研究选取453波段为RGB的波段组合[11,12]。光谱特征对于辅助遥感有效识别地物和准确分类起到了积极作用,为了更精确地提取水体和植被,本研究通过波段运算提取以下几种特征变量:

1)改进的归一化差异水体指数

MNDWI=(Green-MIR)/(Green+MIR)

Green为绿光波段,MIR为第五波段中红外波段。

2)归一化差值植被指数NDVI=(NIR-IR)/(NIR+IR)

NIR为近红外波段,IR为红光波段。

3)K-T变换的亮度指数、绿度指数和湿度指数

U=RTx+r

R是缨帽变换系数,x代表不同波段的灰度值,r 表示常数偏移量,U表示缨帽变换后不同的波段。

将提取的特征变量同原始影像RGB波段相叠加,构建出高于原始影像的维度特征空间。

2.5 样本选择与参数设置

通过目视解译和实地考察,研究区的农作物在9月底基本已经收割,沼泽主要分布在湖泊、坑塘周围。本研究在选择训练样本时将研究区地物分为河流、湖泊、坑塘、草本沼泽、已收割耕地、未收割耕地、裸地、森林沼泽、其他9类(表2)。根据研究区范围和影像的地物特征,每类选择150~200个训练样本和相同数量的检验样本,统计样本间的可分离度。

采用SVM分类法,核函数的参数和惩罚因子是影响SVM性能的主要因素[13]。目前针对SVM核函数参数和惩罚因子的设置有试凑法[14]和基于统计学理论的方法,如臧淑英等[15]提出的基于遗传算法的支持向量机湿地遥感分类。本研究采用多项式函数通过试凑法来确定最佳参数。对干旱区湿地的先验知识结合反复试验,发现在多项式阶数d=6时分类结果最优;将核参数设置为特征空间波段数的倒数,令其固定为?酌=0.125;不断调试惩罚因子,令C=15时分类结果最优。

3 结果与分析

基于上述SVM分类法,对乌伦古湖流域湿地信息提取的结果如图1(a)所示。MLC与ISODATA分类结果分别如图1(b)和图1(c)。

3.1 分类效果评价

为了更清晰地显示3种分类的差异,选取局部区域加以分析,如图2所示。对比显示ISODATA法分类可以完成湿地信息的粗提取,但是难以通过光谱信息区分出湖泊湿地与坑塘湿地,同时,河流湿地与裸地信息混淆,造成河流斑块破碎,信息不连续。此外,河流湿地与草本沼泽信息混淆情况严重。然而MLC法与SVM法通过训练样本都可以有效提取出各种类型的湿地,能够区分出湖泊湿地与坑塘湿地,尤其在河道较窄的情况下能够较为完整地提取河流信息。

3.2 分类精度评价

建立混淆矩阵进行精度评价评定是目前普遍采用的遥感影像分类精度定量评价方法[16]。统计本研究涉及的3种分类结果得到相应的混淆矩阵(表3、4、5)。通过分类结果判断和混淆矩阵显示状况,可以看出3种方法都出现了错分漏分现象,但利用SVM多项式的分类总精度高达94.000%,比ISODATA法提高了8.692%,比MLC法提高了2.467%;Kappa系数为0.932 3,比ISODATA法提高了0.1,比MLC法提高了0.028。混淆矩阵显示:

1)使用SVM分类法时各地物正确分类率较高且水平均衡,未出现较为严重的错分现象。

2)SVM分类法相对于ISODATA法而言,不仅区分出了坑塘信息,其正确分类样本高达99%,甚至比MLC还高8%。

3)MLC分类将其他地物错分为河流的样本达到24%,而SVM分类结果中只有7.33%,很好地改善了这一混淆状况。

通过观察各湿地类型3种分类方法的用户精度和制图精度统计图(图3、图4)可以得出,ISODATA法在湿地分类中用户精度和制图精度相对偏低,并且该分类法未区分出坑塘信息,不具有参考价值。SVM法在针对湿地的分类中,制图精度普遍高于MLC法,平均制图精度达到97.14%。SVM分类结果的用户精度与MLC接近,除草本沼泽外,均保持在90%以上。虽然在河流和草本沼泽中精度略低于MLC法,但能够满足分类需求,并且在坑塘的用户精度上体现了优越性。

4 结论

本研究以新疆乌伦古湖为研究区,利用TM影像,在提取影像NDVI、MNDWI、湿度、绿度、亮度等特征的基础上,选取少量样本利用SVM多项式函数提取湿地信息,结果证明SVM能有效地区分各湿地类型,清晰显示湿地的分布情况。虽然SVM分类法也存在漏分、错分现象,但经有限的检验样本验证显示,SVM分类总精度、Kappa系数、平均用户精度、平均制图精度都高于传统的最大似然法和非监督分类。SVM在小样本、高维度情况下体现出了精度高、效果好等特点,是一种值得推广的分类方法。

参考文献:

[1] 孙广友.中国湿地科学的进展与展望[J].地球科学进展,2000, 15(6):666-670.

[2] 牛明香,赵庚星,李尊英.南四湖湿地遥感信息分区分层提取研究[J].地理与地理信息科学,2004,20(2):45-52.

[3] 徐涵秋.利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J].遥感学报,2005,9(5):589-595.

[4] 肖艳芳,赵文吉,朱 琳.利用TM影像Band1与Band7提取水体信息[J].测绘科学,2010,35(5):226-227.

[5] 田 源,塔西甫拉提・特依拜,丁建丽,等.基于支持向量机的土地覆被遥感分类[J].资源科学,2008,30(8):1268-1274.

[6] 张 睿,马建文.支持向量机在遥感数据分类中的应用新进展[J].地球科学进展,2009,24(5):555-562.

[7] HUGHES G. On the mean accuracy of statistical pattern recognizers[J].IEEE Transactions on Information Theory,1968, 14(1):55-63.

[8] CRISTIANINI N,SHAWE-TAYLOR J. An Introduction to Support Vector Machines and Other Kerne-l based Learning Methods(English Edition)[M].BinJing:China Machine Press,2005.

[9] 唐小平,黄桂林.中国湿地分类系统的研究[J].林业科学研究,2003,16(5):531-539.

[10] 朱长明,李均力,常 存.新疆干旱区湿地景观格局遥感动态监测与时空变异[J].农业工程学报,2014,30(15):229-238.

[11] 金宝石,周葆华.TM影像在湖泊湿地信息提取中的最佳波段组合[J].光谱实验室,2012,29(6):3771-3774.

[12] 姜小光.成像光谱数据的光谱信息特点及最佳波段选择[J].干旱区地理,2010,23(3):215-220.

[13] 林升梁,刘 志.基于RBF核函数的支持向量机参数选择[J].浙江工业大学报,2007,35(2):163.

[14] 周 奇.对支持向量机几种常用核函数和参数选择的比较研究[J].福建电脑,2009(6):42-43.

[15] 臧淑英.遗传算法优化的支持向量机湿地遥感分类――以洪河部级自然保护区为例[J].地理科学,2012,32(4):434-441.

[16] 李振源,许捍卫,王金龙.基于QUEST决策树的大丰湿地信息提取[J].地理空间信息,2014,12(5):35-37.

上一篇:山东夏季降水日变化特征分析 下一篇:制造橡木桶用木材的微观结构研究