监督分类范文

时间:2023-03-14 10:06:21

监督分类范文第1篇

摘 要 水系是重要的地性线,常被看成是地形的“骨架”,对其他要素有一定的制约作用。快速提取遥感影像上水系的线性特征,获

>> 一种基于非监督判别语义特征提取的文本分类算法 基于监督局部线性嵌入特征提取的高光谱图像分类 基于提取网站层次结构的网页分类方法 基于自动机模型的构件集成软件测试要素的提取 基于AAM关键特征点提取的人脸照片分类方法的研究与应用 基于支持向量机分类水平集方法的图像特征提取研究 基于局部序列图像的虹膜特征提取与分类研究 基于分类结果的多光谱遥感影像端元提取方法 基于样本熵的运动想象脑电信号特征提取与分类方法 基于小波包与共空间模式的脑电信号特征提取与分类 基于动态特征提取和神经网络的数据流分类研究 基于局部保持投影的神经尖峰电位特征提取与分类 中文文本分类中基于概念屏蔽层的特征提取方法 解题信息的分类与提取 基于风险导向的内部控制监督要素的实施方案 基于光谱特征的监督分类方法在黄河口湿地的应用比较 结合均值漂移的基于图的半监督图像分类 基于锚点建图的半监督分类在遥感图像中的应用 基于纹理分类的高分辨率卫星城市用地信息提取 基于局部学习的半监督多标记分类算法 常见问题解答 当前所在位置:l.

[4]游代安.GIS辅助的遥感图像处理与分析技术的研究[D].信息工程大学,2001.

[5]郭德方.遥感图像的计算机处理和模式识别[M].电子工业出版社,1984.

[6]王刚,李小曼,田杰.几种TM影像的水体自动提取方法比较[J].测绘科学,2008(03).

监督分类范文第2篇

关键词: 遥感图像; 图像分类; mean shift; 锚点

中图分类号: TN957.52?34; TP79 文献标识码: A 文章编号: 1004?373X(2016)22?0092?0

0 引 言

遥感图像具有较高的光谱分辨率,在航天、地质勘探、农业等领域获得了越来越多的应用,遥感图像分类在遥感图像应用中具有重要的作用。但对遥感图像分类也面临以下难题:其一是如果采用传统的非监督方法对遥感图像直接分类,因遥感图像的复杂性和特殊性,很难获得比较满意的结果;其二采用监督方法,需要运用大量的训练样本才能获取较好的分类结果,而标记样本的获取代价高昂,也容易出现分类器过拟合与训练样本的问题。

半监督学习[1]可以很好地解决上述问题,首先大量的廉价的无标记样本也包含样本特征信息,其次遥感图像中标记样本的获取十分昂贵。半监督学习可以利用少量的已标记样本,结合大量的无标记样本建立分类器完成学习任务。基于图的半监督图像分类在近年来图像研究领域成为了一个研究热点,此方法结合图理论,能够充分利用图像中的无标记样本信息,分类性能较好,且目标函数优化简单,因此更加高效,目前也有许多基于图的半监督分类方法[2?6]。

基于图的半监督图像分类方法是建立在图理论的基础上,但算法计算速度依赖于所构建图的规模大小,当数据规模过大时,如果还是每一个图节点代表一个样本点,图规模就会很庞大,计算的时间复杂度会很高,例如线性近邻传递算法(Linear Neighborhood Propagation)、局部与全局一致性算法(Local and Global Consistency),其计算复杂度为[O(n3)],[n]为样本个数。为了降低算法的复杂度,Blum 和Chawla提出了图的最小割(Mincut)算法,并将其时间复杂度降低到了[O(cn2)],这里[c]为类别数。但最小割算法可能存在多个解,得到不同的分类结果。

2010年Liu等提出基于锚点建图的半监督分类方法[7](Anchor Graph Regularization,AGR)。首先采用K?means算法对数据聚类,将聚类中心作为锚点得到锚点集,其次利用锚点与已标记样本建图,缩小了图规模,时间复杂度降为[Om2n,m?n],[n]为样本总数,[m]为聚类个数。但K?means聚类算法消耗时间过长,且遥感图像混合像元问题使部分像元很难进行非此即彼的划分,部分区域地物类别边界是过渡性的,没有明显边界划分,因此K?means不适宜对遥感图像聚类。针对上述问题,本文采用mean shift聚类算法代替K?means算法对遥感图像聚类,缩短了聚类时间,mean shift算法对噪声也有一定的鲁棒性,可以解决噪声点带来的干扰,提高聚类的有效性。其次在每个聚类中随机选取一个点作为锚点,得到锚点集,并与标记样本集建立图。该方法不仅降低了算法复杂度,可以处理大规模图像分类问题,同时在遥感图像分类中具有较好的分类结果。

1 AGR图像分类方法

设样本数据集为[x=xini=l?Rd],共有[n]个样本,[l]个是已标记样本,剩余的为未标记样本。为了解决大规模数据问题,将标记预测函数定义为一个对锚点的加权平均函数,当得到锚点的类别信息后,就可以通过映射关系得到与锚点密切相关的无标记样本的类别信息。将锚点加权平均函数表示为:[UA=ukmk=1?Rd],其中[uk]代表锚点,标记预测函数为:

[f(xi)=k=1mZikf(uk)] (1)

在这里定义两个向量[f=[f(x1),f(x2),…,f(xn)]T]和[a=[f(u1),f(u2),…,f(um)]T];[a]为锚点的软标签预测矩阵;[m]为锚点个数。式(1)可以写成:

[f=Za, Z∈Rn×m, m?n] (2)

其中Z是一个权值矩阵,表示了锚点与所有样本点的线性关系:

[Zik=Kh(xi,uk)k'∈Kh(xi,uk'), ?k∈] (3)

这里使用的是高斯核函数[Kh(xi,uk)=][exp-xi-uk22h2]。[?[1:m]]是一个保存[xi]的[s]个最近邻锚点的索引,为了提高计算效率,规定每一个样本[xi]只与[s]个[Zik]中值最大的锚点具有连接关系,其他连接均为0。

由Z矩阵可以得到邻接矩阵:

[W=ZΛ-1ZT] (4)

式中,[Λ∈Rm×m]是一个对角矩阵:

[Λkk=i=1nZik] (5)

由[s]的取值可以知道,所有的样本点都只与部分近邻锚点存在连接关系,所以矩阵W是稀疏的。Zhu提出稀疏图对算法的性能的影响优于全连通图[1]。因为全连通图中,每个样本的邻接信息中含有大量重复的、干扰的信息,而稀疏图在连接不同样本时含有较少的错误信息,对算法结果有正确的指导。由式(4)定义的邻接矩阵所构造的图就是Anchor Graph。最后Anchor Graph的图拉普拉斯矩阵为:

[L=D-W=I-ZΛ-1ZT] (6)

式中:D为对角线矩阵,[Dii=j=1nWij]。

2 本文方法流程

假设已标记样本[xi(i=1,2,…,l)],其标记信息为[yi∈{1,2,…,c}],[c]为类别个数。用[Y=[y1,y2,…,yc]∈Rl×c]表示已标记样本的标记信息,如果[yi=j],[Yij=1],否则[Yij=0]。用mean shift聚类算法对遥感图像进行聚类,得到各个类别的聚类中心,把每个聚类中心作为一个锚点,得到AGR方法中的锚点集合。此时就需要求得锚点的标签预测矩阵[A=[a1,a2,…,ac]∈Rm×c]。选择被广泛应用的图拉普拉斯正则化项[ΩG(f)=12fTLf],可得到半监督学习框架 :

[minA=[a1,a2,…,ac]Γ(A)=12j=1cZlaj-yj2+γj=1cΩG(Zaj) =12ZlA-Y2F+γ2tr(ATZTLZA)] (7)

式中:[Zl∈Rl×m]是[Z]矩阵的子矩阵,只包含标记样本;[・F]是Frobenius范数;取[γ>0],为正则化参数。那么缩小后的拉普拉斯矩阵为:

[L=ZTLZ=ZT(I-ZΛ-1ZT)Z =ZTZ-(ZTZ)Λ-1(ZTZ)] (8)

缩小后的拉普拉斯矩阵存储空间更小,易于计算,空间复杂度为[O(m2)],时间复杂度为[O(m3+m2n)]。这时,目标函数[Γ(A)]进一步简化为:

[Γ(A)=12ZlA-Y2F+γ2tr(ATLA)] (9)

最后,就可以得到全局最优解:

[A*=(ZTlZl+γL)-1ZTlY] (10)

得到了锚点的标记信息,那么未标记样本的标记信息就可以通过下式得到:

[yi=argmaxj∈{1,2,…,c}Ziajλj, i=l+1,l+2,…,l+n] (11)

式中:[Zi∈Rl×m]表示Z矩阵的第i行。[λj=ITZaj]表示归一化因子,作用是平衡倾斜的类分布。

具体的算法步骤如下:

输入:已标记样本[xi(i=1,2,…,l)],标记信息[yi∈{1,2,…,c}]

输出:图像分类结果

(1) 用mean shift算法对遥感图像进行聚类,得到m个类,从每一个聚类中选取一个点作为锚点;

(2) 选择合适的[γ];近邻锚点个数s取3;

(3) 计算Z矩阵,根据式(4)计算邻接矩阵W;

(4) 根据式(6)计算图拉普拉斯矩阵L;

(5) 根据式(10)计算锚点标签预测矩阵[A*];

(6) 根据式(11)计算未标记样本的标记。

3 算法复杂度分析

基于图的半监督分类方法,大多数方法中是每个样本作为一个图节点建立图,所以计算复杂度为[O(n3)],其中[n]是样本个数。本文方法中,mean shift的计算复杂度是[O(dn2t)],其中[d]是数据的空间维度,[t]是迭代次数;基于锚点的算法的计算复杂度[7]是[O(m2n)],所以本文方法的计算复杂度是[O(dn2t)]+[O(m2n)],且m是聚类后得到的聚类中心个数,[m?n],所以本文方法的计算复杂度是远小于原始基于图的半监督分类方法的计算复杂度[O(n3)]。

4 实验结果与分析

本文在Matlab R2012a下计算机内存为2 GB,CPU为Intel Core i3,频率为2.53 GHz的机器上运行实验。实验采用的遥感图像是IKONOS卫星图像,IKONOS卫星图像包含一个全色波段,分辨率为1 m,四个多光谱波段,分辨率为4 m。图像大小为400×400,实验中对四个多光谱波段构成的遥感图像进行分类,3个RGB多光谱波段构成的真彩色图像如图1所示。根据实验区的特点,具体样本分类类别如表1所示。

图1中最左侧两片颜色灰白的区域是水泥建筑场地,右上侧灌木林中间的一个蓝色区域是一个房屋,这两片区域在本文实验中都归为“公路居民区”类别。因此本次实验样本类别个数为:“农田”像元点数32 433,“荒裸地”像元点数41 825,“植被”像元点数67 978,“公路居民区”像元点数17 764。

原文方法采用K?means聚类算法,不适应对遥感图像聚类,所以本文对遥感图像的分类结果并未与原文方法进行对比,而与遥感图像处理平台ENVI自带的监督支持向量机(SVM)方法进行对比。

本文实验SVM方法参数取值:核类型(Kernel Type)选择Polynomial,核心多项式的次数取4,Classification Probability Threshold取0,其他参数采用默认值。

本文实验中标记样本均为人工选取,实验分四次,四次实验中每类标记样本个数分别为5,20,50,100,每一次实验中所有实验方法均采用相同的标记样本,且每次实验都在上次已有标记样本的基础上添加新的标记样本。本文对实验结果的评价采用了Kappa系数和像元分类正确率(Pixel Classification Rate,PCR):

[PCR=正确分类像元数图像总像元数] (12)

图2和图3分别为每类标记样本为50和100时,本文方法和监督SVM方法的实验结果。遥感图像中样本分为四类,红色代表“荒裸地”的样本点,绿色代表“植被”的样本点,蓝色代表“农田”的样本点,黄色代表“公路居民区”的样本点。对比图2和图3,可以发现,本文方法优于监督SVM方法,图4中区域标号图像为1的区域是农田和没有农作物荒裸地区域,没有灌木植被,本文方法明确地分为农田和荒裸地两类,而SVM方法中将一部分样本错分为植被;在标号为2的区域与右上角的空白区域一样均为裸地,本文方法分类效果很好,而SVM方法分类效果显然较差,部分样本错分为农田类别;标号为3的区域中,有一排灌木植被在农田中间,即右侧的很少一部分还属于农田,可以看到还有农作物存在,SVM方法中将此少部分农田错分为裸地,本文方法大部分样本分类正确;在标号4的区域,可以看到是农田和裸地的分界处,而可以明显看到此处属于农田,只不过左侧部分不存在农作物,所以归为裸地类别,在SVM方法分类结果中许多样本点被错分为植被,而本文方法只有极少量样本分错,这是因为半监督学习的流形假设,处于很小局部区域内的样本可能具有相似的标记,此处的样本明显与邻近的农田相似性更大。

对遥感图像的分类精度的评价指标是以分类结果的混淆矩阵为基础,总体分类精度和Kappa系数都要通过混淆矩阵计算得到,而为了更直观地评价两种方法的分类效果和优缺点,本文列出了每类标记样本数为100的分类结果的混淆矩阵:两种方法在每类标记样本为100时的分类结果见表2和表3。

混淆矩阵中每行的总和为每一类样本的真实样本数,每一列的总和为分类结果中每一类的总样本数,括号内的值为混淆矩阵对角线的和,即分类正确的样本总数。漏分误差即每类真实样本中没有被正确识别出来的样本比例;错分误差为分类结果中其他类别样本被错分为此类的样本占总和的比例。

通过混淆矩阵的数字可以直观地看到,本文方法的每一类样本的错分误差都小于SVM方法的错分误差;本文方法对“植被”类别的分类正确率不如SVM方法的分类结果,但本文方法对细节处的分类效果更优于SVM方法,例如在图4中右侧的灌木林,本文方法的分类结果中,琐碎的极少量的裸地都被分出来;“荒裸地”和“农田”类别的样本分类正确率都明显优于SVM方法;而“公路居民”类别正确率低于SVM方法,由混淆矩阵可以看到是错分为“荒裸地”的样本较多,这是因为图4中最左侧的居民区建筑因为曝光太强,错分为“荒裸地”; “公路居民区”类别和“农田”类别样本差别明显,本文方法把“公路居民区”错分为“农田”的样本数为零,而SVM方法的错分数是9,本文方法对类别“公路居民区”和“农田”之间的区分更优;本文方法总体精度和Kappa系数也明显高于监督SVM的。具体的分类结果统计如表4所示。

从表4可以看出,本文方法分类结果明显优于监督SVM方法,而监督SVM方法是ENVI软件的监督分类方法中效果最优的方法[8],且监督SVM方法在小样本时具有良好的分类效果。但半监督的学习方法,结合无标记样本,优于监督学习方法,提高了分类性能。如标记样本数较少,为5和20时,无标记样本作用明显,分类精度和Kappa系数提高较大。通过观察图像和实验发现,本此实验的遥感图像中样本比较复杂,地物交错比较严重,边界过度不明显,不同于城市居民区边界清晰,这就给分类增加了难度,这也是分类精度不是很高的原因之一。实验结果验证了本文方法在遥感图像分类中的有效性,相比监督SVM方法获得了更好的分类效果。

本文方法在图像聚类选取锚点时采用mean shift聚类算法,聚类样本数160 000,平均用时9.4 s。原文[9]方法采用K?means聚类算法选取锚点,文中给出了两次实验结果中的聚类时间,7 291个样本聚类时间是7.65 s;630 000个样本聚类时间是195.16 s。因此mean shift聚类算法相比K?means算法缩短了聚类时间。

5 结 语

基于图的半监督图像分类方法通常因为数据规模大而导致内存空间不足和分类时间过长,而遥感图像通常规模较大且地物复杂、信息量大,所以影响了其在遥感图像分类中的应用。本文首先采用mean shift算法对遥感图像聚类得到锚点集,利用锚点集和标记样本集建图,缩小了图规模,降低了计算复杂度,其次通过分类方法得到锚点的类别信息,最后映射还原到整个样本集,得到遥感图像分类结果。AGR方法解决了大规模图像分类,本文采用mean shift算法缩短了锚点选取时间。实验结果表明,本文方法在遥感图像分类中获得了较好的分类结果,验证了其对遥感图像分类的有效性。

参考文献

[1] HUANG G, SONG S, GUPTA J, et al. A second order cone programming approach for semi-supervised learning[J]. Pattern recognition, 2013, 46(12): 3548-3558.

[2] XIE W, LU Z, PENG Y, et al. Graph?based multimodal semi?supervised image classification [J]. Neuro computing, 2014, 138: 167?179.

[3] BLUM A, CHAWLA S. Learning from labeled and unlabeled data using graph mincuts [C]// Proceedings of 2001 International Conference on Machine Learning. San Francisco: ACM, 2001: 19?26.

[4] WANG F, ZHANG C. Label propagation through linear neighborhoods [J]. IEEE transactions on knowledge and data engineering, 2008, 20(1): 55?67.

[5] ZHOU D, BOUSQUET O, LAL T N, et al. Learning with local and global consistency [J]. Advances in neural information processing systems, 2004, 16(4): 321?328.

[6] ZHU X J, GHAHARMANI Z, LAFFERTY J. Semi?supervised learning using Gaussian fields and harmonic functions [C]// Proceedings of 20th International Conference on Machine Learning. Menlo Park: AAAI, 2003: 912?919.

[7] LIU W, HE J, CHANG S F. Large graph construction for scalable semi?supervised learning [C]// Proceedings of the 27th International Conference on Machine Learning. Haifa: ACM, 2010: 679?686.

[8] 闫琰,董秀兰,李燕.基于ENVI的遥感图像监督分类方法比较研究[J].北京测绘,2011(3):14?16.

[9] YU G, ZHANG G, DOMENICONI C, et al. Semi?supervised classification based on random subspace dimensionality reduction [J]. Pattern recognition, 2012, 45(3): 1119?1135.

[10] CHENG Y. Mean shift, mode seeking, and clustering [J]. IEEE transactions on pattern analysis and machine intelligence, 1995, 17(8): 790?799.

[11] WANG Y, CHEN S, ZHOU Z H. New semi?supervised classification method based on modified cluster assumption [J]. IEEE transactions on neural networks and learning systems, 2012, 23(5): 689?702.

监督分类范文第3篇

关键词 高光谱遥感 图像处理 分类

中图分类号:TP751 文献标识码:A

1高光谱遥感的简介

高光谱遥感技术是上世纪80年展起来的一种新兴的遥感技术,高光谱遥感利用很多窄的电磁波段(通常波段的宽度小于10nm)从感兴趣的物体中获取图像数据,一般它是在电磁波谱的可见光,近红外,中红外和热红外波段范围内,设置了几十甚至几百个连续波段,其光谱分辨率可高达纳米(nm)数量级。由于许多地表物质的吸收特性仅表现在20~40nm的光谱分辨率范围内,高光谱遥感图像可以识别在宽波段遥感中不可探测的物质。现在,遥感应用领域也更加拓宽,涉及全球环境,土地利用,资源调查,自然灾害,以及星际探测等方面。

遥感图像分类一直是遥感研究领域的重要内容,如何解决多类别的图像的分类识别并满足一定的精度,是遥感图像研究中的一个关键问题,具有十分重要的意义。

2高光谱遥感图像的分类方法

依据是否使用类别的先验知识,可分为监督分类和非监督分类。

2.1非监督分类

非监督分类是指人们事先对分类过程不施加任何的先验知识,而仅凭遥感影像地物的光谱特征的分布规律,随其自然地进行盲目的分类;其分类的结果,只是对不同类别达到了区分,但并不确定类别的属性;其类属是通过事后对各类的光谱响应曲线进行分析,以及与实地调查数据相比较后确定的。非监督分类主要的方法有K-均值聚类,ISODATA分类等。

K均值分类方法属于动态聚类法,其假定被用来表示样本空间的聚类中心的个数是预先知道的,这种假定本身在某种程度上限制了@一类方法的利用,它使聚类域中所有样本到聚类中心的距离平方和最小,这是在误差平方和准则的基础上得到的。K均值分类方法简便易行。这种方法的结果受到所选聚类中心的数目和其初始位置以及模式分布的几何性质和读入次序等因素的影响,并且在迭代的过程中又没有调整类别数的措施,因此不同的初始分类可能会得到不同的分类结果。

ISODATA分类又叫做迭代自组织数据分析技术,基本思想是通过设定初始参数而引入人机对话环节,并使用归并与分裂的机制,当某两类聚类中心距离小于某一阈值时,将它们合并为一类,当某类标准差大于某一阈值或其样本数目超过某一阈值时,将其分为两类。在某类样本数目少于某阈值时,需将其取消。

非监督分类的主要优点是无需对分类区域有广泛地了解,仅需一定的知识来解释分类出的集群组;人为误差的机会减少,需输入的初始参数较少。但是无监督分类需要对其结果需进行大量分析及后处理,才能得到可靠分类结果。

2.2监督分类

监督分类就是先用某些己知训练样本让分类识别系统进行学习,待其掌握了各个类别的特征后,按照分类的决策规则进行分类下去的过程。监督分类又称训练场地法,是以建立统计识别函数为理论基础,依据典型样本训练方法进行分类的技术。监督分类的主要分类方法有最大似然法、贝叶斯方法、K近邻法等。

最大似然比判决分类方法是建立在贝叶斯准则基础上的,其分类错误概率最小,是风险最小的判决分析,是典型的和应用最广的监督分类方法,偏重于集群分布的统计特性,并假定训练样本数据在光谱空间服从高斯正态分布。该分类法错误最小精度高,是较好的一种分类方法。不足的是传统的人工采样方法工作量大,效率低,加上人为误差的干扰,使得分类结果的精度较差。

最小距离分类法又称光谱距离,是用特征空间中的距离表示像元数据和分类类别的相似程度,在距离最小(相似度最大)的类别上对像元数据进行分类的方法。

K近邻分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别。K近邻算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

有监督分类的主要优点是可充分利用分类地区的先验知识,预先确定分类的类别;可控制训练样本的选择,并可通过反复检验训练样本,以提高分类精度。但是人为主观因素较强;只能识别训练样本中所定义的类别,对于因训练者不知或因数量太少未被定义的类别,监督分类不能识别,从而影响分结果。

3结束语

监督分类和非监督分类的根本区别点在于是否利用训练区来获取鲜艳的类别知识,监督分类根据训练区提供的样本选择特征参数,建立判别函数,对待分类点进行分类。相比而言,非监督分类不需要更多的先验知识,它根据地物光谱特性进行分类。

参考文献

[1] 杜培军,夏俊士,薛朝辉,等.高光谱遥感影像分类研究进展[J].遥感学报,2016, 20(2):236-256.

[2] Rahman S A E. Hyperspectral Imaging Classification Using ISODATA Algorithm: Big Data Challenge[C]// Fifth International Conference on E-Learning. IEEE, 2015:247-250.

监督分类范文第4篇

【关键词】高分辨率遥感影像;非监督分类;监督分类;最大似然;分类精度

引言

近年来,随着航天技术、传感器技术、数字图像处理技术的发展,遥感正朝着三高(高空间分辨率、高光谱、高时相分辨率)和三多(多传感器、多平台、多角度)方向迅猛发展[1]。高分辨率遥感影像的分类问题在遥感应用中越来越重要。高分辨率遥感影像分类方法由传统的分类方法发展到一些诸如人工神经网络、模糊聚类和决策树分类等新的分类算法。

1 高分辨率遥感影像分类的原理

1.1 高分辨率遥感影像分类的基本概念

遥感图像的分辨率简单来说就是成像系统对图像细节分辨能力的一种度量,也是图像中目标细微程度的指标,它表示景物信息的详细程度。本文所说的高分辨遥感图像是指高空间分辨率、高时间分辨率、光谱分辨率的遥感图像。高分辨率遥感图像分类是遥感分析与解译的需要。高分辨率遥感图像分类是基于图像内容检索的必然结果

1.2 高分辨率遥感影像分类的基本原理

遥感图像计算机分类以遥感数字图像为研究对象,在计算机系统支持下,综合运用地学分析、遥感图像处理、地理信息系统、模式识别与人工智能技术,实现地学专题信息的智能化获取。其基本目标是将人工目视解译遥感图像发展为计算机支持下的遥感图像理解。

2 高分辨率遥感影像分类方法的研究

2.1 非监督分类方法的研究

非监督分类(Unsupervised Classification)一种无先验(已知)类别标准的分类法。对于待研究的对象或区域,没有已知类别或训练样本作标准,而直接依据样品观测资料的内在联系进行分类。非监督分类的理论依据是遥感图像上的同类地物在相同的表面结构特征、植被覆盖、光照等条件下,应当具有相同或相近的光谱特征,从而表现出某种内在的相似性,归属于同一个光谱空间区域;不同的地物,光谱信息特征不同,归属于不同的光谱空间区域[2]。

非监督分类最常用的统计分析方法是聚类分析,对于遥感图像进行聚类分析,通常是按照某种相似性准则对样本进行合并或分离,确定一些描述点与点之间的联系程度的统计量即类似度。非监督分类中最常用的方法有ISODATA,K-均值聚类等方法。

2.2 监督分类方法的研究

监督分类根据已知训练场地提供的样本,通过选择特征参数,建立判别函数,然后把图像中各个像元点归化到指定类中的分类方法[3]。

监督分类的分类的思想是:首先根据类别的先验知识确定判别函数和相应的判别准则,其中利用一定数量的已知类别的样本(称为训练样本)的观测值确定判别函数中待定参数的过程称为训练或学习,然后将未知类别的样本的观测值代入判别函数,再依据判别准则对样本的所属类别做出判定。

有监督分类一般是在图像中选取有代表性区域作为训练区,由训练区数据得出各个类别的统计数据,然后根据这些统计数据对整个图像进行分类。它常用的分类方法有最小距离分类,平面多面体分类和最大似然分类方法

2.3 其他分类方法的研究

①决策树(Decision Tree)又称为判定树[3],是运用于分类的一种树结构。可以像分类过程一样被定义,依据规则把遥感数据集一级级往下细分,定义决策树的各个分支。决策树由一个根结点、一系列内部结点(分支)及终极结点(叶节点)组成,每一结点只有一个父结点和一个或多个子结点。其中的每个内部结点(internal node)代表对某个属性的一次测试,每条边代表一个测试结果,叶结点(leaf)代表某个类(class)或者类的分布(class distribution)。决策树算法中比较成熟的有ID3、C4.5、CART、SLIQ以及SPRINT等。

②人工神经网络(Artificial Neural Networks,ANN)是人们在模仿人脑处理问题的过程发展起来的一种人工智能信息处理理论,它通过大量的称之为神经元的简单处理单元构成非线性动力学系统,对人脑的形象思维、联想记忆等进行模拟的抽象,实现与人脑相似的学习、识别、记忆等信息处理能力。人工神经网络又可以分为反向传播(简称BP) 网络、径向基函数(简称RBF)网络、自组织特征映射的Kohonen网络、CP网络、Hopfield网络等,其中BP网络是一种用得较多的人工神经网络。

3 基于ERDAS软件的影像分类实验与分析

3.1 数据源和软件平台

本次试验的数据源采用2005年山东省胶州市2.8m多光谱和0.7m全色Quick- Bird融合后的遥感影像,并以当年胶州市地形图为参考进行分类结果的精度评价。

软件平台选用ERDAS IMAGINE 9.1 ,它是美国ESRI 公司的产品, 具有友好、灵活的用户界面和操作方式及多种影像分类方法 。

3.2 传统分类方法分析

①遥感影像融合是一种通过高级影像处理技术来复合多源遥感影像数据的技术,其目的是将单一传感器的多波段信息或不同类传感器所提供的信息加以综合,消除多传感器信息之间可能存在的冗余和矛盾,加以互补,降低其不确定性,减少模糊度,以增强影像中信息透明度,改善解译精度、可靠性以及使用率,以形成对目标完整一致的信息描述。:

②应用非监督分类方法进行遥感影像分类时,首先需要调用系统提供的非监督分类方法获得初始分类结果,而后再进行一系列的调整分析。

4 分类精度评价

分类精度是指分类图像中的像元被正确分类的程度[4]。现在,衡量分类精度最广泛的方法是由congalton 提出的误差矩阵法。分类精度主要指标有生产精度、用户精度、总体精度、漏分精度、错分精度和Kappa 系数等[6]。为了评价分类试验精度,随机选取了140 个样本点,建立混淆矩阵,计算其生产者精度、用户精度及Kappa 系数。

本次试验采用最大似然监督分类、马氏距离监督分类和最小距离监督分类三种不同的分类方法进行分类精度评价。表4-1为精度评价表:

5 结束语

①运用1SODATA算法进行非监督分类,虽然非监督分类过程的自动化程度较高,但其分类精度没有监督分类高,分类效果较差,监督分类效果较好。

②可以从评价分类精度实验结果分析中看出,无论是总体精度还是Kappa系数,最大似然分类方法的分类精度最高,最小距离分类方法的分类精度次之,马氏距离分类方法的分类精度最差。

参考文献:

[1]李德仁.论21世纪遥感与GIS的发展[J].武汉大学学报,2003,28(2):127-131.

[2]袁金国.遥感图像数字处理[M].北京:中国环境出版社,2006.

[3]杜培军.遥感原理与应用[M]. 北京:中国矿业大学出版社,2006.

[4]杜凤兰、田庆久、夏学齐等.面向对象的地物分类法分析与评价.遥感技术与应用.2004,19(1),No.2:20.

[5]党安荣.ERDAS Imagine遥感图像处理方法[M].北京:清华大学出版社,2008.

监督分类范文第5篇

【关键词】遥感影像专题图制作; 影像融合; 影像裁剪; 影像分类

【中图分类号】G4【文献标识码】A【文章编号】1672-5158(2013)07-0357-01

一、整体思路

首先,纵观所有的数据,有分辨率为30M与120M的六个波段TIFF格式数据,还有一张10M分辨率的SPOT的影像,它包含影像投影信息,大地坐标和分辨率。确定专题图课题为制作地物分类专题图。

专题地图是突出反映一种或几种主体要素的地图,这些主体要素多是根据专门用途的需要确定的,它们应表达得很详细,其它的地理要素则根据表达主体的需要作为地理基础迭绘。

由于所给数据各波段的数据时分开的,但是要进行地物分类需对各波段的数据进行综合判断。所以第一步应该将各个波段的图像数据分为左右片,分别进行叠加处理,得到地物区分较为明显的彩色图像。

而在ERDAS在实现数据处理时,对于TIFF格式文件的处理较不完善,故在各单波段数据叠加后形成叠加影像输出时,应更改数据格式为IMG格式,以方便数据的处理。

我们又可以看到所给数据是包含左右片的,而且左右片相对于基准的SPOT影像是不完整的,所以要进行地物分类便应事先将左右片进行拼接。然而拼接工作进行时,由于左右片在形成时有一定的畸变,拼接过程的直接进行可能较为困难。所以,在拼接工作进行以前,应先进行左右片进行纠偏工作,这里是将SPOT卫星影像作为基准片对叠加后的左右片进行几何纠正。将纠正后的左右片进行拼接,便能得到完整的彩色地区影像。

由于拼接以后得到的影像可能在接边处会有不规则出现,故在拼接完成后应对影像进行裁剪,形成较为规则的影像。

在上述前期工作完成后,便可以进行分类的工作了。这里有两种分类,一种是监督分类,另一种是非监督分类。对地物进行监督分类,可粗略的分为两步:一、分类模板的采样;二、影像分类。在模板的采集过程中,尽量找具有代表性的地物特征,并在图像分类完成后运用卷帘等观察分类情况,若不理想可以更改分类模板从新进行分类,直到得到符合要求的分类图像为止。非监督分类就是运用一定的算子对图像进行统计分类,由系统自动完成分类工作,不需要人工制作分类模板。

进行分类工作的原因是,卫星影响上的信息量过于杂乱,我们只需要了解一些感兴趣的部分时,便可以将卫星影像中感兴趣的信息分为几类,然后运用监督分类或非监督分类将卫星影像简约成较为直接明了的地图。

分类完成后,工作就要接近尾声了。接下来就是要进行专题图的优化补充了,设定边框,增加比例尺、图例、指南针、标题等以后,一幅较为粗略的专题图便完成了。

二、地图制作的过程

(一)准备阶段

准备阶段主要是要进行分类的数据准备完全,实习所给的数据只有6个波段的数据以及一幅SPOT影像。由于分类过程中是针对每个波段来考虑的,所以,第一步应该是将这六个波段的图像叠加起来。得到两幅彩色的卫星左右片影像。并影像进行叠加完成后应注意将数据的输出形式转为image格式。

由于卫星影像在成像过程中,相对于地面是有偏差的,而SPOT卫星影像较为准确,所以需要运用Spot影像进行几何校正处理。

几何校正初期,由于所给SPOT影像是没有赋予坐标以及投影信息的,要将两幅图联系起来,则应先给SPOT影像赋予投影信息后,再进行几何校正处理。

得到左右片的校正影响后,专题图不可能是两幅图,为了将成图做到最大的范围,就必须将两幅图拼接起来。在拼接完成后,由于TM影像的几何精度相较于SPOT影像是不够精确的,故可以在成图后将拼接后的图像与SPOT影像进行融合处理,得到精度较高的图像。并在一下的分类环节武将融合后与未经融合的TM影像均进行分类处理,得到将得到的结果进行比较,并分析差异性。

而且,得到的图像是不规则的,故在融合完成后,拼接后影像以及融合后影像均进行裁剪得到规则的矩形图像。通过比较可知,融合后的影像精度明显偏高。

(二)分类阶段

分类阶段主要进行的有两个方面,一个是监督分类一个是分监督分类。

1.监督分类

监督分类首先要进行的就是分类模板的的获取,这里采用的是利用AOI绘图工具在原始图像获取分类模板信息。模板获取以后应对模板进行评价处理,主要是对于模板的可能性矩阵的检查。

AOI训练区的像元应绝大部分都落在类别之中(比例不能小于85%)。不断修改分类模板,直至符合要求即可进行监督分类工作。

分类完成后,需要进行分类精度评估,来评定分类的效果如何,选定至少250个随机点进行检查分类的正确与否,并统计出分类的精度百分比。

在模板的形成过程中,由于有类的合并或删除等操作,会照成影像中有多个0值类的情况,这样在分类图像精度评定完成后,应对图像进行RECODE处理,将不需要的0值类都归为0,并将有用的类别重新排号,这样也便于以后专题地图的制作。RECODE操作也可以对于那些区分不是很明显的类别进行合并。

在以上的操作完成后,可以看出分类得到的图中,噪点较多,这时便应进行分类后的处理操作了,分为聚类统计、过滤分析以及去除分析。在处理完成后,可以明显了解处理后的图像噪点较少。后续过程中,若对分类结果还是叫不满意,可以运用填充工具手动将图像进行修改。

2.非监督分类

非监督分类过程较为简单,先在ERDAS图标面板工具条中点击Classifier,单击Unsupervised Classification选项,在弹出的对话框中设置相关选项即可。

(三)专题图制图阶段

专题图的制图过程主要运用的是ERDAS中的专题地图编辑器(Map Composer),其用于产生地图质量的图像和演示图,这种地图可以包含单个或多个栅格图像层、GIS专题图层、矢量图成和注记层。同时地图编辑可以允许自动生成文本、图例、比例尺、符号及其它制图要素。

这一阶段的内容主要是在图中添加方里网、比例尺、图例、指南正以及标题。

首先要准备一个空的制图文件,来进行后去的制图工作。其次便是运用Annotation中的图标来确定专题制图范围,加入方里网、比例尺、指南针以及标题。

最后得到专题地图如下图(这里所用的图是未融合的分类图像):

三、流程图

以下的流程图只是涵盖的监督分类的流程,非监督分类主要就是运用Classifier中的Unsupervised Classification功能,操作较为简单,这里就没有具体的绘制流程图。

参考文献

[1] 党安荣,王晓林,陈晓峰,张建宝.ERDAS IMAGINE遥感图像处理方法[M].北京:清华大学出版社,2009

监督分类范文第6篇

关键词:高分辨率 遥感影像分类 监督分类法 面向对象分类法

中图分类号:TP751 文献标识码:A 文章编号:1007-9416(2016)10-0105-02

土地利用很大程度上决定着人类的生产和生活,同时人类活动也改变着土地利用类型的分布和属性。随着海洋资源的进一步开发,沿海地区作为开发海洋基地的作用愈显重要。因此,科学地进行土地利用分类,有助于考察岛陆土地利用状况,满足调查研究以及制图的需要,也有利于合理制定沿海地区的经济建设,可持续地开发和使用海洋资源[1]。

遥感技术是一种信息时代的产物和工具,具有周期动态性、信息量丰富、获取效率高等优势。随着遥感技术的日益成熟,图像质量如空间分辨率和光谱分辨率得到很大提高。高分辨率遥感影像有着传统的遥感影像不存在的特点,如空间分辨率高、时间分辨率高、信息量大、所包含的地物的几何和纹理信息更加明显、能提取地物三维信息等特点[2]。针对高分辨率遥感图像所具有的特性,本文采用监督分类法及面向对象分类法对研究区土地利用情况进行监测及分类分析。

1 数据准备与处理

1.1 实验数据概况及实验数据的处理

实验数据选取在山东省威海市部分沿海地区,本文采用的数据源为高分一号(GF1)遥感影像,空间分辨率为2m,已完成辐射校正和几何粗校正基本处理。图1是经过2%线性拉伸后的图像。

1.2 遥感图像分类

地物在多光谱图像上的亮度体现了地物的光谱特征,不同地物在同一波段上的亮度值不同,同时在各个波段图像上亮度的呈现规律也不相同。因此,可以通过亮度特征的提取,对特征空间的划分,达到区分不同地物的目的,进而得到图像分类的结果。遥感图像分类就是利用计算机对遥感影像中各类地物的光谱信息和空间信息进行分析、识别,选取特征,将图像中每个像元按照某种规则或算法划分为不同类别,最后得到遥感影像与实际地物的对应信息,从而实现的遥感影像分类。ENVI中基于光谱分类的方法有非监督分类和监督分类。

1.2.1 非监督分类

非监督分类,又称聚类分析,它无需训练样本,是计算机以图像的统计特征为根据进行的自动分类。ENVI软件执行非监督分类时,人为控制地将地物类数定义为多于目标类数的值,分类之后通过参照原始影像进行目视解译将部分类别进行删除或合并,最终得到分类结果,常用循环集群法和K-均值聚类法。由于非监督分类存在不能确定类别属性的特点,监督分类法应用更加广泛。

1.2.2 监督分类

监督分类,又称训练分类法,利用已知样本的像元特征去识别未知类别的像元所属类别。ENVI分类中,分析者首先选取图像每种地物的训练区,计算机计算每种训练区的统计信息,进行像元和训练样本的对比分析,按照多种不同规则将其归类到最相似的训练样本中。目前常用的监督分类法有平行六面体、马氏距离、最小距离和最大似然。同时基于统计模式识别技术的分类法如支持向量机和模糊分类应用也较多。

针对实验区特点和原始数据图像的土地利用实际情况,把GF1遥感图像中定义为6种土地利用类别:沙滩、裸地/道路、林地、耕地、居民地、水体。文中用到:最小距离,最大似然,支持向量机监督分类器对研究区进行土地利用分类。为了最终的结果精度u价,文中所有分类器采用统一样本。表1为训练样本的可分离度计算。可分离度的值大于1.8时说明各类样本可分离性较好。

分类后对原始分类图像进行聚类、过滤、去除后处理工作,并采用总体分类精度、Kappa系数评定分类精度,发现支持向量机分类精度最高。图2-1至图2-3为3种方法分类处理后结果图像。

1.3 面向对象分类研究

鉴于高分辨率影像的光谱信息并不特别丰富,且有光谱相互影响及“同物异谱,同谱异物”的现象,面向对象分类法应运而生。面向对象是一种智能化的自动影像分析法,它的分析单元不是单个像素,而是整个目标对象[3]。特征的定义和分类均是基于目标进行的。经过研究实验表明,此分类法更适用中高分辨率,多光谱和全色影像。面向对象分类流程图如图3所示。

1.3.1 多尺度影象分割

面向对象多尺度分割时,选取的尺度会影响生成对象的大小、数量及信息提取的精度。高尺度分割时,生成较少的图斑,图斑的面积较大;反之亦然。文中采用Feature Extraction对影像进行基于样本的分割,使用边缘的分割法,采用影像临近像素的纹理、颜色等信息检测图像边缘,同时选定最合适的参数值,分割阈值为60.0,合并参数值为85.0。

1.3.2 基于样本的图像分类

经过分割与合并后,进行样本的选择以及样本属性的设置。本文选取光谱、形状与纹理特征,色彩空间和波段比值等特征用于之后的监督分类。使用最近邻分类器,它需选择训练区样本,能更好的处理多维特征空间的联系。面向对象分类结果及样本选取如图4所示。

2 分类精度评价

遥感图像进行分类后,常用混淆矩阵对分类结果精度进行评价。根据混淆矩阵能够计算出总体精度和Kappa系数。Kappa系数避免了混淆矩阵中像元类别的微小变动导致其百分比变化的缺点,能够评价整个分类图的精度。Kappa分析的评价指标为K统计[4],公式为:

式中:是用于精度评价的像元总数;是误差矩阵中的总列数;是误差矩阵中第正确分类的数目;和是第行与第列像元总数。表2为各分类方法分类精度对比。

3 结语

本文利用ENVI软件采用监督分类和面向对象分类等单分类器对研究区的GF1影像进行了土地利用分类。从分类结果及精度评价指标得出:最小距离,最大似然分类器在分类过程中出现居民地与裸地、水体与裸地、沙滩与居民地的误分现象;支持向量机分类器存在裸地与水体的误分现象;基于面向对象的分类精度最好,错分误分现象最小。

针对传统的基于像素统计特征分类方法存在的种种不足,面向对象的分类方法充分利用影像地物的光谱、几何、结构和高分辨率遥感影像丰富的空间信息,使高分辨率遥感影像自动识别与提取的精度得到极大提高。因而,面向对象分类法值得进一步推广和研究。

参考文献

[1]付佳,黄海军,杨曦光.基于 ENVI的唐山湾三岛土地利用遥感分类方法的比较分析[J].海洋科学,2014,38(1):20-26.

[2]黄海军,程新文,李柏鹏等.基于ENVI的高分辨率遥感图像应用实验研究[J].地理空间信息,2007,5(3):41-43.

[3]孙晓霞,张继贤,刘正军.利用面向对象的分类方法从IKONOS全色影像中提取河流和道路[J].测绘科学,2006,31(1):62-63.

[4]段新成.基于BP人工神经网络的土地利用分类遥感研究[D].北京:中国地质大学,2008:49-50.

[5]徐灵,侯小风.基于区域生长的遥感影像河流提取[J].测绘与空间地理信息,2015,38(3):198-200.

[6]闫琰,董秀兰,李燕.基于ENVI 的遥感图像监督分类方法比较研究[J].北京测绘,2011,3(3):14-16.

收稿日期:2016-09-09

*国家自然科学基金项目(41561087):多源遥感影像的分层特征信息提取与宁夏生态环境地物目标分类识别。

作者简介:王胜男(1990―),女,汉族,河南商丘人,宁夏大学研究生,现从事遥感图像处理研究;汪西原(1964―),女,汉族,陕西西安人,教授/硕

监督分类范文第7篇

关键词:遥感影像 城市专题信息 专题图制作 影响因素 图像分类

中图分类号: TP75 文献标识码: A 文章编号:

1、引言

近年来,遥感影像处理水平的不断提高,为其开辟了更广阔的应用空间。在城市规划领域,利用遥感技术可以实现土地信息的专题提取,城市环境的规划建设等,这在国内外许多城市已经形成很好的范例。将遥感技术应用到城市信息提取中,动态监测城市的土地利用面积,优化城市结构,不仅可以实现城市的整体规划,也可以调整城市布局,改善生态环境,提高城市的可持续发展潜能[1]。

本实验采用宜昌市的Landsat TM图像,包括1、3、4、5、6、7等波段的数据,每一波段数据分为左右两片;同时利用已知投影信息和大地坐标文件的全色SPOT图像作为地理参照图来进行TM图像的几何纠正。

2、基本方案概述

本次实验采用ERDAS IMAGING 9.2软件进行:首先将实验影像数据转换成软件默认的IMG格式,然后将TM影像多波段叠加生成多光谱影像并以SPOT影像为基准进行几何纠正,进而将成果图左右部分进行镶嵌并裁剪成规则形状,最后将结果与SPOT影像融合,并进行图像增强、分类、制作专题图[2]。流程如图1所示。

图1流程框图

3、专题信息提取与制图过程

3.1 数据预处理

利用ERDAS的Import模块将实验图像文件转换为IMG 格式,然后利用LayerStack Bands Data模块将TM各个单波段图像进行叠加,生成信息量大的多光谱图像,便于后续处理。

3.2 几何纠正

TM影像存在几何畸变,因而在进行城市专题信息提取之前,我们需要使用经过配准的SPOT高分辨率影像对TM影像进行几何纠正。这里可以采用二次多项式的方法进行纠正,这种方法对于线性和非线性变形都能起到作用。利用ERDAS的Geometric Correction模块实现几何纠正,以六个同名点、六个检查点参与解算,要求检查点残差、中误差均小于1,然后进行重采样,获得纠正后影像。如果纠正后的影像存在严重畸变,则需要重新进行同名点的选取,直至满足要求为止。

3.3 图像镶嵌

给定的TM影像分为左右两部分,因此在进行后续操作之前,需要在几何上将两幅图像拼接在一起,即图像镶嵌。镶嵌时需要保证左右两部分反差一致,色调相近,没有明显的接缝,同时需要拼接影像的成像条件相近[2]。最后选择合适的投影信息、地理坐标信息即可完成图像镶嵌。

3.4 图像裁剪

经上一步图像镶嵌得到的图像并不是规则图形,为对感兴趣区域进行规则化,我们需要对图像进行裁剪。利用Data Prep模块中的Subset Image功能对增强后的图像进行裁剪,使之成为规则的矩形。

3.5 图像融合

图像融合可以突出我们所感兴趣的信息,便于更好的分类。我们将多光谱的TM影像与高分辨率的SPOT影像进行融合,综合两种图像的优势,使成果既有TM影像的光谱信息,又有SPOT影像高分辨率的特点,提高图像的效果与质量[3]。

3.6 图像分类

图像分类即为根据不同的地物波谱特性对遥感影像中的要素进行分类,可以采用监督法和非监督法进行。ERDAS是利用Classifier模块来实现分类的。首先对影像进行非监督分类,了解图像的光谱空间聚类信息,为后续的监督分类提供指导。接着进行监督分类,提取专题信息并利用模糊矩阵进行样区选取精度评定。一般要求类别选取精度高于85%。分类完成后,利用目视判读与精度评价相结合的方法,选择融合前后分类效果较好的图像作为制作专题地图的底图。

3.7 专题图制作

利用GIS Analysis模块的clump和eliminate工具消除成果图上的噪声效应,然后开始绘制专题图。点击Composer模块的New Map Composition,设置地图版面的大小、单位等,在弹出的Map Composer窗口中点击Annotation/Tools,调出工具板,绘制地图。一是要根据我们的制图目的决定图上哪些要素需要详细表达。还要根据研究需要和制图区域的特征生成图层、公里格网、文本、图例、比例尺等图像整饰内容[4]。

4、影响因素分析

在城市专题信息提取流程中,几何纠正是其后各项操作的基础,因此几何纠正准确与否关系到后续实验的精度。通过实验,笔者总结了几何纠正精度的相关因素如下:其一,基准图像即配准后的SPOT的精度;其二,所选控制点的精度;其三,选的几何纠正的模型的适当性;其四,所选重采样的函数模型。由于实验原始数据的精度限制,一般只能从后三个方面来提高几何纠正的精度。因此,在纠正过程中,尽量均匀地选择控制点;提高选点精度,尽量选择明显的交叉点;选择适当的纠正和重采样函数模型都能提高几何纠正的精度。同时,在选择同名点的时候,尽量不要将图像放得过大,这样会导致图像的模糊,影响选点精度;也尽量不要选择水体边缘点,因为获取影像时相不同,水位也不一定相同。

对于影像镶嵌而言,主要是镶嵌边的选取以及镶嵌边的平滑和整体色调的调整这三个步骤可能会影响到精度。可以采取不同的方法组合多进行几次影像镶嵌,以寻求最适当的影像镶嵌方法。因为影像镶嵌是在几何纠正的基础上进行,要提高影像镶嵌的精度,就必须尽可能提高几何纠正的精度。还要注意消减影像镶嵌的痕迹,这与接壤边的选取,覆盖地区的颜色处理和过渡处理有关[4]。同时,在图像的镶嵌时,应该注意调整左右两张影像的亮度,使它们达到一致,必要时可以进行直方图的匹配来提高影像镶嵌的精度。

5、图像分类探究

图像分类是专题信息提取的核心。在本次探究中,笔者采用监督分类和非监督分类分别对融合前后影像进行分类处理,处理后的图像如图2所示。从目视判读来看,监督法分类的效果要优于非监督法分类,这是由于在监督分类的时候,人为干预的可能更多,更能有针对性地提高分类的精度。

融合前非监督分类融合前监督分类

融合后非监督分类融合后监督分类

图2 分类图像

本实验中,选取了两幅监督分类的结果进行精度评定,从精度评定Report得出,在融合前的监督分类中,总的分类精度为92.92%,在融合后的监督分类中,总的分类精度为90.80%。从定量的数据可以看出,融合前图像的分类精度优于融合后的图像,究其原因,可能是融合后,图像的各类地物之间的差别没有融合前明显,因此,在选择样区时易受干扰,致使选择样区的准确度不高。同时,融合后影像中的噪点比较多,不利于专题图的制作和判读的要求。

通过分类中多次的实验和思考,笔者认为,非监督分类的分类精度主要与以下因素有关:其一,所获得的影像的数据精度;其二,所选择的用于分类的波段类别;其三,分类过程中的参数设置。其实,在分类的时候,还会发现非监督分类具有引导作用。比如说,两条河道会被分成两类,这提醒我们在对水体采样时要注意要将两条河道分别采样。可以说,非监督分类有效地指导了监督分类。

监督分类的分类精度则主要是受以下几个方面的影响:其一,所获得的影像的数据精度;其二,所选择的用于分类的波段类别;其三,分类样区的选择以及所分种类数;其四,分类函数的选取。

6、结束语

城市专题地图将欲强调的各种人文、资源、环境等信息作为地图的主题凸显出来,对于国家建设、科学发展、文化教育都有着不可忽视的作用。同时,作为获取土地利用信息的重要手段,高效、精确地提取感兴趣的城市专题信息是值得我们深入挖掘和探究的。

参考文献:

[1] 黎薇.基于遥感影像的城市绿地信息提取及分析[D].华东师范大学,2007.

[2] 孙家抦. 遥感原理与应用[M]. 湖北武汉:武汉大学出版社, 2009.

[3] 王恒中.小波分析在遥感影像融合中的应用研究[D].中南大学,2006.

[4] 胡堃.基于ERDAS9.1操作平台的遥感专题图制取[J].科技创新导报,2009,(6):20-21.

监督分类范文第8篇

关键词:黄河河口湿地信息提取分层提取

中图分类号:TP751 文献标识码:A 文章编号:1672-3791(2012)11(c)-0008-03

黄河河口湿地在黄河河口地区的生态系统平衡中有重要的作用,为了做好湿地需水量的准确评价工作,需要精确地获取黄河河口各个湿地类型的面积。本文基于遥感影像和已经具有的图件信息实现了对湿地各个类型的面积提取。在传统的遥感影像中,主要通过监督分类和非监督分类来获取地物的分类,本文在此基础上提出了通过分层提取的方法,获得了更加准确的湿地类型的面积。即首先根据地物的光谱特征采用模型法对有水的湿地进行提取,然后用非监督分类对其它湿地类型进行提取,最终得到了湿地类型分布图及其相应的面积。

1 研究数据

1.1 研究区域

黄河河口,是指以山东省东营市垦利县宁海为顶点,北起徒骇河口,南至支脉沟河口之间的扇形地域以及划定的容沙区范围。在本研究中,鉴于资料的完整性与可收集性,同时考虑到行政区的完整性和研究成果便于应用性,将占黄河河口面积主体地位的东营市作为研究范围,即北纬36°55′~38°10′,东经118°07′~119°10′,南北最大长123 km,东西最大长74 km,总面积7923 km2。

1.2 卫星遥感资料

通过对比各种卫星遥感数据源的优缺点和资料的可得性,选择Landsat/TM卫星遥感数据作为本项研究的数据源。Landsat/TM卫星遥感数据具有波谱分辨率较高,对地面水体和植被有较好的反映,另外经过分辨率融合的30 m空间分辨率也能够满足黄河河口景观特征参数提取的需要。为此本研究采用了黄河河口(莱洲湾幅)1992年的TM图像。

1.3 专题资料

专题资料包括图件资料和统计数据。其中图件资料包括东营市1∶5万地形图、东营市1∶10万土地利用图、东营市行政区划图以及东营市土壤图等;统计数据包括东营市土地详查变更资料以及相关自然及社会经济统计数据等。这些专题资料主要用以辅助进行遥感资料的纠正及分类处理。

2 遥感图像预处理

遥感图像的预处理是获取黄河河口湿地信息的第一步,也是非常重要的一步。为此,进行黄河河口湿地遥感信息的提取,首先要对1992年的TM图像进行预处理,预处理结果的好坏在一定程度上决定了信息提取的效果。

2.1 几何精校正

本研究中的几何精校正主要是借助于东营市1∶5万地形图,采用控制点校正的方式进行。

几何校正是将影像数据投影到平面上,使其符合地形图的投影系统。根据东营市1∶5万地形图的坐标系统和投影参数,投影为高斯—克吕格投影,东营市均处在20度带内,故选择投影参数为GK Zone20。进行几何精校正首先要选取地面控制点,这是几何精校正中重要的一步。为此,在本研究中每景影像中分别选择40个控制点进行校正,校正后误差均小于0.4个像元,这远远满足了误差控制在一个像元内的要求。

在图像处理过程中,进行全区坐标变换,要进行图像数据的内插,即数据的重采样。目前的重采样技术有三次卷积内插法、双线形内插法、最邻近法等。不同的方法各有特色,要选用合适的重采样技术。考虑到双线性内插法具有较高的空间位置精确性与适当的计算量,本研究中像元灰度值的重采样采用双线性内插法完成整幅图像的几何精校正。

2.2 研究区图像的选取

本项研究的研究区为黄河河口,即整个东营市的行政范围,是获得的是整景TM图像中的一部分,为此要进行研究区图像数据的提取。具体的提取过程是利用东营市的行政边界进行研究区图像数据的提取,也就是对东营市土壤图边界进行矢量化,将得到的边界文件校正后做掩膜进行图像的提取。

2.3 增强处理

(1)波段的选择。

TM图像各波段之间的信息存在相当程度的冗余,使用过程中必然存在相互干扰,为了减少这种问题,在信息处理时应该在选择较大波段信息的前提下,尽量选择相关性较小的波段进行分析,本研究中所用的TM图像各波段之间的相关性如表1所示。

表1中,从相关性看,TM4波段比较独立,TM5和TM7波段的相关性较高,TM1、TM2、TM3波段的相关系数都在0.90以上,说明相关性很高。由此,选择TM1、TM2、TM3中的一个波段,TM5、TM7中的一个波段和TM4波段。从方差分析看,表1中TM1、TM3、TM5三个波段信息量较大,其中TM3波段与其它的波段相比,它受大气的阴霾影响较小,影像的反差较好,分辨率较高,同时包含对叶绿素的吸收区,易于识别植被。最后经合成后目视效果对比,TM3、TM4、TM5合成后湿地类型边界清晰,易于识别。因此,TM4(赋予R通道)、TM5(赋予G通道)、TM3(赋予B通道)波段是本研究中最佳假彩色合成波段。

(2)图像的增强。

为了突出特定的地物类型,需要做特定方式的增强处理。目前,图像的增强方法存在很多种,每一种增强方法都存在一定的局限性,不存在一种对所有问题效果都较好的增强方法(李伯衡,1991)。在本研究中,图像的增强采取对原始遥感图像进行2%的线性拉伸,拉大不同地物之间的差异,这样提高了图像的对比度,增强了图像的层次感,具体见图2。

通过对比图1和图2,可以清晰地比较出图像增强前后遥感影像的差别。拉伸前,TM影像的色调比较灰暗,各湿地类型之间的色调差别较小,界限模糊,无法辨认各湿地类型,无法对其进行遥感解译。经过2%的自动线性拉伸后,各种湿地类型的色调差别较大,边界清楚,具有很好的层次感,利于进行遥感解译。可见,经过2%自动线性拉伸的遥感影像效果要好于未经增强处理的图像。

3 黄河河口湿地信息提取

常规的信息提取采用监督分类和非监督分类的方法进行。其中非监督分类方法是在分类之前排除人的干预,完全依据于地物的光谱反射数据,操作简单,易于实现,国内外的研究者运用这种方法已经进行了较多的案例研究(Jose A等,2000;S Le Hegarat-Mascle等,2000;Thomas H.C.Lo等,1986),但在实际应用中,由于存在“混合像元”、“同质异谱”、“同谱异质”等现象,使得非监督分类方法的精度不是很准确。

本研究中,根据黄河河口湿地地物的光谱特征以及黄河河口的特点,放弃了单纯传统的监督分类与非监督分类方法,对黄河河口湿地采用了分层提取的方法。

3.1 分类系统的确定

根据《全国湿地资源调查与监测技术规程》(中华人民共和国林业部,1997)及甘甫平等人的研究成果,该区的湿地类型和界定标准见表2。

3.2 黄河河口湿地信息的分层提取

目前的黄河河口湿地类型较为复杂,且多种湿地类别之间的光谱特征存在近似或者混淆的问题。但整个湿地类型中,都充满着水的三种类型是盐田、水库和虾蟹池,它们分布面积较广,面积比例较大,光谱特征与其它湿地类别有较大差异。为此,对黄河河口湿地信息的提取采用了分层提取的方法。首先,根据地物的光谱特征对盐田、水库和虾蟹池运用模型法进行提取,然后用对其它湿地类型运用非监督分类法进行提取。

(1)盐田、水库和虾蟹池提取模型的构建。

黄河河口湿地类型中,充满着水的三种类型是盐田、水库和虾蟹池,它们分布面积较广,面积比例较大,其光谱特征与其它湿地类别有较大差异,如图3所示。

由地物光谱曲线图分析可知,盐田、水库和虾蟹池三种类型的光谱特征相似,差别较小。但三种类型的光谱特征与其它湿地类型的光谱特征相比,差异明显。盐田、水库和虾蟹池的TM3、TM4、TM5波段,三者的光谱值骤减,TM3远大于TM5;其它湿地类型的光谱值则是先减小后增加,TM3小于TM5;当TM5与TM3相减后,其它湿地类型的光谱值为正值,而盐田、水库和虾蟹池的光谱值为负。由此,可将盐田、水库和虾蟹池同其它湿地类别区分开来。

为此,经过波段间的组合,根据光谱特征分析,建立了如下盐田、水库和虾蟹池的提取模型:

VII=TM5-TM3

通过将两时相的影像经过上述模型变换后,可获得模型指数图像(图4)。在图像中,水体和其它地物的光谱特征差别较大,水体的颜色几乎为白色,其它的地物的颜色为黑色。对于本次湿地类别的提取中,坑塘、河流以及渠道等水体由于面积较小或者水量分布不均,利用上面建立的提取模型无法进行完整的提取,因此,本研究所建立的模型只应用于盐田、水库和虾蟹池。对于盐田、水库和虾蟹池三种湿地类型的具体划分可以根据各自的形态特征进行划分。如虾蟹池间的边界较密集,呈条状;水库周围都有较清晰的水工建筑物如坝头等,且形状较规则;盐田由多个田块组成,呈方格状。

(2)ISODATA-人工交互合并及修正法。

目前的黄河河口湿地共有16种类型,除了利用上述模型进行提取后,还剩有13种类型,其中9种类型属于自然湿地。这些类型之间光谱混淆较为严重,无法利用光谱特征进行提取,为此采用非监督分类中的人工交互合并及修正法(ISODATA法)进行分类提取。先对整景影像进行分类再做mask,分类参数的统计包括了黄河三角洲行政界线内外的所有像元,这样得到的分类参数考虑了界线内外地物的整体性和界线外地物的光谱特征,其分类结果当然也更全面,更有代表性。(表3)

在进行黄河河口湿地类型的提取研究中,还有一项重要要素的提取就是海岸线的提取。本研究中采用卫星成像时的瞬时水边线作为海岸线。目前国内外学者在遥感影像上提取海岸线一般采用的方法是运用近红外波段阈值法来划分水陆边界。但是黄河河口存在着水体泥沙含量高,水深浅等特征,所以无法采用简单的阈值法来获取所需的海岸线。为此,本研究中采用非监督分类后的影像结合目视解译的方法进行提取。在遥感影像中,水域部分色彩单一,呈深蓝至黑色,而陆地部分颜色丰富,有较为明显的人工建筑(如虾蟹池、盐田等),同时,TM4、TM5、TM3波段组合也可加强水体与陆地的差异,这样可以准确地确定水陆界线。

将上述分层提取的湿地信息利用ENVI中的Overlay功能进行链接,便可得到黄河河口湿地类型分布图。

4 结语

本文主要对黄河河口湿地信息遥感进行了提取研究。通过几何校正、图像选取以及图像增强等方式进行了遥感影像的预处理,为准确地提取湿地信息提供了数据基础。在舍弃单纯的传统监督分类和非监督分类的前提下提出了一种利用分层提取地物信息的新方法:即首先对盐田、水库和虾蟹池等湿地类型根据地物的光谱特征采用模型法进行提取,然后其它湿地类型运用非监督分类法进行提取,最终得到了黄河三角洲1992年湿地类型分布图及其相应类型的准确面积。本研究采用的方法具有典型性,对其它滨海湿地的信息提取具有指导意义。

参考文献

[1] 方红亮.两种水稻种植面积遥感提取方案的分析[J].地理学报,1998,53(1):58-65.

[2] 甘甫平,王润生,王永江,等.基于遥感技术的土地利用与土地覆盖的分类方法[J].国土资源遥感,1999,42(4):40-45.

监督分类范文第9篇

1引言 海滨湿地是指发育在海岸带附近并且受海陆交互作用的湿地,是陆地生态系统和海洋生态系统的交错过渡地带,广泛分布于沿海海陆交界、淡咸水交汇地带,是一个高度动态和复杂的生态系统[1]。江苏盐城海滨湿地属于典型的淤泥质海岸湿地类型,由于海岸的不断淤长,海滨湿地植物覆被类型比较丰富多样,景观格局处于不断演变之中[2]。遥感技术是获取地表覆盖信息的有效技术手段,目前广泛用于湿地研究中并取得了显著的成果[3-5]。采用何种方法对湿地遥感信息进行有效提取,以达到理想精度要求,一直是湿地遥感研究的重要内容。目前,湿地遥感信息提取中难度最大的是对湿地植物覆被类型的有效识别,其方法研究成为湿地遥感信息提取的难点与热点[3-5]。而针对不同的遥感数据源,学者们采取的方法各异。如于欢等[6]选取ALOS遥感影像为数据源,通过对其波段的光谱及纹理特征进行分析,采用非监督、监督及面向对象分类方法,对三江平原湿地信息进行提取。那晓东等[7]以Landsat卫星影像为数据源,利用回归树集中挖掘分类规则对湿地类型进行分类研究。牛明香等[8]利用TM数据,提出了单红外阈值法和改进的监督分类相结合方法对湿地进行分类。从目前的研究进展来看,湿地遥感分类研究采用的数据源大部分都是TM、SPOT等影像,而利用ALOS数据的研究并不多。 本文针对江苏海滨湿地的时空分布特征,选择ALOS影像为数据源,其原因是保护区核心区面积较小,空间分辨率较高的ALOS影像更适合,而不选用波段与之相似的Landsat卫星数据。另外,相比于分辨率相同的SPOT等影像,ALOS影像在图像纹理特征方面,如反映地物类别空间特征的差异性和纹理信息的丰富程度均比SPOT5等影像强,并且小图斑的面积精度也优于SPOT等影像[9];从时间选择来看,由于11月份海滨湿地的盐蒿呈现红色,与其他湿地植被类型的色差比较明显,是湿地遥感信息提取的较好时机。而选用的ALOS数据在2006年11月9日恰好在海滨湿地过境,故采用分辨率高、性能好、价格低的秋季ALOS影像作为本次研究的数据源最为合适。 为此,针对海滨湿地植物覆被类型遥感信息分类难度大,以及湿地植物覆被类型之间的生态交错带信息难以正确识别的问题,综合考虑光谱信息、空间信息并附加知识规则和GIS规则,对海滨湿地进行遥感分类方法研究,为海滨湿地研究提供重要的科学支撑。 2研究区概况 江苏盐城部级珍禽自然保护区核心区是目前残留的典型淤泥质海滨湿地代表,具有丰富多样的湿地类型。该区域位于新洋港和斗龙港出海河之间[10],地理位置位于33°25′0″~33°42′40″N,120°26′40″~120°44′40″E,面积为203.57km2,基本保持自然景观状态。湿地植物覆被类型包括芦苇群落、大米草群落、盐蒿群落等[11]。研究区位置如图1所示。 3数据源 采用的数据为ALOS数据,重访周期为46d,卫星轨道为太阳同步。AVNIR-2传感器可以接收4个波段的数据,分别为蓝波段(0.42~0.50μm)、绿波段(0.52~0.60μm)、红波段(0.61~0.69μm)、近红外波段(0.76~0.89μm)。多光谱分辨率10m,全色波段空间分辨率2.5m。为了更准确地提取信息,还采用了其他相关辅助资料,包括1∶400000江苏省海岸土地利用图以及野外调查时38个点GPS数据。 3.1数据预处理 本文采用ENVI下的FLAASH模块对ALOS影像进行大气校正。FLAASH是基于MODT-RAN4大气校正模块,可以从多光谱遥感影像中复原地物的地表反射率,是多光谱能量影像反射率反演的首选大气校正模型[12]。影像几何校正通常选取图像上有定位识别明显的标志,如道路交叉点、河流岔口等GPS记录点为控制点。采用二次多项式变换和最邻近像元重采样的方法对原始影像进行几何纠正,RMS小于0.5个像元。 3.2湿地分类系统的建立 根据研究区湿地类型的特征,综合考虑遥感影像数据的可解译性,建立湿地土地利用/覆被分类系统,见表1。 4对ALOS影像的非监督分类 针对本研究区特点,海岸带地物在遥感影像上的光谱比较复杂。选择的训练区不可能包括所有的光谱类型,也就是说有一部分像元会出现漏分的现象。所以本文采用人机交互的非监督分类方法,算法是重复自组织数据分析技术(ISODATA)。 4.1分类的过程及结果 海岸带地物的波谱相关性较大,也就是“同物异谱”和“异物同谱”的情况比较多。鉴于这种情况,使用非监督分类时,一般设置分类的数目比最终分类数量多3~4倍,再进行合并,防止错分漏分,以提高分类精度。本次研究初始分类数定为30类,输出分类图像后再对30类地物进行合并,找到最佳的合并方案,然后再对其进行重新合并。把原始影像和分类的结果进行对比,并且参考1∶400000江苏海岸土地利用数据,对30类地物进行同类合并删减。合并时尽量遵循以下规则,尽可能地把地物归为:养殖塘、河流、芦苇、盐蒿、米草和光滩6类。利用上述规则,在ENVI中对非监督分类的图像进行重新归类,结果如图2所示。 4.2分类精度检验 精度检验是遥感分类的必备工作,通过精度分析可以清楚地发现哪些类别的分类精度还有待提高,从而改进分类模式,修改分类结果,提高分类精度。根据所选择的样本,大致为150个样本点,其中包括野外调查时38个点GPS数据,每类样本至少20个,在ENVI4.7软件的分类后处理中选择混淆矩阵法通过地表真实感兴趣区进行精度检验。经检验,总体分类精度为78.8786%,Kappa系数为0.7415,具体参数见表2。#p#分页标题#e# 从非监督分类后的精度验证可以看出,非监督分类的精度一般。地物类型之间尤其在米草、盐蒿、芦苇等草本植被类型间错分、漏分现象比较突出,其中米草错分误差达到33.21%,芦苇漏分误差达到26.47%。分析其原因主要有以下3个方面: (1)由于遥感影像光谱的复杂性,非监督分类这种纯粹的依靠光谱特征的分类方法在地物类型比较复杂的地区很难得到较高的精度[7]。 (2)米草、盐蒿、芦苇3种植被由于光谱比较类似,所以植被分类精度不理想。 (3)保护区北部人为管理区大坝内和养殖塘东界以西的区域部分,芦苇因为光谱的相似性被错分为米草或者盐蒿。因此要提高分类精度,就要对非监督分类后的结果进行改进。 5非监督分类后初始结果的改进 核心区北部人为管理区大坝内和养殖塘东界以西的区域被错分为米草和盐蒿的芦苇可以根据生态学知识和GIS规则进行修改,同理被错分为芦苇和盐蒿的光滩部分也可以用同样的方式修改。而对于3种植被的交错带的部分只能寻找新的特征向量来加以区分,所以根据分区分层分类法的思想可以把研究区化为3个小区域:交错带区、大坝以内养殖塘东界以西以及剩余区域。根据研究区的特殊性把非监督分类结果的修改分为下面两个部分,其流程如图3所示。 5.1基于知识规则的植被覆盖的细分 由于ALOS数据4个波段组成的特征空间有很高的相关性,不足以将核心区的地物很好地划分,导致初始非监督分类的精度不是十分理想。所以必须寻找新的特征向量和特征空间来减少地物之间的相关性,以区分核心区的地物信息,达到提高分类精度的目的。本文通过ALOS四个波段的PCA变换、纹理分析和NDVI进一步构造特征空间,再利用特征空间上的阈值作为知识规则,进而采用密度分割和决策树的方法来区分地物。就研究区的实际情况来看,分类精度不高的地区主要有3个,米草和盐蒿的交错带,芦苇和盐蒿的交错带,以及上下两个芦苇、米草和盐蒿的交错带。所以如何较高精度地划分出3个交错带,对提高遥感影像的解译精度具有非常重要的意义。知识规则阈值的生成有两个途径:第一是根据特征空间上值的分布人工寻找阈值;第二采用数据挖掘算法例如CART树、C4.5树等自动挖掘阈值[13]。数据挖掘的方法适合于大批量阈值的寻找,就本研究的实际情况,由于只要寻找出两种植被或3种植被的阈值,数据量不是很大,故采用观察样本差异人工寻找阈值的方法。 5.1.13种植被交错带的细分 PCA变换又称主成分变换,是一种除去波段之间的多余信息,将多波段的图像信息压缩到比原波段更有效的少数几个转换波段的方法。使得在原光谱空间相关性较大的地物,能在新的PCA特征空间中得到有效区分[14]。本次研究利用PCA变换对3种植被的交错带进行细分:被区分的植被有米草、芦苇和盐蒿。首先对原图进行PCA变换,进而在PCA变换图上绘制3种植被的训练区,尽量选择比较纯净的像元,然后对这些训练样本的主成分变换后的数值进行分析。通过观察这几种植被在主成分变换中各个主成分的差异,找出差异最大的主成分波段,观察PCA中各个主成分的最大值、最小值和平均值,最后发现PC1能够很好地区分这3种植被,如表3所示。 5.1.2芦苇和盐蒿交错带的细分通过观察非监督分类图上芦苇和盐蒿的分布,根据实地考察记录的GPS点,可以看到很多芦苇都被错分为盐蒿,主要分布在分类图左下角养殖塘的周围。对错分为盐蒿的芦苇和正确划分的芦苇以及正确划分的盐蒿进行采样,采样时依旧遵循上面的原则即尽量保证像元纯净,以方便比较。然后在ENVI4.7中绘制光谱图,如图4所示。观察图4可以发现错分为盐蒿的芦苇和芦苇的斜率比较相近,而和盐蒿的斜率有较大的差别,进而计算整个图像的NDVI,然后利用上面的采样区对NDVI进行分析,得到以上3种植被的NDVI数值表,见表4。从表4可以看出,在光谱空间上极易错分为盐蒿的芦苇和正确划分的盐蒿在NDVI值上相差很大,而和正确划分的芦苇的值很接近,所以通过NDVI可以较为准确地划分芦苇和盐蒿。 5.1.3盐蒿和米草交错带的细分 非监督分类后,通过观察分类图上米草和盐蒿的分布,可以发现有较大片的盐蒿属于米草,同理也有较大片的米草属于盐蒿。所以需要把错分为盐蒿的米草从盐蒿中分离出来,然后将其中的米草信息还原。同理错分为米草的盐蒿也是这样。对米草和盐蒿在NDVI和PCI特征空间做采样分析,发现在这两个特征空间不能找到合适的阈值将其区分。考虑到灰度共生矩阵的纹理可以很大程度上改进遥感影像的分类精度,本文采用ENVI4.7软件的二阶概率矩阵方法生成8个基于灰度共生矩阵的纹理特征,即平均值、方差、同质性、反差、差异性、熵、二阶矩和自相关性。生成二阶概率矩阵时选用3×3的滑动窗口,移动步长为1。通过比较这8组数据发现盐蒿和米草在方差和自相关性上差异较大,如表5。自相关上差异很大是因为米草有不少负相关很大的值,比如-8000,因此平均的米草负相关值就会很大,同理盐蒿也是,从米草和盐蒿的自相关值集中的频率来看,两者绝大部分的值都集中在-1和1之间,所以在自相关这个纹理特征空间上不能将米草和盐蒿区分开。而从方差上看,方差的第四波段可以较容易地划出一个阈值来区分米草和盐蒿。方差运算后结果比较小的表示该地物纹理比较细密,方差运算后结果比较大的表示该地物纹理比较粗糙,从遥感影像上来看盐蒿的纹理显得比较平滑、波动性小,而米草的纹理比较粗糙,刚好符合表5统计数据的特征[15]。因此,可以选用方差的第四波段上的阈值来区分米草和盐蒿。 5.1.4河流和养殖塘错分的修改 由于核心区的养殖塘形状较为规则,呈现长方形和正方形,而河流的形状较为弯曲,且分布在核心区的最北和最南,根据这条知识规则对非监督分类图中河流和养殖塘的错分进行修改,还原错分的养殖塘和河流。总结上述知识规则,得到表6。对于3种植被的交错带,采用构建决策树的方法进行细分(图5)。而芦苇和盐蒿两种植被的交错带则采用密度分割的方法划分阈值进行细分。#p#分页标题#e# 5.2基于GIS规则的分类改进 遥感影像特征是基于植物类型与土壤、水体等地物特征及其组分相互消长关系的综合反映,由于“同物异谱”和“异物同谱”的情况比较严重,因此,单纯基于光谱特征识别植被类型会不同程度地产生错分和误分。根据生态学和地学等方面的专家知识,利用GIS,对基于光谱特征的影像分类进行改进是提高分类精度的一个重要方法[16]。利用研究区1∶5万的地形图和江苏省1∶400000海岸土地利用图,可以在影像上目视解译出河道和养殖塘的范围。将非监督分类后所得的栅格数据转为矢量图,并与河道和养殖塘的范围作GIS叠加分析,对于河道和养殖塘叠加后有偏差的少部分区域,借助于地形图和土地利用图予以确认并进行修改。叠加分析后发现部分米草和盐蒿分布在河道和养殖塘的周围。根据生态学的基本知识,米草和盐蒿性喜盐,在淡水区域不可能长出米草和盐蒿,应为喜淡水的芦苇。通过GIS的空间相邻关系特征设置查询选项,执行这一特定区域的误分斑块的筛选,然后进行类代码的重新赋值,提高了分类精度。同理,被误分为芦苇和盐蒿的光滩也可以通过这一原理重新赋值修正。由于保护区具有科学实验的特征,核心区分为人为管理区和自然生长区。以中路港为界上半部分为人为管理区下半部分为自然生长区,在20世纪90年代人为管理区修建堤坝以防止海水的入侵,因此涨潮时海水不会影响堤坝内的植被。所以依照生态学的知识,根据GIS空间叠加分析的功能可以把该区域误分为米草和盐蒿的芦苇进行选定,并进行类别代码的重新赋值,从而纠正该类的误分。 5.3对修改后的非监督分类图进行精度评价 根据上述知识规则对非监督初始分类图进行修改,结果如图6所示。所选择的150个样本点仍然是非监督分类后的检验样本,每大类至少20个样本,其中包括野外考察38个点。在ENVI4.7软件中的分类后处理中选择混淆矩阵法,通过地表真实感兴趣区进行精度检验。经检验,总体精度为92.6829%,Kappa系数为0.9098,见表7。 6结语 通过精度检验表(表7)可以看出,各类地物的用户精度和生产精度都有了不同程度的提高,普遍达到85%以上,总体精度达到了92.68%。其中养殖塘和河流的分类精度都比较高,用户精度和生产精度都达到了95%以上。修改后米草和光滩间相互误分比较明显,因为越靠近光滩,有部分米草是小块、零散分布的,面积通常比较小,10m的空间分辨率无法将其表现出来。这些米草像元被自动归为与之相临近的光滩里面导致了误分错分。芦苇和光滩也存在误分,因为有些区域芦苇长势不是很好,和一些裸地形成了混合像元,从而在表观上显示裸地的光谱特征。米草和芦苇在上下两个三界交错带有部分的混生分布,并且光学特征非常类似,所以也产生了错分现象。非监督分类的方法无需选定感兴趣区,单纯依靠光谱信息聚类,误分错分比较多,具体表现在河流和养殖塘之间、芦苇、米草和盐蒿这两组光谱空间非常相似的地物之间。本文以非监督分类后的结果为模板,运用分区分层分类的思想对非监督分类初始结果进行修改,得到了较高的精度。研究表明融合遥感影像纹理信息、主成分变换等非光谱信息,可以提高地物的可分性,避免单纯利用光谱信息导致的错分漏分。同时基于分类规则以GIS为工具,依据生态学知识、地学等方面的知识对分类结果进行改进是提高分类精度的重要手段。

监督分类范文第10篇

关键词:GE影像;非监督分类;增强处理

中图分类号:TP317.4 文献标识码:A 文章编号文章编号:16727800(2014)001014702

基金项目基金项目:武汉理工大学自主创新研究基金项目(135214001);中央高校基本科研业务费专项资金资助项目;教育部人文社科基金规划项目(12YJAZH022)

作者简介作者简介:唐赫(1989-),女,武汉理工大学理学院硕士研究生,研究方向为人脸图像识别、遥感图像、统计预测决策。

0 引言

土地是人类生存和发展的基础,经济的发展离不开土地资源的支撑,土地资源管理领域只有不断引入新技术和新理论,才能促进该领域的快速发展和土地资源的有序利用。本文将Google Earth引入到土地资源管理领域,利用提供的免费影像图、软件的基本功能以及基于Java script的API,将其应用到土地资源调查、土地监测、规划决策以及土地项目管理领域,为土地资源管理的发展提供了一个新的思路。

1 算法流程

1.1 数据获取

由于GE影像精度高画面清楚,而且容易获取,所以用于土地研究是比较方便的。我们下载的Google Earth 2013年武汉市的影像,其分辨率较高,影像较清晰,易于目视解译。由于GE影像上没有武汉市的行政分区,所以要研究武汉市的土地利用情况还需要武汉市的矢量地图,运用ENVI软件进行图像裁剪、分类和数据统计等处理工作。

1.2 图像处理软件

本文研究中主要应用ENVI遥感图像处理软件,它的软件处理技术包括数据输入和输出、图像增强、图像校正、图像镶嵌和融合以及变换、图像分类等。ENVI 支持各种类型的遥感图像,目前广泛应用于科研、环保、遥感、气象、石油矿产勘探、土地、农业水利、地球科学、测绘勘察等各个领域。

1.3 图像预处理

卫星获取的原始数据由于受到地形、天气变化、大气散射等因素的影响,往往会产生随机误差。一幅遥感图像,必须经过几何校正、辐射校正、投影变换、去噪等处理后才能进行图像增强处理和其它诸如图像镶嵌、特征提取、分类等工作。其中,几何校正是图像处理中一种最基本的处理方法,主要是调整各类特征空间关系的变换。图像配准是对同一个景物在不同时间、用不同探测器、从不同视角获得的图像,利用图像中共有的录物,通过比较和匹配,找出图像之间的相对位置关系。辐射量校正是消除图像数据中依附在辐射亮度中的各种失真的过程。增强处理是指通过图像增强以加强地物特征,提高解译性。

1.4 边界提取

原始数据获取的是整幅图像,要裁剪出武汉市行政区,这里采用矢量地图进行裁剪,过程可以分为以下4个部分:

①首先打开矢量文件,投影参数如果已经设置好,不要变化;

②在打开的Available Vector List对话框中,选择File—Export Layer to ROI,在弹出的对话框中选择需要裁剪的图像;

③在下面的对话框中选择将所有矢量要素转换为一个ROI;

④选择主菜单Basic Tools—Subset data via ROIs,选择需要裁剪的图像,在打开的对话框中,设置参数,选择路径及文件名,裁剪影像。

1.5 图像分类

图像分类总的目的是将图像中每个像元按照某种规则或算法划分为不同的类别,根据分类过程中人工参与程度分为监督分类、非监督分类和面向对象分类等。

监督分类(supervised)是指根据已知训练区提供的样本,通过计算选择特征数,建立判别函数以对各待分类影像进行图像分类。先定义信息类,再定义光谱可分性。监督分类的流程如图1所示。

非监督分类(unsupervised)也称聚类分类,它不用先验信息,仅依靠自身统计特征进行分类,是在多光谱图像中搜寻、定义其自然相似光谱集群组的过程。非监督分类方法简单,而且具有一定的精度。非监督分类流程如图2所示。

本次图像分类用的是ENVI 图像处理软件,非监督分类的算法只用到两种:ISODATA 和KMeans,本文研究选择了ISODATA 自然集群算法。先用非监督分类的ISODATA 自然集群算法进行初步分类,最少分类个数为5个,最多为10个,迭代了10次,其它选项都是默认选项。选择开始分类,得到非监督分类结果,然后把监督分类结果进行同类合并,在Combine Classes 中完成,并确定其类别属性。

初步结果一般难于达到最终的应用目的,所以对于获取的分类结果需要再进行一些处理,才能得到最终理想的分类结果。①选择ToolColor MappingClass Color Mapping进行类别颜色的修改;②选择ClassificationPost ClassificationClump Classes进行聚类;③选择ClassificationPost Classification Sieve Classes进行过滤;④对于产生的误分和错分现象,需要在Interactive Class Tool 窗口下选择EditPolygon Add to Class 或者Polygon Delete from Class 进行修改,选择添加到另一类或删除。

经过上述后续处理可以得到简易的分类图进行初步解析,运用ENVI软件进行分类结果的统计分析。

2 结果与分析

预处理图和武汉市边界裁剪图如图3所示。

其中,调整后的分类图中,绿色代表绿地,蓝色代表水域,紫色代表建筑用地,橙灰色代表农用地及其它。统计后的各个类别所占比例如表1(本文图片为黑白,彩色图片找笔者索取)。

由表1可见,武汉市的水域面积比重很高,说明武汉是一个水资源丰富的城市,武汉市的地形属残丘性河湖冲积平原,山丘、湖泊与平陆相间,江(河)湖水面占总面积的25%。建筑用地的比例也占到了接近五分之一,武汉市城市化程度、工业化程度较高,交通便利,说明武汉市的城市化具有较大的发展空间;武汉市城市建筑用地远少于农村用地,说明武汉市是一个工业特征明显的县市,矿用地占用了较大一部分建筑用地。武汉市农用地占了较大比重,农业以种植业为主,其次是林业、渔业,但其中其它用地的比例不可知,土地的后备资源是否充足、是否有开发潜力还有待研究。

3 结语

本文的研究工作主要应用了Google Earth影像数据,对此进行了几何校正、辐射校正、图像增强等处理,研究了区域边界的裁剪;然后利用处理后的图像进行分类处理,研究和分析其分类方法,最后分析了统计结果。Google

Earth影像数据获取便利,影像清晰,用于研究方便而且资源丰富。在图像分类方面先初步分类再根据实际地形图慢慢调整,在这个过程中还有很多细节需优化,对于分类精度的评价还需要多个样本进行检测。本文只是初步的分类和分析,有些问题还有待进一步解决。后续工作可以以当前的研究为基础,结合武汉市的自然、经济、技术和社会等因素,具体分析土地利用规划现状。

参考文献参考文献:

[1] 王兵,臧玲.我国土地利用、土地覆被变化研究近期进展[J].地域研究与开发,2006,25(2):8691.

[2] 耿长良.Google Earth在城市轨道交通工程控制网布设中的应用[J].测绘通报,2011(7):5456.

[3] 陈强,姜立新,帅向华.Google Earth在地震应急中的应用研究[J].地震,2008,28(1):121 127.

[4] 钭春红.Google Earth在水利水电测绘中的应用[J].地理空间信息,2011,9(5):5355.

[5] 刘盛和,吴传钧.基于GIS的北京城市土地利用扩展分析模式[J].地理学报,2000(7):407416.

[6] 胡银根,吴冲龙.目前我国土地利用规划决策新趋势[J].特区经济,2008(5):3638.

[7] 汤竞煌,聂智龙.遥感图像的几何校正[J].测绘与空间地理信息,2007,30(2):100102.

[8] 敬忠良,肖刚,李振华.图像融合理论与应用[M].北京:高等教育出版社,2007:2324.

[9] 张伟,曹广超.浅析遥感图像的几何校正原理及方法[J].价值工程,2011 (2):189190.

上一篇:职能部门范文 下一篇:桩基检测技术研究范文