Land use and cover classification based on multi-feature soft probability cascading
ZHANGBin, LIUYueyan, WANGLinyu China University of Geosciences,Department of Land Resources Management,Wuhan 430074,China 收稿日期:2016-09-20 修回日期:2017-02-5 网络出版日期:2017-03-20 版权声明:2017《资源科学》编辑部《资源科学》编辑部 基金资助:国家自然科学基金资助项目(41601480)对地观测技术国家测绘地理信息局重点实验室开放基金(K201407 ) 作者简介: -->作者简介:张斌,男,湖南益阳人,博士,讲师,硕士生导师,主要从事高分辨率遥感影像土地利用分类。E-mail:zhangbin@cug.edu.cn
展开
摘要 为实现高分辨率遥感影像低层特征的有效组织与优化,提高特征的可判别性,重点研究了基于稀疏编码的中层特征学习、基于支持向量机(Support Vector Machine,SVM)的分类技术,提出了基于软概率级联中层特征学习模型实现土地利用/土地覆盖(Land Use and Land Cover,LULC)分类。首先,提取影像的灰度共生矩阵(Gray-level Co-occurrence Matrix,GLCM)、光谱特征、密集尺度不变特征转换(Dense Scale Invariant Feature Transform,DSIFT)作为低层特征;然后由稀疏编码分别对GLCM、DSIFT和光谱特征进行稀疏编码,并结合最大平滑方法对稀疏系数进行优化,获得影像的中层特征,并通过SVM分类器分别计算LULC类别软概率,对其级联获得影像的特征表达;最后,利用SVM分类器再次分类获得LULC分类结果。选用武汉市远城区农村居民点作为实验样区,对该方法进行了验证,实验结果表明,该方法总体精度达到88%左右;相较于提取单一低层特征的分类方法,本文算法可有效提高LULC分类精度。
关键词:高分辨率;遥感影像;图像分类;土地利用/土地覆盖;稀疏编码;支持向量机 Abstract In order to realize the effective organization and optimization of low-level features for high resolution remote sensing images,and make feature descriptors more discriminative,we focused on mid-level feature learning based on sparse coding and support vector machine (SVM)classification,and propose a land use / land cover (LULC)classification method based on soft probability cascading and mid-level feature learning model. First,the gray level co-occurrence matrix (GLCM),Dense Scale-Invariant Feature Transform (DSIFT)and spectral feature descriptors are extracted as low-level feature descriptors. Second,sparse coding is adopted to obtain the sparse coefficients of GLCM,DSIFT and spectral features,and then max-pooling methods are used for learning mid-level feature descriptors. Combined with SVM classification with training samples of LULC class types the soft probabilities of different LULC class types are calculated. Three different kinds of soft probabilities belong to each LULC class type,which takes GLCM,DSIFT and spectral features as low-level feature descriptors respectively,and are cascaded for the construction of final feature descriptors. The cascaded feature descriptors are more discriminative than unsupervised mid-level feature descriptors,because it is learned by a supervised way. This method incorporates different low-level feature descriptors effectively. Finally,using the cascaded feature descriptors,the LULC classification map is achieved by the SVM classifier in a supervised way. Taking rural residents in the district area of Wuhan City as an experimental area,our proposed method was verified by aerial high resolution remote sensing images. Experimental results show that the overall accuracy is 88%. Compared with the extraction of a single low-level feature classification method,the algorithm in this paper can effectively improve LULC classification accuracy.
遥感现已成为获取地表信息的重要手段,随着传感器技术的不断发展,可获取大量高分辨率遥感影像,如 IKONOS、QuickBird、World-View-2、国产资源3C 以及高分1号、2号等高分辨率遥感数据,其分辨率可接近1m甚至亚米级。另外,随着无人机航拍技术的推广,可获得大量分米级超高分辨率遥感影像。目前,国内外已经加快对高分辨率影像在城市环境、精准农业、交通及道路设施、林业测量、军事目标识别和灾害评估中的应用[1-3]。土地利用/土地覆盖(Land Use and Land Cover,LULC)分类是高分辨率遥感影像处理以及土地资源管理领域的热点及难点问题,高分辨率遥感影像提供了更为丰富的纹理结构特征信息,为解决这一难题提供了可能[1,2]。 遥感影像分类模型经历了像元解译、局部结构特征提取、面向对象解译的发展历程。高分辨率遥感影像分类,需综合利用计算机视觉、信号处理、模式识别等相关领域的前沿热门理论与技术方法[3]。在利用遥感影像对LULC分类方面,国内外研究者往往将LULC进行统一分类或是对土地LULC实现变化监测。中等空间分辨率的Landsat系列卫星影像在区域尺度LULC分类中发挥了较大的作用。为获得更高的分类精度,研究者在迭代自组织数据分析算法(ISODATA,Iterative Self Organizing Data Analysis)、最大似然及平行六面体等传统分类方法基础上将模糊数学、GIS技术以及多源数据融合方法等应用于Landsat卫星影像LULC分类[3]。在高分辨率遥感影像处理方面,发展了较多的分类方法,如面向对象的方法、决策树算法、人工神经网络、支持向量机(Support Vector Machine ,SVM)等[4-11]。这些方法大部分是基于低层特征学习的分类方法,然而基于低层特征学习的遥感影像新的分类方法仍是一个突破点,因为基于中层及高层特征学习的分类方法不一定在一些简单的小数据集上有效[12]。 目前,综合利用局部特征和稀疏编码建立特征的分层学习模型是高分辨率遥感影像处理在土地利用解译领域的热点问题。基于中层特征学习的高分辨率遥感影像LULC分类方法,通常提取影像的密集尺度不变特征转换 (Dense Scale Invariant Feature Transform,DSIFT)作为低层特征并对其进行稀疏编码,然后结合超像素分割、空间金字塔匹配(Spatial Pyramidal Matching,SPM)、最大空间平滑方法实现影像的中层特征表达,最后由分类器实现LULC分类[13-17]。 Chen Y.提出了一种考虑空间上下文信息的稀疏编码方法,并将其应用于高光谱遥感影像地物分类[14]。Yang Y.在考虑特征的局部空间相关性的基础上,对传统的视觉词袋模型(Bag of Visual Words,BOVW)进行了改进,实现了场景级土地利用分类[15]。Qi K.L等对影像的局部特征以及光谱直接级联然后进行稀疏编码得到影像的特征表达,并与传统的场景级分类方法相比较,其分类精度更高[16]。刘越岩等提出了一种多特征软概率级联的场景级土地利用分类方法[17]。Cheriyadat A. M 提出了一种非监督中层特征学习方法,实现了特殊用地的检索[18]。Hu F.等结合稀疏编码对卷积神经网络模型(Convolutional Neural Networks,CNN)结构进行微调实现场景级土地利用分类,然而该方法的CNN模型参数缺乏土地利用类型信息,其特征可判别性不强[19]。 中层特征学习方法在高分辨率遥感影像场景级土地利用分类以及LULC地物分类中具有较大的优势,然而由于稀疏编码的视觉字典通常是由非监督聚类方法获得的,会导致中层特征的可判别性不强。同时基于中层特征学习的分类方法通常采用DSIFT局部特征作为低层特征,未考虑光谱特征以及其它结构纹理特征。为有效实现LULC分类,本文提出了多特征软概率级联的支持向量机(Multi-features soft probability cascading and Support Vector Machine,MFSP-SVM)分类模型,在获取影像中层特征表达后,利用SVM分类器分别计算光谱、纹理以及DSIFT三种低层特征对应的软概率,对其进行级联得到影像的特征表达,最后由SVM分类器进行第二次分类得到LULC分类结果。
2 研究方法
研究方法流程如图1所示,主要分为低层特征提取、中层特征学习、软概率级联、SVM分类四个步骤。首先提取影像的低层特征,包含DSIFT特征,灰度共生矩阵(Gray-level Co-occurrence Matrix,GLCM)特征以及光谱特征。然后,采用K-均值非监督聚类的方式获得稀疏编码的字典,对低层特征进行稀疏分解,同时采用超像素分割获得影像的超像素区域,通过最大平滑进行优化获得影像的中层特征。由SVM分类器进行第一次分类,分别计算三种特征的软概率,进行级联,获得影像最终的特征表达。最后,对级联后的软概率特征向量采用SVM分类器进行第二次分类,获得LULC分类结果图。 显示原图|下载原图ZIP|生成PPT 图1研究方法流程 -->Figure 1Flow diagram of research method -->
实验数据为武汉市国土资源局提供的无人机航拍高分辨率遥感数据,拍摄时间均为2012年10月24日,分辨率均为0.2m(如图2,图3所示)。图2原始影像大小为1024×1200,拍摄地区为武汉市蔡甸区索河镇盐山村(E113°0′57.54″, N30°1′44.00″);图3原始影像大小为1113×1777,拍摄地区为武汉市蔡甸区索河镇彭新村(E113°3′31.81″,N30°4′25.75″)。两幅影像均标注了6种地物类别。研究小组人员参照德国摄影测量与遥感协会(German Association of Photogrammetry and Remote Sensing,DGPF)的ISPRS语义分类数据集标注方法,ISPRS数据集总共标注了6种地物类别,对其中的部分地物类别进行了合并,重点标注了建筑物这种特定的地物类别,主要是为了便于后续的建筑物三维重建。小组成员对高分辨率遥感影像和土地利用现状图及地籍图进行分析,对农村居民点土地利用类型进行了语义标注,重点标注了农村宅基地,其次标注了植被、树木、道路,水体,农田,总共6种地物类别。 显示原图|下载原图ZIP|生成PPT 图2武汉市蔡甸区索河镇盐山村居民点数据集 -->Figure 2Dataset of Yanshan Village,Suohe Town,Caidian District,Wuhan City -->
显示原图|下载原图ZIP|生成PPT 图3武汉市蔡甸区索河镇彭新村居民点数据集 -->Figure 3Dataset of Pengxin Village,Suohe Town,Caidian District,Wuhan City -->
4 结果分析
基于Matlab 2013平台,首先采用提取影像的低层特征,通过超像素分割、稀疏编码,最大平滑方法获取其中层特征,通过由SVM分类器分别计算其软概率,进行级联获得特征表达,最后由SVM分类器获得分类结果(如图4,图5所示,见第562页)。武汉市蔡甸区索河镇盐山村居民点数据集原始影像经quick shift算法[20]分割后获得了52 654个分割区域;武汉市蔡甸区索河镇彭新村居民点数据集原始影像经quick shift算法分割后获得了92 441个分割区域,实验中,随机抽取一定数目的超像素区域作为分类器的训练样本,其余的作为测试样本,如表1,表2所示。选择了传统的SOMP[14],U+SVM[21]作为对比试验方法。 显示原图|下载原图ZIP|生成PPT 图4武汉市蔡甸区索河镇盐山村居民点数据集分类结果 -->Figure 4Classification results of the Yanshan Village,Suohe Town,Caidian District,Wuhan City dataset -->
显示原图|下载原图ZIP|生成PPT 图5武汉市蔡甸区索河镇彭新村居民点分类结果 -->Figure 5Classification results of the Pengxin Village,Suohe Town,Caidian District,Wuhan City dataset -->
Table 1 表1 表1武汉市蔡甸区索河镇盐山村居民点数据集分类信息 Table 1Classification information of Yanshancun village,Suohe town,Caidian district,Wuhan City dataset
类别
训练样本数目
测试样本数目
低层植被
100
6 055
宅基地
100
6 518
树木
100
17 710
农田
100
13 022
水体
100
2 294
道路
100
7 055
新窗口打开 Table 2 表2 表2武汉市蔡甸区索河镇彭新村居民点数据集分类信息 Table 2Classification information of the Pengxin Village,Suohe Town,Caidian District,Wuhan City dataset
类别
训练样本数目
测试样本数目
低层植被
500
8 964
宅基地
500
9 215
树木
500
20 304
农田
500
41 528
水体
500
1 781
道路
500
10 649
新窗口打开 本文选择了三种对比试验方法:①传统的SOMP分类方法[14],采用光谱特征作为低层特征,经中层特征学习后最后由SVM分类器得到分类结果;②U+SVM分类方法[21],与SOMP方法不同之处在于采用DSIFT作为低层特征;③GLCM+SVM分类方法,采用GLCM作为低层特征。训练字典参数设置为400,SVM分类器训练样本数目如表1,表2所示。 实验结果如图4,图5所示,MFSC-SVM分类方法明显优于其他三种分类方法,其中宅基地这种特定的LULC类别整体性较好,道路也较为完整的与其他地物类别区分开。同时,GLCM+SVM分类方法要优于SOMP与U+SVM分类方法,这是因为GLCM是一种较为稳定的局部特征,包含的纹理以及结构信息较为丰富。MFSC-SVM分类方法综合了不同的低层特征,因此分类效果最好。 为分析方法的准确性以及普适性,采用了总体分类精度(Overall Accuracy,OA),Kappa系数,以及单类地物类别分类精度等指标进行定量分析评价(如表3,表4所示)。在武汉市蔡甸区索河镇盐山村居民点数据集中,MFSC-SVM分类方法精度达到了85.3%,相较于其他三种方法,分别提升了4.9%,20.7%,1.8%;在武汉市蔡甸区索河镇彭新村居民点数据集中,MFSC-SVM分类方法精度达到了87.9%,相较于其他三种方法分别提升了9.7%,10.0%,4.3%。U-SVM分类方法精度最低,主要是因为该方法采用了DSIFT特征作为低层特征,DSIFT特征能对目标的形状结构进行较好的描述表达,然而缺乏地物的光谱信息,因此分类精度较低。在农村宅基地这种特定地物分类精度方面,在武汉市蔡甸区索河镇盐山村居民点数据集中,MFSC-SVM分类方法达到了88.7%,相较于其他三种方法,分别提升了4.5%,26.3%,5.1%;在武汉市蔡甸区索河镇彭新村居民点数据集中,MFSC-SVM分类方法达到了88.0%,相较于其他3种方法,分别提升了11.4%,7.9%,4.1%。 Table 3 表3 表3武汉市蔡甸区索河镇盐山村居民点数据集不同分类方法精度 Table 3Classification accuracy for the Yanshan Village,Suohe Town,Caidian District,Wuhan City dataset with different classifiers
分类方法
精度/%
OA/%
Kappa
植被
宅基地
树木
农田
水体
道路
SOMP
67.8
84.2
79.9
91.4
96.0
63.0
80.4
0.765
U-SVM
57.9
62.4
54.6
68.2
87.7
56.8
64.6
0.575
GLCM-SVM
74.1
83.6
76.2
93.1
97.6
76.3
83.5
0.802
MFSC-SVM
75.9
88.7
81.2
93.1
96.7
76.2
85.3
0.823
新窗口打开 Table 4 表4 表4武汉市蔡甸区索河镇彭新村居民点不同分类方法精度 Table 4Classification accuracy for the Pengxin Village,Suohe Town,Caidian District,Wuhan City dataset with different classifiers
分类方法
精度/%
OA/%
Kappa
植被
宅基地
树木
农田
水体
道路
SOMP
76.5
76.6
73.7
73.3
96.0
73.3
78.2
0.739
U-SVM
77.8
80.1
66.2
70.7
99.1
73.5
77.9
0.735
GLCM-SVM
82.5
83.9
76.4
80.4
99.1
79.1
83.6
0.803
MFSC-SVM
89.4
88.0
81.6
85.6
99.6
83.5
87.9
0.855
新窗口打开 在进行LULC分类时,训练样本的数目会影响最后的分类结果,选择了武汉市蔡甸区索河镇盐山村居民点数据集进行实验,通过随机抽取影像中的超像素区域作为训练样本,分析其对结果的影响(如图6所示)。随着训练样本的增加,四种方法分类精度都随之提升,MFSC-SVM分类方法分类精度始终高于其他三种方法。当训练样本数由100递增至500时,MFSC-SVM分类方法的分类精度以3%速度递增。然而,当训练样本由500增至600时,总体分类精度仅提升了0.6%。当训练样本数目为1000时,其分类精度高达92.8%。 显示原图|下载原图ZIP|生成PPT 图6训练样本数目对分类结果影响 -->Figure 6The influence of training sample number per LULC class type on classification accuracy -->
5 结论
本文以航拍高分辨率遥感影像作为数据源,综合利用中层特征学习,SVM分类方法,对光谱特征、纹理特征(GLCM)、结构几何特征(DSIFT)进行软概率特征级联,提出了一种基于软概率特征级联的SVM分类方法,实现了武汉市蔡甸区农村居民点LULC分类。实验结果表明:MFSC-SVM分类总体精度高达88%左右,Kappa系数保持在0.85左右,高于采用单一特征作为低层特征的分类方法,能够为农村地籍图调绘、农村宅基地使用权确权、农村土地利用格局分析提供一定的科学参考。针对实验,可得出以下结论: 对4种方法的分类结果进行比较分析发现,采用单一DSIFT特征作为低层特征分类效果较差;采用GLCM特征作为低层特征的分类方法,与采用光谱特征、DSIFT特征作为低层特征的分类方法相比较,其效果更好;本文构建的多特征软概率级联模型由于综合了这三种低层特征,同时特征向量是通过SVM分类器监督训练获得的,因此特征可判别性更强,分类精度比其他三种方法更高,分类结果中农村宅基地这种特定的地物类别精度也更高。同时,本文提出的MFSC-SVM是开放的模型,可根据具体的分类需求,级联各种不同的低层特征。 The authors have declared that no competing interests exist.
[GongP,LiX,XuB,et al.Interpretation theory and application method development for information extraction from high resolution remotely sensed data [J]. ,2006,10(1):1-4.] [本文引用: 2]
[BaiM,Liu HP,QiaoY,et al.New progress in the classification of high spatial resolution satellite images for LUCC [J]. ,2010,(1):19-23.] [本文引用: 1]
[5]
PaulA,Peter MA,Paul JC.Fine spatial resolution simulated satellite sensor imagery for land cover mapping in the United Kingdom [J]. ,1999,68(3):206-216.
[6]
OlivierD,Isabelle VS,PatriceL,et al.Textural and contextual land-cover classification using single and multiple classifier system [J]. ,2002,68(6):597-605.
[7]
ForkuorG,CofieO.Dynamics of land-use and land-cover change in Freetown,Sierra Leone and its effects on urban and peri-urban agriculture-a remote sensing approach [J]. ,2011,32(4):1017-1037.
[8]
Stuart KM.Using the Normalized Difference Water Index (NDWI)within a geographic information system to detect swimming pools for mosquito abatement:A practical approach [J]. ,2013,5(7):3544-3561.
[Wang R,Jiang D,Han H, et al. Extracting natural and artificial forest information based on high resolution remote sensing data [J]. ,2013,35(4):868-874.]
[Liu YY,Wang LL,ZhangB,et al.Scene-level land use classi-fication based on multi-features soft-probability cascading [J]. ,2016,32(22):266-272.] [本文引用: 2]
[18]
Cheriyadat AM.Unsupervised feature learning for aerial scene classification [J]. ,2014,52(1):439-451. [本文引用: 1]
[19]
HuF,Xia GS,Hu JW,et al.Transferring deep convolutional neural networks for the scene classification of high-resolution remote sensing imagery [J]. ,2015,7(11):14680-14707. [本文引用: 1]
[20]
FulkersonB,VedaldiA,SoattoS.Class segmentation and object localization with superpixel neighborhoods [J]. ,2009,30(2):670-677. [本文引用: 2]
[21]
Wu TF,Lin CJ,Weng RC.Probability estimates for multi-class classification by pairwise coupling [J]. ,2004,5(4):975-1005. [本文引用: 3]
[22]
Lee CH,SchmidtM,MurthaA,et al.Segmenting Brain Tumors with Conditional Random Fields and Support Vector Machines [C]. ,2005. [本文引用: 1]