删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于LSSVM-CA模型的复杂土地利用变化模拟——以鄂州市为例

本站小编 Free考研考试/2021-12-29

杨建新1,, 龚健1,2,, 李江风1
1. 中国地质大学(武汉)公共管理学院,武汉 430074
2. 国土资源部法律评价重点实验室,武汉 430074

Complex land use changes simulation in Ezhou City using cellular automata based on least squares support vector machine

YANGJianxin1,, GONGJian1,2,, LIJiangfeng1
1. School of Public Management,China University of Geosciences (Wuhan),Wuhan 430074,China
2. Key laboratory of the Ministry of Land and Resources Law Evaluation,Wuhan 430074,China
通讯作者:通讯作者:龚健,E-mail:gongjian@cug.edu.cn
收稿日期:2015-05-11
修回日期:2016-06-5
网络出版日期:2016-08-25
版权声明:2016《资源科学》编辑部《资源科学》编辑部
基金资助:国家社科基金项目(14BJY057)国家社科青年项目基金项目(12CGL065)
作者简介:
-->作者简介:杨建新,男,湖北鄂州人,博士生,主要研究方向为土地利用变化及其资源环境效应分析与模拟。E-mail:yangjianxinjian@163.com



展开

摘要
本文探索了最小二乘支持向量机(Least Squares Support Vector Machine ,LSSVM)获取元胞转换规则的可行性,并应用于复杂土地利用变化模拟预测。以湖北省鄂州市为研究区,以1991-2004年土地利用变化数据作为模型训练数据,运用改进的ROC分析方法对比分析了LSSVM和逻辑回归方法获取的元胞转换规则,在此基础上运用LSSVM-CA模型模拟了研究区2013年的土地利用情景,并对2020年和2030年土地利用情景进行预测。研究结果表明:①LSSVM对数量较大、变化过程较复杂土地利用类型的空间分布模拟效果更好,如耕地、建设用地、养殖水体和其他用地;②与2013年实际土地利用情景相比,LSSVM-CA模拟结果总体精度为0.80,Kappa系数为0.73,处于较高一致性水平,优于逻辑回归-CA模型结果;③未来,鄂州市主城区、城西新区、“葛华新城”、“红莲湖新城”以及南部的花湖开发区、沼山镇、太和镇建设用地需求较大,将占用大量耕地,东部和南部低丘岗地区的耕地将大量转变为林地。研究结论为LSSVM方法可用于获取元胞转换规则进行复杂土地利用变化模拟,并能取得较好的效果,模拟结果可为研究区土地规划、耕地和生态环境保护等提供决策参考。

关键词:元胞自动机;最小二乘支持向量机;土地利用;鄂州市
Abstract
Here we validate the feasibility of gaining transformation rules for cellular automata modeling using Least Squares Support Vector Machine (LSSVM)methods,and apply it to the simulation and prediction of complex land use change. We took land use change information from 1991 to 2004 for Ezhou,Hubei as training data. With the application of LSSVM and Logistic Regression methods,we obtained two sets of transformation rules respectively. Comparison and analysis were made between them with the help of an enhanced ROC method. We then simulated land use scenarios for 2013 using a united LSSVM-CA model and predictions to 2020 and 2030. The results show that the LSSVM method has a better output than the Logistic Regression method in simulating the spatial distribution of land use types that have a large area and a complex change process,such as cultivated land,construction land,aquaculture land and other land. Compared with the actual land use scenarios in 2013,the precision of simulation output derived from the LSSVM-CA model is 0.80. The Kappa coefficient is 0.73,which is at a high level of consistency and better than the simulation results gained from Logistic-CA model. In the future,some districts will have a large demand of construction land and a large number of cultivated land will be occupied. Farmland in the eastern and southern low-hilly area will transform into forest land in a big way. We conclude that the LSSVM method can be used to obtain transformation rules in a cellular automata model and can gain a good result in simulating land use changes. The simulation results provide meaningful decision-making reference points for the study area in land planning,farmland protection and ecological environmental protection.

Keywords:cellular automata;least squares support vector machine;land use;Ezhou City

-->0
PDF (1331KB)元数据多维度评价相关文章收藏文章
本文引用格式导出EndNoteRisBibtex收藏本文-->
杨建新, 龚健, 李江风. 基于LSSVM-CA模型的复杂土地利用变化模拟——以鄂州市为例[J]. , 2016, 38(8): 1525-1537 https://doi.org/10.18402/resci.2016.08.11
YANG Jianxin, GONG Jian, LI Jiangfeng. Complex land use changes simulation in Ezhou City using cellular automata based on least squares support vector machine[J]. 资源科学, 2016, 38(8): 1525-1537 https://doi.org/10.18402/resci.2016.08.11

1 引言

土地利用/土地覆被变化((Land Use and Land Cover Change,LUCC)作为全球环境变化和可持续发展的重要内容,是全球变化研究的热点和前沿问题。国际全球环境变化人文因素计划(International Human Dimensions Programme,IHDP)和国际地圈生物圈计划(International Geosphere-Biosphere Pro-gramme,IGBP)于1995年联合提出的LUCC计划以及后续提出的全球土地计划(Global Land Plan,GLP),极大的促进了土地变化科学(Land Change Science,LCS)的诞生和发展[1]。LUCC模型研究作为土地变化科学(LCS)核心问题之一和作为深入理解土地利用变化过程、驱动机制、动态规律、生态效应和环境变化的重要手段[2]也取得了重大研究进展,涌现出了许多新的模型和方法。目前,国际上已提出的LUCC模型主要有基于经验-统计理论的逻辑回归(Logistic Regression,LR)模型[3]、人工神经网络(Artificial Neural Network,ANN)模型[4]等;基于概念机理的系统动力学(System Dynamics,SD)模型[5]、多智能体(Multi-Agent System,MAS)模型[6]等;基于多模型耦合的综合模型,如CLUE-S(Conversion of Land Use and its Effects at Small region extent)模型[7]、元胞自动机(Cellular Automation,CA)模型[8]、Dinamica EGO模型[9]等。其中元胞自动机(CA)模型作为一种“自下而上”的时间、空间、状态都离散,空间作用和时间因果都局部的网格动力学模型,具有自组织和自演化特征,其强大的空间运算能力可让大量元胞遵循相同的局部运动规则作同步更新,以此推动系统的动态演变从而产生全局整体有序的系统结构模式。这使得元胞自动机模型特别适合于可视化模拟土地利用这种复杂地理现象的时空动态变化。
元胞转换规则的定义和获取是元胞自动机模型的关键,很大程度上决定了元胞自动机模拟土地利用变化的成败。国内外****对元胞转换规则的定义和获取进行了大量研究。一些国外****将Logistic回归[10]、贝叶斯分析[11]、支持向量机[12]、人工神经网络[13]等方法引入CA模型来获取元胞转换规则;国内以黎夏为代表的研究团队采用多模型、多方法获取元胞转换规则对珠江三角洲地区的城市扩张和土地利用变化进行了模拟与分析[14-16]。然而,通过大量简单规则的堆叠和线性方法获取的转换规则在模拟复杂非线性地理现象时效果一般不太理想。近年来,基于智能算法自动获取元胞转换规则的方法得到了快速发展,这些算法一般涉及到较多难以确定的模型参数,且当输入数据维数较高时往往存在“维数祸根”的弊端,一些算法还存在陷入局部最优的风险、过拟合问题和计算量大等不足之处。最小二乘支持向量机(Least Squares Support Vector Machine ,LSSVM)是Suykens等对传统支持向量机(Support Vector Machine ,SVM)的一种完善和扩展,不仅具有传统支持向量机模型良好的非线性逼近能力、较好的泛化性、较高的拟合精度等特点,能很好地解决“维数祸根”、过学习以及局部收敛等问题,同时还具备学习速度快,运算量小等优点[17]。目前,已广泛应用于模式识别[18]、回归拟合[19]、故障诊断[20]等领域。
本文探索使用LSSVM方法获取元胞转换规则。以湖北省鄂州市1991-2004年土地利用变化作为模型训练数据,对其2013年土地利用情景进行模拟分析,并与目前使用较多的逻辑回归(Logistic Regression)模型结果进行对比分析,然后利用校验后模型对研究区2020和2030年土地利用情景进行预测。LSSVM正则化参数λ和核宽度δ对模型精度有较大影响,本文采用协同模拟退火(Coupled Simulated Annealing,CSA)算法和Nelder-Mead单纯形(Nelder-Mead Simplex,NMS)算法相结合进行LSSVM参数寻优,以提高模型模拟精度、收敛速度和泛化能力。

2 研究方法与数据来源

2.1 最小二乘支持向量机

支持向量机 (Support Vector Machine,SVM)是一种基于统计学习理论的机器学习方法,采用结构风险最小化原则和VC维理论,能够在模型的复杂性和学习能力之间进行折中处理,具有很好的泛化性和全局寻优能力,同时通过引入核函数将非线性可分的向量空间映射到线性可分的Hilbert空间,很好地解决了“维灾”问题。其不足之处在于当样本数据很大时,需要求解的二次规划问题将变得十分复杂,模型计算量很大。LSSVM是对传统SVM的一种改进,它将传统SVM中的不等式约束改为等式约束,以误差平方和作为样本数据的经验损失函数,将解二次规划问题转化为求解线性方程组问题,降低了模型运算量,提高了求解速度和收敛精度[22]。LSSVM推导过程如下:
假设有样本数据集(x1,y1),…,(xk,yk),k为样本数量,(xi,yi)∈(Rn,[-1,1]),i=1,2,…,k,nxi的维数。首先通过映射 ?(·)将原始向量空间Rn映射到高维特征空间 ?(xi)中,并在此高维特征空间中构造最优决策函数:
y(x)=sgn[ωT??(x)+b](1)
式中ωRn为权向量;b为偏差量。根据结构风险最小化理论,构建如下优化问题:
minJ(ω,b,ξ)=12ω2+γ2i=1kξi2(2)
s.t.yi[ωT??(xi)+b]=1-ξi(3)
式中 ω2控制决策函数的复杂性; γ为正则化参数,控制对超出误差样本的惩罚程度;ξ为误差向量;i=1,2,…,k
对上式定义拉格朗日(Lagrange)函数为:
L(ω,b,e,α)=12ω2+γ2i=1kξi2-i=1kαiyi[ωT×?(xi)+b]+ξi-1(4)
式中 αii=1,2,…,k)为Lagrange乘子,如果输入的 xi对应0< αi<γ,则称 xi为支持向量。
公式(4)分别对ω,b,e,α求偏微分,由KKT最优值条件得:
?L?ω=0?ω=i=1kαi×?(xi)?L?b=0?i=1kyi×αi=0?L?ξi=0?αi=γ×ξi?L?αi=0?yi[ωT??(xi)+b]=1-ξi(5)
对公式(5)消去ωξ可得到下面线性方程组:
0-yT+γ-1I?ba=0I(6)
式中Ik维单位向量, I=[1,1,…,1]T;α=[α1,α2,…,αk]T;y=[y1,y2,…,yk]T;Ω为核函数矩阵,Ωij=yiyj??Txi?xj)= yiyj?Kxi,xj),i,j=1,2…,k,Kxi,xj)为满足Mercer条件的对称核函数。令A=Ω+γ-1I,用最小二乘法求解方程组(6)得:
a=A-1I-byb=yTA-1IyTA-1y(7)
ω=i=1kαi×yi×?(xi),因此LSSVM最优决策函数为:
y(x)=sgni=1kαi×yi×K(x,xi)+b(8)
常用的核函数有多项式核函数、径向基(Radial-Basis Function,RBF)核函数、Sigmoid核函数和B样条核函数,本文采用目前使用广泛且效果较好的RBF核函数,即:
K(x,xi)=exp(-x-xi2/2σ2)(9)
式中σ为核宽度。采用RBF核函数的LSSVM仅需确定γσ两个参数,参数的搜索空间由传统SVM的三维降低到二维,极大地加快了模型收敛速度。

2.2 协同模拟退火算法

同传统SVM一样,LSSVM在实际应用中的难点在于确定合理的模型参数,一组好的参数能同时提高模型精度和模型泛化能力,这也是支持向量机研究的难点和热点。目前,常用的LSSVM参数确定方法主要有经验法、网格搜索法和智能寻优算法。本文采用CSA算法和NMS方法相结合确定LSSVM最优参数γσ
模拟退火(Simulated Annealing,SA)算法是一种基于蒙特卡罗(Monte Carlo)迭代和Metropolis接受准则的启发式随机寻优算法,其核心原理是对固体退火过程的模拟[23],理论上已经证明,SA是一种全局最优算法,即当算法搜索时间足够长时总能以概率1接近全局最优解。然而,实际应用中SA获得最优解的时间往往过长,因此,SA实际获得的解往往只能是全局近似最优解。另外,SA初始状态的选择对最终解的质量也存在一定影响。CSA不同于SA之处在于,CSA采取了并行搜索策略,在计算接受概率时同时考虑了多个当前状态,它们构成一个当前状态集Θ,同时,根据状态集Θ中每个元素新状态接受概率的方差对下一次搜索时状态集Θ中各元素新状态接受概率进行控制,这些特征使得CSA算法寻优时的搜索时间大大降低,并且拥有更好的鲁棒性,即最终解的求得基本不依赖于初始状态的选取。CSA算法寻优原理如下[24]
(1)随机生成一个初始状态集Θ={x1,x2,…, xi},i=1,2,…,m。计算Θ各初始状态对应的损失函数Exi)和协同参数δ。初始化温度控制参数Tktkk=0,初始化方差控制参数λDβ(0<β≤0.1)。本文取常数 β=0.05,δλD分别按下式计算:
δ=i=1kE(xi)tk(10)
λD2=0.99(m-1m2)(11)
(2)对 xiΘ进行随机扰动生成一个对应的新状态 yiΩ,并计算对应的损失函数 E(yi)。其中i=1,2,…,m;Ω为全部可能状态集合。
(3)若 E(yi)E(xi),则 xiyi替换;若 E(yi)> E(xi),则 xi以概率 Piyi替换,即当 Pi>ρ时, xiyi替换。重新计算参数δ,保持 Tk不变,重复执行步骤(2)、步骤(3)一定次数。ρ为[0,1]之间均匀分布的随机数, Pi按下式计算:
Pi=exp(E(xi)tk)δ(12)
(4)根据指定规则对 tk进行调整:
tk=tk-11-βλ2<λD2tk=tk-11+βλ2λD2(13)
式中 λ2Θ中各状态 xi为对应新状态 yi的接受概率 Pi的方差,0≤ λ2≤(m-1)/m2
(5)缓慢降低温度 Tk
(6)重复步骤(2)-步骤(5)直到满足收敛条件为止。
用CSA算法对LSSVM参数γσ进行寻优时,Θ={(γ1,σ1),(γ2,σ2),…, γmσm},损失函数Ex)为LSSVM分类精度,采用k折交叉验证法计算[25]。相比经典SA算法,在获得同等质量的解时CSA算法的收敛速度更快,鲁棒性更强,但由于CSA算法本质上仍然是一种模拟固体退火过程的随机搜索算法,因此在一定的搜索时间内其获得的只能是全局近似最优解。CSA算法的整个流程见图1。为进一步优化解的质量,本文将CSA搜索得到的全局近似最优解作为NMS算法的一个初始点,使用NMS算法进一步优化CSA获得的全局近似最优解。NMS算法进行参数优化的原理详见参考文献[26,27]
显示原图|下载原图ZIP|生成PPT
图1协同模拟退火算法结构框架
-->Figure 1The structure of CSA algorithm
-->

2.3 LSSVM-CA模型构建

多种土地利用类型之间的变化是十分复杂的,如果研究区域有N种土地利用类型,则可能发生的土地利用变化类型就有N×N种。然而LSSVM是一种二分类器,因此需对研究区每种土地利用变化类型构建一个LSSVM分类器,共N2个。LSSVM模型的输入中x表示土地利用变化驱动因子,以y=1表示某种土地利用变化类型发生,y=-1则表示该种土地利用变化类型没有发生。土地利用变化往往具有一定的不确定性和随机性,若直接以LSSVM的布尔分类结果来判断土地利用变化类型发生与否,结果往往不够理想,而以概率形式进行表达则可减少各种误差在模型中的传递,从而提高模型效果[28]。可以借鉴SVM的概率化输出方法[29],将LSSVM分类结果转化为土地利用变化类型发生概率,实现对土地利用变化类型发生可能性的概率化表示。某种土地利用变化类型的发生概率 Pchange按公式(14)进行计算:
Pchange=11+exp[-(i=1kαi×yi×K(x,xi)+b)](14)
本文以概率表示元胞转换规则进行复杂土地利用变化模拟,并且CA模型要求输入的概率为某种土地利用类型出现的适宜性,而不是某种变化类型发生的可能性[30],因此需将土地利用变化类型发生的可能性概率转变为土地利用类型出现的适宜性大小。转换方法如下:假设研究区N种土地利用类型为L1,L2,…, Lii=1,2,…,N),则可能发生的土地利用变化类型就有“L1L1,L1L2,…, LiLj,…, LNLN”(i,j=1,2,…,N)共N2种,通过LSSVM模型得到的各土地利用变化类型概率图分别为 P11, P12,…, Pij,…, PNN。则由土地利用变化类型概率图 P1i, P2i,…, Pji,…, PNi中空间位置上分别对应某一时期土地利用类型L1,L2,…, Li,…, LN的部分镶嵌而成的图像即为土地利用类型 Li的适宜性大小分布图 Pivar
Pivar是由土地利用变化驱动变量决定的元胞在模拟时期内从现土地利用类型转变为第i种土地利用类型的适宜性大小。除此之外,元胞在模拟时期内转变为第i种土地利用类型的适宜性大小还受其周围元胞状态影响,当其一定邻域范围内元胞有较多处于类型i时,则该元胞转变为类型i的概率更高。元胞邻域影响作用大小按公式(15)计算:
Pineigh=Kj=1MConjiM(15)
式中j为邻域元胞;M为邻域元胞数量;Con j,i)=1,表示邻域元胞j的利用类型为i;Con j,i)=0,表示邻域元胞j的利用类型不为i;K为调整系数。
复杂土地利用变化一般伴随着一定的随机性,模拟时可将随机变量 ε引入CA模型中,使得模拟结果更接近实际, ε为[0,1]范围内均匀分布的随机数。同时,区域土地利用规划和政策对土地利用变化也起到一定的约束或引导作用,因此可在模型中引入一个引导或约束参数 ci, ci值参考已有研究成果和专家经验设定多组试验值,然后通过多次试验对比确定。土地利用类型i出现的适宜性大小由 PivarPineigh、随机变量 ε和政策规划参数 ci共同决定,最终各土地利用类型的适宜性大小按下式计算:
Pisuit=Pivar×Pineigh×ε×ci(16)
每次CA循环中,通过比较各元胞位置上某种土地利用类型的适宜性大小,即可确定该元胞下某一时刻的土地利用类型,这一过程也是各种土地利用变化类型发生的过程。模拟期内各土地利用变化类型出现的数量应该是相互差异的,可以通过土地利用变化混淆矩阵对其数量进行控制。LSSVM-CA模型结构见图2
显示原图|下载原图ZIP|生成PPT
图2LSSVM-CA模型结构框架
-->Figure 2The structure of LSSVM-CA model
-->

2.4 数据来源及处理

本文以湖北省粮食主产区鄂州市为研究区,从鄂州市国土资源局(http://www.ezlr.gov.cn)获取了研究区1991年、2004年及2013年的土地利用现状矢量数据,该数据采用遥感解译和实地调查相结合的方法采集,精度较高。根据研究区土地资源利用特点和覆被特征,将土地利用数据重分类为耕地、林地、建设用地、水体、养殖水面和其他用地6类。研究表明,土地利用变化常受到一些距离变量和自然属性的驱动[21],本文共选取了以下8个土地利用变化驱动变量:到高速路入口距离、到铁路站场距离、到主要公路距离、到乡镇中心距离、到城市中心距离、到大型水体距离、高程、坡度。其中,高程、坡度、到大型水体距离等土地自然属性是区域土地利用的基础条件,如林地多分布在高程、坡度较大区域,耕地、建设用地的分布则地势平缓、靠近水源区域,养殖水体多分布在距离大型水体较近区域;公路、铁路等交通网线是区域与外界沟通的通道,对区域土地利用变化有着重要影响作用,存在强烈的导向作用,如建设用地一般沿着交通干线扩展、蔓延,而路网周边的耕地、林地、水体等土地利用类型被改为建设用地的概率更高,为方便产品运输,养殖水体也多分布在路网沿线;乡镇、城市中心是区域行政、商业、文化中心,对建设用地存在明显的吸引作用而对农用地则有一定的排斥作用。研究区土地利用变化驱动因子见图3。在ArcGIS平台下将所有数据转换为30m×30m栅格格式,并进行投影转换,统一为UTM-50N坐标系统。考虑到研究区部分大型水体面积从1991-2013年都未发生变化,并且研究区正积极创建生态文明城市,这些水体已列为生态环境保护区,可认为其未来也不会发生较大变化,因此不对这些大型水体区域的变化进行模拟。研究区1991年和2004年土地利用现状见图4
显示原图|下载原图ZIP|生成PPT
图32004年研究区土地利用变化驱动因子
-->Figure 3Driving factors of land use change in the study area in 2004
-->

显示原图|下载原图ZIP|生成PPT
图41991年和2004年鄂州市各土地利用类型空间分布
-->Figure 4Land use map of study area in 1991 and 2004
-->

3 结果及分析

3.1 LSSVM方法挖掘元胞转换规则

以鄂州市1991-2004年土地利用变化作为模型训练数据,获取各土地利用类型适宜性概率作为元胞转换规则。训练时采用分层随机采样方法对每种变化类型随机采取1000个样点,将样点数据输入Matlab2011a平台下编程实现的LSSVM模型中,确定各分类器的最佳参数γσ。共构建了36个LSSVM分类器,部分主要土地利用变化类型LSSVM参数γσ值见表1。按上述方法,通过构建的分类器得到研究区不同土地利用类型适宜性图。同时使用逻辑回归方法以相同过程得到研究区各土地利用类型适宜性图。以2013年土地利用类型实际分布情况为参考,运用改进ROC曲线方法对比分析了LSSVM方法和逻辑回归方法得到的未考虑邻域、随机因素和规划、政策影响的土地利用类型适宜性图,结果见图5
Table 1
表1
表1部分主要土地利用变化类型LSSVM分类器参数值
Table 1Parameters of LSSVM classifier for some main land use transition types
变化类型耕地-养殖水面耕地-建设用地耕地-林地其他用地-林地水体-养殖水面耕地-其他土地
γ6.3043.4694.1005.0004.0025.826
σ20.0250.2160.0150.0210.0500.003


新窗口打开
显示原图|下载原图ZIP|生成PPT
图52013年土地利用适宜性概率ROC曲线
-->Figure 5The ROC curve of suitability for different land use types in 2013
-->

图5x轴表示假阳性率(True Positive ,TP),y轴表示真阳性率(False Positive,FP)。曲线上数值为该曲线与x轴所围图形面积,曲线上特征点为适宜性概率大于特定值的土地面积与模拟期内其他地类转化为该地类面积相同时的适宜性概率确定的(x,y)点,并以该概率值作为阈值确定的二分类列联表计算特征点处的尤拉系数Q,结果见表2。尤拉系数可度量二分类图像之间的相关性,Q=0表示无相关性,Q>0表示正相关,Q<0表示负相关,Q=±1表示完全相关[31]。根据Pontius等人的研究,ROC曲线下面积越大,特征点处x值越小y值越大,原点到特征点段曲线斜率越大,则表明适宜性概率图与土地利用类型分布趋势一致性越好[32]。从ROC曲线下面积来看,LSSVM对耕地、建设用地、养殖水体以及其他用地分布的模拟效果明显优于逻辑回归模型,而在模拟林地和水体空间分布上LSSVM方法则稍优于逻辑回归方法;从特征点分布以及原点到特征点段连线斜率来看,LSSVM在模拟耕地、建设用地、养殖水体以及其他用地分布时效果更好,而逻辑回归对水体、林地分布的模拟效果则稍优于LSSVM;从特征点处的尤拉系数来看,LSSVM方法模拟的耕地、建设用地、养殖水体以及其他用地分布相比逻辑回归方法与实际分布情况更为一致,相关性更好,而逻辑回归方法对水体和林地分布的模拟效果则稍好一些。总体上,LSSVM对耕地、建设用地、养殖水体和其他用地分布的模拟效果明显优于逻辑回归方法,而对林地和水体的模拟效果与逻辑回归方法模拟结果接近。可见,当土地利用类型基数较大、变化过程较复杂时,LSSVM方法模拟效果较好,这是因为LSSVM模型能更好地从小样本数据中获得较好地学习和泛化能力。
Table 2
表2
表2LSSVM和逻辑回归方法特征点处尤拉Q系数
Table 2The Q coefficients in feature points of LSSVM and logistic regression model
耕地林地建设用地水体养殖水面其他用地
尤拉Q系数LSSVM0.630.740.850.540.910.50
逻辑回归方法-0.210.78-0.040.620.34-0.13


新窗口打开

3.2 LSSVM-CA模拟土地利用变化

以适宜性概率作为元胞转换规则,考虑邻域作用、随机变量以及规划、政策因素影响,以2004年为基期模拟鄂州市2013年的土地利用情景。模拟时以2004-2013年实际土地利用变化混淆矩阵对各种变化类型进行数量控制。区域土地利用规划、政策对元胞状态转换概率影响大小ci参考已有研究成果和专家经验设定试验值,然后对比试验结果选择较优值。首先,本文考虑了基本农田保护区对研究区耕地分布的影响,将基本农田保护区所在栅格单元的耕地适宜性在LSSVM模型输出结果的基础上分别乘以1.1、1.3、1.5、1.8,即这些区域的耕地适宜性的规划引导参数ci分别设为1.1、1.3、1.5、1.8。其次考虑了生态环境保护区对模拟结果的影响,一是从研究区中剔除了多年未发生变化的大型水体区域,这些区域一般位于研究区生态保护区划定范围内。二是对林地空间分布的影响,研究中将林地保护区所在栅格单元的林地适宜性的规划引导参数ci分别设为1.1、1.3、1.5、1.8。第三,考虑了研究区土地利用总体规划中建设用地管制分区对建设用地空间分布的影响,将允许建设区所在栅格单元的建设用地适宜性的约束参数ci设为1,将有条件建设区的约束参数ci设为0.8或0.5,将限制建设区的约束参数ci设为0.5或0.3,将禁止建设区的约束参数ci设为0。对以上不同的规划、政策引导或约束作用大小进行模拟试验和分析,最终确定基本农田保护区耕地适宜性引导参数ci为1.3,生态环境保护区林地适宜性引导参数ci为1.3,有条件建设区建设用地适宜性约束参数ci为0.8,限制建设区建设用地适宜性约束参数ci为0.5。
CA邻域局部作用通过多次循环迭代实现,如果迭代次数太少则无法保证元胞之间已进行了充分的相互作用,而迭代次数过多则会显著增加运算量,而对模型结果不会带来大的影响,一般进行100~200次循环迭代是较为合适的,本文试验了3×3、5×5、7×7元胞邻域,结果发现采用常见的3×3元胞邻域得到的模型结果在精度和整体格局上与实际较为接近。研究区2013年土地利用实际和模拟情景见图6,见第1534页。
显示原图|下载原图ZIP|生成PPT
图62013年鄂州市土地利用模拟结果和实际情景
-->Figure 6The simulating and actual land use scenarios in study area in 2013
-->

土地利用系统的动态演变不仅受到自然因素的影响,同时也涉及到复杂的社会、经济和文化习俗等因素影响,并且各种影响因素还处于不断变化的过程中,因此完全准确地模拟出土地利用变化过程和细节是极其困难的,对模拟结果应从整体分布和空间格局上认识和分析。运用Fragstats软件分别计算了反映景观形状特性和聚散特性的景观格局指数,实际和模拟土地利用情景的景观格局指数计算结果见表3。从景观格局计算结果可以看出,无论是是从景观形状特性还是聚散特性指数来看,实际和模拟情景中各指数值都较为接近,土地利用空间分布格局较为一致,在元胞邻域作用下模拟情景的景观聚集性更好。
Table 3
表3
表3实际和模拟情景景观格局指数
Table 3The landscape pattern index of simulating and actual land use map
景观格局指数实际情景模拟情景指数差值取值范围
形状特性平均斑块分维数(FRAC_MN1.061.050.01[1,2]
平均斑块相关外接圆指数(CIRCLE_MN0.530.470.06[0,1]
平均斑块聚集指数(CONTIG_MN0.400.440.04[0,1]
周长面积分形维数(PAFRAC1.391.250.14[1,2]
聚散特性蔓延度指数(CONTAG42.3248.406.08[1,100]
散布于并列指数(IJI74.7675.430.67[1,100]
斑块结合度指数(COHESION99.1299.110.01[1,100]
聚集度指数(AI84.7191.496.78[1,100]


新窗口打开
将模拟结果与实际情况逐点对比得到土地利用混淆矩阵,并计算各地类精度和总精度,结果见表4。从表4可知,LSSVM-CA模型对耕地的模拟正确率最高,达到86%,其次是建设用地、林地和养殖水面,而对水体和其他用地的模拟精度较低,因水体和养殖水面在遥感解译时分辨难度较大,可能会对水体和养殖水面的精度检验结果造成影响,而其他用地涉及的二级土地利用类型较多,各种类型之间的变化极为复杂,且分布零散无规律,因此模拟难度相对较大。模型总体精度为0.80,Kappa系数为0.73,处于高度一致性水平,Logistic-CA模型模拟结果的总体精度为0.68,Kappa系数为0.55,LSSVM-CA模型模拟结果优于Logistic-CA模型结果。
Table 4
表4
表4LSSVM-CA模拟结果精度
Table 4The precision of simulating result from LSSVM-CA model(hm2,%)
实际面积
耕地林地建设用地水体养殖水面其他用地精度总精度
模拟面积耕地53 225.281 392.752 641.14326.162 581.651 501.658680
林地1 493.9111 465.01523.7154.2799.63903.4279
建设用地2 666.61610.5622 301.82253.621 004.31659.2581
水体278.6439.06328.502 190.24807.57133.5658
养殖水面2 669.4067.14996.39823.4116 728.39336.3377
其他用地1 344.06961.47711.45119.52394.023 821.2252


新窗口打开
在假设土地利用变化驱动变量以及政策影响因素ci无较大变化的条件下,可利用本模型对未来可能发生的土地利用变化进行预测,为研究区土地资源的使用、管理、预警和规划提供参考资料。运用Markov方法预测了研究区2013-2020年以及2013-2030年的土地利用变化混淆矩阵[33],以预测得到的混淆矩阵限定CA模拟时各土地利用转变类型发生的栅格数量。以2013年为模拟初始期,模拟研究区2020年和2030年的土地利用情景,模拟时采用3×3元胞邻域,进行100次CA循环迭代,结果见图7
显示原图|下载原图ZIP|生成PPT
图72020年和2030年鄂州市土地利用情景模拟
-->Figure 7The simulating land use scenarios of study area in 2020 and 2030
-->

将模拟结果与2013年土地利用现状进行叠加对比,可以清晰地看出鄂州市土地利用表现出城市用地不断增加,农用地不断减少的趋势。首先,耕地大量转变为建设用地,这是城市化、工业化快速发展的结果,这种变化主要分布在鄂州市主城区、城西新区、“葛华新城”以及“红莲湖新城”等地区,同时在鄂州市“南部启动”发展战略支持下,南部地区建设用地也将经历一个快速增长过程,如花湖经济开发区、沼山太和两镇及其连接公路沿线地带建设用地面积增长明显;其次,在经济利益和生态文明建设的驱使下,鄂州市东部和南部坡度相对较大的低丘岗地区的耕地将大量转变为林地。可见作为湖北省粮食主产县市,鄂州市未来仍将面临较大的耕地及环境保护压力,如果不采取合适的政策措施,这种快速地土地利用变化现象,必将给鄂州市带来一系列的资源和环境问题。

4 结论与讨论

4.1 结论

土地利用变化是一种十分复杂的地理空间现象,元胞自动机作为一种模拟分析复杂系统演变规律的重要工具,其核心是如何定义合理的转换规则。LSSVM基于统计学习理论,采用结构风险最小化原则,具有很好的泛化能力和较高的模拟精度,通过核函数将原始向量空间映射到高维Hilbert空间,使其具有良好的非线性模拟能力,同时还巧妙地避免了“维灾”问题。与经典SVM相比LSSVM还具有运算量小,收敛快等优点。这些使得LSSVM能很好的反映出土地利用变化系统的非线性特征,可用于复杂土地利用系统的模拟分析。通过为每种土地利用变化类型构建一个分类器,并进行掩膜提取,将二分类的LSSVM方法应用于多类别的土地利用变化模拟,是一种很好的尝试。针对LSSVM参数难以确定这一难题,提出使用CSA和NMS方法相结合进行模型参数优化,既提高了模型精度和泛化能力,同时还大大减少参数寻优时间。
将模型应用于湖北省粮食重要产地鄂州市,以1991-2004年土地利用变化资料作为模型训练数据,运用LSSVM方法获取非线性元胞转换规则,并与逻辑回归方法获取的转换规则进行了对比分析。结果表明,总体上,在模拟面积较大、变化较复杂的地类时,LSSVM模拟效果优于逻辑回归方法,如耕地、建设用地、养殖水体和其他用地,这得益于LSSVM模型良好的小样本学习能力和泛化能力。以LSSVM模型得到的土地利用适宜性概率作为元胞转换规则输入CA模型,模拟了鄂州市2013年的土地利用情景,模拟精度为0.80,Kappa系数为0.73。土地利用是一个受到自然、社会、经济和文化习俗等因素影响的复杂巨系统,完全模拟出其演变的过程和细节是十分困难的,但模拟预测结果可为研究区土地利用整体发展趋势、空间整体布局、土地管理以及城市发展规划提供重要参考资料。

4.2 讨论

考虑到数据的可获取性,本文选取的土地利用变化驱动因子主要为一些距离因子和自然驱动因子,如果能将人口、GDP等其他社会和经济驱动因子以及城市交通、水利等规划影响因素也纳入模型,并对各因子驱动机制进行深入分析,模拟精度应会有进一步提高。同时,在模型训练时只采用了两期数据,这也是目前利用元胞自动机模拟土地利用变化时常用做法,并且假设各土地利用变化驱动因子无较大变化,这样获取的转换规则往往都是静止不变的,如何获取随时间动态演变的元胞转换规则将作为今后进一步深入研究的方向,未来还可考虑基于本模型对研究区土地利用政策进行多情景模拟分析。
The authors have declared that no competing interests exist.

参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子

[1]唐华俊,吴文斌,杨鹏,. 土地利用/土地覆被变化(LUCC)模型研究进展
[J]. 地理学报,2009,64(4):456-468.
[本文引用: 2]

[Tang H J,Wu W B,Yang P,et al.Recent progresses of land use and land cover change (LUCC)models
[J]. Acta Geographica Sinica,2009,64(4):456-468.]
[本文引用: 2]
[2]张丁轩,付梅臣,陶金,. 基于Clue-S模型的矿业城市土地利用变化情景模拟
[J]. 农业工程学报,2013,(12):246-256.
[本文引用: 1]

[Zhang D X,Fu M C,Tao J,et al.Scenario simulation of land use change in mining city based on LUE-S model
[J]. Transactions of the Chinese Society of Agricultural Engineering,2013,(12):246-256.]
[本文引用: 1]
[3]Xu Y,Mcnamara P,Wu Y,et al.An econometric analysis of changes in arable land utilization using multinomial logit model in Pinggu District,Beijing,China
[J]. J Environ Manage,2013,128(20):324-334.
[本文引用: 1]
[4]Mozumder C,Tripathi N K.Geospatial scenario based modelling of urban and agricultural intrusions in Ramsar wetland Deepor Beel in Northeast India using a multi-layer perceptron neural network
[J]. International Journal of Applied Earth Observation and Geoinformation,2014,32(1):92-104.
[本文引用: 1]
[5]Rasmussen L V,Rasmussen K,Reenberg A,et al.A system dynamics approach to land use changes in agro-pastoral systems on the desert margins of Sahel
[J]. Agricultural Systems,2012,107(1):56-64.
[本文引用: 1]
[6]Ralha C G,Abreu C G, Coelho C G C, et al. A multi-agent model system for land-use change simulation
[J]. Environmental Modelling & Software,2013,42(4):30-46.
[本文引用: 1]
[7]Zhang P,Liu Y,Pan Y,et al.Land use pattern optimization based on clue-s and swat models for agricultural non-point source pollution control
[J]. Mathematical and Computer Modelling,2013,58(3-4):588-595.
[本文引用: 1]
[8]Mitsova D,Shuster W,Wang X.A cellular automata model of land cover change to integrate urban growth with open space conservation
[J]. Landscape and Urban Planning,2011,99(2):141-153.
[本文引用: 1]
[9]高志强,易维. 基于CLUE-S和Dinamica EGO模型的土地利用变化及驱动力分析
[J]. 农业工程学报,2012,28(16):208-216.
[本文引用: 1]

[Gao Z Q,Yi W.Land use change in China and analysis of its driving forces using CLUE-S and Dinamica EGO model
[J]. Transactions of the Chinese Society of Agricultural Engineering,2012,28(16):208-216.]
[本文引用: 1]
[10]Arsanjani J J,Helbich M,Kainz W,et al.Integration of logistic regression,Markov chain and cellular automata models to simulate urban expansion
[J]. International Journal of Applied Earth Observation and Geoinformation,2013,21(4):265-275.
[本文引用: 1]
[11]Verstegen J A,Karssenberg D,Hilst F V D, et al. Identifying a land use change cellular automaton by Bayesian data assimilation
[J]. Environmental Modelling & Software,2014,53(1):121-136.
[本文引用: 1]
[12]Rienow A,Goetzke R.Supporting sleuth-enhancing a cellular automaton with support vector machines for urban growth modeling
[J]. Computers,Environment and Urban Systems,2015,49:66-81.
[本文引用: 1]
[13]Guan Q L W,Clarke K C. An artificial-neural-network-based,constrained CA model for simulating urban growth
[J]. Carto-graphy & Geographic Information Science,2005,32(4):369-380.
[本文引用: 1]
[14]张亦汉,黎夏,刘小平,. 基于数据同化的元胞自动机
[J]. 遥感学报,2011,15(3):475-491.
[本文引用: 1]

[Zhang Y H,Li X,Liu X P,et al.CA model based on data assimilation
[J]. Journal of Remote Sensing,2011,15(3):475-491.]
[本文引用: 1]
[15]张亦汉,黎夏,刘小平,. 耦合遥感观测和元胞自动机的城市扩张模拟
[J]. 遥感学报,2013,17(4):872-886.


[Zhang Y H,Li X,Liu X P,et al.Urban expansion simulation by coupling remote sensing observations and cellular automata
[J]. Journal of Remote Sensing,2013,17(4):872-886.]

[16]黎夏. 协同空间模拟与优化及其在快速城市化地区的应用
[J]. 地球信息科学学报,2013,15(3):321-327.
[本文引用: 1]

[Li X.Collaborative spatio-simulation and optimization and its application in fast growing regions
[J]. Journal of Geo-Information Science,2013,15(3):321-327.]
[本文引用: 1]
[17]周竹,李小昱,李培武,. 基于GA-LSSVM和近红外傅里叶变换的霉变板栗识别
[J]. 农业工程学报,2011,27(3):331-335.
[本文引用: 1]

[Zhou Z,Li X Y,Li P W,et al.Near-infrared spectral detection of moldy chestnut based on GA-LSSVM and FFT
[J]. Transactions of the Chinese Society of Agricultural Engineering,2011,27(3):331-335.]
[本文引用: 1]
[18]Mitra V,Wang C,Banerjee S.Text classification:A least square support vector machine approach
[J]. Applied Soft Computing Journal,2007,7(3):908-914.
[本文引用: 1]
[19]Ismail S,Shabri A,Samsudin R.A hybrid model of self-organi-zing maps (SOM)and least square support vector machine (LSSVM)for time-series forecasting
[J]. Expert Systems with Appli-cations,2011,38(8):10574-10578.
[本文引用: 1]
[20]Xu H,Guohua C.An intelligent fault identification method of rolling bearings based on LSSVM optimized by improved PSO
[J]. Mechanical Systems and Signal Processing,2013,35(1-2):167-175.
[本文引用: 1]
[21]曹雪,罗平,李满春,. 基于扩展CA模型的土地利用变化时空模拟研究-以深圳市为例
[J]. 资源科学,2011,33(1):127-133.
[本文引用: 1]

[Cao Z,Luo P,Li M C,et al.Spatio-temporal simulation of land use change based on an extended CA model:A case study of Shenzhen City,China
[J]. Resources Science,2011,33(1):127-133.]
[本文引用: 1]
[22]Wang H,Hu D.Comparison of SVM and LS-SVM for Regression[R].
Beijing:2005 International Conference on Neural Networks and Brain,2005.
[本文引用: 1]
[23]Kirkpatrick S,Gelatt J C D,Vecchi M P. Optimization by simulated annealing
[J]. Science (New York,N.Y.),1983,220(4598):671-680.
[本文引用: 1]
[24]Xavier-De-Souza S,Suykens J A K,Vandewalle J,et al. Coupled simulated annealing
[J]. IEEE Transactions On Systems,Man,and Cybernetics,Part B (Cybernetics),2010,34(2):320-335.
[本文引用: 1]
[25]王霞,王占岐,金贵,. 基于核函数支持向量回归机的耕地面积预测
[J]. 农业工程学报,2014,30(4):204-211.
[本文引用: 1]

[Wang X,Wang Z Q,Jin G,et al.Land reserve prediction using different kernel based support vector regression
[J]. Transactions of the Chinese Society of Agricultural Engineering,2014,30(4):204-211.]
[本文引用: 1]
[26]Huang Y,Mccoll W F.An Improved Simplex Method for Function Minimization
[C]. Beijing:IEEE International Conference,1996.
[本文引用: 1]
[27]Wang P C,Shoup T E.Parameter sensitivity study of the Nelder-Mead Simplex Method
[J]. Advances in Engineering Software,2011,42(7):529-533.
[本文引用: 1]
[28]黎夏,叶嘉安,廖其芳. 利用案例推理(CBR)方法对雷达图像进行土地利用分类
[J]. 遥感学报,2004,8(3):246-253.
[本文引用: 1]

[Li X,Ye J A,Liao Q F. Case-Based Reasoning (CBR)for land use classification using radar images
[J]. Journal of Remote Sensing,2004,8(3):246-253.]
[本文引用: 1]
[29]Madevska-Bogdanova A,Nikolik D,Curfs L.Probabilistic SVM outputs for pattern recognition using analytical geometry
[J]. Neurocomputing,2004,62(1):293-303.
[本文引用: 1]
[30]黎夏,叶嘉安. 基于神经网络的元胞自动机及模拟复杂土地利用系统
[J]. 地理研究,2005,24(1):19-27.
[本文引用: 1]

[Li X,Ye J A.Cellular automata for simulating complex land use systems using neural networks
[J]. Geographical Research,2005,24(1):19-27.]
[本文引用: 1]
[31]Sangermano F,Eastman J R,Zhu H.Similarity weighted instance-based learning for the generation of transition potentials in land use change modeling
[J]. Transactions in GIS,2010,14(5):569-580.
[本文引用: 1]
[32]Pontius R G,Parmentier B.Recommendations for using the relative operating characteristic (ROC)
[J]. Landscape Ecology,2014,29(3):367-382.
[本文引用: 1]
[33]肖明,吴季秋,陈秋波,. 基于CA-Markov模型的昌化江流域土地利用动态变化
[J]. 农业工程学报,2012,28(10):231-238.
[本文引用: 1]

[Xiao M,Wu J Q,Chen Q B,et al.Dynamic change of land use in Changhua downstream watershed based on CA-Markov model
[J]. Transactions of the Chinese Society of Agricultural Engineering,2012,28(10):231-238.]
[本文引用: 1]
相关话题/概率 空间 数据 养殖 逻辑