删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于3种空间预测方法的黄土区土壤颗粒组成空间分布研究—以宁夏海原县为例

本站小编 Free考研考试/2021-12-26

<script type="text/javascript" src="https://cdn.bootcss.com/mathjax/2.7.2-beta.0/MathJax.js?config=TeX-AMS-MML_HTMLorMML"></script> <script> MathJax.Hub.Config({ extensions: ["tex2jax.js"], jax: ["input/TeX", "output/HTML-CSS"], tex2jax: {inlineMath: [ ['$','$'], ["\\(","\\)"] ],displayMath: [ ['$$','$$'], ["\\[","\\]"] ],processEscapes: true}, "HTML-CSS": { availableFonts: ["TeX"] }, TeX: {equationNumbers: {autoNumber: ["none"], useLabelIds: true}}, "HTML-CSS": {linebreaks: {automatic: true}}, SVG: {linebreaks: {automatic: true}} }); </script> 申哲,1, 张认连1, 龙怀玉1, 王转1, 朱国龙1, 石乾雄2, 喻科凡1, 徐爱国,11中国农业科学院农业资源与农业区划研究所,北京 100081
2北京大学地球与空间科学学院,北京100871

Research on Spatial Distribution of Soil Particle Size Distribution in Loess Region Based on Three Spatial Prediction Methods—Taking Haiyuan County in Ningxia as an Example

SHEN Zhe,1, ZHANG RenLian1, LONG HuaiYu1, WANG Zhuan1, ZHU GuoLong1, SHI QianXiong2, YU KeFan1, XU AiGuo,11Institute of Agricultural Resources and Regional Planning, Chinese Academy of Agricultural Sciences, Beijing 100081
2School of Earth and Space Sciences, Peking University, Beijing 100871

通讯作者: 徐爱国,E-mail: xuaiguo@caas.cn

责任编辑: 李云霞
收稿日期:2019-12-10接受日期:2020-03-17网络出版日期:2020-09-16
基金资助:国家重点研发计划.2017YFD0200607
科技基础性工作专项.2012FY112100
中国农业科学院基本科研业务费专项.Y2020PT37
中国农业科学院基本科研业务费专项.1610132019043


Received:2019-12-10Accepted:2020-03-17Online:2020-09-16
作者简介 About authors
申哲,Tel:16619922154;E-mail: 18211097094@163.com










摘要
【目的】探索适合地形复杂的黄土母质地区土壤颗粒组成的空间预测方法。【方法】以宁夏自治区海原县为研究区域,结合地形因子、土壤类型、归一化植被指数变量,采用基于对称对数比转换的经验贝叶斯克里格法(SLR-EBK)、回归克里格法(SLR-RK)、随机森林(SLR-RF)3种方法对训练集100个样点表层土壤颗粒组成的空间分布进行预测,并通过验证集24个样点比较了3种方法的预测精度。【结果】(1)最终进入土壤颗粒组成线性回归预测模型的辅助变量包括高程(Ele)和土壤类型;进入RF模型的辅助变量包括高程(Ele)、土壤类型、坡度(Slo)和风力作用指数(WEI),其中,高程(Ele)是最重要的辅助变量,其次是土壤类型,坡度(Slo)和风力作用指数(WEI)重要性相对较低。(2)3种方法预测的海原县土壤各粒级含量空间分布的趋势基本一致,表现为砂粒含量西南部低,东北部高,粉粒、黏粒则相反。与SLR-EBK相比,SLR-RK和SLR-RF能够更好地反映局部变异并减小平滑效应。(3)SLR-RF法对验证集3个粒级含量预测的平均绝对误差(MAE)和均方根误差(RMSE)均低于其他两种方法,且从平均Aitchison距离(MAD)来看,SLR-RF(0.208)<SLR-RK(0.235)<SLR-EBK(0.274),表明SLR-RF的预测精度最高。【结论】海原县土壤颗粒组成空间预测的最优方法为SLR-RF;黄土母质区高程、土壤类型是与土壤颗粒组成的空间变异相关性较强的辅助变量。
关键词: 土壤颗粒组成;空间预测;经验贝叶斯克里格法;回归克里格法;随机森林;对称对数比转换

Abstract
【Objective】 This study was oriented to explore for a model that was capable of predicting spatial distribution of soil particle size distribution in the region with complicated terrain and single parent material, like Haiyuan County, Ningxia. 【Method】 Empirical Bayesian Kriging with the symmetry logratio transform (SLR-EBK), regression Kriging with the symmetry logratio transform (SLR-RK) and random forest with the symmetry logratio transform (SLR-RF) were used to predict spatial distribution of soil particle size distribution in Haiyuan County based on the training set of 100 samples, combined with topographic factors, normalized difference vegetation index and soil types, and then the predictions were validated with a validating set of 24 validation points in the study area for comparison of prediction accuracy. 【Result】 (1) The auxiliary variables that came into the linear regression equator for prediction included elevation (Ele) and soil types. The auxiliary variables that came into the RF model included Ele, soil type, slope (Slo) and wind exposition index (WEI), of which Ele was the most important auxiliary variable, followed by soil types. Slo and wind exposition index (WEI) were less important. (2) Results predicted by three methods showed a spatial distribution trend that the sand content was lower in the southwest and higher in the northeast of the county, while the silt content and clay content were higher in the southwest and lower in the northeast. SLR-RK and SLR-RF could better describe local variation of different soil particle size contents. (3) The mean absolute error (MAE) and root-mean-square error (RMSE) of SLR-RF were lower than those of the other two methods. As for mean Aitchison distance (MAD), the sequences of MAD were obtained as following: SLR-RF (0.208) <SLR-RK (0.235)<SLR-EBK (0.274), which indicated that SLR-RF had the smallest MAD. 【Conclusion】The optimal fitting model for prediction of distribution of soil particle size distribution was SLR-RF. In the loess region, elevation and soil types were the auxiliary variables, which had strong correlation with spatial variation of soil particle size distribution.
Keywords:soil particle size distribution;spatial prediction;empirical Bayesian Kriging;regression Kriging;random forest;symmetric log-ratio transform


PDF (2145KB)元数据多维度评价相关文章导出EndNote|Ris|Bibtex收藏本文
本文引用格式
申哲, 张认连, 龙怀玉, 王转, 朱国龙, 石乾雄, 喻科凡, 徐爱国. 基于3种空间预测方法的黄土区土壤颗粒组成空间分布研究—以宁夏海原县为例[J]. 中国农业科学, 2020, 53(18): 3716-3728 doi:10.3864/j.issn.0578-1752.2020.18.008
SHEN Zhe, ZHANG RenLian, LONG HuaiYu, WANG Zhuan, ZHU GuoLong, SHI QianXiong, YU KeFan, XU AiGuo. Research on Spatial Distribution of Soil Particle Size Distribution in Loess Region Based on Three Spatial Prediction Methods—Taking Haiyuan County in Ningxia as an Example[J]. Scientia Acricultura Sinica, 2020, 53(18): 3716-3728 doi:10.3864/j.issn.0578-1752.2020.18.008


0 引言

【研究意义】土壤质地是十分稳定的土壤自然属性,也是最基础的土壤物理性质之一,它影响土壤的通气透水性、保水保肥性[1],决定着诸多其他土壤物理化学行为。黄土高原地区是我国主要的农业生产区,也是水土流失严重、生态脆弱区[2],因此,利用空间预测方法实现对黄土区土壤颗粒组成空间分布的精准预测,了解其空间分布规律,有助于研究黄土区域土壤侵蚀和土壤化学元素行为特征,为区域农田施肥、灌水的精准化管理和土壤质量评价提供科学依据。【前人研究进展】地统计学方法是预测土壤属性空间分布最常见、最成熟的方法,以克里格插值最具代表性。传统的普通克里格(ordinary Kriging,OK)适用于较均一、土壤属性变化不强烈的环境[3,4],在小尺度和均质景观区域应用较多[5,6,7]。黄土高原地形复杂,土壤属性空间变异程度大,其空间分布受地形等因素影响显著[8,9],结合辅助变量的混合插值模型和常规统计模型在黄土区取得了较好的空间预测效果。文雯等[10]利用基于土地利用类型修正的OK对黄土丘陵区土壤有机碳进行了空间插值。连纲等[11]以地形因子和土地利用方式为辅助变量,采用多元线性回归(multiple linear regression,MLR)和回归克里格(regression Kriging,RK)对黄土高原县域土壤养分进行空间预测,结果表明RK有效地减小了预测残差,精度高于MLR。LIU等[12]利用空间状态方程和MLR结合地形、气候等要素对整个黄土高原的土壤有机碳进行空间模拟,结果表明空间状态方程取得了更好的预测效果。除加入辅助变量提高预测精度以外,经验贝叶斯克里格(empirical Bayesian Kriging,EBK)也被证明是一种可对非均质景观区域进行空间预测的插值方法[13],但目前该方法在黄土区应用较少。地统计和传统统计模型均难以拟合土壤属性和环境变量之间的非线性关系,且面临着处理类别型变量的困难。为克服这些局限,分类与回归树(classification and regression tree,CART)、神经网络(artificial neural network,ANN)等机器学习方法被引入到土壤属性空间预测中,研究表明这些模型能成功预测类别型变量、提高土壤属性预测的精度[14,15],但两者均易过度拟合[16,17],且神经网络过程繁琐。随机森林(random forest,RF)模型在分类与回归树模型基础上发展而来,具有计算简单、不易过度拟合、反映辅助变量重要程度等特点[18],目前在平原和山区、流域等母质多样化地区应用较多。LIU等[19]基于MODIS获取的地表温度资料,用RF法完成了江苏平原土壤颗粒组成、有机质和PH的空间制图。郭澎涛等[20]利用RF结合多源环境变量(成土母质、平均降雨量、平均气温和归一化植被指数)对橡胶园土壤全氮含量进行空间预测,并与MLR、CART比较,结果表明RF模型表现最优。MAREIKE等[21]在厄尔多瓜安第斯山脉对土壤颗粒组成空间分布的研究和GERALD等[22]在布基纳法索西南部小流域对土壤颗粒组成、有机碳空间预测的研究均表明,RF法优于其他机器学习方法。【本研究切入点】就研究对象而言,前人对黄土区土壤属性空间预测的研究集中在土壤养分指标,对土壤颗粒组成等物理属性研究相对较少。与土壤养分指标相比,土壤颗粒组成受人类活动等随机因素的影响较小,受母质、地形、气候等结构性因素影响较大,空间分布规律性更强。且土壤颗粒组成属于成分数据,预测结果要满足非负、定和为1的要求。就空间预测方法而言,目前黄土区已有的研究中对较新近的EBK使用较少,且缺乏地统计学方法与机器学习方法的对比研究。就辅助变量的选择而言,平原地区多选择高光谱数据[23,24]、地表温度[19]等作为辅助变量进行预测;山区、流域多为母质多样化地区,以地形因子结合成土母质[20,25]为辅助变量能取得理想的预测结果。但在地形复杂、母质较为单一的区域,成土母质无法作为辅助变量参与空间预测,仅使用地形因子预测可能精度并不高,需考虑加入其他环境变量提高预测精度。因此,对地形复杂、单一母质地区的土壤属性进行空间预测时,在方法的选择、辅助变量的选择方面仍需进一步研究。【拟解决的关键问题】本文选择黄土、黄土状母质的宁夏自治区海原县为研究区,选用3种方法(SLR-EBK、SLR-RK、SLR-RF)结合地形、土壤类型、归一化植被指数等辅助变量进行表层土壤颗粒组成的空间制图,并进行精度对比选出最优模型,以期为地形复杂的黄土母质区土壤颗粒组成的空间预测提供依据。

1 材料与方法

1.1 研究区概况

海原县地处黄土高原西北部(36°6′—37°4′N、105°9′—106°10′E),面积689 900 hm2。该区属大陆季风气候,年均气温7℃,≥10℃年积温2 398℃,年平均降水量 363 mm,降水量由南向北递减。县内地势由西南向东北倾斜(图1),地貌以黄土丘陵为主,南部月亮山、中部南华山、西部西华山、北部油井山呈孤立零星分布,被黄土丘陵包围,东北角与同心县交界处为狭长的河谷冲积平原,面积较小,为提灌区。研究区内绝大部分成土母质为黄土、黄土状母质,仅在南华山、西华山零星分布有岩石风化物。土壤类型包括灰褐土、黑垆土、黄绵土、灰钙土、新积土、红黏土和粗骨土7种,各土壤类型面积占比见表1。其中黄绵土、黑垆土、灰钙土3个土类面积最大,共占全县面积的81.51%。以盐池乡-李旺一线为界,此线以北主要为灰钙土,以南黄绵土和黑垆土插花分布,南华山、西华山发育有灰褐土,丘陵间低地及冲积平原有新积土分布。海原县以雨养农业为主,土地利用类型主要为旱地、草地,种植作物主要为玉米、荞麦、马铃薯。

图1

新窗口打开|下载原图ZIP|生成PPT
图1研究区位置及样点分布图

Fig. 1The map of the study position and sampling sites



Table 1
表1
表1各土壤类型面积占比及样点统计
Table 1The area proportion and sample points of each soil type
土壤类型
Soil type
采样个数
Sampling point
本县面积占比
Proportion of area (%)
黄绵土 Cultivated loessial soil6553.33
黑垆土 Dark loessial soil2115.31
灰钙土 Sierozem1914.87
灰褐土 Gray cinnamonic soil96.87
新积土 Alluvial soil54.71
粗骨土 Skeletal soil33.75
红黏土 Red clay21.16

新窗口打开|下载CSV

1.2 样品采集与分析

采用网格法布点,在此基础上综合考虑地形地貌、土壤类型等因素,在南华山、西华山等地形复杂地区加密样点,共选取具有代表性的样点124个(图1)。以盐池乡-南华山-九彩乡一线为界,南部面积占32%,采样点共53个,占全部采样点的43%,平均每4 300 hm2一个样点;北部面积占68%,采样点共71个,平均每6 600 hm2一个样点。研究区全部样点平均间隔7—8 km。东南部边缘因地势陡峭无路,取样较困难,故3个样点取在海原县外3—5 km范围内。各土壤类型的采样点个数见表1。土壤样品采集时间为2018年9月、2019年4月,采样深度为0—20 cm,记录样点经纬度、地形地貌、土壤类型、土地利用类型等信息。土壤颗粒组成采用湿筛-吸管法测定[26],粒级划分采用国际制(砂粒2—0.02 mm,粉粒0.02—0.002 mm,黏粒<0.002 mm)。

1.3 辅助变量来源及处理

海原县内地形复杂,地势起伏较大,海拔落差大于1 600 m,地貌类型主要包括山地、黄土丘陵、平原。因地形地貌不同,各区域温度、降水量、植被差异较大,直接影响成土过程,进而影响土壤颗粒组成的空间分布。土壤类型是五大成土因素综合作用的产物,一定程度上包含土壤质地的信息;土壤类型也含有母质信息,而本研究区母质相对单一,因此,其他因素对质地的影响会更大;另外,许多研究表明,土壤类型与土壤有机质、容重有一定相关性[27,28]。温度、降水量对土壤颗粒组成有影响,由于缺乏研究区较精细的温度、降水数据,而植被覆盖情况直接受温度、降水影响,且研究区基本为雨养农业,故将反映植被覆盖程度的归一化植被指数作为辅助变量反映气候因素。同时地形、土壤类型在一定程度上也包含气象信息。与土壤养分相比,土壤颗粒组成稳定,受人为耕作影响较小,研究区土地利用类型主要为旱地和草地,受灌水耕作影响很小,因此本研究区黏土矿物分解更加缓慢。综上所述,本研究选取的辅助变量为地形因子、土壤类型、归一化植被指数。

1.3.1 辅助变量来源

(1)宁夏自治区1﹕50 000等高线矢量图;(2)宁夏自治区1﹕200 000土壤图;(3)本文使用处于植物生长季(8—9 月)、且云量覆盖度少(小于5%)的卫星影像计算植被指数。2017年8月28日和9月6日的Landsat8 OLI_TIRS 四景卫星影像覆盖海原县全境,影像均来源于地理空间数据云网站(http://www. gscloud.cn)。由于缺乏研究区2018年5月以后的卫星影像,故采用前一年相应月份的影像代替。

1.3.2 辅助变量的提取及处理

(1)用1﹕50 000等高线矢量图在ArcGIS10.2中生成10 m分辨率的数字高程模型(digital elevation model,DEM)栅格影像,从中提取5个地形因子:高程(elevation,Ele)、坡度(slope,Slo)、平面曲率(horizontal curvature,HC)、剖面曲率(profile curvature,PC)、地形湿度指数(topographic wetness index,TWI)。使用SAGA GIS软件基于DEM提取风力作用指数(wind exposition index,WEI)[29],该指数是各个风向对区域的风影响(wind effect)[29]的平均值。WEI越大,表明该区域越容易受风力影响。(2)土壤类型(soil types,ST)为类别变量,本文采用“算术平均值变换”[30],以不同土壤类型下定量因变量的算术平均值代替该土壤类型,即将土壤类型变为一个具有7个数值的定量变量。由于有砂粒、粉粒、黏粒3个因变量,则土壤类型共转化为3组定量变量,分别用于构建砂粒、粉粒、黏粒的预测模型。算术平均值变换用动态思维(类别自变量与定量因变量的关系)建立起自变量各水平与定量结果变量之间数量关系,比传统的哑变量变换更具合理性[30];此外,哑变量变换将具有n个水平的类别变量变为(n-1)个二值变量,这些二值变量非相互独立[31],需全部进入回归模型中,造成模型中无关变量太多,拟合精度不高,而算术均值变换将类别变量变为具有n个数值的定量变量,提高了回归拟合精度[30]。(3)在ENVI5.1中对遥感影像进行镶嵌、计算,提取归一化植被指数(normalized difference vegetation index,NDVI)。(4)为消除变量之间的量纲影响,对变量进行归一化处理。

1.4 预测方法

1.4.1 数据转换方法 为了使数据满足正态分布,且使预测结果满足非负、定和为1的要求,本文首先对土壤颗粒组成进行对称对数比(symmetry log-ratio,SLR)转换[32],转换公式为:

$Z_{ij}^{\text{ }\!\!'\!\!\text{ }}=\ln \frac{{{Z}_{ij}}+{{\delta }_{j}}}{{{(\prod _{j=1}^{D}{{Z}_{ij}}+{{\delta }_{j}})}^{1/D}}}$
转回公式为:

${{Z}_{ij}}=\left( \frac{\exp Z_{ij}^{\text{ }\!\!'\!\!\text{ }}}{\sum _{j=1}^{D}\exp Z_{ij}^{\text{ }\!\!'\!\!\text{ }}}-\frac{{{\delta }_{j}}}{1+\sum _{j=1}^{D}{{\delta }_{j}}} \right)\left( 1+\sum\limits_{j=1}^{D}{{{\delta }_{j}}} \right)$
式中,Zij代表第i个样点第j种粒级的相对含量(%);

$Z_{ij}^{\text{ }\!\!'\!\!\text{ }}$代表第i个样点第j种粒级含量的转换值;D表示成分数据的维度,本文中D=3;δj为常数,取研究区第j种颗粒除0外最小含量的一半。

1.4.2 经验贝叶斯克里格(EBK) EBK在OK的基础上发展而来,可以通过构造子集、建立局部模型对非平稳数据进行空间插值[33]。它克服了OK的两大局限:第一,EBK则通过构造子集,通过评估较小子集上的半方差函数,在研究区的不同区域中得到不同的半方差函数模型,克服了OK假设单一半方差函数可准确表示所有位置数据的空间结构的局限。第二,在半方差函数的参数评估方面,OK只依赖于单一半方差函数,忽略了模型的不确定性[34],因此在构建半方差函数的过程中,需对每个参数进行手动反复调试,以使该模型更接近于真实的半方差函数。而EBK在每个子集中,自动评估半方差函数,并以此半方差函数来模拟子集中的新数据值。然后使用这些模拟的数据值来评估子集的新半方差函数。此模拟和评估过程重复多次,并且在每个子集中生成多个模拟的半方差函数,最后将这些模拟混合在一起以生成最终的预测图。本研究中,训练集砂粒、粉粒、黏粒含量经SLR转换后的全局Moran’s I(莫兰指数)分别为0.293、0.260、0.192,且P值均小于0.05,表明经SLR转换的土壤颗粒组成在研究区域内有一定的空间自相关性。ArcGIS趋势分析发现,转换后的砂粒、粉粒含量均存在二阶趋势,不满足空间平稳假设。Voronoi图也显示两者的局部空间规律变化较大,因此使用EBK进行空间插值。具体步骤为:(1)将数据分为多个特定大小的重叠子集(通过逐次尝试,最终本文每个子集设置为70个点,子集重叠系数设置为3,即每个点可落入3个子集中);(2)对子集中的数据进行半方差函数拟合;(3)使用该半方差函数,在每个输入位置生成新值;(4)使用新的模拟数据生成新的半方差函数;(5)将步骤(3)和(4)重复100次。此过程将为每个子集生成100个半方差函数,每个都是子集真实半方差函数的估计。将其绘制在一起生成按密度着色的半方差函数分布;(6)对于空间内每个位置,都使用唯一的半方差函数分布生成预测,该分布是通过周围子集的半方差函数分布加权综合计算得出的;子集距离预测位置越近,给定的权重就越高。这就保证了每个预测值使用的是临近数据所定义的模型,而不是远处数据所定义的模型[13]。最后,将局部预测结果混合生成全局预测结果。

1.4.3 回归克里格(RK) RK是应用多元线性回归拟合土壤属性与辅助变量间的关系,然后对回归残差应用克里格法插值,最后将回归预测结果与残差插值结果结合起来的一种空间预测方法。首先用皮尔森相关分析对辅助变量进行初步筛选,表2相关分析的结果表明,高程、归一化植被指数和土壤类型与土壤颗粒组成显著相关。其中,高程和NDVI均与土壤砂粒含量呈负相关,与粉粒和黏粒含量呈正相关。为避免辅助变量间的共线性问题,基于筛选出的变量,采用逐步线性回归的方法对经SLR转换后的土壤颗粒组成进行预测(F值的概率Fp<0.05为变量进入方程的标准,Fp>0.10为剔除变量的标准),并对预测残差进行简单克里格插值,最后将回归预测值与残差相加并转回得到预测结果。

Table 2
表2
表2土壤各粒级含量与辅助变量的相关性分析
Table 2Pearson correlation coefficients between soil particle size distribution and auxiliary variables
辅助变量
Auxiliary variable
粒级 Soil particle
砂粒 Slr-sand粉粒 Slr-silt黏粒 Slr-clay
高程Ele-0.387**0.341**0.239**
坡度Slo0.0440.061-0.111
平面曲率 HC-0.1290.0430.107
剖面曲率 PC-0.0180.019-0.011
地形湿度指数 TWI0.130-0.1320.065
风力作用指数 WEI0.129-0.045-0.111
归一化植被指数 NDVI-0.296**0.235**0.204**
土壤类型 ST10.576**----
土壤类型 ST2--0.435**--
土壤类型 ST3----0.466**
*表示相关性显著(P<0.05);**表示相关性极显著(P<0.01)。Slr-sand、Slr-silt、Slr-clay分别代表砂粒、粉粒、黏粒经对称对数比转换之后的数值,土壤类型ST1、ST2、ST3分别表示以Slr-sand、Slr-silt、Slr-clay为因变量,经算术平均值变换之后的土壤类型变量
*Denotes significant correlation (P<0.05); **denotes extremely significant correlation (P<0.01). Slr-sand, Slr-silt, and Slr-clay stand for symmetry log-ratio of sand, silt and clay contents respectively. ST1, ST2, and ST3 stand for the soil type after arithmetic mean transformation with Slr-sand, Slr-silt and Slr-clay as the dependent variable, respectively

新窗口打开|下载CSV

1.4.4 随机森林(RF) 与其他模型一样,随机森林(RF)可以反映若干自变量对因变量的作用[35]。其主要过程包括:从原始训练集中进行bootstrap重新抽样(有放回的随机抽取)构成新的训练集生成决策树;同时,随机地选择部分变量进行决策树节点的确定;随机地生成几百至几千个决策树构成随机森林。对于分类问题,所有决策树预测结果中得票最高的分类结果为最终结果;对于回归问题,所有决策树预测结果的平均值为最终的预测结果[18]。每次未被抽到的样本组成袋外样本,故RF可根据袋外误差估计模型误差,对于分类问题,袋外误差是分类错误率;对于回归问题,袋外误差通过回归残差计算,本文采用均方误差(mean square eroor,MSE)。

RF不要求原始数据符合正态分布,但为了更好地同其他两种方法做对比,且使预测结果满足定和为1的要求,本研究使用经SLR转换后的数据进行建模。由于RF不是简单的线性回归,皮尔森相关分析筛选变量的结果不一定适合RF模型,故用两步法对RF辅助变量进行筛选:对变量进行重要性排序,初步剔除不重要变量[36];对剩下的变量,基于随机森林逐步选择[37]。本文采用Breiman经典随机森林版本中的评价方法,通过变量值的置换计算变量重要性得分,剔除得分小于0的变量。结果表明平面曲率、剖面曲率两个辅助变量重要性得分均小于0,故剔除。剩下的变量按照重要性评分降序排列,以不同的变量子集所构建森林运行100次的MSE均值作为逐步筛选变量的标准,从最重要变量开始,遍历所有变量,MSE最小结束(变量筛选过程中,RF参数均为默认参数)。基于筛选的辅助变量对RF模型进行参数优化:首先以MSE最小化为目标,通过逐次计算确定决策树节点分裂时所用变量个数(mtry);通过观察决策树数量(ntree)与误差关系图,在保证误差稳定的前提下,选择较小的ntree[38]

本研究中随机森林在R3.5.2中完成,相关性分析和逐步回归使用SPSS 22软件,经验贝叶斯克里格插值、回归残差的简单克里格插值和空间制图在ArcGIS 10.2中完成。

1.5 精度验证

从124个样点中随机选取80%的(100个)样点用于空间预测,20%的(24个)样点用于精度验证[39,40],训练样点和验证样点的分布如图1所示。本研究采用验证集的平均绝对误差(MAE)、均方根预测误差(RMSE)、平均Aitchison距离(MAD)[41]进行模型精度评价。MAE能更好地反映预测值误差的实际情况;RMSE对系统误差和随机误差都很敏感,常用来评估不同模型的预测精度;MAD可以反映成分数据预测值和观测值之间整体的相似性。MAE、 RMSE、MAD越小,模型精度越高。

$\text{MAE}=\frac{1}{n}\sum\limits_{i=1}^{n}{\left| {{Z}_{ij}}-Z_{ij}^{\text{*}} \right|}$ j=1,2,3
$\text{RMSE}=\sqrt{\frac{1}{n}{{\sum\limits_{i=1}^{n}{\left( {{Z}_{ij}}-Z_{ij}^{\text{*}} \right)}}^{2}}}$ j=1,2,3
$\text{MAD}=\frac{1}{n}\sum\limits_{i=1}^{n}{\sqrt{\sum\limits_{i=1}^{D}{\left( \ln \frac{{{Z}_{ij}}}{{{(\prod _{j=1}^{D}{{Z}_{ij}})}^{1/D}}}-\ln \frac{Z_{ij}^{\text{*}}}{{{(\prod _{j=1}^{D}Z_{ij}^{\text{*}})}^{1/D}}} \right)}}}$
Zij代表第i个样点第j种粒级含量的观测值;$Z_{ij}^{\text{*}}$代表第i个样点第j种粒级含量的预测值;n表示验证点的数量;D表示成分数据的维度,本文中D=3。

2 结果

2.1 土壤颗粒组成的描述性统计特征

表3为研究区采样点土壤颗粒组成的描述性统计结果,可以看出研究区土壤砂粒含量最高(训练集和验证集砂粒平均含量分别为61.82%、63.96%),黏粒含量最低(训练集和验证集的平均黏粒含量分别为14.56%、13.36%),粉粒含量居中(训练集和验证集的平均粉粒含量分别为23.62%、22.68%)。训练集中3个粒级含量的范围和标准差都比验证集中的大,相对应地,训练集中砂粒、粉粒、黏粒含量的变异系数(14.02%、23.96%、27.41%)大于验证集(11.30%、21.91%、25.45%)。方差分析结果表明训练集与验证集土壤3个粒级含量差异均不显著,表明训练数据和验证数据都具有较好的代表性。训练集中3个粒级含量偏度均接近于0,但经Kolmogorov-Smirnov检验,只有砂粒含量P值大于0.05,满足正态分布,粉粒和黏粒含量均不符合正态分布。经SLR转换后,砂粒、粉粒、黏粒含量均符合正态分布,可用于空间插值和线性回归。

Table 3
表3
表3研究区采样点土壤颗粒组成基本统计特征
Table 3Statistical characters of soil particle size distribution in study area
样本组
Sample group
粒级
Soil particle
样本数
Sample size
最大值
Max (%)
最小值
Min (%)
均值
Mean (%)
标准差
Std. deviation (%)
变异系数
CV (%)
偏度
Skewness
训练集
Calibration sample
砂粒Sand10079.1843.1561.828.6714.02-0.04
粉粒 Silt10040.4013.2123.625.6623.960.16
黏粒Clay10023.077.5914.564.0027.470.24
验证集
Validation sample
砂粒Sand2477.4948.6863.967.2311.30-0.34
粉粒 Silt2434.0613.7622.684.9721.910.48
黏粒Clay2422.618.1013.363.4025.450.72

新窗口打开|下载CSV

2.2 多元线性回归和RF模型的构建

表4可以看出,最终进入土壤颗粒组成线性回归预测模型的辅助变量包括高程Ele和土壤类型,NDVI由于与高程、土壤类型存在多重共线性,在逐步线性回归的过程中被剔除。从调整决定系数(Adjusted R2)来看,砂粒含量的线性回归模型方差解释率最高(0.339),拟合度较好;粉粒和黏粒含量的线性回归方程方差解释率较低(分别为0.208,0.205),拟合度较差。表5为RF模型的拟合结果,可以看出进入模型预测的辅助变量除了高程Ele、土壤类型外,还包括坡度Slo和风力作用指数WEI,这主要是因为RF可以拟合土壤颗粒组成和辅助变量之间的非线性关系。其中,高程对3个粒级含量的空间预测来说,均是最重要的辅助变量,其次是土壤类型,坡度、风力作用指数的重要性相对较低。虽然RF对辅助变量间的多重共线性不敏感,但考虑到NDVI对预测精度无显著影响,为了简化模型,提高计算速度,本研究未将NDVI作为RF的辅助变量。

Table 4
表4
表4土壤颗粒组成逐步线性回归方程拟合结果
Table 4Fitting of soil particle size distribution with the stepwise linear regression equation
粒级Soil particle方程Equator调整决定系数Adjusted R2概率Probability
砂粒 Slr-sandslr-sand=0.160-0.140Ele+0.875ST10.339<0.001
粉粒 Slr-siltslr-silt=-0.070+0.097Ele+0.811ST20.208<0.001
黏粒 Slr-clayslr-clay=-0.054+0.042Ele+0.945ST30.205<0.001

新窗口打开|下载CSV

Table 5
表5
表5SLR-RF参数拟合结果
Table 5SLR-RF parameter fitting results
粒级Soil particle辅助变量Auxiliary variableNtreeMtry
砂粒 Slr-sandEle、ST1、Slo、WEI3002
粉粒 Slr-siltEle、ST2、Slo、WEI3002
黏粒 Slr-clayEle、ST3、Slo、WEI3002
RF建模变量按重要性由高到低列出
Variables of RF screened are listed by their importance from high to low

新窗口打开|下载CSV

2.3 土壤颗粒组成的空间分布预测结果

利用拟合的SLR-EBK、SLR-RK和RF模型分别对研究区土壤砂粒、粉粒、黏粒含量的空间分布进行预测,得到其空间分布图(图2—4)。可以看出,3种方法预测的土壤各粒级含量空间分布的趋势大体一致。研究区砂粒含量基本呈现西南部低,东北部高的趋势,其中西华山-南华山-九彩乡海拔较高一带含量较低,集中在60%以下,北部和东部边缘含量较高,大多数为65%—70%,部分达到70%以上。粉粒和黏粒含量的空间分布趋势与砂粒相反,呈现西南部高,东北部低的趋势,西华山-南华山-九彩乡一带粉粒含量变化范围集中在25%—30%,黏粒含量变化范围集中在15%—20%,北部和东部边缘粉粒含量低至20%以下,黏粒含量大部分为10%—15%。土壤颗粒组成的空间分布趋势明显受到海拔的影响。

图2

新窗口打开|下载原图ZIP|生成PPT
图2SLR-EBK预测土壤颗粒组成空间分布图

Fig. 2Spatial distribution of soil particle size distribution predicted by SLR-EBK



图3

新窗口打开|下载原图ZIP|生成PPT
图3SLR-RK预测土壤颗粒组成空间分布图

Fig. 3Spatial distribution of soil particle size distribution predicted by SLR-RK



图4

新窗口打开|下载原图ZIP|生成PPT
图4SLR-RF预测土壤颗粒组成空间分布图

Fig. 4Spatial distribution of soil particle size distribution predicted by SLR-RF



虽然3种方法预测的土壤颗粒组成空间分布总体趋势比较相似,但在局部区域上不尽相同。首先,SLR-RK和SLR-RF的预测结果对细节刻画比较清晰,而SLR-EBK预测结果只能反映海原县土壤颗粒组成的宏观分布趋势,难以体现局部变异信息。其次,虽然3种方法预测的砂粒、粉粒、黏粒含量的平均值相近(SLR-EBK、SLR-RK、SLR-RF 3种方法预测砂粒含量的均值分别为62.32%、62.83%、62.53%,粉粒含量的均值分别为23.34%、23.25%、23.38%,黏粒含量的均值分别为14.34%、13.91%、14.09%),但由图2—4可以看出,SLR-EBK存在平滑效应,与土壤采样点原始数据相比,该方法预测的极大值和极小值均向均值方向靠拢,SLR-RK与SLR-RF的预测范围更接近实测值。

2.4 不同预测方法的精度对比

表6列出了3种方法在验证集的预测精度,可以看出SLR-RF法对3个粒级含量预测的MAE和RMSE均低于其他两种方法,且SLR-RF的MAD(0.208)最低,表明该方法的预测精度更高。因此,研究区土壤颗粒组成的最优预测模型为SLR-RF。

Table 6
表6
表6不同空间预测方法精度对比
Table 6Accuracy comparison of different spatial prediction methods
方法
Method
砂粒 Sand粉粒 Silt黏粒 ClayMAD
MAE (%)RMSE (%)MAE (%)RMSE (%)MAE (%)RMSE (%)
SLR-EBK5.7066.7413.5154.3083.1134.0690.274
SLR-RK4.4045.4472.7563.4082.8393.6770.235
SLR-RF3.8094.8682.6233.3172.1892.9140.208

新窗口打开|下载CSV

3 讨论

3.1 3种预测方法的精度

本文利用3种方法在宁夏南部黄土丘陵区对土壤颗粒组成的空间分布进行预测,结果显示,SLR-EBK方法预测精度较低,原因在于空间插值方法仅利用了土壤颗粒组成的空间自相关性,忽略了环境变量的影响。虽然EBK在一定程度上考虑了土壤属性变化的不均匀性,但由于本研究区地形破碎,且南部高山区与北部黄土丘陵区气候条件差异大,故SLR-EBK法预测精度并不高。

SLR-RK、SLR-RF法由于引入辅助变量参与预测,提高了土壤颗粒组成的空间预测精度,相比SLR-RK,SLR-RF的预测精度更高。可以看出,虽然RK通过对回归残差进行简单克里格插值进一步提高了多元线性回归的预测精度,但RF通过精确捕捉土壤属性同辅助变量之间的非线性关系,依然取得了比RK更好的预测效果。在黄土母质区,地形是影响土壤属性的主要因素,精确拟合地形因子与土壤属性之间的关系是进行土壤属性空间预测的关键所在。小尺度下,气候、植被等环境条件相对一致,地形因子与土壤属性之间的关系较为简单,可直接利用线性回归拟合[20]。王库[42]以高程、坡度等为辅助变量,使用RK对福建省旗山北麓一块面积为29 000 hm2的区域进行土壤全氮的空间预测,结果表明,RK取得了较高的预测精度,验证集的决定系数达到0.682。MOORE等[43]在科罗拉多州一块5.4 hm2的坡面上,利用多元线性回归结合地形因子(坡度、坡向、平面曲率、剖面曲率、地形湿度指数等)对土壤属性(有机质、pH、砂粒含量、粉粒含量等)进行空间预测,取得了理想的预测结果。但在大尺度区域,随着地形的变化,气候、植被等也出现明显变化,土壤属性与地形因子之间往往表现出非线性的特征,这时运用RF进行空间预测就有明显优势。姜赛平[28]等以整个海南岛(3.29×106 hm2)为研究区域,利用RK、RF结合辅助变量预测全岛的有机质空间分布,结果表明RF预测精度高于RK,更适合地形复杂的大尺度地区土壤属性的空间预测。本研究区面积达689 900 hm2,南北部地形、气候、植被差异较大,部分地形因子(坡度、风力作用指数)与土壤颗粒组成无显著的线性关系,并未进入回归方程,但却进入RF模型参与空间预测,表明RF模型可以拟合土壤属性同环境变量之间的非线性关系,进一步提高预测精度。除地形因子外,本研究中土壤类型也是预测土壤颗粒组成的重要变量。土壤类型属于类别变量,与多元线性回归模型相比,RF对类别变量具有更好的包容性[44],可以更多地捕捉土壤颗粒组成与土壤类型之间的关系。综上所述,RF更适合用于预测研究区土壤颗粒组成的空间分布。

3.2 土壤颗粒组成空间分布与辅助变量的关系

地形作为五大成土因素之一,通过影响物质与能量的再分配,引起土壤的理化性质变化[45]。本研究中,高程是预测土壤颗粒组成最重要的地形因子。皮尔森相关分析和空间预测结果均表明,海拔高度越高,砂粒含量越低,粉粒和黏粒含量越高。这与部分****[46,47,48]低海拔地区土壤黏粒含量更高的研究结果不符。但也有****与本文研究结果相似,BACIS等[49]在巴西杰尼罗州的研究表明高程与土壤质地的变异密切相关,海拔越高,黏粒含量越高。这是因为前者[46,47,48]的研究中,海拔主要影响土壤颗粒的运移速度和方向,粒径较小的颗粒在重力和地表径流的作用下运移的距离更远。BACIS等[49]的研究中,与海拔密切相关的是土壤母质,该地区高海拔区域土壤主要由前寒武纪片麻岩原位风化形成,质地较细;低海拔区域以砂质坡积物为主,砂粒含量较高。本研究中,海拔主要影响区域降水、植被等,研究区内区域降水量差异大,以盐池乡-李旺一线为界,南部高海拔地区降水在400 mm以上,植被覆盖度高,湿润的条件有利于黏土矿物的形成;北部低海拔地区降水为200—350 mm,植被覆盖度低,地表裸露多,蒸发强烈,土壤颗粒较粗。这也与NDVI和砂粒含量呈显著负相关,和粉粒和黏粒含量呈正相关的结果相一致。除高程外,坡度、风力作用指数两个地形因子也进入RF模型(表5),但重要性相对较低,表明这两个辅助变量虽然也会影响土壤颗粒组成的空间分布,但影响程度较小。坡度通过影响表层土壤颗粒运动、径流挟沙能力和侵蚀方式[50,51],从而影响土壤颗粒组成。邹心雨等[52]等研究表明,坡度对小尺度下土壤颗粒组成的空间变异影响较大,本文研究尺度较大,坡度的影响并不显著。

除地形因子外,土壤类型也是预测土壤颗粒组成的重要变量。土壤类型在一定程度上可以反映母质、气候等信息,杨艳丽等[53]研究表明,土壤类型与黏粒含量的空间分布显著相关。海原县绝大部分区域为黄土、黄土状母质,在此母质上发育有黄绵土、灰钙土和黑垆土,与黄绵土和灰钙土相比,黑垆土形成的环境条件更为湿润,黏粒含量更高。海拔2 100 m以上的南华山、西华山中上部分布有页岩、泥岩和片岩的风化物,这些岩石风化物是形成山地灰褐土的主要母质,其中页岩、泥岩属于沉积岩中的泥质岩类,发育形成的土壤颗粒较细。新积土、粗骨土和红黏土的面积较小,其中新积土是在水力或重力迁移堆积的物质上形成,主要分布于东北角的冲积平原,颗粒较细;粗骨土仅分布于西华山等山地的陡坡,含较多的砂岩风化碎屑,植被覆盖度很低,土壤颗粒较粗。红黏土主要分布于研究区东南角,为裸露的第三纪红土层,质地较黏重。

本研究区地形复杂,地形因子是重要的辅助变量;区内土地利用类型多为天然草地和旱地,且单季种植,土壤物理性状受人为影响不强烈。因此要对平原地区、受人类活动影响强烈的地区进行颗粒组成的空间预测,仍需探索选取适当的辅助变量和预测方法。

4 结论

3种方法(SLR-EBK、SLR-RK和SLR-RF)预测的海原县土壤各粒级含量空间分布的趋势基本一致,表现为砂粒含量西南部低,东北部高,粉粒、黏粒则相反; SLR-RF、SLR-RK预测精度均高于SLR-EBK,其中以SLR-RF预测精度最高,为预测海原县土壤颗粒组成空间分布的最优方法;在黄土母质区,高程、土壤类型是与土壤颗粒组成的空间变异相关性较强的辅助变量。

参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子

吴克宁, 赵瑞. 土壤质地分类及其在我国应用探讨
土壤学报, 2019,56(1):227-241.

[本文引用: 1]

WU K N, ZHAO R. Soil texture classification and its application in China
Acta Pedologica Sinica, 2019,56(1):227-241. (in Chinese)

[本文引用: 1]

李宗善, 杨磊, 王国梁, 侯建, 信忠保, 刘国华, 傅伯杰. 黄土高原水土流失治理现状、问题及对策
生态学报, 2019,39(20):7398-7409.

[本文引用: 1]

LI Z S, YANG L, WANG G L, HOU J, XIN Z B, LIU G H, FU B J. The management of soil and water conservation in the Loess Plateau of China: Present situations, problems, and counter-solutions
Acta Ecologica Sinica, 2019,39(20):7398-7409. (in Chinese)

[本文引用: 1]

LIU T L, JUANG K W, LEE D Y. Interpolating soil properties using kriging combined with categorical information of soil maps
Soil Science Society of America Journal, 2006,70(4):1200-1209.

DOI:10.2136/sssaj2005.0126URL [本文引用: 1]

徐剑波, 宋立生, 彭磊, 张桥. 土壤养分空间估测方法研究综述
生态环境学报, 2011,20(8/9):1379-1386.

[本文引用: 1]

XU J B, SONG L S, PENG L, ZHANG Q. Research review on methods of spatial prediction of soil nutrients
Ecology and Environmental Sciences, 2011, 20(8/9):1379-1386. (in Chinese)

URL [本文引用: 1]

HEBA E, MOHAMED A, ADEL A A, GAD A A. Spatial variation of soil carbon and nitrogen pools by using ordinary Kriging method in an area of north Nile Delta, Egypt
Catena, 2014,113:70-78.

DOI:10.1016/j.catena.2013.09.008URL [本文引用: 1]
Nile Delta includes part of the most fertile and populated lands in the world. However, there is no accurate and reliable database about C and N pools of this region; in addition there are no published data in this regard. Spatial variation of soil C and N pools was studied based on Ordinary Kriging (OK) as a geostatistical method. This method was used for converting sampled soil C and N data to continuous maps of C and N pools in Northern part on Nile Delta, Egypt. The data revealed different levels of variability of C and N pools in the study area. The total C pool (TCP) ranged between 1.6 and 122.7 Mg/ha; while total N pool (TNP) ranged between 03 and 7.6 Mg/ha. Soil organic carbon pool (SOCP) ranged between 03 and 76.4 Mg/ha, whereas soil inorganic carbon pool (SOCP) ranged between 12 and 90.5 Mg/ha. Soil C and N pools are the lowest in the Northern part in the study area which is close to Mediterranean Sea coast because of low organic matter inputs in addition to salinity and alkalinity. (C) 2013 Elsevier BM.

WANG Z, SHI W J. Mapping soil particle-size fractions: A comparison of compositional kriging and log-ratio kriging
Journal of Hydrology, 2017,546(3):526-541.

DOI:10.1016/j.jhydrol.2017.01.029URL [本文引用: 1]

何甜辉, 蔡建楠, 罗杰敏, 何冠星, 邓依婷. 基于普通克里格的中山市农田土壤砷的空间变异特性
四川化工, 2018,122(2):55-57.

URL [本文引用: 1]

HE T H, CAI J N, LUO J M, HE G X, DENG Y T. Spatial variation characteristics of arsenic in farmland soil based on ordinary kriging in Zhongshan city
Sichuan Chemical Industry, 2018, 122(2):55-57. (in Chinese)

[本文引用: 1]

宋丰骥, 常庆瑞, 钟德燕. 黄土高原沟壑区土壤养分空间变异及其与地形因子的相关性
西北农林科技大学学报(自然科学版), 2011,39(12):174-180.

[本文引用: 1]

SONG F J, CHANG Q R, ZHONG D Y. Spatial variability of soil nutrients and its relations to topographical factors in hilly and gully area of Loess Plateau
Journal of Northwest A & F University (Natural Science Edition), 2011,39(12):174-180. (in Chinese)

[本文引用: 1]

解文艳, 周怀平, 杨振兴, 冯悦晨, 白雪, 杜燕玲. 黄土高原东部潇河流域农田土壤有机质时空变异及影响因素
农业资源与环境学报, 2019,36(1):96-104.

[本文引用: 1]

XIE W Y, ZHOU H P, YANG Z X, FENG Y C, BAI X, DU Y L. The spatial-temporal variation of soil organic matter and its influencing factors in Xiaohe River basin in eastern Loess Plateau, China
Journal of Agricultural Resources and Environment, 2019,36(1):96-104. (in Chinese)

[本文引用: 1]

文雯, 周宝同, 汪亚峰, 黄勇. 基于辅助环境变量的土壤有机碳空间插值—以黄土丘陵区小流域为例
生态学报, 2013,33(19):6389-6397.

DOI:10.5846/stxb201305030916URL [本文引用: 1]
利用普通克里格法(OK)、反距离加权法(IDW)、径向基函数法(RBF)、基于土地利用类型修正的普通克里格法(OK_LU)4种插值方法,对黄土丘陵羊圈沟小流域的土壤有机碳含量进行空间插值。预测结果的准确性通过Pearson相关系数(R),平均绝对误差(MAE),均方根误差(RMSE),准确度(AC)来评价。研究结果表明:(1)在前3种常规空间插值方法中,OK对刻画区域土壤有机碳的空间分布趋势效果最佳,其预测MAE值和RMSE值均为最小,Pearson相关系数(R)和准确度(AC)最大,说明其预测结果的准确性最好、预测的极端误差也最小;其次为RBF;IDW预测的效果最差。(2)OK_LU在空间特征表达方面能够更好地反映复杂地形区的局部变异,其插值结果的精度相比OK有一定程度的提高,其平均绝对误差(MAE)从0.900%降到了0.567%,均方根误差(RMSE)从1.101%降到了0.777%,Pearson相关系数(R)从0.4026提高到0.5589,准确度(AC)从0.9081提高到0.9505。综合比较,在黄土丘陵地区,OK_LU能使插值结果的精度有较大提高,是土壤有机碳空间制图的有效途径。
WEN W, ZHOU B T, WANG Y F, HUANG Y. Soil organic carbon interpolation based on auxiliary environmental covariates: a case study at small watershed scale in Loess Hilly region
Acta Ecologica Sinica, 2013,33(19):6389-6397. (in Chinese)

DOI:10.5846/stxb201305030916URL [本文引用: 1]
利用普通克里格法(OK)、反距离加权法(IDW)、径向基函数法(RBF)、基于土地利用类型修正的普通克里格法(OK_LU)4种插值方法,对黄土丘陵羊圈沟小流域的土壤有机碳含量进行空间插值。预测结果的准确性通过Pearson相关系数(R),平均绝对误差(MAE),均方根误差(RMSE),准确度(AC)来评价。研究结果表明:(1)在前3种常规空间插值方法中,OK对刻画区域土壤有机碳的空间分布趋势效果最佳,其预测MAE值和RMSE值均为最小,Pearson相关系数(R)和准确度(AC)最大,说明其预测结果的准确性最好、预测的极端误差也最小;其次为RBF;IDW预测的效果最差。(2)OK_LU在空间特征表达方面能够更好地反映复杂地形区的局部变异,其插值结果的精度相比OK有一定程度的提高,其平均绝对误差(MAE)从0.900%降到了0.567%,均方根误差(RMSE)从1.101%降到了0.777%,Pearson相关系数(R)从0.4026提高到0.5589,准确度(AC)从0.9081提高到0.9505。综合比较,在黄土丘陵地区,OK_LU能使插值结果的精度有较大提高,是土壤有机碳空间制图的有效途径。

连纲, 郭旭东, 傅伯杰, 虎陈霞. 黄土高原县域土壤养分空间变异特征及预测—以陕西省横山县为例
土壤学报, 2008,45(4):3-10.

[本文引用: 1]

LIAN G, GUO X D, FU B J, HU C X. Spatial variability and prediction of soil nutrients on a county scale on the Loess Plateau-a case study of Hengshan county, Shaanxi province
Acta Pedologica Sinica, 2008,45(4):3-10. (in Chinese)

[本文引用: 1]

LIU Z P, SHAO M A, WANG Y Q. Estimating soil organic carbon across a large-scale region: A state-space modeling approach
Soil Science, 2012,177:607-618.

DOI:10.1097/SS.0b013e318272f822URL [本文引用: 1]

SAMSONOVA V P, BLAGOVESHCHENSKII Y N, MESHALKINA Y L. Use of empirical Bayesian kriging for revealing heterogeneities in the distribution of organic carbon on agricultural lands
Eurasian Soil Science, 2017,50(3):305-311.

DOI:10.1134/S1064229317030103URL [本文引用: 2]

杨文静, 王一博, 刘鑫, 孙哲. 基于BP神经网络的青藏高原土壤养分评价
冰川冻土, 2019,41(1):215-226.

[本文引用: 1]

YANG W J, WANG Y B, LIU X, SUN Z. Nutrient evaluation of the soil in the Qinghai-Tibet Plateau based on BP neural network
Journal of Glaciology and Geocryology, 2019,41(1):215-226. (in Chinese)

[本文引用: 1]

周斌, 许红卫, 王人潮. 基于分类树方法的土壤有机质空间制图研究
土壤学报, 2003,40(6):801-808.

[本文引用: 1]

ZHOU B, XU H W, WANG R C. Soil Organic matter mapping based on classification tree modeling
Acta Pedologica Sinica, 2003,40(6):801-808. (in Chinese)

[本文引用: 1]

ITO E, ONO K, ITO Y M, ARAKI M. A neural network approach to simple prediction of soil nitrification potential: A case study in Japanese temperate forests
Ecological Modelling, 2008,219(1/2):200-211.

DOI:10.1016/j.ecolmodel.2008.08.011URL [本文引用: 1]

郑伟, 马楠. 一种改进的决策树后剪枝算法
计算机与数字工程, 2015,43(6):26-32.

[本文引用: 1]

ZHENG W, MA N. An improved post-pruning algorithm for decision tree
Computer and Digital Engineering, 2015,43(6):26-32. (in Chinese)

[本文引用: 1]

BREIMAN L. Random Forests
Machine Learning, 2001,45(1):5-32.

DOI:10.1023/A:1010933404324URL [本文引用: 2]
Random forests are a combination of tree predictors such that each tree depends on the values of a random vector sampled independently and with the same distribution for all trees in the forest. The generalization error for forests converges a.s. to a limit as the number of trees in the forest becomes large. The generalization error of a forest of tree classifiers depends on the strength of the individual trees in the forest and the correlation between them. Using a random selection of features to split each node yields error rates that compare favorably to Adaboost (Y. Freund & R. Schapire, Machine Learning: Proceedings of the Thirteenth International conference, ***, 148–156), but are more robust with respect to noise. Internal estimates monitor error, strength, and correlation and these are used to show the response to increasing the number of features used in the splitting. Internal estimates are also used to measure variable importance. These ideas are also applicable to regression.

LIU F, ROSSITER D, SONG X D, ZHANG G L, WU H Y, ZHAO Y G. An approach for broad-scal epredictive soil properties mapping in low-relief areas based on responses to solar radiation
Soil Science Society of America Journal, 2020, 84(1):1-19.

DOI:10.1002/saj2.v84.1URL [本文引用: 2]

郭澎涛, 李茂芬, 罗微, 林清火, 唐群锋, 刘志崴. 基于多源环境变量和随机森林的橡胶园土壤全氮含量预测
农业工程学报, 2015,31(5):194-200.

URL [本文引用: 3]
土壤全氮与土壤肥力和土壤氮循环紧密相关。掌握土壤全氮详细的空间分布信息对提高土壤肥力管理效率和更好地了解土壤氮循环至关重要。该文以儋州国营橡胶园为研究区域,采集2511个土壤样品,利用随机森林(random forest,RF)、逐步线性回归(stepwise linear regression,SLR)、广义加性混合模型(generalized additive mixed model,GAMM)以及分类回归树(classification and regression tree,CART)结合多源环境变量(成土母质、平均降雨量、平均气温和归一化植被指数)对研究区橡胶园土壤全氮含量进行空间预测,并通过754个独立验证点比较了4种模型的预测精度。结果表明RF对土壤全氮的预测值和实测值的相关系数(0.82)明显高于SLR(0.68)、GAMM(0.70)和CART(0.69),而RF的预测平均绝对误差(0.08836 g/kg)和均方根误差(0.13090 g/kg)均低于SLR、GAMM和CART。此外,RF模型预测结果能反映更为详细的局部土壤全氮含量空间变化信息,与实际情况更为接近。可见,RF模型可作为橡胶园土壤全氮含量空间分布预测的高效方法,为其他土壤属性的空间分布预测提供了一种新的方法。
GUO P T, LI M F, LUO W, LIN Q H, TANG Q F, LIU Z W. Prediction of soil total nitrogen for rubber plantation at regional scale based on environmental variables and random forest approach
Transactions of the Chinese Society of Agricultural Engineering, 2015,31(5):194-200. (in Chinese)

URL [本文引用: 3]
土壤全氮与土壤肥力和土壤氮循环紧密相关。掌握土壤全氮详细的空间分布信息对提高土壤肥力管理效率和更好地了解土壤氮循环至关重要。该文以儋州国营橡胶园为研究区域,采集2511个土壤样品,利用随机森林(random forest,RF)、逐步线性回归(stepwise linear regression,SLR)、广义加性混合模型(generalized additive mixed model,GAMM)以及分类回归树(classification and regression tree,CART)结合多源环境变量(成土母质、平均降雨量、平均气温和归一化植被指数)对研究区橡胶园土壤全氮含量进行空间预测,并通过754个独立验证点比较了4种模型的预测精度。结果表明RF对土壤全氮的预测值和实测值的相关系数(0.82)明显高于SLR(0.68)、GAMM(0.70)和CART(0.69),而RF的预测平均绝对误差(0.08836 g/kg)和均方根误差(0.13090 g/kg)均低于SLR、GAMM和CART。此外,RF模型预测结果能反映更为详细的局部土壤全氮含量空间变化信息,与实际情况更为接近。可见,RF模型可作为橡胶园土壤全氮含量空间分布预测的高效方法,为其他土壤属性的空间分布预测提供了一种新的方法。

MAREIKE L, BRUNO G, BERND H. Uncertainty in the spatial prediction of soil texture: comparison of regression tree and random forest models
Geoderma, 2012,170(3):70-79.

DOI:10.1016/j.geoderma.2011.10.010URL [本文引用: 1]

GERALD F, OZIAS K L, HOUNKPATIN, GERHARD W, THIEL M. High resolution mapping of soil properties using remote sensing variables in south-western Burkina Faso: A comparison of machine learning and multiple linear regression models
Plos One, 2017, 12(1):e0170478.

DOI:10.1371/journal.pone.0170478URLPMID:28114334 [本文引用: 1]
Accurate and detailed spatial soil information is essential for environmental modelling, risk assessment and decision making. The use of Remote Sensing data as secondary sources of information in digital soil mapping has been found to be cost effective and less time consuming compared to traditional soil mapping approaches. But the potentials of Remote Sensing data in improving knowledge of local scale soil information in West Africa have not been fully explored. This study investigated the use of high spatial resolution satellite data (RapidEye and Landsat), terrain/climatic data and laboratory analysed soil samples to map the spatial distribution of six soil properties-sand, silt, clay, cation exchange capacity (CEC), soil organic carbon (SOC) and nitrogen-in a 580 km2 agricultural watershed in south-western Burkina Faso. Four statistical prediction models-multiple linear regression (MLR), random forest regression (RFR), support vector machine (SVM), stochastic gradient boosting (SGB)-were tested and compared. Internal validation was conducted by cross validation while the predictions were validated against an independent set of soil samples considering the modelling area and an extrapolation area. Model performance statistics revealed that the machine learning techniques performed marginally better than the MLR, with the RFR providing in most cases the highest accuracy. The inability of MLR to handle non-linear relationships between dependent and independent variables was found to be a limitation in accurately predicting soil properties at unsampled locations. Satellite data acquired during ploughing or early crop development stages (e.g. May, June) were found to be the most important spectral predictors while elevation, temperature and precipitation came up as prominent terrain/climatic variables in predicting soil properties. The results further showed that shortwave infrared and near infrared channels of Landsat8 as well as soil specific indices of redness, coloration and saturation were prominent predictors in digital soil mapping. Considering the increased availability of freely available Remote Sensing data (e.g. Landsat, SRTM, Sentinels), soil information at local and regional scales in data poor regions such as West Africa can be improved with relatively little financial and human resources.

SILA A, SHEPHERD K D, POKHARIYAL G P, TOWETT E, WEULLOW E, NYAMBURA M. Using spectral subspaces to improve infrared spectroscopy prediction of soil properties
Isij International, 2015,37(2):188-193.

DOI:10.2355/isijinternational.37.188URL [本文引用: 1]

刘艳芳, 宋玉玲, 郭龙, 陈奕云, 卢延年, 刘以. 结合高光谱信息的土壤有机碳密度地统计模型
农业工程学报, 2017,33(2):191-199.

URL [本文引用: 1]
传统线性回归模型在借助光谱信息进行土壤属性预测时,通常忽略了土壤自身所具有的空间异质性和依赖性,并且未考虑模型残差的空间结构。针对以上不足,该文以江汉平原232个土壤样本为研究对象,以土壤反射光谱为辅助变量,采用偏最小二乘回归、普通克里格、协同克里格以及回归克里格分别构建土壤有机碳密度预测模型,选取决定系数(R2)、均方根误差、标准差与预测均方根误差比(ratio of performance to deviation,RPD)对模型预测精度进行对比评价。结果显示,结合高光谱信息,且同时考虑残差空间结构的回归克里格模型表现优于其他模型,预测决定系数R2为0.617,RPD为1.614。鉴于土壤光谱信息同时还具有测定简单、省时、无损等优点,因此土壤光谱是土壤有机碳密度空间插值的理想辅助因子。
LIU Y F, SONG Y L, GUO L, CHEN Y Y, LU Y N, LIU Y. Geostatistical models of soil organic carbon density prediction based on soil hyperspectral reflectance
Transactions of the Chinese Society of Agricultural Engineering, 2017,33(2):191-199. (in Chinese)

URL [本文引用: 1]
传统线性回归模型在借助光谱信息进行土壤属性预测时,通常忽略了土壤自身所具有的空间异质性和依赖性,并且未考虑模型残差的空间结构。针对以上不足,该文以江汉平原232个土壤样本为研究对象,以土壤反射光谱为辅助变量,采用偏最小二乘回归、普通克里格、协同克里格以及回归克里格分别构建土壤有机碳密度预测模型,选取决定系数(R2)、均方根误差、标准差与预测均方根误差比(ratio of performance to deviation,RPD)对模型预测精度进行对比评价。结果显示,结合高光谱信息,且同时考虑残差空间结构的回归克里格模型表现优于其他模型,预测决定系数R2为0.617,RPD为1.614。鉴于土壤光谱信息同时还具有测定简单、省时、无损等优点,因此土壤光谱是土壤有机碳密度空间插值的理想辅助因子。

ZHANG S W, SHEN C Y, CHEN X Y, YE H C, HUANG Y F, LAI S. Spatial interpolation of soil texture using compositional kriging and regression kriging with consideration of the characteristics of compositional data and environment variables
Journal of Integrative Agriculture, 2013,12(9):1673-1683.

DOI:10.1016/S2095-3119(13)60395-0URL [本文引用: 1]
The spatial interpolation for soil texture does not necessarily satisfy the constant sum and nonnegativity constraints. Meanwhile, although numeric and categorical variables have been used as auxiliary variables to improve prediction accuracy of soil attributes such as soil organic matter, they (especially the categorical variables) are rarely used in spatial prediction of soil texture. The objective of our study was to comparing the performance of the methods for spatial prediction of soil texture with consideration of the characteristics of compositional data and auxiliary variables. These methods include the ordinary kriging with the symmetry logratio transform, regression kriging with the symmetry logratio transform, and compositional kriging (CK) approaches. The root mean squared error (RMSE), the relative improvement value of RMSE and Aitchison's distance (D-A) were all utilized to assess the accuracy of prediction and the mean squared deviation ratio was used to evaluate the goodness of fit of the theoretical estimate of error. The results showed that the prediction methods utilized in this paper could enable interpolation results of soil texture to satisfy the constant sum and nonnegativity constraints. Prediction accuracy and model fitting effect of the CK approach were better, suggesting that the CK method was more appropriate for predicting soil texture. The CK method is directly interpolated on soil texture, which ensures that it is optimal unbiased estimator. If the environment variables are appropriately selected as auxiliary variables, spatial variability of soil texture can be predicted reasonably and accordingly the predicted results will be satisfied.

张甘霖, 龚子同. 土壤调查实验室分析方法, 北京: 科学出版社, 2012: 8-16.
[本文引用: 1]

ZHANG G L, GONG Z T. Soil Survey Laboratory Methods. Beijing: Science Press, 2012: 8-16. (in Chinese)
[本文引用: 1]

韩光中, 王德彩, 谢贤健. 中国主要土壤类型的土壤容重传递函数研究
土壤学报, 2016,53(1):93-102.

[本文引用: 1]

HAN G Z, WANG D C, XIE X J. Pedotransfer functions for prediction of soil bulk density for major types of soils in China
Acta Pedologica Sinica, 2016,53(1):93-102. (in Chinese)

[本文引用: 1]

姜赛平, 张怀志, 张认连, 李兆君, 谢良商, 徐爱国. 基于三种空间预测模型的海南岛土壤有机质空间分布研究
土壤学报, 2018,55(4):227-237.

[本文引用: 2]

JIANG S P, ZHANG H Z, ZHANG R L, LI Z J, XIE L S, XU A G. Research on spatial distribution of soil organic matter in Hainan Island based on three spatial prediction models
Acta Pedologica Sinica, 2018,55(4):227-237. (in Chinese)

[本文引用: 2]

JURGEN B, OLEG A. Land-surface parameters specific to topo- climatology
Developments in Soil Science, 2009,33(11):195-226.

[本文引用: 2]

胡良平. 提高回归模型拟合优度的策略(Ⅱ)-算术均值变换与其他变量变换
四川精神卫生, 2019,32(1):9-15.

[本文引用: 3]

HU L P. Strategy of improving the goodness of fit of the regression model(Ⅱ)-the transformation of the arithmetic mean and the other variable transformations
Sichuan Mental Health, 2019,32(1):9-15. (in Chinese)

[本文引用: 3]

张晋昕, 李河. 回归分析中定性变量的赋值
循证医学, 2005,5(3):169-171.

DOI:10.3969/j.issn.1671-5144.2005.03.010URL [本文引用: 1]
回归分析中对自变量的要求比较宽松,可以是服从正态分布的随机变量,也可以是分类变量及有序变量,参与回归方程的估计时需首先对分类变量和有序变量赋值.实际应用中,分类变量的赋值存在较多的误用,势必导致错误的分析结果.本文给出了最普遍发生的定性变量被错误赋值的情形,剖析了错误的原因,指出对分析结果的严重歪曲.文中阐述了哑变量设置的具体方法和结果的解释,旨在指导读者采用正确的赋值方法,对分类变量采用多个派生的哑变量参与建模计算,从而得到合理的回归分析结果.
ZHANG J X, LI H. The way to evaluate qualitative variables in regression analysis
The Journal of Evidence-Based Medicine, 2005,5(3):169-171. (in Chinese)

DOI:10.3969/j.issn.1671-5144.2005.03.010URL [本文引用: 1]
回归分析中对自变量的要求比较宽松,可以是服从正态分布的随机变量,也可以是分类变量及有序变量,参与回归方程的估计时需首先对分类变量和有序变量赋值.实际应用中,分类变量的赋值存在较多的误用,势必导致错误的分析结果.本文给出了最普遍发生的定性变量被错误赋值的情形,剖析了错误的原因,指出对分析结果的严重歪曲.文中阐述了哑变量设置的具体方法和结果的解释,旨在指导读者采用正确的赋值方法,对分类变量采用多个派生的哑变量参与建模计算,从而得到合理的回归分析结果.

AITCHISON J. On criteria for measures of compositional difference
Mathematical Geology, 1992,24(4):365-379.

DOI:10.1007/BF00891269URL [本文引用: 1]

GUPTA A, KAMBLE T, MACHIWAL D. Comparison of ordinary and Bayesian kriging techniques in depicting rainfall variability in arid and semi-arid regions of north-west India
Environmental Earth Sciences, 2017,76(15):512.

DOI:10.1007/s12665-017-6814-3URL [本文引用: 1]

鲁民颉, 董有福. EBK算法中半变异函数模型对DEM插值精度差异性研究
测绘技术装备, 2018(1):22-24.

[本文引用: 1]

LU M J, DONG Y F. Study on the difference in accuracy of DEM interpolation based on the semi-variant function model in EBK
Geomatics Technology and Equipment, 2018(1):22-24. (in Chinese)

[本文引用: 1]

李欣海. 随机森林模型在分类与回归分析中的应用
应用昆虫学报, 2013,50(4):314-321.

[本文引用: 1]

LI X H. Using “random forest”for classification and regression
Chinese Journal of Applied Entomology, 2013,50(4):314-321. (in Chinese)

[本文引用: 1]

GENUER R, POGGI J M, TULEAU-MALOT C. Variable selection using random forests
Pattern Recognition Letters, 2010,31(14):2225-2236.

DOI:10.1016/j.patrec.2010.03.014URL [本文引用: 1]

Abstract

This paper proposes, focusing on random forests, the increasingly used statistical method for classification and regression problems introduced by Leo Breiman in 2001, to investigate two classical issues of variable selection. The first one is to find important variables for interpretation and the second one is more restrictive and try to design a good parsimonious prediction model. The main contribution is twofold: to provide some experimental insights about the behavior of the variable importance index based on random forests and to propose a strategy involving a ranking of explanatory variables using the random forests score of importance and a stepwise ascending variable introduction strategy.

冯盼峰, 温永仙. 基于随机森林算法的两阶段变量选择研究
系统科学与数学, 2018,38(1):119-130.

[本文引用: 1]

FENG P F, WEN Y X. Two-Stage stepwise variable selection based on random forests
Journal of Systems Science and Mathematical Sciences, 2018,38(1):119-130. (in Chinese)

[本文引用: 1]

赵北庚. 基于R语言randomForest包的随机森林建模研究
计算机光盘软件与应用, 2015,18(2):152-153.

[本文引用: 1]

ZHAO B G. Research on randomForest modeling based on R language random forest package
Computer CD Software and Applications, 2015,18(2):152-153. (in Chinese)

[本文引用: 1]

LIU Q, GU Y L, WANG S H, WANG C C, MA Z H. Canopy spectral characterization of wheat stripe rust in latent period
Journal of Spectroscopy, 2015,2015(1):1-11.

[本文引用: 1]

周敏, 史振威, 丁火平. 遥感图像飞机目标分类的卷积神经网络方法
中国图象图形学报, 2017,22(5):702-708.

[本文引用: 1]

ZHOU M, SHI Z W, DING H P. Aircraft classification in remotesensing images using convolutional neural networks
Journal of Image and Graphics, 2017, 22(5):702-708. (in Chinese)

[本文引用: 1]

AITCHISON J. The statistical analysis of compositional data
Technometrics, 1982,30(1):120-121.

DOI:10.1080/00401706.1988.10488337URL [本文引用: 1]

王库. 回归克里格在土壤全氮空间预测上的应用
中国农学通报, 2013,29(20):142-147.

[本文引用: 1]

WANG K. Application of regression kriging on the spatial prediction of total soil nitrogen
Chinese Agricultural Science Bulletin, 2013,29(20):142-147. (in Chinese)

[本文引用: 1]

MOORE I D, GESSSLER P E, NIELSEN G A, PETERSON G A. Soil attribute prediction using terrain analysis
Soil Science Society of America Journal, 1993,57(2):443-452.

DOI:10.2136/sssaj1993.03615995005700020026xURL [本文引用: 1]

杨其坡, 武伟, 刘洪斌. 基于地形因子和随机森林的丘陵区农田土壤有效铁空间分布预测
中国生态农业学报, 2018,26(3):422-431.

[本文引用: 1]

YANG Q P, WU W, LIU H B. Prediction of spatial distribution of soil available iron in a typical hilly farmland using terrain attributes and random forest model
Chinese Journal of Eco-Agriculture, 2018,26(3):422-431. (in Chinese)

[本文引用: 1]

张丽萍, 王小云, 张赫斯. 沙盖黄土丘陵坡地土壤理化特性随地形变化规律研究
地理科学, 2011,31(2):178-183.

[本文引用: 1]

ZHANG L P, WANG X Y, ZHANG H S. Evolution of physical and chemical characteristics of loess with different landforms in slope field under sand cover
Scientia Geographica Sinica, 2011,31(2):178-183. (in Chinese)

[本文引用: 1]

张世文, 黄元仿, 苑小勇, 王睿, 叶回春, 段增强, 龚关. 县域尺度表层土壤质地空间变异与因素分析
中国农业科学, 2011,44(6):1154-1164.

URL [本文引用: 2]
【目的】以北京市平谷区为研究区域,采用传统统计和地统计学相结合的方法研究县域尺度下土壤质地空间变异的规律,探究土壤质地空间变异的机理。【方法】采用Levine’s方法进行方差奇次性检验,根据检验结果选取最小显著性差方法(least-significant difference,LSD)对土壤颗粒组成与高程、母质、土地利用和水域分布关系进行研究。空间预测采用普通克里格法,鉴于土壤质地属于成分数据,插值前对原始数据进行对称对数比转换。【结果】不同高程组、母质类型、土地利用类型及水域缓冲区组各颗粒平均含量存在一定的差异性,不同高程组和母质类型的土壤颗粒组成之间的差异性比不同土地利用类型和水域缓冲区明显。总体而言,研究区内随着海拔高度的降低,土壤颗粒呈现由粗变细的趋势;由石英含量较高的酸性岩母质发育的土壤土壤颗粒较粗;菜地土壤颗粒相对较细;随着离水域距离的增大,土壤砂粒含量呈增加趋势。地统计分析结果显示,土壤质地各颗粒表现出极强的空间自相关性,空间变异主要由结构性因素引起。各颗粒空间插值结果表明,土壤各颗粒组成空间分布总体趋势特征比较明显。【结论】传统统计分析和地统计学相结合的方法能够系统和全面地揭示土壤质地空间变异的确定性和随机性,研究区土壤质地空间格局主要受地形、母质等自然因素影响。经过对称对数比转换后,土壤质地各颗粒组成空间预测结果满足成分数据空间插值的要求。


ZHANG S W, HUANG Y F, YUAN X Y, WANG R, YE H C, DUAN Z Q, GONG G. The spatial variability and factor analysis of topsoil texture on a county scale
Scientia Agricultura Sinica, 2011,44(6):1154-1164. (in Chinese)

URL [本文引用: 2]
【目的】以北京市平谷区为研究区域,采用传统统计和地统计学相结合的方法研究县域尺度下土壤质地空间变异的规律,探究土壤质地空间变异的机理。【方法】采用Levine’s方法进行方差奇次性检验,根据检验结果选取最小显著性差方法(least-significant difference,LSD)对土壤颗粒组成与高程、母质、土地利用和水域分布关系进行研究。空间预测采用普通克里格法,鉴于土壤质地属于成分数据,插值前对原始数据进行对称对数比转换。【结果】不同高程组、母质类型、土地利用类型及水域缓冲区组各颗粒平均含量存在一定的差异性,不同高程组和母质类型的土壤颗粒组成之间的差异性比不同土地利用类型和水域缓冲区明显。总体而言,研究区内随着海拔高度的降低,土壤颗粒呈现由粗变细的趋势;由石英含量较高的酸性岩母质发育的土壤土壤颗粒较粗;菜地土壤颗粒相对较细;随着离水域距离的增大,土壤砂粒含量呈增加趋势。地统计分析结果显示,土壤质地各颗粒表现出极强的空间自相关性,空间变异主要由结构性因素引起。各颗粒空间插值结果表明,土壤各颗粒组成空间分布总体趋势特征比较明显。【结论】传统统计分析和地统计学相结合的方法能够系统和全面地揭示土壤质地空间变异的确定性和随机性,研究区土壤质地空间格局主要受地形、母质等自然因素影响。经过对称对数比转换后,土壤质地各颗粒组成空间预测结果满足成分数据空间插值的要求。


马冉, 刘洪斌, 武伟. 流域尺度下地形属性对土壤质地类型变异的影响—以重庆市彭水县一小流域为例
农业资源与环境学报, 2019,36(3):279-286.

[本文引用: 2]

MA R, LIU H B, WU W. Effect of topographic attributes on soil texture class variations at a watershed scale: A case study of a basin in Pengshui County of Chongqing, China
Journal of Agricultural Resources and Environment, 2019,36(3):279-286. (in Chinese)

[本文引用: 2]

LI A D, GUO P T, WU W, LIU H B. Impacts of terrain attributes and human activities on soil texture class variations in hilly areas, south-west China
Environmental Monitoring and Assessment, 2017,189(6):281.

DOI:10.1007/s10661-017-5997-0URLPMID:28534308 [本文引用: 2]
Knowledge of soil texture variations is critical for agricultural and engineering applications because texture influences many other soil properties. This study used random forest method to evaluate the effects of human activities and topographic parameters on the spatial variability of soil texture in hilly areas where soil parent material was uniform. The study site covers 252 km(2) and is located in the Upper Yangtze River Basin of south-west China. A total of 3636 samples were collected from the cultivated soils at a depth of 20 cm of dryland (sloping field and terraced land) landscape. The soil texture class for each sample was estimated by experienced soil scientists in the field. Two soil texture classes (loam and clay) were observed in the watershed. Eleven terrain parameters were derived from a digital elevation model with a resolution of 30 m. Compared with loamy soils, clayey soils were mostly observed in the areas with lower elevation and gentle slopes. The outcome of random forest indicated that human activities and elevation had strong effects on soil texture class variations across the study site. Further results showed that the relative importance of terrain parameters to soil texture class variations varied with dryland landscape. Topographic wetness index and elevation were the most important variables for sloping field and terraced land landscapes, respectively.

BACIS C M, ROSA V S OLIVEIRA V A L, DOS SANTOS M L, DOS ANJOS L H C, DE CARVALHO D F. Topography and spatial variability of soil physical properties
Scientia Agricola, 2009,66(3):338-352.

DOI:10.1590/S0103-90162009000300009URL [本文引用: 2]

王丽, 王力, 王全九. 不同坡度坡耕地土壤氮磷的流失与迁移过程
水土保持学报, 2015,29(2):69-75.

[本文引用: 1]

WANG L, WANG L, WANG Q J. The processes of nitrogen and phosphorus loss and migration in slope cropland under different slopes
Journal of Soil and Water Conservation, 2015,29(2):69-75. (in Chinese)

[本文引用: 1]

郑子成, 秦凤, 李廷轩. 不同坡度下紫色土地表微地形变化及其对土壤侵蚀的影响
农业工程学报, 2015,31(8):168-175.

URL [本文引用: 1]
为了揭示川中丘陵区紫色土地表微地形变化对土壤侵蚀的影响,该文通过室内人工模拟降雨试验,从地表糙度角度出发,结合多重分形理论与方法,分析了不同坡度条件下紫色土地表微地形变化特征,探讨了地表微地形变化与土壤侵蚀间的关系。结果表明:1)雨强为1.5 mm/min,历时为40 min降雨条件下,10°、15°和20°坡面地表相对高程的变化量分别为-11.66、-3.52 和-5.61 mm,仅20°坡面地表初始低洼部位被径流贯通形成细沟;各坡面地表糙度均有所减小,且表现为15°>10°>20°,其中10°和15°坡面不同坡位地表糙度均较雨前减小,20°坡面下坡地表糙度较雨前增大,不同坡度全坡面地表糙度均较雨前减小;2)地表微地形具有一定的多重分形特征,10°和15°坡面雨后多重分形参数广义分形维数跨度、奇异指数跨度和多重分形谱高差均较雨前增大,微地形空间分布差异增大,且地表变得圆润,20°坡面与之相反;3)随坡度增大,地表径流量呈先减小后增大的变化趋势,且地表糙度变幅越小的坡面,地表产流量越高,而侵蚀产沙量则随坡度的增大显著提高(P<0.05)。研究成果为揭示水蚀过程中地表微地形变化的本质和作用机理提供了参考。
ZHENG Z C, QIN F, LI T X. Changes in soil surface microrelief of purple soil under different slope gradients and its effects on soil erosion
Transactions of the Chinese Society of Agricultural Engineering, 2015,31(8):168-175. (in Chinese)

URL [本文引用: 1]
为了揭示川中丘陵区紫色土地表微地形变化对土壤侵蚀的影响,该文通过室内人工模拟降雨试验,从地表糙度角度出发,结合多重分形理论与方法,分析了不同坡度条件下紫色土地表微地形变化特征,探讨了地表微地形变化与土壤侵蚀间的关系。结果表明:1)雨强为1.5 mm/min,历时为40 min降雨条件下,10°、15°和20°坡面地表相对高程的变化量分别为-11.66、-3.52 和-5.61 mm,仅20°坡面地表初始低洼部位被径流贯通形成细沟;各坡面地表糙度均有所减小,且表现为15°>10°>20°,其中10°和15°坡面不同坡位地表糙度均较雨前减小,20°坡面下坡地表糙度较雨前增大,不同坡度全坡面地表糙度均较雨前减小;2)地表微地形具有一定的多重分形特征,10°和15°坡面雨后多重分形参数广义分形维数跨度、奇异指数跨度和多重分形谱高差均较雨前增大,微地形空间分布差异增大,且地表变得圆润,20°坡面与之相反;3)随坡度增大,地表径流量呈先减小后增大的变化趋势,且地表糙度变幅越小的坡面,地表产流量越高,而侵蚀产沙量则随坡度的增大显著提高(P<0.05)。研究成果为揭示水蚀过程中地表微地形变化的本质和作用机理提供了参考。

邹心雨, 张卓栋, 吴梦瑶, 万缘强. 河北坝上地区坡面尺度土壤机械组成的空间变异
中国水土保持科学, 2019,17(5):44-53.

[本文引用: 1]

ZOU X Y, ZHANG Z D, WU M Y, WAN Y Q. Spatial variability of particle size distribution at slope scale in Bashang region of Hebei province
Science of Soil and Water Conservation, 2019, 17(5):44-53. (in Chinese)

[本文引用: 1]

杨艳丽, 史学正, 于东升, 王洪杰, 徐茂, 王果. 区域尺度土壤养分空间变异及其影响因素研究
地理科学, 2008,28(6):788-792.

URL [本文引用: 1]
江苏北部5市土壤表层(0~20cm)全氮含量连云港东北部、淮安南部和盐城西部显著高于其它地区;全磷含量呈现由北到南、自西向东升高的趋势;速效磷含量高值区位于北部的灌云县和南部的金湖县;速效钾含量东部沿海高于其它地区。土壤类型和成土母质对土壤养分产生显著影响:对于土类而言,沼泽土和水稻土养分较高;各成土母质中,湖相沉积物发育的土壤养分含量最高。在研究区1:5万尺度范围内,土壤类型对全氮和全磷的变异起主导作用,而速效磷受成土母质的影响较大,土壤类型和成土母质对速效钾的影响较小,土壤类型和成土母质对全量养分的影响要大于速效养分。
YANG Y L, SHI X Z, YU D S, WANG H J, XU M, WANG G. Spatial heterogeneity of soil nutrients and their affecting factors at regional scale
Scientia Geographica Sinica, 2008,28(6):788-792. (in Chinese)

URL [本文引用: 1]
江苏北部5市土壤表层(0~20cm)全氮含量连云港东北部、淮安南部和盐城西部显著高于其它地区;全磷含量呈现由北到南、自西向东升高的趋势;速效磷含量高值区位于北部的灌云县和南部的金湖县;速效钾含量东部沿海高于其它地区。土壤类型和成土母质对土壤养分产生显著影响:对于土类而言,沼泽土和水稻土养分较高;各成土母质中,湖相沉积物发育的土壤养分含量最高。在研究区1:5万尺度范围内,土壤类型对全氮和全磷的变异起主导作用,而速效磷受成土母质的影响较大,土壤类型和成土母质对速效钾的影响较小,土壤类型和成土母质对全量养分的影响要大于速效养分。
相关话题/土壤 空间 数据 信息 光谱