0 引言
【研究意义】土壤有机质是土壤营养元素的重要来源,是反映和判断土壤肥力的关键指标[1]。高光谱技术是一种新兴的农业现代化技术,具有高效、非接触、无污染等优势,被应用于估算土壤有机质含量的研究[2-5]。土壤高光谱是土壤各种理化性状(有机质、氧化铁、水分、质地和孔隙度等)的综合外在表现,包含了丰富的土壤属性信息,其中必然存在与土壤有机质无关的光谱信息。土壤有机质与其他理化属性的光谱吸收峰之间相互重叠[6],呈现合频和倍频现象,导致土壤高光谱中存在较多与土壤有机质相关而冗余的波长信息,均严重影响估测模型性能和精度。鉴于此,有必要探究土壤有机质的高光谱特征,揭示土壤有机质的高光谱响应规律,为优选土壤有机质的敏感波长、构建较高精度的估测模型提供理论依据。【前人研究进展】利用土壤有机质敏感波长建立土壤有机质含量估算模型,可以降低模型复杂度,同时保持甚至提升模型精度。早期****们采用相关分析法研究土壤有机质与土样光谱反射率(或其不同数学变换形式)的关系,将相关系数高的波长作为土壤有机质敏感波长[7-9]。而后,****们通过分析土壤去除有机质前、后的光谱变化特征,获取土壤光谱反射率变化较大的波段,将其作为土壤有机质的敏感波段[10-12]。近年来,越来越多的****采用变量优选方法[13-14],从全波段中滤除无效变量或冗余变量,优选出敏感波段。YANG等[15]基于田间较小范围土壤光谱,采用无信息变量消除(uninformative variables elimination,UVE)方法结合连续投影算法(successive projections algorithm,SPA)优选敏感波长,采用敏感波长建立的偏最小二乘回归(partial least squares regression,PLSR)模型的估测精度和全波段模型基本一致;于雷等[16]尝试将不同的变量优选方法耦合进行土壤有机质敏感波长变量的优选,得到竞争适应重加权采样(competitive adaptive reweighted sampling,CARS)与SPA方法耦合的CARS-SPA-PLSR模型估测精度略高于全波段模型。上述研究结果表明,变量优选方法可以精确、有效地确定敏感波长。【本研究切入点】然而,相关分析法仅对观测结果进行数理统计,未能尝试探究土壤有机质的高光谱响应机理,揭示土壤有机质的光谱响应规律;去除有机质方法虽能够较好地确定敏感程度高的有机质响应波段,但仍需要深入分析这些敏感波段是否存在无效或冗余信息。【拟解决的关键问题】因此,本文以江汉平原潮土为研究对象,将去有机质试验和变量优选方法的优势相结合,通过分析土样去有机质前、后的光谱数据,揭示土壤有机质的光谱响应规律,基于变量优选方法确定土壤有机质敏感波长,为利用高光谱技术监测农田土壤提供理论支撑。1 材料与方法
1.1 土样采集与分析
试验区位于湖北省潜江市竹根滩镇(图1),江汉平原腹地,地势平坦;属于亚热带季风性湿润气候,四季分明,雨量充沛,耕地地力优越;主要分布的土壤类型为潮土,是江汉平原最常见的土壤类型之一;主要种植棉花、大豆和花生等旱生作物。显示原图|下载原图ZIP|生成PPT
图1试验区地理位置图
-->Fig.1Geographical position map of test area
-->
选取试验区内面积约为650 m×300 m田块,设置5行、26列,行间距为75 m、列间距为25 m,布设130个样点(图2);采集耕层土样,深度为0—20 cm,十字法取样,剔除侵入体,混合均匀后四分法采
样,带回实验室风干、磨碎、过2 mm孔筛。
显示原图|下载原图ZIP|生成PPT
图2样本采集示意图
-->Fig. 2Sketch of sample collection
-->
1.2 土壤样本集的划分
将130份土样分为训练集、建模集和验证集(表1)。按照采样顺序取1号土样后,每隔2个编号抽取1份土样,直至结束共获取40份供试土样为训练集;剩余90份土样按照土壤有机质含量升序排列,排在奇数位的45份土样作为建模集,排在偶数位的45份土样作为验证集。训练集样本用于土壤有机质去除试验,确定土壤有机质敏感波长;建模集样本用于基于敏感波长建立估算模型;验证集样本用于检验土壤有机质敏感波长对同种土壤类型的适用性。采用重铬酸钾容量法-外加热法[17]测定土壤有机质含量。Table 1
表1
表1土壤有机质含量统计特征
Table 1Statistical characteristics of soil organic matter content
样本类型 Type of samples | 样本数 Samples | 最小值 Min (g·kg-1) | 最大值 Max (g·kg-1) | 均值 Mean (g·kg-1) | 标准差 Standard deviation(g·kg-1) | 变异系数 Coefficient of variation (%) | 偏度 Skewness |
---|---|---|---|---|---|---|---|
训练集 Training set | 40 | 11.61 | 21.39 | 17.47 | 2.58 | 14.77 | -0.85 |
建模集 Calibration set | 45 | 11.60 | 22.53 | 17.42 | 2.68 | 15.4 | -0.24 |
验证集 Validation set | 45 | 11.38 | 21.85 | 17.31 | 2.68 | 15.5 | -0.33 |
新窗口打开
1.3 土样有机质去除试验
去有机质试验的具体步骤如下:量取300 mL土样放入5 000 mL烧杯中,加入200 mL 30% H2O2 溶液,用橡胶头玻璃棒搅动加速其氧化,待强烈氧化过后,静置片刻,再次加入200 mL H2O2,重复上述操作,直至最后一次加入H2O2溶液时烧杯中的土样无明显反应且有上层清液出现,则停止操作。土样静置约24 h,移除上层清液,将去有机质土样置于60℃恒温箱烘干,重新过2 mm孔筛,测定有机质含量,获取去除有机质后土样的有机质含量统计特征(表2)。Table 2
表2
表2训练集样本去有机质后的土壤有机质含量统计特征
Table 2Statistical characteristics of soil organic matter content after removal of organic matter based on training set
土壤有机质状态 State of soil organic matter | 最小值 Min (g·kg-1) | 最大值 Max (g·kg-1) | 均值 Mean (g·kg-1) | 标准差 Standard deviation (g·kg-1) | 变异系数 Coefficient of variation (%) |
---|---|---|---|---|---|
去除有机质后土样 Samples after removal of organic matter | 0.93 | 9.29 | 4.85 | 2.13 | 43.91 |
有机质去除量 Removal content of organic matter | 7.53 | 15.80 | 12.62 | 1.70 | 13.50 |
新窗口打开
1.4 土样光谱数据的测定
土样高光谱数据的测定采用美国Analytical Spectral Devices公司开发生产的ASD FieldSpec3地物光谱仪,波谱范围350—2 500 nm,采样间隔1.4 nm(350—1 000 nm)和2 nm(1 000—2 500 nm),重采样间隔1 nm。光源为能够提供平行光线的50 W卤素灯。采用5°视场角光纤探头,光源到土壤表面距离(L)为50 cm,光源入射角度(A)为30°,探头到土壤表面距离(H)为15 cm[18]。将土样置于直径10 cm深2 cm盛样皿中,土壤表面刮平,在暗室内进行光谱测量。每次采集光谱前,用白板(反射率100%)对光谱仪进行优化和标定。每个土样进行4个方向(转动3次,每次90°)的测量,每个方向保存5条光谱曲线,共20条,对其进行算术平均后得到土样原始光谱,每条光谱去除噪声较大的边缘波段350—399 nm和2 401—2 500 nm之后为本文所用光谱数据。1.5 土壤有机质高光谱特征分析
去有机质前、后光谱的差值及变化率运算可获取因有机质含量变化而引起的光谱变化信息,为土壤有机质的高光谱特征分析提供数据基础。具体算法为:Dm×n=Am×n-Bm×n (1)
式中,Dm×n为去有机质前、后的差值光谱矩阵,m为样本数,即40,n为波长变量数,即2 001,Am×n为去有机质后的光谱矩阵,Bm×n为去有机质前的光谱矩阵。
式中,ROCj表示第j个样本在第p列的去有机质后的光谱变化率,R(D)p表示在第p列去有机质前、后差值光谱反射率,R(B)P表示在第p列去有机质前的光谱反射率,其中1≤j≤m,1≤p≤n。
1.6 土壤有机质的波长变量优选方法
UVE算法[19]是在分析PLSR模型回归系数b的基础上,消除不提供目标矩阵信息即无用的变量信息。本文训练集去有机质前、后的差值光谱矩阵Dm×n与有机质去除量矩阵Ym×1存在如下关系:Ym×1=Dm×n·b+e,其中b表示回归系数向量,e表示误差向量。UVE算法是将随机变量矩阵即噪音矩阵(与自变量矩阵数目相同)加入原始光谱矩阵中,通过PLSR交叉验证逐一剔除原始光谱矩阵中的无用变量,得到回归系数矩阵,利用回归系数矩阵中回归系数向量b的平均值和标准偏差的商即变量的稳定性C,评价每个变量的可靠性[20-21],从而获取可靠性较强的波长变量。表达式如下:式中,mean(bi)表示回归系数向量b的平均值,S(bi)表示回归系数向量b的标准偏差,i表示光谱矩阵中第i列向量。
Cmax=Max[abs(Ci)] (4)
式中, abs(Ci)表示Ci的绝对值,Max[abs(Ci)]表示Ci的最大绝对值,以Cmax的0.99倍为阈值标准[22],Ci在阈值以外的波长变量为优选变量。
CARS算法模仿达尔文进化理论中“适者生存”的基本原理,各波长变量将被作为单一个体,在进行个体选择的过程中,保留具有较强适应能力的个体,剔除适应能力较弱的个体。在波长变量优选过程中,通过优选PLSR模型回归系数绝对值相对较大的波长变量,剔除模型回归系数绝对值相对较小的波长变量,从而获得多个优选变量子集,再通过获取交叉验证模型中交叉验证均方根误差(root-mean-square error of cross-validation,RMSECV)最小的优选变量子集,即为最优变量子集[23-24]。
将UVE、CARS 两种算法相结合,比较UVE、CARS、UVE-CARS、CARS-UVE这4种变量优选方法,获取最佳变量优选方法。
UVE、CARS方法以及示意图绘制均通过Matlab R2012a(The MathWorks,USA)软件完成。
1.7 模型建立与检验
利用线性和非线性模型中较为典型的PLSR和BPNN方法进行建模、验证分析。PLSR可以较好地解决样本数量小于波长数量的问题,以及自变量之间存在多重相关性的问题;此外,该模型可以有效地提取对系统解释能力较强的综合变量,从而排除无解释能力的信息,对因变量的解释能力增强[25]。BPNN是目前应用较为广泛的一类人工神经网络模型,具有较强的非线性处理能力和抗干扰能力[26]。该模型的特点是信号前向传递,误差反向传递。在前向传递中,输入信号由输入层经隐含层逐层处理,直至输出层;每一层的神经元状态只影响下一层神经元状态,如果输出层得不到期望输出,则转入反向传播,根据预测误差调整网络权值,权值不断调整的过程即为网络的学习过程;直至网络输出的误差逐渐减少至可接受的程度或达到设定的学习次数为止[27-28]。本文采用训练函数为Levenberg-Marquardt算法的trainlm,隐含层传递函数为正切Sigmoid函数,输出层为purelin函数,学习速率为0.01,最大训练次数为1 000次,模型期望误差为0.001。
利用决定系数(determination coefficients,R2)、均方根误差(root mean squared error,RMSE)、相对分析误差(relative percent deviation,RPD)、平均绝对误差(mean absolute error,MAE)、平均相对误差(mean relative error,MRE)及1﹕1线综合评价PLSR及BPNN的模型性能。其中,R2值越接近于1,表明模型的稳定性及拟合度越高;RMSE值越接近于0,表明模型的估测值与实测值误差变幅越小;RPD值是计算样本标准差与均方根误差比值得到,若RPD<1.4,模型对样本无法实施估测,1.4≤RPD<2,模型可对样本进行粗略评估,RPD≥2,模型可对样本进行极好的估测;MAE和MRE值能够反应估测值误差的真实情况。PLSR模型的建立与验证在The Unscrambler 9.7软件中完成,BPNN模型建立与验证在Matlab R2012a(The MathWorks,USA)软件中完成。
2 结果
2.1 去有机质前、后土壤高光谱特征对比分析
去有机质前、后平均光谱反射曲线特征比较表明,光谱反射率在全波段范围随有机质含量的减少而呈现增加趋势(图3-A),而反射率增加后的光谱曲线几何特征与去有机质前的在不同波段存在差异:去有机质后的光谱曲线在400—600 nm的斜率及550—650 nm的弓曲差[29]均大于去有机质前(图3-A1、3-A2),在800—2 400 nm的斜率则小于去有机质前(图3-A3)。显示原图|下载原图ZIP|生成PPT
图 3去有机质前、后平均光谱反射曲线比较
-->Fig. 3The comparison of average spectral reflectance curves between before and after removal of organic matter
-->
2.2 去有机质后土壤高光谱特征分析
应用差值运算对训练集样本去有机质前、后光谱的差异进行研究,提取因有机质含量变化所造成的光谱差异信息。去有机质前、后的平均差值光谱反射曲线呈现出各波段对有机质含量变化的响应规律(图4),具体为:差值光谱反射率值在全波段范围均大于零,其在可见光波段(400—780 nm)总体大于近红外波段(780—2 400 nm)。可见光波段的光谱反射曲线在600 nm附近凸起,该波长处反射率值达到最大。近红外波段的光谱反射率值在780—1 900 nm波段呈减小趋势,1 900—2 400 nm逐渐趋于平稳,仅2 000 nm附近存在微弱的凸起。这说明各波段的光谱对有机质含量变化的响应具有差异。显示原图|下载原图ZIP|生成PPT
图 4平均差值光谱反射曲线
-->Fig. 4Average difference value spectral reflectance curve
-->
采用变化率表征基于不同有机质去除量,去有机质后全波段及分波段的光谱反射率变化情况:有机质去除量与去有机质后光谱反射率的变化率呈正相关关系,当样本本身有机质去除量最大时,光谱反射率的变化率在任何波段都最大;各个供试土样去有机质后,在全波段范围的光谱反射率均有所增加,尤其在可见光波段增加明显(表3)。这说明去有机质试验,不仅对土壤有机质光谱响应规律产生直接作用,而且揭示了同一样本的有机质含量变化对不同波段的影响效果不同,这使得优选光谱变量的必要性显著,消除无效变量,获取重要性变量,即对土壤有机质响应强烈的敏感波长变量尤为重要。
Table 3
表3
表3去除有机质后对土壤光谱反射率的影响
Table 3Soil spectral reflectance affected by removal of soil organic matter
有机质去除量 Removal of organic matter content ( g·kg-1) | 样本数 Number of samples | 光谱反射率的平均变化率Average rate of change in spectral reflectance (%) | ||||||
---|---|---|---|---|---|---|---|---|
400-2400 nm | 400-600 nm | 600-800 nm | 800-1200 nm | 1200-1600 nm | 1600-2000 nm | 2000-2400 nm | ||
8-10 | 6 | +19 | +45 | +33 | +18 | +12 | +11 | +11 |
10-12 | 8 | +19 | +45 | +33 | +19 | +13 | +11 | +11 |
12-14 | 15 | +20 | +48 | +36 | +21 | +14 | +12 | +11 |
14-16 | 11 | +23 | +55 | +41 | +24 | +17 | +14 | +13 |
新窗口打开
2.3 土壤有机质波长变量优选方法
2.3.1 UVE变量优选 利用去有机质前、后的差值光谱矩阵与有机质去除量矩阵进行UVE变量优选,得到UVE变量稳定性分析结果(图5-A)。其中,2 000 nm处的竖直线为变量分隔线,分隔线左侧为原始矩阵2 001个光谱变量的稳定性C的分布曲线,右侧为UVE噪音矩阵2 001个随机变量的稳定性C的分布曲线,两条水平线为UVE变量筛选的上下阈值线,其中阈值的选择标准设置为Cmax的0.99倍。从而剔除变量稳定性值C位于2条阈值线以内的无用信息变量,保留2条阈值线以外的有用信息变量。经UVE变量优选后,共有575个优选变量被保留。显示原图|下载原图ZIP|生成PPT
图 5基于不同方法的变量优选
-->Fig. 5The variables selected based on different variables selection methods
-->
2.3.2 CARS变量优选 采用CARS方法优选,设置蒙特卡罗采样次数为50次,随着采样数增加,被优选出的波长变量数逐渐减少(图5B-a)。在1—23 次采样过程中,RMSECV值不断降低,表明筛选过程中剔除的变量与有机质去除量无关,而23次采样以后,RMSECV值呈回升趋势,表明开始剔除与有机质去除量相关的重要变量,从而导致RMSECV值上升(图5B-b)。当采样次数为第23次时,RMSECV值最小即所选择的光谱变量子集最优(图5B-c中“*”对应的位置),其中该子集包含48个光谱变量。
2.3.3 UVE-CARS、CARS-UVE变量优选 将UVE、CARS两种变量优选方法按照不同运行顺序结合(UVE-CARS、CARS-UVE)对去有机质前、后差值光谱进行变量优选,获得基于不同方法的优选变量分布(图6)。
显示原图|下载原图ZIP|生成PPT
图6基于不同变量优选方法的优选变量分布(图中括号内数字是基于各变量优选方法的优选变量个数;图右侧波段表示基于各变量优选方法的优选变量的波段覆盖范围)
-->Fig. 6Distribution of selected variables based on different variables selection methods(The figure in brackets are the number of selected variables based on different variables selection methods; The spectral bands show the area coverage of selected variables based on different variables selection methods)
-->
2.4 最佳变量优选方法的确定
以不同变量优选方法的优选变量为自变量,有机质含量为因变量,建立、比较各PLSR模型内部交叉验证的效果,确定最佳的变量优选方法(表4)。结果表明,采用UVE-CARS方法获得的优选变量所建模型精度最高,由此后续基于建模集和验证集进行分析的土壤有机质敏感波长(记为Wsen)以UVE-CARS方法的优选变量为准,其84个优选变量分布于561—721、1 920—2 280 nm覆盖范围。Table 4
表4
表4不同变量优选方法的优选变量PLSR模型结果
Table 4Results of PLSR models with different variables selection methods based on selected variables
变量优选方法 Variables selection methods | 校正集 Calibration set | 交叉验证 Cross validation sets | ||||
---|---|---|---|---|---|---|
R2 | RMSE (g·kg-1) | R2 | RMSE (g·kg-1) | RPD | ||
UVE | 0.66 | 1.49 | 0.65 | 1.50 | 1.72 | |
CARS | 0.70 | 1.44 | 0.69 | 1.45 | 1.78 | |
UVE-CARS | 0.72 | 1.40 | 0.70 | 1.43 | 1.80 | |
CARS-UVE | 0.65 | 1.51 | 0.60 | 1.54 | 1.68 |
新窗口打开
2.5 模型建立与比较
基于Wsen建模的同时引入全波段进行比较(图7)。以Wsen对应光谱反射率为PLSR分析的自变量,土壤有机质含量为因变量,采用Full Cross Validation法确定回归模型中最佳因子数,建立PLSR模型(简称Wsen-PLSR)。以同样数据集为BPNN的输入变量,土壤有机质含量为输出变量,建立BPNN模型(简称Wsen-BPNN),将其与全波段的PLSR(简称F-PLSR)和BPNN(简称F-BPNN)进行比较(表5)。结果表明,Wsen-PLSR、Wsen-BPNN模型性能均优于基于各自方法的全波段模型。对比Wsen-PLSR、Wsen-BPNN模型,后者建模和验证的稳定性和拟合程度均高于前者。基于Wsen建模,将模型的自变量数目从2 001个降低至84个,数据压缩率为95.8%。Table 5
表 5
表 5土壤有机质含量估测模型的建模集和验证集结果
Table 5Calibration and validation results of estimation models for soil organic matter content
方法 Methods | 建模集 Calibration set | 验证集 Validation set | ||||||||
---|---|---|---|---|---|---|---|---|---|---|
R2 | RMSE (g·kg-1) | MAE (g·kg-1) | MRE (%) | R2 | RMSE (g·kg-1) | MAE (g·kg-1) | MRE (%) | RPD | ||
F-PLSR | 0.64 | 1.59 | 1.27 | 7.4% | 0.63 | 1.61 | 1.28 | 7.5% | 1.66 | |
Wsen-PLSR | 0.68 | 1.50 | 1.18 | 6.9% | 0.68 | 1.50 | 1.18 | 6.9% | 1.78 | |
F-BPNN | 0.72 | 1.38 | 1.05 | 6.3% | 0.71 | 1.41 | 1.06 | 6.4% | 1.90 | |
Wsen-BPNN | 0.74 | 1.34 | 1.04 | 6.2% | 0.74 | 1.33 | 1.04 | 6.2% | 2.02 |
新窗口打开
显示原图|下载原图ZIP|生成PPT
图7土壤有机质含量的实测值与估测值比较
-->Fig. 7Relationship between measured and estimated soil organic matter content
-->
3 讨论
去有机质试验结果表明,去有机质前、后光谱反射率曲线的几何特征在不同波段存在差异。随着有机质去除量的增加,去有机质后光谱反射率变化也随之增大,尤其表现在可见光波段。这说明该试验对于深入探讨土壤有机质光谱响应规律产生直接作用,为后续确定土壤有机质敏感波长奠定基础。供试土样去有机质后,光谱的平均反射率在全波段范围均有所增加,在可见光波段增加明显。彭杰等[13]通过比较去有机质前、后土壤的光谱反射特性,认为供试的多种土壤类型土样均在400—700 nm波段的平均光谱反射率变化最大,即去有机质对该波段的影响最大。而本文最终定量获取土壤有机质敏感波长分布于561—721、1 920—2 280 nm覆盖范围,这说明将去有机质试验与变量优选方法的优势相结合,一些原本较隐晦的土壤有机质光谱特征信息被提取[30],该敏感波长的分布与可见光谱区受到土壤发色团和有机质本身黑色的影响,以及2 200 nm附近有机质中O-H官能团的伸缩振动和转角振动的合频跃迁有关[31-32]。通过去有机质前、后光谱的差值运算,基于光谱变化信息,采用多种变量优选方法从全波段范围中获取优选变量。单一进行UVE变量优选,则仅仅消除无用变量,并未确定对土壤有机质敏感性强的相关变量。单一进行CARS变量优选,则存在大量无用信息影响甚至遮蔽重要性信息的优选。故考虑将两种方法按照不同运行顺序进行结合,表明UVE-CARS的内部交叉验证结果不仅优于单一优选方法,而且优于CARS-UVE,成为最佳的变量优选方法。这与2种算法本身特征及算法运行顺序密切有关,UVE方法消除了光谱中对模型贡献小甚至无用的变量,降低了噪声干扰对模型稳健性的影响,提高模型的抗干扰能力[21],在此基础上CARS方法优选了对模型贡献大的波长变量集合[33],UVE-CARS在消除了无用信息后,被掩盖的有用信息的重要性被释放和凸显,得到的优选变量个数甚至多于单一CARS方法,这种先“过滤”后“优选”的运算过程,能够合理、精确、有效的确定敏感波长在全波段中的位置。
利用建模集基于敏感波长建模,输入变量大幅减少,线性及非线性模型性能均优于全波段模型,验证集的检验结果体现了敏感波长对该试验区同类土壤有机质含量估测的适用性。其中,BPNN模型的估测能力高于PLSR的结果说明,BPNN模型具有强大的容错能力及非线性逼近能力[34],该模型可以归避由于仪器、人为等因素引起的异常数据对模型的不良影响,使分析结果达到了较高的估测精度[28]。尤其是Wsen-BPNN模型的估测效果最优,说明本文研究方法获得的敏感波长,更能够反映土壤有机质与光谱反射率之间的非线性关系。纪文君等[34]在进行土壤有机质高光谱估测建模研究中将PLSR提取出的主成分带入BPNN进行训练,与PLSR算法相比显著提高了模型的估测精度,而主成分的提取过程是通过线性变换保留包含信息量多的组分,舍弃含信息量少的组分,这与本文变量优选方法的基本特征相一致,均将敏感性强的变量置于BPNN模型,从而实现基于非线性方法的土壤有机质含量高精度的估测。
已有研究表明,基于统计学方法建立的估测模型精度受样本变异程度的影响较大,不同土壤类型样本之间的变异程度越高,模型估测精度也随之提升[35],反之亦然[36]。本文以单一潮土为研究对象,将研究区限定在一个较小的空间范围,使土壤样本的变异度较低,将样本变异度对建模的影响降到最低,能够更单纯地验证去有机质试验和变量优选方法对提升模型估测精度的作用。本文的研究思路对该类土壤具有较好的可行性,未来可以尝试扩大研究范围,将该方法应用于不同土壤类型的有机质含量估测研究,逐渐丰富和完善高光谱监测土壤有机质的理论体系。
4 结论
本文以江汉平原潮土的130个土样为研究对象,利用其中的训练集样本进行土壤有机质去除试验,分析去有机质前、后土壤高光谱变化规律,基于两者的差值光谱分析土壤有机质的光谱响应特征,采用最佳的变量优选方法获取土壤有机质敏感波长,建模集基于敏感波长分别建立土壤有机质的PLSR和BPNN的估算模型,验证集检验本文研究方法对同类土壤的普适性。从而表明通过有机质去除试验,供试土壤的光谱反射率在全波段均有所增加,尤其在可见光波段变化明显。基于训练集去有机质前、后差值光谱,采用最佳的变量优选方法UVE-CARS进行变量优选,最终获得土壤有机质的敏感波长分布于561—721、1 920—2 280 nm波段覆盖范围。建模集基于土壤有机质敏感波长建立的PLSR、BPNN模型性能均优于全波段,其中,基于敏感波长的BPNN模型估测能力高于PLSR,建模集R2、RMSE、RPD、MAE、MRE值分别为0.74、1.34 g·kg-1、2.00、1.04 g·kg-1、6.2%,验证集R2、RMSE、RPD、MAE、MRE值分别为0.74、1.33 g·kg-1、2.02 g·kg-1、1.04 g·kg-1、6.2%。本研究将去有机质试验和变量优选方法的优势相结合,获取敏感波长建模,所得线性、非线性模型精度较于全波段模型均有所提升。The authors have declared that no competing interests exist.