0 引言
【研究意义】苹果是世界最大宗的水果之一,而中国又是世界最大的苹果生产国。目前中国苹果种植面积约为2.2×106 hm2,约占世界苹果总种植面积的42%;总产量为3.598×107 t,约占世界总量的54.21%,年产值达1 605.17亿元[1]。由此可见,中国苹果生产在世界苹果产业中占有极为重要的地位,也是苹果主产区农民增加收入的重要途径。要实现苹果生产基地的优质丰产,则首先需要苹果树具有良好的生长势和适宜的花量,而高效可靠的花量估测技术是实施疏花疏果和精准肥水管理的重要依据[2]。但对于大面积规模化果园,依靠人工统计花量十分费时、费力,且对技术经验要求较高,一般管理人员难以正确实施。近年来,快速发展的光谱技术为果树营养和果实品质无损监测等提供了可能。利用光谱分辨率高、波段连续性强、光谱信息量大等优势,实时记录植物器官生长发育中的细微变化,通过科学的光谱采集和模型运算可获取详细的生物物理和生物化学参数信息,及时了解植物的生理生态变化和营养状况,同时还可以预测产量以及对果树品种、病害进行分类[3-6]。【前人研究进展】许多研究表明,利用植株冠层的光谱信息,可以对作物的生长状况进行评估和预测。GUTIERRE等[7]分析了常用的植被指数和冠层光谱反射率与棉花生物量之间的关系,结果表明植株盛花期的比值植被指数与棉花产量具有显著的相关性。程洪等[8]利用树冠图像特征对苹果树产量建立了神经网络模型,其决定系数达到0.9以上。PRASAD等[9]探讨了冬小麦植株的冠层反射率指数与生物质产量间的相关性。朱西存等[10]对苹果花期的冠层高光谱特征进行了研究,探索出该时期的敏感波长以及不同花量光谱曲线的差异。潘蓓等[11]利用苹果冠层的光谱数据建立了预测果树P含量的估测模型。BROGE等[12]通过对作物冠层的光谱反射率红边特性的分析以进行对叶绿素密度的预测。ROYO和VILLEGAS[13]通过实地测量小麦冠层光谱反射率进而实现对小粒谷物的生物量评估。【本研究切入点】目前,有关苹果冠层花量的实时光谱估测技术研究鲜见报道。本研究选用高纺锤形苹果植株,在盛花期采集植株冠层高光谱图像信息,通过光谱数据预处理、建模方法筛选与预测精度分析,对基于光谱技术的苹果树冠层花量的估测进行研究。【拟解决的关键问题】建立高纺锤形苹果树冠层高光谱图像信息采集方法,探讨基于不同预处理方法的PLS模型以及基于特征波长的PLS、BPNN和LS-SVM模型对冠层花量的估测效果,预期结果能够为建立快速准确的花量光谱估测技术提供理论依据。1 材料与方法
试验于2015年4月在陕西海升集团千阳苹果基地的矮砧密植高纺锤形果园进行。1.1 试验时间、地点
该基地位于陕西省关中西陲,北纬34°34′34″— 34°56′56″,东径106°56′15"—107°22′31″,属暖温带半大陆性气候,年均气温10.9℃,年降水量653 mm,果园株距1 m,行距4 m。1.2 试验材料
在试验果园选择99株M9自根砧‘米奇嘎啦’(Malus pumila ‘Mitch Gala’)苹果树为试材,供试植株为定植后第5年,树形为高纺锤形,冠径约60 cm,树高约3.0 m,长势基本一致,正值盛花期,单株花量差异较大。1.3 苹果冠层高光谱图像的采集
将黑色KT板(一种由再生塑料颗粒经过发泡生成板芯,再经表面覆膜压合而成的一种新型材料)直立放在苹果树一侧作为背景,采用以高光谱成像仪(ImSpector,V10E,芬兰)、EMCCD(Raptor photonics公司,FA285-CL,英国)、旋转平台、控制器和笔记本电脑等设备组成的信息采集系统逐株进行光谱图像信息采集。光谱信息采集时间为盛花期晴朗无云天气时的10:00—14:00,镜头焦距8 mm,传感器分辨率1 004×1 002,波长范围305.461—1 090.103 nm,具有501个波段。为了尽量获取完整的冠层信息,将成像仪与树体之间的距离设为最大行距,并主要采集花量集中的树冠中间区域。在图像信息采集过程中根据光线方位和光强的改变及时用白板进行校正。1.4 苹果单株花量和单位面积花量统计
从试验植株各个部位随机选择50个花序,调查每个花序的花量,得到花序平均花朵数为6朵,再人工统计整个植株的花序总量,以式1计算得到试验单株的总花量。即:单株花量(朵)=单株花序数总量×6 (1)
试验植株枝叶分散,从树冠一侧观察类似于一个平面,用单株总花量除以采集冠层的树体实际面积,即可得到冠层单位面积花量(式2)。
单株单位面积花量(朵/cm2)=单株花量/采集冠层的树体实际面积 (2)
1.5 光谱数据提取
如图1所示,将采集的高光谱图像(1-a)先用HIS Analyzer进行黑白板校正得到图像(1-b),将DN值转换成反射率;再将获得的高光谱反射率图像以ENVI4.7软件进行处理,用分割方法将目标区域以外的图像去掉得到图像(1-c);然后采用单波长阈值法除去背景,得到红色区域的树体冠层图像(1-d),提取包括花朵、枝叶、树干等在内的冠层面积(红色区域)的平均光谱反射率为试验单株的冠层光谱反射率。显示原图|下载原图ZIP|生成PPT
图1嘎啦苹果树冠层高光谱图像处理流程图
-->Fig. 1The processing flow chart of Gala tree’s canopy hyper-spectral images
-->
1.6 光谱数据预处理与特征波长提取
光谱采集过程中,由于外界环境的影响会导致光谱曲线存在一些噪声,因此本试验采用The Unscrambler v9.7软件中提供的SG、SNV、lst Der、2nd Der、Normalize等5种光谱预处理方法[14]。采用x-LW法[15]提取预测单株花量的特征波长。
1.7 模型建立与优选标准
本研究获得99株矮砧‘嘎啦’苹果树冠层高光谱反射率信息,在建模过程中采用随机分配法[16]选取79个样本作为校正集,20个样本作为预测集。在全波长条件下,建立基于树体冠层原始光谱反射率与不同预处理光谱的PLS模型[17],经数据分析筛选出最佳预处理的PLS模型;再基于x-LW提取的特征波长建立PLS、BPNN[18]和LS-SVM[19]模型。以决定系数(R2)、均方根误差(RMSE)和相对误差(RE)作为评价指标[20]。2 结果
2.1 花量水平评价指标筛选
在光谱建模分析研究中,所建模型的性能优劣和适应范围在较大程度上取决于校正集样本数据的精度和覆盖范围,尤以样品值覆盖范围越大,所建模型的预测精度越高,适用范围越广[21]。本试验所用样本植株中(表1),单株花量介于60—2 322朵,平均花量为843.818朵,样本变异系数为62.214%;单株单位面积花量在0.007—0.291朵/cm2之间,平均单位面积花量为0.106,样本变异系数为63.462%。二者都具有较大的花量覆盖范围,可以用于建模预测分析。Table 1
表1
表1嘎啦苹果盛花期单株花量与单位面积花量的统计结果
Table 1The statistics of the number of flowers per tree and flowers per unit area during Gala blooming
统计项目 Statistical items | 样本数 Samples | 平均值 Mean | 最小值 Minimum | 最大值 Maximum | 标准差 Standard deviation | 变异系数 Variable coefficient |
---|---|---|---|---|---|---|
单株花量 The number of flowers per tree (flower) | 99 | 843.818 | 60 | 2322 | 524.976 | 62.214% |
单株单位面积花量 The amount of flowers per unit area per tree (flowers/cm2) | 99 | 0.281 | 0.018 | 0.787 | 0.178 | 63.462% |
新窗口打开
由图2可知,单株花量和单株单位面积花量的相关系数达到0.930,由此表明,以单株单位面积花量代表单株花量水平是完全可行的。
显示原图|下载原图ZIP|生成PPT
图2单株花量与单株单位面积花量的线性关系
-->Fig. 2The linear relationship of flowers per tree and flowers per unit area per tree
-->
2.2 嘎啦苹果盛花期冠层高光谱曲线特征
为了直观了解单位面积不同花量与花期冠层光谱反射率的关系,将99个样本数据按照单位面积花量由低到高分成3组,每组33个样本,从而得到平均单位面积花量分别为0.096、0.260和0.487 朵/cm2的3组数据,将每一组别所有样本的冠层光谱进行平均,同时将冠层光谱数据与单位面积花量进行相关性分析。结果显示(图3、图4),单株单位面积花量在紫外-可见光波段(308—700 nm)显著影响其光谱反射率,两者之间呈极显著正相关;在近红外波段(750—1 050 nm)的决定系数较低,相关性没有达到极显著水平。水是吸收太阳辐射能量最强的介质,主要影响短波-红外光谱的反射率,在室外采集高光谱图像时,不可避免空气中水汽对图像高光谱反射率的影响,因此,在758 nm波长下突然出现的一个反射峰,可能是受室外采集高光谱图像时空气中水汽的影响[22]。在550 nm绿光区域有一个明显的波峰,是由于冠层叶片对绿光的强烈反射所致;在690 nm红光区域有一个明显的波谷,这是由于冠层叶片对红光强烈吸收形成的;在750—1 050 nm波长范围内,苹果树冠层具有较高的反射率,1 000 nm以后光谱反射率骤然降低。显示原图|下载原图ZIP|生成PPT
图3嘎啦苹果盛花期单位面积不同花量的冠层光谱曲线
-->Fig. 3The reflective spectra curves of Gala canopy with different flowers per unit area in blooming period
-->
显示原图|下载原图ZIP|生成PPT
图4单株冠层光谱反射率与单株单位面积花量的相关性曲线
-->Fig. 4The correlation curve of canopy spectral reflectance per tree with flowers per unit area per tree
-->
2.3 基于不同预处理的PLS模型对单株单位面积花量的估测
比对分析不同光谱预处理方法对估测单株单位面积花量的PLS模型的影响。从本试验结果可见(表2),基于Normalize预处理的建模效果最好,模型的决定系数最高,Rc2和Rp2分别为0.794和0.804;均方根误差和相对误差最小,RMSEC和RMSEP分别为0.084和0.062,RE%为3.940。Normalize-PLS的预测散点图如图5所示。
Table 2
表2
表2基于不同预处理的PLS模型预测结果
Table 2The prediction results of PLS models based on different pretreatments
预处理方法 Pretreatment methods | 校正集(79个)Calibration | 预测集(20个)Validation | ||||
---|---|---|---|---|---|---|
决定系数 Rc2 | 均方根误差 RMSEC | 决定系数 Rp2 | 均方根误差 RMSEP | 相对误差 RE% | ||
原始光谱反射率 OS | 0.768 | 0.089 | 0.762 | 0.069 | 5.650 | |
Savitzky-Golay平滑法 SG | 0.768 | 0.089 | 0.760 | 0.069 | 6.140 | |
一阶求导 lst Der | 0.687 | 0.104 | 0.693 | 0.078 | 14.650 | |
二阶求导 2nd Der | 0.702 | 0.101 | 0.755 | 0.070 | 5.390 | |
正态变量标准化 SNV | 0.752 | 0.092 | 0.734 | 0.072 | 5.830 | |
标准化 Normalize | 0.794 | 0.084 | 0.804 | 0.062 | 3.940 |
新窗口打开
显示原图|下载原图ZIP|生成PPT
图5Normalize-PLS模型对单株单位面积花量的预测结果
-->Fig. 5The prediction result of flowers per unit area per tree based on Normalize-PLS
-->
2.4 基于特征波长的PLS、BPNN和LS-SVM模型对单株单位面积花量的估测
采用全波长建立校正模型时,不仅运算数据量大,而且冗余信息较多,校正模型的预测精度未必能达到最优[23]。利用x-LW提取了8个特征波长(555.889、678.518、750.358、751.962、755.170、848.612、923.113和934.467 nm),基于该特征波长建立PLS、LS-SVM、BPNN 3种模型。运行LS-SVM模型时采用交叉验证优化参数,运行BPNN模型时参数设置为允许最大训练步数5 000步,训练目标最小误差0.01,每间隔50步显示一次训练结果,学习速率为0.01。由3种模型的建模结果(表3)可知,BPNN模型预测集R2偏低,RE偏高,模型稳定性不足;PLS模型的相对误差最小,但模型决定系数偏低,预测精度不如全波长;LS-SVM模型决定系数最高,均方根误差较小,RE稍高,以该模型综合效果较好。x-LW-LS-SVM的预测散点图如图6所示。Table 3
表3
表3基于特征波长的三种模型对单株单位面积花量的建模结果
Table 3The results of three models based on characteristic wavelengths to predict the number of flowers per unit area per tree
模型 Models | 校正集(79个)Calibration | 预测集(20个)Validation | |||
---|---|---|---|---|---|
决定系数 Rc2 | 均方根误差 RMSEC | 决定系数 Rp2 | 均方根误差 RMSEP | 相对误差 RE% | |
x-LW-PLS | 0.713 | 0.099 | 0.669 | 0.081 | 2.643 |
x-LW-LS-SVM | 0.826 | 0.077 | 0.804 | 0.064 | 12.160 |
x-LW-BPNN | 0.988 | 0.004 | 0.567 | 0.385 | 37.660 |
新窗口打开
显示原图|下载原图ZIP|生成PPT
图6x-LW-LS-SVM模型对单株单位面积花量的预测结果
-->Fig. 6The prediction result of flowers per unit area per tree based on x-LW-LS-SVM
-->
3 讨论
花期是苹果树年生长发育周期中的重要时期,树体花量的多少是果树肥水管理的重要依据,也是果园生产力预测的一项重要依据,因此,快速估测花量具有重要生产意义[24]。光谱技术是近年果树生理信息获取方法的一次革命,较多研究表明,通过冠层光谱信息可以实时了解作物的生理生化特征[25-28],预测作物或组织的代谢趋势[29],精准指导果园管理作业[30]。矮砧高纺锤形密植栽培是当前苹果栽培技术的发展趋势,也是中国推动苹果栽培技术提档升级的重要内容之一[31],因此,本试验选择高纺锤形苹果树进行研究。由于田间采集苹果树冠层高光谱图像时难免出现局部区域丢失现象,这对于树体总花量的预测必然造成一定的误差,而统计单位面积花量可以有效降低该误差。此外,衡量一株树花量的多少不应该只看花量绝对值,统计单位面积花量则可更为科学地评估树体开花能力和花量水平,从而科学进行疏花管理[32-33]。本研究表明利用冠层高光谱或特征光谱反射率均可实现对苹果单株单位面积花量的有效估测,由于单株花量与单株单位面积花量之间较高的线性相关性,因此可同时通过线性方程估测单株花量。而通过特征波长的筛选利用,可为研制成本较低的多光谱监测系统、最终为实现果园花量光谱估测技术的实用化奠定基础。
光谱预处理不仅可以有效消除背景噪音、降低物理因素所导致的散射影响,而且可以提高模型的适用性。田喜等[34]采用不同光谱预处理方法对柑橘叶片光合色素进行预测研究,结果显示经过多元散射校正建立LS-SVM对叶绿素a的预测效果最好;易时来等[35]表明在预测锦橙叶片钾含量采用二阶微分建立回归模型预测精度最高;卢艳丽等[36]采用570—590 nm波段的一阶导数预测土壤有机质含量得到了较高的预测精度。本试验结果表明,不同光谱预处理方法所获得的PLS模型预测精度存在差异,其中,以经过Normalize预处理的高光谱数据所建立的PLS模型预测精度最高,表明通过对光谱数据进行预处理可提高建模预测精度。
偏最小二乘法(PLS)、支持向量机(LS-SVM)、神经网络(BP)都是化学计量学建模分析中常用的方法。本研究中,以特征波长的光谱数据为自变量的PLS模型的建模效果不及全波长的建模效果好,这可能是因为提取的特征波长不够充分;BP模型得到的Rc2最高,Rp2最低,RMSE相差较大,并且预测RE偏大,表明其模型的稳定性不够;LS-SVM模型决定系数较高,预测效果最优,但是预测相对误差稍大,不及Normalize-PLS的建模效果,两种建模方法均有各自的优缺点,x-LW-LS-SVM模型所用波长数较少,提高了模型的运算速度,但是降低了模型的预测精度,因此,进一步研究特征波长的提取至关重要。其中核函数和正则化参数对于LS-SVM模型的性能具有重要的作用,目前虽有多种选取参数的方法,例如本研究采用的交叉验证法,但不能保证能够得到一个最优的建模参数,而如何快速有效地确定最优参数,一直以来都是提高该模型学习和泛化能力的主要研究问题之一[37-38]。
4 结论
基于高纺锤形苹果树盛花期冠层高光谱图像信息,通过不同光谱预处理方法、特征波长的提取和建模方法,可实现对单株单位面积花量的较好预测。3种建模预测方法比对发现,基于全波长的偏最小二乘法模型(PLS模型)和基于特征波长的最小二乘支持向量机(LS-SVM)对单株单位面积花量的估测效果均较好,人工神经网络模型(BPNN模型)稳定性最差。其中以基于标准化预处理的PLS模型综合效果最佳。The authors have declared that no competing interests exist.