删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于多种算法的果树果实生长模型研究—以云南昭通苹果为例

本站小编 Free考研考试/2021-12-26

孙擎,1, 赵艳霞,1, 程晋昕2, 曾厅余3, 张祎11中国气象科学研究院,北京 100081
2云南省气候中心,昆明 650000
3云南昭通农业气象试验站,云南昭通657000

Fruit Growth Modelling Based on Multi-Methods - A Case Study of Apple in Zhaotong, Yunnan

SUN Qing,1, ZHAO YanXia,1, CHENG JinXin2, ZENG TingYu3, ZHANG Yi11Chinese Academy of Meteorological Sciences, Beijing 100081
2Yunnan Climate Center, Kunming 650000
3Agricultural Meteorological Experimental Station of Zhaotong, Zhaotong 657000, Yunnan

通讯作者: 赵艳霞,E-mail: zhaoyanxia@cma.gov.cn

责任编辑: 赵伶俐
收稿日期:2020-11-25接受日期:2020-12-21
基金资助:国家重点研发计划(2019YFD1002201)
云南省科技计划(2018BC007)
云南省省部合作协议重点工程“高原特色农业气象服务系统建设专项”资助项目(2019.01—2021.12)
中国气象科学研究院基本科研业务费(2020Y003)


Received:2020-11-25Accepted:2020-12-21
作者简介 About authors
孙擎,E-mail: sunq@cma.gov.cn; sunqingmeteo@gmail.com







摘要
【目的】针对果树果实与生长过程中的气象因子关联密切,且生长过程多为非线性、非平稳序列,直接对其连续测定难度较大的问题,对比多种模型对果实直径的模拟能力,为果树及其果实的生长发育监测和预测、适时灌溉施肥、生长环境调控等提供科学参考。【方法】以云南昭通苹果为例,分析2019和2020年果实生长期间直径变化特征及其与环境气候因子的关系。引入深度学习中的长短期记忆模型(LSTM),使用LSTM模型对苹果果实直径进行模拟及预测,与多元线性回归模型(MLR)和机器学习模型中的决策树(DT)及随机森林(RF)模型的模拟结果进行对比分析,并使用3种采样方法对不同模型模拟的结果进行评估。【结果】苹果果实直径有明显日变化特征,呈夜间直径增长而白天缩小为主的规律,一般早晨直径达到最大,然后逐渐微缩,在日落前后直径到达当日最小。苹果果实直径的增长速率在果实膨大初期较高,在果实生长后期降低。苹果果实小时和日平均直径与土壤温度和土壤湿度呈中度或高度正相关,与紫外线指数(UVI)呈高度负相关。苹果果实直径的日平均增长量(FMDG)、日增长量(FDG)、日最大变化量(MDFS)与60 cm土壤温度和20 cm、40 cm土壤湿度呈低负相关(-0.5≤R<-0.3)。4个模型的模拟结果相比,LSTM模型的模拟精度高于MLR、DT和RF模型。LSTM模型比MLR模型在相关系数R增加3%—20%的情况下,RMSE和MAE下降约50%—75%,而机器学习模型DT和RF对苹果果实直径的预测相对较差,可能存在过度拟合。【结论】对比统计学、机器学习和深度学习等方法,LSTM模型在苹果果实直径的模拟中表现出更高的精度和可靠性,能更好地解决果实生长过程中的复杂非线性问题。
关键词: 苹果直径;生长模型;气象因子;深度学习;长短期记忆模型(LSTM)

Abstract
【Objective】 Meteorological factors are closely related to fruit diameter during growth process, but this relationship between them tends to be non-linear and non-stationary, thus making it hard to monitor the fruit and trunk diameter continuously. Comparing the simulation capabilities of various growth models for fruit diameter could provide scientific support for fruit growth monitoring and predicting, timely irrigation and fertilization, and the regulation of growth environment. 【Method】 Taking apples in Zhaotong, Yunan Province as an example, this study first analyzed the characteristics of diameter change during apple growth in 2019 and 2020 and its relationship with environmental and climate factors. Subsequently, a deep learning method of Long Short-Term Memory (LSTM) model was adopted to simulate and predict the fruit diameter by integrating these factors, which was evaluated with the multi-linear regression (MLR) model and machine learning methods including Decision Tree (DT) and Random Forests (RF) using three sampling methods. 【Result】 The apple diameter had obvious diurnal cycle characteristics, which shrunk in the daytime and expanded in the nighttime. The maximum diameter was in the morning, while the minimum diameter was near the sunset. The growth rate of apple diameter was higher in the early growth period than near mature. The hourly and daily mean apple diameters were moderately or highly-positive correlated with soil temperature and soil moisture, while there was a highly-negative correlation with UVI. The daily mean increase (FMDG), daily increase (FDG), and maximum daily shrinkage (MDFS) of apple diameter had a weak negative correlation with 60 cm soil temperature as well as 20 and 40 cm soil moisture (-0.5≤R<-0.3). The simulation accuracy of the LSTM model was significantly higher than that of MLR, DT and RF model. The correlation coefficient (R) of LSTM model increased (3% -20%) compared with MLR, and the RMSE and MAE were approximately decreased by 50%-75%. The machine learning methods showed relatively poor performance in apple diameter simulation and might have overfitting problems. 【Conclusion】 Compared to statistics and machine learning approaches, the LSTM model demonstrated higher accuracy and robust performance because of the incapability of considering the complex non-linear correlations in the fruit growth simulation.
Keywords:apple diameter;growth model;meteorological factors;deep learning;Long Short-Term Memory (LSTM)


PDF (4762KB)元数据多维度评价相关文章导出EndNote|Ris|Bibtex收藏本文
本文引用格式
孙擎, 赵艳霞, 程晋昕, 曾厅余, 张祎. 基于多种算法的果树果实生长模型研究—以云南昭通苹果为例. 中国农业科学, 2021, 54(17): 3737-3751 doi:10.3864/j.issn.0578-1752.2021.17.015
SUN Qing, ZHAO YanXia, CHENG JinXin, ZENG TingYu, ZHANG Yi. Fruit Growth Modelling Based on Multi-Methods - A Case Study of Apple in Zhaotong, Yunnan. Scientia Acricultura Sinica, 2021, 54(17): 3737-3751 doi:10.3864/j.issn.0578-1752.2021.17.015


开放科学(资源服务)标识码(OSID):

0 引言

【研究意义】云南昭通市是云南苹果种植的主要区域,也是当地农民主要的经济收入来源之一。2019年,昭通苹果种植规模达4.51万hm2,总产量65万 t,总产值60亿元[1]。云南地形复杂,呈立体气候特征,气象灾害种类多、发生频率高、危害强度大[2],对苹果产量造成较大影响,亟需在模拟果实生长规律的同时,建立气候因子对苹果果实生长的影响模型。随着物联网在农业上的广泛应用,积累了大量的观测数据,为尝试探索应用新的技术和方法来模拟果实生长变化带来了机会。本研究尝试提出模拟苹果果实直径变化的一种新方法,以弥补目前研究方法的不足。研究结果可精确模拟和预测苹果果实直径,对适时进行果树灾害防御、灌溉施肥、生长环境调控等提供重要参考和应用价值。【前人研究进展】果树果实直径每日膨胀和收缩量是果树生长的重要指标,与作物生长环境如温度、日照、土壤水分等环境因子密切相关[3]。大部分关于果树生长的研究主要针对不同灌溉量[4]、施肥量[5]对果实生长发育、品质、直径等的影响,或茎干微变的研究[6,7]。对苹果果实生长的研究来说,主要是关于不同施肥量对苹果果树生长及果实产量的影响[8],或不同干旱程度对苹果果实、茎干直径和叶片水势的影响[9],径流与环境因子的关系 [10]。传统的果实生长发育模型包括作物生理模型、多元线性回归(multi-linear regression,MLR)、移动平均模型(moving average model,MA)、自动回归模型(autoregressive moving average model,ARMA),或基于机器学习方法如BP神经网络、人工神经网络(artificial neural network,ANN)、支持向量机(support vector machines,SVM)等。例如,LI等[11]使用作物生理模型模拟了苹果果实的生长发育情况;夏桂敏等[10]建立了苹果果树径流与环境因子的多元回归模型;张海辉等[12]使用机器学习方法对苹果霉心透射光谱进行研究,结果表明机器学习方法在修正果实直径对透射光谱的影响方面表现出良好的精度;张彪等[13]使用BP神经网络评价了苹果制干的适宜性。但传统作物生理模型、统计模型或机器学习方法存在一定局限,如模型过于简单导致模拟精度较低,或将动态时间建模问题转化为静态空间建模研究,忽略了过去时间的输入对于预测的影响[14]。部分研究使用了深度学习中的递归神经网络(recurrent neural network,RNN),表现出良好的精度[15],但RNN在训练过程中存在梯度消失和梯度爆炸等缺陷。长短期记忆模型(long short-term memory,LSTM)作为一种特殊的RNN模型可以有效规避上述问题,特别是LSTM在时间序列预测方面的优良特性,促使越来越多的研究者将LSTM模型应用在各个方面,如面部识别[16]、质量控制[17]、文本识别[18]、病虫害识别[19]。【本研究切入点】对于果树生长发育中果实或茎干直径微变来说,仅有的研究主要涉及的是作物茎干微变;同时,目前关于深度学习应用在果树方面的研究很少,且主要应用在机器视觉方面[20,21],对与经济价值直接关联的果实直径的监测及模拟研究鲜见报道。【拟解决的关键问题】本研究首先分析苹果果实直径在生长过程中的变化趋势,进而分析苹果果实直径与生长过程中环境因子的相关性,最后使用多元回归模型、机器学习模型中的决策树和随机森林以及深度学习中的LSTM模型分别模拟昭通苹果果实直径在生长过程中的变化情况,并对模拟及预测结果进行对比评估,以验证模型在果实直径监测及模拟中的精度和可靠性。

1 材料与方法

1.1 试验概况

云南省昭通市夏秋季节受西南海洋季风控制,空气湿度大、温度高、雨热同季;冬、春主要受极地大陆季风(干冷气团)控制,空气干燥、温度低、干冷同季。年平均气温11.7℃,月平均气温≥10℃的天数为191.3 d,≥10℃的活动积温3 217.4℃,全年降雨量750—1 100 mm,无霜期221 d,年日照1 902.2 h。苹果开花期温度为15—23℃,花芽分化期温度为20—25℃,果实发育期温度25℃左右,云南昭通自然条件适宜苹果生长,肉质脆且风味浓。

试验于2019和2020年5—8月在昭通苹果果实生长期开展。苹果品种为‘嘎啦’,在2016年树龄2年时移栽,果树种植行距4 m,间距0.5 m,属于自根砧矮化密植,种植地点为云南省昭通市昭阳区永丰镇昭通超越有限公司苹果种植基地(27.25°N,103.69°E),总种植面积约5万亩,选用长势一致、无病虫害的一棵苹果果树及其上正常生长的一个苹果果实进行观测(图1)。2019年2月14日苹果果树进入花芽膨大期,3月4日花蕾出现,开花期为3月20日—4月3日,5月29日在苹果果实直径大于3 cm后开始监测苹果果实直径,2019年8月16日收获,其中7月1—4日,由于仪器故障,数据未能正常采集。

图1

新窗口打开|下载原图ZIP|生成PPT
图1苹果果实和茎干直径监测仪示意图

Fig. 1Apple and trunk dendrometer



2020年2月24日进入花芽膨大期,3月12日花蕾出现,开花期为3月22日—4月8日,在5月18日在苹果果实直径大于3 cm后开始监测苹果果实直径,8月20日收获,其中7月15—16日,由于仪器故障,数据未能正常采集。依据果园常规管理方式开展施肥、灌溉和农药管理。

1.2 观测指标和方法

本试验采用摩尔多瓦Bio Instruments公司生产的线性位移传感器连续自动监测苹果树果实和茎干直径(型号FI-LM),传感器与物联网自动监测系统Caipos(北京科百宏业科技有限公司生产)连接,每间隔1 h自动记录作物果实直径的变化量(μm)。果园内物联网监测系统可以采集以下环境气象要素:降水(mm)、气压(mbar)、太阳辐射(W·m-2)、空气温度(℃)、空气相对湿度(%)、风速(m∙s-1)、风向(度)、紫外线指数(UVI)、叶面温度(℃)、土壤湿度(%)、土壤温度(℃)等。其中土壤湿度采用英国Delta-T公司C200A型土壤水分传感器,可测定20、40和60 cm的土壤湿度(体积含水量)和土壤温度。2019年5月29日至8月16日与2020年5月18日至8月20日苹果果实直径监测期间观测的主要气象数据如图2所示。

图2

新窗口打开|下载原图ZIP|生成PPT
图2试验期间太阳辐射、空气相对湿度、日平均气温、土壤温度、叶片温度、降水和土壤水分

Fig. 2Solar radiation, RH, daily mean temperature, soil temperature, leaf temperature, precipitation and soil moisture during experiment period



基于果实直径传感器测量的果实直径小时数据(μm),本研究采用以下4种果实直径变化指标来衡量果实直径的变化程度:直径日增长量(FDG)、日平均增长量(FMDG)、日最大变化量(MDFS)和小时增量(FHG)。直径日增长量(FDG)是当日果实直径最大值与前一天果实直径最大值的差值;小时增量(FHG)是当前小时的果实直径与前一小时的果实直径的差值;日平均增长量(FMDG)是当日果实的平均直径与前一日果实平均直径的差值;日最大变化量(MDFS)是果实直径日最大值与最小值之差。以上日平均值均为0—23时的平均值。

1.3 模型简介

选取统计学、深度学习和机器学习3种方法中常用的4个模型来模拟苹果果实直径,包括多元回归模型(MLR)、深度学习中的长短期记忆模型(LSTM)、机器学习中的决策树(decision trees,DT)和随机森林(random forests,RF)模型。

1.3.1 多元回归模型 多元回归模型的公式如下所示:

$\text{y}={{a}_{1}}\times {{x}_{1}}+{{a}_{2}}\times {{x}_{2}}+{{a}_{3}}\times {{x}_{3}}+.....+b$
其中,y是因变量,即苹果果实直径,x1,x2,x3….是自变量,即输入的环境气象因子,ai为各个因子的系数,b为误差项。本研究将使用Python 3.6的基于TensorFlow的Keras框架对多元回归模型参数aib进行最优拟合,拟合方法为随机梯度下降法。

1.3.2 LSTM模型 在深度学习中,RNN常用来处理时间序列数据,但是RNN对长序列处理会出现记忆丢失的问题,从而导致梯度消失和梯度爆炸,这使得RNN模型无法深入训练。长短期记忆(long short-term memory,LSTM)是在克服RNN这一缺点基础上形成的一种RNN变形结构,对时间上有依赖的时序数据有着优秀的预测能力。通过在LSTM内部结构中引入门控机制,通过“门”(gate)来控制丢弃或者保留信息,使得时间序列上的记忆信息可控,具有记忆性,使不同时间点之间的数据网络存在连接 [22]。RNN只有一个传输状态(ht)相比,LSTM中有两个传输状态:ct(cell state)和ht(hidden state),如图3-a所示。

图3

新窗口打开|下载原图ZIP|生成PPT
图3长短期记忆网络LSTM模型结构图

Fig. 3Long short-term memory (LSTM) model structure



图3-b为LSTM模型的基本结构图,其中ct为LSTM的记忆状态(即记忆神经元),又称为长期记忆,ht为短期记忆。LSTM模型的网络更新为:设h为LSTM单元输出,c为LSTM模型的记忆模块值,x为单元输入,WxcWhc分别为输入数据和上一时刻的输出权重系数,则t时间的记忆单元值为:

${{\tilde{c}}_{t}}$=tanh(Wxcxt+Whcht-1+bc)
式中,${{\tilde{c}}_{t}}$为ct的逐点乘积。输入门it可控制当前数据

输入对记忆模块状态的影响,公式为:

it(Wxixt+Whiht-1+Wcict-1+bi)
遗忘门ft可控制历史学习对当前记忆模块状态值的影响,决定单元状态被遗忘的信息公式为:

ft(Wxfxt+Whfht-1+Wcfct-1+bf)
当前时刻记忆单元状态则为:

${{\tilde{c}}_{t}}$=ftct-1+it⊙${{\tilde{c}}_{t}}$
输出门ot可控制记忆模块状态制的输出,公式为:

ot(Wxoxt+Whoht-1+Wcoct-1+bo)
LSTM的输出单元ht为:

$h_{t}=o_{t}tanhc_{t}$
上述公式(2)—(7)的W表示相关的权重向量,b表示相关的偏差向量。

本研究将使用Python3.6的基于TensorFlow的Keras深度学习框架,进行LSTM模型的拟合与训练,利用dropout函数防止过度拟合,预测的数据为苹果的果实直径,训练LSTM模型时采用Adam算法动态调整每个输入参数的学习速率,使用MSE最小化为损失函数的优化目标。

1.3.3 决策树模型 决策树(DT)是一种逼近离散值目标函数的方法,DT学习到的函数被表示为一棵决策树,代表的是对象属性与对象值之间的一种映射关系。决策树计算复杂度不高,输出结果易于理解,对中间值缺失不敏感,可以处理不相关特征数据[23]

1.3.4 随机森林模型 随机森林(RF)是由CART算法衍生出的分类与回归算法[24]。RF是一种集成算法(ensemble learning algorithm),使用样本数据中的不同子集建立多个分类回归树,其中每一个子集都在样本数据中随机选择,且每个子集间相互独立。每一个树都是一个独立的分类与回归树,树的每一个节点内可以建立一个简单、准确的模型来模拟自变量与因变量之间的关系。由于该算法对每个节点进行拆分时运用的方案随机,并从这些随机方案中选出最优点,所以随机森林算法对异常值和噪声有较高的容忍度[25]

1.4 模型评价指标

果实直径模拟结果评估使用的指标为:均方根误差(root mean square error,RMSE)、相关系数(correlation coefficient,R)和均方误差(mean square error, MSE)。其中,一般认为0.9<R≤1.0为极高相关,0.7<R≤0.9为高度相关,0.5<R≤0.7为中度相关,0.3<R≤0.5为低相关,0.0<R≤0.3为几乎不相关[26,27,28]

$R M S E=\sqrt{\frac{\sum_{i=1}^{n}\left(S_{i}-O_{i}\right)^{2}}{n}}$
$R=\frac{\sum\nolimits_{i=1}^{n}{({{S}_{i}}-\overline{S})({{O}_{i}}-\overline{O})}}{\sqrt{\sum\nolimits_{i=1}^{n}{{{({{S}_{i}}-\overline{S})}^{2}}\sum\nolimits_{i=1}^{n}{{{({{O}_{i}}-\overline{O})}^{2}}}}}}$
$M S E=\frac{1}{n} \sum_{i=1}^{n}\left(S_{i}-O_{i}\right)^{2}$
其中Oi为果实直径的观测值,Si为模拟的果实直径,$\bar{O}$为果实直径的平均值,$\bar{S}$为模拟的果实直径平均值。

2 结果

2.1 苹果果实直径变化趋势

从2019年5月29日—8月16日(图4-a)与2020年5月18日—8月20日(图4-b)的苹果果实直径小时值和日平均值图可以看出,2019和2020年苹果果实直径约从30 000 μm逐渐增大,成熟收获时约为70 000 μm。苹果果实直径具有明显的日变化规律,在早晨06:00—08:00达到最大,然后果实直径变化开始微缩,在傍晚日落前后18:00—20:00达到最小。苹果果径的日变化在果实生长前期波动较大,在生长后期波动较小。

图4

新窗口打开|下载原图ZIP|生成PPT
图4苹果直径累积增量2019年(a)和2020年(b)小时变化和日平均变化

Fig. 4Hourly and daily variation of apple diameter’s cumulative increment during 2019 (a) and 2020 (b)



图5可以看出,苹果的果径在果实膨大初期增长较快,在整个6月都处在较高的增长阶段,大约每日增长在600—800 μm。在果实生长中期以后,果径的日增量逐渐减少,在果实生长后期接近成熟时果径的日增量约200—400 μm。苹果果径的日增量和小时增量都有明显的周期性波动。对于苹果果径小时增量FHG来说,从日落前后到第二天早晨,苹果果径处在增长的阶段,在白天光合作用和蒸腾作用之后,苹果果径处于缩小阶段,FHG为负值。苹果果径的MDFS、FMDG和FDG指标呈较为一致的变化趋势,周期性地增大或减少,总体呈现出果实生长初期到后期逐渐减小的趋势。

图5

新窗口打开|下载原图ZIP|生成PPT
图5苹果直径2019年(a)和2020年(b)小时增量(FHG)、日平均增长量(FMDG)、日增长量(FDG)、日最大变化量(MDFS)

Fig. 5Hourly increase (FHG), daily mean increase (FMDG), daily increase (FDG), daily maximum shrink (MDFS) for apple diameter in 2019 (a) and 2020 (b)



2.2 苹果果实直径与气象因子的关系

图6为苹果果实直径指标(包括小时果径、日平均果径、FHG、MDFS、FMDG和FDG)与气象及生长因子(包括降水,气压,气温,空气相对湿度,风速,风向,UVI,太阳辐射,(20、40和60)cm土壤温湿度,叶片温度和茎干直径等)的相关系数热力图,为2019年和2020年相关系数的平均值。图中颜色偏蓝说明相关系数呈正相关,颜色偏红表明呈负相关,其中P<0.05。从图6可以看出,苹果果实直径的小时和日平均值与其他因子的相关性较为一致,与茎干直径呈极高正相关(R=0.97),与土壤温度、土壤湿度、茎干直径呈中等或高度正相关,与UVI呈高度负相关,与MDFS、DFG和FMDG呈中度负相关,与其他因子相关性较低。MDFS、FDG和FMDG与其他因子的相关性较为一致,与UVI呈中度正相关,与风向、60 cm土壤温度、20和40 cm土壤湿度呈低负相关,与苹果日平均直径、茎干日平均直径呈中度负相关。FHG与其他因子无明显的相关性。

图6

新窗口打开|下载原图ZIP|生成PPT
图6苹果果实直径指标与生长气候因子相关系数图

Fig. 6Correlation coefficients between apple diameter indices and growing environmental variables



2.3 模型模拟结果

使用MLR、LSTM、DT和RF 4种模型模拟苹果直径的生长变化时,考虑到更好的应用目的,使用自动气象站观测气象要素的小时数据作为输入变量(包括降水、气压、太阳辐射、空气温度、空气相对湿度、风速、风向、紫外线指数、土壤湿度、土壤温度等)。同时,训练数据使用以下3种采样方法对比模型在不同采样方法下的适用性:1)将2019和2020年的数据按照时间顺序放在一起,采样方法为使用前3 003个数据进行训练,剩余1 001个数据作为验证;2)使用2019年数据作为训练数据,2020年数据作为验证;3)将2019和2020年的数据按照时间顺序放在一起,使用前3 003个数据中的80%进行随机采样训练,剩余20%作为验证,最后剩余的1 001个数据作为模型预测的验证。

图7中可以看出,LSTM模型验证结果在4种模型中最好,模拟值与观测值达到极高相关(3种采样方法R均大于0.9),其次是MLR模型,3种采样方法下的观测值与模拟值的相关系数在0.7以上,属于高度相关;DT和RF模型训练结果较差;所有相关系数的P均小于0.01。使用不同采样方法进行训练和验证的效果也不同,采样方法1的验证结果中LSTM模型的R最高(>0.9),达到极高度相关,RMSE约为MLR模型的50%,约为DT和RF模型验证结果的1/3,DT和RF模型的模拟结果相对较差(R<0.3),RMSE在9 000 μm左右。采样方法2使用了2020年的数据进行验证,可以看出MLR和LSTM模型可以较好模拟出苹果果实的变化规律,R均达到极高度相关,LSTM模型验证结果的RMSE约为MLR模型验证结果的50%,为1 757.4 μm;DT和RF模型模拟结果相对较差,可以模拟出果实直径随时间上升的趋势,但是RMSE和MAE较大(>15 000 μm),偏离1﹕1线较远。对采样方法3的验证结果来说,进行随机采样的MLR、LSTM、DT和RF模型的验证结果较好,大部分点在1﹕1线附近,模型验证结果的R均达到极高度相关,除MLR的RMSE为3 106.02 μm,其余模型的RMSE小于1 000 μm,MAE小于300 μm。从采样方法3的预测结果可以看出LSTM模型模拟的精度最高,R大于0.99,RMSE和MAE均在1 000 μm左右;MLR模型的RMSE和MAE在5 000 μm左右,R达到高度相关;而DT和RF模型预测的验证结果较差,R小于0.3,RMSE在9 000 μm左右。

图7

新窗口打开|下载原图ZIP|生成PPT
图7苹果直径实测与模拟值对比

Fig. 7Simulated and observed values for apple diameter



图8为使用3种采样方法训练的模型预测和实测值对比的时间序列图。整体来看,MLR和LSTM能够预测出苹果果实直径随时间增大的趋势,DT和RF模型预测的结果较差。MLR模型在果实生长中期模拟效果较好,在前期和后期模拟结果稍差,在果实生长后期的观测值与模拟值的最大差值约为13 000 μm。LSTM模型的模拟结果最好,在2020年果实生长前期的预测结果好于MLR模型,使用采样方法3的预测结果好于采样方法1的结果,更接近观测值,在果实生长后期的观测值与模拟值的最大差值小于2 000 μm,使用采样方法1和2在果实生长后期模拟结果相近,观测值与模拟值的最大差值约为8 000 μm。DT和RF模型使用3种采样方法的预测结果类似,只能预测部分时间的果实直径,模拟效果较差。

图8

新窗口打开|下载原图ZIP|生成PPT
图8苹果果实直径实测与模拟结果时间序列

Fig. 8Time series of simulated and observed values for apple diameter



3 讨论

苹果果实直径有明显的日变化特征,在早晨约6:00—8:00达到最大,日落前后约18:00—20:00达到当日最小,与苹果树茎干直径的日变化较为一致,在LIU等[29]的研究结果中也得到证实。夜间果树吸水导致果实和茎干的直径膨大,日间果树蒸腾致失水增加[30]进而导致果实和茎干直径收缩,同时日间果树形成的光合产物在晚上分配转移至果实和茎干,是引起苹果果实和茎干日变化的主要原因。苹果果实直径的FMDG、FDG和MDFS的波动较为一致,这些指标能够反映植物体内的水分状况[6],苹果果实直径指标与土壤湿度和土壤温度相关系数较高也从侧面印证了果实中水分的变化。

不同品种的苹果树对气候环境因子的响应也不同[31],定量确定不同品种苹果树对气候因子的响应是今后的研究方向。有研究表明果实产量与茎干直径年增长量成反比,茎干直径年增长量越低,苹果果实产量就越高[32],本研究只使用了2年观测数据,在未来长时间序列的研究中可以进一步探究果实产量与茎干直径增长的关系。果实和茎干直径的大小除了与气象条件相关外,与土壤养分、树体营养、施肥管理措施等也密切相关,但由于较难测定或无法定量确定,因此,本研究仅考虑便于监测的气象因子作为果实监测及模拟的依据。

总体来看,所有采样方法以LSTM模型模拟结果最好,MLR模型模拟结果较为稳健,使用3种采样方法对果实生长后期果实直径的模拟结果相近,但均有一定程度低估。使用LSTM模型在果实生长后期预测的结果比采样方法1和2的结果稍好,更接近观测值。采样方法2中MLR和LSTM模型对苹果果实生长中期的模拟效果较好,采样方法1和3对果实生长后期的果实直径有一定程度的低估,这可能是由于使用了2年的果实生长前期和中期数据进行训练,使用1年的果实生长后期数据进行训练所导致。LSTM模型在果实生长前期和后期的模拟效果高于其他模型,说明LSTM模型可以自动学习出果实在不同生长阶段的直径与环境气象因子的关系。有研究表明LSTM模型的RMSE比使用生理生长模型[10](physiological development time,PDT模型)会降低50%以上。

在机器学习和深度学习训练过程中可能会存在过度拟合现象,导致预测结果低于模型训练结果。在使用采样方法3时,使用随机数据进行验证时,RF和DT模型模拟结果较好,但在使用剩余1 001个苹果果实直径进行预测验证时预测结果较差,对苹果果实直径的预测精度远低于MLR和LSTM模型,这可能主要是由于过度拟合导致。本研究在LSTM模型训练时采用dropout函数避免过度拟合,训练和测试的损失曲线在经过迭代后最终重合并未分散,未发生过度拟合或欠拟合。因此,在4种模型中,LSTM模型对苹果果实直径的模拟效果最好,精度最高,且能够有效防止过度拟合的出现。

本研究成果可用于无田间果实直径监测仪器情况下的果实直径监测及预测,是一种新的模拟思路和方法,一定程度上解决了传统统计学方法如多元回归以及机器学习方法模拟精度不高的问题,深度学习方法表现出更强的稳定性和可靠性,在果实直径监测预测方面有广阔的应用前景[33,34,35]

4 结论

本文分析了苹果果实在生长期间直径的变化情况以及与气候环境因子的相关性,使用统计模型MLR、深度学习模型LSTM和机器学习模型DT及RF共4种模型,建立了苹果果实直径模拟模型并进行验证。结果表明,苹果果实直径有明显日变化特征,一般在早晨直径达到最大,在日落前后直径为当日最小。苹果果实直径的FMDG、FDG和MDFS呈现出果实生长初期变化量增大,生长后期变化量减小的趋势。苹果果实直径和茎干直径呈极高度正相关,变化趋势较为一致。苹果果实直径的小时和日平均值与土壤湿度和土壤温度呈中高程度正相关,与40和60 cm土壤温度及20 cm土壤湿度呈高度正相关,与UVI呈高度负相关。果实直径的MDFS、FDG、FMDG与60 cm土壤温度、20及40 cm土壤湿度呈低负相关。在苹果果实直径模拟方面,LSTM模型比MLR、DT和RF模型表现出更高的可靠性和精度。

参考文献 原文顺序
文献年度倒序
文中引用次数倒序
被引期刊影响因子

王顺富, 张丹, 夏敏, 王成轶, 刘毅, 邓芳, 杨艳群, 郎平勇, 全勇, 李云国. 昭通苹果产业助推脱贫攻坚的经验及成效
云南农业大学学报(社会科学版), 2020, 14(6): 36-41.

[本文引用: 1]

WANG S F, ZHANG D, XIA M, WANG C Y, LIU Y, DENG F, YANG Y Q, LANG P Y, QUAN Y, LI Y G. The experience and effectiveness of apple industry in promoting poverty alleviation program in Zhaotong
Journal of Yunnan Agricultural University (Social Science), 2020, 14(6): 36-41. (in Chinese)

[本文引用: 1]

周桂华, 吴惠标. 2016年云南主要自然灾害特点及减灾对策研究
灾害学, 2017, 32(3): 112-119.

[本文引用: 1]

ZHOU G H, WU H B. 2016 Yunnan major natural disasters and the characteristics of the mitigation measures research
Journal of Catastrophology, 2017, 32(3): 112-119. (in Chinese)

[本文引用: 1]

CONEJERO W, ALARCÓN J J, GARCÍA-ORELLANA Y, ABRISQUETA J M, TORRECILLAS A. Daily sap flow and maximum daily trunk shrinkage measurements for diagnosing water stress in early maturing peach trees during the post-harvest period
Tree Physiology, 2007, 27(1): 81-88.

DOI:10.1093/treephys/27.1.81URL [本文引用: 1]

陈毓瑾, 陈立, 娄玉穗, 秦泽冠, 董肖, 马超, 苗玉彬, 张才喜, 许文平, 王世平. 基于新梢直径和果粒投影面积变化确定‘巨峰’葡萄果实发育期的灌溉阈值
果树学报, 2019, 36(5): 612-620.

[本文引用: 1]

CHEN Y J, CHEN L, LOU Y S, QIN Z G, DONG X, MA C, MIAO Y B, ZHANG C X, XU W P, WANG S P. Determination of thresholds to trigger irrigation of ‘Kyoho’ grapevine during berry development periods based on variations of shoot diameter and berry projected area
Journal of Fruit Science, 2019, 36(5): 612-620. (in Chinese)

[本文引用: 1]

王国栋, 肖元松, 彭福田, 张亚飞, 郜怀峰, 孙希武, 贺月. 尿素配施不同用量纳米碳对桃幼树生长及氮素吸收利用的影响
中国农业科学, 2018, 51(24): 4700-4709.

[本文引用: 1]

WANG G D, XIAO Y S, PENG F T, ZHANG Y F, GAO H F, SUN X W, HE Y. Effects of urea application combined with different amounts of nano-carbon on plant growth along with nitrogen absorption and utilization in young peach trees
Scientia Agricultura Sinica, 2018, 51(24): 4700-4709. (in Chinese)

[本文引用: 1]

王晓森, 孟兆江, 段爱旺, 刘祖贵. 基于茎直径变化监测番茄水分状况的机理与方法
农业工程学报, 2010, 26(12): 107-113.

[本文引用: 2]

WANG X S, MENG Z J, DUAN A W, LIU Z G. Mechanism and methodology for monitoring tomato water content based on stem diameter variation
Transactions of the Chinese Society of Agricultural Engineering, 2010, 26(12): 107-113. (in Chinese)

[本文引用: 2]

林琭, 汤昀, 闫万丽, 张纪涛, 籍增顺. 基于茎直径变化的精准灌溉技术研究进展
农业工程学报, 2016, 32(5): 1-13.

[本文引用: 1]

LIN L, TANG Y, YAN W L, ZHANG J T, JI Z S. Overview of precise irrigation scheduling based on stem diameter variations
Transactions of the Chinese Society of Agricultural Engineering, 2016, 32(5): 1-13. (in Chinese)

[本文引用: 1]

贺琦琦, 郭向红, 杨凯, 石美娟, 马娟娟, 孙西欢, 雷涛, 刘艳武. 滴灌灌施磷钾肥对矮砧苹果树生理生长和产量的影响
节水灌溉, 2019(8): 24-27.

[本文引用: 1]

HE Q Q, GUO X H, YANG K, SHI M J, MA J J, SUN X H, LEI T, LIU Y W. Effects of phosphorus and potassium fertilizer on physiological growth and yield of dwarf rootstock apple trees under drip irrigation
Water Saving Irrigation, 2019(8): 24-27. (in Chinese)

[本文引用: 1]

高木旺, 聂佩显, 孙滢, 姜远茂, 张金春, 张继祥. 避雨环境下苹果幼树水分状态指标对干旱胁迫的响应
应用生态学报, 2016, 27(8): 2459-2466.

[本文引用: 1]

GAO M W, NIE P X, SUN Y, JIANG Y M, ZHANG J C, ZHANG J X. Response of water status indicators in apple saplings to drought stress under shelter from rain
Chinese Journal of Applied Ecology, 2016, 27(8): 2459-2466. (in Chinese)

[本文引用: 1]

夏桂敏, 孙媛媛, 王玮志, 吴奇, 迟道才. ‘寒富’苹果树茎流特征及其对环境因子的响应
中国农业科学, 2019, 52(4): 701-714.

[本文引用: 3]

XIA G M, SUN Y Y, WANG W Z, WU Q, CHI D C. The characteristics of sap flow of Hanfu apple trees and its response to environmental factors
Scientia Agricultura Sinica, 2019, 52(4): 701-714. (in Chinese)

[本文引用: 3]

LI M, CHEN M X, ZHANG Y, FU C X, XING B, LI W Y, QIAN J P, LI S, WANG H, FAN X D, YAN Y J, WANG Y A, YANG X T. Apple fruit diameter and length estimation by using the thermal and sunshine hours approach and its application to the digital orchard management information system
PLoS ONE, 2015, 10(4): e0120124.

DOI:10.1371/journal.pone.0120124URL [本文引用: 1]

张海辉, 田世杰, 马敏娟, 赵娟, 张军华, 张佐经. 考虑直径影响的苹果霉心病透射光谱修正及检测
农业机械学报, 2019, 50(1): 313-320.

[本文引用: 1]

ZHANG H H, TIAN S J, MA M J, ZHAO J, ZHANG J H, ZHANG Z J. Detection method of moldy core in apples using modified transmission spectrum based on size of fruit
Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(1): 313-320. (in Chinese)

[本文引用: 1]

张彪, 刘璇, 毕金峰, 吴昕烨, 金鑫, 李旋, 李潇. 基于BP人工神经网络算法的苹果制干适宜性评价
中国农业科学, 2019, 52(1): 129-142.

[本文引用: 1]

ZHANG B, LIU X, BI J F, WU X Y, JIN X, LI X, LI X. Suitability evaluation of apple for chips-processing based on BP artificial neural network
Scientia Agricultura Sinica, 2019, 52(1): 129-142. (in Chinese)

[本文引用: 1]

陈舒蕴. 基于LSTM多类型机组风电场等值建模研究
山东农业大学学报(自然科学版), 2020, 51(2): 294-297.

[本文引用: 1]

CHEN S Y. Study on the equivalent modeling of wind power farm based on LSTM multi-type wind turbine generators
Journal of Shandong Agricultural University (Natural Science Edition), 2020, 51(2): 294-297. (in Chinese)

[本文引用: 1]

王子文. 基于深度学习和模糊决策的苹果自动分拣方法研究
[D]. 哈尔滨: 哈尔滨工业大学, 2019.

[本文引用: 1]

WANG Z W. Use of deep learning and fuzzy decision making in automated sorting of apple
[D]. Harbin: Harbin Institute of Technology, 2019. (in Chinese)

[本文引用: 1]

SUN X D, WU P C, HOI S C H. Face detection using deep learning: an improved faster RCNN approach
Neurocomputing, 2018, 299: 42-50.

DOI:10.1016/j.neucom.2018.03.030URL [本文引用: 1]

XUE W D, CHAI Y, LI Q G, HONG Y Q, ZHENG G F. Short-term relay quality prediction algorithm based on long and short-term memory
Instrumentation, 2018, 5(4): 46-54.

[本文引用: 1]

LI P, LI X, PAN H, KHYAM O, NOOR-A-RAHIM M. Text-based indoor place recognition with deep neural network
Neurocomputing, 2020, 390: 239-247.

DOI:10.1016/j.neucom.2019.02.065URL [本文引用: 1]

沈利言, 姜海燕, 胡滨, 谢元澄. 水稻病虫草害与药剂实体关系联合抽取算法
南京农业大学学报, 2020, 43(6): 1151-1161.

[本文引用: 1]

SHEN L Y, JIANG H Y, HU B, XIE Y C. A study on joint entity recognition and relation extraction for rice diseases pests weeds and drugs
Journal of Nanjing Agricultural University, 2020, 43(6): 1151-1161. (in Chinese)

[本文引用: 1]

郑艳梅, 黄光耀, 芦碧波, 王永茂. 结合深度学习和引导滤波的苹果叶片图像分割
中国农业大学学报, 2020, 25(9): 112-120.

[本文引用: 1]

ZHENG Y M, HUANG G Y, LU B B, WANG Y M. An apple leaf image segmentation algorithm using deep learning and guided filtering
Journal of China Agricultural University, 2020, 25(9): 112-120. (in Chinese)

[本文引用: 1]

曲之琳. 深度学习网络在苹果表面病变图像识别中的应用
[D]. 南京: 南京邮电大学, 2017.

[本文引用: 1]

QU Z L. Application of deep learning network in recognition of apple surface lesions
[D]. Nanjing: Nanjing University of Posts and Telecommunications, 2017. (in Chinese)

[本文引用: 1]

MTIBAA F, NGUYEN K K, AZAM M, PAPACHRISTOU A, VENNE J S, CHERIET M. LSTM-based indoor air temperature prediction framework for HVAC systems in smart buildings
Neural Computing and Applications, 2020, 32(23): 17569-17585.

DOI:10.1007/s00521-020-04926-3URL [本文引用: 1]

BLANQUERO R, CARRIZOSA E, MOLERO-RIO C, MORALES D R. Sparsity in optimal randomized classification trees
2020, 284(1): 255-272.

[本文引用: 1]

BREIMAN L. Random Forests
Machine Learning, 2001, 45(1): 5-32.

DOI:10.1023/A:1010933404324URL [本文引用: 1]

GISLASON P O, BENEDIKTSSON J A, SVEINSSON J R. Random Forests for land cover classification
Pattern Recognition Letters, 2006, 27(4): 294-300.

DOI:10.1016/j.patrec.2005.08.011URL [本文引用: 1]

DE ANDRADE C F, DELGADO R C, BARBOSA M L, TEODORO P E, DA SILVA J C A, WANDERLEY H S, CAPRISTO-SILVA G F. Fire regime in Southern Brazil driven by atmospheric variation and vegetation cover
Agricultural and Forest Meteorology, 2020, 295: 108194.

DOI:10.1016/j.agrformet.2020.108194URL [本文引用: 1]

MUKAKA M M. Statics corner: A guide to appropriate use of correlation coefficient in medical research
Malawi Medical Journal, 2012, 24(3): 69-71.

[本文引用: 1]

VAJSOVÁ B, FASBENDER D, WIRNHARDT C, LEMAJIC S, DEVOS W. Assessing spatial limits of Sentinel-2 data on arable crops in the context of checks by monitoring
Remote Sensing, 2020, 12(14): 2195.

DOI:10.3390/rs12142195URL [本文引用: 1]

LIU C W, KANG S Z, LI F S, LI S E, DU T S, TONG L. Relationship between environmental factor and maximum daily stem shrinkage in apple tree in arid region of northwest China
Scientia Horticulturae, 2011, 130(1): 118-125.

DOI:10.1016/j.scienta.2011.06.022URL [本文引用: 1]

ORTUNO M F, CONEJERO W, MORENO F, MORIANA A, INTRIGLIOLO D S, BIEL C, MELLISHO C D, PEREZ-PASTOR A, DOMINGO R, RUIZ-SANCHEZ M C, CASADESUS J, BONANY J, TORRECILLAS A. Could trunk diameter sensors be used in woody crops for irrigation scheduling? A review of current knowledge and future perspectives
Agricultural Water Management, 2010, 97(1): 1-11.

DOI:10.1016/j.agwat.2009.09.008URL [本文引用: 1]

EGEA G, PAGÁN E, BAILLE A, DOMINGO R, NORTES P A, PÉREZ-PASTOR A. Usefulness of establishing trunk diameter based reference lines for irrigation scheduling in almond trees
Irrigation Science, 2009, 27(6): 431-441.

DOI:10.1007/s00271-009-0157-0URL [本文引用: 1]

BERMAN M E, DEJONG T M. Seasonal patterns of vegetative growth and competition with reproductive sinks in peach (Prunus persica)
The Journal of Horticultural Science and Biotechnology, 2003, 78(3): 303-309.

DOI:10.1080/14620316.2003.11511622URL [本文引用: 1]

孙红, 李松, 李民赞, 刘豪杰, 乔浪, 张瑶. 农业信息成像感知与深度学习应用研究进展
农业机械学报, 2020, 51(5): 1-17.

[本文引用: 1]

SUN H, LI S, LI M Z, LIU H J, QIAO L, ZHANG Y. Research progress of image sensing and deep learning in agriculture
Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(5): 1-17. (in Chinese)

[本文引用: 1]

邵泽中, 姚青, 唐健, 李罕琼, 杨保军, 吕军, 陈轶. 面向移动终端的农业害虫图像智能识别系统的研究与开发
中国农业科学, 2020, 53(16): 3257-3268.

[本文引用: 1]

SHAO Z Z, YAO Q, TANG J, LI H Q, YANG B J, LV J, CHEN Y. Research and development of the intelligent identification system of agricultural pests for mobile terminals
Scientia Agricultura Sinica, 2020, 53(16): 3257-3268. (in Chinese)

[本文引用: 1]

刘慧芳, 贺正, 贾彪, 刘志, 李振洲, 付江鹏, 慕瑞瑞, 康建宏. 基于机器学习的滴灌玉米光合响应特征
中国农业科学, 2019, 52(17): 2939-2950.

[本文引用: 1]

LIU H F, HE Z, JIA B, LIU Z, LI Z Z, FU J P, MU R R, KANG J H. Photosynthetic response characteristics of maize under drip irrigation based on machine learning
Scientia Agricultura Sinica, 2019, 52(17): 2939-2950. (in Chinese)

[本文引用: 1]

相关话题/数据 土壤 果树 环境 观测