巫振富1, 赵彦锋2, 程道全3, 陈杰,21. 郑州大学公共管理学院,郑州 450001
2. 郑州大学农学院,郑州 450001
3. 河南省土壤肥料站,郑州 450002

Key factors affecting the spatial variation of summer maize yield in Henan Province, China

WU Zhenfu1, ZHAO Yanfeng2, CHENG Daoquan3, CHEN Jie,21. School of Public Administration, Zhengzhou University, Zhengzhou 450001, China
2. School of Agricultural Sciences, Zhengzhou University, Zhengzhou 450001, China
3. Station of Soil and Fertilizer Extension Service, Henan Province, Zhengzhou 450002, China

通讯作者: 陈杰,男,河南长垣人,教授,博士生导师,从事土壤地理与土地资源管理研究。E-mail: jchen@zzu.edu.cn


关键词: 夏玉米;产量;空间分异;Boruta算法;随机森林;土壤;气候;河南省

Assessing the contribution of various factors to the spatial variation of crop yield is of vital importance in promoting agricultural practice according to local conditions, such as delimiting functional regions of grain production, optimizing cropping system, improving medium and low yield fields, and developing high-standard grain fields. This study was carried out in Henan Province, China, by using the field fertilization experiment data at the county level from 2008 to 2010, cultivated land productivity evaluation data, and meteorological data in summer maize growing season. Employing the Boruta algorithm and random forest model, contributions of five factor categories (including 17 factors) namely fertilization, soil, climate, cultivar, and irrigation and drainage, to the spatial variation of summer maize yield were quantitatively assessed. It was demonstrated that the high-yield areas of summer maize were mainly distributed in the Huang- Huai- Hai Plain (HHHP) in the north, and the medium-yield fields were concentrically located in the HHHP in the east and in Nanyang Basin, while the low-yield parcels were scattered in the mountainous and hilly areas in the west, the south, and the periphery of Nanyang Basin. The fields with less inter-annual fluctuation of yield were mainly found in medium-yield areas. All the 17 factors played an important role in the spatial variation of summer maize yield. Fertilization, particularly formulated fertilization, effectively increased crop yield, however, it was not work on changing the spatial distribution pattern of crop yield. This led to the conclusion that the spatial distribution pattern of crop yield is dominated by regional factors such as climate, soil and site conditions. Thus, for sustainable food security, it is necessary to protect high quality cultivated land resources with high and stable yield, and to improve cultivated land productivity by eliminating soil obstacle factors and improving the site.
Keywords:summer maize;yield;spatial variation;Boruta algorithm;random forest;soil;climate;Henan Province

巫振富, 赵彦锋, 程道全, 陈杰. 河南省夏玉米产量空间分布特征及其影响因素. 资源科学[J], 2019, 41(10): 1935-1948 doi:10.18402/resci.2019.10.15
WU Zhenfu. Key factors affecting the spatial variation of summer maize yield in Henan Province, China. RESOURCES SCIENCE[J], 2019, 41(10): 1935-1948 doi:10.18402/resci.2019.10.15

1 引言





2 数据来源与研究方法

2.1 数据来源及处理


(1)作物品种、施肥量(kg/hm2)和对应的夏玉米产量(kg/hm2)。为验证河南省县域测土配方施肥效果,2008—2010年各县农业局进行了三区示范田间试验,即不施肥处理的空白对照区(Control Check, CK)、按照当地农民习惯进行施肥处理的传统施肥区(Conventional Fertilization Treatment, CF)、根据土壤化验结果优化施肥处理的配方施肥区(formulated Fertilization Treatment, FF)。CK、CF和FF处理均详细记录了每年作物品种、氮肥(N)、磷肥(P2O5)和钾肥(K2O)施用量以及与之对应的作物产量。收集整理633个(2008年)、716(2009年)和694个(2010年)河南省夏玉米三区示范田间试验样点的上述数据(图1),并按80%与20%的比例分年度将试验样点随机划分为训练样点和验证样点。



Figure 1Spatial distribution of summer maize planting areas, meteorological stations, and field fertilization experiment sites in Henan Province



为实施夏玉米产量空间预测,将河南省夏玉米种植区耕地进行2 km×2 km格网化处理,并将影响夏玉米产量的因素(不包括作物品种)按照空间位置一致性原则赋值给相应位置的格网。

2.2 研究方法

本文采用Boruta特征选择算法定量评价影响因素对夏玉米产量及其空间分异的重要性;采用随机森林(Random Forest,RF)模型计算不同因素组别对夏玉米产量及其空间分异的解释百分比,并对研究区夏玉米产量进行空间预测。

2.2.1 Boruta特征选择

Boruta是围绕随机森林(Random Forest,RF)构建的用于特征选择的一种包装算法。本文应用Boruta特征选择算法定量评价研究区田间试验样点土壤类型、日照时数、作物品种、N施用量等17个影响因素对CK、CF和FF三种不同处理下夏玉米产量及其空间分异的重要性程度。

基于“RF中单棵树之间不相关”的假设,RF自身具有特征重要性评价功能[34],但是相关研究[35,36,37]表明这种假设并不总是成立。Boruta算法通过向原始特征(Original Features)增加随机性有效解决了这个问题,其核心思想如下:首先,通过随机复制原始特征创建阴影特征(Shadow Features),并将两者合并构建扩展特征(Extended Features);其次,基于扩展特征训练RF模型,以重要性指数(Z-score)为指标评价原始特征与阴影特征的重要性,Z-score越高代表越重要;第三,比较每个原始特征与阴影特征的相对重要性,只有重要性高于所有阴影特征,即高于最好阴影特征(shadowmax),的原始特征才被判定为重要特征[38]

2.2.2 随机森林模型

RF是一种多功能机器学习算法,既是一种能够执行回归和分类任务的弱无偏分类器集合,同时它也是一种有效的数据降维手段。RF通过组合一定数量的分类器,能有效解决单一决策树分类规则复杂、局部最优解、过度拟合等一系列问题[34]。决策树的数量ntree和每棵决策树节点分裂时选用的随机特征数量mtry是RF建模的两个关键参数,本文参考以往相关研究,设置ntree=1000、mtry=log2 M+ 1(M为RF模型选定的特征总数量)[39]


式中:MSROOB表示对残差平方的无偏估计;k为训练样点数量(本文2008年、2009年、2010年k值分别为506、573、555); yiy?iOOB分别为第i个训练样点的实测产量和OOB预测产量平均值。

式中:PEVar为特征变量对夏玉米产量空间分异的解释百分比; δ?y2表示训练样点实测产量y的方差(计算过程中以k作为分母,而非k-1)。


河南省三区示范田间试验样点施肥量和耕地地力调查评价农化样点土壤养分空间插值(相关方法参考文献[40]和[41],插值结果为2 km×2 km栅格图)、夏玉米产量空间分布图绘制均利用ArcGIS 10.1完成。本文涉及的Boruta和Random Forest相关分析计算在软件R 3.5.1环境中完成,分析结果整理和图表绘制使用Microsoft Excel完成。

3 结果与分析

3.1 施肥量和夏玉米产量统计特征

研究区2008年、2009年、2010年三区示范田间试验样点CF和FF处理的施肥量统计结果显示(表1),CF偏重施N,轻施P2O5、K2O特征明显,FF则更注重在肥料类型与施用量两个方面优化N、P2O5、K2O结构。以2008年抽选的506个训练样点为例,FF采用N、P2O5、K2O配施的样点数为499个,配施样点比例远大于CF,并且FF处理在减小N施用量的同时,增加了P2O5、K2O施用量。本文在三区示范田间试验实施期间,CF处理总施肥量从2008年的287 kg/hm2逐年增加至2010年的307 kg/hm2,而FF处理则通过不断优化调整施肥结构的方式,将施肥总量从2008年的329 kg/hm2减至2010年的299 kg/hm2

Table 1
Table 1Statistical characteristics of fertilizer application rate at the field experiment sites
注:NPK、NP、NK、N分别代表N、P2O5和K2O配施、N和P2O5配施、N和K2O配施、N单施。— 表示无该项数据。



Table 2
Table 2Statistical characteristics of summer maize yields of the field experiment sites


3.2 不同因素对夏玉米产量空间分异的重要性分析




Figure 2Z-score values of influencing factors and shadowmax (error bar represents ±1 standard deviation)

3.3 不同因素组别对夏玉米产量空间变异的解释 程度




Figure 3Percent of spatial variation of summer maize yield explained by factor categories


3.4 夏玉米产量空间预测


输出结果显示,2008—2010年不同施肥处理下夏玉米产量实测值与预测值呈极显著相关,相关系数0.60~0.75,均方根误差952~1145 kg/hm2,基于验证样点的预测精度列入表3。根据空间预测结果可以发现(图4),首先,CK、CF和FF三种施肥处理下研究区3年平均单产分别为4035~8491 kg/hm2、5953~9808 kg/hm2和6302~10385 kg/hm2,虽然不同处理方式下夏玉米3年平均单产差距明显,但空间分布格局基本一致:高产区主要分布于濮阳、安阳、鹤壁、新乡、开封等河南省境内的黄淮海平原北部地区,中产区主要分布在商丘、周口、漯河、郑州、许昌等黄淮海平原南部地区以及南阳盆地,低产区则分布在豫西、豫南山区以及南阳盆地周边的丘陵山地。另外,相同施肥处理下夏玉米产量存在明显年际变化,其产量空间分布格局也存在局部差异:如FF处理下,2008年、2009年、2010年研究区夏玉米单产分别为5849~11102 kg/hm2、5570~11047 kg/hm2、5449~11219 kg/hm2;产量空间分布方面,2008年低产区集中分布在郑州、许昌、平顶山3市和洛阳交界的山地丘陵区,2009年低产区则零散分布于平顶山和许昌交界处、洛阳北部和西部、南阳盆地东侧等山地丘陵区,2010年低产区扩展至驻马店南部,而商丘东部则由原来的中低产区变为高产区。本文田间试验开展期间(2008—2010年)与2015—2017年期间的河南省各市夏玉米平均产量散点图表明(图5),虽然各市夏玉米产量水平在两个时期有所变化,但是全省夏玉米产量空间分布格局并未发生根本性改变。

Table 3
Table 3Prediction accuracy of summer maize yield




Figure 4Spatial distribution of predicted summer maize yields in Henan Province



Figure 5Scatter graph of average summer maize yields over three years of 2008-2010 and 2015-2017 of different cities in Henan Province




Figure 6Spatial distribution of standard deviation of summer maize yields, 2008-2010

4 讨论与结论

4.1 讨论





4.2 结论





