Field Wheat Ears Counting Based on Superpixel Segmentation Method
DU Ying![](https://www.chinaagrisci.com/richhtml/0578-1752/richHtml_jats1_1/images/REemail.gif)
杜颖, 蔡义承, 谭昌伟, 李振海, 杨贵军, 冯海宽, 韩东. 基于超像素分割的田间小麦穗数统计方法[J]. 中国农业科学, 2019, 52(1): 21-33 doi:10.3864/j.issn.0578-1752.2019.01.003
DU Ying, CAI YiCheng, TAN ChangWei, LI ZhenHai, YANG GuiJun, FENG HaiKuan, HAN Dong.
0 引言
1 材料与方法
1.1 试验设计
本试验于2013年在北京市昌平区小汤山国家精准农业研究示范基地(北纬 40°00′—40°21′,东经116°34′—117°00′,海拔高度 36 m)进行。试验设计为氮素和品种的完全随机试验(图1),冬小麦品种为中麦175和中优206,均为冬性中早熟长芒品种,熟期和穗型相似;氮肥水平4个,尿素施用量分别是0(N1),228 kg·hm-2(N2,1/2正常施氮量),456 kg·hm-2(N3,正常施氮量),912 kg·hm-2(N4,过量施肥);重复2个,共16个小区,其他按正常水平进行田间管理。图1
(1)品种处理——P1:中麦 175;P2:中优206。(2)氮素处理——N1:0;N2:1/2正常;N3:1倍正常;N4:2倍正常
Fig. 1Experimental design
(1) Variety treatment——P1: Zhongmai 175; P2: Zhongyou 206. (2) Nitrogen treatment——N1: 0; N2: 1/2 Normal; N3: 1 Normal; N4: 2 Normal
1.2 数据获取
1.2.1 小麦数码影像获取 本研究所用小麦数码影像获取于2013年5月31日(灌浆期)下午5:00(太阳天顶角63°07′51″,方位角96°56′19″),晴朗无风条件下背光手持SONY DSC-H9数码相机田间垂直拍摄。高度为高于小麦冠层顶部约1 m,拍摄面积约为每幅0.75 m2(5行小麦,行距15 cm)。每个小区获取3张分辨率2 592×1 944的小麦数码影像,共48幅。1.2.2 穗数人工获取 在麦穗人工统计过程中,本研究采用人工判读和机器计数相结合的方法(图2)。首先对小麦数码影像进行人工判读,标记出麦穗部分;然后在MATLAB R2016a中提取图像的标记点,对标记点进行数目统计并在图像中标号以获得准确、直观的穗数统计结果。
1.3 麦穗识别方法
麦穗识别过程主要包括以下步骤:超像素分割处理、样本标记、颜色特征分析、分类器训练和识别(图3)。具体步骤如下。(1)利用简单线性迭代聚类(simple linear iterative clustering,SLIC)超像素分割算法对小麦数码照片进行预处理。超像素是指具有同质特征的相邻像素构成的图像块,超像素分割就是将像素聚合成超像素的处理过程,在图像预处理过程被广泛应用。SLIC算法是众多超像素分割算法中的典型代表[20],该算法基于颜色相似度和空间距离关系,利用改进的K均值聚类算法进行局部迭代聚类生成超像素。算法主要涉及两个关键参数:预分割的像素数(n)和像素紧凑度(m)。预分割的像素数n即为图像中的聚类中心数,按照所设定的n值在图像中均匀分配聚类中心,一般来说n越大所得超像素越小分割效果越好,但是同时也会大大增加计算量,影响整体效率,因此需要根据图像的大小合理设定n值;像素紧凑度m为每个类内的最大距离(包括空间距离和颜色距离)的权值,m值越大所分割的超像素边界越规则,较复杂的图片往往需要较小的m值。本试验所用图片大小2 592×1 944,n和m分别设置为10 000和10。
Fig. 2Ears manual counting process
Fig. 3Ears segmentation process
Eg = 2g-r-b;
Dgr = (g-r) / (g+r);
Dgb = (g-b) / (g+b)。
(4)利用MATLAB R2016a中的分类学习工具箱(classification learner),根据颜色特征分析结果,选取适宜的指数用作分类特征,选择几个常用的支持向量机(support vector machine,SVM)和K近邻(K nearst neighbour,NN)分类器进行训练(表1),根据训练结果中分类器的准确率选择最佳分类器。
Table 1
Table 1
分类器类型 Classifier type | 预测速度 Prediction speed | 内存占用 Memory usage | 解释性 Interpretability | 模型灵活性 Model flexibility |
线性支持向量机 linSVM | 二分类:快 Binary: Fast 多分类:中 Multiclass: Medium | 中等 Medium | 简单 Easy | 低 Low 在类之间进行简单的线性分隔 Makes a simple linear separation between classes |
二次多项式支持向量机 quaSVM | 二分类:快 Binary: Fast 多分类:慢 Multiclass: Slow | 二分类:中等 Binary: Medium 多分类:大 Multiclass: Large | 困难 Hard | 中等 Medium |
三次多项式支持向量机 cubSVM | 二分类:快 Binary: Fast 多分类:慢 Multiclass: Slow | 二分类:中等 Binary: Medium 多分类:大 Multiclass: Large | 困难 Hard | 中等 Medium |
细高斯支持向量机 finGSVM | 二分类:快 Binary: Fast 多分类:慢 Multiclass: Slow | 二分类:中等 Binary: Medium 多分类:大 Multiclass: Large | 困难 Hard | 高,随内核刻度设置而减小 High, creases with kernel scale setting 类之间精细区分,内核刻度为sqrt(P)/4 Makes finely detailed distinctions between classes, with kernel scale set to sqrt(P)/4 |
中度高斯支持向量机 medGSVM | 二分类:快 Binary: Fast 多分类:慢 Multiclass: Slow | 二分类:中等 Binary: Medium 多分类:大 Multiclass: Large | 困难 Hard | 中等 Medium 中度区分,内核刻度为sqrt(P) Medium distinctions, with kernel scale set to sqrt(P) |
粗高斯支持向量机 coaGSVM | 二分类:快 Binary: Fast 多分类:慢 Multiclass: Slow | 二分类:中等 Binary: Medium 多分类:大 Multiclass: Large | 困难 Hard | 低 Low 在类之间粗区分,内核刻度为sqrt(P)*4,其中P为预测因子数 Makes coarse distinctions between classes, with kernel scale set to sqrt(P)*4, where P is the number of predictors |
细 K最近邻 finKNN | 中 Medium | 中等 Medium | 困难 Hard | 类之间细微差异区分,邻域数设为1 Finely detailed distinctions between classes. The number of neighbors is set to 1 |
中度 K最近邻 medKNN | 中 Medium | 中等 Medium | 困难 Hard | 类之间中等差异区分,邻域数设为10 Medium distinctions between classes. The number of neighbors is set to 10 |
粗 K最近邻 coaKNN | 中 Medium | 中等 Medium | 困难 Hard | 类之间粗略差异区分,邻域数设为100 Coarse distinctions between classes. The number of neighbors is set to 100 |
余弦 K最近邻 cosKNN | 中 Medium | 中等 Medium | 困难 Hard | 使用余弦距离度量,在类之间中等区分,邻域数设为10 Medium distinctions between classes, using a cosine distance metric. The number of neighbors is set to 10 |
三次多项式 K最近邻 cubKNN | 慢 Slow | 中等 Medium | 困难 Hard | 使用立方距离度量,在类之间中等区分,邻域数设为10 Medium distinctions between classes, using a cubic distance metric. The number of neighbors is set to 10 |
加权 K最近邻 weiKNN | 中 Medium | 中等 Medium | 困难 Hard | 使用权重距离度量,在类之间中等区分,邻域数设为10 Medium distinctions between classes, using a distance weight. The number of neighbors is set to 10 |
1.4 麦穗自动计数方法
如图4所示,对麦穗识别结果二值化,通过腐蚀膨胀等形态学变换[23],保留麦穗的主体部分弱化边缘,减少邻近麦穗的黏连情况。对二值图进行区域统计,计算出二值图中区域数目(nregion)、面积等属性。由于大田环境复杂且灌浆期随着籽粒的充实麦穗形态普遍较大,形态学处理后的二值图中仍存在少量麦穗重叠部分,根据区域的面积和形态(长宽比)等参数筛选出麦穗重叠区,针对重叠区进行骨架提取[24,25]并计算骨架拐点数[26](npoint),重叠区麦穗数为npoint + 1,总麦穗数为nregion + npoint。图4
Fig. 4Ears counting process
1.5 统计分析
在SPSS 22.0中采用Pearson相关系数(r)和线性回归分析方法,分析麦穗自动统计数目与人工计数的关系,比较不同氮水平下麦穗自动统计数目与人工计数的相关性,以人工计数为标准计算准确率(A)。通过比较不同氮水平下的计数准确率,分析长势差异对该方法识别效果的影响。准确率A计算公式如下:$A=\left( 1-\frac{\left| {{N}_{c}}-{{N}_{a}} \right|}{{{N}_{a}}} \right)\times 100%$
2 结果
2.1 麦穗识别
2.1.1 分类特征分析 本研究选用超绿值(Eg)、归一化红绿指数(Dgr)和归一化蓝绿指数(Dgb)这3个与G分量相关的颜色指数,分别对灌浆期麦穗样本、叶片样本和土壤样本进行计算分析(图5)。结果表明,土壤部分的Eg值整体偏小且分布集中,与麦穗部分几乎没有重叠,而叶片与麦穗的Eg分布范围和曲线形态都极为相近,重叠现象严重,因此Eg可以用于麦穗和土壤的区分,但是无法解决图像中的叶片干扰(图5-a);土壤部分的Dgr整体偏小,在大于0的部分与麦穗曲线有着严重的重叠,但是叶片整体分布Dgr值较大区域与麦穗曲线重叠不明显,且峰值差异大,对麦穗和叶片有较好的区分效果;3种样本的Dgb曲线几乎重叠,对麦穗识别意义不大。图5
Fig. 5Color histogram
a: Super green index, Eg; b: Normalized red green index, Dgr; c: Normalized blue green index, Dgb
2.1.2 分类器训练结果 选取Eg和Dgr为分类特征,对MTLAB R2016a自带的分类学习工具箱中SVM和KNN分类器(表1)进行训练,根据训练结果,确定适宜的分类器(表2)。结果表明,无氮水平下(N1)分类准确率均达到80%,medGSVM分类器准确率最高,为87.2%;低氮水平下(N2)各分类器准确率差异不大,均在90%左右,finGSVM分类器最为理想,准确率为92.6%;正常氮水平下(N3),几乎所有分类器准确率均达到90%,medGSVM分类器最为理想,准确率达93.5%;高氮水平下(N4),所有分类器准确率均高于90%,cubSVM分类器最为理想,准确率为93.8%;氮水平混合的情况下,weiKNN分类器最为理想,准确率为88.2%。在单一氮水平下,SVM分类器表现更为理想,有较高的准确率,而对于混合样本,KNN分类器准确率则高于SVM分类器。随着氮素水平的提高,分类准确率有所提升,并趋于稳定,例如N2较N1分类准确率提高了5.4%,N3较N2分类准确率提高了0.9%,N4较N3分类准确率仅提高了0.3%。总体而言,施氮样本(N2、N3、N4)分类准确率相近,无氮处理下植株长势较差,在均一度、颜色、大小等方面与施氮样本有鲜明差异,因此混合样本内部差异较大,分类准确率较低。
2.1.3 麦穗识别结果 利用所确定的分类器分别对预处理后的图像进行麦穗分类识别(图6)。作为对照,利用颜色特征Eg和Dgr对小麦图进行自动阈值计算,叠加2次阈值分割结果即为基于像素的麦穗识别结果。结果表明,区分氮水平的麦穗识别结果较混合氮水平的分类器识别效果更优,所得麦穗部分叶片混杂明显减少;对比基于像素的阈值分割结果,基于超像素的识别结果中麦穗主体更为完整,有效改善穗部斑块缺失,麦穗的形态、大小均得到更好的表达;随着氮素水平的提高,麦穗形态更为清晰,分割效果有所提升,施氮区域(N2、N3、N4)麦穗均能被有效识别,分类效果与分类器训练结果一致。
Fig. 6Ears segmentation results
Table 2
Table 2
分类器类型 Classifier type | 氮水平 Nitrogen level | ||||
N1 | N2 | N3 | N4 | 混合 Mix | |
linSVM | 81.2 | 86.2 | 90.1 | 90.9 | 85.1 |
quaSVM | 86.1 | 89.7 | 91.9 | 92.8 | 87.6 |
cubSVM | 86.6 | 89.5 | 92.2 | 93.8 | 56.8 |
finGSVM | 84.9 | 92.6 | 90.7 | 93.1 | 88.2 |
medGSVM | 87.2 | 90.5 | 93.5 | 92.7 | 88.2 |
coaGSVM | 82.4 | 87.0 | 90.6 | 90.8 | 86.3 |
finKNN | 85.0 | 89.5 | 87.0 | 92.3 | 85.2 |
medKNN | 85.8 | 89.9 | 92.3 | 93.0 | 85.2 |
coaKNN | 83.4 | 88.4 | 90.8 | 90.9 | 87.2 |
cosKNN | 84.8 | 89.4 | 91.1 | 93.0 | 87.1 |
cubKNN | 85.5 | 89.8 | 92.0 | 91.4 | 87.1 |
weiKNN | 86.4 | 91.1 | 92.1 | 92.2 | 88.2 |
2.2 穗数统计
2.2.1 不同氮肥水平的麦穗计数结果 分别将样本按氮肥水平划分和忽略氮肥水平混合,训练相应分类模型对超像素块分类提取麦穗,对麦穗识别结果进行自动穗数统计,以人工计数结果作为穗数的真实值计算计数准确率,对自动统计所得穗数和实际穗数进行线性回归分析,形成1﹕1关系图(图7)。比较不同氮水平下的麦穗统计结果,无氮水平下计数准确率为81.9%,穗数较少时统计结果存在严重偏差,穗数统计值与实际值间相关性也较差(R2 = 0.24,P>0.05),表现为差异不显著,麦穗统计效果差。其他3种施氮水平下均有较准确率(AN2 = 93.1%,AN3 = 94.1%,AN4 = 94.4% ),且穗数自动统计值与实际值之间也有较好的相关性(R2N2 = 072,R2N3 = 0.75,R2N4 = 0.78),均达到极显著相关(P<0.01),麦穗自动计数准确率较高。随着氮素水平的上升,麦穗自动计数效果有所改善,高氮水平下效果最优,准确率达94.4%。穗数统计是基于麦穗识别结果的二值图进行区域处理和统计计算的,因此不同氮水平下的穗数统计效果与麦穗识别效果表现一致,在无氮条件下适用性较差,施氮区域均能有效统计。在忽略氮水平混合所有样本情况下,麦穗自动计数准确率为84.6%,R2为0.15,在本研究平均每幅图中240穗的情况下,统计效果较差,无法满足实际生产上的穗数统计要求。图7
a. 无氮,b.低氮,c. 正常氮,d. 高氮,e.氮水平混合
Fig. 7Ears counting results
a. Nitrogen-free, b. Low-nitrogen, c. Normal nitrogen, d. High nitrogen, e. Nitrogen level mixing
2.2.2 施氮区综合麦穗计数结果 根据上述分析结果,在训练样本中排除极端的无氮样本,对其余混合样本进行K-means聚类,建立具有代表性的混合样本集用于分类器训练。根据训练结果(表3),综合考虑总体分类准确率和穗部分类准确率,选择weiKNN分类器用于识别麦穗,对麦穗识别结果进行自动穗数统计(图8)。与直接混合所有氮水平的统计结果(图7-e)相比,统计效果明显改善,计数准确率由84.6%提高到了92.9%,穗数统计值与实测值相关性也有明显改善,R2由0.15提高到了0.71。因此,在施氮区域可以忽略氮水平差异进行的麦穗识别统计,统计结果较为可靠。
Table 3
Table 3
分类器类型 Classifier type | 总体准确率 Overall accuracy (%) | 穗部准确率 Ear accuracy (%) | 背景准确率 Background accuracy (%) |
linSVM | 87.1 | 88.0 | 86.0 |
quaSVM | 89.2 | 91.0 | 87.0 |
cubSVM | 84.0 | 77.0 | 91.0 |
finGSVM | 89.2 | 89.0 | 90.0 |
medGSVM | 89.5 | 91.0 | 88.0 |
coaGSVM | 88.0 | 90.0 | 86.0 |
finKNN | 87.4 | 87.0 | 87.0 |
medKNN | 89.4 | 90.0 | 89.0 |
coaKNN | 89.1 | 93.0 | 86.0 |
cosKNN | 88.8 | 88.0 | 90.0 |
cubKNN | 88.9 | 89.0 | 88.0 |
weiKNN | 90.2 | 93.0 | 88.0 |
Fig. 8Ears counting result in nitrogen application
3 讨论
本研究选取灌浆期小麦田间影像进行分析,结合小麦的生育进程,花后籽粒受精麦穗体积不断增大,随着籽粒的灌浆充实逐渐达到顶满仓,麦穗体积达到最大值,因此该时期田间影像中麦穗为主要成分。在此之前的开花期,田间影像中叶片比重较大,相反麦穗比例较小,不利于图像特征提取和分析。在此之后的成熟期,随着籽粒成熟,叶片逐渐衰老,植株整体呈金黄色,麦穗与植株的区分度降低,并且田间影像中土壤背景的影响增加了图像特征提取难度。因此本研究认为灌浆期是利用颜色特征识别麦穗的最佳时期。然而灌浆期内小麦形态和颜色变化鲜明,本研究仅选用了单一时期影像,多生育时期结合对田间图像解析和麦穗识别的影响仍有待进一步探究。此外,本研究所采用的数码相机为普通消费级相机(SONY DSC-HX200),由于未进行严格的检校,在近距离获取图像时,其存在较大的光学误差和边缘畸变误差。在麦穗图像获取过程中,田间情况复杂,叶片与麦穗姿态各异,导致相同麦穗的光照条件存在差异,使得图像上麦穗的颜色特征发生较大差异,降低了基于颜色特征分割方法的准确率。以上这些因素均降低了麦穗的识别效果,因此还需要进一步研究,探究一种更好表达麦穗特征的图像获取和处理方法,从而改善麦穗识别效果,提高计数准确率。
4 结论
通过颜色直方图分析,利用颜色特征Eg和Dgr可以有效识别灌浆期麦穗。相较于基于像素的分割方法,基于超像素块分割得到的麦穗形态更为完整,边缘信息保持较好,错分现象也有所改善。受不同氮素水平下小麦长势差异影响,该方法在长势较好的高氮水平下麦穗识别统计效果最优(AN4 = 94.4%),在正常氮(AN3 = 94.1%)和低氮水平(AN2 = 93.1%)下同样适用,长势较差的无氮水平(AN1 = 81.9%)下效果较差。针对混合样本,排除极端无氮情况后,样本长势差异减小,麦穗统计结果有明显改善,准确率达到92.9%,提高了8.3%。因此在一般环境下,利用超像素和颜色特征的麦穗自动统计方法可以快速准确地对大田小麦进行穗数计算,长势过弱以及差异过大区域不推荐使用。参考文献 原文顺序
