基于机器视觉技术预测玉米质量等级的方法研究

周鸿达,张玉荣,王伟宇,陈赛赛

(河南工业大学粮油食品学院,粮食储藏与安全教育部工程研究中心,粮食储运国家工程实验室,河南郑州 450001)

摘 要:国家标准规定玉米的质量定等指标为容重,为了实现利用机器视觉快速预测玉米等级,采用自行构建的基于机器视觉技术的玉米检测系统获取4种不同等级的玉米籽粒图像,通过均值滤波、最大类间方差法和形态学运算对玉米籽粒和背景进行处理、分割和特征参数的选取,并采用主成分分析法确定图像特征信息的最佳主成分因子数,建立以玉米容重为基础的8-21-4三层BP神经网络质量等级识别模型。结果表明:利用BP神经网络对基于完整籽粒图像和籽粒横切面图像的玉米等级的总体识别率均在90%以上,因此利用该模型对玉米等级的检测识别具有较高的可行性。

关键词:玉米;质量等级;机器视觉;主成分分析;BP神经网络

按照国家标准GB 1353—2009规定,玉米等级是按容重大小进行划分,该标准是玉米在收购等流通环节中判断质量等级的重要依据,能够确切地反映玉米自身的成熟度、完整度、均匀度和使用价值[1]。籽粒的大小、形状、水分含量、整齐度、饱满程度、胚乳质地等多方面因素决定了玉米容重的大小,一般来说,籽粒饱满、水分含量低、杂质含量少、不完善粒少、质构紧密、粒形较短的玉米容重较大;反之籽粒不饱满、水分较高、杂质含量高、不完善粒多、质构疏松、粒形较长的玉米籽粒容重较小。Hurburgh[2]等研究了玉米水分与容重对玉米质量的影响,其关系为每降低1%的水分,玉米容重增加0.25磅/蒲式耳;车海先等[3]研究表明玉米容重与水分、体积、形状、表面光滑度等因素有关;顾金玲等[4]研究了杂质含量与容重的相关性,指出杂质含量在9%以下时,容重与杂质含量呈正相关,高于9%时,呈

负相关。然而从籽粒本身的角度,利用机器视觉对玉米容重的影响因素研究目前尚未见报道。机器视觉技术在农产品质量与品质检测过程中,通常从样品的形态、颜色和纹理等方面提取特征参数,用于籽粒特征描述并对其进行评价。因此,利用机器视觉技术对玉米籽粒的颜色、大小、光滑度、胚乳质地等影响玉米容重的因素进行描述提供了可能性。本研究尝试利用机器视觉技术对玉米容重的影响因素进行分析,并且建立等级识别模型,以实现玉米等级的快速识别判定。

1 材料与方法

1.1 材料与装置

1.1.1 试验材料

玉米样品由吉林省中储粮质检中心提供。从一等到四等4个等级的玉米样品中分别选取若干份容重相近的玉米样品,每种等级的玉米样品分别采集玉米完整籽粒和籽粒横切面图像各150张,随机选取其中的80张作为训练样本,剩余的70张作为测试样本,用于模型的学习和测试。对玉米籽粒横切面图像进行采集时,使用单面刀片将玉米籽粒从中部横向切断,保留带胚芽的部分用于图像采集,横切面图像采集数量同完整籽粒图像。然后用快速水分测定仪测定水分后将样品水分调至(13.5± 0.5)%。待水分平衡后利用国标法进行容重测定,其结果如表1所示。

表1 不同等级的玉米样品g/L

1.1.2 仪器设备

HGT-1000A型容重器:上海东方衡器有限公司生产;LDS-1G谷物水分测定仪:上海青浦绿洲检测仪器有限公司生产;1010-3型鼓风恒温干燥箱:上海实验仪器厂有限公司生产;AY120电子天平:日本岛津制作所生产;自行构建基于机器视觉技术的玉米检测系统,如图1所示。

图1 图像采集系统

1万向支架 2 CCD摄像头 3 LED环形光源 4支盘 5计算机 6图像采集卡

1.2 玉米籽粒图像采集及预处理

1.2.1 图像采集

玉米籽粒的图像是在自制基于机器视觉技术的玉米质量检测系统中采集的。采集时先确定光源的亮度,再调整焦距和样品位置,选取合适的参数。再利用图像采集卡将所采集的图像数据存储到计算机(存储格式为BMP),以备后续处理。采集的玉米籽粒图像如图2所示。

图2 玉米籽粒原始图像

1.2.2 图像滤波

利用MATLAB中的图像处理工具箱中的线性

滤波、中值滤波和维纳滤波等方法来消除噪音,实现对图像的平滑、锐化及边缘检测。通过对比不同滤波方法处理的效果,结果发现均值滤波的效果最好,且滤波窗口选择3×3模板,处理效果如图3所示。

图3 玉米籽粒滤波后图像

图4 不同等级玉米籽粒横切面滤波后图像

1.2.3 图像分割

为了去掉原始图像中一些无用的信息和减轻后期处理的工作量。通过对玉米籽粒原始图像进行灰度化处理,同时采用最大类间方差法(OTSU)[5-6]对玉米籽粒和背景进行分割,另采用形态学运算中膨胀和腐蚀进行开、闭运算,并对玉米籽粒的边缘进行平滑和形态学上的闭操作,再经填充得到如图5a所示的玉米籽粒区域图像。利用此图像作模板分别和均值滤波后的R、G、B分量进行合成运算得到图5b,该图能较好地保留了其形态、纹理和颜色等特征信息[7]

图5 玉米籽粒OTSU分割后图像

2 籽粒外观特征参数提取

由于相同容重的玉米在籽粒颜色、形态和纹理特征之间也会存在较大的差异,因此单个籽粒的图像特征不能准确的反映该等级下的玉米整体特征。在试验中提取出每个籽粒的特征参数后,对整张图像籽粒特征参数取均值,将每张图像的特征参数均值用于不同等级玉米的特征差异描述。

2.1 形态特征

玉米籽粒的形态特征参数值可以反映玉米本身的完整性[8],可通过二值图像标号将每一个玉米籽粒从整体图像中提取出来,经形态学运算处理后,有效去除噪声干扰之后利用籽粒区域和边界特性提取籽粒形态特征。获取玉米完整籽粒及籽粒横切面的形态特征参数如表2、表3所示。

表2 不同等级玉米籽粒的形态特征

根据表2所示结果,不同等级的玉米籽粒在形态特征上存在较明显差异,一等玉米投影面积最小,四等玉米的最大,直径、当量直径、长轴长等从一等至四等逐渐增大,反映出玉米籽粒本身的大小对玉米容重有一定的影响。因此,利用形态特征参数反映不同等级玉米容重的差异是可行的。

表3 不同等级玉米横切面籽粒的形态特征

由表2、3可知,不同容重的玉米籽粒在外观、大小等方面均存在一定差异,因此对于玉米完整籽粒选择形态、纹理和颜色特征参数表征容重的不同,对于玉米籽粒横切面,形态特征影响较小,可以进一步选取颜色和纹理特征来表征对容重的影响程度。

2.2 颜色特征

采用人眼最为敏感的RGB模型和HSI模型对不同等级的玉米颜色信息进行描述,提取籽粒的6个特征指标计算其均值。不同容重下玉米完整籽粒的颜色特征如表4所示,由表4可知一等至四等玉米颜色特征变化差异较为明显,利用颜色特征参数的差异来表征玉米等级的不同是可行的。

表4 不同等级玉米完整籽粒的颜色特征

由表5可以看出,不同容重的玉米籽粒横切面的颜色特征参数差异较为明显,从一等玉米至四等玉米,R、G、B和I均值逐渐增大,而H均值和S均值逐渐减小,由此可以说明利用横切面籽粒颜色特征参数的差异来表征玉米等级的不同是可行的。

表5 不同等级玉米籽粒横切面的颜色特征

2.3 纹理特征

纹理特征包含了玉米籽粒中重要的结构组织排序[9],本实验采用基于区域亮度直方图的统计方法来描述玉米种子胚部及胚乳的纹理特征[10]。为了消除背景的影响,在亮度直方图中去除灰度值为0的像素,纹理特征的计算公式分别为:

用以表示该区域中灰度值平均对比度度量。

用以描述图像区域亮度的相对平滑度,在实践中常常需要对其进行归一化处理,用以度量图像灰度概率密度分布情况。

用以描述图像区域灰度的一致性。

用以描述纹理的复杂及混乱程度。

式中:zi为亮度的随机变量;

p(zi)为一个区域中灰度级的直方图;

L为灰度级数。

纹理特征包含了玉米籽粒重要的结构组织排序,对提取的纹理特征参数,分别计算了标准差、平滑度、三阶矩、一致性和熵正理,结果如表6和表7所示。由表6和表7可看出不同容重的玉米籽粒在标准差、光滑度、三阶矩等纹理特征方面均存在一定差异。

表6 不同等级玉米完整籽粒的纹理特征

表7 不同等级玉米籽粒横切面的纹理特征

由提取的不同等级的玉米完整籽粒和籽粒横切面的颜色、形态和纹理特征参数可知,对于完整籽粒图像,颜色特征能较好的反映不同等级玉米的籽粒差异,其次是形态特征和纹理特征。对于籽粒的横切面图像,颜色和纹理特征能较好的反映不同等级玉米籽粒的差异,形态特征差异很小。

3 识别模型与结果分析

3.1 基于主成分分析的BP神经网络因子数的确定

对玉米各籽粒图像采用主成分分析进行特征简化,对籽粒的原始形态、纹理和颜色共48个特征进行主成分分析,得到主成分贡献直方图如图6所示,从图6中可看出第一个主成分的方差贡献率达59.36%,前8个累积方差贡献率达到99.07%,即此8个主成分几乎能表征图像所有特征变量的原始信息。因此,以8作为输入单元来建立BP神经网络模型。

图6 各主成分的方差贡献直方图

3.2 基于BP神经网络的识别模型

BP神经网络(Back propagation network)是误差反向传播的多层前向网络结构,能够实现输入和输出间的任意非线性映射,适宜于复杂类型模式的分类。本实验的模式识别是利用BP神经网络分类器来完成,而BP神经网络选用单隐层结构。输入层神经元个数由主成分分析筛选的参数数量确定,根据主成分分析结果,输入层神经元个数为8。中间层节点数通过训练来确定,即隐含层神经元数目主要利用试凑法来确定,每个隐含层节点数按照n2=2n1+1选取,其中n2表示隐含层神经元个数,n1表示输入神经元的个数,因此选取13、15、17、19、21进行训练对比,即BP神经网络的结构为8-(13、15、17、19、21)-4,隐含层节点数由训练比较的结果来

确定,最终进行识别BP网络模型的确定。网络输出为4种玉米等级,因此输出层的神经元应该有4个,目标输出模式为(1000)、(0100)、(0010)和(0001),即分别代表一等、二等、三等和四等。

不同隐含层节点值训练结果对比如表8。

表8 不同隐层节点数训练结果对比

由表8可知,对于隐含层节点数13的网络,与其他隐含层节点数相比,训练次数和训练时间、MSE都最大。隐含层节点数为15和17的网络,训练时间较短,但MSE比较大,达不到目标误差要求。隐含层节点数为17和19的网络,训练时间和MSE都较小。在所选隐含层节点数中,综合考虑训练次数、训练时间、MSE等方面,节点数为21时效果最好。因此,研究中将中间层节点数选为21,神经网络结构为8-21-4。节点数为21的训练过程和结果见图7。

图7 节点为21的训练结果

3.3 模型的验证

以网络的输入神经元个数为8,根据不同隐层节点数训练结果对比,隐含层可以取21个节点。由于网络输出神经元个数为4,所以该BP神经网络结构为8-21-4。系统识别的结果如表9所示。

使用相同的方法对基于横切面信息的玉米等级进行识别,经过比较,将网络结构设计为8-21-4时,网络性能最好。使用该模型对玉米等级进行识别,其结果如表9所示。

表9 BP神经网络模型对基于完整籽粒图像的玉米等级识别结果

由表9和表10中的识别结果可以看出,使用BP神经网络模型对玉米等级进行识别时,模型对基于完整籽粒图像训练集的玉米等级识别时的正确率为93.44%,基于横切面信息的玉米等级识别正确率达到91.88%,因此两种方法均可对玉米等级进行有效的识别。基于横切面信息的玉米等级识别主要是依据玉米籽粒结构的紧密程度等内在品质进行的,其外界影响因素较小,而基于完整籽粒图像是依据完整籽粒的形态、颜色、纹理特征对其识别,其外界因素影响较大,因此,建议在使用机器视觉图像处理技术识别玉米等级时,主要使用玉米横切面图像来进行判别。

表7 BP神经网络模型对基于横切面图像的玉米等级识别结果

4 结论

对采集到的RGB彩色图像进行均值滤波、图像分割、形态学运算等预处理,可以较好地实现图像增强和消除噪声的目的,能够满足图像特征信息提取的要求。通过对形态学运算处理后的二值图像进行像素点统计等相关运算,可以得到玉米籽粒的形态特征信息,对原始RGB图像及其子图像处理后进行颜色和纹理特征参数的提取,可以获取玉米籽粒图像的颜色和纹理特征信息。使用这些特征信息反映玉米籽粒的大小、长宽比、饱满程度、光滑度等与容重相关的因素是可行的。

利用机器视觉图像处理技术分别提取了玉米完整籽粒和玉米横切面图像的形态、颜色和纹理共48个特征参数,提取的每个籽粒的特征参数后,对整张图像的籽粒特征参数取均值,用于不同等级玉米的特征差异描述,比使用单籽粒图像特征参数更具代表性。比较不同等级的玉米形态、颜色和纹理特征参数可知:对于完整籽粒图像,颜色和形态特征能较好地反映玉米等级的差异,其次为纹理特征;对于玉米籽粒横切面图像,颜色和纹理特征能较好地反映玉米等级的差异。

建立了8-21-4的三层BP神经网络模型,模型建好后,利用测试集样品对所建模型进行验证,依据不同等级玉米籽粒特征信息的差异,通过训练集得到不同等级玉米籽粒的相应信息,并根据提取的测试集样本信息对其等级进行划分。

综上所述,采集玉米横切面信息可以对玉米等级进行有效的识别,说明玉米容重主要取决于籽粒内部结构;而对完整籽粒的形态、颜色、纹理特征进行提取后用于等级识别,其整体识别率大于单独使用横切面信息的识别率,说明籽粒大小、饱满程度、表面光滑度等信息对容重也有一定的影响。在考虑外界因素影响时建议在使用机器视觉图像处理技术识别玉米等级时,主要使用玉米横切面图像来进行判别。

参考文献:

[1]GB 1353—2009,玉米[S].北京:中国标准出版社,2009.

[2]Hurburgh C,Elmore R.Corn quality issues in 2008-moisture and test weight[DB/OL].Integrated crop management news.http://lib.dr.iastate.edu/cropnews/749,2008-10-24.

[3]车海先,李海玉.玉米容重影响因素浅析[J].粮食与食品工业,2011,18(1):56-61.

[4]顾金玲,尹国彬,魏春立.玉米容重与杂质的相关性研究[J].粮食与饲料工业,2008,15(5):50-51.

[5]李明,张长利,房俊龙.基于图像处理技术的小麦叶面积指数的提取[J].农业工程学报,2010,26(1):205-209.

[6]汪成龙,李小昱,武振中,等.基于流形学习算法的马铃薯机械损伤机器视觉检测方法[J].农业工程学报,2014,30(1):245-252.

[7]展慧,李小昱,王为,等.基于机器视觉的板栗分级检测方法[J].农业工程学报,2010,26(4):327-331.

[8]张玉荣,陈赛赛,周显青,等.基于图像处理和神经网络识别的小麦不完善粒识别方法研究[J].粮油食品科技,2014,22(3):59-63.

[9]郝玉保,王仁礼,马军,等.改进Tamura纹理特征的图像检索方法[J].测绘科学,2010,35(4):136-138,176.

[10]冈萨雷斯,著.数字图像处理:MATLAB版[M].阮秋琦,译.北京:电子工业出版社,2006.

Identification method of maize quality grades based on machine vision

ZHOU Hong-da,ZHANG Yu-rong,WANG Wei-yu,ZHOU Xian-qing,CHEN Sai-sai
(College of Food Science and Technology,Engineering Research Center of Grain Storage and Security of Ministry of Education,Grain Storage and Logistics National Engineering Laboratory,Henan University of Technology,Zhengzhou Henan 450001)

Abstract:Volume weight is the main index of maize quality grades according to national standard.In order to discriminate the maize grades accurately by machine vision,the grain image of four different grades of maize were adopted by the method of image processing with the industrial camera,the kernels and their background were processed,divided by the average filter,Otsu and morphological operation,the characteristic parameters were selected.The number of optimal main factors was determined by principal component analysis(PCA).The 8-21-4 three layers BP neural network model was established for the identification of maize grades based on volume weight.Results showed that the overall recognition rate was over 90%based on the image of complete kernel and the kernel transverse section by BP neural network.So the model had high feasibility for detecting maize grades.

Key words:maize;quality grades;machine vision;principal component analysis(PCA);BP neural network

中图分类号:TS 210.7

文献标识码:A

文章编号:1007-7561(2016)06-0050-07

收稿日期:2016-04-06

作者简介:周鸿达,1990年出生,男,硕士研究生.

通讯作者:张玉荣,1967年出生,女,教授.