卷积神经网络在储粮害虫图像识别中的应用研究

桂 便,祝玉华,甄 彤

(河南工业大学 信息科学与工程学院, 河南 郑州 450001)

摘 要:立足于当今储粮害虫图像识别领域面临的技术需求,针对现有的储粮害虫图像识别算法网络结构相对复杂,辨认率低,为此,引入卷积神经网络实现储粮害虫图像的识别。简要阐述了卷积神经网络发展过程,分析其网络结构,选用5种储粮害虫作为训练样本,分析了储粮害虫图像识别过程,最后通过实验得出了基于卷积神经网络的Alexnet模型对储粮害虫图像识别的精确度达97.62%,说明基于CNN对储粮害虫图像识别具有较高的准确率。

关键词:储粮害虫;卷积神经网络;图像识别

“民以食为天,食以粮为先”,中国作为全球最大的粮食生产国和消费国,储粮过程中的害虫防治是一项重大问题。据统计,仅以粮食损失来说,全世界每年至少有10%左右的粮食被害虫吃了,造成很大的经济损失,只有精准识别出害虫类别,才能对症下药,所以粮食害虫的快速有效识别已变成储粮是否安全的一项重大事务[1]。传统的害虫图像识别方式深入挖掘图像的全部或局部特性进行识别,可以概括为基于图像的纹路特征、空间关系特征、颜色特征、形态特征等特性进行害虫图像识别的方法。基于这些方法通过样本学习,提取图像的底层特征进行特征编码与特征的聚合统计,利用分类器达到图像的识别[2]。近年来,科研工作者在害虫图像识别研究方面做出了大量工作,邱道尹[3]等利用模糊识别技术检测储粮中的害虫,准确率高达85%;方明[4]等利用BP神经网络对储粮害虫辨别的研究,精确度达到95%;廉飞宇[5]等利用小波变换和支持向量机技术的结合对害虫图像进行处理,准确率高达95.56%。但是这些技术仍然存在网络结构相对复杂,识别率低,且大部分害虫图像需要人工提取,易受人的主观因素和经验的影响,存在细节特征丢失等问题,为此引入了基于卷积神经网络(Con­volutional Neural Network,CNN)的储粮害虫图像识别方法。该方法不同于传统的图像识别模型,其最大的优势在于利用端到端的处理方式,不需要对图像进行复杂的预处理,相当于在一个黑盒子中完成图像识别过程中的预处理与特征提取,研究者仅对网络参数和网络架构进行不断优化。程国建[6]等利用卷积神经网络对岩石图像的分类实验中,分类的结果精确度达到98.5%;顾亚风[7]等利用卷积神经网络对古玩图片的归类实验中,归类的结果精确度高达99%;高振宇[8]等利用卷积神经网络对鲜茶叶智能分选系统的研究表明,该分选系统对鲜茶叶自动识别和分选的识别率达92.40%。这些实验均表明卷积神经网络在对图像准确的分类识别领域中得到了理想的效果。

1 卷积神经网络

1.1 卷积神经网络的发展历程

机器学习领域中,CNN作为深度前馈神经网络中的一类,通过模仿人脑机制作的人工神经元能够回应局部范畴之内的周围单元,在处理大型图片方面展示出了卓越的成效。CNN对图像识别方法是利用大规模多层次的网络模型经过训练从海量数据库中自动提取图像特征,对输入的图像逐级提取,设立从低级特征到顶级抽象特征的映射[9],最后将提取到的图像特征提取到合适的分类器中,达到对图像的分门别类。CNN的主要发展历程如表1所示。

表1 CNN的主要发展历程

发展阶段时间人物成果 理论提出阶段20世纪60年代Hubel和Wiesel人眼观察到的事物从视网膜传达到大脑皮层是经过多个层系的感受野激发完成的。 1980年Fukushima提出基于感受野的理论模型Neocognitron,该模型采用无监督学习,对模式的识别不受外界客观因素如位置、形状、尺度的影响。 模型实现阶段1998年Lecun提出有监督的多层训练模型LeNet-5,该模型基于梯度反向传播算法,在手写字符识别领域赢得了广泛关注。 广泛研究阶段2012年KrizhevskyAlexNet在大型图像数据库图像分类竞赛中,以极大的优势一举得冠,卷积神经网络变成研究者们研究的热点[10]。自此VGG、GoogLeNet、ResNet等模型相继被提出。

1.2 卷积神经网络的基本结构

CNN的基本构架由输入层、卷积层、池化层、全连接层和输出层构成[11]。该网络模型通过各层进行级联,可看做特征提取与模式识别的组合。下图为CNN的基本结构,如图1所示:

width=199.9,height=111.35

图1 CNN的基本结构

卷积层用它来提取输入的图像特征,CNN中包括低层系和高层系这两个卷积层,低层系的卷积层实现图像边沿的检测,高层系的卷积层则实现对获取到的图像特性再次提取,生成越发抽象的特性,以便更好完成分门别类的任务。局部连接和权值共享是卷积层的两个主要特征,局部连接通过训练学习图像部分特征,该方式能够减少网络结构参数过多和过拟合的缺陷。此外卷积层中不同的卷积核对应不同的权值参数,检测不同的特征[12]

池化层将图像分割成若干小区域,在这些小区域内实现对特征图的再采样,这种操作在减少数据量的同时更加增强了所获图像特征的有效性,增强抗畸变能力。常用的池化操作方法有最大池化法和平均池化法[12]。全连接层通常位于网络尾端,该层对前面逐层变换和映射提取的特征分门别类,实现对最后的抽象特征进行组合[13]

2 基于CNN储粮害虫图像识别

2.1 储粮害虫样本的选择

一般而言,储粮中的害虫可分为昆虫和螨虫两类。本实验以谷蠹、赤拟谷盗、锯谷盗、玉米象、长角扁谷盗五种比较常见且高发的害虫为研究对象,如图2所示,依次列出了这五种害虫的图像。实验样本分为训练集和测试集,训练集为从互联网上搜集到的500张这5种害虫图像的标本,测试集为实际采集到的60张这五种害虫的活体照片。

width=257.95,height=244.45

图2 实验研究害虫图像

2.2 储粮害虫图像识别的过程

虽然卷积神经网络具有很强的处理机制,但是为了提高网络结构的识别率、鲁棒性,消除图像噪声对提取害虫图像本身特征造成的干扰,首先对收集到的害虫图像实行简单的预处理操作。

卷积层中用一个可训练的滤波器对输入的图像进行卷积运算,通过该过程的运算能够使原 信号特征增强,减少噪音。卷积层的节点输出表示为:

width=130,height=39(1)

式中,m—层数;f—ReLu激励函数;ab—神经元数目;Nb—输入特征图像;width=21,height=18—5´5卷积核;Bn—每个输出图像对应的偏置。

池化层对初次得到的特征图进行降维,并保持图像特征的尺度不变特性。该层利用输入的特征图上以步长x,对每个y´y的子区域进行特征映射。本实验对储粮害虫图像的识别采用最大池化法,每次只将子区域获得的最大值作为输出,构成图像新的特征。

经过多个卷积层和池化层的交替传递,在全连接层对获得到的特征进行分门别类的识别。本次研究储粮害虫图像样本共有5个类别,因此经过Softmax分类器经过归一化处理后得到一个长度为5的向量。

本实验采用Alexnet的结构模型如图3所示:

width=230.25,height=136.1

图3 Alexnet网络结构

经过以上训练过程,当迭代次数为200时,正确率为96.98%;当迭代次数为400时,正确率达到97.61%;当迭代次数为600时,正确率为97.61%;当迭代次数为700时,正确率为97.62%;当迭代次数为800时,正确率达到97.61%;当迭代次数达到1 000时,正确率达到97.62%,Alexnet的神经网络结构模型对储粮害虫图像的识别率趋于稳状态。通过数据的分析得到基于卷积神经网络下的Alexnet模型对常见的锯谷盗、谷蠹、长角扁谷盗、赤拟谷盗、玉米象这五类储粮害虫识别的正确率达到97.62%。展示出卷积神经网络对储粮害虫图像辨认上显著的效果。Alexnet正确率曲线如图4所示,横坐标表示迭代次数,纵坐标表示正确率。

width=205.1,height=102.85

图4 Alexnet模型的正确率变化曲线

从曲线图中不难看出随着迭代次数的增加,当迭代次数达到200时,Alexnet模型对害虫辨别的正确率的曲线基本趋于平稳状态,该模型对图像识别的正确率达到97.62%附近上下缓慢波动并趋于稳定状态。引言中方明使用基于BP神经网络对害虫图像进行识别,但BP神经网络选择结构不一,只能靠经验选定,且至今尚未出现一种统一并完整的理论作为指导;廉飞宇使用小波变换和支持向量机,由于小波变换的冗余大,支持向量机对大规模的训练样本难以实施,本实验利用CNN的Alexnet模型则避免了以上几种技术的缺点,且该模型适用于储粮害虫。

3 结论

本实验将卷积网络运用到储粮害虫图像识别中,该方法能更好的模拟人工识别,从海量复杂数据中自动提取到图像的不同特征,降低人工提取特征的主观因素,对储粮害虫图像识别的正确率达到97.62%,说明基于CNN对储粮害虫图像识别具有较高的准确率和可靠性。

参考文献:

[1] 甄彤, 范艳峰. 基于支持向量机的储粮害虫分类识别技术研究[J]. 计算机工程, 2006, 30(9): 15-19.

[2] 段萌. 基于卷积神经网络的图像识别方法研究[D]. 郑州: 郑州大学, 2017.

[3] 邱道尹, 张红涛, 陈铁军, 等. 模糊识别技术在储粮害虫检测中的应用[J]. 土壤与作物, 2002, 18(2): 108-119.

[4] 方明, 周龙. 基于BP神经网络的储粮害虫分类识别研究[J]. 武汉轻工大学学报, 2009, 28(4): 56-70.

[5] 廉飞宇, 张元. 基于小波变换压缩和支持向量机组的储粮害虫图像识别[J]. 河南工业大学学报: 自然科学版, 2006, 27(1): 17-22.

[6] 程国建, 郭文惠. 基于卷积神经网络的岩石图像分类[J]. 西安石油大学学报: 自然科学版, 2017, 14(5): 3-4.

[7] 顾亚风. 基于卷积神经网络的古玩图片分类方法[D]. 杭州: 杭州电子科技大学, 2017.

[8] 高震宇, 王安, 刘勇. 基于卷积神经网络的鲜茶叶智能分选系统研究[J]. 农业机械学报, 2017, 6(3): 6-7.

[9] FUKUSHIMA K. Neocognitron: A self- organizing neural networkmodel for a mechanism of pattern recognition unaffected by shift inposition[J]. Biological Cybernetics, 1980, 36(4): 193- 202.

[10] 李彦东, 郝宗波, 雷航. 卷积神经网络研究综述[J]. 计算机应用, 2016, 36(9): 2508-2515.

[11] SIMARD P Y, STEINKRAUS D, PIATT J C. Best practices for convolutional neural networks applied to visual document analysis[C]. 2013 12th International Conference on Document Analysis andRecognition. IEEE Computer Society, 2003, 2: 934-958.

[12] 蒋帅. 基于卷积神经网络的图像识别方[D]. 吉林: 吉林大学, 2017.

[13] 张庆辉, 万晨霞. 卷积神经网络综述[J]: 中原工学院学报, 2017, 28(3): 3-5.width=7.9,height=8.05

Application of convolutional neural network in image recognition of stored grain insects

GUI Bian, ZHU YU-hua, ZHEN Tong

(College of Information Science and Engineering, Henan University of Technology, Zhengzhou Henan 450001)

Abstract:Based on the technical requirement in the field of stored-grain insect image recognition nowadays, aiming at the complex network structure and low recognition rate of the existing stored-grain insect image recognition algorithm, convolutional neural network is introduced to realize the image recognition of stored-grain insect. The development process of convolutional neural network is briefly introduced, its network structure is analyzed. Five kinds of stored-grain insects are selected as training samples. The process of image recognition of stored-grain insects is analyzed. The Alexnet model based on convolutional neural network is obtained by the test, which accuracy reaches to 97.62%.It shows that the image recognition of stored grain insects based on CNN has higher accuracy rate.

Key words:stored grain insects; convolutional neural network; image recognition

DOI:10.16210/j.cnki.1007-7561.2018.06.014

中图分类号:TS 207.5;S 379.5

文献标识码:A

文章编号:1007-7561(2018)06-0073-04

收稿日期:2018-05-10

基金项目:十三五重点科技攻关项目(2018YFD0401404);国家重点研发计划项目(2017YFD0401004)

作者简介:桂便,1993年出生,女,硕士研究生.