第十届挑战赛A1-基于深度学习的农田害虫定位与识别研究

发布时间:2022-06-27 作者:本站原创 浏览量:12964

摘  要:

作物病虫害一直是影响粮食产量的一个主要原因,往往会由于发现不及时,以及错误判断病虫害种类,不能很好处理。基于虫情测报灯的虫情信息采集,提供了大量的农作物害虫图像。但是由于害虫图像背景复杂,有些目标过小,人工识别存在误判漏判,并且效率十分低下。而基于视觉手工特征的方法鲁棒性差,不适用于复杂的害虫待识别环境。近些年来,基于深度神经网络的人工智能技术得到快速发展,得益于算力的提升和大规模数据集的出现,深度学习已经在目标检测、人脸识别、语音识别等领域飞速发展 。虫情测报灯收集到了大量害虫图片,为基于深度学习的目标检测算法进行害虫识别提供了可能性。

通过分析害虫图片,我们发现数据集中存在严重的害虫种类长尾分布和待检测目标过小的问题。为了使得切分后的数据集能够更加适合模型的训练,我们首先先对数据集进行了扩充处理,主要工作是提取一部分数量少和面积小的目标,通过copy and paste和常规在线数据增强方法进行离线的数据增强。我们将原图像中576个目标扩充至4401个目标,然后进行了8:2训练集和测试集的划分,成功地提高了模型的鲁棒性。

为了能准确地识别出害虫的位置和类别,我们结合了当下主流的两阶段目标检测框架Cascade Mask RCNN进行实现,并使用Swin-Transformer模型作为我们的特征提取网络。相比于一阶段目标检测在速度上的性能,农作物害虫识别更偏向于对准确性的要求,所以我们使用两阶段目标检测算法作为基本的检测框架。Cascade Mask RCNN在Faster RCNN的基础上解决了misalignment的问题,并添加了multi-stage的结构,并为每一个stage设立了不同的IOU阈值。Swin-Transformer使用了基于窗口的自注意力机制,将Transformer模型很好地应用到了视觉任务中来。在此之后,我们结合K-means聚类实现锚框长宽比的确定,然后把Smooth L1损失函数和Soft NMS分别加入到网络的训练中。最后,我们用SWA和多模型融合进一步提升网络性能。

关键词:病虫害识别;目标检测;数据增强;多模型融合;随机权重平均

点击查看全文