您好,欢迎访问宁夏农林科学院 机构知识库!

基于改进YOLO v5s的轻量化植物识别模型研究

文献类型: 中文期刊

作者: 马宏兴 1 ; 董凯兵 1 ; 王英菲 1 ; 魏淑花 1 ; 黄文广 1 ; 苟建平 1 ;

作者机构: 1.北方民族大学电气信息工程学院;宁夏农林科学院植物保护研究所;宁夏回族自治区草原工作站;西南大学计算机与信息科学学院

关键词: 植物识别;YOLO v5s;BoTNet;坐标注意力;深度可分离卷积;轻量化

期刊名称: 农业机械学报

ISSN: 1000-1298

年卷期: 2023 年 08 期

页码: 267-276

收录情况: EI ; 北大核心 ; CSCD

摘要: 为方便调查宁夏全区荒漠草原植物种类及其分布,需对植物识别方法进行研究。针对YOLO v5s模型参数量大,对复杂背景下的植物不易识别等问题,提出一种复杂背景下植物目标识别轻量化模型YOLO v5s-CBD。改进模型YOLO v5s-CBD在特征提取网络中引入带有Transformer模块的主干网络BoTNet(Bottleneck transformer network),使卷积和自注意力相结合,提高模型的感受野;同时在特征提取网络融入坐标注意力(Coordinate attention, CA),有效捕获通道和位置的关系,提高模型的特征提取能力;引入SIoU函数计算回归损失,解决预测框与真实框不匹配问题;使用深度可分离卷积(Depthwise separable convolution, DSC)减小模型内存占用量。实验结果表明,YOLO v5s-CBD模型在单块Nvidia GTX A5000 GPU单幅图像推理时间仅为8 ms,模型内存占用量为8.9 MB,精确率P为95.1%,召回率R为92.9%,综合评价指标F1值为94.0%,平均精度均值(mAP)为95.7%,在VOC数据集平均精度均值可达80.09%。相比YOLO v3-tiny、YOLO v4-tiny和YOLO v5s,改进模型内存占用量减小,平均精度均值提升。模型YOLO v5s-CBD在公开数据集和宁夏荒漠草原植物数据集都有良好的鲁棒性,推理速度更快,且易于部署,已应用在宁夏荒漠草原移动端植物图像识别APP和定点生态信息观测平台,可用来调查宁夏全区荒漠草原植物种类和分布,长期观测和跟踪宁夏盐池县大水坑、黄记场、麻黄山等地植物生态信息。

  • 相关文献
作者其他论文 更多>>