彭锐晖 赖杰 孙殿星 李莽 颜如玉 李雪

彭锐晖, 赖杰, 孙殿星, 李莽, 颜如玉, 李雪. 一种改进YOLOv5算法的伪装目标检测方法[J]. 电子与信息学报, 2024, 46(8): 3324-3333. doi: 10.11999/JEIT231170
doi: 10.11999/JEIT231170 cstr: 32379.14.JEIT231170
基金项目: 航天科技集团稳定支持项目(ZY0110020009),国防科技重点实验室基金项目(2023-JCJQ-LB-016)








  • 中图分类号: TN911.73

A Camouflaged Target Detection Method with Improved YOLOv5 Algorithm

Funds: China Aerospace Science and Technology Corporation Stabilization Support Project (ZY0110020009), The Defense Science and Technology Key Laboratory Fund Project (2023-JCJQ-LB-016)
  • 摘要: 为了深入挖掘伪装目标特征信息含量、充分发挥目标检测算法潜能,解决伪装目标检测精度低、漏检率高等问题,该文提出一种多模态图像特征级融合的伪装目标检测算法(CAFM-YOLOv5)。首先,构建伪装目标多波谱数据集用于多模态图像融合方法性能验证;其次,构建双流卷积通道用于可见光和红外图像特征提取;最后,基于通道注意力机制和空间注意力机制提出一种交叉注意力融合模块,以实现两种不同特征有效融合。实验结果表明,模型的检测精度达到96.4%、识别概率88.1%,优于YOLOv5参考网络;同时,在与YOLOv8等单模态检测算法、SLBAF-Net等多模态检测算法比较过程中,该算法在检测精度等指标上也体现出巨大优势。可见该方法对于战场军事目标检测具有实际应用价值,能够有效提升战场态势信息感知能力。
  • 图  1  YOLOv5算法网络结构图

    图  2  CAFM-YOLOv5网络结构图

    图  3  CAFM模块结构图

    图  4  通道注意力机制结构图

    图  5  空间注意力机制结构图

    图  6  多波谱伪装目标数据集

    图  7  不同方法在测试集上的检测结果

    图  8  损失函数变化曲线

    表  1  检测结果分类及其含义表

    表  2  本文方法各项指标

    模型 数据集 Parameters Size(MB) Precision(%) Recall(%) mAP@0.5:0.95(%) RCR(%) fps(帧/s)
    YOLOv5 可见光 7012822 14.4 85.1 78.2 34.5 83.5 50
    红外 7012822 14.4 93.3 84.1 47.7 66.9 53
    CAFM-Net 可见光、红外 11557128 23.6 96.4 93.8 57.2 88.1 48
    表  3  多种算法检测精度性能对比

    模型 数据集 特征提取骨干 图像输入尺寸 Parametrs mAP@0.5:0.95(%)
    Faster-Rcnn 可见光 ResNet50 640×640 7864320 34.1
    Faster-Rcnn 红外 ResNet50 640×640 7864320 36.3
    SSD 可见光 VGG-16 640×640 7235175 43.9
    SSD 红外 VGG-16 640×640 7235175 47.6
    YOLOv3 可见光 Darknet-53 416×416 6501172 34.1
    YOLOv3 红外 Darknet-53 416×416 6501172 39.1
    YOLOv4 可见光 CSPDarknet-53 416×416 6396314 27.8
    YOLOv4 红外 CSPDarknet-53 416×416 6396314 34.1
    YOLOv8 可见光 CSPDarknet-53 640×640 11125971 41.1
    YOLOv8 红外 CSPDarknet-53 640×640 11125971 51.1
    MHA-YOLOv5 可见光 CSPDarknet-53 640×640 7704906 53.3
    MHA-YOLOv5 红外 CSPDarknet-53 640×640 7704906 52.0
    DETR 可见光 Resnet50 800×800 42991616 53.6
    DETR 红外 Resnet50 800×800 42991616 53.4
    表  4  多光谱数据集上多模态检测算法的结果

    模型 数据集 图像输入
    Parameters mAP@0.5:0.95
    SLBAF-Net 可见光、红外 640×640 419430 20.7
    CFT 可见光、红外 640×640 44879052 50.4
图(8) / 表(4)
  • 收稿日期:  2023-10-30
  • 修回日期:  2024-03-24
  • 网络出版日期:  2024-04-07
  • 刊出日期:  2024-08-30


