陈勇 谢文阳 刘焕淋 汪波 黄美永

陈勇, 谢文阳, 刘焕淋, 汪波, 黄美永. 结合头部和整体信息的多特征融合行人检测[J]. 电子与信息学报, 2022, 44(4): 1453-1460. doi: 10.11999/JEIT210268
CHEN Yong, XIE Wenyang, LIU Huanlin, WANG Bo, HUANG Meiyong. Multi-feature Fusion Pedestrian Detection Combining Head and Overall Information[J]. Journal of Electronics & Information Technology, 2022, 44(4): 1453-1460. doi: 10.11999/JEIT210268
doi: 10.11999/JEIT210268
基金项目: 国家自然科学基金(51977021)







    陈勇 chenyong@cqupt.edu.cn

  • 中图分类号: TN911.73; TP391.41

Multi-feature Fusion Pedestrian Detection Combining Head and Overall Information

Funds: The National Natural Science Foundation of China (51977021)
  • 摘要: 尺度过小或被遮挡是造成行人检测准确率降低的主要原因。由于行人头部不易被遮挡且其边界框包含的背景干扰较少,对此,该文提出一种结合头部和整体信息的多特征融合行人检测方法。首先,设计了一种具有多层结构的特征金字塔以引入更丰富的特征信息,融合该特征金字塔不同子结构输出的特征图从而为头部检测和整体检测提供有针对性的特征信息。其次,设计了行人整体与头部两个检测分支同时进行检测。然后,模型采用无锚框的方式从特征图中预测中心点、高度及偏移量并分别生成行人头部边界框和整体边界框,从而构成端到端的检测。最后,对非极大值抑制算法进行改进使其能较好地利用行人头部边界框信息。所提算法在CrowdHuman数据集和CityPersons数据集Reasonable子集上的漏检率分别为50.16%和10.1%,在Caltech数据集Reasonable子集上的漏检率为7.73%,实验表明所提算法对遮挡行人的检测效果以及泛化性能与对比算法相比得到一定的提升。
  • 图  1  模型总体结构

    图  2  特征提取模块结构

    图  3  检测模块结构

    图  4  行人头部区域

    图  5  检测效果对比

    图  6  实际检测效果

    表  1  Caltech数据集中部分子集划分标准

    Reasonable>50 PXs遮挡比例<0.35
    Partial>50 PXs0.1<遮挡比例≤0.35
    Heavy>50 PXs0.35<遮挡比例≤0.8
    下载: 导出CSV

    表  2  CityPersons数据集中部分子集划分标准

    Bare>50 PXs0.1≤遮挡比例
    Reasonable>50 PXs遮挡比例<0.35
    Partial>50 PXs0.1<遮挡比例≤0.35
    Heavy>50 PXs0.35<遮挡比例≤0.8
    下载: 导出CSV

    表  3  CrowdHuman数据集实验结果(%)

    Adaptive NMS[16]79.6763.0394.77
    下载: 导出CSV

    表  4  CityPersons数据集漏检率(MR)的实验结果(%)

    下载: 导出CSV

    表  5  Caltech数据集漏检率MR和速度的实验结果

    Faster R-CNN+ATT[26]10.3322.2945.18
    下载: 导出CSV
图(6) / 表(5)
  • 收稿日期:  2021-04-02
  • 修回日期:  2021-08-21
  • 网络出版日期:  2021-09-09
  • 刊出日期:  2022-04-18


