王俊帆 陈毅 高明煜 何志伟 董哲康 缪其恒

王俊帆, 陈毅, 高明煜, 何志伟, 董哲康, 缪其恒. 智能交通感知新范式:面向元宇宙的交通标志检测架构[J]. 电子与信息学报, 2024, 46(3): 777-789. doi: 10.11999/JEIT230357
引用本文: 王俊帆, 陈毅, 高明煜, 何志伟, 董哲康, 缪其恒. 智能交通感知新范式:面向元宇宙的交通标志检测架构[J]. 电子与信息学报, 2024, 46(3): 777-789.
WANG Junfan, CHEN Yi, GAO Mingyu, HE Zhiwei, DONG Zhekang, MIAO Qiheng. A New Paradigm for Intelligent Traffic Perception: A Traffic Sign Detection Architecture for the Metaverse[J]. Journal of Electronics & Information Technology, 2024, 46(3): 777-789. doi: 10.11999/JEIT230357
Citation: WANG Junfan, CHEN Yi, GAO Mingyu, HE Zhiwei, DONG Zhekang, MIAO Qiheng. A New Paradigm for Intelligent Traffic Perception: A Traffic Sign Detection Architecture for the Metaverse[J]. Journal of Electronics & Information Technology, 2024, 46(3): 777-789.


基金项目: 浙江省研发攻关计划项目(2023C01132),杭州市重大科技创新项目 (2022AIZD0009)








    董哲康 englishp@hdu.edu.cn

  • 中图分类号: TN911.7; TP183

A New Paradigm for Intelligent Traffic Perception: A Traffic Sign Detection Architecture for the Metaverse

Funds: Zhejiang Provincial Major Research and Development Project of China (2023C01132), Hangzhou Major Science and Technology Innovation Project of China (2022AIZD0009)
  • 摘要: 交通标志检测对智能交通系统和智能驾驶的安全稳定运行具有重要作用。数据分布不平衡、场景单一会对模型性能造成较大影响,而建立一个完备的真实交通场景数据集需要昂贵的时间成本和人工成本。基于此,该文提出一个面向元宇宙的交通标志检测新范式以缓解现有方法对真实数据的依赖。首先,通过建立元宇宙和物理世界之间的场景映射和模型映射,实现检测算法在虚实世界之间的高效运行。元宇宙作为一个虚拟化的数字世界,能够基于物理世界完成自定义场景构建,为模型提供海量多样的虚拟场景数据。同时,该文结合知识蒸馏和均值教师模型建立模型映射,应对元宇宙和物理世界之间存在的数据差异问题。其次,为进一步提高元宇宙下的训练模型对真实驾驶环境的适应性,该文提出启发式注意力机制,通过对特征的定位和学习来提高检测模型的泛化能力。所提架构在CURE-TSD, KITTI, VKITTI数据集上进行实验验证。实验结果表明,所提面向元宇宙的交通标志检测器在物理世界具有优异的检测效果而不依赖大量真实场景,检测准确率达到89.7%,高于近年来其他检测方法。
  • 图  1  面向元宇宙的交通标志检测框架

    图  2  元宇宙虚拟交通场景构建

    图  3  基于视神经科学的跨域目标检测网络

    图  4  元宇宙下的跨域检测框架图

    图  5  CURE-TSD类别信息

    图  6  本文提出的方法在CURE-TSD数据集上的测试结果

    图  7  本文所提提方法在VKITTI和KITTI上的测试结果

    图  8  本文所提方法在Meta-CURE数据集上的测试样例

    图  9  本文所提方法与其他方法的热力图对比

    表  1  本文主要贡献

    参考文献 核心瓶颈 本文贡献
    [28] 现有基于深度学习的交通标志检测算法依赖于大量的多样数据集进行训练,且实际对算法的测试成本较高,安全性无法得到保证。 本文首次提出了在元宇宙和物理世界实现交通标志检测的新范式。为此,建立了一种场景映射机制,以基于来自物理世界的场景信息构建元宇宙中的交通场景。此外,引入模型映射机制,通过虚拟世界表示增强模型对物理世界中交通标志的识别能力
    [915] 元宇宙下训练和测试的模型应用于物理世界要求其具备更好的泛化能力,模型性能无差别实现于虚实世界。 本文设计基于启发式注意力的目标检测器。所提出的启发式注意力机制受视神经科学和CAM的启发,结合3维注意力权重的能量函数和目标定位引导,从而提高检测器的特征提取能力和泛化能力。
    表  2  在CURE-TSD数据集上的对比实验

    方法 精度 召回率 mAP AP50 APS APM APL
    文献[15] 0.892 0.842 0.489 0.869 0.561 0.806 0.879
    文献[3] 0.904 0.834 0.492 0.883 0.557 0.813 0.900
    文献[36] 0.896 0.827 0.473 0.878 0.558 0.790 0.876
    文献[10] 0.885 0.833 0.481 0.866 0.545 0.784 0.861
    本文所提方法(不使用跨域结构) 0.924 0.835 0.514 0.883 0.563 0.801 0.889
    本文所提方法+跨域训练 0.897 0.808 0.480 0.848 0.548 0.772 0.863
    表  3  不同训练数据配置下的对比实验

    训练数据 方法 精度 召回率 mAP AP50 APS APM APL
    20k CURE-TSD中真实场景数据 文献[15] 0.880 0.831 0.468 0.860 0.552 0.793 0.867
    文献[3] 0.886 0.819 0.479 0.874 0.544 0.801 0.889
    文献[36] 0.876 0.801 0.463 0.863 0.539 0.782 0.864
    文献[10] 0.871 0.815 0.468 0.858 0.528 0.772 0.849
    本文所提方法+跨域训练 0.904 0.822 0.504 0.870 0.555 0.794 0.876
    10k Meta-TSD和CURE-TSD中
    虚拟场景数据+5k CURE-TSD中
    文献[15] 0.853 0.801 0.429 0.810 0.519 0.736 0.851
    文献[3] 0.871 0.802 0.437 0.821 0.525 0.741 0.861
    文献[36] 0.863 0.792 0.422 0.827 0.513 0.749 0.848
    文献[10] 0.821 0.804 0.445 0.801 0.502 0.729 0.837
    本文所提方法+跨域训练 0.892 0.804 0.458 0.826 0.537 0.757 0.862
    表  4  提出方法在KITTI, VKITTI数据集上测试结果

    数据集 精度 平均置信度
    KITTI 0.757 0.747 0.821 0.793 0.781 0.755 0.735
    VKITTI 0.781 0.774 0.843 0.825 0.817 0.776 0.768
    表  5  在CURE-TSD数据集上的消融实验

