白静 杨瞻源 彭斌 李文静

白静, 杨瞻源, 彭斌, 李文静. 三维卷积神经网络及其在视频理解领域中的应用研究[J]. 电子与信息学报, 2023, 45(6): 2273-2283. doi: 10.11999/JEIT220596
BAI Jing, YANG Zhanyuan, PENG Bin, LI Wenjing. Research on 3D Convolutional Neural Network and Its Application to Video Understanding[J]. Journal of Electronics & Information Technology, 2023, 45(6): 2273-2283. doi: 10.11999/JEIT220596
基金项目: 国家自然科学基金(62162001, 61762003),宁夏自然科学基金(2022AAC02041),宁夏优秀人才支持计划,北方民族大学创新项目(YCX22194)






Research on 3D Convolutional Neural Network and Its Application to Video Understanding

Funds: The National Natural Science Foundation of China (62162001, 61762003), The Natural Science Foundation of Ningxia Province of China (2022AAC02041), The CAS “Light of West China” Program, The Ningxia Excellent Talent Program, North Minzu University Innovation Project(YCX22194)
  • 摘要: 3维卷积神经网络(3D CNN)是近几年来深度学习研究中的热点,在计算机视觉领域取得了诸多成就。虽然研究多年且成果丰富,但目前仍缺少关于此内容全面、细致的综述。基于此,该文从以下几个方面对其进行综述:首先阐述3维卷积神经网络的基本原理和模型结构,接着从网络结构、网络内部和优化方法总结3维卷积神经网络的相关改进工作,然后对3维卷积神经网络在视频理解领域中的应用进行总结,最后总结全文内容并对未来发展方向进行展望。该文针对3维卷积神经网络的最新研究进展以及在视频理解领域中的应用进行了系统的综述,对3维卷积神经网络的研究发展具有一定的积极意义。
  收稿日期:  2022-05-11
  修回日期:  2022-11-18
  网络出版日期:  2022-11-21
