王子华 叶莹 刘洪运 许燕 樊瑜波 王卫东

WANG Zihua, YE Ying, LIU Hongyun, XU Yan, FAN Yubo, WANG Weidong. Spiking Sequence Label-Based Spatio-Temporal Back-Propagation Algorithm for Training Deep Spiking Neural Networks[J]. Journal of Electronics & Information Technology, 2024, 46(6): 2596-2604. doi: 10.11999/JEIT230705
Citation: WANG Zihua, YE Ying, LIU Hongyun, XU Yan, FAN Yubo, WANG Weidong. Spiking Sequence Label-Based Spatio-Temporal Back-Propagation Algorithm for Training Deep Spiking Neural Networks[J]. Journal of Electronics & Information Technology, 2024, 46(6): 2596-2604. doi: 10.11999/JEIT230705


基金项目: 科技创新—2030“新一代人工智能”重大项目(2020AAA0105800)








  • 中图分类号: TN911.7; TP18

Spiking Sequence Label-Based Spatio-Temporal Back-Propagation Algorithm for Training Deep Spiking Neural Networks

Funds: The Scientific and Technological Innovation 2030 - “New Generation Artificial Intelligence” Major Project (2020AAA0105800)
  • 摘要: 尖峰放电的脉冲神经网络(SNN)具有接近大脑皮层的信号处理模式,被认为是实现大脑启发计算的重要途径。但是,目前对于深度脉冲神经网络的学习仍缺乏有效的监督学习算法。受尖峰放电速率标识的时空反向传播算法的启发,该文提出一种面向深度脉冲神经网络训练的基于时间脉冲序列标识的监督学习算法,通过定义突触后电位和膜电位反传迭代因子分别分析脉冲神经元的空间和时间依赖关系,使用替代梯度的方法解决反传过程中不连续可微的问题。不同于现有基于尖峰放电速率标识的学习算法,该算法能够充分反映脉冲神经网络输出的时间脉冲序列的动态特性。因此,所提算法非常适合应用于需要较长时间序列标识的计算任务,例如行为的时间脉冲序列控制。该文在静态图像数据集CIFAR10和神经形态数据集NMNIST上验证了所提算法的有效性,在所有这些数据集上都显示出良好的性能,这有助于进一步研究基于时间脉冲序列应用的大脑启发计算。
  • 图  1  脉冲神经元模型及其多层前馈脉冲神经网络结构图

    图  2  前馈结构信息流动关系

    1  伪代码

     input : Network inputs X, class label Y, initial weight vector$\{ {{\boldsymbol{W}}^l}\} _{l = 1}^L$, membrane decay factor ${\tau _{\mathrm{m}}}$, synaptic decay factor ${\tau _{\mathrm{s}}}$, threshold potential ${V_{\rm{th}}}$,simulation windows T
     output : Output Spike Sequence ${O^L}$
     1 Forward Pipeline :
     2 $v_{0:T - 1}^1 \;\; \leftarrow \;\;{\mathrm{repeat}}\;{\mathrm{input}}\;X\;{\mathrm{through}}\;T$
     3 ${\text{target}} \;\; \leftarrow \;\;{\mathrm{encode}}\_{\mathrm{repeat}}(Y)$
     4 for $l\; \leftarrow \;2$ to L do
     5  for $t\; \leftarrow \;0$ to $T\; \leftarrow \;1$ do
     6   $u_t^l,\;\;o_t^l\;\; \leftarrow \;\;{\mathrm{Update}}\_{\mathrm{neuron}}\_{\mathrm{state}}({w^l},v_t^{l - 1},u_{t - 1}^l,{\tau _m},{V_{{\mathrm{th}}}})$ /Eq.(4)–(5)
     7   $v_t^l\;\; \leftarrow \;\;{\mathrm{Compute}}\_{\mathrm{psp}}(o_t^l)$ /Eq.(3a)
     8  end
     9 end
     10 ${\mathrm{Loss}} \;\; \leftarrow \;\;{\mathrm{loss}}\_{\mathrm{function}}({O^L},{\text{target}})$
     11 Backward Pipeline :
     12 for $l \;\; \leftarrow \;\;L$ to 1 do
     13 for $t \;\; \leftarrow \;\;T - 1$ to 0 do
     14  if $t = T$ and $l = L$ then
     15    $ \hat \delta _{ T - 1}^L \;\; \leftarrow \;\;{\mathrm{Initial}}\_{\mathrm{psp}}\_{\mathrm{iteration}}\_{\mathrm{factor}} \left(\dfrac{{\partial L}}{{\partial a_{T - 1}^L}}\right) $ /Eq.(13)
     16    $ \tilde \delta _{T - 1}^L \;\; \leftarrow \;\;{\mathrm{Initial}}\_{\mathrm{mem}}\_{\mathrm{iteration}}\_{\mathrm{factor}} \left(\hat \delta _{ T - 1}^L,\dfrac{{\partial a_{T - 1}^L}}{{\partial u_{\ T - 1}^L}}\right) $ /Eq.(12)
     17   end
     18   else if $t = T - 1$ and $l! = L$ then
     19    $ \hat \delta _{ T - 1}^l \;\; \leftarrow \;\;{\mathrm{Update}}\_{\mathrm{psp}}\_i{\mathrm{teration}}\_{\mathrm{factor}}(\hat \delta _{ T - 1}^{l + 1},{w^{l + 1}},u_{ T - 1}^{l + 1},o_{ T - 2}^{l + 1}) $ /Eq.(15)
     20    $ \tilde \delta _{T - 1}^l \;\; \leftarrow \;\;{\mathrm{Update}}\_{\mathrm{mem}}\_{\mathrm{iteration}}\_{\mathrm{factor}}(\hat \delta _{ T - 1}^l,u_{ T - 1}^l) $ /Eq.(14)
     21   end
     22   else if $t! = T - 1$ and $l = L$ then
     23    $ \hat \delta _t^L \;\; \leftarrow \;\;{\mathrm{Update}}\_{\mathrm{psp}}\_{\mathrm{iteration}}\_{\mathrm{factor}}(\hat \delta _{ T + 1}^L,o_{ T + 1}^L,u_{T + 1}^L,u_t^L) $ /Eq.(17)
     24    $ \tilde \delta _t^L \;\; \leftarrow \;\;{\mathrm{Update}}\_mem\_{\mathrm{iteration}}\_{\mathrm{factor}}(\hat \delta _t^L,u_t^L,\tilde \delta _{T + 1}^L,o_t^L) $ /Eq.(16)
     25   end
     26   else
     27    $ \hat \delta _t^l \;\; \leftarrow \;\;{\mathrm{Update}}\_{\mathrm{psp}}\_{\mathrm{iteratio}}n\_{\mathrm{factor}}(\hat \delta _t^{l + 1},o_{ T - 1}^{l + 1},u_t^{l + 1},\hat \delta _{T + 1}^l,u_t^l,u_{ T + 1}^l,o_t^l) $ /Eq.(11)
     28    $ \tilde \delta _t^l \;\; \leftarrow \;\;{\mathrm{Update}}\_{\mathrm{mem}}\_{\mathrm{iteration}}\_{\mathrm{factor}}(\hat \delta _t^l,u_t^l,\tilde \delta _{ T + 1}^l,o_t^l) $ /Eq.(10)
     29   end
     30 end
     31 end
     32 $ {\mathrm{Update}}{\text{ w based on: }}\Delta {{\boldsymbol{W}}^l} = \displaystyle\sum\nolimits_{T = 0}^{T - 1} {a_t^{l - 1}\tilde \delta _t^l} $ /Eq.(18)
    表  1  CIFAR10的测试结果(van Rossum距离)

    方法 网络 时间步长 周期 准确率(%)
    Converted SNN[24] AlexNet 80 83.52
    STBP[12] AlexNet 8 150 85.24
    本文算法 AlexNet 5 100 88.47
    ① : 96C3-256C3-P2-384C3-P2-384C3-256C3-1024-1024
    表  2  CIFAR10的测试结果(Hamming距离)

    方法 网络 时间步长 周期 准确率(%)
    Converted SNN[24] AlexNet 80 83.52
    STBP[12] AlexNet 8 150 85.24
    本文算法 AlexNet 10 100 89.10
    ① : 96C3-256C3-P2-384C3-P2-384C3-256C3-1024-1024
    表  3  NMNIST的测试结果(van Rossum距离)

    方法 网络 时间步长 周期 准确率(%)
    STBP[12] 12C5-P2-64C5-P2 50 150 98.19
    本文算法 12C5-P2-64C5-P2 25 100 98.61
    表  4  NMNIST的测试结果(Hamming距离)

