曾剑敏 张章 虞志益 解光军

Jianmin ZENG, Zhang ZHANG, Zhiyi YU, Guangjun XIE. Applications of Generic In-memory Computing Architecture Platform Based on SRAM to Internet of Things[J]. Journal of Electronics & Information Technology, 2021, 43(6): 1574-1586. doi: 10.11999/JEIT210010
基金项目: 国家自然科学基金(U19A2053, 61674049),中央高校基本科研基金(JZ2020YYPY0089),中国科学院红外成像材料与器件重点实室开放课题(IIMDKFJJ-19-04)






    张章 zhangzhang@hfut.edu.cn

  • 中图分类号: TN47

Applications of Generic In-memory Computing Architecture Platform Based on SRAM to Internet of Things

Funds: The National Natural Science Foundation of China(U19A2053, 61674049), The Fundamental Research Funds for Central Universities (JZ2020YYPY0089), The Key Laboratory of CAS (IIMDKFJJ-19-04)
  • 摘要: 最近,存算一体(IMC)架构引起了广泛关注,并被认为有望成为突破冯诺依曼瓶颈的新型计算机架构,特别是在数据密集型(data-intensive)计算中能够带来显著的性能和功耗优势。其中,基于SRAM的IMC架构方案也被大量研究与应用。该文在一款基于SRAM的通用存算一体架构平台——DM-IMCA的基础上,探索IMC架构在物联网领域中的应用价值。具体来说,该文选取了物联网中包括信息安全、二值神经网络和图像处理在内的多个轻量级数据密集型应用,对算法进行分析或拆分,并将关键算法映射到DM-IMCA中的SRAM中,以达到加速应用计算的目的。实验结果显示,与基于传统冯诺依曼架构的基准系统相比,利用DM-IMCA来实现物联网中的轻量级计算密集型应用,可获得高达24倍的计算加速比。
  • 图  1  SRAM列内逻辑运算示意图

    图  2  DM-IMCA硬件架构图

    图  3  存内向量计算自动化及自适应示意图

    图  4  测试平台

    图  5  测试OTP加密所花费的时间对比

    图  6  加法哈希函数运算中字符串在IMC-SRAM中的映射

    图  7  测试加法哈希算法进行加密所耗费的时间对比

    图  8  二值神经网络中激活和权重在IMC-SRAM中的映射

    图  9  测试二进制卷积运算所花费的时钟周期数对比

    表  1  IMC指令集编码格式

    memCfg Rn
    31–27op (11001)
    addrCfg R3, R2, R1
    31–27op (11000)
    opcode vl (vl: vector length,矢量长度)
    31–27op (11010)
    下载: 导出CSV

    表  2  IMC指令集

    计算指令逻辑计算mand$c = a\& b$
    mor$c = a|b$
    mxor$c = a \oplus b$
    mnor$c = \sim(a|b)$
    mnand$c = \sim(a + b)$
    mnot$c = \sim a$
    算术计算madd$c = a + b$(有符号)
    maddu$c = a + b$(无符号)
    mop$c = - a$
    minc$c = a + 1$
    mdec$c = a - 1$
    msl$c = a \ll 1$
    msr$c = a \gg 1$
    存储操作mcopy$c = a$
    下载: 导出CSV

    表  3  OTP算法

     输入: plaintext P[N], key K[N], N为数组PK的字长
     输出: ciphertext C[N]
     (1) for (unsigned i = 0; i < N; i++) do
     (2) C[i] = P[i]⊕K[i];
     (3) end for
    下载: 导出CSV

    表  4  加法哈希算法

     输入: char *key, uint32_t len, uint32_t prime
     输出: result
     (1) uint32_t hash, i
     (2) for (hash = len, i = 0; i < len; i++) do
     (3) hash +=key[i]
     (4) end for
     (5) return (hash % prime)
    下载: 导出CSV

    表  5  二值乘法真值表

    下载: 导出CSV

    表  6  存内矢量XOR运算和popcount操作算法

     输入: int $A[N]$, $B[N]$, $N$为数组AB长度
     输出: S
     (1) $M[i] \leftarrow {\rm{0x}}0001,i \in [0,N - 1]$
     (2) $D[i] \leftarrow 0,i \in \in [0,N - 1]$
     (3) $S \leftarrow 0$
     (4) $A[i] \leftarrow A[i] \oplus B[i],i \in [0,N - 1]$
     (5) $C[i] \leftarrow A[i]\& M[i],i \in [0,N - 1]$
     (6) $D[i] \leftarrow D[i] + C[i],i \in [0,N - 1]$
     (7) for (i = 0; i < 31; i++) do
     (8) $C[i] \leftarrow A[i] \gg 1,i \in [0,N - 1]$
     (9) $C[i] \leftarrow A[i]\& M[i],i \in [0,N - 1]$
     (10) $D[i] \leftarrow D[i] + C[i],i \in [0,N - 1]$
     (11) end for
     (12) for (i = 0; i < N; i++) do
     (13) $S \leftarrow S + D[i],i \in [0,N - 1]$
     (14) end for
     (15) return $S$
    下载: 导出CSV
  • 收稿日期:  2021-01-05
  • 修回日期:  2021-04-09
  • 网络出版日期:  2021-04-30
