赖李洋 郑锫骏 梁海成 李华伟

赖李洋, 郑锫骏, 梁海成, 李华伟. 路径规划算法的高层综合设计研究[J]. 电子与信息学报, 2024, 46(11): 4132-4140. doi: 10.11999/JEIT240210
LAI Liyang, ZHENG Peijun, LIANG Haicheng, LI Huawei. Case Study of High Level Synthesis on Path Planning Algorithm[J]. Journal of Electronics & Information Technology, 2024, 46(11): 4132-4140. doi: 10.11999/JEIT240210
doi: 10.11999/JEIT240210
基金项目: 国家自然科学基金(62090024),广东省自然科学基金(2022A1515011084),广东省扬帆计划紧缺拔尖人才项目(140-14600602),计算机体系结构国家重点实验室开放课题(CARCH201912, 140-15220011)






    赖李洋 lylai@stu.edu.cn

  • 中图分类号: TN47; TP391.72

Case Study of High Level Synthesis on Path Planning Algorithm

Funds: The National Natural Science Foundation of China(62090024), The Natural Science Foundation of Guangdong Province(2022A1515011084), Guangdong Province Yangfan Program for Shortage and Top-notch Talents (140-14600602), Open Project of State Key Laboratory of Computer Architecture (CARCH201912, 140-15220011)
  • 摘要: 随着机器人自动导航技术的快速发展,基于软件实现的路径规划算法在实时性上已无法满足许多应用场景的需求,这就要求对算法进行快速高效的硬件定制,从而获得低延时的性能加速。该文以机器人路径规划中的经典A*算法为对象,通过构建面向硬件设计的C/C++数据结构和函数流程优化,采用高层综合(HLS)实现快速的硬件架构探索和选取较优的设计方案,并完成硬件FPGA综合。实验数据表明,相较于传统寄存器传输级(RTL)开发模式,基于HLS开发模式的路径规划算法在FPGA实现上在开发效率、硬件性能和资源占用率上都有显著提升,验证了高层综合在硬件定制中的可行性和成本优势。
  • 图  1  实现高层综合的基本流程

    图  2  切片函数的读操作示意图

    图  3  格点信息的数据结构

    图  4  开启列表数组

    图  5  原始算法中的开启列表操作

    图  6  开启列表操作优化

    图  7  优先级队列实现的地图路径

    图  8  堆栈实现的地图路径

    图  9  队列实现的地图路径

    图  10  地图样式1

    图  11  地图样式2

    图  12  地图样式3

    图  13  地图样式4

    1  A*算法的基本流程

     (4) 从开启列表中取出最小F值的格点作为当前格点,并将之加
     (5)  foreach(当前格点的相邻格点)
     (6)   if(该格点在关闭列表中或是故障格点) then(跳过该格点)
     (7)   elsif(该格点在开启列表中) then(比较通过当前格点计算
     (8)   elsif(该格点不在开启列表中) then(通过当前节点计算该
     (9)   elsif(该格点为终点) then(设其父节点为当前节点,并通
     (10) end_foreach
     (12)if(开启列表为空) then(路径搜索失败)
    表  1  SOC FPGA 芯片 PL 资源

    逻辑单元 LUT87 840
    LUTRAM57 600
    触发器 Flip-flop(FF)175 680
    I/O 引脚256
    全局时钟缓冲器 BUFG352
    表  2  15×15地图下不同开启列表优化比较

    优先队列2 4852 8073.018 598
    队列2 1372 7552.544 325
    堆栈2 1482 7392.538 779
    表  3  使用优先队列数据结构的HLS和RTL开发模式比较

    HLS483 4453 2083 30334.5
    RTL523 0467 2537 16159.5
    表  4  使用堆栈数据结构的HLS和RTL开发模式比较

    FPGA开发模式 运行时间(ns) LUT个数 FF个数 BRAM个数
    HLS 3 305 830 1 669 1 523 25
    RTL 5 987 348 7 313 7 065 56
    表  5  使用队列数据结构的HLS和RTL开发模式比较

    FPGA开发模式 运行时间(ns) LUT个数 FF个数 BRAM个数
    HLS 3 389 425 1 756 1 555 25
    RTL 5 598 080 7 317 7 053 56
