高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

面向AI计算服务的算网融合轻量化部署方法

王钦定 谭斌 黄光平 段威 杨冬 张宏科

王钦定, 谭斌, 黄光平, 段威, 杨冬, 张宏科. 面向AI计算服务的算网融合轻量化部署方法[J]. 电子与信息学报. doi: 10.11999/JEIT250663
引用本文: 王钦定, 谭斌, 黄光平, 段威, 杨冬, 张宏科. 面向AI计算服务的算网融合轻量化部署方法[J]. 电子与信息学报. doi: 10.11999/JEIT250663
WANG Qinding, TAN bin, HUANG Guangping, DUAN Wei, YANG Dong, ZHANG Hongke. Lightweight Incremental Deployment for Computing-Network Converged AI Services[J]. Journal of Electronics & Information Technology. doi: 10.11999/JEIT250663
Citation: WANG Qinding, TAN bin, HUANG Guangping, DUAN Wei, YANG Dong, ZHANG Hongke. Lightweight Incremental Deployment for Computing-Network Converged AI Services[J]. Journal of Electronics & Information Technology. doi: 10.11999/JEIT250663

面向AI计算服务的算网融合轻量化部署方法

doi: 10.11999/JEIT250663 cstr: 32379.14.JEIT250663
基金项目: 国家自然科学基金(No.62394325)
详细信息
    作者简介:

    王钦定:男,博士生,研究方向为未来网络体系架构、算力网络、算网融合

    谭斌:男,高级工程师,研究方向为IP网络、SDN系统架构与技术

    黄光平:男,高级工程师,研究方向为算力网络、确定性网络以及下一代IP网络

    段威:男,高级工程师,研究方向为IP网络、智算中心网络关键技术

    杨冬:男,教授,研究方向为新一代信息网络关键理论与技术以及工业互联网、网络智能化技术

    张宏科:男,教授,研究方向为新一代信息网络理论与关键技术

    通讯作者:

    王钦定 22110022@bjtu.edu.cn

  • 中图分类号: TN913.21

Lightweight Incremental Deployment for Computing-Network Converged AI Services

Funds: The National Key Research and Development Program of China (2022YFB2901302)
  • 摘要: 近年来,人工智能(AI)计算服务的规模和复杂性迅速增长要求算力资源能够被灵活访问和高效使用。作为用户与算力资源间访问和交互的重要通道,网络的能力和性能也亟需进行提升以支持AI计算服务的应用需求,如低时延、高并发等。然而,传统的域名系统(DNS)和基于IP的调度机制在满足这些需求方面面临适应性不足和智能化缺失的问题。因此,计算与网络资源的一体化(即算网融合)成为了解决上述问题的关键途径。鉴于此,该文引入了一种面向AI计算的语义化服务标识(AISID),用于对服务进行编码,AISID的引入实现了服务请求与资源位置的解耦,从而支持更灵活精确的服务调度。在此基础上,提出一种算网融合的轻量化增量部署方案,通过将智能路由与资源调度相结合以优化服务请求的路由及资源分配。通过对核心设备实施轻量化的增量部署,可在最小改动现有网络的情况下优化网络性能,并增强系统可扩展性。实验结果表明,在500个并发请求的负载条件下,相较于传统的DNS调度和网络架构,AISID机制将请求响应时间降低了61.3%;轻量化部署方案使链路带宽使用率方差和算力使用率方差分别降低32.8%和12.3%。这些结果验证了所提方法在提升AI计算服务性能和资源利用效率方面的有效性,表明该方法为实现算网融合提供了一种有效途径。
  • 图  1  网络、应用、计算的演进

    图  2  DNS与AISID流程对比

    图  3  AISID生成实例

    图  4  AISID的编码生成表示

    图  5  携带AISID的服务请求报文结构

    图  6  基于AISID的算网融合轻量化部署方法

    图  7  初始化与控制阶段

    图  8  业务阶段

    图  9  AISID与DNS服务请求响应时间对比

    图  10  链路带宽使用率方差对比

    图  11  算力使用率方差对比

    表  1  携带AISID的IPv6报文示例

    字段描述值/示例
    版本IPv6协议版本,固定为6位6
    流量类用于流量标识,通常为0,长度8位0x00
    流量标签用于标识流量类型,长度20位0x00000
    负载长度报文有效负载的长度,16位40(假设有效载荷长度为40字节)
    下一个头部表示协议类型,长度8位,表示传输协议类型17(例如UDP协议,假设为17)
    跳数限制TTL(Time-To-Live),最大跳数,长度8位64
    源IP地址发起请求的源设备的IPv6地址,128位fd00:abcd:1234:5678:
    90ab:cdef:2345:6789
    AISID存储AISID, 128位2001:0db8:abcd:0012:
    0001:0002:0001:1388
    下载: 导出CSV

    表  2  AISID生命周期管理的任务与实现机制

    阶段 主要任务 关键接口与机制
    服务注册 AISID生成、验证并登记;智能管控系统全局注册与同步更新 服务注册接口,AISID唯一性校验机制
    服务查询 用户发起AISID请求;入口/出口网关执行路由与节点定位 AISID路由表,1级/2级路由机制
    服务迁移 更新AISID与节点位置映射;向智能管控系统同步变更信息 服务迁移通知接口,智能管控系统同步机制
    服务下线 AISID注销、缓存清理与回收;通知相关用户 服务下线接口,AISID回收机制
    下载: 导出CSV

    表  3  网络和服务请求参数设置

    网络参数
    网络节点数42
    入口网关数10
    出口网关数4
    链路数66
    链路带宽100 Gbit/(s·Hz)
    链路传播时延5 ms
    服务提供商局域网内设备总算力10000TFLOPS
    服务提供商可提供的服务类型数10
    服务请求参数
    用户可请求的服务类型数20
    带宽需求20Mbps~100 Mbit/(s·Hz)
    算力需求1TFLOPS~10TFLOPS
    下载: 导出CSV
  • [1] 刘强, 崔莉, 陈海明. 物联网关键技术与应用[J]. 计算机科学, 2010, 37(6): 1–4,10. doi: 10.3969/j.issn.1002-137X.2010.06.001.

    LIU Qiang, CUI Li, and CHEN Haiming. Key technologies and applications of internet of things[J]. Computer Science, 2010, 37(6): 1–4,10. doi: 10.3969/j.issn.1002-137X.2010.06.001.
    [2] WANG Shuo, ZHANG Xing, ZHANG Yan, et al. A survey on mobile edge networks: Convergence of computing, caching and communications[J]. IEEE Access, 2017, 5: 6757–6779. doi: 10.1109/ACCESS.2017.2685434.
    [3] TRIGKA M and DRITSAS E. Edge and cloud computing in smart cities[J]. Future Internet, 2025, 17(3): 118. doi: 10.3390/fi17030118.
    [4] SINGH R and GILL S S. Edge AI: A survey[J]. Internet of Things and Cyber-Physical Systems, 2023, 3: 71–92. doi: 10.1016/j.iotcps.2023.02.004.
    [5] ALSADIE D. Advancements in heuristic task scheduling for IoT applications in fog-cloud computing: Challenges and prospects[J]. PeerJ Computer Science, 2024, 10: e2128. doi: 10.7717/peerj-cs.2128.
    [6] PENG Xiaohui, SUN Yixuan, ZHANG Zhenghui, et al. DSparse: A distributed training method for edge clusters based on sparse update[J]. Journal of Computer Science and Technology, 2025, 40(3): 637–653. doi: 10.1007/s11390-025-4821-5.
    [7] SU Weixing, LI Linfeng, LIU Fang, et al. AI on the Edge: A comprehensive review[J]. Artificial Intelligence Review, 2022, 55(8): 6125–6183. doi: 10.1007/s10462-022-10141-4.
    [8] 张宏科, 于成晓, 权伟, 等. 融算网络体系基础研究[J]. 电子学报, 2022, 50(12): 2928–2934. doi: 10.12263/DZXB.20221140.

    ZHANG Hongke, YU Chengxiao, QUAN Wei, et al. Fundamental research on computing integration networking[J]. Acta Electronica Sinica, 2022, 50(12): 2928–2934. doi: 10.12263/DZXB.20221140.
    [9] ZHANG Zhen, CHANG Chaokun, LIN Haibin, et al. Is network the bottleneck of distributed training?[C]. Proceedings of the Workshop on Network Meets AI & ML (NetAI '20), USA, 2020: 8–13. doi: 10.1145/3405671.3405810. (查阅网上资料,未找到本条文献出版地信息,请确认).
    [10] ISMAIL A A, KHALIFA N E, and EL-KHORIBI R A. A survey on resource scheduling approaches in multi-access edge computing environment: A deep reinforcement learning study[J]. Cluster Computing, 2025, 28(3): 184. doi: 10.1007/s10586-024-04893-7.
    [11] AKTAS F, SHAYEA I, ERGEN M, et al. AI-enabled routing in next generation networks: A survey[J]. Alexandria Engineering Journal, 2025, 120: 449–474. doi: 10.1016/j.aej.2025.01.095.
    [12] GAO Tianfu and DONG Qingkuan. DNS-BC: Fast, reliable and secure domain name system caching system based on a consortium blockchain[J]. Sensors, 2023, 23(14): 6366. doi: 10.3390/s23146366.
    [13] DAN O, PARIKH V, and DAVISON B D. IP geolocation through reverse DNS[J]. ACM Transactions on Internet Technology, 2022, 22(1): 17. doi: 10.1145/3457611.
    [14] DENG Shuiguang, ZHAO Hailiang, FANG Weijia, et al. Edge intelligence: The confluence of edge computing and artificial intelligence[J]. IEEE Internet of Things Journal, 2020, 7(8): 7457–7469. doi: 10.1109/JIOT.2020.2984887.
    [15] 陈前斌, 谭颀, 贺兰钦, 等. 云雾混合网络下基于多智能体架构的资源分配及卸载决策研究[J]. 电子与信息学报, 2021, 43(9): 2654–2662. doi: 10.11999/JEIT200256.

    CHEN Qianbin, TAN Qi, HE Lanqin, et al. Research on resource allocation and offloading decision based on multi-agent architecture in cloud-fog hybrid network[J]. Journal of Electronics & Information Technology, 2021, 43(9): 2654–2662. doi: 10.11999/JEIT200256.
    [16] ZHOU Guangyao, TIAN Wenhong, BUYYA R, et al. Deep reinforcement learning-based methods for resource scheduling in cloud computing: A review and future directions[J]. Artificial Intelligence Review, 2024, 57(5): 124. doi: 10.1007/s10462-024-10756-9.
    [17] SHEN Wangbo, LIN Weiwei, WU Wentai, et al. Reinforcement learning-based task scheduling for heterogeneous computing in end-edge-cloud environment[J]. Cluster Computing, 2025, 28(3): 179. doi: 10.1007/s10586-024-04828-2.
    [18] BALAKRISHNAN H, BANERJEE S, CIDON I, et al. Revitalizing the public internet by making it extensible[J]. ACM SIGCOMM Computer Communication Review, 2021, 51(2): 18–24. doi: 10.1145/3464994.3464998.
    [19] KNIGHT S, NGUYEN H X, FALKNER N, et al. The Internet topology zoo[J]. IEEE Journal on Selected Areas in Communications, 2011, 29(9): 1765–1775. doi: 10.1109/JSAC.2011.111002.
  • 加载中
图(11) / 表(3)
计量
  • 文章访问数:  8
  • HTML全文浏览量:  1
  • PDF下载量:  5
  • 被引次数: 0
出版历程
  • 收稿日期:  2025-07-15
  • 修回日期:  2025-09-10
  • 网络出版日期:  2025-09-15

目录

    /

    返回文章
    返回