A Survey of Maintaining the Path Programmability in Software-Defined Wide Area Networks
摘要: 软件定义网络(SDN)被誉为下一代网络的关键技术。近年来,SDN已经成为学术界与工业界的热点。广域网是SDN应用到工业界的一个重要的场景。基于SDN的广域网被称为软件定义广域网(SD-WAN)。在SD-WAN中,SDN控制器通过控制流转发路径上的SDN交换机来实现流的路径可编程性。然而,控制器失效是SD-WAN中一种常见的现象。当控制器失效时,流转发路径上的交换机会失去控制,流的路径可编程性将无法得到保障,从而无法实现对网络流量的灵活调度,导致网络性能下降。该文对SD-WAN控制器失效场景下保证路径可编程性的研究工作进行了综述。该文首先阐述了当控制器失效时,SD-WAN中路径可编程性保障研究的背景及意义。随后,在查阅分析了国内外相关文献的基础上,介绍了当前在控制器失效时SD-WAN对交换机的主流控制方案。最后,对现有研究成果可能的进一步提高之处进行了总结,并对此研究的未来发展与研究前景进行了展望。Abstract: Software-Defined Networking (SDN) is the key technique of the next-generation network. Recently, SDN has become a hot spot in both academia and industry. Wide Area Network (WAN) is one of the primary application scenarios in the industry for SDN, which is known as Software-Defined WAN (SD-WAN). In SD-WAN, flexible traffic scheduling and network performance improvement are realized by the flow path programmability, which is enabled by the SDN controller to change dynamically the paths of flows traversing SDN switches. However, controller failure is a common phenomenon. When the controller fails, the switches controlled by the failed controller become offline, and the flows traversing the offline switches become offline too. In this way, the path programmability can not be guaranteed, and thus flexible flow control becomes invalid, leading to severe network performance degradation. This survey is presented to introduce the research works on maintaining path programmability in SD-WAN. First, the path programmability and the important feature for maintaining the path programmability in SD-WAN are introduced. Second, different types of existing solutions for coping with the controller failure in SD-WAN are proposed. Finally, potential improvements and future directions on this research topic are proposed.
表 1 保证路径可编程性的研究现状
恢复类型 恢复目标 恢复方法 优化目标 求解方法 参考文献 静态 降低失效概率 最优控制器放置 控制延迟 帕累托最优 [11] 控制器部署代价和路由代价 ILP [12] 所需控制器数量 ILP和启发式算法 [13] 控制延迟 MILP和模拟退火算法 [14] 控制延迟 启发式算法 [15] 节点重要程度 启发式算法 [16] 链路升级成本 ILP [17] 弹性控制结构设计 IP路由器更新数量 启发式算法 [18] 控制器视图异构度 启发式算法 [19] 控制器利用率 ILP和启发式算法 [20] 控制路径失效数量 ILP [21] 映射鲁棒性 ILP和启发式算法 [22] 降低失效后影响 主从控制器分配 负载变化 ILP和启发式算法 [23] 控制延迟、控制器负载均衡和映射鲁棒性 ILP和启发式算法 [24] 控制延迟 ILP和贪婪算法 [25] 控制器负载均衡 ILP和模拟退火算法 [26] 控制延迟 MILP和贪婪算法 [27] 失效检测 控制器恢复效果 基于区块链的启发式算法 [28] 应用服务质量 控制器负载迁移框架 [29] 故障恢复速度 高级消息队列协议 [30] 网络可靠性、电力成本和控制延迟 ILP、基于SVM的分类法和贪婪算法 [31] 重映射成本 ILP [32] 控制器负载均衡 基于控制器负载的贪婪算法 [33] 动态 维持控制弹性 交换机-控制器初始映射 控制器负载均衡 ILP和模拟退火算法 [34] 控制延迟、控制器负载均衡和映射鲁棒性 深度Q学习 [35] 所需控制器数量 LP [36] 提升恢复效果 交换机-控制器重映射 控制器负载均衡和控制器失效概率 MILP和遗传算法 [37] 所需控制器数量 LP和启发式算法 [38] 流建立时间 MILP [39] 控制器交换机信息交换时长 ILP [40] 负载变化和交换机迁移代价 MILP和启发式算法 [41] 控制器负载均衡和控制延迟 MILP和启发式算法 [42] 恢复流的数量 MILP和启发式算法 [43] 流-控制器重映射 可编程性均衡性、总体可编程和控制延迟 MILP和启发式算法 [44] 可编程性均衡性、总体可编程性 MILP和启发式算法 [45] -
