A Review of the Research on UAV Swarm Confrontation under Incomplete Information
-
摘要: 无人机集群以其具备的应用优势及发展前景,成为当前人工智能领域研究者关注的热点之一。而非完全信息下的无人机集群对抗技术,因其集群结构变化的高动态性以及环境信息复杂多变且不能完全感知的特点,成为对集群协同性与智能性要求最高的研究方向之一。其研究成果可以促进智能化无人系统的快速发展和广泛应用。该文全面回顾了非完全信息环境下无人机集群对抗研究的最新进展,按照包以德循环理论的思路将无人机集群对抗过程划分为态势评估、意图推断、任务规划与机动决策4个相互衔接的关键组成部分,并进一步将其细分为8个子研究目标。通过分析比较近年来的相关研究,着重阐述了无人机集群对抗领域各项任务的研究重点和难点以及已取得的成果,并讨论了无人机集群对抗技术所面临的挑战,包括大规模异构集群的协同控制、非完全信息的处理、复杂决策过程的建模以及实际应用任务的应对等。Abstract: UAV (Unmanned Aerial Vehicle) swarm, with its application advantages and development prospects, has become one of the current hot spots of interest for researchers in the field of artificial intelligence. The UAV swarm confrontation technology under incomplete information has become one of the research directions with the highest requirements for swarm cooperativeness and intelligence due to the high dynamics of swarm structure changes and the complex and variable environmental information that cannot be fully perceived. Its research achievements can promote the rapid development and wide application of intelligent unmanned systems. This paper comprehensively reviews of the recent progress in the research of UAV swarm confrontation under incomplete information environments. According to the Observe-Orient-Decide-Act (OODA) loop theory, the UAV swarm confrontation process is divided into four interlocking key components of situation assessment, intention inference, mission planning, and maneuver decision, and is further subdivided into eight sub-research objectives. By analyzing and comparing the relevant research works in recent years, the research focuses and difficulties of various tasks in the field of UAV swarm confrontation and the achieved research results are highlighted, and the challenges faced by UAV swarm confrontation technology are discussed, including the cooperative control of large-scale heterogeneous swarms, the handling of incomplete information, the modeling of complex decision-making processes, and the tackling of practical application tasks.
-
1. 引言
1.1 无人机集群对抗的定义和背景
无人机(Unmanned Aerial Vehicle, UAV)因其低维护成本和高机动性,在民用与军事领域成为研究热点[1,2]。单一无人机能力有限,易损坏导致任务失败,因此研究重心转向无人机集群,以实现群体智能,提高效率和性能。无人机集群技术的发展进一步促进了无人机集群对抗的研究,多架无人机可以高度协同执行战术行动,如打击、掩护和情报搜集等,增强了其在军事和安全领域的应用,成为军事和安全领域的重要研究方向。同时,这一技术也推动了工业、物流和农业领域的自动化生产和管理,促进了智能应用技术的发展。
无人机集群对抗要求无人机具备自主判断、规划和决策能力,并能实现集群间的信息交互和协同行动。多种算法的配合形成完整系统,以提高任务执行效率和精确度。无人机集群对抗广泛应用于军事和安全领域,如对恐怖组织的打击、军事突袭、领空防御、海上巡逻等,能提高作战效率,降低成本和人员伤亡。此外,为了满足更复杂的任务需求,设计了不同类型的无人机以及由不同无人系统组成的异构集群[3,4],这对无人系统的适应力和自主性提出了更高的要求。
1.2 非完全信息下无人机集群对抗方法研究意义
在无人机集群对抗中,真实对抗环境往往存在非完全信息环境,集群无法获取完整的信息,包括友机、敌机以及其他环境信息。这些特点通常由通信干扰、数据传输带宽限制、通信距离限制、敌方决策误导、突发障碍物威胁、极端气候等多种因素引起。因此,非完全信息问题成为当前无人机控制领域的热点和难点之一。为了帮助研究人员应对这一问题,本文总结了近年来非完全信息下无人机集群对抗的研究现状。
提升无人机在非完全信息环境下的决策能力具有重要意义,但也带来了很大的挑战。非完全信息条件使模型更加贴近真实应用场景,增强了模型可行性和实用性。要突破这一难关,不仅需要更先进的硬件设计、感知算法和通信技术,方法研究也是关键,它是提高无人机集群智能化的核心。非完全信息条件会增加信息处理难度,需要研究者提出更高效灵活的对抗策略与方法,增强方法的鲁棒性。现有研究通过多种任务算法配合使用,以提高无人机智能化水平,推动无人机集群模型向实用性方向发展。
1.3 非完全信息下无人机集群对抗研究内容
非完全信息下无人机集群对抗研究,参考由美国空军军事战略家John Boyd提出的包以德循环(Observe-Orient-Decide-Act Loop, OODA Loop)理论,可以分成几个阶段。OODA循环描述了空战中飞行员决策过程,由观察、定位、决策、执行组成,强调的是比敌人具备更灵活的观察与反应能力,能够快而准确地在敌人的决策周期中瓦解敌人招式而取得优势[5]。参照此循环结构及其各部分的内在逻辑关系,本文将复杂的无人机对抗过程对应地分解为如图1所示的多阶段循环研究任务,包括态势评估、意图推断、任务规划、机动决策4个主要部分。通过OODA循环不断迭代,无人机集群能够快速适应并响应环境中的变化与不确定性,快速理解环境,识别目标意图,灵活地调整策略,进而采取有利的行动。
根据OODA循环环节,并结合近年来的研究进展情况,本文进一步将非完全信息下的无人机集群对抗研究的具体内容分解为8个子任务,如表1所示。OODA循环的观察阶段对应态势评估,涵盖对抗态势评估研究与威胁因素评估研究。定位阶段则对应敌机行为的意图推断,无人机集群进一步对收集到的敌机行为数据进行分析,通过对敌机行为的预测与识别对潜在的意图进行推断,进而快速响应、精准打击,获得决策优势。OODA循环的决策阶段需要制定最佳行动方案,对应任务规划研究,包括目标分配与航迹规划两部分。机动决策对应于OODA循环中的执行阶段,其核心研究涵盖协同对抗与追踪合围两部分内容,在执行阶段将观察、定位与决策结果转化为具体的无人机集群自主协同机动决策。
表 1 非完全信息下无人机集群对抗具体研究内容OODA循环 对抗循环环节 具体内容 具体含义 观察 态势评估 对抗态势评估 将态势定性分成优势、劣势、均势等,通过构造优势函数,利用双方状态信息进行态势评估,
辅助集群决策威胁因素评估 根据无人机特点,评估排序敌方目标和防空威胁,以辅助目标分配和决策 定位 意图推断 行为预测 利用已有信息推测敌机未来行为模式,预判使无人机集群获得决策优势 意图识别 对敌方集群当前行为意图进行定性判断,理解敌机意图使无人机集群获得决策优势 决策 任务规划 目标分配 考虑无人机的特性和任务需求,根据资源与优先级等约束,合理地分配目标,
并实现集群内动态协同航迹规划 根据任务需求,为无人机规划最佳路径,以安全到达目标 执行 机动决策 协同对抗 充分发挥集群力量,通过分散瓦解敌方防御,增大对敌方造成有效打击的可能性 追踪合围 对敌方的动态追踪与合围,通过限制敌方行动来保持我方优势与对敌方的压制 在无人机集群对抗的OODA循环中,态势评估和意图推断主要进行非完全信息环境下的数据处理与分析,为决策提供依据。而任务规划与机动决策侧重于集群内外信息融合的综合决策,有很高的协同性与灵活性要求。随对抗进展, OODA循环持续迭代至对抗结束,以优化无人机集群的作战效能。下面分别从态势评估、意图推断、任务规划与机动决策这4个方面对无人机集群对抗的研究现状做进一步的阐述。
2. 态势评估
在非完全信息的战场环境中,态势评估对无人机集群非常关键。这有助于无人机集群更深入地了解作战环境和目标威胁,从而提升自主决策能力。为了实时评估,无人机依赖感知模块来收集数据。但在信息不完全的条件下,如何快速、准确地分析这些数据是一大挑战。现代研究更注重在非完全信息环境下的实时和协同评估。与过去主要排序初始威胁的研究方法不同,目前态势研究越来越注重实时评估能力和协同评估能力。为了提升态势评估方法在实际作战中的应用价值,研究者已经开始增加对非完全信息情况的评估应对机制。
战场态势评估在无人机作战中扮演着关键角色,其研究框架如图2所示,通常包括两个主要方面:对抗态势评估与威胁因素评估。一方面,对抗态势评估对敌我双方空中战斗力量进行分析,通常要对敌我数量,速度、高度以及方向等多因子进行分析,以提高优势决策的可能性。另一方面,威胁因素评估是为了指导无人机选择攻击目标,并识别潜在的作战风险进而提前规避。这两方面评估都有助于提高无人机集群的对抗能力,从而更有效地执行任务并实现预定的战术和战略目标。
2.1 对抗态势评估
大量前期研究的仿真实验表明,具备评估对抗态势优劣能力的无人机集群在自主对抗中更能获得优势。由于空战决策根本目的是让空战态势不断朝着对我方有利的趋势发展,因此态势评估结果对空战中无人机决策影响很大。
态势评估需要融合对当前状态的信息观察、判断与对未来状态的预测进行综合判断,对抗态势评估结果可以简单划分为我方优势、敌方优势、双方均势、互不威胁等。在对抗中,通过量化信息和构建优势函数来实时准确判断态势。通常会用高度速度、距离、角度等信息来构建评估模型,如式(1)所示
f(Ta,Tv,Td,Th)=ωaTa+ωvTv+ωdTd+ωhTh (1) 式中,Ta,Tv,Td,Th分别为我方无人机角度优势函数、速度优势函数、距离优势函数、高度优势函数,它们的权重满足ωa+ωv+ωd+ωh=1。表2对相关研究进行了比较,主要考虑了对战的无人机数量、影响因子权重、未来状态影响、非完全信息条件以及异构集群等影响因素。为了提高复杂战场态势的评估精度,很多研究引入了模糊理论,其中,文献[6]利用模糊推理综合考虑态势中多个影响因素,文献[7]提出基于改进模糊神经网络的方法,而文献[8]利用贝叶斯推理理论对空战态势进行计算,同时利用模糊逻辑增加了决策的鲁棒性。考虑到多因子的常数权重对于分析的不利影响,文献[9]利用动态关联权值算法建立空战态势体系,动态调整权重。此外,考虑异构无人机的差异性,会增大态势评估难度,文献[10]将Endsley1995态势感知模型[11]中的心智模型修改为人机智能模型,构造了异构的无人机分布式集群态势感知模型。高性能的分析模型具备参与实战的价值,文献[12]基于作战几何提出了量化作战态势的评分函数和矩阵,实现了无人机仿真自主作战模型与人类飞行员的交互协同。
表 2 无人机集群空战对抗态势评估方法研究对比无人机集群的协同能力对态势评估有显著影响,尤其体现在态势评估一致性上。文献[13–15]都研究了不确定信息处理在态势一致性评估中的作用。其中,文献[13]采用基于区间数和非线性的方法,文献[14]使用基于证据推理和扰动分析法进行评估,而文献[15]则探讨了基于共识的分布式协作智能决策。
从上述对比分析可知,与过去的研究相比,目前态势优劣评估可实时对当前状态形成较准确的评估结果,并能客观地调整计算众多影响因子的权重,可以较好地避免人为主观因素影响,同时部分评价当前态势结果的研究考虑到了未来状态的影响。但是目前非完全信息下的集群对抗态势评估研究仍为重点和难点,并且异构集群在此领域的研究成果比较匮乏。此外,目前对抗态势评估模型中考虑多架无人机对战多架无人机的研究也比较少,大多数的优势函数仅建立在1 vs. 1场景上。
2.2 威胁因素评估
在复杂多变的战场环境中存在着多种值得注意的威胁因素,除了极端天气等突发自然环境威胁外,威胁因素主要来自敌区地面与空中防空力量的干扰与攻击。结合己方特点,对敌方目标的威胁程度和价值进行评估,可以指导无人机集群选择最优攻击目标,提高打击效果和作战胜率。威胁因素评估的难点是无人机需要在非完全信息战场环境下,收集并分析威胁因素的特征、数量、位置、移动方向、速度等信息,同时考虑集群中个体特征,得出对威胁因素评估一致性结论。这有助于无人机选择相对安全的作战策略与路径,降低无人机集群的损失。
在解决无人机面临多种威胁因素的问题上,特别是在复杂战场环境条件下,相关研究有着丰富的成果。其中,模糊理论与模糊数学方法常用来解决威胁因素评估中的不确定性与模糊性问题[16-21]。文献[16]在直觉利用量子蜂群算法和多属性决策(Quantum Artificial Bee Colony- Intuitionistic Fuzzy Multi-Attribute Decision Making, QABC-IFMADM)方法实现了准确的威胁评估,文献[17]和文献[18]采用了动态直觉模糊框架和VIKOR(VIšekriterijumsko KOmpromisno Rangiranje)方法来处理多目标评估问题,特别是文献[18]更注重处理动态和不确定性目标态势信息,实现了多目标威胁评估与目标选择。处理复杂的环境中的不确定信息是威胁因素评估研究中的难点问题,在相关研究中,文献[19]通过直觉模糊进行条件概率和决策阈值的估算。而文献[20]综合采用区间值直觉模糊集、博弈论和证据推理相结合的方法,提高评估精度;此外,文献[21]则提出了基于可能性理论的扩展模糊模型描述不确定和模糊信息。除模糊理论外,还有其他方法可以处理不确定信息,如文献[22]提出的基于3参数区间数和Heronian均值算子的态势感知一致性评价方法,用于处理信息不确定问题。文献[23]采用了动态贝叶斯网络、目标轨迹预测和威胁评估模型等方法,实现了对双机编队协同战术的准确识别与合理化威胁评估。文献[24]提出基于异构集群的目标威胁共识评估方法,实现分布式架构无人机评估结果的共识。而文献[25]建立多无人机空战威胁评估模型,进而基于矩阵博弈理论形式化目标分配问题。综上所述,无人机在复杂和多变的战场环境中面临多种威胁因素。解决这些威胁不仅需要对敌方和环境因素进行深入分析,而且需要高度精细的数学模型和算法,而在这一方面该领域还有待进一步研究,以应对更复杂的战场条件和不断升级的技术挑战。
3. 意图推断
在空战对抗中,一开始便给对方造成决定性打击的可能性相对较小。空战通常是一个具有多阶段的持续作战过程,其间充满了大量的随机性和不确定性。作战的各个阶段中,敌我双方的空战态势优势可能会随着策略的变化而变化。因此,能识别并预测敌方无人机集群的作战意图,进而能够灵活调整策略尤为重要。
意图推断是通过分析敌方无人机的类型以确定其可能的角色,并通过研究其行为模式进行识别的过程。用于推断的信息包括飞行路径、高度、速度和编队形态等,掌握敌方无人机的意图有助于预测和识别敌方行为,进而有机会优化空战态势。然而,目前针对空中敌机集群的意图推断研究还有待进一步深化。
从决策算法的角度,意图推断可划分为两个方面,如图3所示。一是基于已有信息推测敌机未来行为模式的行为预测;二是对敌方集群当前行为定性的意图识别。然而,目前对于无人机集群的意图推断研究存在许多挑战。首先,在非完全信息环境中,无人机由于有限的感知和通信能力,往往只能获取部分准确性不高的对战数据。其次,无人机集群作战中的个体行为极为复杂多样,集群无人机则具备了更加丰富的战术策略选择。如遇到高智能的敌方集群,敌方可能会采取干扰、伪装和欺骗等迷惑诱敌手段,这大大增加了集群意图推断的难度。最后,在实际的战斗中,无人机需要具备快速的预测和决策能力,在面临大量协同信息时,快速得出准确的一致性结果。接下来从决策算法的角度,对当前无人机集群作战中的意图推断水平进行阐述。
3.1 行为预测
行为预测研究要求无人机能实时而准确地判断敌机的动作,相当于掌握作战先机,能提前做好应对策略,比如进行规避、增强防御或调整攻击策略等。对敌机行为的预测往往作为决策依据的信息之一,对于对抗中我方集群的价值不言而喻。而对敌机行为的预测是一项具有很大挑战的任务。面对非完全信息环境和多目标因素,获取高质量数据和准确预测都变得更为困难。因此,本文在表3中从非完全信息环境、目标复杂运动、计算难度、目标数量及研究目标等角度对已有方法进行比较。
在表3所列成果中,在无法完全获得敌机信息的情况下,文献[26]建立了状态预测影响图(State Predicted Influence Diagram)模型对敌机状态进行预测,使用无迹卡尔曼滤波器(Unscented Kalman Filter, UKF)进行状态预测的置信状态更新。文献[27]利用相空间重建-径向基函数(Phase Space Reconstruction-Radial Basis Function, PSR-RBF)神经网络模型,提高预测目标移动轨迹的精准度。文献[28]提出了基于目标预测网络的图注意力多智能体柔性行动者-评论家(Graph Attention Multi-Agent Soft Actor Critic reinforcement learning with Target Predicting Network, GA-MASAC-TP Net)算法,利用对目标的预测分析来优化无人机群在对抗场景中的决策。另外,时间序列模型也成为模拟未来行为的常用手段[10,29]。其中,文献[10]采用自适应增强方法与长短期记忆(Long Short-Term Memory, LSTM)网络来进行实时轨迹预测,而文献[29]则利用基于双向长短期记忆(Bidirectional Long Short-Term Memory, Bi-LSTM)网络预测敌机轨迹。目标预测对于自主攻击制导有重要意义,文献[30]基于设计的模型预测控制(Model Predictive Control, MPC)框架预测目标运动。然而,从目前已有的研究成果看,考虑到非完全信息环境以及复杂运动趋势预测的研究相对较少,多数研究简化了预测目标的运动复杂度,同时研究较少考虑从降低模型复杂度的角度提高实时性,对多目标行为预测的研究还值得继续探索。
3.2 意图识别
在意图识别方面的研究通常通过定性分类来判断敌机的行为意图。传统方法多依赖专家的先验知识,建立参照库或贝叶斯网络,再收集敌机状态信息特征,定性匹配出具体的意图分类。但这些方法在复杂、动态战斗环境中的有效性仍待进一步验证。
在1 vs. 1的无人机空战意图识别上,常规空战作战任务包括攻击、侦察、佯动、监视、突防、防御和电子干扰等。越来越多的研究开始利用神经网络,特别是循环神经网络的变体如LSTM网络与门控循环单元(Gated Recurrent Unit, GRU)网络,来解决这个问题[31–34]。这些网络擅长处理与时间有关的长期依赖和因果关系。其中文献[31]利用LSTM网络和决策树来获取目标意图。文献[32]使用了LSTM网络并加入了自适应优化算法来克服局部最优问题,同时利用专家经验引入3次样条插值函数拟合以及平均值填充法来修补不完备数据,以解决非完备信息下空战目标意图预测问题。而文献[33]提出基于Bi-LSTM的网络并结合经验知识来进行意图识别。文献[34]则用GRU和意图决策树,特别关注在信息不全环境下的意图识别。文献[35]和文献[36]则分别使用了横向混合神经网络和基于贝叶斯推理的方法进行意图识别。
在多机协同对抗的研究中,多无人机间配合作战形成个体策略与整体策略,集群中会因无人机载荷不同、对抗过程中无人机数量变化等因素大大增加作战意图的多样性,现有研究大多未覆盖到集群的合作意图识别。文献[37]首次解决了多机协同空战战术意图识别问题,通过动态贝叶斯网络、雷达模型和威胁评估模型提取合作策略信息,最终通过决策树输出的战术意图有12种,分为3类:一般战术意图、一般协同战术意图和复杂协同战术意图。文献[38]和文献[39]则引入了先进的机器学习方法。文献[38]针对样本不平衡问题,采用了基于注意力机制的双向门控循环单元(Bidirectional Gated Recurrent Unit, BiGRU)网络。而文献[39]则结合了BiGRU和条件随机场(CRF)进行模型构建,同时引入了时空注意力(Space-Time Attention, STA)机制来强调空间-时间特征。
4. 任务规划
无人机集群的协同任务规划作为作战意图和策略的具体呈现,在对抗战场中发挥着决定性的作用。前文提到的态势评估和意图识别为理解战场环境和作战目标的关键。而任务规划的目的是综合我方无人机的特性,采取能够有效地放大我方优势的策略以获得最终胜利。具体而言,任务规划是依靠无人机间的协同合作,旨在避免冲突、节约资源和提高胜率,包括了目标分配与航迹规划两方面内容。
4.1 目标分配
目标分配是指在无人机集群协同对战时,根据各种约束条件,如目标优先级、无人机类型状态差异、资源约束与时间限制等,将目标或任务合理地分配给不同无人机,一架无人机对应多个目标时制定相应的任务顺序。这一过程依赖于无人机间的通信和协调,以适应实时态势变化和避免任务重复,从而在复杂战场中取得优势。
一般目标分配过程首先通过目标感知手段获取目标信息,确定任务需求与对目标的评估后,根据约束条件进行目标分配。M个目标点与N架无人机分配模型的目标函数可以简化为
maxJ=M∑j=1ω1⋅Vj−N∑i=1ω2⋅Ti (2) 式中Vj代表攻击目标j带来的收益,通常量化为攻击毁伤概率与目标价值的乘积; Ti代表无人机i受到的损失,通常包括航迹损失、资源损失和时间损失等。ω1与ω2作为收益与损失的权重,控制无人机选择激进还是保守策略。
关于目标分配的研究比较丰富,目前最具挑战性的问题是如何在非完全信息条件下实时动态地为异构无人机集群分配作战目标。表4对现有相关方法进行了对比分析,考虑了威胁约束、资源约束和时间约束等影响目标分配的因素。从目前的研究情况看,异构无人机群分配多目标问题需要处理异构信息是难点之一,为了让无人机群做出一致性决策,无人机对目标的评估最终应该在集群中形成共识。其中,文献[40]基于合同网协议(Contract Network Protocol, CNP),考虑了资源约束关系;文献[41]针对异构庞大的无人机集群,基于改进的CNP实现一对多与多对一模式的攻击目标分配;文献[42]则构建了包含多复杂约束的多任务分配模型,并提出了基于拐点的协同多目标粒子群优化(Knee point based Coevolution Multi-objective Particle Swarm Optimization, KnCMPSO)算法进行求解,在解决异构性难题的同时保证了收敛性。
表 4 无人机集群目标分配方法研究对比无人机对抗环境的另一个研究难点是非完全信息处理,研究不确定因素下异构无人机群的目标分配问题对实际作战的价值更高[43–47]。其中,文献[43]提出了基于Q-Learning的一种快速任务分配(Fast Task Allocation, FTA)算法,该算法采用了神经网络逼近和优先体验回放等技术来提高异构集群任务分配的效率;而文献[44]引入改进的两阶段随机规划算法求解不确定信息下的任务目标,利用无人机的运动学约束、资源约束和时间约束建立目标函数。一些研究考虑到战斗中很难对敌方威胁形成确定性评估,常用模糊数来表示敌方目标的威胁度,例如文献[45]利用必要性理论对模糊目标函数进行清晰化处理,同时构建了非合作双矩阵博弈模型,并提出一种改进的多策略融合粒子群优化算法来求解纳什均衡;文献[46]则利用模糊可信性理论构建模糊机会约束模型,解决了不确定因素影响的处理时间窗约束和时序约束难题,并提出了多策略融合的灰狼优化(Multi-Strategy Integrated Grey Wolf Optimization, IMSGWO)算法求解模型。另外,也有学者尝试利用强化学习解决此类问题,例如文献[47]采用多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)方法,解决了任务变化后的快速协同响应问题。
从以上分析可以看出,现在的研究难点主要在于如何使目标分配模型更具有实战价值。在复杂的非完全信息作战环境中,往往需要考虑复杂多变的条件,根据具体的应用场景,目标分配可能需要考虑到的条件包括目标威胁、资源约束、时间约束等。此外,目前大多数研究还停留在以固定目标作为对象的研究层面上,动态目标则更考验模型是否能根据环境目标变化进行响应,意味着模型能否快速适应不同的环境和任务,而这一方面的研究还有待加强。
4.2 航迹规划
航迹规划是指无人机集群为了穿越障碍区或威胁区到达目标点,根据具体的任务需求给每架无人机规划最佳的飞行路径,其难点是在复杂的约束条件下保证规划效率与效果。无人机集群航迹规划模型可简化为式(3)所示的多目标优化问题。给定m架无人机,其中无人机i到其目标之间的航迹距离Di,以最小化航迹距离总和∑mi=1Di为目标函数,其约束条件包括:利用与威胁区o∈{1,2,⋯,n}之间的距离约束躲避环境中威胁,dio是无人机i到威胁区o的距离,ro代表威胁区o的威胁范围半径;无人机间的防碰撞约束利用无人机间距离表示,dij代表无人机i与无人机j之间的距离,dmin代表两个无人机之间的安全距离;ti与tj分别表示无人机i与无人机j到达目标的时间,其绝对值之差表示在一定时间范围C内到达目标点的时间协同约束。此外还要根据实际情况增加无人机动力学约束等。
minm∑i=1Dis.t.{dio≥ro,i∈{1,2,⋯,m},o∈{1,2,⋯,n}dij≥dmin,i,j∈{1,2,⋯,m}|ti−tj|≤C,i,j∈{1,2,⋯,m}⋯ (3) 其中,无人机集群在任务中的避障研究是核心基础问题。式(3)以距离为约束躲避障碍,在仿真中表现的灵活性不足,研究中常会添加其他的避障手段。其中,人工势场法因其简单、实用性强的特点,常被应用于无人机集群自主决策模型中[48–52]。但是传统的人工势场法在规避突发障碍物问题上还存在局限性。除此之外,其他避障模型如强化学习[53]、仿生智能[54, 55]、启发式算法[56]等也被广泛地应用于该领域。
表5从空间维度、集群异构性、目标数量、环境威胁、防碰撞约束和时间协同约束等角度对相关研究进行了对比,其中代表性方法的详细分析如下。
无人机集群航迹问题常被看成多目标优化问题,为求解多目标优化问题,文献[57]利用基于个体评估交叉策略的多目标优化遗传算法(Non-dominated Sorting Genetic Algorithm III-Individual Crossover, NSGAIII-ICO)平衡多目标之间的冲突,增强了高维多目标优化算法的稳定性与实用性;而文献[58]利用广义克拉默-拉奥下界(Generalized Cramer-Rao Lower Bound, GCRLB)理论作为目标函数进行航迹规划。此外在追踪问题中需要无人机实时进行路径规划,文献[59]采用了多目标无干扰深度确定性策略梯度强化学习(Method Name Deep Deterministic Policy Gradient, MN-DDPG)来实现对机动目标的追踪和路径规划。
为提高多目标点航迹规划的规划效果,文献[60]成功将定制内点法引入无人机航迹规划问题中,降低计算复杂度,提升轨迹规划效率。在集群任务规划研究中,多目标分配与多目标路径规划问题往往形成上下层研究关系,多目标分配作为上层将目标分配给无人机后,下层则是针对目标的路径规划[40, 61]。其中,文献[40]在目标分配的基础上,使用协同粒子群(Particle Swarm Optimization, PSO)算法和协同函数、协同变量方法为异构无人机集群规划出最佳航迹;而文献[61]采用模糊蚁群算法实现了基于分层决策的任务规划,包括上层目标分配决策层和下层航迹规划执行层。
通过上述分析可知,目前相关研究既有单目标航迹规划也有多目标航迹规划,而无人机集群航迹问题的未来研究方向在于实现异构集群建模,并且模型应具备应对非完全信息环境的能力,能在具有突发威胁的场景中快速为无人机规划出航迹,以提高其实际应用价值。此外,集群航迹规划模型根据应用场景实际需求还需考虑环境威胁、防碰撞约束、时间协同约束等因素。
5. 机动决策
机动决策被视为无人机集群对抗中的最终执行环节,直接影响战斗效果。集群需要综合战场态势信息与自身的性能和限制条件,完成最优的机动策略制定。其研究主要包括两个核心组成部分——协同对抗与追踪合围,研究框架如图4所示。这两部分几乎包含了所有战术行动,目标是有效打击敌方,维护己方的战场优势。协同对抗主要代表无人机集群对抗中的积极进攻性和协同性,强调利用集体力量来分散瓦解敌方防御;追踪合围则代表了无人机集群对抗的动态性和自适应性,通过限制敌方行动来保持对敌方的压制。由于追踪合围适用于我方占优的战场态势环境中,与逃逸突围形成对峙角色,在真实应用中的追逃关系应被描述为非完全信息博弈,可通过改变支付函数完成角色策略转变[62],因此本文以协同对抗与追踪合围为代表进行阐述。
5.1 协同对抗
在非完全信息环境中,由于无人机无法获取完整且准确的信息,实施有效协同对抗的难度将大幅提高。无人机需要在快速变化的环境中进行协同决策,这需要高效的计算和通信能力以及灵活机动的协同算法。在协同对抗中,需要避免无人机之间的冲突,同时优化资源的使用,以提高攻击效果和效率。
在传统的研究中无人机集群协同对抗常用的方法包括博弈论、启发式算法、仿生智能算法等,而近年来,深度强化学习由于其对于高维连续空间与复杂动态环境的适用性,在该研究领域受到广泛关注。表6从目标分配、协同态势评估、意图推断及协同优势等角度对近期的重要文献及其方法进行了对比分析。
表 6 无人机集群协同对抗方法研究对比在无人机集群协同对抗环境中,深度强化学习已成为实现高效决策与策略优化的主要计算框架,例如,文献[63]将空战动态过程建模成不完全信息动态博弈模型,在推断敌方意图基础上,利用多智能体深度确定性策略梯度(Multi-Agent Deep Deterministic Policy Gradient, MADDPG)求解完美贝叶斯-纳什均衡解;进而,文献[64]在目标分配和空战态势评估基础上,一致化集群目标与个体无人机目标,利用Actor-Critic算法得到了协同策略;文献[65]同样基于Actor-Critic算法,分别引入门控循环单元与注意力机制进行分散执行与集中训练,这种方法与协同态势评估有相似性,但实现方式有显著区别;文献[66]进一步提出了基于并行解耦-多智能体深度确定性策略梯度(Parallel Decoupling-MADDPG, PD-MADDPG)算法的自主协同策略,改善了MADDPG算法的奖励稀疏问题,提高了收敛速度。
除了深度强化学习方法之外,一些基于传统研究思路的方法在无人机协同对抗研究中也取得了很好的效果。例如,文献[67]提出了一种竞争学习鸽子启发优化(Competitive Learning Pigeon-Inspired Optimization, CLPIO)算法,实现无人机集群作战中的群体行为控制与目标分配。而针对非完全信息环境,文献[68]则运用分布式任务分配和多种协同机制,有效降低了侦查和打击任务的失败风险。
通过以上分析可知,使集群中个体在作战中产生协同策略通常会采用多种办法,例如目标分配、协同态势评估、强化学习集中训练以及对敌方的意图推断等来实现协同行为。但是现有研究对于异构集群与非完全信息环境中的协同对抗涉及较少,有待进一步研究。
5.2 追踪合围
无人机集群追踪合围主要应用于对特定目标的跟踪和围堵,是一种常见的协同对抗策略。在优势态势环境下,多智能体集群需实现高度协同与快速反应机制以锁定并从多维度追踪及合围逃逸目标,从而不仅阻止目标的逃逸行为,也最大化地利用集群的优势性能。下面分别从追踪决策和合围决策两个方面予以介绍。
5.2.1 追踪决策
无人机集群的协同追踪是完成任务的主要能力之一。无人机通过感知与决策,分析追踪目标是否在感知范围内,通过分析自身和目标的相对运动状态,不断搜索和跟踪目标,定位目标的实时位置,预测追踪目标的移动方向,其难点在于无人机自动分析追踪目标的信息并决策,同时维持合适的追踪距离,尽量多地保证追踪范围内的目标数量。
表7从目标数量、目标不确定运动、避障研究及复杂环境等角度对相关研究进行了比较分析。真实情况下目标往往是不确定运动的,例如文献[69]在没有先验信息情况下,基于线性多目标集成概率数据关联(smoothing Linear Multi-target based on Integrated Probabilistic Data Association, sLM-IPDA)算法,解决在复杂的环境中追踪多个不确定目标的问题;文献[70]进一步为无人机生成了多种追踪策略;而在文献[71]中,研究者将自适应差分进化(Adaptive Differential Evolution, ADE)算法与纳什(Nash)优化相结合来处理目标轨迹变化的跟踪问题。除此之外,强化学习算法在追踪决策训练中也被广泛应用,例如文献[72]基于分散的最大互惠奖励MARL算法来提高无人机集群的协同追踪性能;而文献[73]利用D3QN(Double Deep Q-Learning network with dueling architecture)来学习合作策略,采用经验共享训练机制来学习无人集群的共享协作策略;文献[74]则在考虑避障需求的基础上,提出了一种平衡了跟踪精度和实时性的无人机追踪策略。
通过以上分析不难看出此方向仍缺乏异构集群追踪问题的研究成果。此外,现有的研究主要攻克的难点涉及多目标追踪、目标不确定运动、追踪过程中的障碍物躲避以及复杂环境的影响等,针对这些问题进行更为深入的探讨,是推动无人机集群追踪技术在非完全信息条件下发展的关键。
5.2.2 合围决策
在无人机集群的对抗作战环境中,实施对逃逸目标的合围控制策略能够为作战过程获取显著优势。作为一种常见的战术形式,合围控制旨在将目标限制在特定的区域内进行干扰或攻击。相较于使用地面设备干扰空中飞行器,利用无人机集群进行协同合围可以显著扩大围捕范围,并增强操作场景的灵活性。然而,在不确定的高强度对抗环境下,如何确保围捕效果的稳定性以及对异构群体的有效控制成为主要的挑战。
表8从复杂环境、有限感知、目标数量与目标状态等方面对相关研究进行了对比分析。其中,文献[75]研究异构集群的合围策略,面对感知受限及部分节点探测故障的限制,借鉴狼群狩猎空间交互机制建立了一种狼群交互动力学模型。在同构集群合围策略的研究中,文献[76]将问题描述为零和矩阵博弈,提出了一种结合Double-Oracle(DO)算法和邻域搜索(Neighborhood Search, NS)算法的DO-NS方法,以处理大规模的零和博弈矩阵。文献[77, 78]将目标的信息状态纳入考虑,基于深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)模型求解围捕策略。而文献[79]在有限感知的前提下,设计了一种基于一致性协议的多无人机协同追踪与合围协议,实现对动态目标的拦截和围捕。
从以上分析来看,目前的无人机集群合围研究有其局限性。首先,现有研究在异构集群方面的探讨还不够充分。其次,多数模型没有考虑真实环境复杂性与无人机感知能力有限性。最后,真实的合围目标通常具备动态可变性及逃脱意图,合围研究更为强调对目标行为的实时响应机制。因此,有必要在未来的研究中着重考虑这些问题的应对策略,以进一步提升无人机集群合围技术的有效性和实用性。
6. 结论
本文参照OODA循环结构及其逻辑关系,将复杂的无人机对抗过程对应地分解为4个多阶段循环研究任务,包括态势评估、意图推断、任务规划与机动决策4个相互衔接的关键组成部分,并进一步将其细分为8个子研究目标,包括对抗态势评估、威胁因素评估、行为预测、意图识别、目标分配、航迹规划、协同对抗与追踪合围。本文在整理相关研究成果时发现,过去对无人机集群对抗问题的研究过于依赖完全信息与先验知识,对态势判断与敌机意图推断具有较强的主观性,并且仅能利用初始状态信息进行行动规划。通过对近些年文献的分析,目前无人机集群已经能较好地实现对战场态势变化的实时应对。在态势评估与意图推断的研究中,无人机集群具备了一定的非完全信息处理能力,可以高效准确地得到判断结果;在任务规划与机动决策中,无人机集群具备了一定的响应战场变化与应对突发威胁的能力。然而,现有的模型和方法与无人机集群实际对抗环境相比仍过于简化,研究中的对手无人机的应变能力也比较弱,难以充分展现出模型的真正效果,并且大多数方法在处理异构集群问题时的鲁棒性仍有待提高。总体而言,在以下几个方面还有待进一步研究。
(1) 大规模多群体的作战研究:大规模多群体无人机对战研究面临很多挑战。首先,数量提升会增加计算复杂性和通信负担,对算法的效率和稳定性产生负面影响。其次,随着无人机数量的增加,目标也会变得复杂多变,这需要算法能够有效地处理目标分配和实时任务规划,以适应不断变化的战场环境。最后,多群体意味着具有更丰富的协同策略空间,需要更高级别的协调,同时也可能引入更多的竞争关系,这两者需要在模型中得到平衡。总的来说,大规模多无人机集群作战研究,尤其是在算法收敛速度和稳定性方面有待进一步深入和优化。
(2) 异构无人系统的决策建模:现有的无人机集群对抗研究中大多数研究对象以同构无人机集群为主。同构无人机集群是由同一类型的、具有相同的载荷及运动学模型的无人机组成的集群,通常能够完成的任务类型比较单一。而异构无人机集群则由不同类型无人机组成,其载荷决定无人机在集群中承担的任务角色。异构无人机通过合作实现功能互补,能够并发执行或顺序执行多种任务,但过程中的时空约束影响更大,涉及参数更多,合作控制模型也更为复杂,因此异构性给无人机集群协同决策带来了更大的挑战,同时也增加了更多可能性。近些年还有研究者提出了一些新的作战理念,包括无人机与有人机协同对抗[80]等。在跨域研究中还提出了海-陆-空相互配合的控制研究[81–84],即无人机与地面无人车或水上无人舰等互相配合,形成混合异构集群系统,扩大了异构无人系统的概念范畴。因此,异构无人系统的决策建模研究必将成为未来的一大发展趋势。
(3) 针对不可控真实环境的模型稳定性和容错能力:无人机的真实应用环境比目前绝大多数研究的应用环境更加复杂。首先,本文在第1节中阐述了无人机真实应用具有非完全信息特性的原因,但大多数研究模型还较大程度依赖完全信息,无人机应对突发事件的能力不足。其次目前大多数研究停留在理想状态下的实验层面,缺少对于实际应用中会受到的诸多外界干扰、无人机故障、信息时滞、异常行为等不利因素的应对措施,因此未来应考虑加强研究无人机群的稳定性,进一步提高模型的容错能力。
(4) 面向复杂实际任务场景的多任务优化:现有无人机集群模型研究大多针对二维单一任务场景,而实际应用场景中往往需要集群并发执行或顺序执行多层级任务,为适应实际任务场景,模型复杂度会提高,优化难度也相应增加。而近年来多任务优化这一新范式受到学界关注[85,86],该范式能同时求解有相似之处的多个任务的最优解,进而缩短优化时间并提高模型的多任务泛化能力。尽管目前该领域相关研究还处于探索阶段,但对于提高多无人机自主控制在应对复杂实际任务场景时有助益作用。
(5) 深度强化学习在无人机集群对抗中的应用:近年来深度强化学习在无人机集群对抗研究中发展迅速,并且经常与其他方法结合在一起使用,在具有高维连续状态和动作空间的环境中展现出了巨大潜力。但深度强化学习在多智能体环境中应用仍然面临许多挑战,包括巨大的动作空间、部分可观测性、置信分配问题、非稳定性环境等难题[87–89],值得进一步深入研究。
-
表 1 非完全信息下无人机集群对抗具体研究内容
OODA循环 对抗循环环节 具体内容 具体含义 观察 态势评估 对抗态势评估 将态势定性分成优势、劣势、均势等,通过构造优势函数,利用双方状态信息进行态势评估,
辅助集群决策威胁因素评估 根据无人机特点,评估排序敌方目标和防空威胁,以辅助目标分配和决策 定位 意图推断 行为预测 利用已有信息推测敌机未来行为模式,预判使无人机集群获得决策优势 意图识别 对敌方集群当前行为意图进行定性判断,理解敌机意图使无人机集群获得决策优势 决策 任务规划 目标分配 考虑无人机的特性和任务需求,根据资源与优先级等约束,合理地分配目标,
并实现集群内动态协同航迹规划 根据任务需求,为无人机规划最佳路径,以安全到达目标 执行 机动决策 协同对抗 充分发挥集群力量,通过分散瓦解敌方防御,增大对敌方造成有效打击的可能性 追踪合围 对敌方的动态追踪与合围,通过限制敌方行动来保持我方优势与对敌方的压制 表 2 无人机集群空战对抗态势评估方法研究对比
表 3 无人机集群空战对抗中对敌方行为预测方法研究对比
表 4 无人机集群目标分配方法研究对比
表 5 无人机集群航迹规划方法研究对比
表 6 无人机集群协同对抗方法研究对比
表 7 无人机集群追踪决策方法研究对比
-
[1] ZUO Zongyu, LIU Cunjia, HAN Qinglong, et al. Unmanned aerial vehicles: Control methods and future challenges[J]. IEEE/CAA Journal of Automatica Sinica, 2022, 9(4): 601–614. doi: 10.1109/JAS.2022.105410. [2] AYAMGA M, AKABA S, and NYAABA A A. Multifaceted applicability of drones: A review[J]. Technological Forecasting and Social Change, 2021, 167: 120677. doi: 10.1016/j.techfore.2021.120677. [3] HASSANALIAN M and ABDELKEFI A. Classifications, applications, and design challenges of drones: A review[J]. Progress in Aerospace Sciences, 2017, 91: 99–131. doi: 10.1016/j.paerosci.2017.04.003. [4] ELMESEIRY N, ALSHAER N, and ISMAIL T. A detailed survey and future directions of Unmanned Aerial Vehicles (UAVs) with potential applications[J]. Aerospace, 2021, 8(12): 363. doi: 10.3390/aerospace8120363. [5] CLARKE R A and KNAKE R K. The Fifth Domain: Defending Our Country, Our Companies, and Ourselves in the Age of Cyber Threats[M]. London: Penguin Press, 2019: 58. [6] WU Ao, YANG Rennong, LIANG Xiaolong, et al. Visual range maneuver decision of unmanned combat aerial vehicle based on fuzzy reasoning[J]. International Journal of Fuzzy Systems, 2022, 24(1): 519–536. doi: 10.1007/s40815-021-01158-y. [7] ZHANG Lin, ZHU Yian, SHI Xianchen, et al. A situation assessment method with an improved fuzzy deep neural network for multiple UAVs[J]. Information, 2020, 11(4): 194. doi: 10.3390/INFO11040194. [8] HUANG Changqiang, DONG Kangsheng, HUANG Hanqiao, et al. Autonomous air combat maneuver decision using Bayesian inference and moving horizon optimization[J]. Journal of Systems Engineering and Electronics, 2018, 29(1): 86–97. doi: 10.21629/JSEE.2018.01.09. [9] XIE Lei, DING Dali, WEI Zhenglei, et al. Moving time UCAV maneuver decision based on the dynamic relational weight algorithm and trajectory prediction[J]. Mathematical Problems in Engineering, 2021, 2021: 6641567. doi: 10.1155/2021/6641567. [10] 高杨, 李东生, 程泽新. 无人机分布式集群态势感知模型研究[J]. 电子与信息学报, 2018, 40(6): 1271–1278. doi: 10.11999/JEIT170877.GAO Yang, LI Dongsheng, and CHENG Zexin. UAV distributed swarm situation awareness model[J]. Journal of Electronics & Information Technology, 2018, 40(6): 1271–1278. doi: 10.11999/JEIT170877. [11] ENDSLEY M R. Toward a theory of situation awareness in dynamic systems[J]. Human Factors:The Journal of the Human Factors and Ergonomics Society, 1995, 37(1): 32–64. doi: 10.1518/001872095779049543. [12] SHIN H, LEE J, KIM H, et al. An autonomous aerial combat framework for two-on-two engagements based on basic fighter maneuvers[J]. Aerospace Science and Technology, 2018, 72: 305–315. doi: 10.1016/j.ast.2017.11.014. [13] 高杨, 李东生, 柳向. 无人机集群协同态势觉察一致性评估[J]. 电子学报, 2019, 47(1): 1906–19. doi: 10.3969/j.issn.0372-2112.2019.01.025.GAO Yang, LI Dong-sheng, LIU Xiang. UAV Swarm Cooperative Situation Perception Consensus Evaluation[J]. Acta Electonica Sinica, 2019, 47(1): 1906–19. doi: 10.3969/j.issn.0372-2112.2019.01.025. [14] 唐帅文, 周志杰, 姜江, 等. 考虑扰动的无人机集群协同态势感知一致性评估[J]. 航空学报, 2020, 41(S2): 724233. doi: 10.7527/S1000-6893.2020.24233.TANG Shuaiwen, ZHOU Zhijie, JIANG Jiang, et al. Consensus evaluation of UAV swarm cooperative situation awareness considering perturbation[J]. Acta Aeronauticaet Astronautica Sinica, 2020, 41(S2): 724233. doi: 10.7527/S1000-6893.2020.24233. [15] GAO Yang and LI Dongsheng. Unmanned aerial vehicle swarm distributed cooperation method based on situation awareness consensus and its information processing mechanism[J]. Knowledge-Based Systems, 2020, 188: 105034. doi: 10.1016/j.knosys.2019.105034. [16] 韩博文, 姚佩阳, 钟赟, 等. 基于QABC-IFMADM算法的有人/无人机编队作战威胁评估[J]. 电子学报, 2018, 46(7): 1584–1592. doi: 10.3969/j.issn.0372-2112.2018.07.007.HAN Bowen, YAO Peiyang, ZHONG Yun, et al. Threat assessment of manned/unmanned aerial vehicle formation based on QABC-IFMADM algorithm[J]. Acta Electronica Sinica, 2018, 46(7): 1584–1592. doi: 10.3969/j.issn.0372-2112.2018.07.007. [17] ZHANG Kun, KONG Weiren, LIU Peipei, et al. Assessment and sequencing of air target threat based on intuitionistic fuzzy entropy and dynamic VIKOR[J]. Journal of Systems Engineering and Electronics, 2018, 29(2): 305–310. doi: 10.21629/JSEE.2018.02.11. [18] 高杨, 黄仰超, 程国兵, 等. 直觉模糊信息下基于VIKOR和三支决策的多目标威胁评估方法[J]. 电子学报, 2021, 49(3): 542–549. doi: 10.12263/DZXB.20190150.GAO Yang, HUANG Yangchao, CHENG Guobing, et al. Multi-target threat assessment method based on VIKOR and three-way decisions under intuitionistic fuzzy information[J]. Acta Electronica Sinica, 2021, 49(3): 542–549. doi: 10.12263/DZXB.20190150. [19] GAO Yang, LI Dongsheng, and ZHONG Hua. A novel target threat assessment method based on three-way decisions under intuitionistic fuzzy multi-attribute decision making environment[J]. Engineering Applications of Artificial Intelligence, 2020, 87: 103276. doi: 10.1016/j.engappai.2019.103276. [20] ZHAO Ruojing, YANG Fengbao, JI Linna, et al. Dynamic air target threat assessment based on interval-valued intuitionistic fuzzy sets, game theory, and evidential reasoning methodology[J]. Mathematical Problems in Engineering, 2021, 2021: 6652706. doi: 10.1155/2021/6652706. [21] ZHAO Ruojing, YANG Fengbao, and JI Linna. An extended fuzzy CPT-TODIM model based on possibility theory and its application to air target dynamic threat assessment[J]. IEEE Access, 2022, 10: 21655–21669. doi: 10.1109/ACCESS.2022.3153361. [22] GAO Yang and LI Dongsheng. UAV swarm cooperative situation perception consensus evaluation method based on three-parameter interval number and heronian mean operator[J]. IEEE Access, 2018, 6: 73328–73340. doi: 10.1109/ACCESS.2018.2882409. [23] 孟光磊, 周铭哲, 朴海音, 等. 基于协同战术识别的双机编队威胁评估方法[J]. 系统工程与电子技术, 2020, 42(10): 2285–2293. doi: 10.3969/j.issn.1001-506X.2020.10.17.MENG Guanglei, ZHOU Mingzhe, PIAO Haiyin, et al. Threat assessment method of dual-aircraft formation based on cooperative tactical recognition[J]. Systems Engineering and Electronics, 2020, 42(10): 2285–2293. doi: 10.3969/j.issn.1001-506X.2020.10.17. [24] GAO Yang and LI Dongsheng. Consensus evaluation method of multi-ground-target threat for unmanned aerial vehicle swarm based on heterogeneous group decision making[J]. Computers & Electrical Engineering, 2019, 74: 223–232. doi: 10.1016/j.compeleceng.2019.01.019. [25] LIU Chang, SUN Shaoshan, TAO Chenggang, et al. Sliding mode control of multi-agent system with application to UAV air combat[J]. Computers & Electrical Engineering, 2021, 96: 107491. doi: 10.1016/j.compeleceng.2021.107491. [26] PAN Qian, ZHOU Deyun, HUANG Jichuan, et al. Maneuver decision for cooperative close-range air combat based on state predicted influence diagram[C]. 2017 IEEE International Conference on Information and Automation (ICIA), Macao, China, 2017: 726–731. doi: 10.1109/ICInfA.2017.8079001. [27] XI Zhifei, XU An, KOU Yingxin, et al. Target maneuver trajectory prediction based on RBF neural network optimized by hybrid algorithm[J]. Journal of Systems Engineering and Electronics, 2021, 32(2): 498–516. doi: 10.23919/JSEE.2021.000042. [28] LIU D, ZONG Q, ZHANG X, et al. Game of drones: Intelligent online decision making of Multi-UAV confrontation[J]. IEEE Transactions on Emerging Topics in Computational Intelligence, 2024, 8(2): 2086–210. doi: 10.1109/TETCI.2024.3360282. [29] TAN Mulai, TANG Andi, DING Dali, et al. Autonomous air combat maneuvering decision method of UCAV based on LSHADE-TSO-MPC under enemy trajectory prediction[J]. Electronics, 2022, 11(20): 3383. doi: 10.3390/electronics11203383. [30] YANG Zhen, SUN Zhixiao, PIAO Haiyin, et al. An autonomous attack guidance method with high aiming precision for UCAV based on adaptive fuzzy control under model predictive control framework[J]. Applied Sciences, 2020, 10(16): 5677. doi: 10.3390/app10165677. [31] ZHOU Tongle, CHEN Mou, WANG Yuhui, et al. Information entropy-based intention prediction of aerial targets under uncertain and incomplete information[J]. Entropy, 2020, 22(3): 279. doi: 10.3390/e22030279. [32] 刘钻东, 陈谋, 吴庆宪, 等. 非完备信息下无人机空战目标意图预测[J]. 中国科学:信息科学, 2020, 50(5): 704–717. doi: 10.1360/SSI-2019-0106.LIU Zuandong, CHEN Mou, WU Qingxian, et al. Prediction of unmanned aerial vehicle target intention under incomplete information[J]. Scientia Sinica Informationis, 2020, 50(5): 704–717. doi: 10.1360/SSI-2019-0106. [33] WANG Xingyu, YANG Zhen, ZHAN Guang, et al. Tactical intention recognition method of air combat target based on BiLSTM network[C]. 2022 IEEE International Conference on Unmanned Systems (ICUS), Guangzhou, China, 2022: 63–67. doi: 10.1109/ICUS55513.2022.9986667. [34] XIA Jingyang, CHEN Mengqi, and FANG Weiguo. Air combat intention recognition with incomplete information based on decision tree and GRU network[J]. Entropy, 2023, 25(4): 671. doi: 10.3390/e25040671. [35] WANG Yinhan, WANG Jiang, FAN Shipeng, et al. Quick intention identification of an enemy aerial target through information classification processing[J]. Aerospace Science and Technology, 2023, 132: 108005. doi: 10.1016/j.ast.2022.108005. [36] MENG Haodong, SUN Chong, FENG Yunchong, et al. One-to-one close air combat maneuver decision method based on target maneuver intention prediction[C]. 2022 IEEE International Conference on Unmanned Systems (ICUS), Guangzhou, China, 2022: 1454–1465. doi: 10.1109/ICUS55513.2022.9987174. [37] MENG Guanglei, ZHAO Runnan, WANG Biao, et al. Target tactical intention recognition in multiaircraft cooperative air combat[J]. International Journal of Aerospace Engineering, 2021, 2021: 9558838. doi: 10.1155/2021/9558838. [38] 马钰棠, 孙鹏, 张杰勇, 等. 样本不平衡下的空中群组意图识别方法[J]. 系统工程与电子技术, 2022, 44(12): 3747–3755. doi: 10.12305/j.issn.1001-506X.2022.12.19.MA Yutang, SUN Peng, ZHANG Jieyong, et al. Air group intention recognition method under imbalance samples[J]. Systems Engineering and Electronics, 2022, 44(12): 3747–3755. doi: 10.12305/j.issn.1001-506X.2022.12.19. [39] WANG Siyuan, WANG Gang, FU Qiang, et al. STABC-IR: An air target intention recognition method based on bidirectional gated recurrent unit and conditional random field with space-time attention mechanism[J]. Chinese Journal of Aeronautics, 2023, 36(3): 316–334. doi: 10.1016/j.cja.2022.11.018. [40] 严飞, 祝小平, 周洲, 等. 考虑同时攻击约束的多异构无人机实时任务分配[J]. 中国科学:信息科学, 2019, 49(5): 555–569. doi: 10.1360/N112018-00338.YAN Fei, ZHU Xiaoping, ZHOU Zhou, et al. Real-time task allocation for a heterogeneous multi-UAV simultaneous attack[J]. Scientia Sinica Informationis, 2019, 49(5): 555–569. doi: 10.1360/N112018-00338. [41] ZHEN Ziyang, WEN Liangdong, WANG Bolan, et al. Improved contract network protocol algorithm based cooperative target allocation of heterogeneous UAV swarm[J]. Aerospace Science and Technology, 2021, 119: 107054. doi: 10.1016/j.ast.2021.107054. [42] 王峰, 黄子路, 韩孟臣, 等. 基于KnCMPSO算法的异构无人机协同多任务分配[J]. 自动化学报, 2023, 49(2): 399–414. doi: 10.16383/j.aas.c210696.WANG Feng, HUANG Zilu, HAN Mengchen, et al. A knee point based coevolution multi-objective particle swarm optimization algorithm for heterogeneous UAV cooperative multi-task allocation[J]. Acta Automatica Sinica, 2023, 49(2): 399–414. doi: 10.16383/j.aas.c210696. [43] ZHAO Xinyi, ZONG Quan, TIAN Bailing, et al. Fast task allocation for heterogeneous unmanned aerial vehicles through reinforcement learning[J]. Aerospace Science and Technology, 2019, 92: 588–594. doi: 10.1016/j.ast.2019.06.024. [44] JIA Zhenyue, YU Jianqiao, AI Xiaolin, et al. Cooperative multiple task assignment problem with stochastic velocities and time windows for heterogeneous unmanned aerial vehicles using a genetic algorithm[J]. Aerospace Science and Technology, 2018, 76: 112–125. doi: 10.1016/j.ast.2018.01.025. [45] 赵玉亮, 宋业新, 张建军, 等. 基于多策略融合粒子群的无人机对地攻击模糊博弈决策[J]. 控制理论与应用, 2019, 36(10): 1644–1652. doi: 10.7641/CTA.2019.80437.ZHAO Yuliang, SONG Yexin, ZHANG Jianjun, et al. Fuzzy game decision-making of unmanned aerial vehicles air-to-ground attack based on the particle swarm optimization integrating multiply strategies[J]. Control Theory Applications, 2019, 36(10): 1644–1652. doi: 10.7641/CTA.2019.80437. [46] 张安, 杨咪, 毕文豪, 等. 基于多策略GWO算法的不确定环境下异构多无人机任务分配[J]. 航空学报, 2023, 44(8): 327115. doi: 10.7527/S1000-6893.2022.2711.ZHANG An, YANG Mi, BI Wenhao, et al. Task allocation of heterogeneous multi-UAVs in uncertain environment based on multi-strategy integrated GWO[J]. Acta Aeronauticaet Astronautica Sinica, 2023, 44(8): 327115. doi: 10.7527/S1000-6893.2022.2711. [47] LIU Da, DOU Liquan, ZHANG Ruilong, et al. Multi-agent reinforcement learning-based coordinated dynamic task allocation for heterogenous UAVs[J]. IEEE Transactions on Vehicular Technology, 2023, 72(4): 4372–4383. doi: 10.1109/TVT.2022.3228198. [48] SUN Jiayi, TANG Jun, and LAO Songyang. Collision avoidance for cooperative UAVs with optimized artificial potential field algorithm[J]. IEEE Access, 2017, 5: 18382–18390. doi: 10.1109/ACCESS.2017.2746752. [49] HEIDARI H and SASKA M. Collision-free trajectory planning of multi-rotor UAVs in a wind condition based on modified potential field[J]. Mechanism and Machine Theory, 2021, 156: 104140. doi: 10.1016/j.mechmachtheory.2020.104140. [50] WU Enming, SUN Yidong, HUANG Jianyu, et al. Multi UAV cluster control method based on virtual core in improved artificial potential field[J]. IEEE Access, 2020, 8: 131647–131661. doi: 10.1109/ACCESS.2020.3009972. [51] SELVAM P K, RAJA G, RAJAGOPAL V, et al. Collision-free path planning for UAVs using efficient artificial potential field algorithm[C]. 2021 IEEE 93rd Vehicular Technology Conference (VTC2021-Spring), Helsinki, Finland, 2021: 1–5. doi: 10.1109/VTC2021-Spring51267.2021.9448937. [52] PAN Zhenhua, ZHANG Chengxi, XIA Yuanqing, et al. An improved artificial potential field method for path planning and formation control of the multi-UAV systems[J]. IEEE Transactions on Circuits and Systems II:Express Briefs, 2022, 69(3): 1129–1133. doi: 10.1109/TCSII.2021.3112787. [53] SINGLA A, PADAKANDLA S, and BHATNAGAR S. Memory-based deep reinforcement learning for obstacle avoidance in UAV with limited environment knowledge[J]. IEEE Transactions on Intelligent Transportation Systems, 2021, 22(1): 107–118. doi: 10.1109/TITS.2019.2954952. [54] 申燕凯, 段海滨, 邓亦敏, 等. 仿鸽群被动式惯性应急避障的无人机集群飞行验证[J]. 中国科学: 信息科学, 2019, 49(10): 1343–1352. doi: 10.1360/N112018-00333.SHEN Yankai, DUAN Haibin, DENG Yimin, et al. Verification of a UAV swarm flight simulating the passive inertial emergency obstacle avoidance behavior of a pigeon flock[J]. Scientia Sinica Informationis, 2019, 49: 1343–1352. doi: 10.1360/N112018-00333. [55] 姜龙亭, 魏瑞轩, 张启瑞, 等. 基于群智机理的集群防碰撞控制[J]. 航空学报, 2020, 41(S2): 724294. doi: 10.7527/S1000-6893.2020.24294.JIANG Longting, WEI Ruixuan, ZHANG Qirui, et al. Anti-collision control of UAVs based on swarm intelligence mechanism[J]. Acta Aeronauticaet Astronautica Sinica, 2020, 41(S2): 724294. doi: 10.7527/S1000-6893.2020.24294. [56] WU Yu, GOU Jinzhan, HU Xinting, et al. A new consensus theory-based method for formation control and obstacle avoidance of UAVs[J]. Aerospace Science and Technology, 2020, 107: 106332. doi: 10.1016/j.ast.2020.106332. [57] 蔡星娟, 胡钊鸣, 张志霞, 等. 基于高维多目标优化的多无人机协同航迹规划[J]. 中国科学:信息科学, 2021, 51(6): 985–996. doi: 10.1360/SSI-2020-0218.CAI Xingjuan, HU Zhaoming, ZHANG Zhixia, et al. Multi-UAV coordinated path planning based on many-objective optimization[J]. Scientia Sinica Informationis, 2021, 51(6): 985–996. doi: 10.1360/SSI-2020-0218. [58] 左燕, 刘雪娇, 彭冬亮. 距离相关噪声AOA协同定位下无人机路径优化方法[J]. 电子与信息学报, 2021, 43(4): 1192–1198. doi: 10.11999/JEIT200078.ZUO Yan, LIU Xuejiao, and PENG Dongliang. UAV path planning for AOA-based source localization with distance-dependent noises[J]. Journal of Electronics & Information Technology, 2021, 43(4): 1192–1198. doi: 10.11999/JEIT200078. [59] LI Bo, YANG Zhipeng, CHEN Daqing, et al. Maneuvering target tracking of UAV based on MN-DDPG and transfer learning[J]. Defence Technology, 2021, 17(2): 457–466. doi: 10.1016/j.dt.2020.11.014. [60] 王祝, 徐广通, 龙腾. 基于定制内点法的多无人机协同轨迹规划[J/OL]. 自动化学报, 1–12. https://kns.cnki.net/kns8/Detail?sfield=fn&QueryID=0&CurRec=1&recid=&FileName=MOTO20201119000&DbName=CAPJLAST&DbCode=CAPJ&yx=Y&pr=&URLID=11.2109.TP.20201119.1423.001, 2020.WANG Zhu, XU Guangtong, and LONG Teng. Customized interior-point method for cooperative trajectory planning of unmanned aerial vehicles[J/OL]. Acta Automatica Sinica, 1–12. https://kns.cnki.net/kns8/Detail?sfield=fn&QueryID=0&CurRec=1&recid=&FileName=MOTO20201119000&DbName=CAPJLAST&DbCode=CAPJ&yx=Y&pr=&URLID=11.2109.TP.20201119.1423.001, 2020. [61] ZHANG Lin, ZHU Yian, and SHI Xianchen. A hierarchical decision-making method with a fuzzy ant colony algorithm for mission planning of multiple UAVs[J]. Information, 2020, 11(4): 226. doi: 10.3390/INFO11040226. [62] LI Zhenyu, ZHU Hai, and LUO Yazhong. An escape strategy in orbital pursuit-evasion games with incomplete information[J]. Science China Technological Sciences, 2021, 64(3): 559–570. doi: 10.1007/s11431-020-1662-0. [63] REN Zhi, ZHANG Dong, TANG Shuo, et al. Cooperative maneuver decision making for multi-UAV air combat based on incomplete information dynamic game[J]. Defence Technology, 2023, 27: 308–317. doi: 10.1016/j.dt.2022.10.008. [64] ZHANG Jiandong, YANG Qiming, SHI Guoqing, et al. UAV cooperative air combat maneuver decision based on multi-agent reinforcement learning[J]. Journal of Systems Engineering and Electronics, 2021, 32(6): 1421–1438. doi: 10.23919/JSEE.2021.000121. [65] LI Shaowei, JIA Yuhong, YANG Fan, et al. Collaborative decision-making method for multi-UAV based on multiagent reinforcement learning[J]. IEEE Access, 2022, 10: 91385–91396. doi: 10.1109/ACCESS.2022.3199070. [66] WANG Zhenhua, GUO Yan, LI Ning, et al. Autonomous collaborative combat strategy of unmanned system group in continuous dynamic environment based on PD-MADDPG[J]. Computer Communications, 2023, 200: 182–204. doi: 10.1016/j.comcom.2023.01.009. [67] YU Yueping, LIU Jichuan, and WEI Chen. Hawk and pigeon’s intelligence for UAV swarm dynamic combat game via competitive learning pigeon-inspired optimization[J]. Science China Technological Sciences, 2022, 65(5): 1072–1086. doi: 10.1007/s11431-021-1951-9. [68] DENG Hanqiang, HUANG Jian, LIU Quan, et al. A distributed collaborative allocation method of reconnaissance and strike tasks for heterogeneous UAVs[J]. Drones, 2023, 7(2): 138. doi: 10.3390/drones7020138. [69] MEMON S A and ULLAH I. Detection and tracking of the trajectories of dynamic UAVs in restricted and cluttered environment[J]. Expert Systems with Applications, 2021, 183: 115309. doi: 10.1016/j.eswa.2021.115309. [70] CYBULSKI P and ZIELIŃSKI Z. UAV swarms behavior modeling using tracking bigraphical reactive systems[J]. Sensors, 2021, 21(2): 622. doi: 10.3390/s21020622. [71] YU Yao, WANG Hongli, LIU Shumei, et al. Distributed multi-agent target tracking: A Nash-combined adaptive differential evolution method for UAV systems[J]. IEEE Transactions on Vehicular Technology, 2021, 70(8): 8122–8133. doi: 10.1109/TVT.2021.3091575. [72] ZHOU Wenhong, LI Jie, LIU Zhihong, et al. Improving multi-target cooperative tracking guidance for UAV swarms using multi-agent reinforcement learning[J]. Chinese Journal of Aeronautics, 2022, 35(7): 100–112. doi: 10.1016/j.cja.2021.09.008. [73] ZHOU Wenhong, LIU Zhihong, LI Jie, et al. Multi-target tracking for unmanned aerial vehicle swarms using deep reinforcement learning[J]. Neurocomputing, 2021, 466: 285–297. doi: 10.1016/j.neucom.2021.09.044. [74] HUA Xia, WANG Xinqing, RUI Ting, et al. Light-weight UAV object tracking network based on strategy gradient and attention mechanism[J]. Knowledge-Based Systems, 2021, 224: 107071. doi: 10.1016/j.knosys.2021.107071. [75] 张岱峰, 段海滨, 范彦铭. 仿狼群狩猎空间交互机制的无人机集群合围控制[J]. 中国科学:技术科学, 2022, 52(10): 1555–1570. doi: 10.1360/SST-2021-0042.ZHANG Daifeng, DUAN Haibin, and FAN Yanming. UAV swarm containment control inspired by spatial interaction mechanism of wolf-pack foraging[J]. Scientia Sinica Technologica, 2022, 52(10): 1555–1570. doi: 10.1360/SST-2021-0042. [76] MA Yingying, WANG Guoqiang, HU Xiaoxuan, et al. Cooperative occupancy decision making of multi-UAV in beyond-visual-range air combat: A game theory approach[J]. IEEE Access, 2020, 8: 11624–11634. doi: 10.1109/ACCESS.2019.2933022. [77] MURAT OZBEK M and KOYUNCU E. Reinforcement learning based air combat maneuver generation[J]. arXiv: 2201.05528, 2022. [78] LI Yue, HAN Wei, and WANG Yongqing. Deep reinforcement learning with application to air confrontation intelligent decision-making of manned/unmanned aerial vehicle cooperative system[J]. IEEE Access, 2020, 8: 67887–67898. doi: 10.1109/ACCESS.2020.2985576. [79] 过劲劲, 齐俊桐, 王明明, 等. 未知区域中四旋翼无人机集群协同搜索与围捕算法[J]. 北京航空航天大学学报, 2023, 49(8): 2001–2010. doi: 10.13700/j.bh.1001-5965.2021.0606.GUO Jinjin, QI Juntong, WANG Mingming, et al. A cooperative search and encirclement algorithm for quadrotors in unknown areas[J]. Journal of Beijing University of Aeronautics and Astronautics, 2023, 49(8): 2001–2010. doi: 10.13700/j.bh.1001-5965.2021.0606. [80] 牛轶峰, 沈林成, 李杰, 等. 无人-有人机协同控制关键问题[J]. 中国科学:信息科学, 2019, 49(5): 538–554. doi: 10.1360/N112019-00008.NIU Yifeng, SHEN Lincheng, LI Jie, et al. Key scientific problems in cooperation control of unmanned-manned aircraft systems[J]. Scientia Sinica Informationis, 2019, 49(5): 538–554. doi: 10.1360/N112019-00008. [81] KHAWAJA W, SEMKIN V, RATYAL N I, et al. Threats from and countermeasures for unmanned aerial and underwater vehicles[J]. Sensors, 2022, 22(10): 3896. doi: 10.3390/s22103896. [82] YANG Xuekuan, WANG Wei, and HUANG Ping. Distributed optimal consensus with obstacle avoidance algorithm of mixed-order UAVs–USVs–UUVs systems[J]. ISA Transactions, 2020, 107: 270–286. doi: 10.1016/j.isatra.2020.07.028. [83] XUE Kai and WU Tingyi. Distributed consensus of USVs under heterogeneous UAV-USV multi-agent systems cooperative control scheme[J]. Journal of Marine Science and Engineering, 2021, 9(11): 1314. doi: 10.3390/jmse 9111314. [84] WEI Wei, WANG Jingjing, FANG Zhengru, et al. 3U: Joint design of UAV-USV-UUV networks for cooperative target hunting[J]. IEEE Transactions on Vehicular Technology, 2023, 72(3): 4085–4090. doi: 10.1109/TVT.2022.3220856. [85] XU Qingzheng, WANG Na, WANG Lei, et al. Multi-task optimization and multi-task evolutionary computation in the past five years: A brief review[J]. Mathematics, 2021, 9(8): 864. doi: 10.3390/math9080864. [86] OSABA E, DEL SER J, MARTINEZ A D, et al. Evolutionary multitask optimization: A methodological overview, challenges, and future research directions[J]. Cognitive Computation, 2022, 14(3): 927–954. doi: 10.1007/s12559-022-10012-8. [87] WONG Annie, BÄCK T, KONONOVA A V, et al. Deep multiagent reinforcement learning: Challenges and directions[J]. Artificial Intelligence Review, 2023, 56(6): 5023–5056. doi: 10.1007/s10462-022-10299-x. [88] OROOJLOOY A and HAJINEZHAD D. A review of cooperative multi-agent deep reinforcement learning[J]. Applied Intelligence, 2023, 53(11): 13677–13722. doi: 10.1007/s10489-022-04105-y. [89] CANESE L, CARDARILLI G C, DI NUNZIO L, et al. Multi-agent reinforcement learning: A review of challenges and applications[J]. Applied Sciences, 2021, 11(11): 4948. doi: 10.3390/app11114948. 期刊类型引用(0)
其他类型引用(1)
-