A Review of Game Theory Analysis in Cognitive Radar Anti-jamming
-
摘要: 雷达对抗的核心研究内容主要是干扰策略与抗干扰策略之间的对抗博弈,其作为电子战研究领域的热点一直备受学者们关注。该文综述了学者们利用合作与非合作博弈方法来分析雷达在进行目标探测和干扰抑制时所使用的策略,主要通过不同体制的雷达利用认知技术感知和学习外界复杂的电磁环境,合理地分配发射功率、控制编码序列、设计波形、研究检测和跟踪方法以及分配雷达通信资源等。这样雷达既节约发射所消耗的功率,又可以自适应地搜索和跟踪目标而不被敌方所发现,从而使雷达在复杂多变的现代战场环境中达到自身最优的性能。最后,对认知雷达抗干扰中的博弈论分析研究进行总结和展望,并指出了一些博弈论在认知雷达抗干扰策略应用中所面临的潜在问题和挑战。Abstract: The core research contents of radar countermeasures are the games of countermeasures between jamming strategies and anti-jamming strategies. As a hotspot in the field of electronic warfare, radar countermeasures have been paid much attention by scholars. This paper summarizes that the scholars employ the cooperative and non-cooperative game methods to analyze the radar against jamming while probing targets. Different radar systems make use of cognitive techniques perceive and learn the complex electromagnetic environment, and reasonably allocate transmitting power, control coding sequence, design waveform, investigate detection and tracking methods and allocate resources of radar communication etc. In this way, radar can not only reduce power consumption, but also search and track the target without being detected by the enemy. Thus, radar can achieve its optimal performance in the complex and changeable modern battlefield environment. Finally, game theory in cognitive radar anti-jamming is summarized and prospected, and it also points out some potential problems and challenges of game theory in cognitive radar anti-jamming.
-
Key words:
- Cognitive radar /
- Radar countermeasures /
- Game theory /
- Resource allocation /
- Nash equilibrium
-
1. 引言
认知雷达是由国际电子电气工程协会会士、加拿大皇家学会会士Haykin教授[1]于2006年正式提出的,并明确指出认知能力是下一代雷达系统的关键技术[2,3]。认知雷达是对雷达系统赋予了感知外部环境的能力,再利用人工智能技术不断学习和推理外部环境的变化规律,并根据环境的动态变化自适应地调整自身的策略(发射功率、调制方式、编码方式、波形优化设计、检测方式等),从而使雷达在复杂的对抗环境中降低被干扰和破坏的可能性。雷达对抗是一切利用专业的电子系统设备对敌方的雷达和武器系统进行侦查、干扰、破坏和摧毁的电子对抗策略和技术的统称,雷达作为现代战争中的眼睛和耳朵,一旦被干扰或是摧毁,则被干扰一方将丧失获取信息的能力,致使各级指挥平台、作战平台和人员难以进行信息传递分析,变成了站着的“瞎子”和“聋子”,严重丧失了作战能力[4]。而雷达抗干扰技术作为雷达对抗中雷达一方的主要策略方案,再将认知功能赋予雷达以帮助其能够自适应地学习和分析外部的复杂干扰环境,提升雷达的生存和作战能力:例如雷达通过合理地分配发射功率和接收数据率可以有效地提升雷达的干扰抑制能力;通过自适应、短时间地调整发射波形来满足所需的性能,从而大大降低雷达被探测和攻击的可能性[2];合理地利用频率分集和捷变技术可以有效地避开敌方的干扰和捕获雷达发射的信号等。
博弈论(game theory)在早期被译作游戏理论或者对策论。为了对该理论赋予学术的意味,科技文献中将其译为“博弈论”。博弈论分析方法主要研究人们在进行不同的社会活动时所做出的不同应对策略行为。基于博弈双方的理性策略行为,双方都是在一定的约束条件下来满足自身的最大化收益。因此,博弈双方会产生合作与冲突的状况,同时在多方博弈的情况中,又存在合作中有对抗和对抗中有合作的现象[5,6]。在对抗与合作中,博弈双方常常会出现信息不对称的状况,并会导致信息匮乏的一方长期处于劣势的地位。为了扭转这种劣势的状况,弱势一方需要不断地提升自身实力,从而可以在博弈阶段获得更多的信息来满足自身的收益,这种博弈类型正如当今国家之间军事对抗的现状。对于军事强国来说,其拥有的强大军事装备系统不仅能覆盖本国的防区,而且还能辐射到世界其他国家的防区。因此,其会利用卫星、通信基站、雷达和声呐等搜集大量的数据信息资源,将这些数据储备在数据库中可以作为知识辅助(Knowledge-Aided, KA)认知系统的先验学习信息。而认知雷达作为近十几年提出的一种新的雷达系统,其主要的特点是基于目标和环境的先验信息,通过对自身系统的各种优化和控制来提高雷达对目标的探测能力[7-13]。为了进一步提高认知雷达的性能,将博弈论应用于认知雷达抗干扰中有望提升雷达系统的潜在性能,如:(1) 提高传统雷达对目标和环境数据信息的利用率;(2) 利用博弈论来分析和优化雷达系统资源与对抗策略以满足探测雷达所要实现的目的;(3) 基于不同的博弈效用函数来优化雷达发射波形和接收响应,提升雷达系统在复杂场景下的目标检测能力;(4) 通过对不同干扰或杂波类型的学习,利用组合博弈论策略来应对可能出现的复杂干扰场景;(5) 将动态博弈论应用于动目标跟踪分析中,能够有效地提升雷达跟踪目标的动态变化的准确性;(6) 应用博弈论策略分析可以提升雷达的抗干扰能力。
本文的主要结构安排如下:第2节对认知雷达进行了概述;第3节叙述博弈论基础知识;第4节介绍了博弈论在认知雷达抗干扰中的理论研究工作;第5节分析了博弈论在认知雷达抗干扰研究中的潜在研究问题;第6节对全文作了总结与展望。
2. 认知雷达研究概述
认知雷达是模拟蝙蝠的回声定位系统而设计的,主要通过先验知识和感知外部复杂的环境来自适应地分配雷达接收发射功率、波束扫描方式、距离单元、编码序列、频谱资源和调制方式等,类似于人脑一样合理、可靠、鲁棒地搜索和跟踪目标,大大地提升现有雷达性能[9]。认知雷达的概念主要有3个基本要点[1]:
(1) 智能信号处理,通过雷达与周围环境不断的交互学习获得感知和认识外部环境的能力;
(2) 发射机从接收机获取反馈信息的过程是将发射机和接收机形成一个闭环系统,接收机接收到雷达的回波信号,利用人工智能处理得到目标和干扰的各项参数信息,再将信息反馈给发射机,发射机通过学习和推理自适应调整发射信号的波形、调制和频率等,提升雷达对目标的捕获能力;
(3) 雷达回波数据在存储后,再利用人工智能技术(如Bayes方法)对雷达回波数据进行学习和推理,提升雷达认知环境的能力。
Haykin教授在文献[1]中给出了认知雷达的闭环系统图,如图1所示。可以看到,认知雷达系统发射机向周围环境辐射信号,信号辐射到周围环境产生回波到达接收机,接收机通过先验知识和环境分析器对回波进行分析处理(检测、识别、跟踪、捕获等),然后将分析处理结果反馈给发射机,发射机对反馈信息进行分析并适当调整发射信号的各项参数。
另外,Guerci教授等人[10,11]提出了一种基于发射的自适应环境感知的认知雷达框架,如图2所示。该系统框架主要是由自适应发射和接收机、环境动态数据库(Environmental Dynamic DataBase, EDDB)、KA协同处理器以及智能化雷达任务调度器所构成的闭环系统。对比传统雷达只有自适应接收机或自适应发射机的情况,认知雷达系统不仅具有接收自适应,而且还具备调整发射机的多种自由度(极化、空间、慢时间调制等)的功能。在认知雷达持续地进行收发工作时,其搜集到的感兴趣目标和环境的动态数据不断地存储到EDDB中。然后利用KA协同知识辅助器不断地对数据进行智能化的处理分析,进而使雷达系统获得人类专家的经验和判断能力[11]。
上述两种认知雷达系统虽有部分不同,但主要思路是相同的。两种系统都是闭环系统,需要不断地获得外界环境数据信息来满足自身的学习需求。近期,在认知雷达系统研究中,认知雷达主要研究的问题包括波形设计[14-16]、目标检测和跟踪[17,18]、干扰和杂波抑制[19-21]以及资源管理[22-24]等。针对认知波形设计问题,文献[16]考虑了一种基于模糊函数的非凸恒模的雷达波形设计问题,并提出了一种映射梯度下降法来优化该波形设计极小化问题,最后通过模拟实验验证了该方法的性能明显优于其他的基准方法。关于认知雷达目标检测与跟踪问题,文献[17]提出了一种用于目标检测与跟踪的广义认知雷达框架,将该框架应用于求解一般跟踪问题并获得了比标准静态系统更好的性能优势。另外,对于杂波和干扰的影响,文献[21]设计了一种自适应正交频分复用波形的认知雷达系统,并将该系统应用于跟踪一种存在强非平稳干扰的随机扩展目标。根据所构造的模型系统建立了一种随机目标脉冲响应和接收回波之间的极大化互信息函数求解新方法,并利用数值实验验证了该方法较非自适应波形方法有更好的性能。在资源分配方面,文献[23]为了提高多目标逆合成孔径雷达的工作效率而提出了一种联合成像时间和孔径资源分配的策略,该策略相对于传统的算法有更好的多目标成像性能。这些研究内容虽然与传统雷达是相同的,但认知雷达需要从外界获得数据并进行感知学习,这样进一步提升了传统雷达对外部数据的利用效率。针对以上认知雷达研究中所面临的优化决策问题,博弈论作为一种有效的策略方法论可以有效地处理这些问题。接下来,对博弈基础理论做进一步的介绍。
3. 博弈基础理论
博弈论是利用数学模型分析和解决现实世界中决策者之间利益冲突的理论,是数学的一个分支。博弈论的策略式主要包含3个要素[5,6]:
(1)博弈的参与者或决策者集合:
i∈I ,I= {1,2,···,n} ;(2)博弈参与者的策略空间:
Si ,i=1,2,···,n ;(3)博弈参与者的效用函数:
ui(s1,···,si,···,sI)= ui(si,s−i) ,si∈Si ,s−i∈S−i=S1×···×Si−1× Si+1×···×SI 表示除去i 以外的其他所有决策,ui:S1×S2×···×SI↦R ,i=1,2,···,n 。定义博弈的策略表达式为
G={I;{Si}i∈I; {ui}i∈I} ,而参与者i 的严格占优策略s∗i 满足关系ui(s∗i,s−i)>ui(si,s−i) ,其中si∈Si ,si≠s∗i 。博弈论分类及要点如图3所示。3.1 非合作博弈
非合作博弈主要包括完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。
完全信息静态博弈:博弈的每一个参与者都完全知道其他参与者的策略空间和效用函数等信息的情况下,参与者同时选择各自的行动策略,若行动有先后顺序,后行动者不了解先行动者所采取的策略。
完全信息动态博弈:在博弈的所有参与者选择的行动策略和效用函数都被其他参与者了解的情况下,参与者的行动策略有先后顺序,后行动者可以观察到先行动者的策略。
不完全信息静态博弈:在信息不对称的情况下,即在至少有一个参与者不完全了解其他某些参与者的行动策略和效用函数的情况下进行的静态博弈。
不完全信息动态博弈:在信息不对称的情况下,参与者所进行的动态博弈。
纳什均衡:博弈所有参与者的一种最优策略组合状态,在此状态下,没有参与者能够单方面行动而增加自身收益。
贝叶斯均衡:不完全信息状态下的静态博弈纳什均衡(Nash Equilibrium, NE)。
两人零和博弈:参与者一方的收益是另一方的损失。
Stackelberg博弈:该博弈是一种完全信息动态博弈,跟随者根据主导者的策略做出自己的反应,而主导者事先知道跟随者一定会对自己的策略做出反应,因此主导者在考虑策略时会把跟随者反应考虑进去。
贝叶斯博弈:不完全信息博弈,即博弈参与者对于其他参与者的效用函数不一定完全了解。
信号博弈:一类利用信号传递信息特征的不完全信息动态博弈,由信号发送者和接收者组成的不完全信息动态博弈[25]。
重复博弈:同样形式的博弈重复进行多次实验的过程,包括有限次重复博弈和无限次重复博弈。
序贯博弈:参与者选择对应策略有先后顺序的一种动态博弈。
潜博弈:博弈
G={I;{Si}i∈I;{ui}i∈I} 为潜博弈,则存在一个函数P:S↦R 对所有i∈I ,∀si∈S 和s′i∈S ,满足公式P(si,s−i)−P(s′i,s−i)=ui(si,s−i)−ui(s′i,s−i) (1) S-modular博弈:S-modular博弈包括超模(supermodular)博弈和亚模(submodular)博弈[6]:
(1)令
Si ,i∈I 都是Rm 的子格,若ui 在(si,s−i) 上满足增变差关系,则ui 是超模的,并具有等价关系∂2ui∂si∂sj≥0,∀j≠i∈I (2) (2)令
Si ,i∈I 都是Rm 的子格,若ui 在(si,s−i) 上满足减变差关系,则ui 是亚模的,并具有等价关系∂2ui∂si∂sj≤0,∀j≠i∈I (3) 最优反应函数:在博弈中,参与者使自身获得最优收益的函数。
3.2 合作博弈
合作博弈是指博弈双方都有收益增加,或至少有一方的收益增加,而不损失另一方的收益,主要包括联盟博弈和讨价还价模型。
联盟博弈:设
∀S⊆I 是I 的一个子集作为一个联盟,联盟S 的总收益为一个特征函数v(S) ,且v 满足v(∅)=0 ,则联盟博弈的表达式为(N,v) 。讨价还价模型:该博弈是一种完全信息动态博弈,即博弈双方轮流出价,包括两种出价情况,一种是3阶段有限博弈,另一种是任意阶段无限期博弈。
核:核是联盟博弈的解,类似于非合作博弈的NE。
Shapley值:合作博弈的一种数值解。
4. 认知雷达抗干扰中博弈论分析研究
雷达和雷达、雷达和目标、雷达和干扰之间都存在着一种对抗博弈的关系,如图4所示。根据这种博弈关系,学者们将博弈论分析引入到认知雷达研究领域。认知雷达抗干扰中博弈论分析研究主要包括功率分配博弈、目标干扰博弈、编码方式博弈、波形设计博弈、目标检测和跟踪博弈和雷达通信一体化等[26-81],如图4所示。
4.1 认知雷达抗干扰中的功率分配博弈
在认知雷达抗干扰功率分配博弈中,分为非合作[34-41]和合作[42-46]博弈功率分配方式。
(1)非合作博弈功率分配。文献[39]对多基地分布式多输入多输出(Multiple-Input-Multiple-Output, MIMO)雷达组网的功率分配进行了NE分析,提出了一种基于非合作博弈的功率分配方法。在多杂波作为参与者的环境中,博弈的参与者的期望目标是建立一种信干噪比(Signal-to-Interference plus Noise Ratio, SINR)约束的极小化发射功率优化模型,并利用凸优化和非合作博弈理论来求解该功率分配优化问题。接下来,依据雷达系统需求模型建立了功率分配优化模型
minuk(pk,p−k)=M∑i=1pkis.t.SINRki≥γ∗ki∀i=1,2,···,Mpk≥0} (4) 其中,
uk(pk,p−k) 表示发射到第k 个杂波总功率,定义为博弈的效用函数;pk=[pk1,pk2,···,pkM]T ;p−k 表示除了第k 个参与者剩下的其它全部参与者使用的功率分配策略;SINRki 表示第i 个雷达中相对于第k 个杂波的信干噪比;γ∗ki 为对应SINRki 的阈值;pki 表示第i 个雷达发射到第k 个杂波的功率,i=1,2,···,M ,k=1,2,···,K 。对式(4)进行推导变形得到了第
k 个杂波的功率极小化问题的矩阵形式,并利用Lagrange乘子法和KKT(Karush-Kuhn-Tucker)条件建立了广义纳什均衡(Generalized Nash Equilibrium, GNE)分析模型。并根据标准函数的定义证明了第k 个杂波的最佳反应函数满足标准函数的3条准则,因此,博弈的GNE存在且唯一。(2) 合作博弈功率分配。文献[42,43]都是针对分布式MIMO雷达的目标跟踪问题提出了一种合作博弈功率分配算法,该算法是基于Bayesian-Fisher信息矩阵(Bayesian-Fisher Information Matrix, B-FIM)的行列式最大化实现的。而B-FIM是基于信号传播路径、目标反射率、传输功率和目标先验信息的信号模型得到的,利用迭代方法来求解合作博弈的Shapley值,并将该迭代方法与序贯Bayes估计器相结合而得到了更准确的目标定位合作博弈算法。最后,通过数值实验验证了该合作博弈最优功率分配算法的功率分配效能明显优于平均功率分配和随机功率分配算法。
4.2 认知雷达抗干扰中的对抗干扰机博弈
雷达与干扰机之间存在着两人零和博弈(Two Persons Zero Sum Games, TPZSG),即两者都希望自身的收益最大化,而使对方的收益最小化。文献[52,53]将统计MIMO雷达与干扰机之间的互信息函数作为博弈分析的效用函数构造了一种功率分配优化模型,其中雷达和干扰机是博弈的两个参与者。首先,定义雷达接收信号模型为
Y=SG+J+W (5) 其中,
G 为接收机的路径增益矩阵;S 为发射波形矩阵;J 为干扰信号矩阵;W 为接收机噪声矩阵。G ,J 和W 之间是相互独立的,W 和J 都分别服从高斯独立同分布CN(0,RW) 和CN(0,RJ) ,协方差矩阵RW 和RJ 可分别进行特征分解RW=UWΛWUHW ,RJ=UJΛJUHJ 和SSH=USΛSUHS 。如果在特征空间选择构造一个均衡,则存在US=UWP1 和UJ=UWP2 ,P1 和P2 为任意置换矩阵,ΛW ,ΛJ 和ΛS 分别表示对应协方差矩阵进行特征分解的特征值矩阵。根据互信息(Mutual Information, MI)准则,构造了一种干扰环境下接收信号矩阵
Y 与路径增益矩阵G 之间的互信息函数I(Y;G|S)=h(Y|S)−h(J+W) (6) 其中,
h(Y|S) 表示条件微分熵。通过推导化简MI,并将MI定义为雷达和干扰效用函数u≜I(Y;G|S) (7) 当博弈信息不对称时,雷达和干扰机都希望自身的收益最大化,从而构造了单边博弈的功率约束优化模型。雷达的期望是效用函数
u 最大化,而干扰机的期望是效用函数u 最小化,则雷达单边约束优化模型maxus.t.Tr(SSH)≤pTots} (8) 而干扰机的单边约束优化模型
minus.t.Tr(ΛJ)≤pTotJ} (9) 其中,
pTots 和pTotJ 分别为雷达和干扰机的总功率。在单边博弈的基础上可建立分层Stackelberg博弈模型,而Stackelberg博弈是一种主从博弈模型。因此,令雷达和干扰分别作为博弈的主导者和跟随者,建立了最大最小化和最小最大化效用函数的功率约束优化模型。若效用函数
uminmax=umaxmin ,则博弈收敛到相同的点,则该点即为Stackelberg博弈均衡解。当博弈信息对称时,即博弈双方互相知道对方的策略信息,博弈的双方之间构成一个TPZSG,其效用函数对双方的策略分别最大最小化
uminmax 和最小最大化umaxmin ,若有uminmax=umaxmin ,则得到博弈的鞍点,鞍点即为TPZSG的纯策略NE解。4.3 认知雷达抗干扰中的编码方式博弈
文献[59]将非合作博弈论方法应用到雷达网络编码设计中,基于每个有源雷达最大化SINR的目的提出了不同的编码策略。首先,构造了一个非合作博弈的雷达网络,雷达网络中的每个雷达都发射相同子脉冲数的编码脉冲。然后,通过所建立的系统模型得到SINR公式,再利用极小化SINR公式的分母(干扰加噪声功率)使得SINR最大化。接下来,将该分母作为潜博弈的潜函数,对潜函数变形去掉不依赖当前雷达调制序列的编码函数得到了编码传感器的效用函数。基于该效用函数的不同目标,提出了3种不同滤波器准则下的编码更新策略:(1) 匹配滤波编码更新程序;(2) 最小化积分副瓣电平(Integrated Sidelobe Level, ISL)编码更新程序;(3) 最小化主-副瓣比电平(Peak-to-Sidelobe Level, PSL)编码更新程序。最后,根据理论分析证明了这3种不同的博弈编码策略都存在NE,数值结果也验证了所提出的博弈编码策略都可以改善雷达系统性能。
4.4 认知雷达抗干扰中的波形设计博弈
2016年Panoui等人[76]在文献[59]的研究工作的基础上,在IEEE TAES上发表了利用博弈论中潜博弈方法分析了多基地MIMO雷达的波形设计问题。博弈的目的是通过最大化信干杂比(Signal-to-Disturbance Ratio, SDR)来选择最合适波形,将雷达网络中杂波之间的相互作用模拟为一种潜博弈关系,杂波作为博弈的参与者。同样地,类似于文献[59]中将SDR的分母杂波功率最小化来最大化SDR,并将杂波功率定义为一个效用函数,再经过变形将效用函数转化为潜博弈的潜函数形式。根据潜博弈的离散凹性和较大中点性证明了博弈收敛到唯一的NE解,且该NE解的唯一性可以使雷达根据其他杂波的行动策略来制定自身的最优发射波形集,最后数值实验验证了该博弈算法相对于随机波形选择算法有更好的性能[76]。
同年,Han等人[75]也在IEEE TAES介绍了基于博弈论的集中式MIMO雷达跳频波形联合设计优化算法。在博弈论的框架下,跳频波形联合设计是将波形幅值和跳频编码同时考虑的,利用MIMO雷达跳频波形的稀疏恢复和模糊函数所导出的两个目标函数作为博弈两个参与者,并构造了MIMO雷达跳频波形的稀疏恢复和模糊函数联合模型。在幅值设计阶段,作者提出了两种不同的设计策略,一种是独立约束的幅值设计策略,另一种是融合所有发射机的幅值设计策略,并分别将这两种策略应用于非合作方案和合作方案当中;而在接下来的最大离散编码阶段,这两种算法都收敛到全局最优的
ε -逼近NE解,最后通过数值实验验证了该联合设计方案能够有效地提升两者单独设计时的性能[75]。4.5 认知雷达抗干扰中的目标检测博弈
文献[32]将博弈论分析应用于信号检测中,分析了多种博弈方案模型。首先,定义在Neyman-Pearson准则下的检验统计量
λ 为λ={μ,H0信号不存在μ(1+ˉS),H1信号存在 (10) Bayes风险函数作为基本效用函数
u=1∑i=01∑j=0cijPjP(Hi|Hj) (11) 其中,在雷达正确决策时,即
i=j ,代价项cij=1 ,雷达决策错误时对雷达进行惩罚,即在i≠j ,代价项cij=−1 。先验概率Pj 假定为0.5,从而式(11)可以简化为u=c00P0P(H0|H0)+c11P1P(H1|H1)+c10P0P(H1|H0)+c01P1P(H0|H1)=12(P(H0|H0)+P(H1|H1)−P(H1|H0)−P(H0|H1))=12((1−P(H1|H0))+P(H1|H1)−P(H1|H0)−(1−P(H1|H1)))=P(H1|H1)−P(H1|H0)=PD−PFA (12) 其中,
PD 为检测概率;PFA 为虚警概率。(1)非距离选通噪声-单元平均恒虚警检测(Ungated Range Noise Cell-Averaging Constant False Alarm Rate, URN-CACFAR)博弈。利用式(12)导出URN-CACFAR博弈的效用函数
u(ˉJ,α)=(PD(ˉJ,α)h0(κ−ˉJ)−h1(ˉJ−κ))−PFA(α) (13) 其中,
ˉJ 是干扰机功率策略;α 是雷达门限参数策略;κ 是电子保护门限(ˉJ 的上确界);h0 和h1 是Heaviside阶跃函数对干扰机强加的惩罚项。式(13)效用函数对
ˉJ 和α 求2阶混合偏导数,有∂2u(ˉJ,α)∂ˉJ∂α≤0 (14) 根据Topkis定理知,该博弈满足Submodular博弈的等价关系,得到URN-CACFAR博弈为Submodular博弈,存在纯策略的NE点
(ˉJ∗,α∗) 。(2) 距离选通噪声-单元平均恒虚警检测(Range-Gated Noise Cell-Averaging Constant False Alarm Rate, RGN-CACFAR)博弈。博弈的效用函数为
u(ˉJ,R,M)=(PD(ˉJ,R,M)h0(κ−ˉJ)−h1(ˉJ−κ))−PFA(ˉJ,R,M) (15) 博弈中雷达的策略是改变雷达的参考距离单元数
M ,而干扰机的策略是改变干扰功率ˉJ 。博弈存在4种类型:(a) 固定干扰单元个数R,测试单元中无干扰;(b) 固定干扰单元个数R,测试单元中有干扰;(c) 自适应干扰单元个数R,测试单元中无干扰;(d) 自适应干扰单元个数R,测试单元中有干扰。通过分析这4种博弈都存在NE。(3) 假目标-单元平均恒虚警检测(False Targets Cell-Averaging Constant False Alarm Rate Games, FT-CACFAR)博弈。博弈是假目标干扰机和CACFAR处理器之间的序贯博弈,其效用函数定义为
u(ˉJϕ,F,M)=(PD(ˉJϕ,F,M)h0(κ−ˉJ)−h1(ˉJ−κ))−PFA(ˉJϕ,F,M) (16) 其中
ˉJϕ 是干扰功率策略,小于式(13)和式(15)中的干扰功率ˉJ ;F 为强加干扰机限制。通过作图分析,该序贯博弈的子博弈具有子博弈完美NE解(ˉJ∗ϕ,F∗,M∗) 。(4) 随机雷达-干扰机博弈(stochastic radar-jammer games)。前面几种博弈模型都为无约束雷达和干扰机博弈模型,这些闭式基本模型都不能充分描述在非均匀杂波、RGN边缘检测和假目标情况下的随机效应。而随机效应是对参与者策略的可靠现实约束,只能在显式模型中利用Monte Carlo模拟,并且模拟分类和计算CFAR检测需按照下面这几种策略来实现,如感兴趣目标
ΦTI ,虚警ΦFA ,距离门限噪声ΦRN 和假目标ΦFT 。在假定一个认知雷达能准确地“知道”每一次检测都属于哪一种策略类别情况下,根据雷达的增益和衰减定义随机博弈的效用函数u=ΦTI+min(ΦRN,1)−ΦFT−ΦFA (17) 上述效用函数中干扰检测的最大值通过辅助缩放截断为1,并且该公式不考虑其他外部实际目标的检测,即该检测事件只是雷达-干扰机之间相互独立行动。
(5) 随机RGN干扰博弈(stochastic RGN jamming games)。随机RGN干扰博弈包括4种博弈类型:(a) 固定R随机RGN-CACFAR博弈;(b) 自适应R随机RGN-CACFAR博弈;(c) 固定R随机RGN-有序统计恒虚警检测(Order Statistic Constant False Alarm Rate, OSCFAR)博弈;(d) 自适应R随机RGN-OSCFAR博弈。
在随机RGN-CACFAR博弈中,如果最优反应函数的任一或两个都有波动,就不能从相互作用的最优反应函数中推导出纯策略NE的存在性。博弈效用函数若有微小的随机扰动,则最优反应函数之间的相互作用是不稳定的。若博弈的相互作用不存在或效用函数的波动是普遍的,且参与者行动被随机的分配到整个策略集,则博弈将只能通过混合策略来解决,从而产生混合策略NE。对于固定R的随机RGN-CACFAR博弈和自适应R随机RGN-CACFAR博弈都有各自的优势,自适应R比固定R需要更少的平均功率,而固定R检测所需时间更少。
文献[32]的随机RGN-OSCFAR博弈引入了Stirling逼近函数,并重新定义了检测概率和虚警概率的表达式。在固定R随机RGN-OSCFAR博弈中,增加参考窗M的大小可以改善雷达的性能,降低干扰机的不利影响。而自适应R随机RGN-OSCFAR博弈相比于自适应R随机RGN-CACFAR博弈在有外部目标、干扰检测和非均匀杂波情况下表现的更符合实际。
(6) 随机假目标干扰博弈(stochastic FT jamming games)。随机FT博弈分析了假目标的检测和感兴趣目标检测的掩蔽效应。随机FT博弈包含两种博弈类型 (a) 随机FT-CACFAR博弈;(b) 随机FT-OSCFAR博弈。随机FT-CACFAR博弈是干扰机引入另一个假目标节点的序贯博弈,但不存在子博弈完美NE策略收益,这是因为每个子博弈在距离单元的极小点
M=16,126,251,376 中都有对应的局部最优解,随着M的增加每个子博弈将依次增大整体效用函数。因此,雷达将从局部最优策略倾向于距离单元M≈376 时的全局最优策略,说明该博弈不是一个子博弈完美NE收益。相交的最优反应函数表明随机FT-CACFAR博弈在区域(ˉJ,F,M)∈ ([30,42],4,375+) 有NE策略。在分析随机FT-OSCFAR博弈时,只分析不存在任何闭式的情况下与随机FT-CACFAR博弈作对比。当参考距离单元
M<125 时,随机FT-OSCFAR与随机FT-CACFAR有相似的仿真结果,但在非均匀杂波中OSCFAR比CACFAR有更好的性能。由于CACFAR有较低的CFAR损失,则其效用函数最大化会稍高一些。当125<M<375 时,若在较高假目标密度区域之间没有过渡,则OSCFAR与CACFAR的效用有明显不同,这是因为OSCFAR检测器对多目标干扰有更高的鲁棒性。当M>375 时,效用函数的增加会受到范围区域的限制影响。干扰机的最优反应函数在干信比为30到42dB之间持续波动;而雷达随着干信比的增加,其最优反应函数在M∈[375,MMAX] 之间来回波动并最终收敛到MMAX 。最后,根据最优反应函数相交点的分析推测,在区域(ˉJ,F,M)∈([30,42],4, [480,MMAX]) 存在随机FT-OSCFAR博弈的NE策略。另外,文献[60]利用博弈论方法研究了分布式MIMO雷达目标检测的极化策略问题。首先,根据不同目标像的检测性能建立了一种影响发射策略的博弈论框架。博弈中有两个参与者,参与者1(敌对方)是N个可能的目标中的一个,参与者2是Q个极化波形的设计者。双方的策略集分别表示为
S= {s1,s2,···,sN} 和R={r1,r2,···,rQ} 。根据文献[60]对博弈策略的假设,双方都是满足纯策略的博弈,即双方都只采用一种策略来应对对方的攻击。接下来,双方的效用函数分别为u1 和u2 ,并且根据零和博弈的情况,双方的效用函数有如下的关系式u1+u2=0 。关于零和博弈,双方只能存在一个胜利者,而另一个为失败者。根据所建立的博弈理论框架,提出了一种极化的博弈论检测算法。该算法不需要训练数据就能对极化设计做进一步的改善,其性能较常规的垂直或水平极化有更好的检测性能。4.6 认知雷达抗干扰中的目标跟踪博弈
在基于博弈理论的雷达目标跟踪研究成果中,Chavali P等人[65,66]使用博弈论方法结合并行粒子滤波和数据关联对机动目标的运动轨迹进行了研究。作者首先介绍了常规的博弈论框架和NE的定义,并引出了相关均衡(Correlated Equilibrium, CE)的数学定义
∑s∈S:si=nπ(s)[ui(j,s−i)−ui(s)]≤0 (18) 其中,若所有的参与者
i∈I 和所有的策略n,j∈Si 满足式(18)的关系,则概率分布π 被定义为相关均衡。根据NE和CE的定义可以看出,每个NE都是一种特殊的CE。另外,CE是非空的、闭凸集合,并且能保证解的存在性和计算可行性。接下来,作者构造了数据关联博弈的第i 个参与者的效用函数ui(si,s−i)={di(si)−μ1gi(si,s−i),si≠0μ2,si=0 (19) 其中,
di(si) 为量测和状态预测映射之间的Mahalonobis距离;μ1>0 和μ2>0 是固定的参数,函数gk(sk,s−k) 被定义为gi(si,s−i)=1I−1I∑l=1l≠i‖ (20) 其中,
\forall {s_i} ,有{g_i}({s_i},{s_{ - i}}) < 1 。接下来,作者证明了所构造的数据关联博弈的CE的存在性。并在该博弈框架下提出了一种交互多模型的并行粒子滤波算法,该算法结合了序列采样粒子滤波和独立分区粒子滤波算法的优势,在跟踪动目标情况中表现出了一种比其它粒子滤波更优越的性能。另外,文献[67]利用非合作博弈论研究了多功能雷达网络跟踪多目标中的目标选择问题。博弈的参与者为所有雷达,策略是已知观测的所有目标数,效用函数为一个合适的目标跟踪准则。博弈的第
i 个参与雷达的效用函数为u({s_i},{s_{ - i}}) = \sum\limits_{j = 1}^T {{w_{i,j}} \cdot {\rm{gai}}{{\rm{n}}_j}\left( {m_j^t(i)} \right)} (21) 其中,
{\rm{gai}}{{\rm{n}}_j}\left( {m_j^t(i)} \right) = {\rm{Tr}}\left\{ {{P_{j,k|k - 1}} - P_{j,k|k}^{m_j^t(i)}} \right\} ;{\rm{Tr}}\{ \cdot \} 表示矩阵的迹运算;{P_{j,k|k - 1}} 为第j 个感兴趣目标的第k 步的误差协方差矩阵基于第k - 1 步所有量测数据;{w_{i,j}} 是雷达i 对于感兴趣目标j 的权系数。根据效用函数,获得了雷达i 的最佳反应函数{\rm{B}}{{\rm{R}}_i}({s_{ - i}}) = \arg \mathop {\max }\limits_{{s_i} \in {\cal{S}}} u({s_i},{s_{ - i}}) (22) 基于最佳反应函数式(22),文献[67]提出了一种低复杂度最佳反应动态(Best Response Dynamics, BRD)的目标选择分布式策略算法,该算法对比其他的高计算复杂度的中心化方法有更好的性能。
4.7 认知雷达抗干扰中的雷达通信共存博弈
近期,雷达通信一体化成为了研究热点。由于在谱共存的情况下,雷达和通信之间都具有信号的收发工作状态,两种系统彼此都会对另一种系统产生不必要的干扰并影响其正常工作运转。因此,在他们同时工作的情况下,要尽量避免他们之间的相互干扰,而合理资源分配有助于减少两种系统的互干扰影响并提升它们的工作效率。
Shi等人[77-80]研究了谱共存的多基地雷达和大规模MIMO通信系统在通道增益存在不确定性情况下的功率分配策略问题。针对两种系统,双方的效用函数被分别提出,并分别构造了双方的效用最大化模型。大规模MIMO通信的优化模型为
\left.\begin{split} &\mathop {{\rm{max}} }\limits_{{\theta }} {{\hat u}_{{\rm{com}}}}({{\theta }},{{p}}) \\ &\;{\rm{s}}{\rm{.t}}{\rm{.}}\;\;\;\sum\limits_{i = 1}^{{I_R}} {{p_i}(g_i^d - \varepsilon _i^d)} \le {T_{{\rm{th}}}} \end{split}\right\} (23) 其中,
{\hat u_{{\rm{com}}}}({{\theta }},{{p}}) = \displaystyle\sum\nolimits_{i = 1}^{{I_R}} {\theta _i}{p_i}(g_i^d - \varepsilon _i^d) \cdot\mu \left( {{T_{{\rm{th}}}} - \displaystyle\sum\nolimits_{i = 1}^{{I_R}} {{p_i}(g_i^d - \varepsilon _i^d)} } \right) 为通信基站效用函数;{{\theta }} = [{\theta _1},{\theta _2}, ··· ,{\theta _{{I_R}}}] 为干扰价格向量;g_i^d 为雷达i 到通信基站的直达波;{{p}} = [{p_1}, {p_2},··· ,{p_{{I_R}}}] 表示雷达发射功率向量;\mu ( \cdot ) 为步进函数;{T_{{\rm{th}}}} 为预设的总干扰阈值,{I_R} 表示参与雷达总数。另外,多基地雷达一方的优化模型为
\left.\begin{split} &\mathop {{\rm{max}} }\limits_{{p}} {u_{{\rm{rad}},i}}({p_i},{{{p}}_{ - i}},{\theta _i}) \\ &\quad\;\;\quad\;{{\hat \gamma }_i} \ge {\gamma _{\min }},\;\;\quad\quad\forall i \\ &\quad{\rm{s}}{\rm{.t}}{\rm{.}}\;\;0 \le {p_i} \le p_i^{\max },\;\;\forall i \end{split}\right\} (24) 其中,
{u_{{\rm{rad}},i}}({p_i},{{{p}}_{ - i}},{\theta _i}) = \sqrt {{{\hat \gamma }_i} - {\gamma _{\min }}} - {\theta _i}{p_i}(g_i^d - \varepsilon _i^d) 为雷达i 的效用函数;{\hat \gamma _i} 为第i 个雷达的SINR;{\gamma _{\min }} 为最小SINR阈值。根据雷达的效用函数得到了雷达的最佳功率反应函数,并获得了一个固定的雷达功率迭代公式。该公式满足标准函数的3条性质,并收敛到一个固定点。因此,利用功率最佳反应公式建立了一种迭代的鲁棒控制算法,该算法收敛于鲁棒的NE。最后,依据该算法的功率分配方案,雷达和通信能最终得到一种稳定的状态。
本节主要讨论了博弈论在认知雷达研究中的各个方向的代表性研究内容。主要包括雷达功率的优化分配、雷达与目标干扰对抗、雷达编码优化设计、雷达波形优化设计、雷达目标检测和跟踪以及雷达通信共存等。目前,博弈论应用于认知雷达抗干扰策略还处于理论研究阶段,需要进一步地做更深入的研究分析,并加快在实战中的应用实现。
5. 博弈论在认知雷达抗干扰研究中的潜在研究问题
第4节主要介绍了近期学者们将博弈论应用于认知雷达抗干扰中的研究成果,博弈的主要策略是从功率分配、干扰抑制、编码方式、波形设计、目标检测和跟踪方法和雷达通信共存等方面进行分析的。根据文献所给予的不同背景情况,需要对博弈论应用于认知雷达抗干扰中的问题做进一步的剖析,为后续的研究做进一步的指导作用。下面分析了博弈论在认知雷达抗干扰研究中可能面临的研究问题:(1) 博弈论在认知雷达功率分配研究中已有部分成果了,但对其他雷达资源(时间、频谱、站址等)的分配问题的研究还相对较少。在实战中,时间、频谱、站址等都是雷达正常工作所需的重要资源,影响着雷达能否发挥重要的作用,仍需做进一步的细化研究。(2) 博弈效用函数的选择比较广泛,对于特定的作战环境如何选取对己方最有效的效用函数需要经过大量实测数据的测试论证。(3) 博弈策略边界的研究也是重要的,对于某一种策略的使用不是任意无限的。如何设定满足己方所需的策略边界并能抑制对方的策略效用也是一个重要的研究问题。(4) 在相关文献中,研究认知雷达抗干扰中的博弈论分析主要集中于纯策略理论的分析研究,而对于多种策略下的组合博弈研究工作相对较少。由于实际作战环境中,都是多种策略进行组合应用的,如多种低截获信号对多种目标进行捕获和多种干扰同时干扰不同雷达的正常运转等。因此,在复杂多变的综合战场环境中需要利用组合博弈理论来分析不同的应用场景,以提升己方的作战成功率。(5) 在目标检测与跟踪的研究过程中,认知雷达通过前期的信息数据的积累,对感兴趣目标和环境信息进行了动态的融合提取,可以利用不同的演化博弈策略对目标进行实时的检测与跟踪。(6) 对于博弈论分析应用于实战的场景仍需做大量的研究工作,理论联系实际相对容易,但是理论应用于实际需要大量的研究和测试论证。
6. 总结与展望
雷达抗干扰博弈分析的研究时间虽长,但其中有较长一段时间没有什么新的研究成果被发表。最近几年,由于各国的军事装备对抗越来越智能化,雷达抗干扰也需要进行智能化的提升。同时,在认知雷达概念提出后,博弈论分析作为合作与对抗的理性策略被引入到认知雷达合作与对抗的研究当中,其主要的研究方向是雷达功率的优化分配、雷达与干扰机对抗、雷达编码优化设计、雷达波形优化设计、雷达目标检测和跟踪以及雷达通信共存等。雷达和电子干扰之间的对抗博弈会一直持续下去,双方都在应用混合新技术来提升各自的对抗能力,期望在彼此的对抗中获得主动权。而博弈论作为一门交叉融合学科,其相关研究成果已经在各个领域获得应用,但在雷达技术领域的应用研究可以说处于新的起步阶段。未来对认知雷达抗干扰博弈论分析中可能的研究方向有:(1) 由于雷达和干扰之间的对抗是多种策略的,所以着重研究混合策略下的雷达对抗博弈论分析;(2) 雷达网络攻防对抗博弈分析;(3) 无人集群协同对抗博弈分析;(4) 认知雷达抗干扰中的强化学习的博弈论研究等。
-
[1] HAYKIN S. Cognitive radar: A way of the future[J]. IEEE Signal Processing Magazine, 2006, 23(1): 30–40. doi: 10.1109/MSP.2006.1593335 [2] 黎湘, 范梅梅. 认知雷达及其关键技术研究进展[J]. 电子学报, 2012, 40(9): 1863–1870. doi: 10.3969/j.issn.0372-2112.2012.09.025LI Xiang and FAN Meimei. Research advance on cognitive radar and its key technology[J]. Acta Electronica Sinica, 2012, 40(9): 1863–1870. doi: 10.3969/j.issn.0372-2112.2012.09.025 [3] HAYKIN S. Cognition is the key to the next generation of radar systems[C]. The 2009 IEEE 13th Digital Signal Processing Workshop and 5th IEEE Signal Processing Education Workshop, Marco Island, USA, 2009: 463–467. [4] 赵国庆. 雷达对抗原理[M]. 2版. 西安: 西安电子科技大学出版社, 2012.ZHAO Guoqing. Principle of Radar Countermeasure[M]. 2nd ed. Xi’an: Xidian University Press, 2012. [5] 李光久, 李昕. 博弈论简明教程[M]. 镇江: 江苏大学出版社, 2013.LI Guangjiu and LI Xin. A Brief Tutorial on Game Theory[M]. Zhenjiang: Jiangsu University Press, 2013. [6] TOPKIS D M. Supermodularity and Complementarity[M]. Princeton: Princeton University Press, 1998: 212–214. [7] 邹鲲. 认知雷达的未知目标检测[J]. 电子与信息学报, 2018, 40(1): 166–172. doi: 10.11999/JEIT170254ZOU Kun. Unknown target detection for cognitive radar[J]. Journal of Electronics &Information Technology, 2018, 40(1): 166–172. doi: 10.11999/JEIT170254 [8] XUE Yanbo. Cognitive radar: Theory and simulations[D]. [Ph. D. dissertation], The McMaster University, 2010. [9] HAYKIN S, XUE Yanbo, and SETOODEH P. Cognitive radar: Step toward bridging the gap between neuroscience and engineering[J]. Proceedings of the IEEE, 2012, 100(11): 3102–3130. doi: 10.1109/JPROC.2012.2203089 [10] GUERCI J R. Cognitive Radar: The Knowledge-Aided Fully Adaptive Approach[M]. Boston: Artech House, 2010. [11] 左群声, 王彤. 认知雷达导论[M]. 北京: 国防工业出版社, 2017.ZUO Qunsheng and WANG Tong. Introduction to Cognitive Radar[M]. Beijing: National Defense Industry Press, 2017. [12] 张良, 祝欢, 杨予昊, 等. 机载预警雷达技术及信号处理方法综述[J]. 电子与信息学报, 2016, 38(12): 3298–3306. doi: 10.11999/JEIT161007ZHANG Liang, ZHU Huan, YANG Yuhao, et al. Overview on airborne early warning radar technology and signal processing methods[J]. Journal of Electronics &Information Technology, 2016, 38(12): 3298–3306. doi: 10.11999/JEIT161007 [13] SHARAGA N, TABRIKIAN J, and MESSER H. Optimal cognitive beamforming for target tracking in MIMO radar/sonar[J]. IEEE Journal of Selected Topics in Signal Processing, 2015, 9(8): 1440–1450. doi: 10.1109/JSTSP.2015.2467354 [14] BEN KILANI M, NIJSURE Y, GAGNON G, et al. Cognitive waveform and receiver selection mechanism for multistatic radar[J]. IET Radar, Sonar & Navigation, 2016, 10(2): 417–425. doi: 10.1049/iet-rsn.2015.0319 [15] YAO Yu, MIAO Pu, and CHEN Zhimin. Cognitive waveform optimization for phase-modulation-based joint radar-communications system[J]. IEEE Access, 2020, 8: 33276–33288. doi: 10.1109/ACCESS.2020.2974787 [16] ESMAEILI-NAJAFABADI H, LEUNG H, and MOO P W. Unimodular waveform design with desired ambiguity function for cognitive radar[J]. IEEE Transactions on Aerospace and Electronic Systems, 2020, 56(3): 2489–2496. doi: 10.1109/TAES.2019.2942411 [17] BELL K L, BAKER C J, SMITH G E, et al. Cognitive radar framework for target detection and tracking[J]. IEEE Journal of Selected Topics in Signal Processing, 2015, 9(8): 1427–1439. doi: 10.1109/JSTSP.2015.2465304 [18] GUI Ronghua, WANG Wenqin, PAN Ye, et al. Cognitive target tracking via angle-range-Doppler estimation with transmit subaperturing FDA radar[J]. IEEE Journal of Selected Topics in Signal Processing, 2018, 12(1): 76–89. doi: 10.1109/JSTSP.2018.2793761 [19] WEN Cai, HUANG Yan, WU Jianxin, et al. Cognitive anti-deception-jamming for airborne array radar via phase-only pattern notching with nested ADMM[J]. IEEE Access, 2019, 7: 153660–153674. doi: 10.1109/ACCESS.2019.2948507 [20] KIRK B H, NARAYANAN R M, GALLAGHER K A, et al. Avoidance of time-varying radio frequency interference with software-defined cognitive radar[J]. IEEE Transactions on Aerospace and Electronic Systems, 2018, 55(3): 1090–1107. doi: 10.1109/TAES.2018.2886614 [21] KARIMI V, MOHSENI R, and SAMADI S. Adaptive OFDM waveform design for cognitive radar in signal-dependent clutter[J]. IEEE Systems Journal, 2020, 14(3): 3630–3640. doi: 10.1109/JSYST.2019.2943809 [22] LIU Xinghua, XU Zhenhai, WANG Luoshengbin, et al. Cognitive dwell time allocation for distributed radar sensor networks tracking via cone programming[J]. IEEE Sensors Journal, 2020, 20(10): 5092–5101. doi: 10.1109/JSEN.2020.2970280 [23] DU Yi, LIAO Kefei, OUYANG Shan, et al. Time and aperture resource allocation strategy for multitarget ISAR imaging in a radar network[J]. IEEE Sensors Journal, 2020, 20(6): 3196–3206. doi: 10.1109/JSEN.2019.2954711 [24] KRISHNAMURTHY V, ANGLEY D, EVANS R, et al. Identifying cognitive radars - inverse reinforcement learning using revealed preferences[J]. IEEE Transactions on Signal Processing, 2020, 68: 4529–4542. doi: 10.1109/TSP.2020.3013516 [25] GOGINENI S and NEHORAI A. Game theoretic approach for polarimetric MIMO radar waveform design[C]. 2012 International Waveform Diversity & Design Conference, Kauai, USA, 2012: 59–62. [26] Dix J P. Game-theoretic applications[J]. IEEE Spectrum, 1968, 5(4): 108–117. doi: 10.1109/MSPEC.1968.5214595. [27] ZETTERBERG L H. Signal detection under noise interference in a game situation[J]. IRE Transactions on Information Theory, 1962, 8(5): 47–52. doi: 10.1109/TIT.1962.1057773 [28] LIPFORD J. A game theoretic method of obtaining a given return from a minimum weight of radar reflectors[J]. IEEE Transactions on Antennas and Propagation, 1963, 11(2): 193. doi: 10.1109/TAP.1963.1137988 [29] SPEYER J L. A stochastic differential game with controllable statistical parameters[J]. IEEE Transactions on Systems Science and Cybernetics, 1967, 3(1): 17–20. doi: 10.1109/TSSC.1967.300103 [30] 徐友云, 李大鹏, 钟卫, 等. 认知无线电网络资源分配: 博弈模型与性能分析[M]. 北京: 电子工业出版社, 2013.XU Youyun, LI Dapeng, ZHONG Wei, et al. Resource Management of Cognitive Radio Networks: Game Theoretic Modeling and Performance Analysis[M]. Beijing: Publishing House of Electronics Industry, 2013. [31] MITOLA J and MAGUIRE G Q. Cognitive radio: Making software radios more personal[J]. IEEE Personal Communications, 1999, 6(4): 13–18. doi: 10.1109/98.788210 [32] BACHMANN D J, EVANS R J, and MORAN B. Game theoretic analysis of adaptive radar jamming[J]. IEEE Transactions on Aerospace and Electronic Systems, 2011, 47(2): 1081–1100. doi: 10.1109/TAES.2011.5751244 [33] 冯明月, 何明浩, 郁春来, 等. 相控阵雷达噪声干扰博弈分析[J]. 现代雷达, 2014, 36(5): 10–14, 30. doi: 10.16592/j.cnki.1004-7859.2014.05.010FENG Mingyue, HE Minghao, YU Chunlai, et al. Game theory analysis of noise jamming for phased array radar[J]. Modern Radar, 2014, 36(5): 10–14, 30. doi: 10.16592/j.cnki.1004-7859.2014.05.010 [34] PANOUI A, LAMBOTHARAN S, and CHAMBERS J A. Game theoretic power allocation technique for a MIMO radar network[C]. The 2014 6th International Symposium on Communications, Control and Signal Processing, Athens, Greece, 2014: 509–512. [35] BACCI G, SANGUINETTI L, GRECO M S, et al. A game-theoretic approach for energy-efficient detection in radar sensor networks[C]. The 2012 IEEE 7th Sensor Array and Multichannel Signal Processing Workshop, Hoboken, USA, 2012: 157–160. [36] GODRICH H, PETROPULU A P, and POOR H V. Power allocation strategies for target localization in distributed multiple-radar architectures[J]. IEEE Transactions on Signal Processing, 2011, 59(7): 3226–3240. doi: 10.1109/TSP.2011.2144976 [37] SLIMENI F, LE NIR V, SCHEERS B, et al. Optimal power allocation over parallel Gaussian channels in cognitive radio and jammer games[J]. IET Communications, 2016, 10(8): 980–986. doi: 10.1049/iet-com.2015.0976 [38] PANOUI A, LAMBOTHARAN S, and CHAMBERS J A. Game theoretic power allocation for a multistatic radar network in the presence of estimation error[C]. 2014 Sensor Signal Processing for Defence, Edinburgh, UK, 2014: 1–5. [39] DELIGIANNIS A, PANOUI A, LAMBOTHARAN S, et al. Game-theoretic power allocation and the nash equilibrium analysis for a multistatic MIMO radar network[J]. IEEE Transactions on Signal Processing, 2017, 65(24): 6397–6408. doi: 10.1109/TSP.2017.2755591 [40] DELIGIANNIS A and LAMBOTHARAN S. A Bayesian game theoretic framework for resource allocation in multistatic radar networks[C]. 2017 IEEE Radar Conference, Seattle, USA, 2017: 546–551. [41] WAN Kaifang, GAO Xiaoguang, LI Bo, et al. Optimal power management for antagonizing between radar and jamming based on continuous game theory[J]. Transactions of Nanjing University of Aeronautics and Astronautics, 2014, 31(4): 386–393. doi: 10.3969/j.issn.1005-1120.2014.04.005 [42] SUN Bin, CHEN Haowen, WEI Xizhang, et al. Power allocation for range-only localisation in distributed multiple-input multiple-output radar networks - a cooperative game approach[J]. IET Radar, Sonar & Navigation, 2014, 8(7): 708–718. doi: 10.1049/iet-rsn.2013.0260 [43] CHEN Haowen, TA Shiying, and SUN Bin. Cooperative game approach to power allocation for target tracking in distributed MIMO radar sensor networks[J]. IEEE Sensors Journal, 2015, 15(10): 5423–5432. doi: 10.1109/JSEN.2015.2431261 [44] SHI C G, SALOUS S, ZHOU J J, et al. Cooperative game-theoretic power allocation algorithm for target detection in radar network[C]. The 32nd General Assembly and Scientific Symposium of the International Union of Radio Science, Montreal, Canada, 2017: 1–4. [45] SHI Chenguang, SALOUS S, WANG Fei, et al. Power allocation for target detection in radar networks based on low probability of intercept: A cooperative game theoretical strategy[J]. Radio Science, 2017, 52(8): 1030–1045. doi: 10.1002/2017RS006332 [46] LIU Yanqing and DONG Liang. Spectrum sharing in MIMO cognitive radio networks based on cooperative game theory[J]. IEEE Transactions on Wireless Communications, 2014, 13(9): 4807–4820. doi: 10.1109/TWC.2014.2331287 [47] GAO Hai, WANG Jian, JIANG Chunxiao, et al. Equilibrium between a statistical MIMO radar and a jammer[C]. IEEE Radar Conference, Arlington, USA, 2015: 461–466. [48] WONDERLEY D, SELEE T, and CHAKRAVARTHY V. Game theoretic decision support framework for electronic warfare applications[C]. 2016 IEEE Radar Conference, Philadelphia, USA, 2016: 1–5. [49] WANG Lulu, WANG Liandong, ZENG Yonghu, et al. Radar and jammer power allocation strategy based on matrix game[J]. Procedia Computer Science, 2017, 107: 478–483. doi: 10.1016/j.procs.2017.03.093 [50] DELIGIANNIS A, ROSSETTI G, PANOUI A, et al. Power allocation game between a radar network and multiple jammers[C]. 2016 IEEE Radar Conference, Philadelphia, USA, 2016: 1–5. [51] HENAREH N and NOROUZI Y. Game theory modeling of MIMO radar and ARM missile engagement[C]. The 2016 8th International Symposium on Telecommunications, Tehran, Iran, 2016: 515–520. [52] SONG Xiufeng, WILLETT P, ZHOU Shengli, et al. The power game between a MIMO radar and jammer[C]. 2012 IEEE International Conference on Acoustics, Speech and Signal Processing, Kyoto, Japan, 2012: 5185–5188. [53] SONG Xiufeng, WILLETT P, ZHOU Shengli, et al. The MIMO radar and jammer games[J]. IEEE Transactions on Signal Processing, 2012, 60(2): 687–699. doi: 10.1109/TSP.2011.216925 [54] ZHANG Xinxun, MA Hui, WANG Jianlai, et al. Game theory design for deceptive jamming suppression in polarization MIMO radar[J]. IEEE Access, 2019, 7: 114191–114202. doi: 10.1109/ACCESS.2019.2931604 [55] SONG Xiufeng, WILLETT P, and ZHOU Shengli. Jammer detection and estimation with MIMO radar[C]. 2012 Conference Record of the Forty Sixth Asilomar Conference on Signals, Systems and Computers, Pacific Grove, USA, 2012: 1312–1316. [56] LI Kang, JIU Bo, and LIU Hongwei. Game theoretic strategies design for monostatic radar and jammer based on mutual information[J]. IEEE Access, 2019, 7: 72257–72266. doi: 10.1109/ACCESS.2019.2920398 [57] NOROUZI T and NOROUZI Y. Scheduling the usage of radar and jammer during peace and war time[J]. IET Radar, Sonar & Navigation, 2012, 6(9): 929–936. doi: 10.1049/iet-rsn.2012.0049 [58] LIU Xiaowen, ZHANG Qun, LUO Ying, et al. ISAR imaging task allocation for multi-target in radar network based on potential game[J]. IEEE Sensors Journal, 2019, 19(23): 11192–11204. doi: 10.1109/JSEN.2019.2936423 [59] PIEZZO M, AUBRY A, and BUZZI S, et al. Non-cooperative code design in radar networks: A game-theoretic approach[J]. EURASIP Journal on Advances in Signal Processing, 2013, 2013: 63. doi: 10.1186/1687-6180-2013-63 [60] GOGINENI S and NEHORAI A. Game theoretic design for polarimetric MIMO radar target detection[J]. Signal Processing, 2012, 92(5): 1281–1289. doi: 10.1016/j.sigpro.2011.11.024 [61] DELIGIANNIS A, LAMBOTHARAN S, and CHAMBERS J A. Game theoretic analysis for MIMO radars with multiple targets[J]. IEEE Transactions on Aerospace and Electronic Systems, 2016, 52(6): 2760–2774. doi: 10.1109/TAES.2016.150699 [62] LAN Xing, LI Wei, WANG Xingliang, et al. MIMO radar and target stackelberg game in the presence of clutter[J]. IEEE Sensors Journal, 2015, 15(12): 6912–6920. doi: 10.1109/JSEN.2015.2466812 [63] DANIYAN A, GONG Yu, and LAMBOTHARAN S. Game theoretic data association for multi-target tracking with varying number of targets[C]. 2016 IEEE Radar Conference, Philadelphia, USA, 2016: 1–4. [64] DANIYAN A, ALDOWESH A, GONG Yu, et al.. Data association using game theory for multi-target tracking in passive bistatic radar[C]. 2017 IEEE Radar Conference, Seattle, USA, 2017: 42–46. [65] CHAVALI P and NEHORAI A. Concurrent particle filtering and data association using game theory for tracking multiple maneuvering targets[J]. IEEE Transactions on Signal Processing, 2013, 61(20): 4934–4948. doi: 10.1109/TSP.2013.2272923 [66] CHAVALI P and NEHORAI A. Distributed data association for multiple-target tracking using game theory[C]. 2013 IEEE Radar Conference, Ottawa, Canada, 2013: 1–6. [67] BOGDANOVIĆ N, DRIESSEN H, and YAROVOY A. Track selection in multifunction radars for multi-target tracking: An anti-coordination game[C]. 2016 IEEE International Conference on Acoustics, Speech and Signal Processing, Shanghai, China, 2016: 3131–3135. [68] BOGDANOVIĆ N, DRIESSEN H, and YAROVOY A G. Target selection for tracking in multifunction radar networks: Nash and correlated equilibria[J]. IEEE Transactions on Aerospace and Electronic Systems, 2018, 54(5): 2448–2462. doi: 10.1109/TAES.2018.2819798 [69] LEE S J, PARK S S, and CHOI H L. Potential game-based non-myopic sensor network planning for multi-target tracking[J]. IEEE Access, 2018, 6: 79245–79257. doi: 10.1109/ACCESS.2018.2885027 [70] XIE Mingchi, YI Wei, and KONG Lingjiang. Joint selection and power allocation strategy for target tracking in decentralized multiple radar systems[C]. 2016 IEEE Radar Conference, Philadelphia, USA, 2016: 1–6. [71] XIE Mingchi, YI Wei, and KONG Lingjiang. Joint node selection and power allocation for multitarget tracking in decentralized radar networks[C]. The 2016 19th International Conference on Information Fusion, Heidelberg, Germany, 2016: 45–52. [72] XIE Mingchi, YI Wei, KIRUBARAJAN T, et al. Joint node selection and power allocation strategy for multitarget tracking in decentralized radar networks[J]. IEEE Transactions on Signal Processing, 2018, 66(3): 729–743. doi: 10.1109/TSP.2017.2777394 [73] CHAVALI P and NEHORAI A. Scheduling and power allocation in a cognitive radar network for multiple-target tracking[J]. IEEE Transactions on Signal Processing, 2012, 60(2): 715–729. doi: 10.1109/TSP.2011.2174989 [74] HAN Keyong and NEHORAI A. Joint frequency-hopping waveform design for MIMO radar estimation using game theory[C]. 2013 IEEE Radar Conference, Ottawa, Canada, 2013: 1–4. [75] HAN Keyong and NEHORAI A. Jointly optimal design for MIMO radar frequency-hopping waveforms using game theory[J]. IEEE Transactions on Aerospace and Electronic Systems, 2016, 52(2): 809–820. doi: 10.1109/TAES.2015.140408 [76] PANOUI A, LAMBOTHARAN S, and CHAMBERS J A. Game theoretic distributed waveform design for multistatic radar networks[J]. IEEE Transactions on Aerospace and Electronic Systems, 2016, 52(4): 1855–1865. doi: 10.1109/TAES.2016.150378 [77] SHI Chenguang, WANG Fei, SALOUS S, et al. Distributed power allocation for spectral coexisting multistatic radar and communication systems based on stackelberg game[C]. 2019 IEEE International Conference on Acoustics, Speech and Signal Processing, Brighton, UK, 2019: 4265–4269. [78] SHI Chenguang, WANG Fei, SALOUS S, et al. A robust stackelberg game-based power allocation scheme for spectral coexisting multistatic radar and communication systems[C]. 2019 IEEE Radar Conference, Boston, USA, 2019: 1–5. [79] SHI Chenguang, DING Lintao, WANG Fei, et al. Low probability of intercept-based collaborative power and bandwidth allocation strategy for multi-target tracking in distributed radar network system[J]. IEEE Sensors Journal, 2020, 20(12): 6367–6377. doi: 10.1109/JSEN.2020.2977328 [80] SHI Chenguang, QIU Wei, SALOUS S, et al. Power control scheme for spectral coexisting multistatic radar and massive MIMO communication systems under uncertainties: A robust Stackelberg game model[J]. Digital Signal Processing, 2019, 94: 146–155. doi: 10.1016/j.dsp.2019.05.007 [81] MISHRA K V, MARTONE A, and ZAGHLOUL A I. Power allocation games for overlaid radar and communications[C]. 2019 URSI Asia-Pacific Radio Science Conference, New Delhi, India, 2019: 1–4. 期刊类型引用(16)
1. 周彬,尚熙,刘枫,苏中华. 基于强化学习算法的飞行器轨迹防护及干扰策略生成方法. 电子信息对抗技术. 2025(02): 15-23 . 百度学术
2. 马红光,龙正平,闫彬舟,宋小杉. 具有认知偏差的雷达对抗建模方法. 强激光与粒子束. 2024(04): 157-163 . 百度学术
3. 贲德. 机载有源相控阵火控雷达技术发展. 现代雷达. 2024(02): 1-15 . 百度学术
4. 廖晓容,孙国皓,钟苏川,余显祥,李明. 面向多任务动态场景的雷达与干扰空时协同波束联合优化方法. 雷达学报. 2024(03): 613-628 . 百度学术
5. 丁梓航,谢军伟,齐铖. 基于强化学习的频控阵-多输入多输出雷达发射功率分配方法. 电子与信息学报. 2023(02): 550-557 . 本站查看
6. 岳帅英,彭芃,任渊. 舰载多功能相控阵雷达发展现状与趋势. 舰船科学技术. 2023(02): 141-147 . 百度学术
7. 王洋,冯永新,宋碧雪,田秉禾. DP-DRCnet卷积神经网络信号调制识别算法. 兵工学报. 2023(02): 545-555 . 百度学术
8. 孙海信,何崇林,王俊峰,陈镕杰,邓训彬. 水下无线传感器网络抗恶意干扰技术应用及研究进展. 水下无人系统学报. 2023(01): 128-142 . 百度学术
9. 刘国满,任航,聂旭娜,王俊岭,黄剑,李朋远. 一种认知电子战雷达对抗教学训练系统. 实验室研究与探索. 2023(03): 246-250 . 百度学术
10. 易伟,袁野,刘光宏,葛建军,孔令讲,杨建宇. 多雷达协同探测技术研究进展:认知跟踪与资源调度算法. 雷达学报. 2023(03): 471-499 . 百度学术
11. 徐聪,郭子林,王学尧,骆林,王洪林,刘维建. 国外预警机发展现状及雷达关键技术研究. 空天预警研究学报. 2023(02): 79-88 . 百度学术
12. 邢怀玺,邢清华. 基于信号博弈的雷达抗干扰策略选择方法. 军事运筹与评估. 2023(04): 65-70 . 百度学术
13. 尚熙,杨革文,戴少怀,蒋伊琳. 基于强化学习的一对多雷达干扰资源分配策略研究. 空天防御. 2022(01): 94-101 . 百度学术
14. 代向荣,时晨光,周建江. 基于非合作博弈的分布式正交频分复用雷达网络功率分配算法. 战术导弹技术. 2022(05): 1-11+151-152 . 百度学术
15. 朱霸坤,朱卫纲,李伟,杨莹,高天昊. 基于先验知识的多功能雷达智能干扰决策方法. 系统工程与电子技术. 2022(12): 3685-3695 . 百度学术
16. 王峰,李培,徐锋. 新一代雷达电磁空间深蓝博弈技术需求分析. 中国电子科学研究院学报. 2021(12): 1195-1200+1223 . 百度学术
其他类型引用(17)
-