Collaborative Electromagnetic Suppression Method for Electromagnetic Security Control of Major Events
-
摘要: 该文研究了复杂环境条件下重大活动安保区域的电磁安全协同压制技术问题。首先采用了城市环境电波传播模型,建模分析了城市复杂电磁环境的特征。其次,针对高效电磁压制与有效避免有害干扰问题,利用势博弈方法设计电磁压制设备协同部署算法,基于此,提出了基于遗传算法的压制设备功率优化方法,实现了电磁压制设备协同工作下干扰功率的高效投送。仿真结果表明,所提出的电磁压制设备位置部署算法可获得与理论最优方法(即遍历算法)近似的优异性能,且运算复杂度更低;在保证相同干扰效果下,所提功率优化算法相较于传统干扰功率分配方法的传输功率降低了50%以上,实现了精准协同管控。Abstract: The electromagnetic security cooperative suppression technology in the security area of major events under the complex urban environment is presented in this paper. Firstly, the complex urban electromagnetic environment is modeled by using the radio wave propagation model suitable for dense urban environment. Secondly, aiming at the problem of efficient electromagnetic suppression and effective avoidance of harmful interference, the potential game method is used to design the cooperative deployment algorithm of electromagnetic suppression equipment. Building upon this, the power optimization method of suppression equipment based on genetic algorithm is proposed to achieve the efficient delivery of interference power under the cooperative work of electromagnetic suppression equipment. The simulation results indicate that the proposed electromagnetic suppression equipment deployment algorithm can obtain outstanding performance similar to the theoretical optimal method (i.e., traversal algorithm), with lower computational complexity. Moreover, under identical interference effectiveness, the proposed power optimization algorithm reduces transmission power by over 50% compared to the traditional interference power allocation methods, thereby achieving precise collaborative control.
-
1. 引言
随着无线电通信技术的快速发展,电磁频谱的争夺越来越激烈,如何有效地进行电磁安全管控与干扰资源分配是通信干扰及其相关领域的核心问题。电磁安全管控具有复杂性和多样性[1],公安机关和无线电管理部门在面临重大活动安全保障时,需要营造一个干净有序的电磁环境,以提高潜在安全隐患排查效率,降低各种突发事件带来的安全隐患,同时还需保证其他正常的通信业务。
然而,重大活动的电磁安全管控趋于精准化,从技术角度讲,若电磁压制的发射功率太小,对管控频段内的通信业务难以形成有效压制,若电磁压制功率过大,极易导致对管控频段内或邻近频段的正常通信业务产生干扰。因此,如何部署压制设备并精准控制电磁压制设备带内发射功率,实现重点区域电磁安全精准化管控,是社会安全治理和重大活动安保需要解决的关键技术之一。
对于重大活动电磁安全管控的研究集中于构建合适的协同模型机制,建立全面的干扰效能评估,优化协同干扰决策和配置干扰资源等方面。传统通信干扰资源分配主要依靠人工经验对多部干扰机或干扰力量进行分配调度,主观性较强,在针对单个目标时能达到较好的干扰效果,但是在“多目标多设备”场景下,人为经验对干扰效果存在很大的影响,干扰效益难以得到有效保障。因此,干扰资源分配调度对干扰效益和整体管控起着决定性作用。
重大活动举行的地点通常位于城市环境,建筑物和植被的密集分布使得电波传播环境呈现出高度的复杂性,对于城市复杂电磁环境建模的研究,文献[2]提出的COST 231-Walfisch-Ikegami模型在一定程度上模拟了城市环境的电波传播状况,但其对地形复杂性的考虑相对简化,未能充分反映城市环境中如山脉、高楼、树木等元素可能对衍射损耗产生显著影响;文献[3]提出的COST 231-Hata模型是基于特定的频率范围设计的,对于超出这个频率范围的应用场景,模型的预测准确性会显著下降;文献[4]提出的Okumura-Hata模型面临着预测精度不高以及频率范围有限的问题。
针对电磁安全管控通信干扰资源分配问题,公开文献报道大多为通信目标的干扰策略研究。文献[5]提出了一种基于强化学习算法的智能通信对抗方法,针对目标系统受到干扰后可能采取3种抗干扰策略的情况,利用深度神经网络构建一种智能干扰决策算法,但该算法学习时间偏长且仅仅保证逼近最优;文献[6]采用博弈论设计迭代干扰策略选择算法来解决复杂场景下多干扰协同领域的干扰资源分配问题,但随着分配规模的增大,算法效率有一定的下降;文献[7]针对通信对抗目标分配问题,在瞄准式干扰的背景下应用分布式拍卖算法,提出了一种基于多Agent的分布式目标分配系统,然而算法存在局部搜索能力较弱等问题。文献[8]根据协同干扰武器-目标分配问题,引入启发式规则,提出了具有贪婪修复过程的免疫遗传算法,但未涉及多干扰源如何协同等问题。
对于电磁压制设备功率控制问题,相关文献给出了功率优化方面的研究。Tan等人[9]提出一种基于分布式深度强化学习的方法,仅利用局部信息和过去的非局部信息来自动优化信道选择和传输功率,克服了传统优化方法在决策维度过大时失效或者陷入局部最优的问题,但存在决策效率偏低的不足;文献[10]建立了适用于多干扰源环境下电磁压制的离散型目标功率分配数学模型,提出改进型注水功率分配算法;彭翔等人[11]在传统干扰功率分配方法的基础上提出一种基于深度强化学习的自适应干扰功率分配方法,保证干扰成功率的同时最小化功率损耗,但未讨论多干扰源间的协同问题。
上述研究成果表明,电磁安全管控领域的核心问题在于电磁封控手段粗放、协同机理缺失,大部分研究成果对场景及优化问题的假设过于简化,并未充分考虑压制的精准性和协同性。为此,本文采用协作架构,实现电磁压制设备在时域、频域、空域和能域的协同工作,从而降低有害干扰,实现精准压制。针对有效电磁压制与避免有害干扰冲突的精准高效管控问题,提出了基于势博弈的压制设备位置部署算法,实现了重点区域的电磁安全管控;针对警用电磁压制设备精准协同管控问题,提出了基于遗传算法的压制设备功率优化,实现了警用压制设备工作参数的自动化控制,因此本研究对电磁安全管控工程应用领域有着重要的实用价值。
2. 系统模型
在论述重大活动电磁安全管控的协同电磁压制问题之前,首先讨论通信干扰的工作方式。通信干扰是指利用通信压制设备发射的干扰信号,破坏或扰乱敌方无线电通信设备正常工作能力的电磁干扰措施,被压制通信接收机在接收通信发射机发射的通信信号的同时,也接收压制设备发射的干扰信号,其工作原理如图1所示。
在图1中,对于压制设备产生的干扰在被压制通信系统处的干扰功率可以计算为[12]
$$ {P_{{\text{rj}}}} = {P_{\text{j}}} + {G_{\text{j}}} - L({f_{\text{j}}},{d_{\text{j}}}) + {G_{\text{r}}}(\theta ){\text{,}} $$ (1) 式(1)中,$ {P_{\text{j}}} $为压制设备发射功率(dBm),$ {G_{\text{j}}} $为压制设备天馈线增益 (dBi),$ {G_{\text{r}}}(\theta ) $为被压制通信系统接收天馈线增益 (dBi),$ \theta $为方位角,$ L({f_{\text{j}}},{d_{\text{j}}}) $为干扰路径电波传播损耗 (dB),$ {d_{\text{j}}} $为干扰路径距离(m),即压制设备的发射天线到被压制通信系统的接收天线的距离,${f_{\text{j}}}$为压制设备工作中心频率(GHz),干扰功率$ {P_{{\text{rj}}}} $的单位为dBm。
对于被压制通信系统输入端接收到的信号功率可以计算为
$$ {P_{{\text{rs}}}} = {P_{\text{t}}} + {G_{\text{t}}} - L({f_{\text{t}}},{d_{\text{t}}}) + {G_{\text{r}}}(\theta ) $$ (2) 式(2)中,$ {P_{\text{t}}} $为被压制通信系统的发射功率(dBm),$ {G_{\text{t}}} $为发射天馈线增益(dBi),$ L({f_{\text{t}}},{d_{\text{t}}}) $为通信路径电波传播损耗(dB),$ {d_{\text{t}}} $为通信路径距离(m),即被压制通信系统的发站天线到收站天线的距离,$ {f_{\text{t}}} $为被压制通信系统工作中心频率(GHz),信号功率$ {P_{{\text{rs}}}} $的单位为dBm。
为了评估干扰的有效性,需要确定压制系数,针对不同的应用场景,其压制系数的确定方法也是不相同的。无线电通信分为模拟通信和数字通信两种形式,模拟通信质量以接收端解调语音的可懂度或清晰度为度量,通常采用解调输出信噪比来评估;相反,数字通信质量则以解调误码率为指标。因此,评价通信干扰的有效性也应采用解调输出信噪比或解调误码率作为度量标准。综合考虑通信干扰的有效性,可将其判定准则概括为:对于模拟语音通信,当通信接收机的解调输出信噪比降低到规定的门限值(干扰有效阈值)以下时,认为干扰有效;而对于数字通信,当通信接收机的解调输出误码率达到规定的门限值以上时,认为干扰有效。
通信干扰的有效性并非仅由干扰信号本身的大小决定,还与通信信号的大小有关。简言之,解调输出信噪比和解调误码率都与到达通信接收机输入端的干扰信号与通信信号功率的比值相关,通常称为“干信比”。为了量化描述通信干扰对受压制通信系统影响的程度,引入了“压制系数”的概念。压制系数${K_{\text{j}}}$是在确保通信干扰对通信接收机被完全压制的情况下,在通信接收机输入端所需的最小干扰功率与有用信号功率之比,即
$$ {K_{\text{j}}} = \left(\frac{{{P_{\text{j}}}}}{{{P_{\text{s}}}}}\right){{\text{ }}_{\min }} $$ (3) 式(3)中,$ {P_{\text{j}}} $是为保证被完全压制的情况下,在通信接收机输入端所必需的干扰功率;$ {P_{\text{s}}} $为通信接收机接收到的有用信号功率,$ {P_{\text{j}}} $和$ {P_{\text{s}}} $的单位均为mW或W,压制系数${K_{\text{j}}}$的单位为dB。干扰压制系数与通信系统的体系关系密切,即不同通信体系的干扰压制系数是不同的。比如,对于调频(FM)信号,所需的干扰压制系数只要0 dB左右,而对于单边带(SSB)信号,有时就需要高达10 dB。
为了计算城市环境下电波传播的路径损耗,需要进行电波传播信道建模。针对蜂窝LTE或5G的部署,3GPP TR 38.901[12]已明确定义UMi-Street Canyon模型,以计算城市场景中的传输损失。该模型适用于具有密集建筑物的城市环境,综合考虑了中心频率、发射机和接收机之间的距离、地形以及发射机和接收机的天线高度。无线通信系统的传播条件通常被划分为视距(Line Of Sight, LOS)和非视距(Non Line Of Sight, NLOS)两个环境。在没有遮挡的情况下,例如两个基站之间或发射机与接收机之间,信道模型为LOS;当存在建筑或植物遮挡时,除了衰减之外,信号还会受到反射、衍射和穿透损耗的影响,形成NLOS信道模型。UMi-Street Canyon模型的路径损耗方程如公式(4)所示,${f_{\text{c}}}$为发射机的中心频率(GHz),c为光速(m/s),${d_{{\text{2D}}}}$为收发机的2维距离(m),${d_{{\text{3D}}}}$为收发机的3维距离(m),${h_{{\text{BS}}}}$为发射机高度(m),${h_{{\text{UT}}}}$为接收机高度(m)。LOS下的路径损耗为
$$ \left.\begin{aligned} & {{\mathrm{PL}}_{{\text{UMi}} - {\text{LOS}}}} = \left\{ {\begin{array}{*{20}{c}} {{{\mathrm{PL}}_1}}&{10{\text{m}} \le {d_{{\text{2D}}}} \le {{d'}_{{\text{BP}}}}} \\ {{{\mathrm{PL}}_2}}&{{{d'}_{{\text{BP}}}} \le {d_{{\text{2D}}}} \le 5{\text{km}}} \end{array}} \right. \\ & {{\mathrm{PL}}_2} = 32.4 + 40\lg ({d_{{\text{3D}}}}) + 20\lg ({f_{\text{c}}}) \\ & \quad - 9.5\lg ({({{d'}_{{\text{BP}}}})^2} + {({h_{{\text{BS}}}} - {h_{{\text{UT}}}})^2}) \\ & {{\mathrm{PL}}_2} = 32.4 + 40\lg ({d_{{\text{3D}}}}) + 20\lg ({f_{\text{c}}}) \\ & \quad - 9.5\lg ({({{d'}_{{\text{BP}}}})^2} + {({h_{{\text{BS}}}} - {h_{{\text{UT}}}})^2}) \end{aligned}\right\} $$ (4) 式(4)中,断点距离$ d_{{\text{BP}}}^\prime = 4h_{{\text{BS}}}^\prime h_{{\text{UT}}}^\prime {f_{\text{c}}}/{\text{c}} $,$ h_{{\text{BS}}}^\prime $和$ h_{{\text{UT}}}^\prime $分别是为发射机和接收机处的有效天线高度,有效天线高度计算如下:$ h_{{\text{BS}}}^\prime = {h_{{\text{BS}}}} - {h_{\text{E}}} $,$ h_{{\text{UT}}}^\prime = {h_{{\text{UT}}}} - {h_{\text{E}}} $(其中$ {h_{{\text{BS}}}} $和$ {h_{{\text{UT}}}} $是实际天线高度),$ {h_{\text{E}}} = 1{\text{m}} $。
NLOS下的路径损耗为
$$ \left.\begin{aligned} & {{\mathrm{PL}}_{{\text{UMi}} - {\text{NLOS}}}} = \max ({{\mathrm{PL}}_{{\text{UMi}} - {\text{LOS}}}},{{{\mathrm{PL}}'}_{{\text{UMi}} - {\text{NLOS}}}}) \\ & \quad {\mathrm{for}}\; 10\;{\text{m}} \le {d_{{\text{2D}}}} \le 5\;{\text{km}} \\ & {{{\mathrm{PL}}'}_{{\text{UMi}} - {\text{NLOS}}}} = 35.3\lg \left( {{d_{{\text{3D}}}}} \right) + 22.4 \\ & \quad + 21.3\lg \left( {{f_{\text{c}}}} \right) - 0.3({h_{{\text{UT}}}} - 1.5) \end{aligned}\right\} $$ (5) UMi-Street Canyon模型视距传播概率为
$$ {\Pr _{{\text{LOS}}}} = \left\{ \begin{aligned} &1{,{d_{{\text{2D-out}}}} \le 18{\text{m}}} \\ & {\frac{{18}}{{{d_{{\text{2D-out}}}}}} + \exp \left( { - \frac{{{d_{{\text{2D-out}}}}}}{{36}}} \right)\left( {1 - \frac{{18}}{{{d_{{\text{2D-out}}}}}}} \right)}{,18{\text{m}} < {d_{{\text{2D-out}}}}} \end{aligned} \right. $$ (6) 式(6)中,${d_{{\text{2D - out}}}}$为室外收发机的2维距离。
考虑典型安保活动的范围为1km×1km区域,如图2所示。该区域包括多个压制设备、压制典型点、白名单设备和管制台站。在此场景中,假设压制设备的发射天线为全向,负责执行整个场景区域的压制任务。根据压制设备的位置分布,在整个场景区域选取一定数量的压制典型点,以此来评估整个区域的压制效果。典型点的选取考虑了电波传播环境的最坏情况,选择了具有较大干扰信号传输损耗的位置。在进行关键区域电磁安全管控任务之前,需要构建白名单数据库。在整个区域的压制过程中,白名单设备是需要正常工作的,白名单数据库主要由登记进场设备信息、国家用频规划表以及相关台站信息等组成,通过调整压制设备的功率来尽可能减小对白名单设备的影响。管制台站是管控过程的压制目标,需要确保管制台站处的压制强度达到一定水平,使其无法正常工作。在实际重点区域封控场景中,可部署设备点由经验丰富的封控频管工作人员在安保活动开始前根据地形、地物环境和场地实际用途选取,设备点的数量应超过压制设备的数量,用集合$ S{\text{ = \{ }}{s_1}{\text{,}}{s_2}, \cdots ,{s_M}{\text{\} }} $表示,$M$代表可部署设备点数量,经纬度坐标集合为$\{ ({s_{{\text{lat}}}}(1), {s_{{\text{lon}}}}(1)),({s_{{\text{lat}}}}(2),{s_{{\text{lon}}}}(2)), \cdots ,({s_{{\text{lat}}}}(M),{s_{{\text{lon}}}}(M))\} $;压制设备用集合$D = \{ {d_1},{d_2}, \cdots ,{d_I}\} $表示,$I$代表压制设备数量;压制典型点用集合$T = \{ {t_1},{t_2}, \cdots ,{t_N}\} $表示,$N$代表典型点数量,经纬度坐标集合为$\{ ({t_{{\text{lat}}}}(1),{t_{{\text{lon}}}}(1)), ({t_{{\text{lat}}}}(2),{t_{{\text{lon}}}}(2)), \cdots ,({t_{{\text{lat}}}}(N),{t_{{\text{lon}}}}(N))\} $;白名单设备用$W = \{ {w_1},{w_2}, \cdots ,{w_P}\} $表示,$P$代表白名单设备数量,经纬度坐标为$ \{ ({w_{{\text{lat}}}}(1),{w_{{\text{lon}}}}(1)),({w_{{\text{lat}}}}(2),{w_{{\text{lon}}}}(2)), \cdots , ({w_{{\text{lat}}}}(P),{w_{{\text{lon}}}}(P))\} $;管制台站用$C = \{ {c_1},{c_2}, \cdots ,{c_Q}\} $表示,$Q$代表管制台站数量,经纬度坐标为$\{ ({c_{{\text{lat}}}}(1), {c_{{\text{lon}}}}(1)),({c_{{\text{lat}}}}(2),{c_{{\text{lon}}}}(2)), \cdots ,({c_{{\text{lat}}}}(Q),{c_{{\text{lon}}}}(Q))\} $,$Q$个管制频段表示为$f = \{ {f_1}, \cdots ,{f_Q}\} $。使用以表1中的符号:
表 1 符号的定义符号 定义 $i$ 可部署设备点索引$,i \in [1,M]$ $j$ 典型点索引$,j \in [1,N]$ $k$ 白名单索引$,k \in [1,P]$ $q$ 管制台站索引$,q \in \left[ {1,Q} \right]$ $ P_{{t_j}}^{{\text{Th}}} $ 典型点$ {t_j} $接收机正常工作的阈值 $ P_{{w_k}}^{{\text{Th}}} $ 白名单设备$ {w_k} $能允许的最大压制强度 $ P_{{c_q}}^{{\text{Th}}} $ 管制台站$ {c_q} $接收机正常工作的阈值 $ d_{{s_i},{t_j}}^{{\text{2D}}} $ 设备点${s_i}$到典型点${t_j}$的2维距离 $ {d_{{s_i},{t_j}}} $ 设备点${s_i}$到典型点${t_j}$的3维距离 其中,
$$ d_{{s_i},{t_j}}^{{\text{2D}}}{\text{ = }}2\arcsin \sqrt {{{\sin }^2}\frac{{{s_{{\text{lat}}}}(i) - {t_{{\text{lat}}}}(j)}}{2} + \cos ({s_{{\text{lat}}}}(i)) \cdot \cos ({t_{{\text{lat}}}}(j)) \cdot {{\sin }^2}\frac{{{s_{{\text{lon}}}}(i) - {t_{{\text{lon}}}}(j)}}{2}} \times 6\;378.137 $$ (7) $$ {d_{{s_i},{t_j}}}{\text{ = }}\sqrt {{{(d_{{s_i},{t_j}}^{{\text{2D}}})}^2} + {{({s_{\text{h}}}(i) - {t_{\text{h}}}(j))}^2}} $$ (8) 式(8)中,${s_{\text{h}}}(i)$为第$i$个可部署点高度,${t_{\text{h}}}(j)$为第$j$个典型点高度。同理可得设备点${s_i}$到管制台站${c_q}$的3维距离$ {d_{{s_i},{c_q}}} $,设备点${s_i}$到白名单${w_k}$的3维距离${d_{{s_i},{w_k}}}$。
对于典型点,选取管制频段的最高频段,利用式(4)—式(6)计算设备点${s_i}$到典型点${t_j}$路径损耗$ {L_{{s_i},{t_j}}} $,对于管制台站,选取管制台站${c_q}$的工作频段${f_q}({f_q} \in f)$,计算设备点${s_i}$在频点${f_q}$上到管制台站${c_q}$的路径损耗${L_{{s_i},{c_q},{f_q}}}$,对于白名单,选取距离白名单${w_k}$工作频段最近的管制频段${f_w}({f_w} \in f)$,计算设备点${s_i}$在频点${f_w}$上到白名单${w_k}$的路径损耗${L_{{s_i},{w_k},{f_w}}}$。
假定压制设备${s_i}$的发射功率为${P_{{s_i}}}$,压制设备${s_i}$的天线增益为${G_{{s_i}}}$,典型点${t_j}$接收机天线增益为${G_{{t_j}}}$,管制台站${c_q}$接收机天线增益为${G_{{c_q}}}$,白名单${w_k}$接收机天线增益为${G_{{w_k}}}$。则利用式(1)得到设备点${s_i}$到典型点${t_j}$的干扰功率${P_{{s_i},{t_j}}}$为
$$ {P_{{s_i},{t_j}}} = {P_{{s_i}}} - {L_{{s_i},{t_j}}} + {G_{{s_i}}} + {G_{{t_j}}} $$ (9) 式(9)中,${P_{{s_i},{t_j}}}$和${P_{{s_i}}}$的单位均为dBm或dBW。同理,计算设备点${s_i}$到管制台站${c_q}$的干扰功率${P_{{s_i},{c_q}}}$,设备点${s_i}$在频点${f_w}$上到白名单${w_k}$的干扰功率${P_{{s_i},{w_k}}}$。最终得到典型点接收干扰功率矩阵${{\mathbf{P}}_{{\text{rx}}}} = {[{P_{ij}}]_{M \times N}},{P_{ij}} \in \mathbb{R}$,管制台站接收干扰功率矩阵${\bf{P}}{{\bf{C}}_{{\text{rx}}}} = {[{P_{iq}}]_{M \times Q}},{P_{iq}} \in \mathbb{R}$,白名单接收干扰功率矩阵$ {\bf{P}}{{\bf{W}}_{{\text{rx}}}} = {[{P_{ip}}]_{M \times P}},{P_{ip}} \in \mathbb{R} $。
3. 重点区域电磁安全协同管控算法
本节将针对重大活动电磁安全管控场景,设计基于势博弈的压制设备位置部署算法,此外,设计基于遗传算法的协同压制功率优化方法。
3.1 协同电磁压制优化问题建模
协同干扰是指多个电磁压制设备在特定的部署位置和工作方式下,通过在时域、频域、空域和能域等方面协同调度资源和调整行为,以最优方式执行对抗目标的过程。重大活动电磁安全管控的需求在于在整个管控区域内对非法电台和非法频段进行有效管理,同时确保白名单设备的正常运行。因此,在时域上需要在管控时段内持续有效地进行管制;在频域上,要对非法频段进行压制,同时避免对保护频段的影响;在空域方面,应在当前压制资源条件下合理分配各压制设备的位置,通过设备之间的协同合作实现整个区域的精准压制;在能域方面,关键在于自适应调整压制设备的发射功率,以减少资源浪费和避免误伤。综合考虑上述多维因素,可以利用第2节的系统模型建立数学优化问题。
由于需要在多个可部署点位中选择合适的压制设备部署位置,定义二进制指示变量${a_{{s_i}}} \in \left\{ {0,1} \right\}, {s_i} \in S$表示是否选择可部署点位${s_i}$作为压制设备的位置,${a_{{s_i}}} = 1$表示在设备点${s_i}$处放置压制设备。则典型点${t_j}$、管制台站${c_q}$及白名单${w_k}$处压制设备叠加干扰功率可以分别表示为
$$ \left.\begin{aligned} & {P_{{t_j}}} = \sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{t_j}}}} \\ & {P_{{c_q}}} = \sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{c_q}}}} \\ & {P_{{w_k}}} = \sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{w_k}}}} \end{aligned} \right\}$$ (10) 式(10)中,上述功率变量单位均为mW或W。为了定量描述压制效果,定义典型点${t_j}$的压制系数为${K_{{t_j}}}$,管制台站${c_q}$的压制系数为${K_{{c_q}}}$,白名单${w_k}$的压制系数为${K_{{w_k}}}$。根据式(3)得到典型点${t_j}$、管制台站${c_q}$及白名单${w_k}$的干扰功率阈值分别为$P_{{t_j}}^{{\text{th}}}$, $P_{{c_q}}^{{\text{th}}}$, $P_{{w_k}}^{{\text{th}}}$,当接收干扰功率大于等于干扰功率阈值时即为有效压制。
针对精准压制需求构建协同压制优化问题,优化目标函数设定为最小化典型点及管制台站接收干扰功率,优化变量包括:压制设备部署位置${a_{{s_i}}}$及压制设备发射功率${P_{{s_i}}}$作为优化变量。此外,优化问题的约束条件围绕典型点、管制设备以及白名单设备3个对象展开。令$ {\boldsymbol{{A}}} = [{a_{{s_1}}},{a_{{s_2}}}, \cdots ,{a_{{s_M}}}] \in {\mathbb{R}^{1 \times M}} $,${\boldsymbol{{P}}} = [{P_{{s_1}}},{P_{{s_2}}}, \cdots ,{P_{{s_M}}}] \in {\mathbb{R}^{1 \times M}}$ 构建如下优化问题
$$ \left.\begin{aligned} & {\text{(P0)}}:\mathop {\min }\limits_{{\mathbf{{\rm A}}},{\mathbf{{\rm P}}}} \sum\limits_{{t_j} \in T} {\sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{t_j}}} + } } \sum\limits_{{c_q} \in C} {\sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{c_q}}}} } \\ & {\mathrm{s.t}} \\ &\sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{t_j}}}} \ge P_{{t_j}}^{{\text{th}}},\forall {t_j} \in T \\ &\sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{c_q}}}} \ge P_{{c_q}}^{{\text{th}}},\forall {c_q} \in C \\ &\sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{w_k}}}} < P_{{w_k}}^{{\text{th}}},\forall {w_k} \in W \\ &0 \le {P_{{s_i}}} \le P_{{s_i}}^{\max },\forall {s_i} \in S \\ &{a_{{s_i}}} \in \{ 0,1\} ,\forall {s_i} \in S \\[-1pt] \end{aligned}\right\} $$ (11) 式(11)中,目标函数表示最小化典型点及管制台站接收干扰功率,约束条件分别表示所有典型点均满足压制要求,所有管制台站均被有效压制,所有白名单均不受到干扰,以及对压制设备的发射功率进行限定,$P_{{s_i}}^{\max }$表示压制设备${s_i}$的最大发射功率,$ {a_{{s_i}}} $表示二进制指示变量,${a_{{s_i}}} = 1$表示在设备点${s_i}$处放置压制设备。
3.2 基于势博弈的压制设备位置部署算法
本节对于上述优化问题中压制设备部署位置${a_{{s_i}}}$进行求解,固定压制设备${s_i}$发射功率为$P_{{s_i}}^{\max }/2$,则优化问题转化为
$$\left. \begin{aligned} & {\text{(P1)}}:\mathop {\min }\limits_{\boldsymbol{{A}}} \sum\limits_{{t_j} \in T} {\sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{t_j}}} + } } \sum\limits_{{c_q} \in C} {\sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{c_q}}}} } \\ & {\mathrm{ s.t}} \\ & \sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{t_j}}}} \ge P_{{t_j}}^{{\text{th}}},\forall {t_j} \in T \\ & \sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{c_q}}}} \ge P_{{c_q}}^{{\text{th}}},\forall {c_q} \in C \\ & \sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{w_k}}}} < P_{{w_k}}^{{\text{th}}},\forall {w_k} \in W \\ & {a_{{s_i}}} \in \{ 0,1\} ,\forall {s_i} \in S \\[-1pt] \end{aligned}\right\} $$ (12) (P1)问题属于离散优化问题,传统的离散优化问题求解方法通常采用枚举,但在这个问题中,可选的部署点位数量远大于可部署设备的数量。使用传统的枚举方法需要执行${\mathrm{C}}_M^i \times N$次的穷举组合,导致时间复杂度较高,难以在实际工程实践中得到有效应用。另一种常见的解决方法是采用启发式算法,其中贪婪算法是一种典型代表。该算法总是优先选择压制效果最好的可部署点位,直到所有设备都被放置。尽管该算法简单高效,但其缺点在于每次选取局部最优解而不考虑整体情况,且不进行回溯处理,难以获得最优解。相比之下,博弈论方法将可部署点位视为博弈参与者,利用决策理论进行压制设备资源分配,优化目标是达到整体最优。仿真结果表明,采用基于势博弈的压制设备位置部署算法能够接近全局最优解,且显著降低了时间复杂度,更符合实际协同管控需求。
博弈论问题的形成一般包含参与者(Players)、策略空间(Strategy Set)和效用函数(Payoff)3个要素[13,14],策略博弈的通用模型定义为$\varGamma {\text{ = }} < N,{\left\{ {{Y^i}} \right\}_{i \in N}}, {\left\{ {{U_i}} \right\}_{i \in N}} > $,3个要素具体定义如下:
(1) 参与者:能够在博弈中理性决策的决策主体。$n$位参与者组成的博弈称为$n$人博弈,表示为$N = \{ 1,2, \cdots ,n\} $,编号代表每位参与者,用$i \in N$代表博弈中的任意参与者。
(2) 策略空间:是参与者在博弈中为最大化自身利益而制定的行动方案集,它代表了每位参与者在博弈规则下可供选择的多种决策方案,描述了参与者在特定的时间和场合如何进行博弈。策略空间涵盖了策略博弈中的两种形式,即纯策略和混合策略。纯策略是参与者在博弈中选择特定的决策方案,而混合策略则是在纯策略基础上形成的一种概率分布,反映了参与者对多个纯策略的随机选择。设${Y^i}$为第$i$个参与者的纯策略空间,${y^i} \in {Y^i}$是参与者$i$的策略。当$n$个参与者选择自身策略时,形成策略组合$Y = {Y^1} \times {Y^2} \times \cdots \times{Y^n}$。定义$S$为$N$的子集,$ - S$为$S$的补集,${Y^S}$表示笛卡尔乘积,即${ \times _{i \in S}}{Y^i}$。对于单一元素集合$\{ i\} $,${Y^{ - \{ i\} }}$可简写为${Y^{ - i}}$,策略组合$y = ({y^1},{y^2}, \cdots ,{y^n})$可简写为$y = ({y^i},{y^{ - i}}), {y^i} \in {Y^i}, {y^{ - i}} \in {Y^{ - i}},y \in Y$。
(3) 效用函数:指参与者博弈后得到的结果,用于评价参与者决策选择的优劣。参与者$i$的效用函数是${U_i}:Y \to {\rm{R}} $(${\rm{R}}$为实数集),它是策略组合$Y$的函数形式。
博弈理论的核心概念之一是纳什均衡,其物理意义在于在一系列决策后,所有参与者均获得相对较高的利益,从而使得整体局面达到一种稳定状态。在纳什均衡点,任何参与者都缺乏动机偏离其已做出的决策,因为单方面的偏离将导致其个体利益受损。这使得纳什均衡成为一种稳定状态,参与者在这一状态下坚持原有决策,形成一种相互协调的局面。纳什均衡的定义如下:对$\forall i \in N,\forall {y^i} \in {Y^i}$,均满足式(13)时,则称策略组合${y^*} = ({y^{1*}},{y^{2*}}, \cdots ,{y^{n*}})$为纯策略纳什均衡
$$ {U_i}({y^{i*}},{y^{ - i}}) \ge {U_i}({y^i},{y^{ - i}}) $$ (13) 合作式博弈是一种通过参与者之间的协作实现共同目标的博弈形式。势博弈[15]作为其一特殊形式,具有以下优势:首先,势博弈通过对参与者之间相互作用、合作关系以及他们的收益和成本进行分析来求解问题,强调集体理性,注重效率、公正和公平,能够实现整体效益最优。其次,势博弈的关键特性在于参与者的收益函数是否能够映射到一个全局的势函数中,由于势函数具有单调性,因此必然存在纳什均衡。此外,势博弈的定义协调了代表参与者利益的效用函数与代表整体利益的势函数的一致性。因此,合作式博弈中采用势博弈算法适用于解决该问题。
在博弈的初始阶段,势博弈中的每位参与者拥有各自的资源和状态。通过不断的策略选择,参与者达到了对自身而言更优的状态,在有限次的迭代后,博弈会达到纳什均衡点。在这个过程中,参与者的效用函数在全局函数中存在唯一映射,即势函数。势函数和每位参与者的效用函数呈现出一致的变化趋势,因此可以利用全局势函数研究纳什均衡。
势博弈有3种形式:序数势博弈、加权势博弈和完全势博弈。序数势博弈中势函数与每位参与者的收益函数具有一致性,加权势博弈$\varGamma {{ = }} < N,{\left\{ {{Y^i}} \right\}_{i \in N}}, {\left\{ {{U_i}} \right\}_{i \in N}} > $中,若存在函数$G:Y \to R$,对于$\forall i \in N, \forall {y^i} \in {Y^i},\forall x,z \in {Y^i}$,满足
$$ {U_i}(x,{y^{ - i}}) - {U_i}(z,{y^{ - i}}) = {w_i}[G(x,{y^{ - i}}) - G(z,{y^{ - i}})] $$ (14) ${w_i}$为权重,称博弈为加权势博弈。特别地,${w_i} = 1$时为完全势博弈。
通过对博弈论及势博弈基本概念的描述,势博弈完全具备压制设备位置部署算法应具备的特点,概括而言就是:
(1) 势博弈的参与者即为可部署设备点位,设定目标函数为各典型点和管制台站处接收功率的标准差和白名单误伤总数的加权和,作为博弈的效用函数。参与者在独立决策并追求效用最大化的过程中,能够反映不同利益主体的自主性和自利性。在势博弈中,效用函数与势函数的增量一致性有助于协调压制设备个体与整体部署效果的一致性。
(2) 有限势博弈的必然收敛性能够应对压制设备位置部署的动态变化。
在压制设备位置部署博弈中,压制设备仅需与环境进行信息交互,其收益由压制效果与误伤效果的加权和构成。通过对该博弈模型的分析,容易得出在给定势函数的情况下,该博弈为完全势博弈,且存在纳什均衡。因此,通过分布式博弈实现纳什均衡,系统能够获得稳定的压制设备部署方案解。
基于势博弈的压制设备位置部署问题建模如下,设有$M$个可部署设备点位置集合为$S = \left\{ {{s_1},{s_2}, \cdots ,{s_M}} \right\}$,设备点${s_i}$的策略为${a_{{s_i}}}$,${{A}_{{s_i}}}$为设备点${s_i}$的策略集,$\forall {a_{{s_i}}} \in {{A}_{{s_i}}}$。博弈中的策略空间${A}$表示博弈中所有策略的集合,等于所有设备点策略集合的和
$$ {A} = \sum\limits_{{s_i} \in S} {{{A}_{{s_i}}}} $$ (15) 当设备点${s_i}$做出策略${a_{{s_i}}}$时,除设备点${s_i}$外其它设备点的策略组合记为
$$ {a_{ - {s_i}}} = ({a_{{s_1}}},{a_{{s_2}}},{a_{{s_{i - 1}}}}, \cdots ,{a_{{s_{i + 1}}}}, \cdots ,{a_{{s_M}}}) $$ (16) 用$a = ({a_{{s_i}}},{a_{ - {s_i}}})$表示所有设备点某一特定的联合策略。边缘节点的目标是最大化自身的收益,在某一特定策略$a$下,设备点${s_i}$的收益函数
$$ {u_{{s_i}}}({a_{{s_i}}},{a_{ - {s_i}}}) = w{U_{1{s_i}}} + (1 - w){U_{2{s_i}}} $$ (17) 式(17)中,${U_{1{s_i}}}$为${a_{{s_i}}} = 1$的典型点及管制台站的干扰功率标准差,${U_{2{s_i}}}$为${a_{{s_i}}} = 1$的白名单误伤数量归一化结果
$$ {U_{1{s_i}}} = \sqrt {\frac{1}{{N + Q - 1}}\left( {\sum\limits_{{t_j} \in T} {{{\left( {\sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{t_j}}} - \bar P} } \right)}^2} + \sum\limits_{{c_q} \in C} {{{\left( {\sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{c_q}}} - \bar P} } \right)}^2}} } } \right)} $$ (18) $$ {U_{2{s_i}}} = \frac{{{w_{{\text{in}}}}}}{P} \qquad\qquad\qquad $$ (19) 式(19)中,$P$为白名单数量,${w_{{\text{in}}}}$为受扰白名单数量。$\bar P$为典型点及管制台站的平均干扰功率
$$ \bar P = \frac{1}{{N + Q}}\left( {\sum\limits_{{t_j} \in T} {\sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{t_j}}}} } {{ + }}\sum\limits_{{c_q} \in C} {\sum\limits_{{s_i} \in S} {{a_{{s_i}}}{P_{{s_i},{c_q}}}} } } \right) $$ (20) 故压制设备位置部署势博弈可表示为
$$ G = \{ S,{A},{\{ {u_{{s_i}}}\} _{{s_{i \in S}}}}\} $$ (21) 式(21)中,$S$为设备点集合,${A}$为博弈的策略空间,$ {u_{{s_i}}} $为收益函数。
采用基于势博弈的压制设备位置部署算法来求解设计的博弈的纯策略纳什均衡。算法的执行过程如下:首先,进行博弈状态初始化;其次,在随机生成的一组可部署方案上开始迭代。在每轮迭代中,执行一次势博弈过程,比较博弈效用函数,直至算法达到收敛状态。
步骤1 博弈变量状态初始化
设置收敛阈值$\varepsilon $,典型点干扰功率阈值$P_{{t_j}}^{{\text{th}}}$,管制台站干扰功率阈值$P_{{c_q}}^{{\text{th}}}$,白名单误伤阈值$ P_{{w_k}}^{{\text{th}}} $。初始化效用函数最小值$ U_{\min }^0 = \infty $。
步骤2 随机产生可部署设备方案
给定可选部署位置信息和最大部署设备数量,产生一组可部署设备位置方案$V = \{ {v_{{d_1}}},{v_{{d_2}}}, \cdots ,{v_{{d_I}}}\} $,对于$\forall {v_{{d_x}}} \in S$表示设备${d_x}$所部署的设备点索引。
步骤3 计算可部署设备方案博弈效用值
利用典型点接收干扰功率矩阵${{\mathbf{P}}_{{\text{rx}}}} = {[{P_{{s_i},{t_j}}}]_{M \times N}}, {P_{{s_i},{t_j}}} \in \mathbb{R}$,管制台站接收干扰功率矩阵${\bf{P}}{{\bf{C}}_{{\text{rx}}}}\; = {[{P_{{s_i},{c_q}}}]_{M \times Q}}, {P_{{s_i},{c_q}}} \in \mathbb{R}$,计算方案$v$下叠加在典型点及管制台站的接收干扰功率为
$$ P_{{t_j}}^{{\text{sum}}} = \sum\limits_{{v_{{d_x}}} \in V} {{P_{{v_{{d_x}}},{t_j}}}} $$ (22) $$ P_{{c_q}}^{{\text{sum}}} = \sum\limits_{{v_{{d_x}}} \in V} {{P_{{v_{{d_x}}},{c_q}}}} $$ (23) 若对于$\forall {t_j} \in T$,$\forall {c_q} \in C$,均有$P_{{t_j}}^{{\text{sum}}} \ge P_{{t_j}}^{{\text{th}}}$,$P_{{c_q}}^{{\text{sum}}} \ge P_{{c_q}}^{{\text{th}}}$,则认为该部署能够达到压制效果,否则返回步骤2。利用式(18)计算所有典型点及管制台站接收干扰功率的标准差,衡量压制强度分布的均匀程度,作为效用值${U_1}$。
利用白名单接收干扰功率矩阵${\bf{P}}{{\bf{W}}_{{\text{rx}}}} = {[{P_{{s_i},{w_k}}}]_{M \times P}}, {P_{{s_i},{w_k}}} \in \rm{R}$,计算方案$v$下叠加在白名单处的接收干扰功率为
$$ P_{{w_k}}^{{\text{sum}}} = \sum\limits_{{v_{{d_x}}} \in V} {{P_{{v_{{d_x}}},{w_k}}}} $$ (24) 对于$\forall {w_k} \in W$,若$P_{{w_k}}^{{\text{sum}}} < P_{{w_k}}^{{\text{th}}}$,则认为该部署方案下,对该白名单设备没有产生误伤;否则认为会产生误伤,误伤数加一。利用式(19)计算白名单误伤数量归一化结果,作为效用值${U_2}$。综合考虑压制效果和误伤情况,对平均接收功率标准差${U_1}$和白名单误伤数${U_2}$加权,权重为$w$,设置效用函数$U$
$$ U = w \cdot {U_1} + (1 - w) \cdot {U_2} $$ (25) 步骤4 判断收敛
比较当前效用函数$U$和效用函数最小值${U_{\min }}$,若$\left| {U - {U_{\min }}} \right| < \varepsilon $ ,则认为算法已经收敛,迭代停止。若$U \le {U_{\min }}$,则效用函数$U$对应设备部署位置为博弈算法优化得到的最优设备部署位置方案,否则此前${U_{\min }}$对应设备部署位置为最优设备部署位置方案。若未收敛,记录此时最小效用值${U_{\min }}$及其对应设备部署位置方案,返回步骤2,算法继续。
表 1 基于势博弈的压制设备位置部署算法输入:${{\mathbf{P}}_{{\text{rx}}}}$, $ {\bf{P}}{{\bf{C}}_{{\text{rx}}}} $, ${\bf{P}}{{\bf{W}}_{{\text{rx}}}}$, $P_{{t_j}}^{{\text{th}}}$, $P_{{c_q}}^{{\text{th}}}$, $ P_{{w_k}}^{{\text{th}}} $ 初始化: (1) 设置收敛阈值$\varepsilon $ (2) 初始化效用函数最小值$ {U_{\min }} = \infty $,迭代变量$r = 1$ Repeat 随机产生一组可部署设备方案${V^r} = \{ v_{{d_1}}^r,v_{{d_2}}^r, \cdots ,v_{{d_I}}^r\} $ $P_{{t_j}}^{{\text{sum}},r} \leftarrow $利用式(22)计算叠加在典型点的接收干扰功率 $P_{{c_q}}^{{\text{sum}},r} \leftarrow $利用式(23)计算叠加在管制台站的接收干扰功率 for $t = 1:N,q = 1:Q$ do if $P_{{t_j}}^{{\text{sum}},r} \ge P_{{t_j}}^{{\text{th}}}$,$P_{{c_q}}^{{\text{sum}}} \ge P_{{c_q}}^{{\text{th}}}$ then ${U^r} \leftarrow $利用式(18),式(19),式(20),式(24),式(25)计算
效用函数$ {U_{\min }} \leftarrow $更新效用函数最小值 else $r = r + 1$ end if end for Until $\left| {{U^r} - {U_{\min }}} \right| < \varepsilon $ 输出:${V^*} \leftarrow $根据最小效用函数得到最优设备方案 3.3 基于遗传算法的协同压制功率优化方法
本节基于上节得到的最优压制设备位置部署方案${V^*} = \{ v_{{d_1}}^*,v_{{d_2}}^*, \cdots ,v_{{d_I}}^*\} $,$I$为压制设备数,进行压制设备发射功率的优化。由于需要最小化典型点及管制台站接收干扰功率,因此在压制设备位置确定的基础上,将压制典型点处实际压制强度与压制要求间的均方误差最小化作为优化目标,将典型点、管制台站的压制要求和避免白名单误伤作为优化问题的约束条件,各个压制设备的工作功率${P_{v_{{d_i}}^*}}(v_{{d_i}}^* \in V*)$设为优化变量,利用式(22),式(23),式(24)计算得到$ {P_{t_j^*}},{P_{c_q^*}},{P_{w_k^*}} $分别为在最优部署方案${V^*}$下典型点${t_j}$、管制台站${c_q}$和白名单${w_k}$处的叠加功率。构建优化问题如下
$$ \left.\begin{aligned} & {\text{(P2):}}\mathop {\min }\limits_{\mathbf{P}} \frac{1}{{N + Q}}\\ & \sqrt {\sum\limits_{{t_j} \in T} {({P_{t_j^*}} - P_{{t_j}}^{{\text{th}}}} {)^2} + \sum\limits_{{c_q} \in C} {({P_{c_q^*}} - P_{{c_q}}^{{\text{th}}}} {)^2}} \\ & {\mathrm{s.t}} \\ & {P_{t_j^*}} \ge P_{{t_j}}^{{\text{th}}},\forall {t_j} \in T \\ & {P_{c_q^*}} \ge P_{{c_q}}^{{\text{th}}},\forall {c_q} \in C \\ & {P_{w_k^*}} < P_{{w_k}}^{{\text{th}}},\forall {w_k} \in W \end{aligned}\right\} $$ (26) 针对式(26)的功率优化问题,利用启发式搜索算法进行优化求解。遗传算法(Genetic Algorithms, GA)作为群智能算法的典型代表最早由J.Holland教授[16]提出,类似于自然界中生物进化过程,遗传算法采用优胜劣汰的原则对群体进行筛选,最终只有经过精心筛选的个体才能存活下来。与传统的优化方法(如枚举法)不同,遗传算法是一种自适应的全局优化概率搜索算法,具有以下特点[17]:(1)多样的编码方式,具有较好的通用性;(2)基于目标函数的评价信息搜索,无需目标函数具有连续性和可导性;(3)具有隐藏的并行性,收敛速度快。它以一组点作为起始点,有效提高了收敛于全局最优解的效率。
图3为遗传算法实现流程图,本节的目标是在压制设备位置确定后进行发射功率优化,得到每个压制设备的最优功率配置。压制设备的所有功率方案构成种群${\mathrm{Chrom}}$是一个2维矩阵,假设种群大小为$M$,不同功率方案作为个体,压制设备个数$I$为个体的染色体长度,每个压制设备的发射功率${P_{v_{{d_i}}^*}} \in [1,P_{v_{{d_i}}^*}^{\max }](\forall v_{{d_i}}^* \in V*)$作为个体的基因$ {g_{x,y}},\forall x \in [1,M],y \in [1,I] $,得到种群如下
$$ {\bf{Chrom}} = \left( {\begin{array}{*{20}{c}} {{g_{1,1}}}&{{g_{1,2}}}& \cdots &{{g_{1,I}}} \\ {{g_{2,1}}}&{{g_{2,2}}}& \cdots &{{g_{2,I}}} \\ \vdots & \vdots & \ddots & \vdots \\ {{g_{M,1}}}&{{g_{M,2}}}& \cdots &{{g_{M,I}}} \end{array}} \right) $$ (27) 式(27)中,每一行对应一个个体的染色体,即压制设备的一个功率方案,${g_{x,y}}$对应个体$x(x \in [1,M])$的基因值,即压制设备$j(j \in [1,I])$的发射功率。则基于遗传算法的协同压制功率优化方法建模如下
$$ {\mathrm{SGA}} = (C,F,{P_0},M,\varPhi ,\varGamma ,\varOmega ,T). $$ (28) 式(28)中,$C$表示个体的编码方案,$F$表示个体适应度评价函数,${P_0}$表示初始种群,$M$表示种群大小,$ \varPhi $表示选择算子,$ \varGamma $表示交叉算子,$ \varOmega $表示变异算子,$T$表示遗传算法终止条件。具体实现步骤如下:
步骤1 编码和产生初始种群
设置最大进化代数$T$。算法采用实数编码,根据式(27)个体表示为${\mathbf{X}} = [{g_{x,1}}{g_{x,2}} \cdots {g_{x,y}} \cdots {g_{x,I}}]$,$I$即压制设备的个数。在压制设备的工作功率范围$[1,P_{v_{{d_i}}^*}^{\max }]$内随机产生规模为$M$的个体,$M$为种群规模,每个个体取值${g_{x,y}} \in [1,P_{v_{{d_i}}^*}^{\max }]$,作为初始种群${P_0}$。
步骤2 计算各个个体的适应度
适应度函数用来评估进化个体的优劣,是遗传进化过程中个体优胜劣汰的驱动力。个体的适应度与目标函数值、约束条件的违反条件有关,若满足所有约束条件,适应度为目标函数值;若违反约束条件,则采取罚函数方法来计算个体的适应度,表述如下:
$$ \begin{split} f = \,&\frac{{\sqrt {\displaystyle\sum\limits_{{t_j} \in T} {({P_{{t_j}}} - P_{{t_j}}^{{\text{th}}}} {)^2}} }}{N} \\ \,& + {M_1} \sum\limits_{{t_j} \in T} {\min \{ 0,{P_{{t_j}}} - P_{{t_j}}^{{\text{th}}}\} } \\ \,& +{M_1} \cdot \sum\limits_{{c_q} \in C} {\min \{ 0,{P_{{c_q}}} - P_{{c_q}}^{{\text{th}}}\} } \\ & + {M_2} \cdot \sum\limits_{{w_k} \in W} {\min \{ 0,P_{{w_k}}^{{\text{th}}} - {P_{{w_k}}}\} } , \end{split} $$ (29) 式(29)中,${M_1}$为典型点和管制台站的约束条件对应的罚函数系数;${M_2}$为白名单设备的约束条件对应的罚函数系数。在本压制场景中,必须保证压制典型点和管制设备处的满足要求,尽可能地满足白名单正常工作,因此需要满足${M_1} \ge {M_2}$。
步骤3 选择运算
淘汰适应度值较小的种群个体,保留适应度较大的个体进行后续的进化操作。本文采用的随机遍历抽样(Stochastic Universal Sampling, SUS)是基于轮盘赌选择(Roulette Wheel Selection, RWS)的改进版本。在RWS中,首先将个体的适应度值映射到轮盘上,适应度值越大的个体在轮盘上被分配的角度越大,因此其被选中的概率也越大。然而,RWS存在一个缺点,即在选择n个个体时需要旋转n次轮盘。为了改进这一问题,SUS引入了一种更高效的选择方法。在SUS中,如果需要选择n个个体,只需一次生成n个等间距的标记指针位置,即可选择出n个个体。这种方法有效防止了个体被过分反复选择的情况,从而避免了具有特别高适应度的个体垄断下一代。若个体$i$的适应度为${f_i}$,则个体$i$被选取的概率${P_i}$为
$$ {P_i} = \frac{{{f_i}}}{{\displaystyle\sum\limits_{k = 1}^M {{f_k}} }} $$ (30) 式(30)中,$M$为种群大小。如果个体的选择概率较大,那么它被选中的机会就相对较高,从而使其遗传基因在整个种群中扩展;反之,如果个体的选择概率较小,那么被淘汰的可能性就会增大。这样的选择机制有效地反映了个体在进化过程中的贡献,高适应度的个体更有可能在交叉过程中传递其遗传信息,从而促进了种群的演化。
步骤4 交叉运算
随机从保留的种群个体中选择两个不同的个体进行交叉运算,产生新的种群。设置交叉概率为${P_{\text{c}}} \in [0.4,0.99]$,为了增加个体的多样性,提高遗传算法的全局寻优能力,本文采用算术交叉(Arithmetic Crossover),由两个个体的线性组合而产生出两个新的个体
$$ \left. \begin{aligned} & {X_{\text{A}}^{t + 1} = aX_{\text{B}}^t + (1 - a)X_{\text{A}}^t} \\ & {X_{\text{B}}^{t + 1} = aX_{\text{A}}^t + (1 - a)X_{\text{B}}^t} \end{aligned} \right\} $$ (31) 式(31)中,$ X_{\text{A}}^t,X_{\text{B}}^t $为第$t$代种群中两个用于交叉操作的父代染色体,$ X_{\text{A}}^{t + 1},X_{\text{B}}^{t + 1} $为两父代染色体线性组合后产生的两个新的子代个体,$a$为控制参数,在$(0,1)$之间取值。
步骤5 变异运算
在交叉运算后形成的新个体,有一定的概率会发生基因变异,设置变异概率${P_{\text{m}}} \in [0.001,0.05]$。变异的目的是增加种群的多样性,而不至于出现比较优秀的个体,造成基因垄断,从而陷入局部最优。本文采用均匀变异(Uniform Mutation)用符合某一范围内均匀分布的随机数,以某一较小的概率来替换个体编码串中各个基因座上的原有基因值。设个体为${\mathbf{X}} = [{x_1}{x_2} \cdots {x_k} \cdots {x_n}]$,若${x_k}$为变异点,其取值范围为$[U_{\min }^k,U_{\max }^k]$,在该点对个体进行均匀变异操作后,得到一个新的个体${\mathbf{X}} = [{x_1}{x_2} \cdots x'_k \cdots {x_n}]$,变异点的新基因值为
$$ x'_k = U_{\min }^k + r \cdot (U_{\max }^k - U_{\min }^k) $$ (32) 式(32)中,$r$为$(0,1)$范围内符合均匀概率分布的一个随机数。
步骤6 终止条件
若进化代数达到设定的最大遗传代数,则停止迭代,以进化过程中所得到的具有最大适应度的个体作为最好的解输出;反之,则转至步骤3继续迭代。
基于遗传算法的协同压制功率优化方法见算法2。
表 2 基于遗传算法的协同压制功率优化方法输入:${{\mathbf{P}}_{{\text{rx}}}}$, $ {\bf{P}}{{\bf{C}}_{{\text{rx}}}} $, ${\bf{P}}{{\bf{W}}_{{\text{rx}}}}$, $P_{{t_j}}^{{\text{th}}}$, $P_{{c_q}}^{{\text{th}}}$, $ P_{{w_k}}^{{\text{th}}} $ 初始化: (1) 设置最大进化代数$T$,交叉概率${P_{\text{c}}}$,变异概率${P_{\text{m}}}$,种群规模$M$ (2) 初始化种群${P_0}$并计算当前种群中各个体的适应度,迭代变量$t = 0$ while $t < T$ do $t = t + 1$ ${P_{\text{s}}} \leftarrow $利用式(29),式(30)计算适应度得到每个个体的选择概率 ${\mathrm{chroms}} \leftarrow $根据${P_s}$随机选择个体 $({{\mathrm{chrom}}_1},{{\mathrm{chrom}}_2}) \leftarrow $根据交叉概率${P_{\text{c}}}$随机生成需要交叉的个体 $({{\mathrm{child}}_1},{{\mathrm{child}}_2}) \leftarrow $利用式(31)生成新的交叉子代个体 ${\mathrm{chrom}} \leftarrow $根据变异概率${P_{\text{m}}}$随机生成需要变异的个体 ${\mathrm{child}} \leftarrow $利用式(32)生成新的变异子代个体 end while 输出:${P_{{T_{{\text{opt}}}}}} \leftarrow $最大适应度个体 4. 算法仿真与结果分析
西安电子科技大学北校区占地面积1 km×1 km,地理位置位于复杂城区环境,同时拥有密集建筑物和平坦开阔地区。由于其地理、环境、面积等因素与重大安保活动的展开高度契合,因此选择该校区作为算法开发的应用场景。在仿真中采用UMi-Street Canyon模型用于估算城市场景的传输损失,在整个区域均匀分布有20个可部署设备点、40个压制典型点、3个管制台站点和10个白名单点,以及若干台压制设备;采用噪声调频干扰样式,压制系数设定为1 dB。在典型点处,接收机正常工作的阈值为–60 dBm,管制台站正常工作的阈值为–65 dBm,白名单可接受的最大干扰为–55 dBm。压制频段涵盖409~410 MHz, 825~835 MHz, 870~880 MHz, 1 920~1 935 MHz。
图4仿真结果表明,在不同设备数下,采用随机、贪婪、遍历和博弈算法的最优部署情况下标准差的对比。标准差的大小反映了压制效果分布的均匀程度,较小的标准差表示压制效果分布更加均匀,系统具有更高的稳定性和鲁棒性。在设备数量为1~3时,无法满足整个区域的压制需求,因此需要增加设备数量。从图中可以看到,随机算法通过任意选取设备部署位置,导致典型点标准差较大;贪婪算法核心在于每一步都选择在当前状态下最好或最优的设备,即尽可能选择使典型点标准差较小的设备进行部署,然而贪婪算法在每一步得到的局部最优解未能很好地反映全局效果,因此结果略优于随机算法但逊于遍历和博弈算法;遍历和博弈算法的典型点标准差随设备数的增加而递减,因为设备数的增加使得压制功率分布更加均匀,总体而言,遍历算法的结果略优于博弈算法,因为遍历获得全局最优解,尽管在最差情况下,博弈与遍历算法的标准差仅相差约0.5 dBm。然而,博弈算法相对于遍历大大降低了时间复杂度,更适用于实际工程需求。
图5仿真结果表明,在不同设备数下,采用随机、贪婪、遍历和博弈算法的最优部署情况下白名单误伤数的对比。白名单误伤数用于评估压制效果的有害干扰程度,数值越小表示压制设备产生的有害干扰越小。观察图中结果可知,随机算法的白名单误伤数整体较大,并呈现波动性;其次是贪婪算法,其误伤数在设备数量超过5个时稳定在2左右;而遍历和博弈算法的白名单误伤数均为零,遍历算法由于能够找到全局最优解,因此白名单误伤数始终为零,博弈算法在极短时间内找到近似全局最优解,达到与遍历算法相当的零误伤结果。
图6给出了压制设备数量为4~6时遗传算法的收敛情况。观察图中结果可知,当设备数量为4时,目标函数值在30代左右达到收敛;当设备数量为5时,目标函数值在40代左右收敛;而设备数量为6时,目标函数值在70代左右收敛,收敛速度随着设备数量的增加而减小。此外,收敛后的目标函数值反映了典型点均方误差的大小,设备数量越多,收敛后的目标函数值越小。遗传算法的快速收敛特性能够迅速对压制设备的功率进行调整,以适应压制场景内的突发情况。
图7仿真结果表明,在不同设备数下,固定发射功率与经过遗传算法功率优化后的典型点均方误差的对比。其中,固定发射功率分别为36 dBm, 44 dBm, 47 dBm, 49 dBm和50 dBm。这里的固定发射功率表示未经过功率优化,每个压制设备的发射功率都设定为某个特定的数值,随着设备数的增加,典型点均方误差也相应增大。同时,固定发射功率越大,对应的典型点均方误差也越大,这是由于粗放式的大功率压制而导致资源浪费。遗传算法代表了功率优化后的情况,通过调整压制设备的发射功率,随着设备数的增加,典型点均方误差呈下降趋势。可以看到,降低发射功率到最低档位5 W(36 dBm),在设备数较少的情况下,固定发射功率和遗传算法的结果近似,但随着设备数的增加,遗传算法的结果仍在整体上优于固定发射功率的结果。实验结果表明,遗传算法能够使压制方案的均方误差保持在较低水平,减少了资源浪费,实现电磁压制的“精准化”。
5. 结束语
本文面向重大安保活动,针对重点区域常态化封控需求,基于电波传播计算模型和无线电压制机理,通过势博弈和遗传算法优化理论等方法求解最优协同管控策略,生成警用压制设备协同压制规划部署和参数配置方案,实现重点区域的高效、均匀化封控,避免干扰范围扩大和干扰误伤。仿真结果表明,上述算法在实际安保活动中具有明显的优势,以提升公安机关重大活动安保任务的协同、精准管控能力。
-
表 1 符号的定义
符号 定义 $i$ 可部署设备点索引$,i \in [1,M]$ $j$ 典型点索引$,j \in [1,N]$ $k$ 白名单索引$,k \in [1,P]$ $q$ 管制台站索引$,q \in \left[ {1,Q} \right]$ $ P_{{t_j}}^{{\text{Th}}} $ 典型点$ {t_j} $接收机正常工作的阈值 $ P_{{w_k}}^{{\text{Th}}} $ 白名单设备$ {w_k} $能允许的最大压制强度 $ P_{{c_q}}^{{\text{Th}}} $ 管制台站$ {c_q} $接收机正常工作的阈值 $ d_{{s_i},{t_j}}^{{\text{2D}}} $ 设备点${s_i}$到典型点${t_j}$的2维距离 $ {d_{{s_i},{t_j}}} $ 设备点${s_i}$到典型点${t_j}$的3维距离 1 基于势博弈的压制设备位置部署算法
输入:${{\mathbf{P}}_{{\text{rx}}}}$, $ {\bf{P}}{{\bf{C}}_{{\text{rx}}}} $, ${\bf{P}}{{\bf{W}}_{{\text{rx}}}}$, $P_{{t_j}}^{{\text{th}}}$, $P_{{c_q}}^{{\text{th}}}$, $ P_{{w_k}}^{{\text{th}}} $ 初始化: (1) 设置收敛阈值$\varepsilon $ (2) 初始化效用函数最小值$ {U_{\min }} = \infty $,迭代变量$r = 1$ Repeat 随机产生一组可部署设备方案${V^r} = \{ v_{{d_1}}^r,v_{{d_2}}^r, \cdots ,v_{{d_I}}^r\} $ $P_{{t_j}}^{{\text{sum}},r} \leftarrow $利用式(22)计算叠加在典型点的接收干扰功率 $P_{{c_q}}^{{\text{sum}},r} \leftarrow $利用式(23)计算叠加在管制台站的接收干扰功率 for $t = 1:N,q = 1:Q$ do if $P_{{t_j}}^{{\text{sum}},r} \ge P_{{t_j}}^{{\text{th}}}$,$P_{{c_q}}^{{\text{sum}}} \ge P_{{c_q}}^{{\text{th}}}$ then ${U^r} \leftarrow $利用式(18),式(19),式(20),式(24),式(25)计算
效用函数$ {U_{\min }} \leftarrow $更新效用函数最小值 else $r = r + 1$ end if end for Until $\left| {{U^r} - {U_{\min }}} \right| < \varepsilon $ 输出:${V^*} \leftarrow $根据最小效用函数得到最优设备方案 2 基于遗传算法的协同压制功率优化方法
输入:${{\mathbf{P}}_{{\text{rx}}}}$, $ {\bf{P}}{{\bf{C}}_{{\text{rx}}}} $, ${\bf{P}}{{\bf{W}}_{{\text{rx}}}}$, $P_{{t_j}}^{{\text{th}}}$, $P_{{c_q}}^{{\text{th}}}$, $ P_{{w_k}}^{{\text{th}}} $ 初始化: (1) 设置最大进化代数$T$,交叉概率${P_{\text{c}}}$,变异概率${P_{\text{m}}}$,种群规模$M$ (2) 初始化种群${P_0}$并计算当前种群中各个体的适应度,迭代变量$t = 0$ while $t < T$ do $t = t + 1$ ${P_{\text{s}}} \leftarrow $利用式(29),式(30)计算适应度得到每个个体的选择概率 ${\mathrm{chroms}} \leftarrow $根据${P_s}$随机选择个体 $({{\mathrm{chrom}}_1},{{\mathrm{chrom}}_2}) \leftarrow $根据交叉概率${P_{\text{c}}}$随机生成需要交叉的个体 $({{\mathrm{child}}_1},{{\mathrm{child}}_2}) \leftarrow $利用式(31)生成新的交叉子代个体 ${\mathrm{chrom}} \leftarrow $根据变异概率${P_{\text{m}}}$随机生成需要变异的个体 ${\mathrm{child}} \leftarrow $利用式(32)生成新的变异子代个体 end while 输出:${P_{{T_{{\text{opt}}}}}} \leftarrow $最大适应度个体 -
[1] KONG Deqiang, YANG Baoping, and LI Fei. Research on prototype system for electromagnetic spectrum management and control based on GIS[C]. Proceedings of the 8th Annual International Conference on Network and Information Systems for Computers, Hangzhou, China, 2022. doi: 10.1109/ICNISC57059.2022.00156. [2] HAR D, WATSON A M, and CHADNEY A G. Comment on diffraction loss of rooftop-to-street in COST 231-Walfisch-Ikegami model[J]. IEEE Transactions on Vehicular Technology, 1999, 48(5): 1451–1452. doi: 10.1109/25.790519. [3] WALFISCH J and BERTONI H L. A theoretical model of UHF propagation in urban environments[J]. IEEE Transactions on Antennas and Propagation, 1988, 36(12): 1788–1796. doi: 10.1109/8.14401. [4] MEDEISIS A and KAJACKAS A. On the use of the universal Okumura-Hata propagation prediction model in rural areas[C]. Proceedings of the IEEE 51st Vehicular Technology Conference Proceedings, Tokyo, Japan, 2000: 1815–1818. doi: 10.1109/VETECS.2000.851585. [5] 杨鸿杰. 基于强化学习的智能通信干扰决策技术研究[D]. [硕士论文], 中国电子科技集团公司电子科学研究院, 2019. doi: 10.27728/d.cnki.gdzkx.2019.000061.YANG Hongjie. Research on intelligent communication jamming decision-making technology based on reinforcement learning[D]. [Master dissertation], China Academic of Electronics and Information Technology, 2019. doi: 10.27728/d.cnki.gdzkx.2019.000061. [6] 韩鹏, 卢俊道, 王晓丽. 利用于博弈论的雷达有源干扰资源分配算法[J]. 现代防御技术, 2018, 46(4): 53–59. doi: 10.3969/j.issn.1009-086x.2018.04.009.HAN Peng, LU Jundao, and WANG Xiaoli. Radar active jamming resource assignment algorithm based on game theory[J]. Modern Defence Technology, 2018, 46(4): 53–59. doi: 10.3969/j.issn.1009-086x.2018.04.009. [7] 李冯敬, 姚佩阳, 张杰勇, 等. 基于多Agent的分布式通信对抗目标分配系统[J]. 计算机工程, 2012, 38(12): 283–286,290. doi: 10.3969/j.issn.1000-3428.2012.12.083.LI Fengjing, YAO Peiyang, ZHANG Jieyong, et al. Distributed communication countermeasures target assignment system based on multi-agent[J]. Computer Engineering, 2012, 38(12): 283–286,290. doi: 10.3969/j.issn.1000-3428.2012.12.083. [8] 薛羽, 庄毅, 朱浩, 等. 求解协同干扰问题的高效免疫遗传算法[J]. 电子科技大学学报, 2013, 42(3): 453–458. doi: 10.3969/j.issn.1001-0548.2013.03.026.XUE Yu, ZHUANG Yi, ZHU Hao, et al. Efficiently immune genetic algorithm for solving cooperative jamming problem[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(3): 453–458. doi: 10.3969/j.issn.1001-0548.2013.03.026. [9] TAN Junjie, LIANG Yingchang, ZHANG Lin, et al. Deep reinforcement learning for joint channel selection and power control in D2D networks[J]. IEEE Transactions on Wireless Communications, 2021, 20(2): 1363–1378. doi: 10.1109/TWC.2020.3032991. [10] 白琦. 基于多干扰源环境下动态功率分配的电磁压制系统设计[D]. [硕士论文], 西安电子科技大学, 2012.BAI Qi. The designment of electromagnetic compaction system based on dynamic power allocation in the environment of multiple interference sources[D]. [Master dissertation], Xidian University, 2012. [11] 彭翔, 许华, 蒋磊, 等. 一种基于深度强化学习的动态自适应干扰功率分配方法[J]. 电子学报, 2023, 51(5): 1223–1234. doi: 10.12263/DZXB.20220391.PENG Xiang, XU Hua, JIANG Lei, et al. A dynamic adaptive jamming power allocation method based on deep reinforcement learning[J]. Acta Electronica Sinica, 2023, 51(5): 1223–1234. doi: 10.12263/DZXB.20220391. [12] FRIIS H T. A note on a simple transmission formula[J]. Proceedings of the IRE, 1946, 34(5): 254–256. doi: 10.1109/JRPROC.1946.234568. [13] ETSI. ETSI TR 138 901-2020 5G; Study on channel model for frequencies from 0.5 to 100 GHz[S]. ETSI, 2020. [14] VENNILA N L, KUMAR S, and KUMAR J R R. Game theory based method for spectrum management in cognitive radio-WSN applications[C]. Proceedings of the 2nd Asian Conference on Innovation in Technology, Ravet, India, 2022: 1–5. doi: 10.1109/ASIANCON55314.2022.9909191. [15] MONDERER D and SHAPLEY L S. Potential games[J]. Games and Economic Behavior, 1996, 14(1): 124–143. doi: 10.1006/game.1996.0044. [16] SAMPSON J R. Adaptation in natural and artificial systems (John H. Holland)[J]. SIAM Review, 1976, 18(3): 529–530. doi: 10.1137/1018105. [17] ANWAAR A, ASHRAF A, BANGYAL W H K, et al. Genetic algorithms: Brief review on genetic algorithms for global optimization problems[C]. Proceedings of the 2022 Human-Centered Cognitive Systems, Shanghai, China, 2022: 1–6. doi: 10.1109/HCCS55241.2022.10090327. -