An Anti-jamming Power Control Algorithm for Wireless Communication System Based on Disturbance Observer
-
摘要: 在快速变化的干扰环境下,无线通信系统传输可靠性会受到很大影响。为提升快速时变干扰环境下无线通信系统传输的可靠性,该文提出一种基于干扰观测的无线通信系统抗干扰功率控制算法。该算法首先将受到干扰影响的无线通信系统建模为广义稳定性控制系统,并采用干扰观测器生成系统状态受干扰影响的估计值。然后通过利用估计值来预测未来的跟踪误差和稳态的控制输入,优化系统的控制策略以实现对干扰环境的自适应调整。最后仿真结果表明,与传统方法相比,所提算法能够快速响应干扰变化,显著提高系统在快速时变恶意干扰下传输的可靠性,提高了系统对干扰环境的适应能力。Abstract: In the rapidly changing jamming environment, the transmission reliability of wireless communication systems can be significantly impacted. To enhance the transmission reliability of wireless communication systems under such fast-changing jamming conditions, a disturbance observer-based anti-jamming power control algorithm is proposed. The proposed algorithm first models the wireless communication system affected by jamming as a generalized stability control system and utilizes a disturbance observer to generate estimated values of the system state impacted by jamming. Subsequently, by using these estimated values to predict future tracking errors and steady-state control inputs, the algorithm optimizes the system's control strategy to achieve adaptive adjustments in response to the jamming environment. The simulation results demonstrate that, compared to conventional methods, the proposed algorithm can rapidly respond to changes in jamming, significantly improving the system’s transmission reliability under rapidly changing malicious jamming, and enhancing the system’s adaptability to jamming environments.
-
Key words:
- Wireless communication /
- Anti-jamming /
- Stability control /
- Model predictive control
-
1. 引言
无线通信作为一种基于电磁波传播的信息传输技术,在现代社会中扮演着至关重要的角色。然而,由于电磁环境的开放性和复杂性,无线通信系统往往易受到各种干扰的影响,这将导致传输信号质量下降、传输性能恶化甚至传输中断[1]。为提高无线通信系统在干扰环境下传输的可靠性和适应能力,功率自适应调整技术已被广泛应用于无线通信领域。它根据电磁环境和系统需求动态调整无线通信系统的发射功率,以实现信息的可靠传输,并提高系统的覆盖范围、容量和能效[2]。
传统的功率自适应方法往往受制于固定的策略或规则[3],难以适应复杂多变的干扰环境。而启发式算法可在传统功率自适应方法受限的情况下,更好地适应复杂的干扰环境。其中,文献[4]提出了一种基于粒子群优化 (Particle Swarm Optimization, PSO)算法下的功率控制算法,通过以网络节点总发射功率为优化目标,得到在满足一定传输速率下的最小总发射功率,并根据设置的时间周期重新计算分配节点发射功率,进而达到功率自适应。文献[5]在对于蜂窝网络D2D(Device—to—Device communication)通信中D2D用户共享蜂窝用户上行链路的频谱资源引起的干扰抑制问题上,提出一种音调微调概率自适应变化的遗传和声算法进行功率控制,在满足用户最低信干噪比和最大发射功率要求的前提下,实现吞吐量最大化目标。但启发式算法可能需要大量的计算资源和时间来完成搜索过程,这使得系统难以适应快速时变干扰环境。
随着机器学习等人工智能技术的发展,基于智能抗干扰算法逐渐引起了研究者的关注。如文献[6]提出一种基于强化学习的智能抗干扰通信方法。该方法基于互模拟等价关系(Bisimulation)识别不同状态-动作对的相似性,实现知识在其间的重用。每个节点可以独立地学习并迅速调整其策略,从而高效地抵御未知的动态干扰。该方法不仅加速了收敛,还提高了网络吞吐量,并具有优异的响应速度和干扰记忆功能。文献[7]提出了一种基于多智能体深度强化学习(Multi- Agent Deep Reinforcement Learning, MADRL)的上行链路功率控制方法,用于多小区多用户通信系统,解决服务质量(Quality of Service, QoS)约束的上行链路功率控制问题。
尽管基于机器学习等技术的功率自适应方法在提高无线通信系统的对信道和干扰环境的适应能力、功耗节约方面有一定成效,但其调整过程需要较多次数的迭代,时延大、计算复杂度高,自适应调整速度慢,可能导致系统难以跟上电磁环境的变化,进而导致传输性能不稳定。
为此,有学者研究了基于稳定性控制理论的通信抗干扰方法。文献[8]引入一种带积分器的状态反馈控制器,当系统受到突发干扰时,误码率(Bit Error Rate, BER)可以快速稳定在目标值。文献[9]提出了一种基于切换系统的稳定性理论和多重李雅普诺夫函数的稳定控制算法,使切换系统在渐近条件下满足稳定性要求。但是对于更为复杂的电磁环境,简单的状态反馈控制器可能无法提供足够的稳定性保证和收敛速度。为解决这一问题,本论文提出了一种基于干扰观测的模型预测控制方法,通过对系统和干扰状态的估计,及对未来状态信息的预测,能够更快地响应干扰,从而提高无线通信系统在恶意干扰下的传输可靠性。
具体而言,本文首先将干扰环境下的无线通信系统建模为受外部干扰影响的广义稳定性控制系统[10]。然后,采用滑模干扰观测器对系统状态和干扰状态进行估计。再通过泰勒级数展开对系统未来状态信息进行预测。最后,通过求解优化问题,得到最优的控制律来调整系统的功率,以实现系统在干扰环境下的传输可靠性。仿真结果表明,本文提出的抗干扰控制方法与已有方法相比,能够有效解决收敛速度慢和稳定性差的问题,为无线通信系统的抗干扰功率自适应调整技术提供了新的思路和方法。
2. 问题描述与系统建模
如图1所示,假设无线通信系统是连续传输的,而干扰的出现或变化对系统而言相当于对系统传输过程的扰动。因此,本文分析系统在干扰下的稳定性时,将系统建模为连续时间域广义控制系统。系统在对电磁环境进行感知后,发射端根据反馈信息调整发射功率,以确保接收端的误码率不超过预设的目标误码率。
根据此系统模型,对通信参数做出以下假设:假设发射机的发射功率为 Ps,传输信道为加性高斯白噪声(Additive White Gaussian Noise, AWGN)信道,此外,信道遵循块衰落特性且信道内的噪声功率已知。接收机在 Ps下的误码率为 Pe,若不考虑自由空间传播损耗,且通信信号发射功率 Ps和信道内的噪声功率 PN都用dBm表示,当不存在干扰时,传输过程中的信干噪比可简单表示为 SINR=Ps−PN。系统在BPSK调制和(2016,504) 低密度奇偶校验码(Low Density Parity Check Code, LDPC)的误码曲线如图2所示。可见,随着信干噪比的增大,误码率近似呈线性关系减小,所以曲线瀑布区可以拟合成如图2中所示的直线。
假设系统正常传输的目标误码率为 yr(t)。选取发射功率 Ps为控制输入变量 u(t),接收端的信干噪比为系统状态变量 x(t),误码率 Pe为系统输出变量 y(t)。系统建模的目的是将系统用如式(1)形式的线性微分方程来描述
dx(t)/dx(t)dtdt=Ax(t)+Bu(t)y(t)=Cx(t)+D} (1) 这里的 A,B,C,D是常量,分别称作动态特性系数、控制系数、传感系数和直接项。
如图2所示,系统的误码率曲线在瀑布区近似为一直线。因此,可根据图2用直线方程写出误码率与系统输入信干噪比的关系,即
y(t)=Cx(t)+D (2) 由于在没有干扰时, SINR=Ps−PN,所以在 t时刻后的 Δt时刻的系统状态由控制输入 u(t)和此时的噪声功率组成,且假设接收的SINR是可以准确估计的,则
x(t+Δt)=u(t)−PN(t) (3) 信干噪比随时间的变化率为
dx(t)dt=limΔt→0{x(t+Δt)−x(t)}=−x(t)+u(t)−PN(t) (4) 因此根据式(3)和式(4),系统状态建模为
dx(t)/dx(t)dtdt=−x(t)+u(t)−PN(t)y(t)=Cx(t)+D} (5) 在未引入稳定性控制器的条件下: u(t)=xe(t)+PN(t),其中 xe(t)为信干噪比目标值。
为了得到发射功率到误码率的传递函数,令
u1(t)=u(t)−PN(t) (6) 则式(6)转换后的系统状态方程为
dx(t)/dx(t)dtdt=Ax(t)+Bu1(t)y(t)=Cx(t)+D} (7) 其中,动态特性系数 A=−1,控制系数 B=1,传感系数 C和直接项 D根据某种调制和编码方式下拟合的直线斜率和截距而定。
根据式(7),结合广义运动控制系统将受未知干扰影响的无线通信系统表达为
y(2)(t)=f[y(t),y(1)(t),t]+b(t)u1(t) (8) 其中, y(2)(t)=CA2x(t)+CB˙u1(t)+CABu1(t)为 y(t)的2阶导数。 b(t)为控制增益,满足 b−≤b(t)≤ˉb, b−和 ˉb为正常数,表示 b(t)的上下界。目标是解决优化控制问题,使得式(8)所示的受扰系统的输出以性能指标最优的形式,渐近地与参考信号一致。
首先,定义变量
e(t)=yr(t)−y(t),ei(t)=e(i)(t),i∈N (9) 假设 yr(t)是分段连续的,其 n阶导数存在且有界。则误差系统满足
˙ei(t)=ei+1(t),i∈N0:n−2 (10) ˙en−1(t)=−b0u1(t)+wn(t)+w(t) (11) 其中,
w(t)=[b0/b0b(t)−1b(t)−1]y(n)(t)−[b0/b0b(t)b(t)]f(⋅) (12) f[y(t),y(1)(t),t]=CA2x(t)+CB˙u1(t) (13) wn(t)=yr(n)(t) (14) 其中, e(t)为未知干扰导致的控制误差, e(i)(t)表示 e(t)的第 i阶导数, w(t)表示未知干扰和系统不确定性的集总干扰[11], b0为 b(t)标称值;函数 wn(t)由目标误码率 yr(t)构造。
基于连续时间域非线性广义预测控制方法,采用具有显式控制输入加权的改进广义预测控制性能指标作为优化目标。即通过最小化这一改进的广义预测控制性能指标 D(t)来实现最优的控制性能。
不同于传统的非线性广义预测控制方法[12]和文献[13]无偏模型预测控制方法,改进的广义预测控制性能指标综合考虑了系统的预测误差、控制输入加权以及性能权重等因素,以更精确地评估控制系统的性能。其中优化目标为
D(t)=12T∫0[‖ (15) 其中, T{\text{ > }}0 为控制周期; Q{\text{ > }}0 为控制误差的权重; R \ge 0 为控制输入的权重; {u_{\mathrm{r}}}\left( t \right) 为稳态控制输出,定义为
{u_{{{\mathrm{r}}}}}\left( t \right) = {{\left[ {{w_n}(t) + w(t)} \right]} \mathord{\left/ {\vphantom {{\left[ {{w_n}(t) + w(t)} \right]} {{b_0}}}} \right. } {{b_0}}} (16) 可知若要得到预测的性能指标,则需要得到跟踪误差、控制输入、目标(控制)输入的预测值。
3. 基于泰勒级数的系统状态预测
在时域 0 \le \tau \le T 内的控制误差 e\left( {t + \tau } \right) 可用泰勒级数近似为
\begin{split} e\left( {t + \tau } \right) \approx & e\left( t \right) + \tau {e_1}\left( t \right) + \cdots + \frac{{{\tau ^{n - 1}}}}{{(n - 1)!}}{e_{n - 1}}\left( t \right) \\ & + \frac{{{\tau ^n}}}{{n!}}{e_n}\left( t \right) + \cdots + \frac{{{\tau ^{n + r}}}}{{(n + r)!}}{e_{n + r}}\left( t \right) \end{split} (17) 其中, r \in {N} [14]为控制阶次。
简便起见,变量的估计值是对跟踪误差系统的状态和干扰进行估计,用符号 \left( {\hat \cdot } \right) 表示,变量的时域预测值是利用这些估计值通过泰勒级数展开的形式预测滚动时域内的未来状态信息,用符号 \left( {\overline \cdot } \right)表示。定义决策变量为
{\boldsymbol{U}}\left( t \right) = {\left[ {\begin{array}{*{20}{c}} {{u_1}\left( t \right)}&{{u_1}^{(1)}\left( t \right)}& \cdots &{{u_1}^{(r)}\left( t \right)} \end{array}} \right]^{{\mathrm{T}}} } (18) 利用干扰观测器的估计值, 跟踪误差的预测值为
\begin{split} \bar e\left( {t + \tau } \right) =& e\left( t \right) + \tau {\hat e_1}\left( t \right) + \cdots + \frac{{{\tau ^{n - 1}}}}{{(n - 1)!}}{\hat e_{n - 1}}\left( t \right) \\ & + \frac{{{\tau ^n}}}{{n!}}{\hat e_n}\left( t \right) + \cdots + \frac{{{\tau ^{n + r}}}}{{(n + r)}}{\hat e_{n + r}}\left( t \right) \end{split} (19) 如果系统相对阶较低(1或2), 对任意选取的控制器参数(Q, R, r, T), 闭环系统始终渐近稳定[14]。将控制阶次r=0代入式(19)得跟踪误差的预测值以及控制输入、目标输入的预测值为
\overline{e}(t+\tau )=e(t)+\tau {\widehat{e}}_{1}(t)+\frac{{\tau }^{2}}{2!}{\widehat{e}}_{2}(t) (20) 则决策变量为 U_1\left( t \right) , U_1\left( t \right) 为式(18)中的第1行
U_1\left( t \right) = {u_1}(t) (21) 设变量
\overline {\boldsymbol{\varGamma }} (\tau ) = [1{\text{ }}\tau ] (22) \tilde \varGamma (\tau ) = \frac{{{\tau ^2}}}{2} (23) \overline {\boldsymbol{E}} (t) = {[e(t){\text{ }}{\hat e_1}(t)]^{\mathrm{T}}} (24) \begin{split} \tilde{E}(t)&={\widehat{e}}_{2}(t)=-{b}_{0}U(t)+{W}_{2}(t)+W(t)\\ &=-{b}_{0}{u}_{1}(t)+{w}_{2}+\widehat{w}(t) \end{split} (25) {{\boldsymbol{W}}_{\boldsymbol{n}}}\left( t \right) = {\left[ {\begin{array}{*{20}{c}} {{w_n}(t)}&{{w_{n1}}(t)}& \cdots &{{w_{nr}}(t)} \end{array}} \right]^{{\mathrm{T}}} } (26) {\boldsymbol{W}}\left( t \right) = {\left[ {\begin{array}{*{20}{c}} {\hat w\left( t \right)}&{{{\hat w}_1}\left( t \right)}& \cdots &{{{\hat w}_r}\left( t \right)} \end{array}} \right]^{{\mathrm{T}}} } (27) 其中根据式(26)和式(27),代入可得
{W_2}\left( t \right) = {w_2}(t) (28) \hat W\left( t \right) = \hat w(t)\;\;\; (29) 因此跟踪误差的预测值可改写为
\overline e (t + \tau ) = [\overline {\boldsymbol{\varGamma }} (\tau ){\text{ }}\tilde {{\varGamma}} (\tau )]{\text{ [}}\overline {\boldsymbol{E}} (t){\text{ }}\tilde E(t){]^{{\mathrm{T}}} } (30) 同理,可得控制输入、目标输入的预测值为
{\bar {\boldsymbol{u}}_1}\left( {t + \tau } \right) = {\boldsymbol{\hat \varGamma }}\left( \tau \right){u_1}\left( t \right) (31) {\bar {\boldsymbol{u}}_{\mathrm{r}}}\left( {t + \tau } \right) = \frac{1}{{{b_{_0}}}}{\boldsymbol{\hat \varGamma }}\left( \tau \right)\left[ {{w_2}\left( t \right) + \hat w\left( t \right)} \right] (32) 其中, {\boldsymbol{\hat \varGamma }}(\tau ) = [1{\text{ }}\tau ] 。
4. 基于性能指标的优化
基于式(30)、式(31)和式(32),式(15)所示的广义控制性能指标的预测值为
\begin{split} \bar D\left( t \right) = &\frac{1}{2}\left\{ {Q\bar e{{\left( {t + \tau } \right)}^{\mathrm{T}}}\bar e\left( {t + \tau } \right)} \right. + R\left[ {{{\bar u}_1}\left( {t + \tau } \right)} \right.\\ & \cdot\left. {{\bar u}_r}\left( {t + \tau } \right) \right]^{{{\mathrm{T}}}} \left. {\left[ {{{\bar u}_1}\left( {t + \tau } \right) - {{\bar u}_r}\left( {t + \tau } \right)} \right]} \right\}{\text{d}}\tau \\ = \,&\frac{1}{2}Q{{{{\bar {\boldsymbol{E}}}}}^{{\mathrm{T}}} }{\varGamma _1}{{\bar {\boldsymbol{E}}}} - {b_0}Q{{{{\bar {\boldsymbol{E}}}}}^{{\mathrm{T}}} }{\varGamma _2}\left[ {U - \frac{1}{{{b_0}}}\left( {{W_2} + W} \right)} \right]\\ & + \frac{1}{2}{\left[ {U - \frac{1}{{{b_0}}}\left( {{W_2} + W} \right)} \right]^{{\mathrm{T}}} }\left( {b_0^2Q{\varGamma _3} + R{\varGamma _4}} \right) \\ &\times \left[ {U - \frac{1}{{{b_0}}}\left( {{W_2} + W} \right)} \right]\\[-1pt] \end{split} (33) 其中, {\varGamma _1} = \displaystyle\int_0^{\mathrm{T}} {{{{\boldsymbol{\bar \varGamma }}}^{\mathrm{T}}}} {\boldsymbol{\bar \varGamma }}{\text{d}}\tau , {{\boldsymbol{\varGamma}} _2} = \displaystyle\int_0^{\mathrm{T}} {{{\bar {\boldsymbol{\varGamma}} }^{{\mathrm{T}}} }} \tilde \varGamma {\text{d}}\tau , {\varGamma _3} = \displaystyle\int_0^T {{{\tilde \varGamma } }} \tilde \varGamma {\text{d}}\tau , {\varGamma _4} = \displaystyle\int_0^T {{{\hat \varGamma } }} \hat \varGamma {\text{d}}\tau 。对 \bar D(t) 关于 U 求偏导,可得
\begin{split} \partial \bar D{\text{/}}\partial U = \,&- {b_0}Q{\boldsymbol{\varGamma}} _2^{T} {{\bar {\boldsymbol{E}}}} + \left( {b_0^2Q{\varGamma _3} + R{\varGamma _4}} \right)\\ &\cdot \left( {U - ({W_2} + W){\text{/}}{b_0}} \right) \end{split} (34) 此外,注意到 b_0^2Q{\varGamma _3} + R{\varGamma _4} >0。令 \partial \bar D{\text{/}}\partial U{\text{ = }} 0 , {\partial ^2}\bar D{\text{/}}\partial {U^2}{\text{ > }}0 ,优化后的决策变量为
{U^{\text{*}}}\left( t \right){\text{ = }}\frac{1}{{{b_0}}}\left[ {{{\left({\varGamma _3} + \frac{1}{{b_0^2}}\frac{R}{Q}{\varGamma _4}\right)}^{ - 1}}{\boldsymbol{\varGamma}} _2^{\mathrm{T}}{{\bar {\boldsymbol{E}}}} + {W_2} + W} \right] (35) 取决策变量 {U^{\text{*}}}\left( t \right) 的第1行作为实际控制律,可得
{u_1}^{\text{*}}\left( t \right){\text{ = }}\frac{1}{{{b_0}}}\left[ {{k_0}e\left( t \right) + {k_1}{{\hat e}_1}\left( t \right) + {w_2}\left( t \right) + \hat w\left( t \right)} \right] (36) 其中,为了区分输入功率 u\left( t \right) 和在干扰环境下的实际控制律 {u^{\text{*}}}\left( t \right) ,加入符号*。k0和k1分别为控制阶次为零时的最优增益
\left[ {\begin{array}{*{20}{c}} {{k_0}}&{{k_1}} \end{array}} \right] = {\boldsymbol{I}}{\left( {{\varGamma _3} + H{\varGamma _4}} \right)^{ - 1}}\varGamma _2^{T} 其中, {\boldsymbol{I}} = \left[ {\begin{array}{*{20}{c}} 1&0 \end{array}} \right] , H = R{\text{/}}(b_0^2Q) 。
5. 干扰观测器的构造
控制系统中的干扰观测,与无线通信系统中的干扰检测、干扰认知的作用和实现方式有所不同。干扰观测并不直接感知或估计干扰信号,而是通过跟踪误差来生成干扰对系统状态影响的估计值。若要得到跟踪误差、控制输入、目标输入的预测值求解出最优控制律使得控制器得以实现,则干扰观测器要得出观测的估计值。本节根据文献[15]所提出的高阶滑模观测器代入所建立的通信系统中,用于生成估计值 {\hat e_1}\left( t \right), \cdots, {\hat e_{n - 1}}\left( t \right),\hat w\left( t \right) 。则观测的误差方程为
{\dot {\hat e}_i}(t) = {\hat e_{i + 1}}(t) + {v_i}(t),i \in {{\boldsymbol{N}}_{0:n - 2}} (37) {\dot {\hat e}_{n - 1}}\left( t \right) = - {b_0}{u_1}^{\text{*}}\left( t \right) + {w_n}\left( t \right) + {\hat w_0}\left( t \right) + {v_{n - 1}}\left( t \right) (38) {\dot {\hat w}_j}(t) = {\hat w_{j + 1}}(t) + {v_{n + j}}(t),j \in {{\boldsymbol{N}}_{1:m - 2}} (39) {\dot {\hat w}_{m - 1}}\left( t \right) = {v_{n + m - 1}}\left( t \right) (40) 其中, \hat w(t) 为估计的集总干扰[11], {v_i}(t) 为观测器增益
\quad\hat w(t) = \left[ {{{{b_0}} \mathord{\left/ {\vphantom {{{b_0}} {b\left( t \right) - 1}}} \right. } {b\left( t \right) - 1}}} \right]{\hat y^{(n)}}\left( t \right) - {{{b_0}} \mathord{\left/ {\vphantom {{{b_0}} {b\left( t \right)}}} \right. } {b\left( t \right)}}\hat f\left( \cdot \right) (41) \quad {v_0}\left( t \right){\text{ = }}K(t){{\mathrm{sign}}} \left[ {{{\hat e}_0}(t) - {e_0}(t)} \right] (42) \quad {v_i}\left( t \right){\text{ = }}K(t){{\mathrm{sign}}} \left[ {{v_{i - 1}}(t)} \right] (43) 其中, K(t) 为切换增益,取 K(t) = CA 代入系统式(8)可得
\qquad \dot {\hat e}(t) = {\hat e_1}(t) + {v_0} (44) \qquad {\dot {\hat e}_1}(t) = - {b_0}{u_1}*(t) + {w_2}(t) + \hat w(t) + {v_1} (45) \qquad\dot {\hat w}(t) = {v_2} (46) 6. 方法步骤和系统框图
由于之前为了系统的分析方便,式(6)中做了变量替换,因此在实际过程中,控制器的控制输出应该为 u\left( t \right) = {u_1}\left( t \right) + {P_N}\left( {t + \Delta t} \right) 。
根据以上分析,总结设计控制器的具体步骤如下:
(1) 设定系统初值。包括系统的预测步长,观测增益,目标误码率 {y_r} 等,并设定系统状态平衡点 {x_e} ,以及仿真的起始,终止时间和计算步长 h ;
(2) 通过系统状态 x(t) 代入式(7)求得当前时刻系统输出误码率 y(t) ;
(3) 根据式(30)—式(32)得到跟踪误差、控制输入、目标输入的预测值 \overline e (t + \tau ) , {\bar u_1}\left( {t + \tau } \right) , {\bar u_r}\left( {t + \tau } \right) ;
(4) 将当前的信干噪比和求解出的控制律式(35)代入到式(7)求出信干噪比变化率 \dot x(t) ;
(5) 代入 x(t + h) = x(t) + h \times \dot x(t) 求出下一时刻的信干噪比;
(6) 循环执行第(2)步至第(5)步,得到所有采样点的系统状态和输出误码率。
该方法的实现框图见图3。
7. 仿真分析
在本节中,通过MATLAB仿真评估了所提算法在遭遇随机脉冲干扰、周期脉冲干扰和持续恒定干扰时的性能,并与传统的功率自适应等方法进行了对比。以BPSK调制和(2016,504)LDPC码为例,其误码率曲线经过拟合后得到直线 y\left( t \right) = - 2.4x\left( t \right) - 10.8 ,则传感系数 C = - 2.4。图4为所提算法与传统功率自适应方法在随机脉冲干扰环境下的误码率曲线和发射功率仿真对比结果。
由图4(a)可知,系统受到功率为5 dBm随机脉冲干扰,干扰服从概率为0.01的均匀分布,持续时间为0.1 s。所提算法能够迅速应对干扰,响应速度明显高于已有方法。从图4(b)可以看出,在随机脉冲干扰环境下,系统在经历0.05 s的干扰后快速收敛到目标误码率10–4,即便干扰仍在持续。相比之下,传统功率自适应方法输出误码率更高,在干扰脉冲的时间间隔呈随机分布时,难以收敛到规定的误码率。
图5为所提算法与基于强化学习的智能抗干扰通信方法[6]在周期脉冲干扰环境下的归一化吞吐量仿真对比结果。
图5(a)环境中的周期脉冲干扰,其干扰功率为5 dBm,该干扰持续时间为0.2 s,周期为1 s。从图5(b)中可以看出,所提算法在应对干扰时,无需经过繁琐的迭代训练即可稳定地实现归一化吞吐量为0.97;相同参数设置下的基于强化学习的智能抗干扰通信方法经过1000次迭代,归一化吞吐量最多能收敛于0.89。由上述仿真结果可知,在周期脉冲干扰的典型干扰环境下,基于强化学习的智能抗干扰通信方法遇到干扰时会选择静默避开脉冲干扰;而本文算法可以迅速调整发射功率,降低系统误码率,从而获得更高的归一化吞吐量,可见传输可靠性得到了提高。
图6为所提算法与传统的功率自适应方法和文献[8]中的算法在持续恒定干扰下的误码率曲线和发射功率仿真对比结果。图6(a)为环境中的持续恒定干扰,干扰在2 s时出现,功率为5 dBm。
其中,文献[8]中的算法,选择了适度的阻尼比以获得适度的超调量和较短调节时间,同时选择适度的自然频率保证较快的响应速度和较小的控制量。从图6(b)可以看出,与比例积分控制系统和传统的功率自适应系统相比,所提算法能够更快地将输出误码率收敛到目标误码率,且误码率波动较小。
综上所述,所提算法在遭遇随机脉冲干扰、周期脉冲干扰和持续恒定干扰时性能明显优于已有算法。
8. 结束语
本文提出了一种基于干扰观测的无线通信系统抗干扰控制方法,能够改善复杂电磁环境下通信系统功率自适应的稳定性问题。仿真结果表明,该算法在受到突发干扰时能够使系统误码率迅速收敛到目标值,并且相比传统的功率自适应、基于强化学习的智能抗干扰通信方法和基于比例积分(Proportional Integral, PI)状态反馈控制等方法,具有更好的误码率波动情况、更高的归一化吞吐量和更快的发射功率响应速度。然而,仍然有一些挑战需要进一步解决。例如,考虑实际通信系统的约束和限制条件,如功率范围、通信速率等。未来的研究可以结合机器学习和深度学习技术,探索更复杂的模型和算法,以提高系统的性能和适应性。
-
[1] 姚富强. 通信抗干扰工程与实践[M]. 2版. 北京: 电子工业出版社, 2012.YAO Fuqiang. Communication Anti-Jamming Engineering and Practice[M]. 2nd ed. Beijing: Publishing House of Electronics Industry, 2012. [2] 杨正, 郑云, 余月好, 等. 基于自适应功率分裂的协作非正交多址接入无线携能通信网络性能分析[J]. 通信学报, 2023, 44(1): 177–188. doi: 10.11959/j.issn.1000−436x.2023004YANG Zheng, ZHENG Yun, YU Yuehao, et al. Performance analysis for cooperative NOMA networks based SWIPT with adaptive power splitting[J]. Journal on Communications, 2023, 44(1): 177–188. doi: 10.11959/j.issn.1000−436x.2023004 [3] 苏炎荣, 徐卓农, 吴舒辞. 一种功率自适应控制方案在移动自组网的应用[J]. 自动化技术与应用, 2008, 27(11): 60–62. doi: 10.3969/j.issn.1003-7241.2008.11.017SU Yanrong, XU Zhuonong, and WU Shuci. A power-adaptive control protocol for MANET[J]. Techniques of Automation and Applications, 2008, 27(11): 60–62. doi: 10.3969/j.issn.1003-7241.2008.11.017 [4] 苗丽娟, 李锦涛. 无线传感器网络功率自适应控制算法研究[J]. 信息技术与信息化, 2023(6): 214–217. doi: 10.3969/j.issn.1672-9528.2023.06.054MIAO Lijuan and LI Jintao. Research on power adaptive control algorithm for wireless sensor network[J]. Information Technology Informatization, 2023(6): 214–217. doi: 10.3969/j.issn.1672-9528.2023.06.054 [5] 陈文泰. 基于机器学习的蜂窝网络D2D通信频谱分配与功率控制算法研究[D]. [硕士论文], 东南大学, 2019.CHEN Wentai. A study on machine learning based spectrum allocation and power control algorithms for D2D communications underlaying cellular networks[D]. [Master dissertation], Southeast University, 2019. [6] ZHOU Quan, NIU Yingtao, XIANG Peng, et al. Intra-domain knowledge reuse assisted reinforcement learning for fast anti-jamming communication[J]. IEEE Transactions on Information Forensics and Security, 2023, 18: 4707–4720. doi: 10.1109/TIFS.2023.3284611 [7] JIA Ruibao, LIU Liu, ZHENG Xufei, et al. Multi-agent deep reinforcement learning for uplink power control in multi-cell systems[C]. 2022 IEEE International Conference on Communications Workshops, Seoul, South, Korea, 2022: 324–330. [8] TONG Tingting, SONG Xiaoqin, NIU Yingtao, et al. Stability control of power adaptation in wireless communication system[C]. 2013 International Conference on Mechatronic Sciences, Electric Engineering and Computer, Shenyang, China, 2013: 287–291. [9] SONG Xiaoqin, DONG Li, LI Wenfa, et al. Stability control of multi-parameter adaptive wireless communication systems based on multi-Lyapunov function[J]. High Technology Letters, 2017, 23(4): 375–383. doi: 10.3772/j.issn.1006-6748.2017.04.005 [10] YAN Yunda, YANG Jun, SUN Zhenxing, et al. Non-linear-disturbance-observer-enhanced MPC for motion control systems with multiple disturbances[J]. IET Control Theory & Applications, 2020, 14(1): 63–72. doi: 10.1049/iet-cta.2018.5821 [11] ZHANG Lu, YANG Jun, LI Shihua, et al. Invariant manifold based output-feedback sliding mode control for systems with mismatched disturbances[J]. IEEE Transactions on Circuits and Systems II:Express Briefs, 2021, 68(3): 933–937. doi: 10.1109/TCSII.2020.3011458 [12] PANNOCCHIA G and BEMPORAD A. Combined design of disturbance model and observer for offset-free model predictive control[J]. IEEE Transactions on Automatic Control, 2007, 52(6): 1048–1053. doi: 10.1109/TAC.2007.899096 [13] YANG Jun, ZHENG Weixing, LI Shihua, et al. Design of a prediction-accuracy-enhanced continuous-time MPC for disturbed systems via a disturbance observer[J]. IEEE Transactions on Industrial Electronics, 2015, 62(9): 5807–5816. doi: 10.1109/TIE.2015.2450736 [14] CHEN Wenhua, BALANCE D J, and GAWTHROP P J. Optimal control of nonlinear systems: A predictive control approach[J]. Automatica, 2003, 39(4): 633–641. doi: 10.1016/S0005-1098(02)00272-8 [15] LEVANT A. Higher-order sliding modes, differentiation and output-feedback control[J]. International Journal of Control, 2003, 76(9/10): 924–941. doi: 10.1080/0020717031000099029 期刊类型引用(1)
1. 张吉莹,石荣,李屹宽,胡柱,谢佳霖. 基于改进卷积神经网络的频谱自适应通信传输. 中国电子科学研究院学报. 2024(05): 432-441 . 百度学术
其他类型引用(1)
-