Anti-strong Jamming Polar Coding Optimization Method with Multiobjective Reinforcement Learning
-
摘要: 为提升跳频(FH)通信系统信息传输的可靠性和抗干扰能力,该文基于新型Polar编码的慢跳频抗干扰通信系统模型,提出一种适应强干扰环境的Polar编码构造优化方法。首先,面向包含常态和干扰态的混合信道设计多目标强化学习算法,然后优化编码过程中的信息位比特信道序列,提升码字的纠错性能,并通过初始化预处理和理论计算回报值降低算法执行复杂度。仿真结果表明,在包含强干扰的混合信道条件下,所提编码优化方法的全局误码性能优于传统编码构造方法,相比于第5代移动通信系统(5G)第3代合作伙伴计划(3GPP) 标准方案全局编码增益达0.5 dB,有效改善Polar编码跳频通信高可靠抗干扰传输性能。Abstract: In order to improve the reliability and anti-jamming ability of information transmission for the Frequency-Hopping (FH) communication system, a Polar coding construction optimization method is proposed to adapt to the strong-jamming environment, which is based on a novel Polar coded slow FH communication system model. Firstly, the multi-objective reinforcement learning algorithm is designed for the hybrid channel containing normal state and jamming state, and then the information bit-channel sequence in the coding process is optimized. Consequently the error correction performance of the designed Polar codewords is improved. In addition, the complexity of algorithm is reduced by preprocessing the initialization and theoretically calculating the reward values. The simulation results show that the overall error performance of the proposed coding optimization method is better than those of conventional coding construction methods in the hybrid channel containing strong jamming. Compared with the 3rd Generation Partnership Project (3GPP) standard scheme in Fifth-Generation (5G) mobile communication systems, the obtained overall coding gain is up to 0.5 dB. Therefore the high-reliability and anti-jamming performance of Polar coded FH transmission is effectively improved.
-
Key words:
- Channel coding /
- Anti-jamming /
- Polar codes /
- Reinforcement learning /
- Reliability performance
-
1. 引言
线性码的重量分布是编码理论中的一个重要研究问题。近几年,线性码的重量分布,尤其是循环码的重量分布,被国内外的编码学者广泛关注与研究。Ding等人[1]研究了不可约循环码的重量分布,利用不可约循环码构造了一些参数较好的线性码。基于指数和理论,文献[2,3]在有限域上某些可约循环码的重量分布研究中也取得了很大进展。
少重量线性码,如常重量线性码[4]、2-重量线性码[5]、3-重量线性码[6]以及其他少重量线性码[7,8]等,是重要的线性码类,可用于认证码[9]、结合方案以及秘密共享方案的构造。Ding[10]基于不可约循环码的重量分布构造了几类3-重量线性码。Schmidt等人[11]基于离散傅里叶变换和高斯和理论得到了不可约循环码至多有两个重量的充要条件。Zhou等人[12]构造了7类3-重量循环码并分析了由这些3-重量循环码得到的秘密共享方案的结构。
拟循环码是一类重要的线性码,它与卷积码和低密度校验码密切相关。指标为2的拟循环码也称为分块长度相等的双循环码。Borges等人[13]给出了2元域上双循环码的显式生成元并确定了双循环码及其对偶码生成元之间的关系。Gao等人[14,15]给出了4元双循环码的生成元以及与对偶码生成元之间的关系,并且证明了4元双循环码是渐进优的。Patanker等人[16]利用高斯和确定了几类2元双循环码的重量分布。
本文主要利用有限域上指标为2的不可约拟循环码构造少重量的线性码。首先,基于有限域上的高斯周期,本文给出了几类指标为2的不可约拟循环码的重量分布;其次,基于不可约拟循环码的重量分布,本文构造了几类2-重量线性码和3-重量线性码,其中包括3类最优的2-重量线性码。
2. 基本知识
令
p 是一个素数,q=pm ,r=qt ,其中m 和t 是正整数。令Fq 表示q 元有限域。Fql 的线性子空间称为有限域Fq 上码长为l 的线性码。Ai 表示线性码C 中Hamming重量为i 的码字个数。 定义码长为l 的线性码C 的重量分布多项式为1+A1x+⋯+Alxl 。令
l=m0+m1 。如果C 中的任意码字c=(c1,0,c1,1,⋯,c1,m0−1|c2,0,c2,1,⋯,c2,m1−1) 经循环移位T 作用后有T(c)=(c1,m0−1,c1,0,⋯,c1,m0−2|c2,m1−1,c2,0,⋯ ,c2,m1−2)∈C 则称线性码C 是分块长度为(m0,m1) 的双循环码。若m0=m1 ,则称线性码C 是指标为2的拟循环码。令
Fr=Fqt 表示qt 元有限域且ζ 为其本原元。设θ∈Fr∗=Fr∖{0} ,ord(θ)=n ,h(x) 是θ−1 在Fq 上的极小多项式,deg(h(x))=s ,则Fq[x]/Fq[x]⟨h(x)⟩⟨h(x)⟩=Fqs 是一个qs 元有限域且θ∈Fqs∗=Fqs∖{0} 。因为deg(h(x))=s ,所以s|t ,(qs−1)|(qt−1) 。令Fqs∗=⟨w⟩ ,其中w=ζqt−1qs−1 ,则w 为Fqs 的本原元。假设
θ=wN ,其中nN=qs−1 。定义指标为2的不可约拟循环码为C={(Tr(αβ0),Tr(αβ0θ),⋯,Tr(αβ0θn−1)|Tr(αβ1),Tr(αβ1θ),⋯,Tr(αβ1θn−1))|α∈Fqs} (1) 其中,
β0,β1∈Fqs∗∖⟨θ⟩ ,Tr(⋅) 表示从Fqs 到Fq 的迹映射。此外,C 在Fq 上的校验多项式为θ−1 的极小多项式h(x) 且维数为dim(C)=s 。设
Trq/qpp 表示从Fq 到Fp 的迹映射,χ 是从Fq 到模长为1的复数组成的乘法群的映射,对任意的x,y∈Fq 有χ(x+y)=χ(x)χ(y) 。设b∈Fq ,定义χb(c)=e2π√−1Trq/p(bc)/p,∀c∈Fq (2) 为
Fq 上的加法特征。如果b=0 ,则χ0(c)=1 ,χ0 称为Fq 上的平凡加法特征;如果b=1 ,则χ1 称为Fq 上的标准加法特征。定义
Ci(N,qs)=wi⟨wN⟩,i=0,1,⋯,N ,其中⟨wN⟩ 表示Fqs∗ 的一个子群,陪集Ci(N,qs) 称为Fqs 的阶为N 的分圆类。根据加法特征和分圆类,定义Fqs 上的高斯周期为ηi(N,qs)=∑x∈Ci(N,qs)χ(x),i=0,1,⋯,N 其中,
χ 是Fqs 上的标准加法特征。一般情况下,高斯周期的值很难计算,但是可以通过高斯多项式ψ(N,qs)(X) [17]得到一些特殊的值,其中高斯多项式定义为ψ(N,qs)(X)=N−1∏i=0(X−ηi(N,qs)) 引理1[1] 当
N=2 时,高斯周期的值为η0(2,qs)={−1+(−1)s⋅m−1qs22,p≡1(mod4)−1+(−1)s⋅m−1(√−1)smqs22,p≡3(mod4) 和
η1(2,qs)=−1−η0(2,qs) 。引理2[1] 当
N=3 时,高斯多项式ψ(3,qs)(X) 的分解如下:(1)如果
p≡2(mod3) ,则s⋅m 为偶数并且ψ(3,qs)(X)={3−3(3X+1+2qs2)(3X+1−qs2)2,sm2为偶数3−3(3X+1−2qs2)(3X+1+qs2)2,sm2为奇数 (2)如果
p≡1(mod3),s⋅m≡0(mod3) ,则ψ(3,qs)(X)=127(3X+1−c1qs3)⋅(3X+1+12(c1+9d1)qs3)⋅(3X+1+12(c1−9d1)qs3) 其中,
c1 和d1 满足4qs3=c21+27d21,c1≡1(mod3),gcd(c1,p)=1 。引理3[1] 当
N=4 时,高斯多项式ψ(4,qs)(X) 的分解如下:(1)如果
p≡3(mod4) ,则s⋅m 为偶数并且ψ(3,qs)(X)={4−4(4X+1+3qs2)(4X+1−qs2)3,sm2为偶数4−4(4X+1−3qs2)(4X+1+qs2)3,sm2为奇数 (2)如果
p≡1(mod4),s⋅m≡0(mod4) ,则ψ(3,qs)(X)=4−4((4X+1)+qs2+2u1qs4)⋅((4X+1)+qs2−2u1qs4)3×4−4((4X+1)−qs2+4v1qs4)⋅((4X+1)−qs2−4v1qs4) 其中,
u1,v1 满足qs2=u21+4v21,u1≡1(mod4),gcd(u1,p)=1 。为了确定指标为2的不可约拟循环码的重量分布,本文还需要以下引理。
引理 4[1] 设
e1 是qs−1 的正因数并且0≤i≤e1 ,则{xy:y∈Fq∗,x∈Ci(e1,qs)}=q−1e1gcd(qs−1q−1,e1)⋅Ci(gcd(qs−1)q−1,e1),qs), 其中
q−1e1gcd(qs−1q−1,e1)⋅C(gcd(qs−1q−1,e1),qs)i 表示C(gcd(qs−1q−1,e1),qs)i 中的任意元素在集合{ xy:y∈F∗q,x∈C(e1,qs)i} 中出现的次数均为q−1e1gcd(qs−1q−1,e1) 。3. 几类指标为2的不可约拟循环码的重量分布
设
N>1 是一个正整数且满足n=qs−1N,N1=gcd(qs−1q−1,N) 。令θ=wN ,其中w 为Fqs 的本原元。Z(qs,β0) 和Z(qs,β1) 分别为使等式Tr(αβ0θi)=0 和Tr(αβ1θj)=0 成立的i,j 的个数。对于C 中任意的码字c ,如果α≠0 ,则它的Hamming重量为WH(c)=2n−Z(qs,β0)−Z(qs,β1) ,其中Z(qs,β0)=|{0≤i≤n−1:Tr(αβ0θi)=0}|,Z(qs,β1)=|{0≤j≤n−1:Tr(αβ1θj)=0}| 令
χ′ 为Fq 上的加法特征,由引理4有Z(qs,β0)=nq+(q−1)N1Nq⋅ηk(N1,qs),Z(qs,β1)=nq+(q−1)N1Nq⋅ηl(N1,qs) 其中,
k,l=0,1,⋯,N1−1 。下面给出当
β0,β1∈F∗qs∖⟨θ⟩,N1=2,3,4 时,式(1)定义的指标为2的不可约拟循环码的重量分布。显然,C0(N1,qs)∖C0(N,qs),C1(N1,qs),⋯,C(N1,qs)N1−1 构成了F∗qs∖⟨θ⟩ 的一个划分。定义S 为F∗qs∖⟨θ⟩ 中的一个分圆类。定理1 设
N 是qs−1 的正因数且使得N1=gcd(qs−1q−1,N)=2 ,则情形(1)如果
β0,β1 在相同的分圆类S 中,则由式(1)定义的不可约拟循环码的重量分布如表1所示。表 1 情形(1):不可约拟循环码的重量分布重量(i) 频数(Ai) 0 1 2Nq(q−1)(qs−1−2η(2,qs)0) qs−12 2Nq(q−1)(qs−1−2η(2,qs)1) qs−12 情形(2)如果
β0,β1 在不同的分圆类S 中,则由式(1)定义的不可约拟循环码的重量分布如表2所示。表 2 情形(2):不可约拟循环码的重量分布重量(i) 频数(Ai) 0 1 2N(q−1)qs−1 qs−1 证明 对于情形(1)本文只给出当
β0,β1∈C(2,qs)0∖C(N,qs)0 时的证明过程。当
α∈C(2,qs)0 时,因为β0,β1∈C(2,qs)0∖C(N,qs)0 ,所以αβ0,αβ1∈C(2,qs)0 。此时,对于c∈C ,有WH(c)=2n−2(nq+2(q−1)Nq⋅η(2,qs)0) ,出现的频数为qs−12 。同理,当α∈C(2,qs)1 时,对于c∈C ,有WH(c)=2n−2(nq+2(q−1)Nq⋅η(2,qs)1) ,出现的频数为qs−12 。因此,式(1)定义的指标为2的不可约拟循环码的重量分布如表1所示。对于情形(2),可采用相同的讨论方法。证毕
推论1 如果
β0,β1 满足定理1中的情形(1),则式(1)定义的指标为2的不可约拟循环码是一个参数为[2(qs−1)N,s,2(q−1)(qs−qs2)Nq] 的2-重量线性码,其重量分布为1+qs−12x2(q−1)(qs−qs2)Nq+qs−12x2(q−1)(qs+qs2)Nq 。证明 如果
β0,β1 满足定理1中的情形(1),则由引理1可知,当p≡1(mod4) 时,η(2,qs)0=−qs2+12,η(2,qs)1=qs2−12 ;当p≡3(mod4) 时,η(2,qs)0=qs2−12,η(2,qs)1=−qs2+12 。将η(2,qs)0,η(2,qs)1 的值分别代入表1中,可得到式(1)中定义的指标为2的不可约拟循环码是一个参数为[2(qs−1)N,s,2(q−1)(qs−qs2)Nq] 的2-重量线性码,其重量分布为1+qs−12x2(q−1)(qs−qs2)Nq+qs−12x2(q−1)(qs+qs2)Nq 。证毕类似于定理1,当
N1=gcd(qs−1q−1,N)=3 时,式(1)定义的指标为2的不可约拟循环码的重量分布由以下定理给出。定理2 设
N 是qs−1 的正因数且使得N1=gcd(qs−1q−1,N)=3 ,则情形(3) 如果
β0,β1 在相同的分圆类S 中,则式(1)定义的不可约拟循环码的重量分布如表3所示。表 3 情形(3):不可约拟循环码的重量分布重量(i) 频数(Ai) 0 1 2Nq(q−1)(qs−1−3η(3,qs)0) qs−13 2Nq(q−1)(qs−1−3η(3,qs)1) qs−13 2Nq(q−1)(qs−1−3η(3,qs)2) qs−13 情形(4) 如果
β0,β1 在不同的分圆类S 中,则式(1)定义的不可约拟循环码的重量分布如表4所示。表 4 情形(4):不可约拟循环码的重量分布重量(i) 频数(Ai) 0 1 1Nq(q−1)[2(qs−1)−3(η(3,qs)0+η(3,qs)1)] qs−13 1Nq(q−1)[2(qs−1)−3(η(3,qs)1+η(3,qs)2)] qs−13 1Nq(q−1)[2(qs−1)−3(η(3,qs)2+η(3,qs)0)] qs−13 推论2 设
N 是qs−1 的正因子,N1=gcd(qs−1q−1,N)=3,p≡2(mod3) 。若β0,β1 满足定理2中情形(3)且s⋅m≡0(mod4) ,则式(1)定义的不可约拟循环码是参数为[2(qs−1)N,s,2(q−1)(qs−qs2)Nq] 的2-重量线性码,其重量分布为1+2(qs−1)3x2(q−1)(qs−qs2)Nq+qs−13x2(q−1)(qs+2qs2)Nq。 若
s⋅m≡2(mod4) ,则式(1)定义的不可约拟循环码是参数为[2(qs−1)N,s,2(q−1)(qs−2qs2)Nq] 的2-重量线性码,其重量分布为1+qs−13x2(q−1)(qs−2qs2)Nq+2(qs−1)3x2(q−1)(qs+qs2)Nq。 证明: 当
β0,β1 满足定理2中情形(3)时,如果s⋅m≡0(mod4) ,此时s⋅m2 为偶数,由引理2可得η(3,qs)0=−1+2qs23,η(3,qs)1=η(3,qs)1=−1−2qs23 ,将其代入表3,可得到推论2中的第1种结果;如果s⋅m≡2(mod4) , 此时s⋅m2 为奇数,则由引理2可得η(3,qs)0=−1−2qs23,η(3,qs)1=η(3,qs)1=−1+2qs23 ,将其代入表3,可得到推论2中的另一种结果。 证毕类似于推论2的证明方法,可得到以下3个结论。
推论3 设
N 是qs−1 的正因子,N1=gcd(qs−1q−1,N)=3,p≡2(mod3) 。若β0,β1 满足定理2中的情形(4)且s⋅m≡0(mod4) ,则式(1)定义的不可约拟循环码是参数为[2(qs−1)N,s,2(q−1)(qs−qs2)Nq] 的2-重量线性码,其重量分布为1+2(qs−1)3x(q−1)(2qs+qs2)Nq+qs−13x2(q−1)(qs−qs2)Nq。 若
s⋅m≡2(mod4) ,则式(1)定义的不可约拟循环码是参数为[2(qs−1)N,s,(q−1)(2qs−qs2)Nq] 的2-重量线性码,其重量分布为1+2(qs−1)3x(q−1)(2qs−qs2)Nq+2(qs−1)3x2(q−1)(qs+qs2)Nq。 推论4 设
N 是qs−1 的正因子,N1=gcd(qs−1q−1,N)=3,p≡1(mod3) 。若β0,β1 满足定理2中的情形(3)且s⋅m≡0(mod3) ,则式(1)定义的不可约拟循环码是一个参数为[2(qs−1)N,s] 的3-重量线性码,其重量分布为1+qs−13x2(q−1)(qs−c1qs3)Nq+qs−13x2(q−1)(qs+12(c1+9d1)qs3)Nq+qs−13x2(q−1)(qs+12(c1−9d1)qs3)Nq。 推论5 设
N 是qs−1 的正因子,N1=gcd(qs−1q−1,N)=3,p≡1(mod3) 。若β0,β1 满足定理2中的情形(4)且s⋅m≡0(mod3) ,则式(1)定义的不可约拟循环码是参数为[2(qs−1)N,s] 的3-重量线性码,其重量分布为1+qs−13x(q−1)(2qs+12(9d1−c1)qs3)Nq+qs−13x(q−1)(2qs−12(c1+9d1)qs3)Nq+qs−13x(q−1)(2qs+c1qs3)Nq。 类似定理1,当
N1=gcd(qs−1q−1,N)=4 时,式(1)定义的不可约拟循环码的重量分布由以下定理给出。定理3 设
N 是qs−1 的正因数使得N1=gcd(qs−1q−1,N)=4 ,则情形(5)如果
β0,β1 在相同的分圆类S 中,则式(1)定义的不可约拟循环码的重量分布如表5所示。表 5 情形(5):不可约拟循环码的重量分布重量(i) 频数(Ai) 0 1 2Nq(q−1)(qs−1−4η(4,qs)0) qs−14 2Nq(q−1)(qs−1−4η(4,qs)1) qs−14 2Nq(q−1)(qs−1−4η(4,qs)2) qs−14 2Nq(q−1)(qs−1−4η(4,qs)3) qs−14 情形(6)如果下列条件之一成立,则式(1)定义的不可约拟循环码的重量分布如表6所示。
表 6 情形(6):不可约拟循环码的重量分布重量(i) 频数(Ai) 0 1 2Nq(q−1)[(qs−1)−2(η(4,qs)0+η(4,qs)1)] qs−14 2Nq(q−1)[(qs−1)−2(η(4,qs)1+η(4,qs)2)] qs−14 2Nq(q−1)[(qs−1)−2(η(4,qs)2+η(4,qs)3)] qs−14 2Nq(q−1)[(qs−1)−2(η(4,qs)3+η(4,qs)0)] qs−14 (a)
β0,β1∈{C(4,qs)0∖C(N,qs)0,C(4,qs)1} ;(b)
β0,β1∈{C(4,qs)0∖C(N,qs)0,C(4,qs)3} ;(c)
β0,β1∈{C(4,qs)1,C(4,qs)2} ;(d)
β0,β1∈{C(4,qs)2,C(4,qs)3 。情形(7) 如果下列条件之一成立,则式(1)定义的不可约拟循环码的重量分布如表7所示。
表 7 情形(7):不可约拟循环码的重量分布重量(i) 频数(Ai) 0 1 2Nq(q−1)[(qs−1)−2(η(4,qs)0+η(4,qs)2)] qs−12 2Nq(q−1)[(qs−1)−2(η(4,qs)1+η(4,qs)3)] qs−12 (e)
β0,β1∈{C(4,qs)0∖C(N,qs)0,C(4,qs)2} ;(f)
β0,β1∈{C(4,qs)1,C(4,qs)3} 。由引理3、推论2和定理3,可得到以下推论。
推论6 设
N 是qs−1 的正因子,N1=gcd(qs−1q−1,N)=4,p≡3(mod4) 。若β0,β1 满足定理3中的情形(5)且s⋅m≡0(mod4) ,则式(1)定义的不可约拟循环码是参数为[2(qs−1)N,s,2(q−1)(qs−qs2)Nq] 的2-重量线性码,其重量分布为1+3(qs−1)4x2(q−1)(qs−qs2)Nq+qs−14x2(q−1)(qs+3qs2)Nq。 若
s⋅m≡2(mod4) ,则式(1)定义的不可约拟循环码是参数为[2(qs−1)N,s,2(q−1)(qs−3qs2)Nq] 的2-重量线性码,其重量分布为1+3(qs−1)4x2(q−1)(qs+qs2)Nq+qs−14x2(q−1)(qs−3qs2)Nq。 推论7 设
N 是qs−1 的正因子,N1=gcd(qs−1q−1,N)=4,p≡3(mod4) 。如果β0,β1 满足定理3中的情形(6)或情形(7),则式(1)定义的指标为2的不可约拟循环码是参数为[2(qs−1)N,s,2(q−1)(qs−qs2)Nq] 的2-重量线性码,其重量分布为1+qs−12x2(q−1)(qs−qs2)Nq+qs−12x2(q−1)(qs+qs2)Nq 。推论8 设
N 是qs−1 的正因子,N1=gcd(qs−1q−1,N)=4,p≡1(mod4) 。若β0,β1 满足定理3中的情形(7)且s⋅m≡0(mod4) ,则式(1)定义的指标为2的不可约拟循环码是参数为[2(qs−1)N,s] 的2-重量线性码,其重量分布为1+qs−12x2(q−1)(qs+(u1+2v1)qs4)Nq+qs−12x2(q−1)(qs−(u1+2v1)qs4)Nq。 4. 最优码的构造
定理4 设
N 是qs−1 的正因子,N1=3,p≡2(mod3),s⋅m≡2(mod4) 。若β0,β1 满足定理2中的情形(4),则有(1)如果
p=2,s=2,N=3(2m−1) ,则式(1)定义的指标为2的不可约拟循环码是一类2-重量MDS码,其参数为[23(2m+1),2,13(2m+1−1)] 。(2)如果
s=2,2N=3(pm−1) ,则式(1)定义的指标为2的不可约拟循环码是一类达到Griesmer界的最优码,其参数为[43(pm+1),2,23(2pm−1)] 。证明 将情形(1)中所给的条件代入推论4, 可得式(1)定义的指标为2的不可约拟循环码是一类2-重量线性码且其参数满足
n=k+d−1 。 由引理5可得到一类2-重MDS码,其参数为[23(2m+1),2,13(2m+1−1)] 。将情形(2)中所给的条件代入推论4,可得到式(1)定义的指标为2的不可约拟循环码是一类2-重量线性码且参数满足
n=∑k−1i=0⌈dqi⌉ 。由引理6可得到一类达到Griesmer界的最优码,其参数为[43(pm+1),2,23(2pm−1)] 。 证毕例1 令
(N1,p,m,s,N)=(3,2,3,2,21) 。由定理4,式(1)定义的指标为2的不可约拟循环码是F8 上参数为[6,2,5] 的2-重量MDS码,其重量分布为1+42x5+21x6 。例2 令
(N1,p,m,s,N)=(3,11,1,2,15) 。由定理4,式(1)定义的指标为2的不可约拟循环码是F11 上参数为[16,2,14] 的达到Griesmer界的2-重量最优码,其重量分布为1+80x14+40x16 。类似于定理4,可由以下定理得到另一类2-重量MDS码。
定理5 设
N 是qs−1 的正因子,N1=4,p≡3(mod4) 。若β0,β1 满足定理3中的情形(6)或情形(7),s=2,N=4(pm−1) ,则式(1)定义的指标为2的不可约拟循环码是一类2-重量MDS码,其参数为[12(pm+1),2,12(pm−1)] 。例3 令
(N1,p,m,s,N)=(4,3,3,2,104) 。由定理5,式(1)定义的指标为2的不可约拟循环码是F27 上参数为[14,2,13] 的2-重量MDS码,其重量分布为1+364x13+364x14 。5. 结论
本文研究了有限域上指标为2的不可约拟循环码的重量分布,构造了几类2-重量线性码和3-重量线性码。特别地,本文得到了3类最优的2-重量线性码。如何利用
ZpZp[v] -加性码[18,19]的重量分布构造有限域上的最优码是一个有意义的研究问题。 -
表 1 初始化预处理后的动作空间占比结果 |Tact|/K
N ρj 0.1 0.2 0.3 0.4 0.6 256 0.05 0.09 0.12 0.18 0.25 512 0.03 0.05 0.08 0.10 0.16 1024 0.10 0.12 0.15 0.17 0.20 算法1 基于多目标强化学习的Polar编码优化构造算法 (1) 初始化设置Polar码长N, 信息比特长度 K, 干扰因子 {ρj,1≤j≤J−1}; (2) 对未干扰接收序列和对应干扰因子 ρj的S个不同干扰样式pi的接收序列,分别重构信息位序列 {AGAN,AGAN,1,AGAN,2,⋯,AGAN,S}; (3) 确定初始动作空间 Tact={AGAN∪AGAN,1∪⋯∪AGAN,S}\{AGAN∩AGAN,1∩⋯∩AGAN,S},初始状态的信息位序列
s:AoN,in={AGAN∩AGAN,1∩⋯∩AGAN,S};若J > 2,则对每个 ρj获得的 AoN,in, Tact相互间取交集。设周期(episode)数的最大值为E;(4) 随机初始化 TQ(s,aN); (5) 对于每个周期e( 1≤e≤E),重复下述(6)~(15)操作; (6) 初始化状态 s; (7) 对于每个周期的阶段k,重复下述操作; (8) 选取动作 aNk,估计误块率值 blerj,k,计算回报值 rNj,k,获得 rN1,k,rN2,k,⋯,s′; (9) 对于 j=0,1,⋯,J−1,根据 rN1,k,rN2,k,⋯,s′依次计算对应接收序列 cj的Q值
Qj(s,aN)=(1−α)Qj(s,aN)+α(rj+maxaN′Qj(s′,aN′));(10) 计算对应接收序列簇 cNk={c0,c1,⋯,cJ−1}的综合Q值 TQ(s,aN); (11) 基于 TQ(s,aN)确定动作 aNk; (12) 更新 AoN,k+1=aNk∪AoN,k, Tact←Tact∖aNk; (13) 状态转移: s←s′; (14) 判断当前状态s是否截止,否,则转到第7步;是,则继续执行下一步; (15) 判断是否满足e=E,否,转到第(5)步;是,继续执行下一步; (16) 输出构造的最优信息位序列 AoN,K。 表 2 混合信道中所提优化方案与对比方案的全局性能增益差 (dB)
码长N 全局增益差 GdB BLERth 10−2 10−3 10−4 128 ∑J−1jGdB[AoN,K,AGAN]ρj 0.27 0.28 0.18 ∑J−1jGdB[AoN,K,APW]ρj 0.08 0.13 0.27 256 ∑J−1jGdB[AoN,K,AGAN]ρj 0.26 0.28 0.26 ∑J−1jGdB[AoN,K,APW]ρj –0.34 –0.16 0.13 512 ∑J−1jGdB[AoN,K,AGAN]ρj 0.32 0.35 0.37 ∑J−1jGdB[AoN,K,APW]ρj –0.17 0.08 0.45 -
[1] ARIKAN E. Channel polarization: A method for constructing capacity-achieving codes for symmetric binary-input memoryless channels[J]. IEEE Transactions on Information Theory, 2009, 55(7): 3051–3073. doi: 10.1109/TIT.2009.2021379 [2] ETSI. ETSI TS 38 212 V15.2. 0 5G; NR; Multiplexing and channel coding[S]. 2018. [3] NIU Kai, ZHANG Ping, DAI Jincheng, et al. A golden decade of polar codes: From basic principle to 5G applications[J]. China Communications, 2023, 20(2): 94–121. doi: 10.23919/JCC.2023.02.015 [4] 白宝明, 马啸, 陈文, 等. 面向B5G/6G的信息传输与接入技术专题序言[J]. 西安电子科技大学学报, 2020, 47(6): 1–4. doi: 10.19665/j.issn1001-2400.2020.06.001BAI Baoming, MA Xiao, CHEN Wen, et al. Editorial: Introduction to the special issue on information transmission and access technologies for B5G/6G[J]. Journal of Xidian University, 2020, 47(6): 1–4. doi: 10.19665/j.issn1001-2400.2020.06.001 [5] DONG Yanfei, DAI Jincheng, NIU Kai, et al. Joint source-channel coding for 6G communications[J]. China Communications, 2022, 19(3): 101–115. doi: 10.23919/JCC.2022.03.007 [6] 魏浩, 张梦洁, 王东明. 6G极化码低时延译码方案[J]. 移动通信, 2022, 46(6): 64–71. doi: 10.3969/j.issn.1006-1010.2022.06.010WEI Hao, ZHANG Mengjie, and WANG Dongming. Low-latency decoding algorithm of polar codes for 6G wireless systems[J]. Mobile Communications, 2022, 46(6): 64–71. doi: 10.3969/j.issn.1006-1010.2022.06.010 [7] 王任之, 潘克刚, 赵瑞祥. 跳频抗干扰通信系统中LDPC码的编码优化设计[J]. 系统工程与电子技术, 2022, 44(11): 3548–3555. doi: 10.12305/j.issn.1001-506X.2022.11.31WANG Renzhi, PAN Kegang, and ZHAO Ruixiang. Optimal design of LDPC Codes in frequency hopping anti-jamming communication system[J]. Systems Engineering and Electronics, 2022, 44(11): 3548–3555. doi: 10.12305/j.issn.1001-506X.2022.11.31 [8] 孙康宁, 马林华, 茹乐, 等. 混合信道下LDPC码稳定条件分析及度序列优化[J]. 通信学报, 2016, 37(9): 168–174. doi: 10.11959/j.issn.1000-436x.2016188SUN Kangning, MA Linhua, RU Le, et al. Analysis of stability condition for LDPC codes and optimizing degree sequences over mixed channel[J]. Journal on Communications, 2016, 37(9): 168–174. doi: 10.11959/j.issn.1000-436x.2016188 [9] 刘士平, 马林华, 孙康宁, 等. 阻塞式干扰环境下LDPC编码跳频通信优化方案[J]. 火力与指挥控制, 2019, 44(2): 32–36,40. doi: 10.3969/j.issn.1002-0640.2019.02.007LIU Shiping, MA Linhua, SUN Kangning, et al. Optimizing of LDPC coded frequency-hopping communication over blocking interference[J]. Fire Control & Command Control, 2019, 44(2): 32–36,40. doi: 10.3969/j.issn.1002-0640.2019.02.007 [10] MORI R and TANAKA T. Performance of polar codes with the construction using density evolution[J]. IEEE Communications Letters, 2009, 13(7): 519–521. doi: 10.1109/LCOMM.2009.090428 [11] TRIFONOV P. Efficient design and decoding of Polar codes[J]. IEEE Transactions on Communications, 2012, 60(11): 3221–3227. doi: 10.1109/TCOMM.2012.081512.110872 [12] HE Gaoning, BELFIORE J C, LAND I, et al. Beta-expansion: A theoretical framework for fast and recursive construction of Polar codes[C]. Proceedings of 2017 IEEE Global Communications Conference, Singapore, 2017: 1–6. [13] LI Jianxiu and CHENG Wenchi. Stacked denoising autoencoder enhanced Polar codes over Rayleigh fading channels[J]. IEEE Wireless Communications Letters, 2020, 9(3): 354–357. doi: 10.1109/LWC.2019.2954907 [14] LIAO Yun, HASHEMI S A, CIOFFI J M, et al. Construction of polar codes with reinforcement learning[J]. IEEE Transactions on Communications, 2022, 70(1): 185–198. doi: 10.1109/TCOMM.2021.3120274 [15] TENG C F and WU A Y A. Convolutional neural network-aided tree-based bit-flipping framework for polar decoder using imitation learning[J]. IEEE Transactions on Signal Processing, 2021, 69: 300–313. doi: 10.1109/TSP.2020.3040897 [16] LU Yang, ZHAO Mingmin, LEI Ming, et al. Deep learning aided SCL decoding of polar codes with shifted-pruning[J]. China Communications, 2023, 20(1): 153–170. doi: 10.23919/JCC.2023.01.013 [17] KORADA S B and URBANKE R L. Polar codes are optimal for lossy source coding[J]. IEEE Transactions on Information Theory, 2010, 56(4): 1751–1768. doi: 10.1109/TIT.2010.2040961 [18] LIU Chunming, XU Xin, and HU Dewen. Multiobjective reinforcement learning: A comprehensive overview[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2015, 45(3): 385–398. 期刊类型引用(2)
1. 李艳俊,王琦,项勇,谢惠琴. 动态密码组件对合MDS矩阵的设计与实现. 微电子学与计算机. 2024(07): 37-45 . 百度学术
2. 李建佳,蔚保国,鲍亚川,杨梦焕,崔宋祚,田润泽,赵军. 一种适应复杂地下环境的导航增强型脉冲超宽带通导一体自组网体制设计研究. 电子与信息学报. 2023(11): 4179-4189 . 本站查看
其他类型引用(1)
-