High Throughput Dual-mode Reconfigurable Floating-point FFT Processor
-
摘要: 高吞吐浮点可灵活重构的快速傅里叶变换(FFT)处理器可满足尖端雷达实时成像和高精度科学计算等多种应用需求。与定点FFT相比,浮点运算复杂度更高,使得浮点型FFT的运算吞吐率与其实现面积、功耗之间的矛盾问题尤为突出。鉴于此,为降低运算复杂度,首先将大点数FFT分解成若干个小点数基2k 级联子级实现,提出分别针对128/256/512/1024/2048点FFT的优化混合基算法。同时,结合所提出同时支持单通道单精度和双通道半精度两种浮点模式的新型融合加减与点乘运算单元,首次提出一款高吞吐率双模浮点可变点FFT处理器结构,并在28 nm标准CMOS工艺下进行设计并实现。实验结果表明,单通道单精度和双通道半精度浮点两种模式下的运算吞吐率和输出平均信号量化噪声比分别为3.478 GSample/s, 135 dB和6.957 GSample/s, 60 dB。归一化吞吐率面积比相比于现有其他浮点FFT实现可提高约12倍。Abstract: In the advanced applications of real-time radar imaging and high-precision scientific computing systems, the design of high throughput and reconfigurable Floating-Point (FP) FFT accelerator is significant. Achieving high throughput FP FFT with low area and power cost poses a greater challenge due to high complexity of FP operations in comparison to fixed-point implementations. To address these issues, a serial of mixed-radix algorithms for 128/256/512/1024/2048-point FFT are proposed by decomposing long FFT into short implementations with cascaded radix-2k stages so that the complexity of multiplications can be significantly reduced. Besides, two novel fused FP add-subtract and dot-product units for dual-mode functionality are proposed, which can either compute on a pair of double precision operands or on two pairs of single precision operands in parallel. Thus, a high throughput dual-mode floating-point variable length FFT is designed. The proposed processor is implemented based on SMIC 28 nm CMOS technology. Simulation results show that the throughput and Signal-to-Quantization Noise Ratio (SQNR) in single-channel single precision and dual-channel half precision floating-point mode are 3.478 GSample/s, 135 dB and 6.957 GSample/s, 60 dB respectively. Compare to the other FP FFT, this processor can achieve 12 times improvement of normalized throughput-area ratio.
-
1. 引言
近年来,自动驾驶、远程医疗和增强现实等一系列新兴业务和产业蓬勃发展,这对无线网络的信息处理能力提出了更高要求,促使无线网络逐步发展成为通信网络、感知网络和计算网络的融合体[1–3]。与单纯的无线通信技术相比,通信感知一体化技术不仅具有原生的通信功能,而且还具有对环境的感知功能。此外,系统中的资源被通信和感知功能共享,如何协调分配系统资源成为性能优化的新挑战[4]。
无人机(Unmanned Aerial Vehicle, UAV)具有按需部署、机动可控等优点[5]。无人机辅助通信感知一体化系统可以充分利用无人机的机动性,动态调整无人机的位置,提高通信用户或者感知目标的信道质量,更好地实现通信和感知性能的优化[6–10]。文献[6]联合优化无人机位置和发射功率来最大化通信感知一体化系统的网络效用。文献[7]联合设计无人机的飞行轨迹和发射波束赋形,最大化通信用户的通信速率。文献[8]联合优化无人机轨迹、发射波束赋形和感知任务执行时刻,最大化通信用户的通信速率。文献[9]提出一种联合无人机基站和地面基站预测和跟踪用户位置的通信感知一体化方法,并联合优化无人机轨迹以及无人机和用户的关联来最大化用户通信速率和位置克拉美罗下界的加权和。文献[10]考虑概率视距信道模型,在通信和感知服务质量的约束下,联合优化波束赋形和无人机轨迹来提高系统吞吐量。
然而,在上述工作中,空地信道模型大多采用视距信道模型,并忽略了无人机与回程基站之间的回程链路,具有一定的局限性。具体而言,无人机与地面用户或者感知目标的视距信道模型在城市或山区环境下是不准确的,因为它忽略了随机阴影和小尺度衰落[11]。为了更加准确地建模实际信道,空地信道模型可以采用莱斯信道模型。莱斯信道模型由一个确定性的视距分量和一个由障碍物的反射、散射和衍射引起的随机多路径分量组成,考虑了小尺度衰落等实际因素,对实际信道建模更加准确。同时,当无人机中继回程链路的信道质量较差或者可用带宽受限时,可能会导致用户通信速率下降[12]。
解决回程链路问题的一种有效方法是在系统中考虑空地协同网络。将无人车(Unmanned Ground Vehicle, UGV)基站作为无人机中继的回程基站和能源补给站,二者协同构建空地通信感知协同网络,提升通信感知一体化系统的性能和服务范围。文献[13]提出一种无人车基站和无人机基站集群组成空地合作应急网络帮助灾区快速重建通信。文献[14]提出了一种空地协同车载组网体系结构。然而,在上述空地协同工作中,空地协同的方式集中在通信或者感知单一方面,因此其无法直接应用在通信感知一体化系统上。
基于上述工作的局限性,本文研究空地协同通信感知一体化系统,由无人车基站和无人机中继集群组成空地协同网络。采用更加精确且与高度角相关的莱斯信道模型建模空地信道。在莱斯信道下,无人机中继与回程基站、用户或者感知目标的高度角越大,传输过程中遇到的障碍物越少[11],所以空地协同网络的通信感知性能不仅与传输距离有关,还受高度角的影响。因此,本文提出面向空地协同通信感知一体化系统的资源分配和轨迹联合优化方法,在保证系统感知性能的同时,提高通信性能。
2. 系统模型
如图1所示,本文考虑一个由无人车基站和无人机中继集群组成的空地协同通信感知一体化系统,其中,1个单天线无人车基站作为K个无人机中继的回程基站,无人机中继集群接收无人车基站发送的数据,然后将其发送给G个单天线用户,并感知R个目标区域。假设无人车、无人机和用户天线各个方向的增益相同[5,11,15]。在任务开始时,无人车基站搭载并发射无人机集群执行通信感知任务,在任务结束后,无人车回收无人机集群,获取无人机集群对目标区域的回声感知信息。
为了减少链路之间的干扰,系统采用频分复用的方式,不同链路的信号带宽相互正交且相等[6],即Bc,k=Bk=Bsum/(2K),∀k,其中Bsum表示系统总带宽,Bc,k表示无人车与无人机k链路所使用的信号带宽,Bk表示无人机k与关联用户以及目标区域链路所使用的信号带宽。
将任务周期T离散化为N个时隙,每个时隙的长度为δt=T/N。设无人车初始时刻和时隙n的水平位置分别为qI和qc[n],无人机k在时隙n的水平位置和垂直高度分别为qk[n]和hk[n],则无人车和无人机集群的水平位置约束和速度约束分别为
qk[0]=qc[0]=qI,qk[N]=qc[N],∀k (1) ‖qi[n]−qi[n−1]‖≤δtVxyi,max,∀n,i∈{c,k} (2) |hk[n]−hk[n−1]|≤δtVzk,max,∀n,k (3) 其中,‖⋅‖表示欧几里得函数,Vxyi,max,i∈{c,k}表示无人车c或者无人机k最大水平行驶速度。Vzk,max表示无人机k垂直方向最大行驶速度。
假设用户g、目标区域r和障碍物j的位置已知[9],分别为ug, ur和uj,则无人车防碰撞约束表示为
di+dc,min≤‖qc[n]−ui‖,∀n,i∈{g,r,j} (4) 其中,dc,min表示无人车的防碰撞安全距离,di[n],∀i∈{g,r,j}表示用户g,目标区域r或者障碍物j边界与其中心位置的最大距离。
设hk,I为无人机k在时隙0和时隙N的垂直高度,最大最小飞行高度分别为Hmax和Hmin,则
hk[n]=hk,I,n∈{0,N},∀k (5) Hmin≤hk[n]≤Hmax,∀n,k (6) 设dmin表示无人机集群的最小安全距离,则无人机集群的防碰撞约束为
(dmin)2≤‖qk[n]−qk′[n]‖2+|hk[n]−hk′[n]|2,∀n,k≠k′ (7) 定义物体集合I≜{c,g,r}。本文采用莱斯信道模型。在时隙n,无人机k到物体i的信道功率增益
hk,i[n]=√βk,i[n]fk,i[n],∀n,k,i∈I (8) 其中,βk,i[n]=β0(dk,i[n])−2,β0表示参考距离为1 m时的信道功率增益,dk,i[n]表示无人机k到物体i的距离。fk,i[n]表示无人机k到物体i的有效衰落功率。
因为fk,i[n]可以用logistic函数(“S”形状)近似[5,11,15,16],即
fk,i[n]=(C1+C21+exp(−(B1+B2vk,i[n]))),∀n,k,i∈I (9) 其中,B1, B2, C1, C2是最大最小莱斯因子决定的常数。vk,i[n]表示无人机k与物体i高度角的正弦值
1 。设无人车c和无人机k的峰值发射功率和平均发射功率分别为Pc,max, ˉPc, Pk,max和ˉPk。在时隙n,设无人车c向无人机k发射的信号功率为pc,k[n],无人机k的发射功率为pk[n],则
K∑k=1pc,k[n]≤Pc,max,pk[n]≤Pk,max,∀n (10) 1NN∑n=1K∑k=1pc,k[n]≤ˉPc,1NN∑n=1pk[n]≤ˉPk,∀k (11) 设加性高斯白噪声功率谱密度为N0。在时隙n,无人机k回程链路可实现的通信速率(bit/(s·Hz))为
Rk,c[n]=12Klog2(1+|hk,c[n]|2pc,k[n]Bc,kN0) (12) 为了减少不同用户之间的干扰,在每个时隙内,无人机与地面用户为1对1的关系[6],即
0≤G∑g=1ak,g[n]≤1,∀n,k (13) 0≤K∑k=1ak,g[n]≤1,∀n,g (14) ak,g[n](ak,g[n]−1)=0,∀n,k,g (15) 其中,ak,g[n]表示无人机k在时隙n与用户g的关联变量。
在不考虑回程链路的情况下,地面用户g在时隙n的通信速率(bit/(s·Hz))为
Rg[n]=12KK∑k=1ak,g[n]log2(1+|hk,g[n]|2pk[n]BkN0),∀n,g (16) 在任意时隙内,无人机k与关联的地面用户的通信速率之和不大于无人机k回程链路通信速率,即
Rg≤K∑k=1ak,g[n]Rk,c[n],∀n,g (17) 为了减少无人机的能耗,在每个时隙内,无人机k最多感知1个目标区域[17],即
0≤R∑r=1bk,r[n]≤1,∀n,k (18) bk,r[n](bk,r[n]−1)=0,∀n,k,r (19) 其中,bk,r[n]表示无人机k在时隙n与目标区域r的关联变量。
为了提高感知信息的准确性,在整个任务周期内,目标区域至少需要被感知fr次,即
fr≤N∑n=1K∑k=1bk,r[n],∀r (20) 在时隙n,无人机k与目标区域r关联,则无人机k对目标区域r的有效感知功率
pk,r[n]=β0pk[n]d2k,r[n]⋅(C1+C21+exp(−(B1+B2vk,r[n]))),∀n,k,r (21) 设Γmin表示区域r的最小有效感知功率阈值。为了保证感知链路的建立同时减少其他非关联区域r′的回声信号的干扰,需要满足最小有效感知功率约束和感知水平距离约束[17],即
bk,r[n]Γmin≤bk,r[n]pk,r[n],∀n,k,r (22) bk,r[n]‖qk[n]−ur‖≤bk,r[n]ds,min,∀n,k,r (23) 定义优化变量A≜{ak,g[n],∀n,k,g}, B≜{bk,r[n],∀n,k,r}, P≜{pc,k[n],pk[n],∀n,k}, Q≜{qc[n],qk[n],∀n,k}和H≜{hk[n],∀n,k}。本文通过联合优化无人机集群对用户的通信关联A、对目标区域的感知关联B、无人车与无人机集群的发射功率P、无人车与无人机集群的水平轨迹Q以及无人机集群的垂直轨迹H,在用户通信、目标感知、回程链路、轨迹等约束下,最大化用户最小平均通信速率,保证通信用户的公平性。相应的问题建模为
P1:maxA,B,P,Q,H,ηη (24a) s.t.η≤1NN∑nRg[n],∀g (24b) 式(1)−式(7)、式(10)−式(20)、式(22)、式(23) (24c) 其中,η表示用户最小平均通信速率。上述优化问题是一个包含高度耦合变量且非凸的问题,难以求解。为此,下节将利用块坐标下降法和连续凸优化法对其进行求解。
3. 算法设计
为了方便求解,引入松弛变量S≜{sk,c[n],sk,g[n],sk,r[n],∀n,k,g,r}和Rg≜{Rg[n],∀n,g},即
P2:maxA,B,P,Q,H,S,Rg,ηη (25a) s.t.Rg[n]≤12KK∑k=1ak,g[n]⋅log2(1+|hk,g[n]|2pk[n]BkN0),∀n,g (25b) sk,i[n]≤B1+B2vk,i[n],∀n,k,i∈I式(1)−式(7)、式(10)−式(15)、式(17)−式(20)、式(22)、式(23)、式(24b)} (25c) 3.1 通信感知关联优化
对于式(15)和式(19)约束,引入松弛变量ˉak,g[n]和ˉbk,r[n],等价转化为
ak,g[n](1−ˉak,g[n])=0,ak,g[n]=ˉak,g[n],∀n,k,g (26) bk,r[n](1−ˉbk,r[n])=0,bk,r[n]=ˉbk,r[n],∀n,k,r (27) 设ˉA≜{ˉak,g[n],∀n,k,g}和ˉB≜{bk,r[n],∀n,k,r},在P, Q, H和S给定的情况下,P2近似表示为
P3:maxA,B,Rg,ˉA,ˉB,ηη−ωρ (28a) s.t.ρ=N∑nK∑kG∑g(|ak,g[n](1−ˉak,g[n])|2+|ak,g[n]−ˉak,g[n]|2)+N∑nK∑kR∑r(|bk,r[n](1−ˉbk,r[n])|2+|bk,r[n]−ˉbk,r[n]|2) (28b) ωρ=12μρ (28c) 式(13)、式(14)、式(17)、式(18)、式(20)、式(22)、式(23)、式(24b)、式(25b) (28d) 其中,μ表示惩罚项系数,ρ表示关联变量惩罚项。当惩罚项ρ趋近于0,式(15)和式(19)的约束满足[17]。
将P3分解成松弛变量ˉA, ˉB和关联变量A, B这两个优化子问题,并通过交替优化求解。在A, B, Rg和η给定的情况下,令目标函数对ˉA和ˉB的1阶偏导为0,得到最优的松弛变量形式[17]
ˉaoptk,g[n]=ak,g[n]+a2k,g[n]1+a2k,g[n],∀n,k,g (29) ˉboptk,r[n]=bk,r[n]+b2k,r[n]1+b2k,r[n],∀n,k,r (30) 在ˉA和ˉB给定的情况下,P3可以简化为
P4:maxA,B,Rg,ηη−ωρ (31a) s.t.式(13)、式(14)、式(17)、式(18)、式(20)、式(22)、式(23)、式(24b)、式(26) (31b) 问题P4是一个标准的凸优化问题,可以用内点法[18]求解。
3.2 功率优化
在A,B,Q,H和S给定的情况下,P2可以简化为
P5:maxP,Rg,ηη (32a) s.t.式(10)、式(11)、式(17)、式(22)、式(24b)、式(25b) (32b) 显然,P5是一个标准的凸优化问题,可以借助凸优化工具箱求解。
3.3 无人车与无人机集群水平轨迹优化
定理1 当2≤α≤4, C1,C2,γ,x,y>0时,ψ1(x,y)≜(C1+C2x)γyα/2是关于x和y的凸函数。
证明 定义ψ1′(x,y)≜(C3+C4x)1yα/2, (2≤α≤4), C3=C1γ≥0,C4=C2γ≥0。
令ψ1′(x,y)的海森矩阵为∇2ψ1′(x,y),当2≤α≤4且x,y>0时,对于任意t=[t1,t2]T,有tT∇2ψ1′(x,y)t≥0,即ψ1(x,y)是关于x,y>0的凸函数。
证毕 为了方便处理1阶泰勒展开式,定义Xk,i[n]=1+e−sk,i[n],∀n,k,i∈I, Yk,c[n]=‖qk[n]−qc[n]‖2+hk[n]2,∀n,k, Yk,i[n]=‖qk[n]−ui‖2+hk[n]2,∀n,k,i∈{g,r}, λk,c[n]=β0pc,k[n]/(Bc,kN0), λk,g[n]=β0⋅pk[n]/(BkN0)。设Xlk,i[n]和Ylk,i[n]分别为Xk,i[n]和Yk,i[n]第l次迭代的值。由定理1可知,pk,r[n]是关于Xk,i[n]和Yk,i[n]的凸函数。将pk,r[n]在Xlk,i[n]和Ylk,i[n]处1阶泰勒展开,得到pk,r[n]的全局下界plbk,r[n],即
pk,r[n]≥β0pk[n]Ylk,r[n](C1+C2Xlk,r[n])+φlk,r[n](Xk,r[n]−Xlk,r[n])+ζlk,r[n]⋅(Yk,r[n]−Ylk,r[n]) (33) φlk,r[n]=−C1β0pk[n]Xlk,r[n]2Ylk,r[n]ζlk,r[n]=−β0pk[n]Ylk,r[n]2(C1+C2Xlk,r[n])} (34) Rk,i[n]是Xk,i[n]和Yk,i[n]的凸函数[11],将Rk,i[n]在Xlk,i[n]和Ylk,i[n]处1阶泰勒展开,得到Rlbk,i[n]
Rk,i[n]≥12K(log2(1+λk,i[n]Ylk,i[n](C1+C2Xlk,i[n])+ξlk,i[n](Xk,i[n]−Xlk,i[n])+tlk,i[n]⋅(Yk,i[n]−Ylk,i[n])) (35) ξlk,i[n]=−(log2e)C2λk,i[n]Xlk,i[n](Xlk,i[n]Ylk,i[n]+λk,i[n](C1Xlk,i[n]+C2)) (36) tlk,i[n]=−(log2e)(C1Xlk,i[n]+C2)λk,i[n]Ylk,i[n](Xlk,i[n]Ylk,i[n]+λk,i[n](C1Xlk,i[n]+C2)) (37) 设vk,i[n]≜hk[n]/(Yk,i[n])1/2,∀i∈I。vk,i[n]是Yk,i[n]的凸函数[11],将vk,i[n]在Ylk,i[n]处展开,即
vk,i[n]≥hk[n](Ylk,i[n])1/2−hk[n]2(Ylk,i[n])3/2(Yk,i[n]−Ylk,i[n]) (38) 将式(4)和式(7)分别在qlc[n]和qlk[n]−qlk′[n]处1阶泰勒展开,得
di+dc,min≤−‖qlc[n]−ui‖+2(qlc[n]−ui)T⋅(qc[n]−ui),∀n,i∈{g,r,j} (39) d2min≤|hk[n]−hk′[n]|2−‖qlk[n]−qlk′[n]‖2+2(qlk[n]−qlk′[n])T(qk[n]−qk′[n]),∀n,k≠k′ (40) 在A, B, P和H给定的情况下,P2可以近似表示为
P6:maxQ,S,Rg,ηη (41a) s.t.Rg[n]≤12KK∑k=1ak,g[n]Rlbk,c[n],∀n,g (41b) bk,r[n]Γmin≤bk,r[n]plbk,r[n],∀n,k,r (41c) Rg[n]≤12KK∑k=1ak,g[n]Rlbk,g[n],∀n,g (41d) sk,i[n]≤B1+B2vlbk,i[n],∀n,k,i∈I (41e) 式(1)、式(2)、式(23)、式(24b)、式(39)、式(40) (41f) 显然,P6是一个标准的凸优化问题,可以用内点法求解。
3.4 无人机集群垂直轨迹优化
式(7)中,在hlk[n]−hlk′[n]处1阶泰勒展开,得
d2min≤‖qk[n]−qk′[n]‖2−|hlk[n]−hlk′[n]|2+2(hlk[n]−hlk′[n])(hk[n]−hk′[n]),∀n,k≠k′ (42) 对于式(17)、式(22)和式(26),与3.3节式(33)和式(34)同理,得到pk,r[n]和Rk,i[n]的全局下界Γlbk,r[n]和Rlbk,i[n]。则在A,B,P和Q给定的情况下,P10可以近似表示为
P7maxH,S,Rg,ηη (43a) s.t.Rg[n]≤12KK∑k=1ak,g[n]Rlbk,c[n]∀n,g, (43b) bk,r[n]Γmin≤bk,r[n]plbk,r[n],∀n,k,r (43c) Rg[n]≤12KK∑k=1ak,g[n]Rlbk,g[n],∀n,g (43d) 式(3)、式(5)、式(6)、式(17)、式(22)、式(24b)、式(25b)、式(25c)、式(42) (43e) 其中,式(25c)不等号右边是关于H的凹函数[11],因此P7可以用内点法求解。
通过交替优化迭代上面各个子问题直至收敛,完整的优化算法如算法1所示。
表 1 双层迭代算法(1) 初始化迭代次数l1=0和l2=0,关联变量Al1,l2和Bl1,l2,功率变量Pl1,水平轨迹变量Ql1,垂直轨迹变量Hl1,惩罚项系数
μl1,l2,目标函数ηl1,收敛阈值ε1>0, ε2>0,内层循环最大迭代次数L2(2) repeat (3) 令内层迭代次数l2=0,repeat (4) 给定{Al1,l2, Bl1,l2, Pl1, Ql1, Hl1},通过式(29)和式(30)计算{ˉAl1,l2+1, ˉBl1,l2+1} (5) 给定{ˉAl1,l2+1, ˉBl1,l2+1, μl1,l2},通过求解P4得到{Al1,l2+1, Bl1,l2+1, ρl1,l2+1} (6) 更新惩罚项系数μl1,l2+1, l2=l2+1 (7) untilρl1,l2≤ε2 or l2≥L2 (8) 更新Al1+1=Al1,l2, Bl1+1=Bl1,l2,计算ηl1+11 (9) 给定{Al1+1, Bl1+1, Ql1, Hl1},通过求解P5得到{Pl1+1, ηl1+12} (10) 给定{Al1+1, Bl1+1, Pl1+1, Hl1},通过求解P6得到{Ql1+1, ηl1+1,lb3} (11) 给定{Al1+1, Bl1+1, Pl1+1, Ql1+1},通过求解P7得到{Hl1+1, ηl1+1,lb4} (12) 更新l1=l1+1, Al1,0=Al1−1, Bl1,0=Bl1−1, μl1,0,计算ηl1 (13) until ηl1−ηl1−1ηl1−1<ε1 由算法1的步骤(3)–步骤(12)可得,ηl1a≤ηl1+11b≤ηl1+12c=ηl1+1,lb2d≤ηl1+1,lb3e≤ηl1+1,lb4f≤ηl1+1。其中不等号a表示在算法1的步骤(3)–步骤(7)中,惩罚项趋近于0时,目标值具有非减性;不等号b,d和e分别表示在步骤(9)–步骤(11)中,子问题P5, P6和P7的目标函数max(·)具有非减性。等号c表示在步骤(9)中,1阶泰勒展开式在给定局部点具有相同的值。不等号f表示在步骤(11)中1阶泰勒展开得到的ηl1+1,lb4是ηl1+1的下界。因此算法1每次迭代的目标函数值是非减的,且存在上界,因此算法1是收敛的。假设求解器精度为ε>0[18],算法1的时间复杂度为O((N(1+G+K+KG+KR))log2(1/ε))。
4. 仿真结果分析
本节给出仿真结果来验证本文提出方案联合优化算法的性能,并且与以下3种方案作对比:
方案1 固定通信感知关联和功率方案,优化无人车和无人机集群的轨迹。将用户和目标区域分成K簇。无人车和无人机在纯通信时隙分配相等的发射功率,在感知时隙,无人机保持峰值发射功率。
方案2 固定无人机集群高度方案,优化无人机集群的通信感知关联、发射功率和水平轨迹以及无人车的发射功率和行进轨迹,即无人机集群保持相同的高度,即hk[n]=hk,I,∀n。
方案3 固定无人车基站方案,优化无人机集群的通信感知关联、功率和3维轨迹以及无人车的发射功率。在这个方案中,无人车基站保持静止,即,qc[n]=qI,∀n。
对比方案1和方案2的优化算法复杂度均为O((N(1+G+K+KG+KR))log2(1/ε)),方案3优化算法复杂度为O((N(G+max(K+1,R)+KG+KR))log2(1/ε))。在仿真中,工作区域的长宽均为1 250 m,无人车初始位置为(625,0,0) m,无人机数量K为3,用户数G为6,用户最大半径0.5 m,目标区域数R为4,目标区域最大半径为1 m,障碍物数J为5,障碍物最大半径为30 m。3架无人机的初始高度分别为80 m, 90 m, 100 m,无人车峰值发射功率0.15 W,平均发射功率0.015 W,无人机峰值发射功率0.12 W,平均发射功率0.024 W。无人车和无人机最大水平速度分别15 m/s和30 m/s。无人机最大垂直速度为20 m/s,最大最小飞行高度分别为300 m和50 m,无人机感知目标区域的最大水平距离为200 m。系统总带宽为1 MHz,任务总周期为160 s,时隙长度为0.5 s,高斯白噪声功率谱密度N0= –169 dBm/Hz,无人车防碰撞距离为20 m,无人机防碰撞距离为10 m,有效感知功率阈值为–95 dBm,任务周期内每个目标区域的感知频数为20次,参考距离1 m的信噪比为-60 dB,莱斯信道参数[11]B1=–4.3221, B2=6.0750, C1=0, C2=1。设算法1中ε1=1e–4, ε2=1e–5, L2=10。
图2给出了算法1目标函数和惩罚项的迭代情况。在不同的Γmin和fr条件下,所提出算法迭代到30次左右,惩罚项趋近于0,且目标函数值收敛,说明在不同参数下,算法1可以达到良好的收敛效果。
图3是在Γmin= –95 dBm和fr=20 次时,算法1得到的无人机中继的通信感知关联情况。可以看出,感知任务较少的无人机会分配通信时隙给感知任务较多的无人机所关联的用户。
图4给出了当Γmin= –95 dBm和fr=20 次时,算法1得到的无人车与无人机集群的水平轨迹和3维轨迹。在图4(a)中,无人车依次为无人机提供信道质量较好的回程链路,无人机飞往关联的目标区域执行感知任务,在感知完后,靠近关联的用户和无人车,获得较好的信道质量。从图4(b)中看出,无人车和无人机动态调整位置,改变回程链路、通信链路和感知链路的信道质量,协调通信感知性能之间的权衡。
图5给出了当fr=20 次时几种算法用户最小平均通信速率和有效感知功率阈值的关系。随着有效感知功率阈值的减小,用户最小平均通信速率越来越大,但在–105 dBm以后受限于感知频率等因素,减小有效感知功率阈值,用户最小平均通信速率提升不大。所提优化算法的用户最小平均通信速率均比其他3个对比算法明显提高。因为所提优化算法方案拥有更多的优化自由度,实现通信感知性能之间更好的权衡。
图6给出了当Γmin=–95 dBm时几种算法的用户最小平均通信速率和目标区域感知次数的关系。所提优化算法的用户最小平均通信速率均比其他对比方案高。从图5和图6可以看出,与其他3种优化方案相比,所提优化算法虽然增加了一定的复杂度(仍是可接受的多项式复杂度),但显著提高了用户最小平均通信速率,从而验证了所提优化算法的有效性和必要性。
5. 结论
本文提出一种以空地协同的方式辅助通信感知一体化系统的方法,通过优化无人机中继集群对用户的通信关联和目标区域的感知关联、发射功率和飞行轨迹,以及无人车基站的发射功率和行进轨迹,最大化用户最小平均通信速率。基于块坐标下降和连续凸优化法,提出一种双层迭代的算法求解次优解。仿真结果表明,所提优化算法在不同参数下均有良好的收敛性。此外,相比于无人机集群高度固定、通信感知关联和发射功率固定以及回程基站静止这3种基准方案,所提算法可以实现通信感知一体化系统中通信感知任务关联的均衡,并且动态调整空地协同网络的位置和发射功率,使之与通信感知一体化系统的通信感知任务相适应,协调通信感知性能之间的权衡,使得在相同感知性能下,有效提高了用户最小平均通信速率。
-
表 1 本文所提出的混合基算法
点数 优化算法 每个子级相应的基底 1 2 3 4 5 6 7 8 9 10 128 23-22-22 4 8 128 4 16 4 256 24-22-22 4 16 4 256 4 16 4 512 24-22-23 4 16 4 512 4 32 4 8 1024 25-22-23 4 8 32 4 1024 4 32 4 8 2048 25-23-23 4 8 32 4 2048 4 8 64 4 8 表 2 双模浮点融合加减运算单元关键路径
模块名 流水级 延时(ns) 数据提取与尾数生成 1 0.43 指数比较与尾数交换 1 0.77 指数阶差与尾数对齐 2 1.98 尾数求和差 3 1.47 LZA 3 0.35 规格化左移 3 0.16 表 3 双模浮点融合加减运算单元性能比较结果
参数 文献[6] 参考结构T1 本文 工艺 (nm) 45 28 28 归一化面积 (μm2) 5226 (100%) 2665 (51%) 2317 (44%) 工作频率 (MHz) 1920 500 435 计算延迟 (ns) 1.0 6.0 6.9 功耗 (mW) 5.2 0.6 0.4 功耗×周期 2.70 (100%) 1.20 (44%) 0.84 (31%) 表 4 双模浮点融合点乘运算单元关键路径
模块名 流水级 延时(ns) 数据提取与指数比较 1 0.33 尾数部分积相乘 1 0.87 指数阶差与乘积对齐 2 1.25 双模4:2 CSA 2 0.20 双加法舍入路径 2 0.53 LZD与规格化左移 3 1.98 表 5 双模浮点融合点乘运算单元性能比较结果
参数 文献[5] 参考结构T2 本文 工艺 (nm) 45 28 28 归一化面积 (μm2) 12865 (100%) 10336 (80%) 10701 (83%) 工作频率 (MHz) 1493 500 435 计算延迟 (ns) 2.1 6.0 6.9 功耗 (mW) 16.9 2.7 2.5 功耗×周期 11.3 (100%) 5.3 (47%) 5.6 (50%) 表 6 双模浮点FFT整体性能对比
性能参数 文献[2] 文献[9] 文献[16] 本文 工艺 (nm) 90 65 55 28 FFT结构 基于存储器 Hybrid MDF MDF FFT点数 512 1024 1024 128/256/512/1024/2048 并行度 8 1 1 8 数据类型:字长 (bit) 块浮点:12 浮点:32 定点:16 浮点:32/浮点:16 平均输出SQNR (dB) 57 139 55 SP:135/HP:60 时钟频率 (MHz) 324 400 200 435 计算时间 (μs) 0.3 2.6 5.1 0.2/0.3/0.6/1.1/2.2 运算吞吐率 (MSample/s) 2592 400 200 SP:3478/HP:6957 平均功耗 (mW) 42 417 8 104 @435 MHz 有效面积 (mm2) 0.93 1.19 0.15 1.41 归一化面积 10.0 22.1 1.9 16.0 归一化吞吐率面积比 259 18 103 SP:220/HP:440 -
吕倩, 苏涛. 基于改进型快速双线性参数估计的复杂运动目标ISAR成像[J]. 电子与信息学报, 2016, 38(9): 2301–2308 doi: 10.11999/JEIT151359LÜ Qian and SU Tao. ISAR imaging of targets with complex motion based on the modified fast bilinear parameter estimation[J]. Journal of Electronics&Information Technology, 2016, 38(9): 2301–2308 doi: 10.11999/JEIT151359 HUANG Shenjui and CHEN S. A high-throughput radix-16 FFT processor with parallel and normal input/output ordering for IEEE 802.15.3c systems[J]. IEEE Transactions on Circuits and Systems Ⅰ:Regular Papers, 2012, 59(8): 1752–1765 doi: 10.1109/TCSI.2011.2180430 LAN G and FRANK H. Digital Processing of Synthetic Aperture Radar Data: Algorithms and Implementation[M]. Boston: Artech House Publishers, 2005: 154–210. 陈杰男, 费超, 袁建生, 等. 超高速全并行快速傅里叶变换器[J]. 电子与信息学报, 2016, 38(9): 2410–2414 doi: 10.11999/JEIT160036CHEN Jienan, FEI Chao, YUAN Jiansheng, et al. An ultra-high-speed fully-parallel fast Fourier transform design[J]. Journal of Electronics&Information Technology, 2016, 38(9): 2410–2414 doi: 10.11999/JEIT160036 JONGWOOK S and EARL E. Improved architectures for a floating-point fused dot product unit[C]. IEEE Symposium on Computer Arithmetic, Austin, USA, 2013: 41–48. doi: 10.1109/ARITH.2013.26. JONGWOOK S and EARL E. Improved architectures for a fused floating-point add-subtract unit[J]. IEEE Transactions on Circuits and Systems Ⅰ:Regular Papers, 2012, 59(10): 2285–2291 doi: 10.1109/TCSI.2012.2188955 CHO T and LEE H. A high-speed low-complexity modified radix-25 FFT processor for high rate WPAN applications[J]. IEEE Transactions on Very Large Scale Integration(VLSI)Systems, 2013, 21(1): 187–191 doi: 10.1109/TVLSI.2011.2182068 WANG Chao, YAN Yuwei, and FU Xiaoyu. A high-throughput low-complexity radix-24-22-23 FFT/IFFT processor with parallel and normal input/output order for IEEE 802.11ad systems[J]. IEEE Transactions on Very Large Scale Integration(VLSI)Systems, 2015, 23(11): 2728–2732 doi: 10.1109/TVLSI.2014.2365586 WANG Mingyu and LI Zhaolin. A hybrid SDC/SDF architecture for area and power minimization of floating-point FFT computations[C]. IEEE International Symposium on Circuits and Systems, Montreal, Canada, 2016: 2170–2173. doi: 10.1109/ISCAS.2016.7539011. EARL E and HANI H. FFT implementation with fused floating-point operations[J]. IEEE Transactions on Computers, 2012, 61(2): 284–288 doi: 10.1109/TC.2010.271 TANG S N, TSAI J W, and CHANG T Y. A 2.4-GS/s FFT processor for OFDM-based WPAN applications[J]. IEEE Transactions on Circuits and Systems Ⅱ:Express Briefs, 2010, 57(6): 451–455 doi: 10.1109/TCSII.2010.2048373 NIE Zedong, ZHANG Fengjuan, LI Jie, et al. Low-power digital ASIC for on-chip spectral analysis of low-frequency physiological signals[J]. Journal of Semiconductors, 2012, 33(6): 67–70 doi: 10.1088/1674-4926 IEEE 754-2008. IEEE Standard for Floating-Point Arithmetic[S]. 2008. doi: 10.1109/IEEESTD.2008.5976968. PETER K. Correcting the normalization shift of redundant binary representations[J]. IEEE Transactions on Computers, 2009, 58(10): 1453–1439 doi: 10.1109/TC.2009.38 YANG C H, YU T H, and DEJAN M. Power and area minimization of reconfigurable FFT processors: A 3GPP-LTE example[J]. IEEE Journal of Solid-State Circuits, 2011, 47(3): 757–768 doi: 10.1109/JSSC.2011.2176163 MARIO G, HUANG S J, CHEN S G, et al. The serial commutator FFT[J]. IEEE Transactions on Circuits and Systems Ⅱ:Express Briefs, 2016, 63(10): 974–978 doi: 10.1109/TCSII.2016.2538119 YANG K J, TSAI S H, and CHUANG G. MDC FFT/IFFT processor with variable length for MIMO-OFDM systems[J]. IEEE Transactions on Very Large Scale Integration(VLSI)Systems, 2013, 21(4): 720–731 doi: 10.1109/TVLSI.2012.2194315 期刊类型引用(2)
1. 潘钰,胡航,金虎,雷迎科,冯辉,姜丽,张孟伯. 非授权频段下无人机辅助通信的轨迹与资源分配优化. 电子与信息学报. 2024(11): 4287-4294 . 本站查看
2. 郭丹. 无线传感器网络簇间通信信息自适应节能优化方法. 长江信息通信. 2024(11): 104-106 . 百度学术
其他类型引用(0)
-