高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

2024年  第46卷  第8期

封面
 2024 年 8 期封面
2024, 46(8).
摘要:
2024 年 8 期目次
2024, 46(8): 1-4.
摘要:
数据集论文
超大规模MIMO阵列可视区域空间分布数据集
高锐锋, 苗艳春, 陈颖, 王珏, 张军, 韩瑜, 金石
2024, 46(8): 3063-3072. doi: 10.11999/JEIT231273
摘要:
可视区域(VR)信息可用于降低超大规模多输入多输出(XL-MIMO)系统传输设计复杂度,但现有理论分析与传输设计多基于简化的VR统计分布模型。为评估分析XL-MIMO在实际物理传播场景中的性能,该文公开了XL-MIMO阵列VR空间分布数据集,其由环境参数设置、射线追踪仿真、天线场强数据预处理和VR判定准则等步骤构建。该数据集针对典型城区无线传播场景,建立了用户位置采样与场强数据、VR数据之间的关联,总数据条目数量达上亿级。进一步对其中VR形态、VR分布进行了可视化展示与分析,并以基于VR的XL-MIMO用户接入协议为例,利用该数据集对其在真实传播场景中的性能进行了仿真,为该数据集的应用提供了典型样例。
综述评论
以全球导航卫星系统为辐射源的前向散射雷达发展综述
郑雨晴, 艾小锋, 王满喜, 徐志明, 肖顺平
2024, 46(8): 3073-3093. doi: 10.11999/JEIT231255
摘要:
前向散射雷达(FSR)可获得高水平雷达截面积(RCS)的特性使其在反隐身中占据重要地位。利用全球导航卫星系统(GNSS)作为辐射源,具有全天时全天候全地域覆盖的优势,通过部署多个接收节点可构建地面/海上/空中目标监视网络。该文针对基于GNSS的FSR发展现状,从目标检测、目标参数估计、阴影逆合成孔径雷达(SISAR)成像及目标分类识别等方面对关键技术和现存问题进行概述,并从组网探测、多目标定位、布站优化和极化信息获取等方面对基于GNSS的FSR发展趋势提出展望。
基于深度学习的时间序列分类研究综述
任利强, 贾舒宜, 王海鹏, 王子玲
2024, 46(8): 3094-3116. doi: 10.11999/JEIT231222
摘要:
时间序列分类(TSC)是数据挖掘领域中最重要且最具有挑战性的任务之一。深度学习技术在自然语言处理和计算机视觉领域已取得革命性进展,同时在时间序列分析等其他领域也显示出巨大的潜力。该文对基于深度学习的时间序列分类的最新研究成果进行了详细综述。首先,定义了关键术语和相关概念。其次,从多层感知机、卷积神经网络、循环神经网络和注意力机制4个网络架构角度分类总结了当前最新的时间序列分类模型,及各自优点和局限性。然后,概述了时间序列分类在人体活动识别和脑电图情绪识别两个关键领域的最新进展和挑战。最后,讨论了将深度学习应用于时间序列数据时未解决的问题和未来研究方向。该文为研究者了解最新基于深度学习的时间序列分类研究动态、新技术和发展趋势提供了参考。
无线通信与物联网
可重构智能表面辅助的V2I通信系统联合波束赋形算法
仲伟志, 何艺, 段洪涛, 万诗晴, 范振雄, 朱秋明, 林志鹏
2024, 46(8): 3117-3125. doi: 10.11999/JEIT231324
摘要:
为解决基于信道先验知识的联合波束赋形方法受限于多变的车辆与交通基础设施(V2I)通信场景且信道估计开销过大等问题,该文结合环境态势感知,提出一种基于无线传播链路预测的联合波束赋形方法。该方法首先利用射线追踪模拟器构建了可重构智能表面(RIS)辅助的V2I毫米波通信系统模型,通过改变环境态势以获取多样的无线传播链路数据来构建数据集。其次,使用该数据集训练基于机器学习的无线传播链路预测模型。最后,在最大发射功率约束条件下,构建了联合波束赋形问题模型,并基于预测结果采用交替迭代优化方法(AIOA)优化基站波束赋形矩阵和RIS相移矩阵,以实现同步通信车辆用户最小信干噪比(SINR)的最大化。仿真结果验证了该方法的有效性,通过引入非信道先验知识驱动,降低了信道探测开销,提高了该方法在V2I场景中的可行性。
Nakagami-m信道下无人机辅助的速率分拆多址接入协作通信系统性能研究
黄海燕, 张鸿生, 刘伯阳, 梁琳琳, 王春丽
2024, 46(8): 3126-3135. doi: 10.11999/JEIT231385
摘要:
针对多用户通信资源短缺、分配不均衡的问题,该文研究了基于速率分拆多址接入技术(RSMA)的无人机(UAV)辅助多用户下行通信网络。在复杂的实际通信环境中,频率复用所引起的无用信号的干扰不可避免,考虑无人机与各用户节点信息传输受共道干扰影响,在Nakagami-m衰落信道下推导了该无人机协作通信系统的中断概率和信道容量的精确闭式表达式,证明共道干扰的存在使得高信噪比(SNR)区域系统的分集阶数为0。结果表明,在相同的空间模型下,采用RSMA通信方案的系统性能优于非正交多址(NOMA)方案;无人机飞行速度增大时,地-空通信建立视距链路的概率降低,系统中断性能下降。因此,在满足用户实际通信的需求时需要综合考虑无人机飞行速度、多址接入方式、系统性能以及通信连通性,以实现对无人机通信系统整体的有效权衡。
面向同频干扰环境的5G机会信号定位算法研究
孙骞, 丁天语, 简鑫, 李一兵, 于飞
2024, 46(8): 3136-3145. doi: 10.11999/JEIT231423
摘要:
针对全球导航卫星系统(GNSS)拒止环境下定位精度难以保证的问题,该文设计了一种基于新无线电(NR)机会信号的定位方案,并提出一种基于干扰消除子空间追踪(ICSP)算法,解决超密集网络(UDNs)和异构网络(HetNets)环境中同频干扰对定位观测量提取精度不足的问题。通过仿真实验和通用软件无线电外设(USRP)半实物仿真,验证了ICSP算法在复杂网络环境中优化5G机会信号接收机性能、提高定位精度上的有效性。
工业物联网中基于信息熵的联邦增量学习算法与优化
杨睿哲, 谢欣儒, 滕颖蕾, 李萌, 孙艳华, 张大君
2024, 46(8): 3146-3154. doi: 10.11999/JEIT231240
摘要:
面对工业生产过程中大规模、多样且随时间增长的数据和机器学习任务,该文提出一种基于信息熵的联邦增量学习(FIL)与优化方法。基于联邦框架,各本地计算节点可利用本地数据进行模型训练,并计算信息平均熵上传至服务器,以此辅助识别类增任务;全局服务器则根据本地反馈的平均熵选择参与当前轮次训练的本地节点,并判决任务是否产生增量后,进行全局模型下发与聚合更新。所提方法结合平均熵和阈值进行不同情况下的节点选择,实现低平均熵下的模型稳定学习和高平均熵下的模型增量式扩展。在此基础上,采用凸优化,在资源有限的情况下自适应地调整聚合频率和资源分配,最终实现模型的有效收敛。仿真结果表明,在不同的情景下,该文所提方法都可以加速模型收敛并提升训练精度。
混合可重构智能表面和人工噪声辅助的物理层安全通信
邓志祥, 戴陈庆, 张志威
2024, 46(8): 3155-3164. doi: 10.11999/JEIT231235
摘要:
针对可重构智能表面(Reconfigurable Intelligent Reflecting Surface, RIS)辅助的物理层安全通信,该文设计了基于混合有源-无源RIS和人工噪声(Artificial Noise, AN)辅助的安全传输方案。考虑基站和RIS的功率约束以及RIS无源反射元件的反射系数恒模约束,以最大化系统安全传输速率为目标,构建基站发射波束成形、AN波束向量、RIS反射系数矩阵联合优化问题。使用交替优化(Alternating Optimization, AO)、权值最小均方误差(Weighted Minimum Mean Square Error, WMMSE)和半定松弛(Semi-definite Relaxation, SDR)算法,求解所构建的变量高度耦合的非凸优化问题。仿真结果表明,混合RIS辅助安全传输方案,能够有效提高系统的安全速率,与无源RIS相比,能够有效克服“双衰落”效应导致的安全速率降低,与有源RIS相比,具有更高的能量效率。
物联网双层耦合动力学信息传播模型研究
张月霞, 常凤德
2024, 46(8): 3165-3173. doi: 10.11999/JEIT231291
摘要:
信息传播模型的研究是物联网领域的重要组成部分,它有助于提高物联网系统的性能和效率,促进物联网技术的进一步发展,针对物联网通信中影响信息传播的因素复杂且不稳定的问题,该文提出一种双层耦合信息传播模型SIVR-UAD,通过分析物联网中不同状态的设备和用户对信息传播的影响,建立了6种耦合状态,并利用马尔科夫方法分析耦合节点的状态变化过程,找到信息传播平衡点,最后通过理论分析证明了模型的平衡点的唯一性以及稳定性。仿真结果表明,在3组不同的初始耦合节点数下,SIVR-UAD模型中的6种耦合节点数量变化始终趋向同一稳定水平,证明了该模型的平衡点和稳定性。
融合通道个性标准化的本地自适应联邦学习研究
赵宇, 陈思光
2024, 46(8): 3174-3183. doi: 10.11999/JEIT231165
摘要:
为了缓解联邦学习(FL)中客户端之间由于完全重叠特征偏移所带来的数据异构问题影响,该文提出一种融合通道个性标准化的本地自适应联邦学习算法。具体地,构建了一个面向数据特征偏移的联邦学习模型,在训练开始之前先对客户端中的图像数据集进行一系列随机增强操作。其次,客户端分别按颜色通道单独计算数据集的均值和标准差,实现通道个性标准化。进一步地,设计本地自适应更新联邦学习算法,即自适应地聚合全局模型和本地模型以进行本地初始化,该聚合方法的独特之处在于既保留了客户端模型的个性化特征,同时又能从全局模型中捕获必要信息,以提升模型的泛化性能。最后,实验结果表明,该文所提算法与现有相关算法相比,收敛速度更快,准确率提高了3%~19%。
雷达、导航与电磁场电磁波
基于特征融合的窄带雷达短时观测回波序列空中目标识别
郭泽坤, 刘峥, 谢荣, 冉磊, 徐寒铮
2024, 46(8): 3184-3192. doi: 10.11999/JEIT231232
摘要:
窄带雷达因其成本低、作用距离远的优点在防空制导领域有着广泛应用,随着高速机动平台的发展,传统的基于长时间观测回波序列特征建模的目标识别方法已不再适用。针对窄带雷达对短时间观测回波(OEST)序列特征识别能力较差,并且易受诱饵目标干扰,导致识别结果可靠性不高的问题,该文提出一种采用多特征自适应融合的窄带雷达OEST序列空中目标识别方法。首先,对编码层和分类层进行训练,通过构建通道-空间注意力模块,自适应地突出高可分性特征,然后,构建最大边缘正交损失函数,增大不同类别特征间距,缩小同类特征间距,并使类间特征正交,以此提升分类性能;最后,固定编码层与分类层参数,利用重构误差对解码层进行训练,确保模型具备对诱饵等库外目标的准确鉴别能力。实验部分在观测序列长度为100的条件下,分类准确率和鉴别率分别达到94.37%和96.78%,由此可得,所提方法能够有效提升窄带雷达的分类性能和对诱饵目标的鉴别能力,进而提高识别结果的可靠性。
卷积神经网络STAP低空风切变风速估计
李海, 张强, 周桉宇, 熊玉
2024, 46(8): 3193-3201. doi: 10.11999/JEIT231335
摘要:
由于机载气象雷达前视阵下存在非均匀性地杂波,导致难以获得足够的独立同分布样本,影响杂波协方差矩阵准确估计,进而影响风速估计。对此,该文提出一种基于卷积神经网络STAP的低空风切变风速估计方法,通过少量样本就能够实现高分辨杂波空时谱估计。首先,基于卷积神经网络模型训练好高分辨杂波空时谱卷积神经网络,接着计算杂波协方差矩阵,进而计算卷积神经网络STAP最优权矢量进行杂波抑制,达到对低空风切变风速精确估计。该文在小样本情况下,将稀疏恢复问题通过卷积神经网络实现,完成对高分辨杂波空时谱有效估计,仿真实验结果表明该方法可以有效估计空时谱,并完成风速估计。
综合孔径微波辐射计的射频干扰源空间角度稀疏贝叶斯估计方法
张娟, 庄乐慧, 李一楠, 李虹, 窦昊锋
2024, 46(8): 3202-3209. doi: 10.11999/JEIT231367
摘要:
该文提出一种综合孔径微波辐射计射频干扰源(RFI)空间稀疏贝叶斯估计方法。首先建立了综合孔径微波辐射计可见度函数干涉测量模型,观测数据表示为综合孔径天线基线对相关导向矢量观测矩阵与视场亮温的乘积,由于相关导向矢量观测矩阵的正交性和RFI空间角度分布的稀疏性,亮温在基线对相关导向矢量观测矩阵正交基所构成的支撑域中的变换系数是稀疏的。该文在稀疏贝叶斯学习(SBL)框架下对亮温进行稀疏重构。该方法在无需稀疏度和正则化参数等先验信息前提下也能获得较高的重构性能。计算机仿真验证了该方法的有效性。
基于反障碍距离加权的复杂场景电磁频谱地图构建方法
陶诗飞, 吴昱江, 罗佳, 丁浩, 王元贺
2024, 46(8): 3210-3218. doi: 10.11999/JEIT231374
摘要:
针对复杂场景中存在电磁波不可穿透的障碍物导致电磁频谱地图(REMs)构建性能不佳、反距离加权(IDW)算法受限于插值邻域的人工选择等问题,该文提出一种基于Voronoi图的反障碍距离加权(VIODW)的复杂场景电磁频谱地图构建算法。该算法通过创建包含障碍物的Voronoi图,为每一个待插值点自适应选定插值邻域用于电磁频谱数据构建,并利用任意角度路径寻优(ANYA)算法计算得到待插值点与插值邻域内每个监测站点之间的障碍距离,最后以障碍距离的反幂次作为权重加权获得待插值点处的电磁频谱数据,实现高精度的复杂场景电磁频谱地图构建。理论分析和仿真结果表明,该方法具有良好的构建精度,能够准确拟合出电磁波在复杂场景中的功率分布情况,为复杂场景下电磁频谱地图高精度构建提供了一种有效方法。
泰勒展开与交替投影最大似然结合的离网格DOA估计算法
刘帅, 许媛媛, 闫锋刚, 金铭
2024, 46(8): 3219-3227. doi: 10.11999/JEIT231376
摘要:
针对最大似然DOA估计算法需要多维搜索、计算量大且面临着在网格估计的问题,该文提出一种基于泰勒展开的离网格交替投影最大似然算法。该方法首先利用交替投影将多维搜索转化为多个1维搜索,获得对应预设大网格的粗估计结果;再利用矩阵求导理论将1维代价函数在粗估计结果处进行2阶泰勒展开;最后通过对2阶泰勒展开求偏导并令导数等于零,求得离网参数的闭式解。与交替投影最大似然算法相比,该方法突破了搜索网格大小的限制,在保证算法精度的同时,有效减少了算法的在网格计算点数,提升了运算效率。仿真结果证明了该算法的有效性。
一种适用于半互质阵的高精度波达方向估计方法
梁国龙, 滕远鑫, 王晋晋, 付进
2024, 46(8): 3228-3237. doi: 10.11999/JEIT231139
摘要:
在半互质阵列(SCA)下,经典波达方向估计(DoA)算法在面对邻近相干信源时估计性能退化。为了解决该问题,该文提出一种适用于半互质阵列的高精度波达方向估计方法。首先,将半互质阵划分为3个均匀线阵并利用常规波束形成算法对子阵1、子阵2和子阵3的阵列输出信号进行处理;然后,对子阵3的输出信号进行加权后与子阵1,2的输出信号加和构建和波束,利用子阵1与子阵2的输出信号做差构建差波束;最后,将上述和差波束做差得到最终输出信号,计算最终信号的功率得到方位谱。该方法基于半互质阵列特点构建和差波束,充分利用了3个子阵的重叠阵元实现估计精度的提高。通过仿真和湖上实测数据验证表明,该方法可以适用于半互质阵列实现波达方向估计,并且在面对邻近相干信源时其波达方向估计性能优于最小方差无失真估计算法(MVDR)和最小处理算法(MP)。
基于双路射频指纹卷积神经网络与特征融合的雷达辐射源个体识别
肖易寒, 王博煜, 于祥祯, 蒋伊琳
2024, 46(8): 3238-3245. doi: 10.11999/JEIT231236
摘要:
为实现雷达辐射源个体识别不受信号参数、调制方式的影响,该文提出基于双路射频指纹卷积神经网络(Dual RFF-CNN2)和特征融合的雷达辐射源个体识别方法。首先从接收的射频信号中提取原始I/Q(Raw-I/Q)信号;其次分别对Raw-I/Q两路信号进行轴向积分双谱(AIB)和围线积分双谱(SIB)降维以构建双谱积分矩阵;最后将Raw-I/Q信号及双谱积分矩阵共同送入Dual RFF-CNN2网络并进行特征融合以实现雷达辐射源个体识别。实验结果表明,该方法具有较高的识别准确率,提取的“指纹特征”具备稳定性、鲁棒性。
非视距环境下核密度估计的全球卫星导航系统鲁棒定位方法
贾琼琼, 周月颖
2024, 46(8): 3246-3255. doi: 10.11999/JEIT231421
摘要:
非视距(NLOS)传输会引起全球卫星导航系统(GNSS)接收机的伪距测量误差,最终导致定位解出现较大误差,这一问题在城市峡谷等复杂环境下尤为突出。针对该问题,该文提出核密度估计的鲁棒定位方法,其核心思想是在定位解算中引入鲁棒估计来缓解NLOS的影响。考虑到NLOS引起的伪距观测误差偏离高斯分布,所提方法首先利用核密度估计(KDE)方法估计伪距观测误差的概率密度函数,并利用该概率密度函数来构造鲁棒代价函数用于导航解算,从而缓解NLOS引起的定位误差。实验结果表明所提方法在卫星存在NLOS传输时能够较好地减小GNSS的定位误差。
图像与智能信息处理
进化网络模型: 无先验知识的自适应自监督持续学习
刘壮, 宋祥瑞, 赵斯桓, 施雅, 杨登封
2024, 46(8): 3256-3266. doi: 10.11999/JEIT240142
摘要:
无监督持续学习(UCL)是指能够随着时间的推移而学习,同时在没有监督的情况下记住以前的模式。虽然在这个方向上取得了很大进展,但现有工作通常假设对于即将到来的数据有强大的先验知识(例如,知道类别边界),而在复杂和不可预测的开放环境中可能无法获得这些知识。受到现实场景的启发,该文提出一个更实际的问题设置,称为无先验知识的在线自监督持续学习。所提设置具有挑战性,因为数据是非独立同分布的,且缺乏外部监督、没有先验知识。为了解决这些挑战,该文提出一种进化网络模型(英文名EvolveNet),它是一种无先验知识的自适应自监督持续学习方法,能够纯粹地从数据连续体中提取和记忆表示。EvolveNet围绕3个主要组件设计:对抗伪监督学习损失、自监督遗忘损失和在线记忆更新,以进行均匀子集选择。这3个组件的设计旨在协同工作,以最大化学习性能。该文在5个公开数据集上对EvolveNet进行了全面实验。结果显示,在所有设置中,EvolveNet优于现有算法,在CIFAR-10, CIFAR-100和TinyImageNet数据集上的准确率显著提高,同时在针对增量学习的多模态数据集Core-50和iLab-20M上也表现最佳。该文还进行了跨数据集的泛化实验,结果显示EvolveNet在泛化方面更加稳健。最后,在Github上开源了EvolveNet模型和核心代码,促进了无监督持续学习的进展,并为研究社区提供了有用的工具和平台。
考虑坐标耦合的三维变结构多模型机动目标跟踪方法
张宏伟, 高志坚, 张翊
2024, 46(8): 3267-3275. doi: 10.11999/JEIT231290
摘要:
在3维空间机动目标跟踪过程中,目标运动先验未知和坐标耦合误差会引起运动模型-模式失配,而模型-模式失配会引起状态估计有偏。该文根据目标运动速度正交条件修正状态转移矩阵,利用原始-对偶正则约束空间测量到球面可行域,结合自适应转弯率模型和无迹卡尔曼滤波(UKF),进行模型状态滤波并融合状态估计的一致输出,推导3维变结构多模型无迹卡尔曼滤波(VSMMUKF)算法。实验结果表明,相比多模重要性无迹卡尔曼滤波(MIUKF)算法,VSMMUKF计算量相当,能够更准确地拟合3维空间点目标机动运动。相比于交互多模型最大最小粒子滤波(IMM-MPF)算法,VSMMUKF跟踪固定翼无人机(UAV)的滤波精度提升了2.8%~59.9%,整体算法负担减小了1个数量级。
基于统计特征搜索的多元时间序列预测方法
潘金伟, 王乙乔, 钟博, 王晓玲
2024, 46(8): 3276-3284. doi: 10.11999/JEIT231264
摘要:
时间序列中包含一些长期依赖关系,如长期趋势性、季节性和周期性,这些长期依赖信息的跨度可能是以月为单位的,直接应用现有方法无法显式建模时间序列的超长期依赖关系。该文提出基于统计特征搜索的预测方法来显式地建模时间序列中的长期依赖。首先对多元时间序列中的平滑特征、方差特征和区间标准化特征等统计特征进行抽取,提高时间序列搜索对趋势性、周期性、季节性的感知。随后结合统计特征在历史序列搜索相似的序列,并利用注意力机制融合当前序列信息与历史序列信息,生成可靠的预测结果。在5个真实的数据集上的实验表明该文提出的方法优于6种最先进的方法。
平滑注意力与谱上采样细化的非等距三维点云模型对应关系计算
杨军, 张思洋, 吴衍
2024, 46(8): 3285-3294. doi: 10.11999/JEIT231180
摘要:
为了解决非等距3维点云模型对应关系计算易受模型大尺度形变影响而导致对应失真、准确率低且平滑性差的问题,该文提出一种结合平滑注意力与谱上采样细化的非等距3维点云模型对应关系计算新方法。首先,利用点所在表面的几何特征信息设计平滑注意力机制与平滑感知模块,提高特征对大尺度形变区域非刚性变换的感知能力;其次,将深度函数映射模块与平滑正则化约束相结合,提升函数映射计算结果的平滑性;最后,在谱上采样细化模块中,以多分辨率重建的方式得到最终的逐点映射结果。实验结果表明,与已有算法相比,本算法在FAUST、SCAPE和SMAL数据集上构建的对应关系测地误差最小,处理大尺度形变模型时,能够提升逐点映射的平滑性和全局准确率。
粒子群优化的门控循环单元网络漂流浮标轨迹预测
刘凇佐, 王虔, 李磊, 李慧, 余赟
2024, 46(8): 3295-3304. doi: 10.11999/JEIT230945
摘要:
该文针对漂流浮标的轨迹预测问题,提出一种基于深度学习框架的端对端预测模型。由于不同海域的水动力模型存在较大差异,针对海面漂流浮标的流体载荷计算也较为复杂。因此,该文根据漂流浮标历史轨迹形成的多维时间序列,提出更具有普适性的基于数据驱动的轨迹预测模型。该模型将粒子群优化算法(PSO)与门控循环单元(GRU)结合,使用PSO算法对GRU神经网络的超参数进行初始化,经过多次迁移迭代训练后获得最优漂流浮标轨迹预测模型。最后使用多个北大西洋真实漂流浮标轨迹数据进行验证,结果表明PSOGRU算法能够实现准确的漂流浮标轨迹预测。
基于预训练固定参数和深度特征调制的红外与可见光图像融合网络
徐少平, 周常飞, 肖建, 陶武勇, 戴田宇
2024, 46(8): 3305-3313. doi: 10.11999/JEIT231283
摘要:
为了更好地利用红外与可见光图像中互补的图像信息,得到符合人眼感知特性的融合图像,该文采用两阶段训练策略提出一种基于预训练固定参数和深度特征调制的红外与可见光图像融合网络(PDNet)。具体地,在自监督预训练阶段,以大量清晰的自然图像分别作为U型网络结构(UNet)的输入和输出,采用自编码器技术完成预训练。所获得编码器模块能有效提取输入图像的多尺度深度特征功能,而解码器模块则能将其重构为与输入图像差异极小的输出图像;在无监督融合训练阶段,将预训练编码器和解码器模块的网络参数保持固定不变,而在两者之间新增包含Transformer结构的融合模块。其中,Transformer结构中的多头自注意力机制能对编码器分别从红外和可见光图像提取到的深度特征权重进行合理分配,从而在多个尺度上将两者融合调制到自然图像深度特征的流型空间上来,进而保证融合特征经解码器重构后所获得融合图像的视觉感知效果。大量实验表明:与当前主流的融合模型(算法)相比,所提PDNet模型在多个客观评价指标方面具有显著优势,而在主观视觉评价上,也更符合人眼视觉感知特点。
语义增强图像-文本预训练模型的零样本三维模型分类
丁博, 张立宝, 秦健, 何勇军
2024, 46(8): 3314-3323. doi: 10.11999/JEIT231161
摘要:
目前,基于对比学习的图像-文本预训练模型(CLIP)在零样本3维模型分类任务上表现出了巨大潜力,然而3维模型和文本之间存在巨大的模态鸿沟,影响了分类准确率的进一步提高。针对以上问题,该文提出一种语义增强CLIP的零样本3维模型分类方法。该方法首先将3维模型表示成多视图;然后为了增强零样本学习对未知类别的识别能力,通过视觉语言生成模型获得每张视图及其类别的语义描述性文本,并将其作为视图和类别提示文本之间的语义桥梁,语义描述性文本采用图像字幕和视觉问答两种方式获取;最后微调语义编码器将语义描述性文本具化为类别的语义描述,其拥有丰富的语义信息和较好的可解释性,有效减小了视图和类别提示文本的语义鸿沟。实验表明,该文方法在ModelNet10和ModelNet40数据集上的分类性能优于现有的零样本分类方法。
一种改进YOLOv5算法的伪装目标检测方法
彭锐晖, 赖杰, 孙殿星, 李莽, 颜如玉, 李雪
2024, 46(8): 3324-3333. doi: 10.11999/JEIT231170
摘要:
为了深入挖掘伪装目标特征信息含量、充分发挥目标检测算法潜能,解决伪装目标检测精度低、漏检率高等问题,该文提出一种多模态图像特征级融合的伪装目标检测算法(CAFM-YOLOv5)。首先,构建伪装目标多波谱数据集用于多模态图像融合方法性能验证;其次,构建双流卷积通道用于可见光和红外图像特征提取;最后,基于通道注意力机制和空间注意力机制提出一种交叉注意力融合模块,以实现两种不同特征有效融合。实验结果表明,模型的检测精度达到96.4%、识别概率88.1%,优于YOLOv5参考网络;同时,在与YOLOv8等单模态检测算法、SLBAF-Net等多模态检测算法比较过程中,该算法在检测精度等指标上也体现出巨大优势。可见该方法对于战场军事目标检测具有实际应用价值,能够有效提升战场态势信息感知能力。
复杂场景下自适应注意力机制融合实时语义分割
陈丹, 刘乐, 王晨昊, 白熙茹, 王子晨
2024, 46(8): 3334-3342. doi: 10.11999/JEIT231338
摘要:
实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息,再经过特征融合网络(FFN)获得准确语义图像。AAFNet采用扩展的深度可分离卷积(DDW)可增大语义特征提取感受野,提出自适应平均池化(Avp)和自适应最大池化(Amp)构成自适应注意力机制融合模块(AAFM),可细化目标边缘分割效果并降低小目标的漏分率。最后在复杂城市街道场景Cityscapes和CamVid数据集上分别进行了语义分割实验,所设计的AAFNet以32帧/s(Cityscapes) 和52帧/s (CamVid)的推理速度获得73.0%和69.8%的平均分割精度(mIoU),且与扩展的空间注意力网络(DSANet)、多尺度上下文融合网络(MSCFNet)以及轻量级双边非对称残差网络(LBARNet)相比,AAFNet平均分割精度最高。
低分辨率随机遮挡人脸图像的超分辨率修复
任坤, 李峥瑱, 桂源泽, 范春奇, 栾衡
2024, 46(8): 3343-3352. doi: 10.11999/JEIT231262
摘要:
针对低分辨率随机遮挡人脸图像,该文提出一种端到端的4倍超分辨率修复生成对抗网络(SRIGAN)。SRIGAN生成网络由编码器、特征补偿子网络和含有金字塔注意力模块的解码器构成;判别网络为改进的Patch判别网络。该网络通过特征补偿子网络和两阶段训练策略有效学习遮挡区域的缺失特征,通过在解码器中引入金字塔注意力模块和多尺度重建损失增强信息重构,从而实现低分辨率随机遮挡图像与4倍高分辨率完整图像的映射。同时,通过损失函数设计和改进Patch判别网络,确保网络训练的稳定性,提升生成网络性能。对比实验和模块验证实验验证了该算法的有效性。
扩展目标跟踪Student’s t逆Wishart平滑算法
陈辉, 张丁丁, 连峰, 韩崇昭
2024, 46(8): 3353-3362. doi: 10.11999/JEIT231145
摘要:
脉冲干扰和离群量测信息等因素通常会导致异常的厚尾噪声,这使得以高斯假设为前提的扩展目标跟踪(ETT)估计器的性能急剧降低,针对该问题该文提出一种基于扩展目标随机矩阵模型(RMM)的Student’s t逆Wishart平滑(StIWS)算法。首先,将目标的运动状态以及过程噪声和量测噪声建模为Student’s t分布以表征异常噪声对扩展目标概率分布的影响,将目标扩展状态建模为服从逆Wishart分布的随机矩阵。然后,在Student’s t贝叶斯平滑框架下,详细推导了能在扩展目标的多重特征动态演变的过程中有效估计目标状态的StIWS算法。最后,通过扩展目标跟踪的仿真实验结果和真实场景实验结果验证了所提算法的有效性。
多任务协同的多模态遥感目标分割算法
毛秀华, 张强, 阮航, 杨雨昂
2024, 46(8): 3363-3371. doi: 10.11999/JEIT231267
摘要:
利用语义分割技术提取的高分辨率遥感影像目标分割具有重要的应用前景。随着多传感器技术的飞速发展,多模态遥感影像间良好的优势互补性受到广泛关注,对其联合分析成为研究热点。该文同时分析光学遥感影像和高程数据,并针对现实场景中完全配准的高程数据不足导致两类数据融合分类精度不足的问题,提出一种基于多模态遥感数据的多任务协同模型(UR-PSPNet),该模型提取光学图像的深层特征,预测语义标签和高程值,并将高程数据作为监督信息嵌入,以提升目标分割的准确性。该文设计了基于ISPRS的对比实验,证明了该算法可以更好地融合多模态数据特征,提升了光学遥感影像目标分割的精度。
非语言信息增强和对比学习的多模态情感分析模型
刘佳, 宋泓, 陈大鹏, 王斌, 张增伟
2024, 46(8): 3372-3381. doi: 10.11999/JEIT231274
摘要:
因具有突出的表征和融合能力,深度学习方法近年来越来越多地被应用于多模态情感分析领域。已有的研究大多利用文字、面部表情、语音语调等多模态信息对人物的情绪进行分析,并主要使用复杂的融合方法。然而,现有模型在长时间序列中未充分考虑情感的动态变化,导致情感分析性能不佳。针对这一问题,该文提出非语言信息增强和对比学习的多模态情感分析网络模型。首先,使用长程文本信息去促使模型学习音频和视频在长时间序列中的动态变化,然后,通过门控机制消除模态间的冗余信息和语义歧义。最后,使用对比学习加强模态间的交互,提升模型的泛化性。实验结果表明,在数据集CMU-MOSI上,该模型将皮尔逊相关系数(Corr)和F1值分别提高了3.7%和2.1%;而在数据集CMU-MOSEI上,该模型将“Corr”和“F1值”分别提高了1.4%和1.1%。因此,该文提出的模型可以有效利用模态间的交互信息,并去除信息冗余。
一种融合情感和策略信息的共情对话生成方法
朱振方, 李嘉欣, 徐富永, 刘培玉, 张广渊
2024, 46(8): 3382-3389. doi: 10.11999/JEIT231417
摘要:
共情对话旨在为情感焦虑的对话系统聊天用户提供心理健康支持,因此,赋予对话系统共情能力是一个值得关注的问题。现有方法往往只能识别用户的情感状态,并不能根据聊天用户不同的情感状态生成有效的、具有同理心的回复,更不能缓解用户的不良情感。因此,在构建情感支持对话系统的研究中,如何动态地捕捉用户的细粒度情感特征并根据情感特征提供相应的心理支持,需要进一步地探索。该文提出一个情感和策略信息融合的共情对话生成方法,该方法首先使用情感分类网络动态感知用户的情感状态;然后利用支持策略准确地建模策略匹配网络,并根据对话上下文引入对话生成网络进行回复生成;最后,通过比较所提方法和当前较为先进的方法在相应数据集上的实验结果,验证所提方法的有效性以及情感支持的重要性。
一种融合个性化细胞关系和背景信息的宫颈细胞分类方法
丁博, 李超炜, 秦健, 何勇军, 洪振龙
2024, 46(8): 3390-3399. doi: 10.11999/JEIT230826
摘要:
宫颈细胞分类在宫颈癌辅助诊断中发挥着重要的作用。然而,现有的宫颈细胞分类方法未充分考虑细胞关系和背景信息,也没有模拟病理医生的诊断方式,导致分类性能较低。因此,该文提出了一种融合细胞关系和背景信息的宫颈细胞分类方法,由基于细胞关系的图注意力分支(GAB-CCR)和背景信息注意力分支(BAB-WSI)组成。GAB-CCR采用细胞特征间的余弦相似度,首先构建相似和差异细胞关系图,并利用GATv2增强模型对细胞关系建模。BAB-WSI使用多头注意力模块捕捉涂片背景上的关键信息并反映不同区域的重要性。最后,将增强后的细胞特征和背景特征融合,提升了网络的分类性能。实验表明,相比于基线模型Swin Transformer-L,所提方法在准确率、敏感度、特异性和F1-Score分别提高了15.9%, 30.32%, 8.11%和31.62%。
网络与信息安全
秘密共享:高阶掩码S盒和有限域安全乘法设计
唐啸霖, 冯燕, 李明达, 李志强
2024, 46(8): 3400-3409. doi: 10.11999/JEIT231272
摘要:
在信息时代,信息安全是最不能忽视的重要问题,对密码设备的攻击和防护是该领域的研究热点。近年来,多种对密码设备的攻击已为人所知,其目的都是为了获取设备中的密钥,在众多攻击中,功耗侧信道攻击是最受关注的攻击技术之一 。掩码技术是对抗功耗侧信道攻击的有效方法,然而随着攻击手段的不断进步,1阶掩码的防护已经不足以应对2阶及以上的功耗分析攻击,因此对高阶掩码的研究具有重要的意义。为了提升加密电路抗攻击能力,该文基于秘密共享的思想,对分组密码算法的S盒变换实施了高阶掩码防护——共享型掩码,并基于Ishai等人在Crypto 2003上发表的安全方案(ISW框架)提出了有限域安全乘法的通用设计方法。通过实验表明,该文提出的共享型掩码方案不影响加密算法的功能,同时能抵御1阶和2阶相关功耗分析攻击。
低相关区互补序列集的构造方法研究
刘涛, 王玉含, 李玉博
2024, 46(8): 3410-3418. doi: 10.11999/JEIT231332
摘要:
完备互补序列是一类具有理想相关函数性质的信号,在多址接入通信系统、雷达波形设计等领域具有广泛的应用。然而完备互补序列集合大小不超过其子序列数目。为扩展互补序列数目,该文研究了非周期低相关区互补序列集的构造方法,首先提出了两类有限域上的映射函数,进而得到两类参数渐近达到最优的低相关区互补序列集。该类低相关区互补序列集相比完备互补序列集具有更多的序列数目,在通信系统中可支持更多的用户。
面向纵向联邦学习的隐私保护数据对齐框架
高莹, 谢雨欣, 邓煌昊, 朱祖坤, 张一余
2024, 46(8): 3419-3427. doi: 10.11999/JEIT231234
摘要:
纵向联邦学习中,各个客户端持有的数据集中包含有重叠的样本ID和不同维度的样本特征,需要进行数据对齐以适应模型训练。现有数据对齐技术一般将各方样本ID交集作为公开信息,如何在不泄露样本ID交集的前提下实现数据对齐成为亟需解决的问题。基于可交换加密和同态加密技术,该文构造了隐私保护的数据对齐框架ALIGN,包括数据加密、密文盲化、密文求交和特征拼接等步骤,使得相同的原始样本ID经过双重可交换加密可变换为相同的密文,并且对样本特征经同态加密后又进行了盲化处理。ALIGN框架能够对参与方样本ID的密文求交,将交集内样本ID对应的全部特征数据进行拼接并以秘密分享形式分配给参与方。相比现有数据对齐技术,该框架不仅能够保护样本ID交集的隐私性,同时能安全地删除样本ID交集外的样本信息。对ALIGN框架的安全性证明表明,除数据规模外,各客户端不能通过数据对齐获得关于对方数据的任何信息,保证了隐私保护策略的有效性。与现有工作相比,每增加10%的冗余数据,ALIGN框架利用所得数据对齐结果可将模型训练时间缩短约1.3秒,将模型训练准确度稳定在85%以上。仿真实验结果表明,通过ALIGN框架进行纵向联邦学习数据对齐,有利于提升后续模型训练的效率和模型准确度。
电路与系统设计
输入谐波相位控制的宽带高效率连续逆F类功率放大器
黄超意, 聂泽宁, 熊珉
2024, 46(8): 3428-3435. doi: 10.11999/JEIT231202
摘要:
卫星通信与地面移动通信的互补融合已成为趋势,这意味着以功率放大器(功放)为核心的无线射频前端需要应对大带宽和高效率的双重挑战。该文提出的输入谐波相位控制方法可以有效突破功放带宽和效率相互制约的瓶颈,并以连续逆F类工作模式为基础,通过控制输入端二次谐波相位来重构晶体管漏极时域波形,在保证高效率的同时获得阻抗设计空间的大幅提升。利用这一拓展的阻抗设计空间,研制了一款1.7~3.0 GHz的连续逆F类功放,实测结果表明在该工作频段内可以实现40.62~42.78 dBm的输出功率和72.2%~78.6%的漏极效率,同时增益可达10.6~14.8 dB。
一种旁路机制下的低功耗片上网络功率门控设计
欧阳一鸣, 陈志远, 徐冬雨, 梁华国
2024, 46(8): 3436-3444. doi: 10.11999/JEIT231257
摘要:
随着技术尺寸的缩小,静态功耗在片上网络 (NoC)的功耗开销中占据主导地位。功率门控作为一种通用的功耗节约技术,将NoC中空闲模块关闭以降低静态功耗。然而,传统的功率门控技术带来了诸如数据包唤醒延迟,盈亏平衡时间等问题。为了解决上述问题,该文提出代替功率门控路由器进行数据包传输的分区旁路传输机制 (PBTI),并基于该旁路机制设计了低延迟低功耗的功率门控方案。PBTI使用相互独立的旁路分别处理东西方向传输的数据包,并在旁路内部使用公共的缓冲区以提高缓冲区利用率。PBTI可以在路由器断电时实现数据包的注入、传输和弹出。即使网络中所有的路由器均处于功率门控状态,数据包也可以从源节点传输到目的节点。当流量增大超过PBTI的传输能力时,路由器以列为单位进行统一的唤醒。实验结果表明,与不使用功率门控的NoC相比,所提方案降低了83.4%的静态功耗和17.2%的数据包延迟,同时只额外增加了6.2%的面积开销。相较于常规的功率门控方案该文功率门控设计实现了更低的功耗和延迟,具有显著的优势。