高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码
优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。本栏目内容尚未正式出版,未经编辑部许可,不得转载。
显示方式:
基于无监督图互信息最大化的海面小目标异常检测
许述文, 何绮, 茹宏涛
当前状态:  doi: 10.11999/JEIT230887
[摘要](0) [HTML全文](0) [PDF 2068KB](0)
摘要:
受到复杂海洋环境的影响,雷达对海面慢速小目标难以实现高性能检测。对于这类目标,传统的基于能量的统计检测方法存在着严重的性能损失。针对这一问题,该文提出了基于互信息最大化框架下的海面小目标检测方法,实现海杂波背景下的无监督目标异常检测任务。首先,考虑到高分辨雷达回波不满足传统神经网络对样本独立同分布的假设,该文从图的角度重新建模数据,利用回波的空时相关特性来构建图拓扑结构。该文提出相对最大节点度并联合7个已有特征作为节点的初始表示向量。接下来,采用图注意力网络作为互信息最大化框架中的编码器学习节点表示向量。最后,使用异常检测算法进行目标检测,并实现虚警可控。经实测数据验证,使用快速凸包学习算法时,相比三特征检测器,所提检测器性能提升了9.2%;相比时频三特征检测器,性能提升了7.9%。当网络输出更高维的表示向量时,使用孤立森林算法的检测器的性能提升了27.4%。
果蝇嗅视神经通路研究综述
章盛, 郑胜男, 沈洁, 殷兴辉, 徐立中
当前状态:  doi: 10.11999/JEIT230508
[摘要](6) [HTML全文](5) [PDF 8587KB](0)
摘要:
果蝇嗅觉和视觉神经系统对于自然环境中嗅觉和视觉刺激具有高度的灵敏性,高灵敏的嗅视单模态感知决策和跨模态协同决策机制为仿生应用提供一定的启示作用。该文首先以果蝇嗅觉和视觉神经系统为基础,从嗅觉和视觉信号的捕获、加工、决策3个部分概述了果蝇嗅觉和视觉神经单模态感知决策生理机制与计算模型的研究现状,同时对果蝇嗅觉和视觉神经跨模态协同决策生理机制与计算模型进行阐述;然后对果蝇嗅觉和视觉的单模态感知和跨模态协同的典型仿生应用进行归纳;最后总结果蝇嗅视神经通路生理机制与计算建模当前面临的难题并展望未来发展趋势,为未来相关研究工作奠定了基础。
全球尺度下的海洋鱼类图像智能分类研究进展
周鹏, 李昌永, 步雨馨, 周芷诺, 王春生, 沈红斌, 潘小勇
当前状态:  doi: 10.11999/JEIT231365
[摘要](20) [HTML全文](16) [PDF 1107KB](5)
摘要:
在全球尺度上了解鱼类物种组成、丰度及时空分布等,将有助于其生物多样保护。水下图像采集是获取鱼类物种多样性数据的主要调查手段之一,但图像信息分析工作耗时耗力。2015年以来,海洋鱼类图像数据集更新和深度学习模型算法优化等方面取得了一系列进展,但细粒度分类表现仍显不足,研究成果的生产实践应用相对薄弱。因此,该文首先分析海洋相关行业对鱼类自动化图像分类的需求,然后综合介绍鱼类图像数据集和深度学习算法应用,并分析了所面临的小样本下的细粒度分析等主要挑战及相应解决方法。最后探讨了基于深度学习的海洋鱼类图像自动化分类对相关图像信息处理研究及应用平台对未来在生态环境监测等海洋相关产业领域的重要性及其前景。该文旨在为快速了解基于深度学习的海洋鱼类图像自动化分类的研究背景、进展和未来方向的工作者提供相关信息。
面向全息MIMO 6G通信的电磁信道建模理论与方法
黄崇文, 季然, 魏丽, 宫铁瑞, 陈晓明, 沙威, 杨军, 张朝阳, YuenChau
当前状态:  doi: 10.11999/JEIT23129
[摘要](96) [HTML全文](40) [PDF 2456KB](29)
摘要:
全息多输入多输出(HMIMO)是6G通信中的新兴技术,相应阵列由固定物理孔径下的密布天线单元组成。全息MIMO是电磁约束下Massive MIMO天线技术的拓展。全息MIMO系统在有效提升无线通信性能方面具有极大的潜力。比如,可用最小的功率损耗实现尽可能大的连续孔径,灵活控制目标方向的电磁波传输等。但是,由于全息MIMO系统包含大量的紧密分布的天线单元,且单元之间的距离小于半波长,因而造成严重的电磁耦合作用。这些耦合使传统的独立同分布的信道假设失效。因此,如何设计一个有效且贴近实际的信道建模成为当前全息MIMO研究中最具挑战性的问题之一。针对该挑战,该文研究了基于电磁场理论的四种信道建模方式,它们都能很好描述全息MIMO系统中的电磁波传输特征。第1种是基于平面格林函数的精确信道建模方式,该方式将自由空间中点对点的格林函数扩展到平面之间积分形式的格林函数,通过积分计算来构造两个全息MIMO平面之间的通信信道,但该方法的复杂度较高。第2、3种方法则分别采用了平面波展开和球面波展开来近似全息MIMO的通信信道,这两种方案的复杂度更低。其中,基于平面波展开的信道建模形式相对简单,更适用于远场,但是会低估单元强耦合时的最大系统容量;基于球面波展开的信道建模能更好捕捉电磁波信道几何特征,但其复杂度较高。最后介绍基于随机格林函数的信道建模方法,主要描述富散射环境或瑞利信道中电磁波的随机特性。
基于面部全局抑郁特征局部感知力增强和全局-局部语义相关性特征融合的抑郁强度识别
孙强, 李正, 何浪
当前状态:  doi: 10.11999/JEIT231330
[摘要](51) [HTML全文](28) [PDF 5772KB](19)
摘要:
现有基于深度学习的大多数方法在实现患者抑郁程度自动识别的过程中,主要存在两大挑战:(1)难以利用深度模型自动地从面部表情有效学习到抑郁强度相关的全局上下文信息,(2)往往忽略抑郁强度相关的全局和局部信息之间的语义一致性。为此,该文提出一种全局抑郁特征局部感知力增强和全局-局部语义相关性特征融合(PLEGDF-FGLSCF)的抑郁强度识别深度模型。首先,设计了全局抑郁特征局部感知力增强(PLEGDF)模块,用于提取面部局部区域之间的语义相关性信息,促进不同局部区域与抑郁相关的信息之间的交互,从而增强局部抑郁特征驱动的全局抑郁特征表达力。然后,提出了全局-局部语义相关性特征融合(FGLSCF)模块,用于捕捉全局和局部语义信息之间的关联性,实现全局和局部抑郁特征之间的语义一致性描述。最后,在AVEC2013和AVEC2014数据集上,利用PLEGDF-FGLSCF模型获得的识别结果在均方根误差(RMSE)和平均绝对误差(MAE)指标上的值分别是7.75/5.96和7.49/5.99,优于大多数已有的基准模型,证实了该方法的合理性和有效性。
面向演化计算的群智协同研究综述
公茂果, 罗天实, 李豪, 何亚静
当前状态:  doi: 10.11999/JEIT231195
[摘要](8) [HTML全文](5) [PDF 2119KB](0)
摘要:
演化计算为代表的群体智能的迅速发展引发了人工智能领域新一轮技术变革。为满足多样化复杂系统应用需求,人工智能越来越趋向于跨级别的智能化、协同化研究。该文提出面向演化计算的群智协同的概念,根据群智协同层级将人工智能跨级别的智能化、协同化研究分为微观协同、中观协同与宏观协同,以群智协同视角对近年来上述分支领域相关研究做出了总结。首先,通过分析决策变量级协同、全局与局部级协同对微观协同进行了阐述。其次,从目标级协同和任务级协同两个维度对中观协同进行了总结。再次,以智能协同系统中存在的空天地海协同、车路云协同和端边云协同对宏观协同展开分析。最后,该文指出了面向演化计算的群智协同领域的研究挑战,并对相关领域发展方向进行了展望。
卷积神经网络与视觉Transformer联合驱动的跨层多尺度融合网络高光谱图像分类方法
赵凤, 耿苗苗, 刘汉强, 张俊杰, 於俊
当前状态:  doi: 10.11999/JEIT231209
[摘要](8) [HTML全文](5) [PDF 4018KB](0)
摘要:
高光谱图像(HSI)分类是地球科学和遥感影像处理任务中最受关注的研究热点之一。近年来,卷积神经网络(CNN)和视觉Transformer相结合的方法,通过综合考虑局部-全局信息,在HSI分类任务中取得了成功。然而,HSI中地物具有丰富的纹理信息和复杂多样的结构,且不同地物之间存在尺度差异。现有的二者结合的方法通常对多尺度地物目标的纹理和结构信息的提取能力有限。为了克服上述局限性,该文提出CNN与视觉Transformer联合驱动的跨层多尺度融合网络HSI分类方法。首先,从结合CNN与视觉Transformer的角度出发,设计了跨层多尺度局部-全局特征提取模块分支,其主要由卷积嵌入的视觉Transformer和跨层特征融合模块构成。具体来说,卷积嵌入的视觉Transformer通过深度融合多尺度CNN与视觉Transformer实现了多尺度局部-全局特征信息的有效提取,从而增强网络对不同尺度地物的关注。进一步地,跨层特征融合模块深度聚合了不同层次的多尺度局部-全局特征信息,以综合考虑地物的浅层纹理信息和深层结构信息。其次,构建了分组多尺度卷积模块分支来挖掘HSI中密集光谱波段潜在的多尺度特征。最后,为了增强网络对HSI中局部波段细节和整体光谱信息的挖掘,设计了残差分组卷积模块对局部-全局光谱特征进行提取。Indian Pines, Houston 2013和Salinas Valley 3个HSI数据集上的实验结果证实了所提方法的有效性。
极化雷达图像目标超分辨率重建研究进展
李铭典, 肖顺平, 陈思伟
当前状态:  doi: 10.11999/JEIT231249
[摘要](11) [HTML全文](5) [PDF 9774KB](0)
摘要:
成像雷达具有全天时、全天候的观测能力,能够通过成像处理获得目标雷达图像信息,是对地观测、侦察监视等民用和军用领域中的重要遥感设备。高分辨率雷达图像能够提供目标的详细轮廓和精细结构,有利于后续目标分类识别等应用。对获取的雷达图像,如何利用信号和信息处理等理论方法进一步提升分辨率,突破分辨率瑞利极限,具有重要的科学研究和实际应用价值。另一方面,作为电磁波的重要属性之一,极化在目标特性的获取和挖掘中发挥着重要作用,能够为目标超分辨率重建带来丰富信息。为此,该文梳理了极化雷达图像目标超分辨率重建的概念及性能评价指标,并重点归纳整理了极化雷达图像目标超分辨率重建方法及其应用。最后,总结了现有方法的局限性并展望了未来的技术发展趋势。
面向纵向联邦学习的隐私保护数据对齐框架
高莹, 谢雨欣, 邓煌昊, 朱祖坤, 张一余
当前状态:  doi: 10.11999/JEIT231234
[摘要](7) [HTML全文](5) [PDF 1668KB](0)
摘要:
纵向联邦学习中,各个客户端持有的数据集中包含有重叠的样本ID和不同维度的样本特征,需要进行数据对齐以适应模型训练。现有数据对齐技术一般将各方样本ID交集作为公开信息,如何在不泄露样本ID交集的前提下实现数据对齐成为亟需解决的问题。基于可交换加密和同态加密技术,该文构造了隐私保护的数据对齐框架ALIGN,包括数据加密、密文盲化、密文求交和特征拼接等步骤,使得相同的原始样本ID经过双重可交换加密可变换为相同的密文,并且对样本特征经同态加密后又进行了盲化处理。ALIGN框架能够对参与方样本ID的密文求交,将交集内样本ID对应的全部特征数据进行拼接并以秘密分享形式分配给参与方。相比现有数据对齐技术,该框架不仅能够保护样本ID交集的隐私性,同时能安全地删除样本ID交集外的样本信息。对ALIGN框架的安全性证明表明,除数据规模外,各客户端不能通过数据对齐获得关于对方数据的任何信息,保证了隐私保护策略的有效性。与现有工作相比,每增加10%的冗余数据,ALIGN框架利用所得数据对齐结果可将模型训练时间缩短约1.3秒,将模型训练准确度稳定在85%以上。仿真实验结果表明,通过ALIGN框架进行纵向联邦学习数据对齐,有利于提升后续模型训练的效率和模型准确度。
语义增强图像-文本预训练模型的零样本三维模型分类
丁博, 张立宝, 秦健, 何勇军
当前状态:  doi: 10.11999/JEIT231161
[摘要](40) [HTML全文](25) [PDF 1566KB](5)
摘要:
目前,基于对比学习的图像-文本预训练模型(CLIP)在零样本3维模型分类任务上表现出了巨大潜力,然而3维模型和文本之间存在巨大的模态鸿沟,影响了分类准确率的进一步提高。针对以上问题,该文提出一种语义增强CLIP的零样本3维模型分类方法。该方法首先将3维模型表示成多视图;然后为了增强零样本学习对未知类别的识别能力,通过视觉语言生成模型获得每张视图及其类别的语义描述性文本,并将其作为视图和类别提示文本之间的语义桥梁,语义描述性文本采用图像字幕和视觉问答两种方式获取;最后微调语义编码器将语义描述性文本具化为类别的语义描述,其拥有丰富的语义信息和较好的可解释性,有效减小了视图和类别提示文本的语义鸿沟。实验表明,该文方法在ModelNet10和ModelNet40数据集上的分类性能优于现有的零样本分类方法。
智能交通系统中具有隐私保护性的属性基可搜索加密方案
牛淑芬, 戈鹏, 董润园, 刘琦, 刘维
当前状态:  doi: 10.11999/JEIT231074
[摘要](47) [HTML全文](18) [PDF 2679KB](16)
摘要:
针对智能交通系统(ITS)中车载用户出行信息容易被非法盗用、交通系统云端服务器存储的交通数据被恶意用户非法滥用等问题,该文提出一种新的属性基可搜索加密(ABSE)方案,该方案具有隐私保护、密钥聚合和轻量计算等功能。该方案在密钥生成阶段、访问控制阶段和部分解密阶段实现了全隐私保护;将搜索关键字嵌入到访问结构中,在实现部分策略隐藏的同时保证了关键字安全;通过密钥聚合技术,将所有满足搜索条件和访问策略的文件标识聚合成一个聚合密钥,减轻用户的密钥存储负担,保障文件密钥安全的同时进一步保障了数据安全。安全性分析表明,该方案具有隐藏访问结构安全、关键字密文不可区分安全和陷门不可区分安全。理论分析和数值模拟显示所提方案在通信和计算方面的开销是高效且实用的。
基于半张量积的逻辑综合研究进展
储著飞, 马铖昱, 闫鸣, 潘家祥, 潘鸿洋, 王伦耀, 夏银水
当前状态:  doi: 10.11999/JEIT231457
[摘要](80) [HTML全文](28) [PDF 2086KB](19)
摘要:
逻辑综合在现代电子设计自动化流程中扮演着至关重要的角色。随着计算能力的不断增强以及新的计算范式的涌现,各种高效的布尔可满足性(SAT)求解器和电路仿真器(Simulator)得以开发,并在逻辑综合的领域取得了显著的应用。该文首先对布尔可满足性问题和电路逻辑仿真器进行了简要介绍;其次回顾了矩阵半张量积的发展历程,并根据半张量积的基本原理深入阐述了其在推理引擎和逻辑综合方面的研究进展;最后,对未来可能对逻辑综合产生重大影响的新技术进行了展望。
综合孔径微波辐射计的射频干扰源空间角度稀疏贝叶斯估计方法
张娟, 庄乐慧, 李一楠, 李虹, 窦昊锋
当前状态:  doi: 10.11999/JEIT231367
[摘要](24) [HTML全文](16) [PDF 3356KB](1)
摘要:
该文提出一种综合孔径微波辐射计射频干扰源(RFI)空间稀疏贝叶斯估计方法。首先建立了综合孔径微波辐射计可见度函数干涉测量模型,观测数据表示为综合孔径天线基线对相关导向矢量观测矩阵与视场亮温的乘积,由于相关导向矢量观测矩阵的正交性和RFI空间角度分布的稀疏性,亮温在基线对相关导向矢量观测矩阵正交基所构成的支撑域中的变换系数是稀疏的。该文在稀疏贝叶斯学习(SBL)框架下对亮温进行稀疏重构。该方法在无需稀疏度和正则化参数等先验信息前提下也能获得较高的重构性能。计算机仿真验证了该方法的有效性。
面向同频干扰环境的5G机会信号定位算法研究
孙骞, 丁天语, 简鑫, 李一兵, 于飞
当前状态:  doi: 10.11999/JEIT231423
[摘要](24) [HTML全文](14) [PDF 5130KB](8)
摘要:
针对全球导航卫星系统(GNSS)拒止环境下定位精度难以保证的问题,该文设计了一种基于新无线电(NR)机会信号的定位方案,并提出一种基于干扰消除子空间追踪(ICSP)算法,解决超密集网络(UDNs)和异构网络(HetNets)环境中同频干扰对定位观测量提取精度不足的问题。通过仿真实验和通用软件无线电外设(USRP)半实物仿真,验证了ICSP算法在复杂网络环境中优化5G机会信号接收机性能、提高定位精度上的有效性。
基于排序码本的水声自适应OFDM通信中信道状态信息反馈研究
刘凇佐, 韩雪, 马璐, 徐金颉, 杨洋
当前状态:  doi: 10.11999/JEIT230878
[摘要](14) [HTML全文](6) [PDF 2436KB](2)
摘要:
水声(UWA)信道时延扩展大等特点导致信道频响(CFR)快衰落,水声通信(UWAC)技术发展受到挑战。发射端获取有效可靠的信道状态信息(CSI)是自适应通信的前提,针对水声自适应正交频分复用(OFDM)通信的需求,该文提出基于排序码本的信道状态信息分组排序拟合反馈算法(CSI-GSFF),包括分组、排序、数据拟合3个步骤。该算法首先将相邻导频子载波分组,以组为反馈单元;然后对各组内的导频子载波按照信道增益值进行排序,以减轻水声信道频响快衰落造成的反馈开销大等不利影响;最后进行多项式拟合,排序操作有效地降低了拟合阶数。通过实测海试时变信道数据仿真,结果表明,该文提出的信道状态信息反馈算法能够基本达到完美信道状态信息情形下的水声自适应OFDM通信系统误码率性能,同时可以有效地减少反馈开销。
封面
2024 年 3 期封面
2024, 46(3).  
[摘要](108) [PDF 5201KB](30)
摘要:
目次
2024 年 3 期目次
2024, 46(3): 1-4.  
[摘要](76) [HTML全文](18) [PDF 278KB](16)
摘要:
综述评论
云边端架构下边缘智能计算关键问题综述:计算优化与计算卸载
董裕民, 张静, 谢昌佐, 李子扬
2024, 46(3): 765-776.   doi: 10.11999/JEIT230390
[摘要](704) [HTML全文](367) [PDF 2152KB](332)
摘要:
近年来,随着入网设备数量与数据体量的急剧增加,以云计算为代表的中心式计算模式的缺点越来越显露出来。边缘计算,即让计算尽量靠近数据源,以减少数据传输时间和网络延迟,作为云计算的补充,已经成为学术界和工业界关注的焦点。该文面向边缘计算中应用较广的实例架构—云边端架构,以及边缘计算的典型应用—边缘智能计算,讨论云边端架构下边缘智能计算的两大关键问题:计算优化和计算卸载。首先分析和梳理了云边端架构下边缘智能计算优化的应用与研究现状。然后讨论了云边端架构下计算卸载的研究思路和现状。最后,总结提出了目前云边端架构下边缘智能计算业务所面临的挑战和未来研究趋势。
智能交通感知新范式:面向元宇宙的交通标志检测架构
王俊帆, 陈毅, 高明煜, 何志伟, 董哲康, 缪其恒
2024, 46(3): 777-789.   doi: 10.11999/JEIT230357
[摘要](298) [HTML全文](73) [PDF 8364KB](64)
摘要:
交通标志检测对智能交通系统和智能驾驶的安全稳定运行具有重要作用。数据分布不平衡、场景单一会对模型性能造成较大影响,而建立一个完备的真实交通场景数据集需要昂贵的时间成本和人工成本。基于此,该文提出一个面向元宇宙的交通标志检测新范式以缓解现有方法对真实数据的依赖。首先,通过建立元宇宙和物理世界之间的场景映射和模型映射,实现检测算法在虚实世界之间的高效运行。元宇宙作为一个虚拟化的数字世界,能够基于物理世界完成自定义场景构建,为模型提供海量多样的虚拟场景数据。同时,该文结合知识蒸馏和均值教师模型建立模型映射,应对元宇宙和物理世界之间存在的数据差异问题。其次,为进一步提高元宇宙下的训练模型对真实驾驶环境的适应性,该文提出启发式注意力机制,通过对特征的定位和学习来提高检测模型的泛化能力。所提架构在CURE-TSD, KITTI, VKITTI数据集上进行实验验证。实验结果表明,所提面向元宇宙的交通标志检测器在物理世界具有优异的检测效果而不依赖大量真实场景,检测准确率达到89.7%,高于近年来其他检测方法。
脑机接口中脑电图-近红外光谱联合分析进展研究
张力新, 周鸿展, 王东, 孟佳圆, 许敏鹏, 明东
2024, 46(3): 790-797.   doi: 10.11999/JEIT230257
[摘要](410) [HTML全文](202) [PDF 525KB](86)
摘要:
脑机接口(BCI)能将受试者意图相关的大脑活动转化为外部设备控制指令,在神经疾病治疗、运动康复等方面具有较高应用潜力。BCI的实现需从人脑获取有意义的信号,而脑电图(EEG)可以反映神经电活动,主要用于对反映实时性要求较高的BCI系统;近红外光谱(NIRS)主要反映血流动力学水平,一般用于神经生理状态等需要精确定位脑活跃区域的研究。EEG和NIRS因其非侵入、方便穿戴、成本较低等优点,成为BCI的重要信号获取方法。相比于单模态BCI系统,基于EEG-NIRS 联合分析的混合BCI系统由于具有更丰富的信号特征,在生理状态检测、运动想象等领域得到了越来越多的关注与研究。该文从EEG-NIRS联合分析在脑机接口中应用的研究现状出发,在数据和特征融合程度、层面上归纳最近的相关领域研究现状,并对EEG-NIRS信号处理手段的研究前景进行了展望。
无线通信、物联网与数字信号处理
全双工主动窃听非正交多址接入系统智能超表面辅助物理层安全传输技术
阔永红, 曹琳, 吕璐, 贺冰涛, 陈健
2024, 46(3): 798-807.   doi: 10.11999/JEIT230296
[摘要](170) [HTML全文](29) [PDF 989KB](55)
摘要:
针对全双工被动窃听和主动干扰攻击下的多用户非正交多址接入(NOMA)系统,该文提出一种智能超表面(RIS)辅助的鲁棒波束赋形方案以实现物理层安全通信。考虑在仅已知窃听者统计信道状态信息的条件下,以系统传输中断概率和保密中断概率作为约束,通过联合优化基站发射波束赋形、RIS相移矩阵、传输速率和冗余速率,来最大化系统的保密速率。为解决上述多变量耦合非凸优化问题,提出一种有效的交替优化算法得到联合优化问题的次优解。仿真结果表明,所提方案可实现较高的保密速率,且通过增加RIS反射单元数,系统保密性能更佳。
可重构智能反射面辅助太赫兹通信系统鲁棒波束赋形算法
袁一铭, 徐勇军, 周继华
2024, 46(3): 808-816.   doi: 10.11999/JEIT230160
[摘要](277) [HTML全文](67) [PDF 3194KB](74)
摘要:
太赫兹通信作为6G的关键技术之一,被认为是能够解决频谱资源短缺、提升系统容量的有效手段。然而,由于路径损耗极高和分子的吸收作用,太赫兹容易被障碍物阻挡导致通信中断。为了解决该问题,该文将可重构智能反射面(RIS)引入到太赫兹通信系统中,且考虑信道不确定性对传输稳定性的影响,基于用户服务质量约束、基站发射功率约束及RIS离散相移约束,建立多用户能效最大化波束赋形模型。利用丁克尔巴赫、连续凸近似、S-程序、半正定松弛、相位映射和块坐标下降将原非凸优化问题转化为凸优化问题进行求解。仿真结果表明,与传统非鲁棒波束赋形对比,所提算法能效提升了15.4%,中断概率减小了15.48%。
基于改进自适应IMM算法的高速列车组合定位
王小敏, 雷筱, 张亚东
2024, 46(3): 817-825.   doi: 10.11999/JEIT230251
[摘要](205) [HTML全文](177) [PDF 3924KB](45)
摘要:
针对列车高精度定位问题,该文提出基于改进自适应交互多模型(IMM)的高速列车高精度组合定位方法。首先,根据列车定位需求和各传感器特点,设计了卫星接收器、轮轴测速传感器、测速雷达以及单轴陀螺仪4种传感器的组合定位方案。然后,针对IMM融合滤波算法因先验信息不准导致固定参数设置不当的问题,引入Sage-Husa自适应滤波和转移概率矩阵(TPM)自适应更新集成为自适应IMM算法。针对多模型切换的滞后问题,利用子模型似然函数值能快速反映模型变化趋势的特点,将似然函数值设为判定标志,并引入判定窗对TPM矩阵元素进行修正,有效提升了模型的切换速度。最后,基于改进自适应IMM算法对4种传感器定位信息进行融合滤波,实现高速列车的高精度组合定位。仿真结果表明:改进后的算法相比其他自适应IMM算法提升定位精度1.6%~14.7%,并且能通过提高模型间切换速度来有效降低位置误差峰值,同时具备较好的抗噪性能。
基于多维扩展的正交时序复用波形框架及其性能分析
王震铎, 谭正锋, 孙溶辰
2024, 46(3): 826-834.   doi: 10.11999/JEIT230248
[摘要](373) [HTML全文](218) [PDF 5260KB](70)
摘要:
正交时序复用(OTSM)是一种适用于高速移动场景的低复杂度调制方法。然而,单一的波形设计方法难以满足多样化的应用需求和性能需求。因此,该文基于加权分数傅里叶变换(WFRFT)提出了加权分数沃尔什-哈达玛变换(WFRWHT),并提出了多维扩展的一体化的加权分数傅里叶变换-加权分数沃尔什哈达玛变换-正交时序复用(WFRFT-WFRWHT-OTSM)波形框架。通过对2维参数的灵活配置,该框架可退化为OTSM、正交时频空、混合载波、正交频分复用和单载波等波形,同时研究了采用高斯-赛德尔(GS)迭代均衡时一体化WFRFT-WFRWHT-OTSM波形在时延-多普勒信道下的误码率(BER)性能以及峰均功率比(PAPR)性能。仿真结果表明,在不同时延-多普勒信道下,该框架可通过改变WFRFT和WFRWHT阶次实现更优的BER和PAPR性能。
基于全频谱共享的三维轨迹和功率优化方法
裴二荣, 陈新虎, 陈琪美, 孙远欣, 黎伟
2024, 46(3): 835-847.   doi: 10.11999/JEIT230261
[摘要](667) [HTML全文](165) [PDF 6971KB](80)
摘要:
当前蜂窝系统频谱资源极度短缺,免授权频谱因而被建议在蜂窝系统中使用。无人机(UAV)的飞行轨迹和功率控制对频谱利用效率有重大影响。然而,基于频谱共享的3维轨迹和功率优化方法却鲜少研究。为此,该文首先提出一种全频谱共享方法,即无人机通过控制上行蜂窝用户和设备到设备(D2D)用户的发射功率,在不影响WiFi设备正常传输的前提下使用免授权频谱;同时无人机也能够在不影响其他下行蜂窝用户的前提下使用授权频谱。然后基于提出的全频谱共享方法,该文构建了无人机电池能量约束下的3维飞行轨迹和发射功率的联合优化问题。为了求解提出的复杂多变量耦合的非凸优化问题,该文采用块坐标下降和连续凸逼近方法将原问题转化为3维轨迹优化和功率控制两个凸优化子问题并迭代求解。大量仿真结果证明提出的基于3维轨迹和功率优化的全频谱共享方法能够显著提高频谱利用效率。
基于JAYA算法的紫外光通信无人机编队路由优化
郝锐, 王建萍, 陈丹阳, 路慧敏
2024, 46(3): 848-857.   doi: 10.11999/JEIT230206
[摘要](141) [HTML全文](54) [PDF 3008KB](25)
摘要:
紫外光通信由于其灵活性高、安全性好和全天候工作等优点,被认为是应急通信用无人机编队(UAV)的有潜力通信解决方案。为了提升紫外光通信无人机编队的有效作业时间,该文基于低功耗自适应集簇分层(LEACH)算法,并结合JAYA智能优化算法提出一种新颖的路由优化算法(RJLEACH)。该方法被用来改善紫外光通信无人机编队的有效操作时间。应用该算法对不同结构的紫外光通信无人机编队路由优化,并与其它算法得到的结果进行了比较分析。结果表明,RJLEACH算法在簇首选举阶段降低了无人机节点间的剩余能量方差,并且通过搜索最优路由降低了簇间通信的能量消耗。最终使网络出现第1个死亡节点和出现1/2死亡节点的时间相比经典LEACH算法分别延长了31.8%和13.8%,同时明显提高了能量利用率,能够为灾区救援和应急通信等任务争取宝贵的时间。
智能反射表面辅助的非正交多址接入系统用户分组、波束赋形与相移的优化
雷维嘉, 于顺洪, 雷宏江, 唐宏
2024, 46(3): 858-866.   doi: 10.11999/JEIT230329
[摘要](270) [HTML全文](166) [PDF 1541KB](65)
摘要:
该文研究智能反射表面(IRS)辅助的多天线非正交多址接入(NOMA)网络中用户分组、发送波束赋形、相移等的联合优化问题。系统中1个分组分配1个波束并在组内进行连续干扰消除检测。该文提出一种不依赖于发送波束赋形和IRS相移的用户分组配对策略,将用户分组与其他优化分离,显著降低了优化问题求解的难度和计算复杂度。进一步,联合优化基站发送波束赋形、功率分配和IRS相移矩阵,最小化基站的总发送功率。原始优化问题是一个多变量相互耦合的非凸优化问题,利用松弛变量、连续凸逼近、半定松弛、交替迭代优化等方法将原问题转化为凸问题并求解。仿真结果显示,相较于1个用户1个波束的方案,所提方案在基站天线数较少时性能更优,而在天线数较多时也与该对比方案非常接近,但所提方案的优化计算复杂度更低。而对比采用不同分组算法、随机IRS相移方案、最大比发射方案,以及无IRS的方案,所提方案的性能始终更优。
空间耦合低密度奇偶校验码残差滑窗译码算法
周华, 李子杰
2024, 46(3): 867-874.   doi: 10.11999/JEIT230288
[摘要](290) [HTML全文](122) [PDF 3518KB](35)
摘要:
针对空间耦合低密度奇偶校验(SC-LDPC)码滑窗译码(SWD)算法中错误传播导致的高误码率问题,该文提出基于动态残差的滑窗译码(RSWD)算法。通过在窗口内计算边信息更新前后的残差值,动态选择可靠度最低(残差值最大)的边信息优先更新,降低边信息无效更新的频率,提高窗内译码收敛速度。仿真结果表明:相比于传统SWD算法,RSWD算法在窗口中各位置的误比特数明显降低,抑制错误传播效果明显;在高信噪比(SNR)区域或者低迭代次数的情况下,RSWD算法的误码率性能优于SWD算法;此外,将动态残差应用到消息复用(MR)和窗口扩展(WE)两种窗译码算法中,亦能得到类似结论,提升窗译码性能。
智能反射面辅助的抗干扰安全通信系统鲁棒资源分配算法
席兵, 冯彦博, 邓炳光, 张治中
2024, 46(3): 875-885.   doi: 10.11999/JEIT230343
[摘要](246) [HTML全文](110) [PDF 2559KB](60)
摘要:
为了解决恶意干扰攻击、窃听和不完美信道状态信息造成的通信质量降低和安全性差等问题,该文提出一种智能反射面(IRS)辅助的抗干扰安全通信系统鲁棒资源分配算法。首先,基于合法用户的最小安全速率约束、最大发射功率约束和IRS相移约束,在非法节点不完美信道状态信息、干扰器波束成形向量未知的情况下,构建了一个联合优化基站的波束成形向量、人工噪声的协方差矩阵和IRS的相移矩阵的鲁棒资源分配问题。其次,为了求解该非凸问题,利用交替优化、Cauchy-Schwarz不等式、连续凸逼近和泰勒级数展开等方法,将原问题转化为易于求解的凸优化问题。仿真结果表明,与传统算法相比所提算法能有效提高系统安全性、降低功率开销、提高抗干扰裕度,且在一定信道误差范围内能够减低约35%的保密中断概率,具有较强的鲁棒性。
基于深度学习的下行大规模MIMO OFDM系统的1比特预编码算法
周宸颢, 温利嫄, 钱骅, 康凯
2024, 46(3): 886-894.   doi: 10.11999/JEIT230239
[摘要](213) [HTML全文](74) [PDF 3981KB](37)
摘要:
大规模多输入多输出(MIMO)系统中通过在基站端配备数百根天线,在提高频谱利用效率的同时,也带来了系统成本的增加。本课题组之前提出了一种适用于下行大规模MIMO正交频分复用(OFDM)系统的收敛保证的多载波1比特预编码算法(CG-MC1bit),能够获得较优的系统性能,但相应的计算复杂度较高,阻碍了其在实时系统中的应用。为进一步解决大规模MIMO系统中的成本和功耗问题,该文提出了一个模型驱动的神经网络,在CG-MC1bit算法的基础上迭代展开(Unfolding)得到了一种更加高效的CG-MC1bit-Net算法。具体而言,将迭代算法展开为一个神经网络,并引入可训练的参数来替代前向传播中的高复杂性操作。实验结果表明,该方法能够自动更新参数,与传统的预编码算法相比,收敛速度更快,计算复杂度更低。
基于超球面三元组编码的干扰模式开集识别
高玉龙, 王国强, 王钢
2024, 46(3): 895-905.   doi: 10.11999/JEIT230145
[摘要](159) [HTML全文](89) [PDF 2234KB](45)
摘要:
干扰模式识别是现代军事通信对抗中必不可少的一环,随着复杂电磁环境当中各种新型恶意干扰样式层出不穷,对于未知型干扰的判决也变得愈发重要。因此,要求干扰模式识别算法保持对于已知型干扰高精度识别的同时,也能够完成对于未知型干扰的判决,以排除未知型恶意干扰的影响。基于此,该文将未知型干扰存在时的干扰模式识别问题建模为开集识别问题,并提出一种基于超球面3元组编码的干扰模式开集识别方法。所提方法基于超球面3元组对输入的时频图像进行降维编码以提高识别精度,然后采用元识别分类器准确地完成干扰模式开集识别任务。通过仿真试验证明该算法在干信比大于–2 dB时能够高效地完成开放空间中的干扰模式识别任务。
欠采样下的多频带通信信号高精度载频估计
黄翔东, 宋金水, 李燕平
2024, 46(3): 906-913.   doi: 10.11999/JEIT230297
[摘要](110) [HTML全文](26) [PDF 1846KB](27)
摘要:
为根本解决当前主流的基于调制宽带转化器(MWC )的欠采样频率估计方法存在的3个问题,即采样通道数目多、载频估计精度低、信源频带分布稀疏度条件高,该文提出基于互素谱相位差校正的通信信号载频估计方法。通过将两路互素欠采样取代多路调制宽带转化器欠采样,克服了其耗费欠采样通道数目多的缺陷;基于此,既推导出全景谱谱峰位置与两路互素输出IDFT支路序号对的映射关系,又推导出相邻快拍下该序号对的IDFT相位差与载频值的解析关系,从而克服了主流方法的载频估计精度低的缺陷;通过将最小尺寸全相位滤波器对半分解方法融入原型滤波器设计,构造出两路并行互素谱分析器,还彻底克服了对信源频带分布稀疏度条件高的依赖。仿真表明,相比于主流方法,该文方法仅需耗费不足其1/2的样本数量,载频估计的相对误差降至其1/20以下。
智能反射面增强的全双工环境反向散射通信系统波束成形算法
张晓茜, 徐勇军, 吴翠先, 黄崇文
2024, 46(3): 914-924.   doi: 10.11999/JEIT230356
[摘要](301) [HTML全文](83) [PDF 3551KB](70)
摘要:
当前传统环境反向散射通信存在双重衰落、障碍物阻挡和网络容量有限的问题。智能反射面(RIS)作为6G的关键候选技术因能够主动改善信号传输质量、提升通信系统传输性能而备受关注。为此,该文将RIS与全双工技术引入到环境反向散射通信系统,研究了考虑硬件损伤与RIS离散相移的RIS增强全双工环境反向散射通信系统波束成形算法。首先,考虑反射节点最小能量收集与服务质量约束、功率站最大发射功率约束和RIS相移约束,建立了总发射功率最小的波束成形优化问题。然后,利用交替优化、半正定松弛、变量替换、半正定规划将原非凸问题转化成可求解的凸优化问题。最后,仿真结果表明,所提算法比传统波束成形方法平均功耗降低了7.8%。
定向接收低冲突率水声网络媒体接入控制协议
郑茂醇, 韩笑, 葛威, 孙瑶, 殷敬伟
2024, 46(3): 925-933.   doi: 10.11999/JEIT230153
[摘要](94) [HTML全文](25) [PDF 3167KB](20)
摘要:
在全向水声通信网络场景中,较大的传播时延和较高的数据包碰撞率严重影响了网络性能。相比全向接收技术,声矢量传感器的声压和振速通过线性加权组合可以形成单边指向性,实现定向接收某个方向上的信号,进而提高网络的空间复用率。该文首先分析了声矢量传感器定向接收模式下的网络中断概率,验证定向接收技术网络应用的可行性。然后,提出了定向接收低冲突概率媒体接入控制协议(DRLCP-MAC)。该协议利用指向性接收波束握手机制建立稳定的数据传输链路,通过状态转移策略构建多对并行通信链路,缩小虚拟载波监听范围,提高网络的空间复用度。仿真结果表明,与水下冲突避免多址接入协议(MACA-U)和时隙地面多址接入协议(Slotted-FAMA)相比,DRLCP-MAC协议使信道接入成本降低了约50%和60%,网络吞吐量提升了约60%和400%,端到端时延降低了约50%和85%。
考虑信息年龄的无人机辅助智能交通系统计算卸载优化
钟伟锋, 黄旭民, 康嘉文, 谢胜利
2024, 46(3): 934-943.   doi: 10.11999/JEIT230459
[摘要](364) [HTML全文](211) [PDF 1567KB](79)
摘要:
该文考虑无人机(UAV)交通监测与移动边缘计算(MEC)技术结合的智能交通系统。为了保障系统中数据时效性并且降低系统能耗,提出计及信息年龄(AoI)的UAV计算卸载优化方法。首先,建立UAV辅助的MEC系统模型,允许MEC服务器缓存常用的应用程序并为UAV提供计算卸载,以支持UAV执行交通监测任务。通过联合优化UAV任务卸载决策、UAV上下行通信带宽分配以及被卸载任务的计算资源分配,最小化所有UAV与MEC服务器的总能耗,同时满足AoI与资源容量等约束条件。其次,系统能耗最小化问题是混合整数非凸优化问题,因此采用离散化和线性化手段,快速获得问题的近似最优解,并设计离散点生成算法来调节近似误差。最后,仿真结果表明,即使对于大型的非凸问题,所提方法也能够快速得到近似最优解,并且可以在不同的任务场景中满足AoI等约束条件,最大限度降低系统能耗。仿真结果验证了所提方法的有效性。
电磁场与电磁波技术
宽带复合双基地雷达舰船目标长度估计方法
艾小锋, 邱梦奇, 胡旖航, 徐志明, 赵锋
2024, 46(3): 944-951.   doi: 10.11999/JEIT230088
[摘要](165) [HTML全文](102) [PDF 3840KB](23)
摘要:
舰船目标长度特征对舰船目标识别具有重要作用,该文提出一种基于宽带复合双基地雷达联合观测的舰船目标长度估计方法。该方法综合利用单/双基地雷达高分辨距离像(HRRPs)长度,结合双基地雷达-舰船之间的空间关系求解,实现了单次测量估计舰船目标的实际长度,并分析了各种误差因素和几何构型条件下的估计误差。典型场景动态仿真证明了所提方法的有效性,结果表明在高分辨距离像长度误差小于5%条件下,舰船目标长度估计误差小于5%,为舰船目标特征提取与识别提供了新思路。
基于空时级联单脉冲的多目标高效参数估计算法
沈明威, 张永舒, 李建霓, 吴迪, 朱岱寅
2024, 46(3): 952-959.   doi: 10.11999/JEIT230347
[摘要](129) [HTML全文](55) [PDF 3122KB](22)
摘要:
比幅单脉冲最大似然算法(ACM-ML)在进行目标参数估计时需要进行距离与速度的2维松弛迭代搜索,导致了计算效率低、运算量大的问题。针对上述问题,该文提出一种基于空时级联单脉冲的高效多目标参数估计算法(M-STCMP算法)。该算法将单脉冲概念引入脉冲域,利用时域单脉冲计算目标速度,避免了ACM-ML算法中对速度的迭代搜索,将2维松弛迭代搜索降为1维搜索,有效降低了计算复杂度。考虑时域单脉冲无法同时匹配分布在不同时域主波束的速度各异的多个检测目标,进一步利用目标信号的多普勒信息,在各多普勒单元分别进行时域单脉冲测速,并搜索目标距离值。最后为抑制目标间的信号泄露,将所有目标的估计参数进行级联迭代获得高精度参数估计值。理论分析和仿真结果验证了M-STCMP算法的有效性。
一种用于射频识别阅读器的双频宽带圆极化天线
王丽黎, 高智勇, 杜忠红, 徐亚妮
2024, 46(3): 960-966.   doi: 10.11999/JEIT230321
[摘要](208) [HTML全文](67) [PDF 6630KB](60)
摘要:
该文设计了一种紧凑的用作射频识别(RFID)阅读器的双频宽带圆极化天线。天线由弯折处理的矩形贴片、L形贴片和三角形地板构成,通过微带线进行馈电。两个辐射贴片分别独立控制高低两个频段,其轴比带宽也可独立调整,三角形地板可以使横向电流和纵向电流发生变化,从而改变横向电流和纵向电流的比值大小,实现圆极化性能。天线尺寸为0.92\begin{document}$ {\lambda _0} $\end{document}×0.92\begin{document}$ {\lambda _0} $\end{document}×0.0064\begin{document}$ {\lambda _0} $\end{document} (\begin{document}$ {\lambda _0} $\end{document}为2.40 GHz时的自由空间波长)。测试结果表明在超高频(UHF)频段该天线实现了49%(0.77~1.27 GHz)的阻抗带宽和46%(0.84~1.34 GHz)的轴比带宽,在无线局域网(WLAN)频段实现了47.5%(1.54~2.50 GHz)的阻抗带宽和24.2%(1.96~2.50 GHz)的轴比带宽,可以完整覆盖UHF和WLAN两个频段,具有良好的辐射特性。与其他双频圆极化天线相比,该天线整体结构紧凑、设计简单、避免了使用复杂的馈电网络,且具有较宽的3 dB轴比带宽。
图像与智能信息处理
基于DenseNet和卷积注意力模块的高精度手势识别
赵雅琴, 宋雨晴, 吴晗, 何胜阳, 刘璞秋, 吴龙文
2024, 46(3): 967-976.   doi: 10.11999/JEIT230165
[摘要](446) [HTML全文](200) [PDF 4831KB](155)
摘要:
非接触的手势识别是一种新型人机交互方式,在增强现实(AR)/虚拟现实(VR)、智能家居、智能医疗等方面有着广阔的应用前景,近年来成为一个研究热点。由于需要利用毫米波雷达进行更精确的微动手势识别,该文提出一种新型的基于MIMO毫米波雷达的微动手势识别方法。采用4片AWR1243雷达板级联而成的毫米波级联(MMWCAS)雷达采集手势回波,对手势回波进行时频分析,基于距离-多普勒(RD)图和3D点云检测出人手目标。通过数据预处理,提取手势目标的距离-时间谱图(RTM)、多普勒-时间谱图(DTM)、方位角-时间谱图(ATM)和俯仰角-时间谱图(ETM),更加全面地表征手势的运动特征,并形成混合特征谱图(FTM),对12种微动手势进行识别。设计了基于DenseNet和卷积注意力模块的手势识别网络,将混合特征谱图作为网络的输入,创新性地融合了卷积注意力模块(CBAM),实验表明,识别准确率达到99.03%,且该网络将注意力放在手势动作的前半段,实现了高精度的手势识别。
基于任务感知关系网络的少样本图像分类
郭礼华, 王广飞
2024, 46(3): 977-985.   doi: 10.11999/JEIT230162
[摘要](286) [HTML全文](191) [PDF 3321KB](58)
摘要:
针对关系网络(RN)模型缺乏对分类任务整体相关信息的感知能力的问题,该文提出基于任务感知关系网络(TARN)的小样本学习(FSL)算法。引入模糊C均值(FCM)聚类生成基于任务全局分布的类别原型,同时设计任务相关注意力机制(TCA),改进RN中的1对1度量方式,使得在与类别原型对比时,局部特征聚合了任务全局信息。和RN比,在数据集Mini-ImageNet上,5-way 1-shot和5-way 5-shot设置中的分类准确率分别提高了8.15%和7.0%,在数据集Tiered-ImageNet上,5-way 1-shot和5-way 5-shot设置中的分类准确率分别提高了7.81%和6.7%。与位置感知的关系网络模型比,在数据集Mini-ImageNet上,5-way 1-shot设置中分类准确率也提高了1.24%。与其他小样本图像分类算法性能比较,TARN模型在两个数据集上都获得了最佳的识别精度。该方法将任务相关信息和度量网络模型进行结合可以有效提高小样本图像分类准确率。
基于双阶段元学习的小样本中医舌色域自适应分类方法
卓力, 张雷, 贾童瑶, 李晓光, 张辉
2024, 46(3): 986-994.   doi: 10.11999/JEIT230249
[摘要](196) [HTML全文](119) [PDF 3034KB](36)
摘要:
舌色是中医(TCM)望诊最关注的诊察特征之一。在实际应用中,通过一台设备采集到的舌象数据训练得到的舌色分类模型应用于另一台设备时,由于舌象数据分布特性不一致,分类性能往往急剧下降。为此,该文提出一种基于双阶段元学习的小样本中医舌色域自适应分类方法。首先,设计了一种双阶段元学习训练策略,从源域有标注样本中提取域不变特征,并利用目标域的少量有标注数据对网络模型进行微调,使得模型可以快速适应目标域的新样本特性,提高舌色分类模型的泛化能力并克服过拟合。接下来,提出了一种渐进高质量伪标签生成方法,利用训练好的模型对目标域的未标注样本进行预测,从中挑选出置信度高的预测结果作为伪标签,逐步生成高质量的伪标签。最后,利用这些高质量的伪标签,结合目标域的有标注数据对模型进行训练,得到舌色分类模型。考虑到伪标签中含有噪声问题,采用了对比正则化函数,可以有效抑制噪声样本在训练过程中产生的负面影响,提升目标域舌色分类准确率。在两个自建中医舌色分类数据集上的实验结果表明,在目标域仅提供20张有标注样本的情况下,舌色分类准确率达到了91.3%,与目标域有监督的分类性能仅差2.05%。
多目标跟踪中基于次模优化的轨迹片段生成方法
孙瑾, 杜官明
2024, 46(3): 995-1004.   doi: 10.11999/JEIT230208
[摘要](180) [HTML全文](95) [PDF 8855KB](74)
摘要:
作为智能视觉任务的基础工作,多目标跟踪(MOT)一直是计算机视觉领域具有挑战性的课题之一。遮挡是影响跟踪准确性的主要因素,为此该文采用基于检测跟踪的思想,以轨迹片段为基础进行关联获取目标的完整轨迹;同时,为提高跟踪鲁棒性,该文将轨迹片段的生成问题转化为运筹学中的设施选址问题,并进而提出基于次模优化的轨迹片段生成方法。该方法融合梯度(HOG)和颜色(CN)两个互补特征进行目标表征,并根据运动信息设计权重系数提高目标匹配准确度,最后提出具有约束的次模最大化算法实现全局范围内的数据关联生成轨迹片段。通过在多个基准数据集上的对比实验,表明该文算法在保证性能的同时能有效处理遮挡问题。
基于双路径递归网络与Conv-TasNet的多头注意力机制视听语音分离
兰朝凤, 蒋朋威, 陈欢, 赵世龙, 郭小霞, 韩玉兰, 韩闯
2024, 46(3): 1005-1012.   doi: 10.11999/JEIT230260
[摘要](279) [HTML全文](145) [PDF 1431KB](49)
摘要:
目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型(Conv-TasNet)和双路径递归神经网络(DPRNN),提出多头注意力机制时域视听语音分离(MHATD-AVSS)模型。通过音频编码器与视觉编码器获得音频特征与视频的唇部特征,并采用多头注意力机制将音频特征与视觉特征进行跨模态融合,得到融合视听特征,将其经DPRNN分离网络,获得不同说话者的分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及信噪比(SNR)评价指标,在VoxCeleb2数据集进行实验测试。研究表明,当分离两位、3位或4位说话者的混合语音时,该文方法与传统分离网络相比,SDR提高量均在1.87 dB以上,最高可达2.29 dB。由此可见,该文方法能考虑音频信号的相位信息,更好地利用视觉信息与音频信息的相关性,提取更为准确的音视频特性,获得更好的分离效果。
特征反馈机制优化的超声图像病灶检测算法
丁建睿, 王凌涛, 汤丰赫, 宁春平
2024, 46(3): 1013-1021.   doi: 10.11999/JEIT230385
[摘要](181) [HTML全文](86) [PDF 5710KB](37)
摘要:
该文提出一种基于特征反馈机制的超声图像病灶检测方法,以实现超声病灶的实时精确定位与检测。所提方法由基于特征反馈机制的特征提取网络和基于分治策略的自适应检测头两部分组成。特征反馈网络通过反馈特征选取和加权融合计算,充分学习超声图像的全局上下文信息和局部低级语义细节以提高局部病灶特征的识别能力。自适应检测头对特征反馈网络所提取的多级特征进行分治预处理,通过将生理先验知识与特征卷积相结合的方式对各级特征分别进行病灶形状和尺度特征的自适应建模,增强检测头对不同大小病灶在多级特征下的检测效果。所提方法在甲状腺超声图像数据集上进行了测试,得到了70.3%的AP,99.0%的AP50和88.4%的AP75,实验结果表明,相较于主流检测算法,所提算法能实现更精准的实时超声图像病灶检测和定位。
面向方面情感分析的多通道增强图卷积网络
韩虎, 范雅婷, 徐学锋
2024, 46(3): 1022-1032.   doi: 10.11999/JEIT230353
[摘要](236) [HTML全文](110) [PDF 4029KB](60)
摘要:
传统的基于单通道的特征提取方式,仅使用单一的依赖关系捕获特征,忽略单词间的语义相似性与依赖关系类型信息。尽管基于图卷积网络进行方面情感分析的方法已经取得一定成效,但始终难以同时聚合节点的语义信息和句法结构特征,在整个迭代训练过程中最初的语义特征会逐渐遗失,影响句子最终的情感分类效果。由于缺乏先验知识会导致模型对相关情感词的误解,因此需要引入外部知识来丰富文本信息。目前,如何利用图神经网络(GNN)融合句法和语义特征的方式仍值得深入研究。针对上述问题,该文提出一种多通道增强图卷积网络模型。首先,通过对情感知识和依赖类型增强的句法图进行图卷积操作,得到基于语法的两种表示,与经过多头注意力和图卷积学习到的语义表示进行融合,使多通道的特征能够互补学习。实验结果表明,在5个公开数据集上,准确率和宏F1值优于基准模型。由此可见,依赖类型和情感知识均对增强句法图有重要影响,表明融合语义信息与句法结构的有效性。
基于深层特征差异性网络的图像超分辨率算法
程德强, 袁航, 钱建生, 寇旗旗, 江鹤
2024, 46(3): 1033-1042.   doi: 10.11999/JEIT230179
[摘要](242) [HTML全文](100) [PDF 6582KB](52)
摘要:
传统深层神经网络通常以跳跃连接等方式堆叠深层特征,这种方式容易造成信息冗余。为了提高深层特征信息的利用率,该文提出一种深层特征差异性网络(DFDN),并将其应用于单幅图像超分辨率重建。首先,提出相互投影融合模块(MPFB)提取多尺度深层特征差异性信息并融合,以减少网络传输中上下文信息的损失。第二,提出了差异性特征注意力机制,在扩大网络感受野的同时进一步学习深层特征的差异。第三,以递归的形式连接各模块,增加网络的深度,实现特征复用。将DIV2K数据集作为训练数据集,用4个超分辨率基准数据集对预训练的模型进行测试,并通过与流行算法比较重建的图像获得结果。广泛的实验表明,与现有算法相比,所提算法可以学习到更丰富的纹理信息,并且在主观视觉效果和量化评价指标上都取得最好的排名,再次证明了其鲁棒性和优越性。
正交约束域适应的跨工况滚动轴承剩余使用寿命预测方法
韩延, 林志超, 黄庆卿, 向敏, 文瑞, 张焱
2024, 46(3): 1043-1050.   doi: 10.11999/JEIT230274
[摘要](162) [HTML全文](93) [PDF 7246KB](28)
摘要:
针对跨工况轴承剩余使用寿命(RUL)预测模型的决策边界不明显、特征可辨识性低的问题,该文提出一种正交约束的最大分类器差异方法(MCD_OC)。首先,将采集的轴承原始振动信号进行快速傅里叶变换,得到振动信号的频域信号作为模型的输入;然后,通过卷积神经网络(CNN)和门控循环神经网络(GRU)提取轴承信号的深层时空特征,利用最大分类器差异将源域和目标域特征对齐,并对目标域轴承深层特征进行正交约束,增大无标签目标域样本特征之间的可辨识性;最后,基于轴承寿命数据集开展了跨工况轴承寿命预测对比实验,对该文所提方法进行评估,并在多组实验中取得最优结果。
基于高分辨率类激活映射算法的弱监督目标实时检测
孙辉, 史玉龙, 张健一, 王蕊, 王羽玥
2024, 46(3): 1051-1059.   doi: 10.11999/JEIT230268
[摘要](247) [HTML全文](157) [PDF 7240KB](46)
摘要:
受益于深度学习的发展,目标检测技术在各类视觉任务中得到广泛关注。然而,获取目标的边框标注需要高昂的时间和人工成本,阻碍了目标检测技术在实际场景中的应用。为此,该文在仅使用图像类别标签的基础上,提出一种基于高分辨率类激活映射算法的弱监督目标实时检测方法,降低网络对目标实例标注的依赖。该方法将目标检测细划分为弱监督目标定位和目标实时检测两个子任务。在弱监督定位任务中,该文利用对比层级相关性传播理论设计了一种新颖的高分辨率类激活映射算法(HR-CAM),用于获取高质量目标类激活图,生成目标伪检测标注框。在实时检测任务中,该文选取单镜头多盒检测器(SSD)作为目标检测网络,并基于类激活图设计目标感知损失函数(OA-Loss),与目标伪检测标注框共同监督SSD网络的训练过程,提高网络对目标的检测性能。实验结果表明,该文方法在CUB200和TJAB52数据集上实现了对目标准确高效的检测,验证了该文方法的有效性和优越性。
基于双层孪生神经网络的区块链智能合约分类方法
郭加树, 王琪, 李择亚, 武梦德, 张红霞
2024, 46(3): 1060-1068.   doi: 10.11999/JEIT230185
[摘要](197) [HTML全文](101) [PDF 1624KB](34)
摘要:
当前通过深度学习方法进行区块链智能合约分类的方法越来越流行,但基于深度学习的方法往往需要大量的样本标签数据去进行有监督的模型训练,才能达到较高的分类性能。该文针对当前可用智能合约数据集存在数据类别不均衡以及标注数据量过少会导致模型训练困难,分类性能不佳的问题,提出基于双层孪生神经网络的小样本场景下的区块链智能合约分类方法:首先,通过分析智能合约数据特征,构建了可以捕获较长合约数据特征的双层孪生神经网络模型;然后,基于该模型设计了小样本场景下的智能合约训练策略和分类方法。最后,实验结果表明,该文所提方法在小样本场景下的分类性能优于目前最先进的智能合约分类方法,分类准确率达到94.7%,F1值达到94.6%,同时该方法对标签数据的需求更低,仅需同类型其他方法约20%数据量。
基于多尺度分区有向时空图的步态情绪识别
张家波, 高洁, 黄钟玉, 徐光辉
2024, 46(3): 1069-1078.   doi: 10.11999/JEIT230175
[摘要](207) [HTML全文](115) [PDF 1962KB](25)
摘要:
为了有效获取节点之间在多尺度、远距离以及在时间和空间位置上的依赖关系,以提高对步态情绪识别精度,本文首先提出一种构建分区有向时空图的方法:使用所有帧节点进行构图,然后按区域有向连接。其次,提出一种多尺度分区聚合与分区融合的方法。通过图深度学习对图节点进行更新。并对相似节点特征进行融合。最后,提出一个多尺度分区有向自适应时空图卷积神经网络(MPDAST-GCN)方法。网络通过在时间维度上构建图,获取远距离帧节点特征,并自适应地学习每帧上的特征数据。MPDAST-GCN将输入数据分类成高兴、伤心、愤怒和平常4种情绪类型。并在发布的Emotion-Gait数据集上,相比于目前最先进的方法实现6%的精度提升。
规则压缩模型和灵活架构的Transformer加速器设计
姜小波, 邓晗珂, 莫志杰, 黎红源
2024, 46(3): 1079-1088.   doi: 10.11999/JEIT230188
[摘要](334) [HTML全文](203) [PDF 4181KB](73)
摘要:
基于注意力机制的Transformer模型具有优越的性能,设计专用的Transformer加速器能大幅提高推理性能以及降低推理功耗。Transformer模型复杂性包括数量上和结构上的复杂性,其中结构上的复杂性导致不规则模型和规则硬件之间的失配,降低了模型映射到硬件的效率。目前的加速器研究主要聚焦在解决模型数量上的复杂性,但对如何解决模型结构上的复杂性研究得不多。该文首先提出规则压缩模型,降低模型的结构复杂度,提高模型和硬件的匹配度,提高模型映射到硬件的效率。接着提出一种硬件友好的模型压缩方法,采用规则的偏移对角权重剪枝方案和简化硬件量化推理逻辑。此外,提出一个高效灵活的硬件架构,包括一种以块为单元的权重固定脉动运算阵列,同时包括一种准分布的存储架构。该架构可以高效实现算法到运算阵列的映射,同时实现高效的数据存储效率和降低数据移动。实验结果表明,该文工作在性能损失极小的情况下实现93.75%的压缩率,在FPGA上实现的加速器可以高效处理压缩后的Transformer模型,相比于中央处理器 (CPU)和图形处理器 (GPU)能效分别提高了12.45倍和4.17倍。
基于多维信号特征的无人机探测识别方法
聂伟, 戴琪霏, 杨小龙, 王平, 周牧, 周超
2024, 46(3): 1089-1099.   doi: 10.11999/JEIT230302
[摘要](412) [HTML全文](162) [PDF 3275KB](127)
摘要:
如今,无人机(UAVs)在军用民用领域得到大规模应用,在无人机带来便利的同时也带来了巨大的安全隐患。针对无人机的探测识别技术逐渐成为研究热点,传统的无人机探测方法主要是通过获取雷达回波信号、无人机声音信号和光电信号的方式对无人机进行探测。然而,这类方法往往容易受到环境影响具有一定的局限性,无法对无人机进行精确的定位和识别。该文提出一种基于多维信号特征的无人机识别方法,该方法首先通过自适应三角阈值法从接收到的无线信号中探测并筛选出无人机信号,同时解析获取的无线信号的信道状态信息(CSI)。然后,利用正交匹配追踪算法(OMP)进行参数估计来获取无人机的位置信息对无人机进行定位。最后,提取无人机信号中的盒维数和径向积分双谱(RIB)来对无人机进行分类识别。通过实验,该方法对无人机的3维定位精度小于1 m,对无人机的分类识别精度最高能达到100%。
基于双流-非局部时空残差卷积神经网络的人体行为识别
钱惠敏, 陈实, 皇甫晓瑛
2024, 46(3): 1100-1108.   doi: 10.11999/JEIT230168
[摘要](307) [HTML全文](92) [PDF 2296KB](56)
摘要:
3维卷积神经网络(3D CNN)与双流卷积神经网络(two-stream CNN)是视频中人体行为识别研究的常用架构,且各有优势。该文旨在研究结合两种架构且复杂度低、识别精度高的人体行为识别模型。具体地,该文提出基于通道剪枝的双流-非局部时空残差卷积神经网络(TPNLST-ResCNN),该网络采用双流架构,分别在时间流子网络和空间流子网络采用时空残差卷积神经网络(ST-ResCNN),并采用均值融合算法融合两个子网络的识别结果。进一步地,为了降低网络的复杂度,该文提出了针对时空残差卷积神经网络的通道剪枝方案,在实现模型压缩的同时,可基本保持模型的识别精度;为了使得压缩后网络能更好地学习到输入视频中人体行为变化的长距离时空依赖关系,提高网络的识别精度,该文提出在剪枝后网络的首个残差型时空卷积块前引入一个非局部模块。实验结果表明,该文提出的人体行为识别模型在公共数据集UCF101和HMDB51上的识别准确率分别为98.33%和74.63%。与现有方法相比,该文模型具有参数量小、识别精度高的优点。
密码学与网络信息安全
基于非局域性正交乘积态的动态量子秘密共享方案
宋秀丽, 李闯
2024, 46(3): 1109-1118.   doi: 10.11999/JEIT230193
[摘要](207) [HTML全文](78) [PDF 1172KB](45)
摘要:
当前的量子秘密共享(QSS)存在资源制备开销较大、安全性不强的问题,该文提出一种基于正交乘积态的可验证量子秘密共享方案弥补上述不足,且多方成员能动态地加入或退出秘密共享。该方案将正交乘积态的粒子分成两个序列,第1个序列在多个参与者之间传输,前一个参与者对其执行嵌入份额值的酉算子后传输给下一个参与者,直到全部份额聚合完成;对于另一个序列,只有最后一个参与者(验证者)对接收到的粒子执行Oracle算子。然后,验证者对两个序列中的粒子对执行全局测量,得到秘密值的平方剩余。最后,借鉴Rabin密码中密文与明文之间非单一映射的思想,验证者联合Alice验证测量结果的正确性,并从测量结果确定出秘密值。安全性分析表明,该方案能抵抗常见的外部攻击和内部攻击,且验证过程具有强安全性;由于非局域性正交乘积态以两个序列分开传输,因此增强了秘密重构过程的安全性。性能分析表明,该方案使用正交乘积态作为信息载体,量子资源开销较小,且将正交乘积基的维度从低维拓展到d维,参与者人数能动态地增加和减少,使得方案具有更好的灵活性和通用性。
一种面向联邦学习对抗攻击的选择性防御策略
陈卓, 江辉, 周杨
2024, 46(3): 1119-1127.   doi: 10.11999/JEIT230137
[摘要](257) [HTML全文](110) [PDF 2431KB](59)
摘要:
联邦学习(FL)基于终端本地的学习以及终端与服务器之间持续地模型参数交互完成模型训练,有效地解决了集中式机器学习模型存在的数据泄露和隐私风险。但由于参与联邦学习的多个恶意终端能够在进行本地学习的过程中通过输入微小扰动即可实现对抗性攻击,并进而导致全局模型输出不正确的结果。该文提出一种有效的联邦防御策略-SelectiveFL,该策略首先建立起一个选择性联邦防御框架,然后通过在终端进行对抗性训练提取攻击特性的基础上,在服务器端对上传的本地模型更新的同时根据攻击特性进行选择性聚合,最终得到多个适应性的防御模型。该文在多个具有代表性的基准数据集上评估了所提出的防御方法。实验结果表明,与已有研究工作相比能够提升模型准确率提高了2%~11%。
基于混沌理论与DNA动态编码的卫星图像加密算法
肖嵩, 陈哲, 杨亚涛, 马英杰, 杨腾
2024, 46(3): 1128-1137.   doi: 10.11999/JEIT230203
[摘要](226) [HTML全文](103) [PDF 10285KB](64)
摘要:
针对卫星图像在传输、存储过程中涉及的信息安全问题,该文提出一种新型的基于混沌理论与DNA动态编码的卫星图像加密算法。首先,提出一种改进型无限折叠混沌映射,拓宽了原有无限折叠混沌映射的混沌区间。之后,结合改进型Chebyshev混沌映射与SHA-256哈希算法,生成加密算法的密钥流,提升算法的明文敏感性。然后,利用混沌系统的状态值对Hilbert局部置乱后的像素进行DNA编码,实现DNA动态编码,解决了DNA编码规则较少所带来的容易受到暴力攻击的弱点。最后,使用混沌序列完成进一步混沌加密,从而彻底混淆原始像素信息,增加加密算法的随机性与复杂性,得到密文图像。实验结果表明,该算法具有较好的加密效果和应对各种攻击的能力。
电路与系统设计
分数阶光敏神经元的动力学特性分析及其同步研究
杨宁宁, 孟诗悦, 吴朝俊
2024, 46(3): 1138-1146.   doi: 10.11999/JEIT230283
[摘要](259) [HTML全文](138) [PDF 10311KB](35)
摘要:
神经元是神经系统的基本单位,神经元模型的准确性影响对其本质特征的分析和理解。该文研究了由分数阶电容和电感构成的分数阶光敏FitzHugh-Nagumo(FHN)神经元电路。利用分岔图、相轨迹图和时间序列图分析了分数阶光敏神经元模型的动力学特性。研究发现,随着分数阶阶次的降低,分数阶光敏神经元的活跃度增加。当选取不同参数时,神经元系统可以诱发不同的放电模式,如周期放电态、混沌放电态和尖峰放电态。此外,利用电突触耦合的方式连接两个分数阶光敏神经元。通过调整耦合强度,可以实现分数阶光敏神经元系统之间的相位同步和完全同步。最后,采用dSPACE验证了外部光信号对神经元兴奋性的调制作用。
编辑部公告
more >
会议信息
more >
作者服务中心
融媒体平台
more >
友情链接
more >

官方微信,欢迎关注

电子与信息学报

微信学术论坛群