电子与信息学报

姓名
邮箱
手机号码
标题
留言内容
验证码

2024 年 2 期封面

2024, 46(2).

[摘要](160) [PDF 5977KB](71)

摘要:

2024 年 2 期目次

2024, 46(2): 1-4.

[摘要](144) [HTML全文] (47) [PDF 268KB](40)

摘要:

集对论在人工智能中的若干应用与进展综述

赵克勤

2024, 46(2): 383-407. doi: 10.11999/JEIT230889

[摘要](721) [HTML全文] (279) [PDF 2123KB](207)

摘要:
集对论(SPT)把事物所在的时空视为一个既确定又不确定(D-U)时空，把事物的确定性与不确定性作为一个确定不确定系统处理，对不确定性“客观承认、系统描述、定量刻画、具体分析、实践检验”，在应用中不断发展。该文综述集对(SP)及其联系数(CN)的来源与性质，集对论的成对原理与不确定原理、不确定性系统理论与同异反系统理论和基本算法之后，概述集对论在智能定义、航天数据快速评估和多雷达信号分选、复杂系统智能预测、不确定性智能决策、以及自然数的联系数化与群体智能测算等涉及人工智能基础方面的若干应用，简介集对论在智能算法创新方面的若干进展，包括偏联系数计算与联系数系统能守恒计算在内的绿色智能计算等；期待“集对论+非集对论”集成的绿色智能算法在新一代人工智能中得到更多应用。

认知相对论——通向强人工智能之路

李玉鑑

2024, 46(2): 408-427. doi: 10.11999/JEIT230749

[摘要](844) [HTML全文] (278) [PDF 1117KB](188)

摘要:
人工智能(AI)的发展如火如荼，大有超越人类之势，以致很多人认为奇点就要来临，强人工智能即将实现。这是一种对强人工智能的误解，因为强人工智能的核心并不在于其功能是否强大，而在于它是否具有意识。该文首先解释了强人工智能的内涵，讨论了与之相关的意识问题；然后，阐述了旨在揭开意识奥秘的认知相对论思想，包括：世界的相对性原理和符号的相对性原理，以及世界、语言和心灵的关系。接着，提出了另一条新原理，即意识的等效原理，用以说明意识从物质产生所需要的物理条件，解决主观体验或现象意识的困难问题，推导意识能力受限于感觉能力且以感觉容量为上界的认知基本定理，并分析意识在哪里和自我是什么的可能性。最后，在认知相对论的框架下，给出了研究意识问题的新纲领和实现机器意识的新思路，并展望了强人工智能的未来。

联邦学习深度梯度反演攻防研究进展

孙钰, 严宇, 崔剑, 熊高剑, 刘建华

2024, 46(2): 428-442. doi: 10.11999/JEIT230541

[摘要](1355) [HTML全文] (667) [PDF 2335KB](306)

摘要:
联邦学习作为一种“保留数据所有权，释放数据使用权”的分布式机器学习方法，打破了阻碍大数据建模的数据孤岛。然而，联邦学习在训练过程中只交换梯度而不交换训练数据的特点并不能保证用户训练数据的机密性。近年来新型的深度梯度反演攻击表明，敌手可从共享梯度中重建用户的私有训练数据，从而对联邦学习的私密性产生了严重威胁。随着梯度反演技术的演进，敌手从深层网络恢复大批量原始数据的能力不断增强，甚至对加密梯度的隐私保护联邦学习(PPFL)发起了挑战。而有效的针对性防御方法主要基于扰动变换，旨在混淆梯度、输入或特征以隐藏敏感信息。该文首先指出了隐私保护联邦学习的梯度反演漏洞，并给出了梯度反演威胁模型。之后从攻击范式、攻击能力、攻击对象3个角度对深度梯度反演攻击进行详细梳理。随后将基于扰动变换的防御方法依据扰动对象的不同分为梯度扰动、输入扰动、特征扰动3类，并对各类方法中的代表性工作进行分析介绍。最后，对未来研究工作进行展望。

基于脑电的快速序列视觉呈现脑-机接口系统研究进展综述

魏玮, 邱爽, 李叙锦, 毛嘉宇, 王妍紫, 何晖光

2024, 46(2): 443-455. doi: 10.11999/JEIT230952

[摘要](1267) [HTML全文] (415) [PDF 5723KB](259)

摘要:
脑-机接口(BCI)系统建立大脑与外部设备之间的直接交流通路，结合快速序列视觉呈现(RSVP)范式能够实现利用人类视觉系统进行高流通量图像目标检索。近些年来，RSVP-BCI系统在范式编码、脑电(EEG)解码和系统应用方面的研究取得了长足的进步。对范式编码的研究揭示不同范式参数对系统性能的影响，促进提升系统性能；脑电解码的研究在提升算法分类性能的同时推动少训练、零训练样本、多模态等场景下的应用；对RSVP-BCI系统应用的研究实现推动系统走向实际应用并拓宽了应用领域。同时，系统仍面临着迈向实际时可应用领域范围窄、脑电跨域解码难题以及计算机视觉飞速进步带来的挑战。该文对RSVP-BCI近年来的相关研究进展进行了回顾与总结，并对未来的发展方向进行了展望。

无人车集群协同围捕发展现状分析

徐友春, 郭宏达, 娄静涛, 叶鹏, 苏致远

2024, 46(2): 456-471. doi: 10.11999/JEIT230122

[摘要](842) [HTML全文] (401) [PDF 2472KB](201)

摘要:
无人车集群具有成本低、安全性好、自主程度高等优点，已成为无人驾驶领域的研究热点。基于无人车集群，研究人员提出多种不同协同策略以完成各类任务，其中协同围捕作为重要的应用方向，无论是在军用还是民用领域都受到了广泛关注。针对此问题，该文首先基于无人车集群的相关应用和架构，对协同围捕的策略机理进行了系统分析，并将协同围捕策略划分为搜索、追踪和围堵3个子模式。然后，从博弈论、概率分析和机器学习等角度梳理了协同围捕的关键方法，并对这些算法的优缺点进行了比较。最后，对未来研究提出了意见建议，为进一步提高无人车集群协同围捕的效率和性能提供参考和思路。

基于伪监督注意力短期记忆与多尺度去伪影网络的图像分块压缩感知

李俊辉, 侯兴松

2024, 46(2): 472-480. doi: 10.11999/JEIT231069

[摘要](367) [HTML全文] (165) [PDF 8821KB](78)

摘要:
基于深度展开网络的分块压缩感知(BCS)方法，在迭代去块伪影时通常会同时去除部分信号和保留部分块伪影，不利于信号恢复。为了改善重建性能，在学习去噪的迭代阈值(LDIT) 算法基础上，该文提出基于伪监督注意力短期记忆与多尺度去伪影网络(MSD-Net)的图像BCS迭代方法(PSASM-MD)。首先，在每步迭代中，利用残差网络并行地对每个图像子块单独去噪后再拼接。然后，对拼接后的图像采用含有伪监督注意力模块(PSAM)的MSD-Net进行特征提取，以更好地去除块伪影以提高重建性能。其中，PSAM被用于从含有块伪影的残差中抽取部分有用信号，并传递到下一步迭代实现短期记忆，以尽量避免去除有用信号。实验结果表明，该文方法相比现有先进的同类BCS方法在主观视觉感知和客观评价指标上均取得了更优的结果。

半配对的多模态询问哈希方法

庾骏, 马江涛, 咸阳, 侯瑞霞, 孙伟

2024, 46(2): 481-491. doi: 10.11999/JEIT231072

[摘要](357) [HTML全文] (208) [PDF 4991KB](48)

摘要:
多模态哈希能够将异构的多模态数据转化为联合的二进制编码串。由于其具有低存储成本、快速的汉明距离排序的优点，已经在大规模多媒体检索中受到了广泛的关注。现有的多模态哈希方法假设所有的询问数据都具备完整的多种模态信息以生成它们的联合哈希码。然而，实际应用中很难获得全完整的多模态信息，针对存在模态信息缺失的半配对询问场景，该文提出一种新颖的半配对询问哈希(SPQH)，以解决半配对的询问样本的联合编码问题。首先，提出的方法执行投影学习和跨模态重建学习以保持多模态数据间的语义一致性。然后，标签空间的语义相似结构信息和多模态数据间的互补信息被有效地捕捉以学习判别性的哈希函数。在询问编码阶段，通过学习到的跨模态重构矩阵为未配对的样本数据补全缺失的模态特征，然后再经习得的联合哈希函数生成哈希特征。相比最先进的基线方法，在Pascal Sentence, NUS-WIDE和IAPR TC-12数据集上的平均检索精度提高了2.48%。实验结果表明该算法能够有效编码半配对的多模态询问数据，取得了优越的检索性能。

PPNet：基于预先预测的降雨短时预测模型

宋毅, 张晗奕, 孙丰, 张敬林, 白琮

2024, 46(2): 492-502. doi: 10.11999/JEIT230547

[摘要](519) [HTML全文] (361) [PDF 9138KB](121)

摘要:
降雨短时预测一直以来都是气象预测问题中的热点问题。传统的预测方法基于数值天气预测模型展开预报，但近些年利用深度学习展开基于雷达回波图的降雨短时预测方法受到了广大研究者的关注。其中，时序预测网络存在不能并行计算导致耗时过长的问题且存在梯度爆炸问题。全卷积网络可以解决上述两个问题，但是却不具备时序信息提取的能力。因此，该文以泰勒冻结假设为理论依据，提出一个基于预先预测辅助推断结构的2维全卷积网络(PPNet)。网络先行提取粗粒度时序信息与空间信息，然后利用全卷积结构细化特征粒度，有效缓解2维卷积网络不能提取时序信息的缺陷。此外，该文还提供一种时序特征约束器对预先预测特征进行时间维度的特征约束，使预测特征更倾向于真实特征。消融实验证明所提预先预测辅助推断结构和时序特征约束器具有优秀的时序特征能力，可以提升网络对时序信息的敏感度。与目前最好的降雨预测算法或视频预测算法相比，该文网络均取得较好结果，特别在暴雨指标上达到最优。

融合多源异构气象数据的光伏功率预测模型

谈玲, 康瑞星, 夏景明, 王越

2024, 46(2): 503-517. doi: 10.11999/JEIT230731

[摘要](1106) [HTML全文] (616) [PDF 28540KB](169)

摘要:
高精度光伏功率预测对提高电力系统运行效率具有重要意义。光伏功率受多种因素影响，其中云层的变化是最主要的不确定因素。传统光伏功率预测方法没有充分考虑云的3维结构和气象要素对光伏功率的影响。因此，该文提出一种融合多源异构气象数据的多源变量光伏功率预测模型(MPPM)。MPPM的核心包括时空条件扩散模型(STCDM)、注意力堆叠LSTM网络(ASLSTM)和多维特征融合模块(MFFM)。STCDM模型通过对2维卫星云图进行精确预测，消除了云层边界处的模糊现象。ASLSTM模型则提取了3维天气研究与预报模式 (WRF)气象要素特征。MFFM模块将2维卫星云图特征和3维WRF气象要素特征进行融合，以得到未来1 h光伏功率预测结果。该文分别利用STCDM模型和MPPM模型开展卫星云图预测实验和光伏功率预测实验。实验结果显示，STCDM模型预测1 h内卫星云图的结构相似性指数(SSIM)达到0.914，MPPM模型预测1 h内光伏功率的相关系数(CORR)达到0.949，优于所有对比算法。

一种结构化双注意力混合通道增强的跨模态行人重识别方法

庄建军, 庄宇辰

2024, 46(2): 518-526. doi: 10.11999/JEIT230614

[摘要](689) [HTML全文] (198) [PDF 2492KB](98)

摘要:
在目前跨模态行人重识别技术的研究中，大部分现有的方法会通过单模态原始可见光图像或者对抗生成图像的局部共享特征来降低跨模态差异，导致在红外图像判别中由于底层特征信息丢失而缺乏稳定的识别准确率。为了解决该问题，该文提出一种结构化双注意力可交换混合随机通道增强的特征融合跨模态行人重识别方法，利用通道增强后的可视图像作为第三模态，通过图像通道可交换随机混合增强(I-CSA)模块对可见光图像进行单通道和三通道随机混合增强抽取，从而突出行人的姿态结构细节，在学习中减少模态间差异。结构化联合注意力特征融合 (SAFF)模块在注重模态间行人姿态结构关系的前提下，为跨模态表征学习提供更丰富的监督，增强了模态变化中共享特征的鲁棒性。在SYSU-MM01数据集全搜索模式单摄设置下Rank-1和mAP分别达到71.2%和68.1%，优于同类前沿方法。

基于信息分形的行人轨迹预测方法

杨田, 王钢, 赖健, 汪洋

2024, 46(2): 527-537. doi: 10.11999/JEIT230726

[摘要](505) [HTML全文] (381) [PDF 4932KB](77)

摘要:
行人轨迹预测应用十分广泛，比如自动驾驶、机器人导航等。在轨迹预测中，一些不确定信息给轨迹预测任务带来了挑战，比如判别器中对轨迹信息判别的不确定，复杂的交互信息。在不确定信息处理科学领域，信息分形能有效处理不确定信息的不确定性和复杂性。受此启发，为了充分处理判别器中轨迹信息判别的不确定性，提升预测精度，该文提出了基于信息分形的轨迹预测方法。首先，场景信息和历史轨迹信息被特征提取模块提取。然后，通过注意力模块获取到场景-行人之间的交互信息与行人-行人之间的交互信息。最后基于生成对抗网络和信息分形生成合理的轨迹。在两个公共数据集ETH/UCY上实验表明，该方法能有效处理轨迹信息的不确定性，提高轨迹预测的精度。比如突然转弯、从后方超越前人、避让等行为的轨迹都能有效预测。在平均位移误差(ADE)和终点位移误差(FDE)上相比基准模型误差平均降低了11.11%和23.48%。

聚类与信息共享的多智能体深度强化学习协同控制交通灯

杜同春, 王波, 程浩然, 罗乐, 曾能民

2024, 46(2): 538-545. doi: 10.11999/JEIT230857

[摘要](557) [HTML全文] (189) [PDF 3086KB](82)

摘要:
该文提出一种适用于多路口交通灯实时控制的多智能体深度循环Q-网络(MADRQN)，目的是提高多个路口的联合控制效果。该方法将交通灯控制建模成马尔可夫决策过程，将每个路口的控制器作为智能体，根据位置和观测信息对智能体聚类，然后在聚类内部进行信息共享和中心化训练，并在每个训练过程结束时将评价值最高的值函数网络参数分享给其它智能体。在城市交通仿真软件(SUMO)下的仿真实验结果表明，所提方法能够减少通信的数据量，使得智能体之间的信息共享和中心化训练更加可行和高效，车辆平均等待时长少于当前最优的基于多智能体深度强化学习的交通灯控制方法，能够有效地缓解交通拥堵。

基于跨语种声学分析的帕金森病检测方法

季薇, 王传瑜, 吴迪, 李云, 郑慧芬

2024, 46(2): 546-554. doi: 10.11999/JEIT230981

[摘要](437) [HTML全文] (181) [PDF 1208KB](56)

摘要:
基于语音的帕金森病检测具有非介入式、成本较低和无创等优点。当前公开的帕金森病语音数据集大多来源于单一语种，存在数据容量不够大、受试者母语发音特点差异小等特点。单一语种数据集上训练的帕金森病检测模型在面对跨语种语音数据时，将出现性能下降。为避免语种差异带来的影响，提升模型在跨语种场景下的检测性能，该文引入对抗迁移学习和特征解耦的思想，提出一种帕金森病跨语种声学分析模型(CLSAM)。首先，将基于多头自注意力机制的Transformer编码块和多层神经网络级联，组成特征提取器模块，用于将从源域和目标域语音中提取的原始Fbank语音特征初步解耦为两个向量，即域不变病理信息表征向量和域信息表征向量；设计了目标任务不一致的双重对抗训练模块，显式地分离域不变病理信息和域信息；最终，提取跨语种语音数据中的域不变病理信息用于帕金森病检测。该文在公开的MaxLittle帕金森病语音数据集以及自采的帕金森病语音数据集上，采用十折交叉验证的方法验证了所提方法的有效性。实验结果表明：与传统机器学习方法以及现有的迁移学习算法相比，所提模型在跨语种场景中的检测准确率、敏感度和F1分数等性能均有明显提升。

面向可穿戴式的基于LSTM神经网络的智能心音异常诊断芯片

周维新, 高肇岗, 肖宛昂

2024, 46(2): 555-563. doi: 10.11999/JEIT230934

[摘要](462) [HTML全文] (321) [PDF 4511KB](87)

摘要:
心血管疾病是造成全球死亡人数最多的疾病之一，因此对心血管疾病的预防与提前诊断至关重要。人工听诊技术与计算机心音诊断技术无法满足对心音长时间听诊的需求，因而可穿戴式听诊设备越来越受到关注，但是其具有高精度与低功耗的要求。该文设计了低功耗的面向可穿戴式的基于长短期记忆网络(Long Short-Term Memory, LSTM)的智能心音异常诊断芯片，提出了包括预处理、特征提取以及异常诊断的心音异常诊断系统，并搭建了基于听诊器的心音采集FPGA系统，采用了数据增强的方法解决数据集的不平衡问题。基于预训练模型设计了智能心音异常诊断芯片，在SMIC180 nm工艺下完成了版图设计和MPW流片。后仿真结果表明，智能心音异常诊断芯片的诊断准确率为98.6%，功耗为762 μW，面积为3.06 mm × 2.45 mm，满足可穿戴式智能心音异常诊断设备的高性能与低功耗的需求。

基于汉字拆分嵌入和二部图的残损碑文识别

蔺广逢, 吴娜, 贺梦兰, 张二虎, 孙强

2024, 46(2): 564-573. doi: 10.11999/JEIT230893

[摘要](404) [HTML全文] (208) [PDF 2621KB](68)

摘要:
古籍碑刻承载着丰富的历史文化信息，但是由于自然风化浸蚀和人为破坏使得碑石上的文字信息残缺不全。古碑文语义信息多样化且样例不足，使得学习行文语义补全识别残损文字变得十分困难。该文试图从字形空间语义建模解决补全残损汉字进行识别理解这一挑战性任务。该文在层级拆分嵌入(HDE)编码方法的基础上使用动态图修补嵌入(DynamicGrape)，对待识别汉字的图像进行特征映射并判别是否残损。如未残损直接转化为层级拆分编码，输入二部图推理字节点到部件节点的边权重，比对字库编码识别理解；如残损需要在字库里检索可能字和部件，对汉字编码的特征维度进行选择，输入二部图推理预测可能的汉字结果。在自建的数据集以及中文自然文本(CTW)数据集中进行验证，结果表明二部图网络可以有效迁移和推理出残损文字字形信息，该文方法可以有效对残损汉字进行识别理解，为残损结构信息处理开拓出了新的思路和途径。

多层次时空特征自适应集成与特有-共享特征融合的双模态情感识别

孙强, 陈远

2024, 46(2): 574-587. doi: 10.11999/JEIT231110

[摘要](632) [HTML全文] (333) [PDF 6966KB](96)

摘要:
在结合脑电(EEG)信号与人脸图像的双模态情感识别领域中，通常存在两个挑战性问题：(1)如何从EEG信号中以端到端方式学习到更具显著性的情感语义特征；(2)如何充分利用双模态信息，捕捉双模态特征中情感语义的一致性与互补性。为此，提出了多层次时空特征自适应集成与特有-共享特征融合的双模态情感识别模型。一方面，为从EEG信号中获得更具显著性的情感语义特征，设计了多层次时空特征自适应集成模块。该模块首先通过双流结构捕捉EEG信号的时空特征，再通过特征相似度加权并集成各层次的特征，最后利用门控机制自适应地学习各层次相对重要的情感特征。另一方面，为挖掘EEG信号与人脸图像之间的情感语义一致性与互补性，设计了特有-共享特征融合模块，通过特有特征的学习和共享特征的学习来联合学习情感语义特征，并结合损失函数实现各模态特有语义信息和模态间共享语义信息的自动提取。在DEAP和MAHNOB-HCI两种数据集上，采用跨实验验证和5折交叉验证两种实验手段验证了提出模型的性能。实验结果表明，该模型取得了具有竞争力的结果，为基于EEG信号与人脸图像的双模态情感识别提供了一种有效的解决方案。

结合时间注意力机制和单模态标签自动生成策略的自监督多模态情感识别

孙强, 王姝玉

2024, 46(2): 588-601. doi: 10.11999/JEIT231107

[摘要](589) [HTML全文] (430) [PDF 3505KB](109)

摘要:
大多数多模态情感识别方法旨在寻求一种有效的融合机制，构建异构模态的特征，从而学习到具有语义一致性的特征表示。然而，这些方法通常忽略了模态间情感语义的差异性信息。为解决这一问题，提出了一种多任务学习框架，联合训练1个多模态任务和3个单模态任务，分别学习多模态特征间的情感语义一致性信息和各个模态所含情感语义的差异性信息。首先，为了学习情感语义一致性信息，提出了一种基于多层循环神经网络的时间注意力机制(TAM)，通过赋予时间序列特征向量不同的权重来描述情感特征的贡献度。然后，针对多模态融合，在语义空间进行了逐语义维度的细粒度特征融合。其次，为了有效学习各个模态所含情感语义的差异性信息，提出了一种基于模态间特征向量相似度的自监督单模态标签自动生成策略(ULAG)。通过在CMU-MOSI, CMU-MOSEI, CH-SIMS 3个数据集上的大量实验结果证实，提出的TAM-ULAG模型具有很强的竞争力：在分类指标(

\begin{document}$ Ac{c_2} $\end{document}

,

\begin{document}$ {F_1} $\end{document}

)和回归指标(MAE, Corr)上与基准模型的指标相比均有所提升；对于二分类识别准确率，在CMU-MOSI和CMU-MOSEI数据集上分别为87.2%和85.8%，而在CH-SIMS数据集上达到81.47%。这些研究结果表明，同时学习多模态间的情感语义一致性信息和各模态情感语义的差异性信息，有助于提高自监督多模态情感识别方法的性能。

沉浸式视频编码技术综述

曾焕强, 孔庆玮, 陈婧, 朱建清, 施一帆, 侯军辉

2024, 46(2): 602-614. doi: 10.11999/JEIT230097

[摘要](965) [HTML全文] (542) [PDF 4731KB](173)

摘要:
随着虚拟现实、增强现实等沉浸式媒体技术的发展，沉浸式视频的表示、存储、传输和显示等各个环节都受到了科研及产业界的广泛关注。沉浸式视频更复杂的视频特性和庞大的数据量，对传统视频编码技术提出了挑战，新的编码技术应运而生。该文从视频自由度(DoF)出发，分别从3DoF和6DoF两个方面介绍沉浸式视频编码技术的最新成果。3DoF视频相关编码技术包括投影模型、运动估计模型和3DoF视频编码标准。6DoF视频相关编码技术包括视频表示形式、虚拟视点合成技术、6DoF视频编码技术及运动图像专家组沉浸式视频(MPEG, MIV)编码标准。最后，对沉浸式视频及其编码技术的发展进行总结和展望。

基于视觉自注意力模型与轨迹滤波器的篮球战术识别

许国良, 沈刚, 梁旭鹏, 雒江涛

2024, 46(2): 615-623. doi: 10.11999/JEIT230079

[摘要](684) [HTML全文] (396) [PDF 4321KB](107)

摘要:
通过机器学习分析球员轨迹数据获得进攻或防守战术，是篮球视频内容理解的关键组成部分。传统机器学习方法需要人为设定特征变量，灵活性大大降低，因此如何自动获取可用于战术识别的特征信息成为关键问题。为此，该文基于美国职业篮球联赛(NBA)比赛中球员轨迹数据设计了一个篮球战术识别模型(TacViT)，该模型以视觉自注意力模型(ViT)作为主干网络，利用多头注意力模块提取丰富的全局轨迹特征信息，同时并入轨迹滤波器来加强球场线与球员轨迹之间的特征信息交互，增强球员位置特征表示，其中轨迹滤波器以对数线性复杂度学习频域中的长期空间相关性。该文将运动视觉系统(SportVU)的序列数据转化为轨迹图，自建篮球战术数据集(PlayersTrack)，在该数据集上的实验表明，TacViT的准确率达到了82.5%，相对未做更改的视觉自注意力S模型 (ViT-S)，精度上提升了16.7%。

利用跨模态轻量级YOLOv5模型的PET/CT肺部肿瘤检测

周涛, 叶鑫宇, 刘凤珍, 陆惠玲

2024, 46(2): 624-632. doi: 10.11999/JEIT230052

[摘要](1012) [HTML全文] (394) [PDF 12021KB](153)

摘要:
多模态医学图像可在同一病灶处提供更多语义信息，针对跨模态语义相关性未充分考虑和模型复杂度过高的问题，该文提出基于跨模态轻量级YOLOv5(CL-YOLOv5)的肺部肿瘤检测模型。首先，提出学习正电子发射型断层显像(PET)、计算机断层扫描(CT)和PET/CT不同模态语义信息的3分支网络；然后，设计跨模态交互式增强块充分学习多模态语义相关性，余弦重加权计算Transformer高效学习全局特征关系，交互式增强网络提取病灶的能力；最后，提出双分支轻量块，激活函数簇(ACON)瓶颈结构降低参数同时增加网络深度和鲁棒性，另一分支为密集连接的递进重参卷积，特征传递达到最大化，递进空间交互高效地学习多模态特征。在肺部肿瘤PET/CT多模态数据集中，该文模型获得94.76% mAP最优性能和3238 s最高效率，以及0.81 M参数量，较YOLOv5s和EfficientDet-d0降低7.7倍和5.3倍，多模态对比实验中总体上优于现有的先进方法，消融实验和热力图可视化进一步验证。

高效前缀约简的三维Hilbert空间填充曲线编解码算法

贾连印, 范瑶, 丁家满, 李晓武, 游进国

2024, 46(2): 633-642. doi: 10.11999/JEIT230013

[摘要](567) [HTML全文] (334) [PDF 2388KB](67)

摘要:
3维Hilbert空间填充曲线(3D HSFC)的编码和解码效率对空间查询处理、图像处理等领域的应用举足轻重。现有的3维编解码算法独立编解码每一个点，忽略了Hilbert曲线的局部保持特性。为了提高编解码效率，该文设计了高效的3D状态视图，并提出一种新的前缀约简的3D HSFC编码算法(PR-3HE)和前缀约简3D HSFC解码算法(PR-3HD)，这两个算法通过公共前缀的定义和识别、公共前缀约简及多种优化技术来最小化需要编码的阶数，从而提高3D HSFC的编解码效率。理论上证明：当编码或解码一个

\begin{document}$k$\end{document}

阶的窗体(窗体内总共含有

\begin{document}${2^k} \times {2^k} \times {2^k}$\end{document}

个点)时，PR-3HE平均每个点的编码阶数不超过2，PR-3HD平均解码阶数不超过8/7。相对于传统的基于迭代的方法，编解码时间复杂度从

\begin{document}$O(k)$\end{document}

降低到了

\begin{document}$O(1)$\end{document}

。实验结果表明，该文算法在模拟数据集和真实数据集上的表现显著优于现有算法。

利用自适应光照初始化的弱光图像增强方法

刘波, 田广粮, 肖斌, 马建峰, 毕秀丽

2024, 46(2): 643-651. doi: 10.11999/JEIT230056

[摘要](487) [HTML全文] (446) [PDF 4198KB](93)

摘要:
由于光照分量分解估计的高度不确定性，如何准确估计图像的光照分量一直是基于Retinex模型的图像增强方法需要解决的难题。该文提出一个简单有效的方法，准确估计图像的初始光照分量，进而实现弱光图像增强。具体地，首先根据输入图像得到其对应的光照权重矩阵，以指导光照分量的自适应初始化估计；随后在光照结构约束下，对初始光照分量优化估计，并进一步执行非线性光照调整；最终结合Retinex模型得到增强结果。实验表明，该方法不仅能够实现准确的图像分解估计，而且与现有的弱光图像增强方法相比，该文所提方法在多个数据集上的主观视觉效果和客观评价指标都有更好的表现，同时也保持着良好的运行效率。

基于硬件损伤的认知反向散射通信网络鲁棒安全资源分配算法

徐勇军, 姜思巧, 张海波, 王正强, 周继华

2024, 46(2): 652-661. doi: 10.11999/JEIT230117

[摘要](385) [HTML全文] (141) [PDF 4767KB](69)

摘要:
为了提高反向散射通信网络频谱效率、传输鲁棒性及信息安全性，该文提出一种基于硬件损伤的认知反向散射通信网络鲁棒安全资源分配算法。首先，考虑认知反向散射用户的最小安全速率、传输时间、能量收集和反射系数等约束，基于有界信道不确定性和频谱感知误差模型，建立一个多变量耦合的吞吐量最大化非凸资源分配问题。其次，利用最坏准则、连续凸近似和交替优化方法，将原问题转换为凸优化问题，并提出一种基于迭代的鲁棒资源分配算法。仿真结果表明，与现有算法对比，所提算法具有较好的鲁棒性。

多接入边缘计算赋能的AI质检系统任务实时调度策略

周晓天, 孙上, 张海霞, 邓伊琴, 鲁彬彬

2024, 46(2): 662-670. doi: 10.11999/JEIT230129

[摘要](660) [HTML全文] (428) [PDF 4152KB](97)

摘要:
AI质检是智能制造的重要环节，其设备在进行产品质量检测时会产生大量计算密集型和时延敏感型任务。由于设备计算能力不足，执行检测任务时延较大，极大影响生产效率。多接入边缘计算(MEC)通过将任务卸载至边缘服务器为设备提供就近算力，提升任务执行效率。然而，系统中存在信道变化和任务随机到达等动态因素，极大影响卸载效率，给任务调度带来了挑战。该文面向多接入边缘计算赋能的AI质检任务调度系统，研究了联合任务调度与资源分配的长期时延最小化问题。由于该问题状态空间大、动作空间包含连续变量，该文提出运用深度确定性策略梯度(DDPG)进行实时任务调度算法设计。所设计算法可基于系统实时状态信息给出最优决策。仿真结果表明，与基准算法相比，该文所提算法具有更好的性能表现和更小的任务执行时延。

基于不完美CSI的低轨卫星通信系统鲁棒资源分配算法

吴翠先, 董燚恒, 徐勇军, 张海波, 薛青

2024, 46(2): 671-679. doi: 10.11999/JEIT230086

[摘要](716) [HTML全文] (446) [PDF 2075KB](101)

摘要:
为了解决低轨卫星通信系统因资源受限导致的能量与速率不平衡的问题，同时考虑信道不确定性对实际卫星通信系统性能衰退的影响，该文提出一种基于最大化最小能效的鲁棒资源分配算法。首先，考虑每个用户中断速率约束、功率分配系数约束和最大发射功率约束，基于高斯信道不确定性，构建了联合优化卫星波束成形向量与功率分配因子的鲁棒资源分配模型。所描述的问题是一个含参数摄动的非凸、非确定性多项式难问题，很难直接求解。为此，基于丁克尔巴赫、伯恩斯坦不等式、半正定松弛和交替优化等方法将其转化为等价的凸优化问题，并提出一种基于迭代的混合鲁棒波束成形与功率分配算法。仿真结果表明，该文算法具有较好的能效和较强的鲁棒性。

基于模型驱动深度学习的OTFS信道估计

蒲旭敏, 刘雁翔, 宋米雪, 陈前斌

2024, 46(2): 680-687. doi: 10.11999/JEIT230072

[摘要](1049) [HTML全文] (464) [PDF 2608KB](177)

摘要:
针对单输入单输出(SISO)的正交时频空间(OTFS)调制系统，该文利用一种模型驱动深度学习算法进行OTFS信道估计。该方案首先将去噪近似消息传递(DAMP)算法进行深度展开，利用去噪卷积神经网络代替传统的去噪器，对含噪的时延多普勒信道进行去噪估计，然后提供了状态演化方程来预测可学习去噪近似消息传递(LDAMP)算法的理论归一化均方误差性能。仿真结果表明，相比于其他估计方案，该方案不仅在低信噪比条件下具有优越的性能表现，而且还具有非常好的鲁棒性，在信道路径总数不变时，增加OTFS 2维网格点数量，可以有效提升信道估计精确度。

基于多分量LFM信号时频分析的水声多普勒和时延估计研究

宁更新, 肖若君, 谢靓

2024, 46(2): 688-696. doi: 10.11999/JEIT230068

[摘要](321) [HTML全文] (442) [PDF 9319KB](81)

摘要:
在水声多普勒因子和时延估计研究实用化的进程中，利用多分量线性调频(LFM)信号实现估计的算法研究越来越普遍。针对多分量LFM信号时频域存有交叉项时各分量参数估计不准确的问题，提出基于非完全残差与脊线段匹配的自适应模态分解方法。该方法采用非完全残差函数保留了交叉点处的部分时频信息，利用脊线段匹配方法提供更精确的预设时频脊线，改进了各分量LFM信号调频斜率和起始频率的估计精度。联合两个估计量进一步给出了多普勒因子和时延估计的算法。仿真结果表示，较现有模态分解算法，所提改进方法有效解决了估计分量过程中交叉区间断裂带来的估计误差；水声多径的条件下，该方法的多普勒因子和时延估计精度优于对比的现有方法。

基于二阶统计特性的方向向量估计算法的DOA估计

侯进, 盛尧宝, 张波

2024, 46(2): 697-704. doi: 10.11999/JEIT230172

[摘要](510) [HTML全文] (232) [PDF 1100KB](105)

摘要:
为了减小天线阵流形误差对波达方向(DOA)估计结果的影响，以及克服基于传统盲源分离算法的DOA估计算法不能应用于少通道测向设备的不足，提出一种基于2阶统计特性的方向向量估计算法的DOA估计算法。首先，根据确定性最大似然(DML)估计算法谱函数的特征，构造关于协方差矩阵的酉约束下的优化问题；然后，通过优化该问题获得各个单信号的实际方向向量；最后，将各个单信号的实际方向向量输入到空间谱算法中实现DOA估计。由于将多信号的DOA估计转化为多个单信号的DOA估计，因此在天线阵列流形存在误差时，所提算法比传统的DOA方法具有更好的DOA估计性能。由于所提算法仅需使用协方差矩阵，因此所提算法可应用于少通道测向设备。由仿真实验结果可知，在阵列流形存在误差以及测向设备为少通道测向设备时，与传统DOA方法相比，所提算法的DOA估计的准确度、抗扰度以及分辨率更高。

基于双面平行带线的全空间扫描漏波天线

王亨辉, 孙胜, 刘能武, 刘元安

2024, 46(2): 705-712. doi: 10.11999/JEIT230067

[摘要](623) [HTML全文] (260) [PDF 3497KB](67)

摘要:
为了实现从后向端射到前向端射的连续波束扫描天线，该文基于双面平行带线结构提出了一种具有全空间扫描能力的漏波天线。天线单元由双面平行带线传输线和一对反向加载的开路枝节组成，两个开路枝节分别位于传输线的上导带和下导带。加载的反向开路枝节等效为一个偶极子，使得天线单元具有全向辐射性能，作为整个全空间扫描漏波天线的基础单元。为了抑制周期漏波天线中的开阻带问题，又在天线基础单元上加载了一对平衡槽以实现频率平衡条件，还加载了一对匹配槽以匹配周期结构的阻抗。最后实现了一款天线原型，经仿真与实验验证，该天线能够在7.6 GHz 到14.0 GHz的频率范围内，实现从后向端射，经侧向辐射，然后到前向端射的全空间扫描能力。

端接复杂电路传输线网络的电磁耦合时域并行计算方法

叶志红, 张玉, 鲁唱唱

2024, 46(2): 713-719. doi: 10.11999/JEIT230098

[摘要](293) [HTML全文] (193) [PDF 2387KB](40)

摘要:
针对端接复杂电路传输线(TL)网络的电磁耦合问题，仍缺乏高效的场路协同仿真技术。该文将传输线方程与时域有限差分(FDTD)方法、诺顿定理和置换定理以及NGSPICE软件相结合，并引入消息传递接口(MPI)并行技术，提出一种高效的时域混合并行算法(FDTDTL-NGSPICE)。首先，根据诺顿定理和置换定理，将传输线网络分解为传输线子系统和复杂电路子系统，并构建对应的等效电路模型。然后，使用FDTDTL并行算法计算传输线子系统沿线各点的电压和电流，并获取对应诺顿等效电路的电流源和等效导纳大小。最后，使用NGSPICE对复杂电路子系统进行传导干扰分析，获得复杂电路各元件上的瞬态响应，并将端口电压反馈给传输线子系统作为边界，实现传输线网络电磁耦合的场线路联合协同仿真。通过对3类典型场景的计算实例，分别使用时域混合并行算法和电磁仿真软件CST电缆工作室(CS)进行数值模拟并对比，验证所提算法的置信度。

基于总体最小二乘-旋转不变算法的地表核磁共振信号参数估计

于晓辉, 冯海, 田宝凤, 孙海欣, 孙晓东

2024, 46(2): 720-727. doi: 10.11999/JEIT230102

[摘要](314) [HTML全文] (129) [PDF 2807KB](35)

摘要:
在地表核磁共振(SNMR)找水系统中，根据SNMR信号的参数能够预估地下含水层的储水量、导电性以及孔隙结构等信息。然而在实际应用中探测现场采集的SNMR信号十分微弱，易受到环境噪声干扰，导致无法直接获取SNMR信号的参数。针对这一问题，该文提出基于总体最小二乘-旋转不变法(TLS-ESPRIT)的地表核磁共振信号参数估计方法。基于谐波噪声与SNMR信号的相似信号特征构成一个由多个正弦衰减信号叠加的混合信号模型，使用TLS-ESPRIT将混合信号参数提取问题转换为旋转不变矩阵的广义特征值求解，从而获得SNMR信号的拉莫尔频率和弛豫时间，并结合最小二乘法求得其初始振幅和相位。仿真信号和实测信号实验结果表明此方法能够估计出混有随机噪声和工频谐波噪声的SNMR信号的参数，相比传统的谐波建模方法，在参数提取精度上效果更好。

基于改进自适应协同控制方法的电力系统混沌控制

方洁, 张少辉, 江泳

2024, 46(2): 728-737. doi: 10.11999/JEIT230075

[摘要](526) [HTML全文] (247) [PDF 4558KB](74)

摘要:
针对4阶混沌电力系统，该文提出一种具有快速收敛特性的自适应协同控制方案。首先基于Lyapunov稳定性定理和全局快速收敛理论，设计了一种具有快速收敛特性的协同控制器，该控制器可使宏变量快速到达不变流形并可以得到平滑无抖振的控制输入，实现宏变量的精确收敛。然后将所设计的控制器应用于4阶电力系统的混沌控制中。由于电力系统中的能量过剩会引起混沌振荡，在控制回路中引入储能装置，通过控制储能装置吸收电力系统中多余的有功功率来抑制其混沌振荡。在此基础上通过设计自适应律，消除了控制器设计过程中出现的复杂项，增加了控制器的实用性。最后通过数值仿真，验证了该控制方案的有效性与优越性。

基于动态规整与改进变分自编码器的异常电池在线检测方法

郭铁峰, 贺建军, 申帅, 王翔, 张彬汉

2024, 46(2): 738-747. doi: 10.11999/JEIT230084

[摘要](681) [HTML全文] (416) [PDF 10343KB](98)

摘要:
针对电池生产成组过程中，传统异常检测方法对混入的容量及压差异常电池检测精度低及生产结束后离线异常检测方法效率低等问题，该文提出一种集合长短期记忆变分自编码器与动态时间规整评价的锂电池异常在线检测方法(VAE-LSTM-DTW)，实现了异常电池的在线检测，避免了离线异常检测所造成的时间和能源的浪费。该方法首先将长短期记忆网络(LSTM)引入变分自编码器(VAE)模型，训练电池时序数据重构模型；其次，在电池异常检测的度量标准中引入动态时间规整值(DTW)，并基于贝叶斯寻优获得最优检测阈值，对每个单体电池重构数据的动态规整值进行异常辨别。实验结果表明，相较该领域传统异常检测方法，VAE-LSTM-DTW模型性能优越，查准率和F1值都得到了较大的提升，具有较高的有效性和实用性。

区块链隐私众包中的数据验证与可控匿名方案

薛开平, 范茂, 王峰, 罗昕怡

2024, 46(2): 748-756. doi: 10.11999/JEIT230106

[摘要](570) [HTML全文] (392) [PDF 2152KB](108)

摘要:
针对隐私众包场景下出现的数据验证、匿名作恶检测和跨平台资源交互等需求，该文基于区块链技术，并结合零知识证明与环签名技术，提出一种联盟链架构下的隐私众包方案。该方案依靠零知识证明实现对加密数据的验证，依靠链接可撤销环签名改进方案实现工人身份的可控匿名，引入联盟链架构实现众包实体之间的资源交互。在完成众包完整流程的同时，实现隐私众包所需的数据保护与身份保护。安全性分析表明，该方案具有隐私性、可验证性、可控匿名性与公平性。实验结果验证了方案在效率与性能方面的有效性。

格上基于身份的变色龙签名方案

张彦华, 陈岩, 刘西蒙, 尹毅峰, 胡予濮

2024, 46(2): 757-764. doi: 10.11999/JEIT230155

[摘要](650) [HTML全文] (272) [PDF 823KB](114)

摘要:
变色龙签名(CS)是一种比较理想的指定验证者签名，其采用变色龙哈希函数来实现签名的不可传递性，使得任意第三方不信任指定验证者所披露的内容，且避免了不可否认签名必须在线交互验证的缺陷。在满足不可传递性的同时，变色龙签名还要求满足不可伪造性以及签名者可拒绝性和不可抵赖性等。针对基于大整数分解或离散对数等数论难题的变色龙签名无法抵御量子计算机攻击，以及用户对公钥数字证书依赖的问题，该文给出了格上基于身份的变色龙签名(IBCS)，新方案避免了已有方案存在的签名者无法拒绝指定验证者伪造的签名的安全性漏洞，并将最终签名的传输开销由平方级降为线性级；进一步地，针对变色龙签名在仲裁阶段不可传递性失效的问题，给出了格上抗消息暴露的基于身份的变色龙签名，新方案使得签名者能够在不暴露消息内容的条件下拒绝任意敌手伪造的变色龙签名。特别地，基于格上经典的小整数解问题，两个方案在随机预言机模型下是可证明安全的。

留言板

2024年第46卷第2期

留言板

2024年 第46卷 第2期

2024年第46卷第2期