高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码
优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。本栏目内容尚未正式出版,未经编辑部许可,不得转载。
显示方式:
Wave-MambaCT:基于小波Mamba的低剂量CT伪影抑制方法
崔学英, 王宇航, 刘斌, 上官宏, 张雄
当前状态:  doi: 10.11999/JEIT250489
[摘要](0) [HTML全文](0) [PDF 6440KB](0)
摘要:
低剂量CT(LDCT)图像中的伪影和噪声影响疾病的早期诊断和治疗。基于卷积神经网络的去噪方法在远程建模方面能力有限。与Transformer架构的远程建模方法相比,基于Mamba模型在建模时计算复杂度低,然而现有的Mamba模型存在信息丢失或噪声残留的缺点。为此,该文提出一种基于小波Mamba的去噪模型Wave-MambaCT。首先利用小波变换的多尺度分解解耦噪声和低频内容信息。其次,构建残差模块结合状态空间模型的Mamba模块提取高低频带的局部和全局信息,并用无噪的低频特征通过基于注意力的跨频Mamba模块校正并增强同尺度的高频特征,在去除噪声的同时保持更多细节。最后,分阶段采用逆小波变换渐进恢复图像,并设置相应的损失函数提高网络的稳定性。实验结果表明Wave-MambaCT在较低的计算复杂度和参数量下,不仅提高了低剂量CT图像的视觉效果,而且在PSNR,SSIM,VIF和MSE四种定量指标上均优于现有的去噪方法。
融合代码序列与属性图的源代码漏洞检测方法
杨宏宇, 罗靖川, 成翔, 胡俊成
当前状态:  doi: 10.11999/JEIT250470
[摘要](0) [HTML全文](0) [PDF 1728KB](0)
摘要:
针对现有源代码漏洞检测方法无法充分提取并有效融合代码特征,导致检测模型学习不全面、漏洞检测性能不佳等问题,该文提出一种融合代码序列与属性图的源代码漏洞检测方法。首先,获取代码序列特征表示和代码属性图特征表示。其次,使用预训练模型UniXcoder提取代码语义特征并使用残差门控图卷积网络提取代码图结构特征。然后,构建一种用于特征融合的多模态注意力融合网络,通过学习代码的语义特征与图结构特征之间的交互关系,形成对漏洞检测任务更有价值的融合特征。最后,通过引入插值预测分类器并调整模型关注点,提升模型针对不同特性样本的泛化性并优化漏洞检测性能。多个数据集上的实验结果表明,所提方法具有良好检测效果,准确率可提升0.08%~1.38%,精确率可提升5.19%~8.15%。
带全局噪声增强的多模态超图学习引导用于模态信息缺失情感分析
黄辰, 刘会杰, 张龑, 杨超, 宋建华
当前状态:  doi: 10.11999/JEIT250649
[摘要](8) [HTML全文](4) [PDF 2290KB](1)
摘要:
多模态情感分析(MSA)通过多种模态信息来全面揭示人类情感状态。现有MSA研究在面临现实世界中的复杂场景时,仍然面临两方面的关键挑战:(1)忽略了现实世界复杂场景下的模态信息缺失,以及模型鲁棒性问题。(2)缺乏模态间丰富的高阶语义关联学习和跨模态信息传递机制。为了克服这些问题,该文提出一种带全局噪声增强的多模态超图学习引导情感分析方法(MHLGNE),旨在增强现实世界复杂场景中模态信息缺失条件下的多模态情感分析性能。具体而言,MHLGNE通过专门设计的自适应全局噪声采样模块从全局视角补充缺失的模态信息,从而增强模型的鲁棒性,并提高泛化能力。此外,还提出一个多模态超图学习引导模块来学习模态间丰富的高阶语义关联并引导跨模态信息传递。在公共数据集上的大量实验评估表明,MHLGNE在克服这些挑战方面表现优异。
海上无线通信跨层协同资源分配:QoS感知功率调控与知识增强业务调度
张治霖, 毛忠阳, 陆发平, 潘耀宗, 刘锡国, 康家方, 攸阳, 金音
当前状态:  doi: 10.11999/JEIT250252
[摘要](161) [HTML全文](123) [PDF 7256KB](16)
摘要:
海上无线通信网络面临动态拓扑漂移、大尺度信道衰落与跨层资源竞争等多重挑战,使得传统单层资源分配优化方法难以维持有限网络资源下的高质量通信和多种类业务需求之间的平衡,导致业务服务质量(QoS)下降,业务保障失衡。为此,该文提出跨层协同联合资源分配框架,通过物理层功率控制与网络层业务调度的跨层闭环优化,实现系统吞吐量与QoS保障的均衡提升。首先,从物理层信道容量与传输层传输控制协议(TCP)吞吐量的耦合机理出发,构建跨层无线网络传输模型;其次,在经典注水框架中引入信噪比与QoS双水位调节机制,提出服务质量感知的双阈值注水算法,以可控的吞吐量损失换取高需求业务Qos的提升;进一步,在孪生深度强化学习架构中设计出双通道特征解耦与冲突消解的策略优化滤波器,实现节点-业务动态匹配的在线决策。仿真表明,所提框架在对照实验中使QoS平均评分提升9.51%,关键业务完成量增加1.3%,同时维持系统吞吐量下降幅度不超过10%。
IRS辅助的无人机RSMA系统安全速率最大化算法
王正强, 孔维冬, 万晓榆, 樊自甫, 多滨
当前状态:  doi: 10.11999/JEIT250452
[摘要](13) [HTML全文](6) [PDF 1348KB](1)
摘要:
该文研究了智能反射面(IRS)辅助基于速率分割多址接入(RSMA)技术的无人机(UAV)系统安全传输问题。针对存在多个窃听者的通信场景,提出一种联合优化预编码向量、公共安全速率分配、IRS相移和UAV位置的资源分配方案。针对该非凸优化问题,采用分层优化方法将其分解为内层和外层优化两部分。对于内层优化,给定UAV位置,交替优化预编码向量、公共安全速率分配子问题和IRS相移子问题,通过逐次凸逼近、1阶泰勒展开和半正定松弛等方法将非凸问题转化为凸优化问题求解;外层优化,给定其他优化变量,采用粒子群优化算法实现UAV的位置优化。仿真结果表明,所提算法能够有效提高系统安全速率,并优于现有的基准方案。
HRIS辅助的分层稀疏重构混合远近场源定位算法
杨青青, 蒲雪莱, 彭艺, 李辉, 杨秋萍
当前状态:  doi: 10.11999/JEIT250429
[摘要](10) [HTML全文](6) [PDF 2507KB](2)
摘要:
随着可重构智能超表面(RIS)技术的引入,更大的RIS阵列和更高的工作频率扩大了近场通信区域,而基于RIS的辅助定位技术也受到了极大关注。由于近场定位与传统的远场通信属于异构定位网络,其混合定位依赖于远场与近场通信系统网络融合的定位估计算法实现。因此,该文提出一种融合分层稀疏重构与4阶累积量(FOC)矩阵的混合场定位算法,通过引入混合型RIS(HRIS)架构捕获用户信号,有效解决了多跳信道累积误差的问题。该算法利用3组FOC矩阵,将二维角度谱搜索简化为两个一维谱搜索,分阶段实现仰角、方位角和距离参数的估计。在各阶段参数估计过程中结合分层稀疏字典与动态调谐因子衰减机制,逐层逼近真实参数,以进一步降低算法复杂度。仿真结果表明,在低信噪比与小快拍条件下,该文方法在大多数典型混合场景下,角度与距离估计的均方根误差(RMSE)均优于双阶段多重信号分类(TSMUSIC)算法与混合正交匹配追踪(OMP)算法以及基于全息多输入多输出(HMIMO)系统的混合场定位算法,同时展现出更强的抗噪性能与更低的计算开销,验证了其在复杂混合场场景下的有效性与鲁棒性。
高斯混合-概率假设密度滤波器的最优联邦均值融合
薛昱, 徐磊
当前状态:  doi: 10.11999/JEIT250759
[摘要](11) [HTML全文](5) [PDF 2586KB](2)
摘要:
为实现最优不确定多目标分布式融合跟踪,该文提出一种高斯混合-概率假设密度(GM-PHD)滤波器的联邦均值融合算法,该算法具有分层式结构。每个传感器节点运行1个局域GM-PHD滤波器,从传感器量测中提取多目标状态估计。融合节点负责1个仅预测上一时刻融合结果的主滤波器,对所有滤波器的GM-PHD进行关联与合并,且为各滤波器分配融合结果和若干滤波器参数。关联将多目标密度融合分解为4种单目标估计融合,该文推导了有无漏检时的单目标最优估计融合方法。信息分配利用协方差上界理论消除了滤波器间的相关性,进而使所提算法能够获得与贝叶斯融合相同的精度。仿真结果表明,所提算法能够获得最优的跟踪精度,优于现有的算术平均(AA)融合算法,且可以灵活地调节各滤波器的相对可靠性。
深度学习使能的自动调制分类技术研究进展
郑庆河, 李秉霖, 于治国, 姜蔚蔚, 朱政宇, 许驰, 黄崇文, 桂冠
当前状态:  doi: 10.11999/JEIT250674
[摘要](22) [HTML全文](10) [PDF 3485KB](8)
摘要:
随着第六代无线通信系统向太赫兹频段以及空天地海一体化网络发展,通信环境呈现出高度异构化和超密集化的趋势,对自动调制识别技术提出了亚符号周期级别的精度要求。在复杂信道条件下,自动调制识别技术面临着时变多径信道引起的特征混叠、低信噪比环境下传统方法识别性能衰减以及稀疏码多址技术引发的混合调制信号检测复杂性提升等多重挑战。基于上述技术难题,该文从通信系统的信号传输特性出发,探讨自动调制分类方法设计的关键约束,系统回顾了深度学习使能的自动调制分类技术,综述了不同应用场景下自动调制分类方法面临的挑战,对经典深度学习模型进行了性能评估,最后概述了自动调制分类存在的问题及未来关键研究方向。
多层/多孔材料在特定几何剖分下电磁时域有限差分法的散射分析
张玉贤, 杨子江, 黄志祥, 冯晓丽, 冯乃星, 杨利霞
当前状态:  doi: 10.11999/JEIT250348
[摘要](33) [HTML全文](9) [PDF 9674KB](5)
摘要:
时域有限差分法(FDTD)作为计算介质电磁特性的有效方法,往往受到模型结构及其网格剖分的预处理限制。为了探究多层/多孔材料的电磁散射特性问题,提高电磁仿真的计算效率,该文提出一种基于FDTD的电磁分析加速方案。通过计算几何算法来快速完成复杂材料的Yee网格划分,由三维体素数组定义材料构建分布矩阵与电磁分量的统一排布,针对体素数据的特点实现了非解析几何介质的雷达散射截面的高效计算。现今大多数体网格剖分需要解析公式来描述几何体,该文开创性地将射线求交法与有向距离相结合,并通过切平面与交点计算减少网格生成过程中的无效遍历、降低几何运算复杂度,加速实现多孔非解析几何体的电磁参数网格化定义。该文设计了3种关于多层/多孔材料的时域电磁分析场景,计算了这些场景在不同条件下的雷达散射截面。与主流电磁仿真软件任意复杂电磁场计算(FEldberechnungbei Korpern mit beliebiger Oberflache, FEKO)、计算机仿真技术(Computer Simulation Technology, CST)和高频结构仿真软件(High Frequency Structure Simulator, HFSS)的计算相比,该方法的计算数据呈现出高度的吻合性,表现出了优越的效率。电磁分析加速方案拓展了使用FDTD进行电磁仿真的介质结构及材料类型,在保证计算精度的前提下显著节省了计算时间与内存,为体网格剖分加速和内部结构处理提供了新的研究思绪。
面向低信噪比序列的多模态联合自动调制方式识别方法
王祯, 刘伟, 卢万杰, 牛朝阳, 李润生
当前状态:  doi: 10.11999/JEIT250594
[摘要](38) [HTML全文](9) [PDF 3360KB](5)
摘要:
针对单模态自动调制方式识别方法难以在低信噪比条件下可靠识别结果的问题,该文融合对比学习和Kolmogorov-Arnold表示定理,提出一种面向低信噪比序列的多模态联合两阶段自动调制方式识别方法。第1阶段,构建对比学习模块,利用多模态数据在时间、强度等显著联系,实现时域Token和变换域Token序列的初步显式对齐;第2阶段,设计特征融合模块,利用长短时记忆网络LSTM、卷积神经网络CNN从初步对齐特征中提取时序特性,并利用表征学习增大类间距离,从多角度捕获时域和变换域2种模态特征之间的隐式对齐关系,实现多模态特征融合;最后,通过Kolmogorov-Arnold网络学习边缘权重,得到调制方式识别结果。在经典通信信号调制方式识别数据集RadioML2016.10a, RadioML2016.10b和HisarMod2019.1上的实验结果表明,在–20~0 dB信噪比条件下,该文方法的调制方式识别精度相比于经典的FEA-T, AMC-NET和MCLDNN等方法以相近的参数量提高了2.62%~11.63%。
基于报头特征驱动的加密流量跨维度协同识别框架
王梦寒, 周正春, 吉庆兵
当前状态:  doi: 10.11999/JEIT250434
[摘要](17) [HTML全文](7) [PDF 3920KB](2)
摘要:
在网络通信加密技术广泛应用的背景下,加密流量识别已成为网络安全领域亟待攻克的核心难题。传统基于载荷内容的识别方法,因加密算法的持续升级,面临特征失效的风险,进而在动态网络环境中产生检测盲区。与此同时,报头作为协议交互的关键载体,其结构化特征价值尚未得到充分挖掘。此外,随着加密协议的不断发展,现有的加密流量识别方法还面临特征解释性不足、模型在对抗攻击下鲁棒性薄弱等问题。针对上述挑战,该文提出基于报头特征驱动的加密流量跨维度协同识别框架,分别从网络流量特征选取与识别性能、量化特征贡献度的可解释性评估以及对抗性扰动对模型稳健性影响三个维度进行分析,系统地揭示和证明了报头特征在加密流量识别中占主导作用,突破了传统单视角分析的局限性,革新了传统方法依赖载荷数据的固有认知。该识别框架不仅能分析深度模型的性能边界、评估决策的可信性,而且能通过有效筛选特征剪除冗余,在降低模型复杂度的基础上提升加密场景下的抗干扰能力,进而设计更轻量化、更加稳健的加密流量识别模型。最后,在ISCXVPN2016和ISCXTor2016数据集上的对比实验表明:在识别性能维度,仅基于报头特征的模型F1分数较完整流量模型最高提升6%,较仅基于有载荷特征的模型最高提升61%,验证了报头特征在分类任务中的有效性;在可解释性评估中,通过特征贡献度量化方法发现,报头特征相关性得分的平均占比相较于载荷特征最多高出 89.8%,凸显其在模型决策中的主导性影响;在抗干扰鲁棒性方面,含报头特征的模型在同等带宽扰动下的最大抗干扰性能保持率较纯载荷模型相比,优势显著,最大差距达 98.46%,证实了报头特征对增强模型鲁棒性的关键作用。
ELF-MF对AD小鼠Aβ42沉积及SWM相关神经振荡的影响
耿读艳, 刘澳格, 闫禹新, 郑卫然
当前状态:  doi: 10.11999/JEIT241106
[摘要](18) [HTML全文](9) [PDF 3013KB](4)
摘要:
极低频磁场(ELF-MF)已被证实可以对多种常见疾病产生积极影响,但其对阿尔茨海默病(AD)的影响仍然知之甚少。该文将免疫荧光检测、行为学和电生理学相结合,通过计算完成对象位置任务(OLT)的行为认知指数(CI),探究ELF-MF暴露对小鼠空间工作记忆(SWM)的影响;应用时频分布和相位-幅值耦合分析方法,探究小鼠进行OLT过程中海马CA1区局部场电位信号(LFPs)的theta频段和gamma频段神经振荡的变化规律;进一步通过免疫荧光技术定量分析了小鼠海马区域Aβ42的沉积情况,探究ELF-MF暴露对AD病理标志物的影响。此外,还分析了CI与海马CA1区theta频段和gamma频段神经振荡的时频分布及相位-幅值耦合之间的相关性,旨在探究ELF-MF对认知功能和神经振荡模式的调控机制。结果表明,ELF-MF可以减少AD小鼠海马区Aβ42含量,增强AD模型小鼠的SWM能力,且这种增强与小鼠SWM任务期间海马CA1区theta和gamma频段神经振荡的时频能量以及theta-gamma相位-幅值耦合增强有关。
VCodePPA:面向集成电路物理约束优化的Verilog代码数据集
陈溪源, 姜宇轩, 夏莹杰, 胡冀, 周奕兆
当前状态:  doi: 10.11999/JEIT250449
[摘要](24) [HTML全文](11) [PDF 2439KB](3)
摘要:
Verilog作为主流硬件描述语言之一,其代码质量直接影响电路的功耗、性能和面积(PPA)。当前,基于大语言模型(LLM)生成硬件描述语言的应用面临一个关键挑战:如何引入基于PPA指标的设计反馈机制,以有效指导模型优化,而不仅停留在Verilog语法和功能正确性层面。针对这一问题,该文公开了名为VCodePPA的数据集,该数据集将Verilog代码结构与功耗、性能、面积指标进行了精准关联,共包含17 342条高质量样本数据。该文所做工作为:构建了包含基本算术运算模块、存储架构模块等20种功能分类的3 500条规模的种子数据集;设计了基于蒙特卡罗搜索(MCTS)的多维代码数据增强方案,通过架构层、逻辑层和时序层3个维度的九种变换器对种子数据集进行代码变化,生成大规模功能等同但PPA指标差异显著的Verilog代码集。每条数据均包含如板上资源占用量、关键路径延迟、最大工作频率等多种硬件设计指标,用于训练模型在硬件设计PPA指标的冲突-平衡规律知识。实验表明经此数据集训练后,新模型相比基线模型在各种Verilog设计任务上平均减少了10%~15%的板上资源占用,降低了8%~12%的功耗,并缩短了5%~8%的关键路径延迟。
多涡卷保守混沌系统的构建及在图像加密中的应用
安新磊, 李治甫, 薛睿, 熊丽, 张莉
当前状态:  doi: 10.11999/JEIT250432
[摘要](50) [HTML全文](17) [PDF 11311KB](8)
摘要:
鉴于当前保守混沌系统中多涡卷等复杂动力学行为的研究尚不充分,该文构建了五维保守超混沌系统,通过哈密顿能量函数的调控实现多涡卷保守混沌流的可控生成,进而探究其在图像加密领域的应用。基于哈密顿能量函数的驻点分析,该文揭示了涡卷结构的形成机制:系统运动轨迹沿哈密顿能量等值面演化,增加哈密顿能量函数的驻点可诱导多方向涡卷保守混沌流的形成。复杂度分析结果进一步验证了多涡卷保守混沌系统具有显著提升的谱熵复杂度。基于上述研究,该文设计了一种融合人脸检测技术的图像加密算法,实现针对人脸区域的信息加密。仿真结果表明该算法具备良好的安全性能。
基于人工磁导体结构的一维5G毫米波宽角扫描阵列天线
马战刚, 张卿, 冯思润, 赵鲁豫
当前状态:  doi: 10.11999/JEIT250719
[摘要](79) [HTML全文](41) [PDF 8903KB](7)
摘要:
随着5G毫米波技术的快速发展,对天线的高增益、宽波束覆盖和小尺寸提出了更高要求。该文基于人工磁导体(AMC)结构,设计了一种毫米波频段的具有大角域扫描能力的单极化一维阵列天线。通过利用AMC结构的同相反射特性,天线阵列在提升带宽和增益的同时,实现了显著的宽角扫描能力。天线单元采用单极化设计,通过堆叠式结构优化电流分布,改善了带宽和端口隔离度。阵列以4.6 mm(26 GHz时的0.4波长)间距组阵,加载AMC结构后,阵中天线单元的增益提升至5 dBi,且相邻单元的方形贴片参与辐射,进一步展宽了辐射方向图。仿真结果表明,天线阵列覆盖23.7~28 GHz频段,最大增益达13.8 dBi,在26 GHz时实现了±80°的宽角扫描性能。此外,加工测试验证了设计的可行性,实测结果与仿真吻合良好,隔离度优于\begin{document}$ - $\end{document}15 dB。该文的创新点在于通过AMC结构优化天线单元的辐射特性,结合独特的阵列设计,实现了宽频带、高增益和宽角扫描的平衡,为5G毫米波终端天线的设计提供了新的思路。
显示方式:
2025 年 9 期封面
2025, 47(9).  
[摘要](19) [HTML全文](7) [PDF 2575KB](10)
摘要:
2025 年 9 期目次
2025, 47(9): 1-4.  
[摘要](12) [HTML全文](7) [PDF 283KB](4)
摘要:
卓越领军专栏
天基计算芯片:现状、趋势与关键技术
魏肖彤, 许浩博, 尹春笛, 黄俊培, 孙文昊, 徐文浚, 王颖, 刘垚圻, 孟范涛, 闵丰, 王梦迪, 韩银和
2025, 47(9): 2963-2978.   doi: 10.11999/JEIT250633
[摘要](314) [HTML全文](218) [PDF 2238KB](81)
摘要:
随着航天技术的快速发展,天基计算芯片作为空间信息系统的核心器件,承担着数据处理、任务控制和通信支持等关键功能,其重要性日益凸显。天基计算芯片不仅决定了空间任务的执行效率和可靠性,还在极端环境下为航天器的长期稳定运行提供保障。该文通过回顾天基计算芯片的发展历程,以探讨其未来发展方向。首先按照结构功能划分,从通用处理器(CPU)、现场可编程门阵列(FPGA)和专用芯片3方面对天基计算芯片的发展现状进行归纳和总结;然后深入分析其与地面芯片的主要区别,探讨针对辐射效应等空间环境挑战的关键容错技术,并从不同层面阐述已有的技术方法;最后论述了天基计算芯片未来的主要发展方向,即大算力、商用现货 (COTS)器件广泛应用、第五代精简指令集(RISC-V)架构和芯粒技术。该文能够帮助读者了解该领域现状,掌握关键问题,并为后续的相关研究工作提供有价值的参考和启示。
面向芯粒互连的单端64 Gb/s全双工收发机设计
王知非, 黄之闻, 叶天辰, 叶秉奕, 李芳竹, 王玮, 于敦山, 盖伟新
2025, 47(9): 2979-2993.   doi: 10.11999/JEIT250506
[摘要](267) [HTML全文](135) [PDF 17535KB](32)
摘要:
芯粒集成将多颗不同功能、工艺的芯粒封装在一起,为高性能芯片发展开辟了新的思路。芯粒间互连接口电路作为数据传输的纽带,其带宽密度、误码率和功耗对芯片算力和数据吞吐量等关键性能至关重要。针对带宽密度提升带来的信号反射和串扰等问题,该文提出了一种具备回波、近端串扰和远端串扰消除功能的全双工收发机电路,并基于28 nm工艺进行了流片验证。其利用全双工技术提升了单通道数据速率,利用动态阈值判决技术实现了双向收发信号分离、回波与近端串扰消除,利用信道间容性与感性耦合的平衡实现了远端串扰消除。此外,延时匹配的源同步时钟结构降低了时钟相对数据抖动、提升了噪声容限,驻波与重置信号传输电路实现了发送信号的同步,提高了近端串扰消除精度。测试结果表明,在3 mm长的无屏蔽互连信道上,此收发机可以64 Gb/s的单通道速率、10.5 Tb/(s·mm)的带宽密度,实现低于10–16的误码率,能效为1.21 pJ/b。
芯粒集成芯片架构-封装协同设计
卢美璇, 许浩博, 王颖, 王梦迪, 韩银和
2025, 47(9): 2994-3009.   doi: 10.11999/JEIT250626
[摘要](323) [HTML全文](92) [PDF 5710KB](63)
摘要:
芯粒集成技术凭借封装集成的可扩展性,成为后摩尔时代算力拓展的有效途径。然而,芯粒集成芯片架构与封装的紧密耦合导致复杂的多目标权衡问题,同时体积集成密度的提高加剧了可靠性挑战,仅依靠封装层面设计难以解决,传统架构与封装分离的设计范式失效,架构-封装协同设计成为保障芯粒集成芯片性能与可靠性的必要手段。该工作总结芯粒集成驱动的新兴架构特征,梳理芯粒集成芯片架构与封装的紧密耦合关系,阐明协同设计的必要性;理清架构层与封装层核心设计要素对系统关键指标的影响机制,在此基础上定义架构层和封装层协同界面;最后结合已有工作提出架构-封装协同设计的关键组成和协同方法。
综述评论
随机计算应用与挑战概述
陈璐, 王强源, 钟坤材, 张吉良
2025, 47(9): 3010-3019.   doi: 10.11999/JEIT250413
[摘要](85) [HTML全文](29) [PDF 2060KB](14)
摘要:
随机计算是一种以概率信号替代确定性二进制数值的新型计算范式,其核心在于将确定性数值映射为概率化比特数流,通过统计特性而非精确位权实现算术运算。相较于传统确定性数值计算,随机计算具有低硬件开销、高渐进精度与高容错性等优势,广泛应用于数字信号处理、神经网络加速及边缘计算。然而,该技术的发展面临3大关键挑战:序列长度制约的精度与效率权衡、概率转换电路的开销过高以及随机比特流相关性导致的误差累积。该文系统梳理了随机计算的发展脉络与基本原理,重点聚焦其在低功耗滤波、实时图像处理及容错神经网络中的典型应用与实现机制。同时,深入剖析了应对上述挑战的研究策略,包括随机比特流相关性的度量、抑制与反用技术,概率转换电路硬件开销的优化策略,以及动态渐进精度调节机制的最新进展与局限。该文旨在为研究者清晰呈现随机计算的技术现状、应用潜力及未来突破方向。
处理器硬件漏洞研究综述
蓝泽如, 邱朋飞, 王春露, 赵娅喧, 金宇, 张志昊, 汪东升
2025, 47(9): 3020-3037.   doi: 10.11999/JEIT250357
[摘要](301) [HTML全文](149) [PDF 5519KB](41)
摘要:
处理器安全是计算机安全的基石,然而,最近几年处理器硬件漏洞层出不穷,给计算机安全带来了严重的挑战,已成为一种新兴的安全威胁。该文对处理器硬件漏洞相关的研究进行综述与分析,首先介绍导致处理器硬件漏洞的性能优化技术,然后基于现有工作从漏洞发现、攻击实现和漏洞利用3个角度对硬件漏洞总结建立3步攻击模型和全新的攻击场景模型,并总结提出4种常用的漏洞发现方法。随后,依据硬件漏洞的攻击路径与微架构依赖特征,将现有硬件漏洞进行系统性地分类,并对每一类别进一步细分与详述。此外,在现有Cache侧信道攻击9项评估指标的基础上,该文总结形成针对侧信道类漏洞的8项评估指标,从攻击效果、隐蔽性和适用性等多个维度综合评估其潜在威胁,为漏洞的量化分析与对比研究提供指引。更重要的是,该文在多款来自不同厂商、涵盖多种微架构和代际的处理器平台上,对代表性的漏洞进行了实验验证,系统分析了各类漏洞在不同平台下的攻击效果与行为特征。然后,该文基于漏洞攻击流程中的3个关键步骤,整理了当前已提出的缓解方案的缓解思路,为后续防护机制的设计与优化提供了实证支撑与理论指导。最后,对当前硬件漏洞研究的进展与趋势进行了分析与前瞻性讨论。
处理器数据预取器安全研究综述
刘畅, 黄祺霖, 刘煜川, 林世鸿, 秦中元, 陈立全, 吕勇强
2025, 47(9): 3038-3056.   doi: 10.11999/JEIT250412
[摘要](177) [HTML全文](117) [PDF 4107KB](25)
摘要:
数据预取器是现代处理器用于提高性能的重要微架构组件。然而,由于在设计之初缺乏系统性的安全评估与考量,主流商用处理器中的预取器近年来被揭示出存在严重安全隐患,已被用于针对浏览器、操作系统和可信执行环境的侧信道攻击。面对这类新型微架构攻击,处理器安全研究亟需解决以下关键问题:如何系统性地分析攻击方法,全面认识预取器潜在风险,量化评估预取器安全程度,从而设计更加安全的数据预取器。为解决这些问题,该文系统调研了商用处理器中已知预取器设计及相关侧信道攻击,通过提取内存访问模式,为7种预取器建立行为模型,并基于此为20种侧信道攻击建立攻击模型,系统整理了各类攻击的触发条件和泄露信息,并分析可能存在的其他攻击方法。在此基础上,该文提出1套包含3个维度和24个指标的安全性评估体系,为数据预取器的安全性提供全面量化评估。最后,该文深入探讨了防御策略、安全预取器设计思路及未来研究方向。作为首篇聚焦于商用处理器数据预取器安全问题的综述性文章,该文有助于深入了解数据预取器面临的安全挑战,推动预取器的安全性量化评估体系构建,从而为设计更加安全的数据预取器提供指导。
3D IC封装技术中硅通孔研究进展综述
张芊帆, 何茜, 田雨, 丰光银
2025, 47(9): 3057-3069.   doi: 10.11999/JEIT250377
[摘要](312) [HTML全文](222) [PDF 2226KB](51)
摘要:
三维集成电路(3D IC)以其低延迟和高密度等优势,成为后摩尔时期的重要研究方向之一。其中硅通孔(TSV)作为3D IC中层间互连的关键技术,相关热、电和信号问题已有了广泛的研究。为更好地了解TSV技术的原理及研究现状,该文概述了近年来TSV技术在3D IC设计中的研究进展。首先,针对TSV热问题,综述了3D IC的热建模方法和TSV的热管理策略。其次,针对电源完整性问题,介绍了布局优化、背面供电网络(BPDN)技术等解决方案。之后,针对信号完整性问题,阐述了电磁屏蔽、应用低介电常数材料、新型互连等方法。最后,对TSV目前仍存在的局限性进行了总结,并在此基础上重点展望了多物理场协同优化、纳米级TSV(nTSV)与背面供电网络集成设计、新型材料与TSV阵列以及智能优化方法在未来的发展空间。
专业论文
基于工艺相关建模方法的三维结构快闪存储器残余应力不对称性分析及缓解策略
崔翰文, 高彦泽, 张坤, 王诗兆, 田志强, 郭宇铮, 夏志良, 张召富, 霍宗亮, 刘胜
2025, 47(9): 3070-3080.   doi: 10.11999/JEIT250410
[摘要](302) [HTML全文](204) [PDF 9126KB](40)
摘要:
为进一步提升三维结构快闪存储器(3D NAND)架构的性能表现,行业内涌现出一系列水平与垂直微缩设计思路。这些创新设计方案在突破存储密度瓶颈的同时,也带来了新的集成挑战,其中制造过程中的热机械应力影响尤为突出,制约器件生产的良率及性能表现。该文基于局部代表性体积单元(RVE)有限元过程相关建模框架,针对多层堆叠结构及不同区块(Block)架构设计的技术特点,构建了高精度的3D NAND工艺力学模型。通过系统性研究,深入剖析了3D NAND制造过程中不均匀应力产生的根源,并动态监测了不同微缩方案下机械应力水平及分布规律。研究成果对提高良率和器件可靠性具有重要潜在价值,为提升3D NAND存储密度过程中面临的关键难题提供了有效方案。
RISC-V处理器权限正确性验证与提权漏洞自动挖掘方法
唐时博, 朱嘉诚, 慕德俊, 胡伟
2025, 47(9): 3081-3092.   doi: 10.11999/JEIT250362
[摘要](60) [HTML全文](40) [PDF 2736KB](1)
摘要:
处理器安全是近年来的热点前沿研究领域,各种处理器安全漏洞层出不穷。然而,现有处理器漏洞挖掘主要采取各类测试手段,存在自动化程度低、漏洞挖掘效率和完备性不高等局限性,特别是在权限正确性验证与漏洞挖掘方面。该文提出一种基于符号执行和属性验证的RISC-V处理器权限正确性验证与提权漏洞自动挖掘方法。首先,对于特权级访问控制机制,形式化地定义了访问保护(AP)、异常处理(EH)、指令解码(ID)、寄存器安全(RS)和特权绕过(PB)5类特权提升漏洞类型;该文还提出了属性驱动的状态空间归约、路径引导等策略,有效提升了安全验证效率;设计了一个权限正确性验证与提权漏洞挖掘自动化框架,实现了对处理器设计的软硬件联合安全验证、特权提升漏洞检测和概念验证(PoC)自动生成。在OR1200, Ibex, PicoRV32和PULPino 4款开源处理器上的实验结果表明本文所提方法能够实现权限正确性属性的形式化验证并有效捕捉提权类漏洞,验证效率平均提升66.1%,同时能够自动生成高质量PoC。该文所提方法能够显著提升RISC-V处理器特权提升漏洞的自动化挖掘能力,为处理器设计安全评估提供一种新思路和技术手段。
基于交叉耦合结构的低开销高安全性PUF电路
汪鹏君, 任明泽, 陈博, 胡双
2025, 47(9): 3093-3103.   doi: 10.11999/JEIT250360
[摘要](127) [HTML全文](65) [PDF 4684KB](5)
摘要:
物理不可克隆函数(PUF)作为芯片的唯一身份标识,在资源受限的物联网设备中应用前景广阔,但面临着硬件成本过高和其自身易受攻击而导致安全性不足的问题。该文基于双稳态电路的物理特性,提出一种交叉耦合结构的低开销、高安全性强PUF电路。首先,同时激活多个双稳态单元字线,指数级提升激励响应对数量;然后,利用异或树结构混淆多路PUF,提高PUF均匀性与抗攻击能力;最后,利用Virtuoso软件在TSMC 28 nm工艺下仿真验证,并分析其抗机器学习攻击能力与统计特性。实验结果表明,当机器学习训练集激励响应对数量达104时,逻辑回归、支持向量机、人工神经网络等经典机器学习算法预测率均接近50%的随机猜测,且PUF电路的随机性、唯一性和可靠性等性能均表现良好,硬件开销低于传统仲裁器PUF(APUF),适合应用在低成本的物联网设备认证场景。
铁电基的存算一体组合优化求解器
钱煜, 杨泽禹, 王然然, 蔡嘉豪, 李超, 黄庆荣, 樊凌雁, 李云龙, 卓成, 尹勋钊
2025, 47(9): 3104-3115.   doi: 10.11999/JEIT250369
[摘要](210) [HTML全文](104) [PDF 11485KB](19)
摘要:
组合优化问题在诸多领域应用广泛,大多属于非确定多项式时间难题,基于冯·诺依曼架构的传统数字计算机难以满足其极高计算复杂度的需求。具有阈值电压可编程特性和多端口输入结构的铁电晶体管(FeFET)为高效求解组合优化问题提供了新的机遇。基于FeFET的存算一体架构具有能效高、延时低等特点,同时支持对向量-矩阵及向量-矩阵-向量乘法等复杂算子的加速,非常适合求解组合优化问题。该文回顾了FeFET的器件特性,介绍了组合优化问题的基本求解过程,并进一步探讨了近年来面向等式约束、不等式约束和纳什均衡场景下基于FeFET的存算一体组合优化求解器工作。最后,该文从多个方面分析并展望了基于FeFET的存算一体组合优化求解器的前景与挑战。
应用于边缘端视觉感知系统的低功耗片上缓冲存储器
陈漠, 张静, 王艳蓉, 麦麦提·那扎买提, 乔飞
2025, 47(9): 3116-3125.   doi: 10.11999/JEIT250466
[摘要](103) [HTML全文](49) [PDF 6496KB](10)
摘要:
视觉感知系统通过算法提取信息,但其能效受限于感知过程中数据转换与搬移的功耗开销。采用片上缓存实现边缘端系统中数据的存储与交互,通过减少对冗余信息的传输与搬运过程中的功耗,可有效降低系统的整体功耗。该研究提出了一种面向边缘计算的低功耗片上缓冲存储器(Cache)设计方案。该方案基于静态随机存取存储器(SRAM)单元,根据系统中二值神经网络层间数据量峰值,将缓存容量定制为40.5 kbit,集成在芯片内,专用于存储视觉感知系统的神经网络层间数据。针对传统单体式片上缓存功耗过高的问题,该方案采用分块式存储架构,依据二值神经网络最大池化层输出特征,将缓存阵列划分为8个独立可关断的72×72位子阵列。通过分块存储机制,数据存取过程中的动态功耗得到了有效降低。同时,该文进一步提出动态存储控制策略,利用卷积运算时层间数据量逐层递减的特性,在存取第2层卷积数据时,仅激活必要子阵列,由存储控制模块动态关闭未使用区块,实现功耗深度优化。在TSMC 180 nm CMOS工艺下仿真,结果表明时钟频率在10 MHz时,相较于单一式架构,分块式缓存在存储第1层卷积数据时,读写动态功耗降低64.97%;结合动态存储控制策略后,存储第2层卷积数据时的读写动态功耗进一步降低52.9%。该设计为边缘端视觉感知系统提供了高能效的片上存储解决方案。
面向模块化格基密钥封装机制算法多项式乘法的侧信道安全防护关键技术研究
赵毅强, 孔金笛, 付玉成, 张启智, 叶茂, 夏显召, 宋昕彤, 何家骥
2025, 47(9): 3126-3136.   doi: 10.11999/JEIT250292
[摘要](225) [HTML全文](123) [PDF 3306KB](21)
摘要:
后量子密码算法CRYSTALS-Kyber已被美国国家标准与技术研究院(NIST)标准化为唯一的模块化格基密钥封装机制方案 (ML-KEM),以抵御大规模量子计算机的攻击。虽然后量子密码通过数学理论保证了算法的安全性,但在密码实现运算过程中仍面临侧信道威胁。该文针对当前后量子密码算法硬件实现中存在的侧信道泄露风险,提出一种随机伪轮隐藏防护技术,通过动态插入冗余模运算与线性反馈移位寄存器(LFSR)随机调度机制,破坏多项式逐点乘法(PWM)关键操作的时序特征,从而混淆侧信道信息相关性。为了验证其有效性,在Xilinx Spartan-6 FPGA平台对安全增强前后的Kyber解密模块进行实现,并开展基于选择密文的相关功耗分析(CPA)。实验结果表明,防护前攻击者仅需897~1 650条功耗迹线即可恢复Kyber长期密钥;防护后在10 000条迹线下仍无法成功破解,破解密钥所需迹线数量显著提高。同时,相较现有的Kyber防护实现方案,该文的安全增强设计在面积开销上优于其他的隐藏方案。
基于RISC-V指令扩展的双线性对协处理器设计
于斌, 闵玉新, 张自豪, 刘志伟, 黄海
2025, 47(9): 3137-3145.   doi: 10.11999/JEIT250367
[摘要](218) [HTML全文](70) [PDF 4002KB](27)
摘要:
双线性对运算是基于身份的标识密码算法的核心运算,而在边缘设备中实现该运算需要在性能与面积两方面进行折衷。采用指令扩展方式进行软硬件协同设计是具备灵活性和可扩展性的设计方式,但在双线性对运算方面的研究忽略了数据交互过程的时间损耗。该文结合双线性对算法与软硬件协同设计的特点,提出了适配总线传输的模乘运算模式用于减少数据交互过程中的时间损耗,同时设计适配该模式的模乘单元与阔域运算的时序排布,完成基于国产RISC-V处理器进行素数域运算和扩域运算的自定义指令扩展,并使用C语言调度硬件指令实现软硬件协同设计方案。所设计的协处理器在Xilinx ZYNQ-7000 FPGA平台上实现,共消耗8.3k个Slice与134个数字处理单元 (DSP),素数域模乘的执行时间为0.3 μs,2次扩域模乘的执行时间为0.6 μs,双线性对的执行时间约为17.5 ms。实验结果表明,该文设计的协处理器兼顾性能与面积,与同类设计在性能上相比提升6.7%, 能够高效地实现双线性对运算。
混合开关电容物理不可克隆函数和一次性可编程的片上RSA加密算法私钥生成方法
李大为, 陈铁男, 周瑶, 江小平, 万美琳, 张力, 贺章擎
2025, 47(9): 3146-3154.   doi: 10.11999/JEIT250382
[摘要](157) [HTML全文](82) [PDF 6377KB](19)
摘要:
Rivest-Shamir-Adleman(RSA)加密算法作为一种非对称加密算法,被认为是目前最安全的加密方法之一。传统RSA私钥存在存储开销大、功耗高和易受攻击等问题,针对RSA私钥面临非易失性存储器(NVM)存储依赖及物理探测攻击,该文提出一种新型RSA私钥生成架构,该方案基于SMIC 180 nm 标准CMOS工艺,利用全定制开关电容物理不可克隆函数(SC-PUF)单元产生随机密钥,采用片上1次可编程单元(OTP)将SC-PUF的输出随机密钥直接映射为满足要求的RSA私钥,完全消除NVM依赖。同时SC-PUF提供的容性敏感金属层能够有效保护OTP的编辑状态不被攻击者获取,保证了整个密钥产生电路的安全性。实验结果显示,芯片总体面积为18.77 mm2,功耗218 mW,基于SC-PUF和OTP的RSA私钥产生电路不仅能够有效产生密钥,且整个RSA算法工作正常,验证了该新型RSA私钥生成架构的可行性和安全性。
面向芯粒互连网络的故障与拥塞联合感知自适应路由算法
周武, 倪天明, 徐冬雨, 徐晟, 罗乐, 陈付龙
2025, 47(9): 3155-3166.   doi: 10.11999/JEIT250294
[摘要](193) [HTML全文](100) [PDF 6358KB](28)
摘要:
芯粒技术作为后摩尔时代提升计算性能与实现异构集成的关键途径,其内部互连网络的性能与可靠性直接影响系统整体效能。然而,芯粒互连网络面临链路故障频发与动态网络拥塞并发存在且相互耦合的严峻挑战,难以满足高性能和高可靠芯粒系统的需求。针对此问题,该文提出一种故障与拥塞联合感知自适应路由算法,通过实时感知链路故障状态与网络拥塞程度,创新性地构建了综合评估故障、拥塞及距离因素的联合代价函数,动态地选择最优路径。通过详细的仿真评估,与多种基准算法对比,结果表明:该算法能够显著降低平均包延迟,提高网络饱和吞吐率。尤其在高故障率和非均衡流量等恶劣条件下展现出优越的性能和鲁棒性。基于65 nm工艺的硬件综合与功耗分析显示,该算法体现了良好的性能和成本效益。研究表明,该算法为应对芯粒互连网络中故障与拥塞并发的关键挑战提供了一种有效且实用的解决方案。
面向输出混淆度最优化的逻辑加密线性规划方法
秦蔚蓉, 崔晓通, 程克非
2025, 47(9): 3167-3177.   doi: 10.11999/JEIT250527
[摘要](85) [HTML全文](52) [PDF 3031KB](9)
摘要:
逻辑加密通过向硬件设计中插入密钥驱动的门电路来混淆原始电路,其能够有效预防集成电路中的知识产权窃取和硬件木马等安全问题。逻辑加密方法的安全程度主要在于其结构的安全性和输出混淆度,前者决定了攻击者排除错误密钥或找到正确密钥的效率,而后者决定了攻击者寻找近似密钥方案的可行性。该文研究如何将线性规划应用于逻辑加密,并在此基础上提出一种自增长的密钥选择算法以最优化错误密钥情况下的电路输出混淆度。实验结果验证了线性规划在提升逻辑加密输出混淆度方面的有效性。
面向缓存侧信道攻击防护的快速刷写技术
郑帅, 徐向荣, 肖利民, 刘浩, 谢喜龙, 杨睿, 阮利, 廖晓坚, 刘善峰, 张万才, 王良
2025, 47(9): 3178-3186.   doi: 10.11999/JEIT250471
[摘要](118) [HTML全文](68) [PDF 2562KB](19)
摘要:
缓存作为处理器中缓解主存访问延迟的重要结构,在提升系统性能的同时,其共享性也为攻击者实施侧信道攻击提供了条件。近年来,针对数据缓存的多种侧信道攻击手段相继被提出,严重威胁处理器系统的安全性。为应对此类威胁,各类防护策略也不断涌现。现有基于缓存映射随机化的方案通常伴随较高的硬件开销,不适用于资源受限的一级缓存;而基于缓存刷写的方案则存在效率较低的问题。针对上述问题,该文提出基于快速刷写的缓存侧信道攻击缓解技术,通过在数据缓存中引入生存时间标识,在执行缓存刷写时,有选择地执行缓存写回操作,提高缓存刷写效率。该文基于 (RISC-V)架构处理器对上述防护策略进行了实现,并在FPGA平台上对其硬件开销进行了评估,相较于原始缓存刷写方法可减少70%左右的刷写执行时间,相比于原有数据缓存结构,所带来的额外硬件逻辑开销为8%左右,引入标记位的额外存储开销仅为0.01%左右。
面向商用存算一体架构矩阵乘算子协同优化策略研究
贺煜凯, 谢童欣, 朱振华, 高岚, 李冰
2025, 47(9): 3187-3197.   doi: 10.11999/JEIT250364
[摘要](168) [HTML全文](87) [PDF 2650KB](20)
摘要:
由于近存架构对数据密集型程序加速的潜力,Samsung等公司推出基于高带宽存储器与存内计算(HBM-PIM)的近存芯片用于大模型加速,得益于HBM的高带宽和天然并行特性,近存计算表现出对大模型极佳的加速。该文发现,矩阵规模变化时,HBM-PIM架构的加速性能表现出不稳定性,限制了大模型部署的加速提升。为了释放HBM-PIM的加速潜力,该文深度分析了不同规模算子在HBM-PIM上性能差异的根本原因在于当前HBM-PIM对矩阵乘数据划分、映射和执行的支持不足,进而提出融合动态Bank分配、奇偶Bank交错式地址映射与分片虚拟化计算优化方法,有效提高了资源利用率和计算并行性。评估结果表明,所提方法对不同规模的矩阵计算都取得了1.894~8.225的加速比,相比优化前,性能平均提升了2.7倍。该文所提方案有效增强了PIM体系结构在多尺度任务下的可扩展性与适配能力,为AI算子在存内计算平台上的高效映射与调度提供了有益参考。
基于概率模型的集成电路寄生参数提取算法
陈家瑞, 吴昭怡, 游勇杰, 陈忆鹭, 林智锋
2025, 47(9): 3198-3207.   doi: 10.11999/JEIT250458
[摘要](82) [HTML全文](39) [PDF 2695KB](1)
摘要:
随着特征尺寸的不断缩小,寄生参数提取对于整体电路性能变得越来越重要。为了实现更快的设计收敛,该文提出一种基于概率的寄生参数提取算法,用于全局布线后的时序分析。通过一种新颖的基于网格的数据表示方法,该文开发了一种分区策略,以有效地捕获耦合导线段;然后构建了一个基于概率的平均模型,用于加速导线间距的计算;最后提出一种耦合效应感知的提取方法,以计算出精确的互连寄生参数。该文使用28 nm和7 nm技术节点下的工业电路评估所提出的算法。实验结果表明,所生成的寄生参数与领先的商业工具 Innovus具有强相关性,并且运行时间比Innovus快了21.6%。
融合编码校验特性的高效ORBGRAND译码器设计
雷升, 梁展华, 田静, 周杨灿
2025, 47(9): 3208-3219.   doi: 10.11999/JEIT250501
[摘要](115) [HTML全文](61) [PDF 3140KB](15)
摘要:
有序可靠位猜测随机加性噪声译码(ORBGRAND)凭借其平均时延短和通用性等优点受到广泛关注。然而,目前ORBGRAND算法和硬件实现仍然面临挑战,如最差时延长和吞吐率受限等。为了改善上述问题,该文提出将特殊的编码校验关系融入现有串行和展开架构的ORBGRAND译码器以提升硬件效率。针对串行架构,利用全局奇偶校验比特控制逻辑重量和汉明重量(HW)的迭代过程,跳过部分无效错误模式的生成与校验过程;针对展开架构,根据全局奇偶校验比特将错误模式按照HW奇偶性进行分类存储与测试。采用现有文献中的归一化方法处理后的硬件实现结果表明,所提优化的串行架构译码器吞吐率提升了80.9%,面积效率提升了48.1%;所提优化的展开架构译码器吞吐率提升了584%,面积效率提升了1223%。
针对静态随机存取存储器物理不可克隆功能密钥提取的优化方法研究
姜冬梅, 唐旭升, 李冰, 张清宇, 何卫国
2025, 47(9): 3220-3229.   doi: 10.11999/JEIT250551
[摘要](147) [HTML全文](80) [PDF 2596KB](14)
摘要:
该文提出一种适应于比特筛选的静态随机存取存储器物理不可克隆功能(SRAM PUF)密钥提取新方案,使用SRAM的噪声单元生成密钥,使用SRAM的稳定单元重建PUF。该方案利用噪声单元的高熵特性,提高密钥熵值;基于稳定单元的低误码率优势,构建轻量级编解码体系,该方案的运算复杂度比方案2减少40%,比方案3减少98.9%,比方案4减少99.12%;通过实验数据统计出PUF单元变化率,并推导出PUF单元变化率与密钥重构成功率的关系,该方案密钥重构失败概率极低(1.4876E–9),比方案2和方案3降低4个数量级,比方案5降低1个数量级。最后,实验数据表明1 024字节的SRAM空间可提取128位满熵值密钥。
面向深度神经网络图像压缩的高性能算术编码硬件设计
宋赛, 崔昭, 詹尹僧, 杨进祯, 陆明, 田静
2025, 47(9): 3230-3240.   doi: 10.11999/JEIT250509
[摘要](72) [HTML全文](37) [PDF 3647KB](10)
摘要:
随着深度学习驱动的图像压缩技术迅速发展,面向深度神经网络(DNN)的图像压缩亟需一种高性能熵编码架构,以满足对高速压缩的实际需求。针对传统熵编码在硬件实现中面临的运算延迟与资源开销瓶颈,该文提出并实现了一种基于现场可编程逻辑门阵列(FPGA)的高效Range Asymmetric Numeral Systems (RANS)算术编码架构。在设计优化方面,首先引入硬件友好的除法变乘法策略降低除法与取模运算的延迟;其次结合细粒度量化与精度校准机制,在减少资源消耗的同时保证计算精度;最后,基于交织并行设计思想实现可调多通道高速压缩路径,大幅提升系统吞吐率。该架构部署于Xilinx Kintex-7 XC7K325T FPGA平台,在可控压缩率损失下,实现了高达191.97 MSymbol/s的吞吐性能,与现有最新熵编码硬件方案齐平,同时在资源利用率与系统扩展性方面也展现出显著优势,具备良好的工程应用潜力。
针对KASLR绕过的脆弱性指令挖掘
李周阳, 邱朋飞, 卿昱, 王春露, 汪东升
2025, 47(9): 3241-3251.   doi: 10.11999/JEIT250366
[摘要](125) [HTML全文](81) [PDF 2082KB](13)
摘要:
现代操作系统采用内核地址空间随机化(KASLR)技术来抵御内核代码重用攻击。处理器微架构侧信道能够泄露内核代码段的页表信息,进而可以被用来绕过KASLR保护,但是现有研究局限于MOV, CMASKMOV, PREFETCHNTA和CLDEMOTE等少数的几条指令来探测内核地址,攻击面有限。为系统评估KASLR攻击面,该文从指令多样性出发,设计一个自动化分析框架,挖掘可以绕过KASLR保护并暴露计算机系统安全脆弱性的指令。该框架不需要逆向微架构部件的实现细节,专注于攻击任务本身,首先将攻击流程抽象为环境准备、内存探测、微架构信息记录和差分分析4个阶段,然后定位绕过KASLR保护的关键攻击代码,最后研究不同指令在替换关键代码后的攻击效果。该文分别从指令的汇编形式和字节形式出发提出两套KASLR攻击面的评估算法,互相验证和补充。实验结果表明,该文在Intel x86指令集挖掘出699条可实现KASLR绕过的汇编指令,相比现有研究依赖的6条指令,实现了KASLR脆弱性指令的跨数量级增长。此外,从字节形式出发的实验数据表明,Intel x86指令集有39个单字节操作码、121个双字节操作码和24个3字节操作码指令可以实现KASLR绕过。该文的发现不仅显著扩展了KASLR的攻击面,更为基于特征检测的防御机制带来挑战和新思路。
STT-MRAM绝对差值原位计算驱动的轻量型AdderNet电路设计
王黎勋, 张跃军, 李琪康, 张会红, 温亮
2025, 47(9): 3252-3261.   doi: 10.11999/JEIT250627
[摘要](71) [HTML全文](39) [PDF 12292KB](3)
摘要:
随着人工智能研究的不断深入,卷积神经网络(Convolutional Neural Networks, CNN)在资源受限环境中的部署需求不断上升。然而,受限于冯·诺依曼架构,CNN加速器随着部署模型深度增加,卷积核逐层堆叠所引发的乘累加运算呈现超线性增长趋势。为此,该文提出一种基于自旋转移矩磁性随机存储器(Spin Transfer Torque-Magnetoresistive Random Access Memory, STT-MRAM)的轻量型加法神经网络(AdderNet)加速电路设计方案。该方案首先将L1范数引入存算一体架构,提出STT-MRAM绝对差值原位计算方法,以轻量级加法取代乘累加运算;其次,设计基于磁阻状态映射的可配置全加器,结合稀疏优化策略,跳过零值参与的冗余逻辑判断;最后,进一步构建支持单周期进位链更新的并行全加器阵列,实现高效的卷积核映射与多核L1范数并行计算。实验结果显示,在CIFAR-10数据集上,该加速器实现90.66%的识别准确率,仅较软件模型下降1.18%,同时在133 MHz频率下达到32.31 GOPS的最大吞吐量与494.56 GOPS/W的峰值能效。
极简环形忆阻混沌神经网络的动力学分析与同步控制
赖强, 秦铭宏
2025, 47(9): 3262-3273.   doi: 10.11999/JEIT250212
[摘要](248) [HTML全文](139) [PDF 5839KB](61)
摘要:
忆阻器可作为突触引入人工神经网络,提升神经元间连接的合理性,并丰富网络的类脑化动力学行为。该文基于忆阻器提出了一种仅含单向突触连接的极简环形神经网络的混沌化方法,以三节点神经网络为例构造了一类动力学行为丰富且结构简单的忆阻环形神经网络。基于单参数和双参数分岔图以及Lyapunov指数谱,研究了这类网络关于忆阻器耦合强度与内部参数的丰富动力学演化过程,如倍周期分岔与反倍周期分岔。借助相平面图和吸引盆刻画了网络的丰富多稳态行为,如点吸引子与点吸引子、点吸引子与周期吸引子、点吸引子与混沌吸引子。依赖于忆阻器耦合强度的多变量调幅控制行为也被发现和研究。通过电子电路实验检验了所提出网络的物理存在性。此外,针对所提出网络潜在的应用需求,设计了一种新型多幂次趋近律,用于在固定时间内实现混沌同步。数值仿真结果表明了同步策略的可行性与有效性。
基于混合阶数掩码的门级电路侧信道防护方法
赵毅强, 李政阳, 张启智, 叶茂, 夏显召, 李尧, 何家骥
2025, 47(9): 3274-3285.   doi: 10.11999/JEIT250198
[摘要](260) [HTML全文](119) [PDF 3257KB](45)
摘要:
侧信道分析(SCA)对加密算法的电路实现造成了巨大的威胁。掩码作为硬件防护的常用手段,有效地提高了设计的抗性。但是,在已有的掩码方法中,算法级掩码要求对算法结构的深入了解并且无法保证硬件层面的强化效果;实施在寄存器传输级(RTL)电路的掩码在向硬件电路转换时,由于需要经过逻辑优化,因此难以保持结构,并且难以向高阶发展。实施在门级电路的掩码虽然有其独特的优势,但这类方法要求对泄漏精准地定位并且在部署后容易造成无法控制的开销。此外,单一阶数的掩码方法共有的局限性是,在面对比自身阶数更高的分析方法时往往难以保证防护效果。因此,为解决掩码方案共有局限和实施层级问题,该文提出一种混合阶数掩码方法。该方法针对于门级网表电路设计,融合了不同阶数掩码结构,混淆了传统的单一阶数概念,随机化了敏感变量进而大大提升设计的侧信道分析抗性。同时,该方法保证了更小的硬件开销。为了快速和有效地部署该方案,开发了自动化的掩码框架,集成了电路拓扑分析、泄漏识别和掩码防护。最终,通过模拟仿真方法,评估经过掩码的加密电路门级设计。实验结果表明,该方法实现了1 600倍以上的抗性提升,仅仅造成1.2%的额外面积开销。
MOS管选通的硅通孔键合前测试
窦贤锐, 梁华国, 黄正峰, 鲁迎春, 陈田, 刘军
2025, 47(9): 3286-3291.   doi: 10.11999/JEIT250285
[摘要](116) [HTML全文](82) [PDF 2313KB](5)
摘要:
在集成芯片的制造过程中,硅通孔(TSV)中可能会出现许多缺陷,这些缺陷会影响通过硅通孔信号的完整性,因此在早期生产阶段检测这些缺陷至关重要。现有的测试方法存在测试面积和时间开销大、测试精度低的问题。该文选择N型金属氧化物半导体场效应管(NMOS)和P型金属氧化物半导体场效应管(PMOS)作为选通门,以减小共享测试的面积开销;采用两级电压比较器放大测试TSV和参考电容的电压差,可以检测大于等于50 Ω的电阻性开路缺陷和小于等于9 MΩ的泄漏缺陷。 与其他方案对比,该方案具有电阻性开路缺陷检测精度高、最小的测试面积和时间开销的优点。
基于自检测修复的比特配置物理不可克隆函数电路设计
徐梦凡, 张跃军, 刘天翔, 潘钰
2025, 47(9): 3292-3302.   doi: 10.11999/JEIT250359
[摘要](183) [HTML全文](110) [PDF 7274KB](16)
摘要:
物理不可克隆函数(PUF)作为硬件安全原语,为资源受限的物联网设备提供低成本的密钥生成与设备身份认证。然而,PUF电路的可靠性问题已经成为大规模部署的瓶颈。为此,该文提出一种基于自检测修复的比特配置高可靠PUF电路方案。该方案首先研究电桥失衡效应和亚阈值电流特性,利用亚阈值指数级电流特性放大随机工艺偏差,提升输出熵源随机性。其次,构建可配置位单元拓扑结构,结合比特配置策略,在不增加额外硬件开销的情况下,可灵活切换电桥PUF与分压PUF模式。最后,提出一种自检测与修复机制以提升PUF电路的可靠性,并结合掩蔽操作进一步降低误码率(BER)。在TSMC 28 nm工艺下实现64×64位PUF电路设计,全定制版图面积为3283.3 μm2。实验结果表明,电桥PUF和分压PUF唯一性和自相关性分别为50.03%/50.08%和0.027 3/0.027 7,且通过NIST800-22随机性测试。此外,在0 °C~80 °C的温度范围和0.81~0.99 V的电压范围内,对29%的不稳定位进行修复或掩蔽处理,最终误码率为1.62E–9。
集成JFET续流二极管的低开关损耗双沟槽SiC MOSFET
高升, 章先锋, 陈秋锐, 陈伟中, 张红升
2025, 47(9): 3303-3311.   doi: 10.11999/JEIT250237
[摘要](178) [HTML全文](105) [PDF 10380KB](19)
摘要:
传统双沟槽碳化硅金属氧化物半导体场效应晶体管(SiC MOSFET)在高频开关电路和反向续流应用中显现出显著的性能瓶颈,主要表现为开关损耗较高、反向导通电压偏大、反向恢复电荷过多,以及长时间反向续流易引发双极退化等问题。为突破这些技术限制,该文采用TCAD仿真技术,基于PN结空间电荷区内能带弯曲的物理机制,设计一种集成结型场效应晶体管(JFET)的双沟槽SiC MOSFET (IJ-MOS)。与传统SiC MOSFET (CON-MOS)相比,IJ-MOS在性能上取得了显著提升:其反向导通电压从CON-MOS的2.92 V降至1.83 V,反向恢复电荷减少43.7%,反向恢复峰值电流下降31.7%,总开关损耗削减24.2%。此外,IJ-MOS通过有效抑制反向续流时体二极管的激活,显著降低了双极退化的发生概率,从而增强了器件的长期可靠性。这一新型设计使IJ-MOS成为高频开关电路和反向续流应用中更为优越的解决方案。
融合CNN-LSTM的硬件木马旁路检测方法
周康, 侯波, 王力纬, 雷登云, 罗永震, 黄中铠
2025, 47(9): 3312-3320.   doi: 10.11999/JEIT250241
[摘要](141) [HTML全文](93) [PDF 1947KB](14)
摘要:
随着集成电路设计与制造全球化,通过供应链植入硬件木马的潜在威胁日益显著。传统旁路检测方法依赖人工特征提取,易受噪声干扰且泛化能力不足,导致检测耗时且准确率不高。为此,该文提出一种基于一维卷积神经网络(CNN)及其与长短期记忆网络(LSTM)的组合架构(1D-CNN-LSTM)的硬件木马旁路检测方法,分别从局部空间特征与时序依赖关系两方面捕获硬件木马动态功耗信号特征,构建算法模型进行硬件木马检测。另外为了提高检测效率和算法鲁棒性,该文结合硬件木马特征对瞬态功耗原始数据进行预处理,并引入高斯噪声进行样本增强。以流片后的ASIC芯片为对象,开展硬件木马检测实验,结果显示经数据预处理后,1D-CNN-LSTM模型的训练效率提升近10倍,算法在4分类任务中的整体检测精度达到99.6%。该文所提出的方法可有效降低计算资源消耗、消除噪声干扰并实现高精度检测。
可重构铁电数据选择器设计及在映射中的应用
吴乾火, 王伦耀, 查晓婧, 储著飞, 夏银水
2025, 47(9): 3321-3332.   doi: 10.11999/JEIT250263
[摘要](321) [HTML全文](81) [PDF 3109KB](48)
摘要:
目前以铁电晶体管(FeFET)为基础的存算一体逻辑电路的映射以阵列为主,该文提出一种以铁电晶体管-数据选择器(FeFET-MUX)为基本电路单元存算一体逻辑电路的实现方法。该方法主要包含两方面内容:(1) 提出一种可重构的FeFET-MUX电路,该电路具有结构共享和数据输入端可扩展的特点。(2) 提出适合该FeFET-MUX映射的逻辑函数分割方法,通过将待实现的逻辑函数表示成二元决策图(BDD),然后将BDD分割成适合FeFET-MUX映射的子BDD集合,最后完成逻辑函数用FeFET-MUX的映射。该文所提FeFET-MUX电路的逻辑功能用已有的FeFET模型进行仿真验证,用于映射的BDD分割算法用C++实现。实验结果表明,相比于传统的非结构共享二选一FeFET-MUX电路的映射结果,采用所提结构共享FeFET-MUX电路结合BDD分割算法,FeFET的使用数量平均可以减少79.9%。
ARIA算法量子电路最新实现及抗量子安全性分析
李灵琛, 李沛, 莫申勇, 韦永壮, 叶涛
2025, 47(9): 3333-3345.   doi: 10.11999/JEIT250440
[摘要](138) [HTML全文](67) [PDF 5127KB](14)
摘要:
随着量子计算的兴起与飞速发展, 它以其独特的并行计算能力和叠加特性冲击着传统密码算法的安全性。评估经典密码算法在量子计算环境下的抗量子攻击能力并设计出相应改进策略,已成为当前密码学领域的研究热点。该文以韩国分组密码算法标准ARIA为研究对象,基于塔域分解完成ARIA算法4种S盒的量子电路设计,所设计的S盒量子电路在NCT门集下仅需21个量子比特,是现有需要量子比特数最少的ARIA算法S盒量子电路实现方案。针对线性层,该文设计出深度为15的量子电路新方案,相较已有方案在深度方面优化11.7%,为目前该组件最优in-place量子实现。该文通过Grover密钥搜索攻击模型对ARIA系列算法进行了抗量子攻击安全性评估。结果表明,ARIA系列算法在新方案下的实现效率均有提升,ARIA-128/192/256在电路总深度\begin{document}$ \times $\end{document}总门数(\begin{document}$ D \times G $\end{document})和T门深度×电路宽度(\begin{document}$ {\mathrm{Td}} \times M $\end{document})指标上分别优化21.8/12.8/4.5%和11.7/6.6/16.4%。特别地,ARIA-192的抗量子攻击安全性指标甚至已低于NIST的抗量子安全等级3,存在被量子攻击攻破的风险。
集成肖特基二极管的分裂栅碳化硅(SiC)MOSFET器件
马超, 陈伟中, 张波
2025, 47(9): 3346-3352.   doi: 10.11999/JEIT250180
[摘要](316) [HTML全文](303) [PDF 4692KB](57)
摘要:
该文提出一种集成肖特基二极管结构的新型分裂栅碳化硅MOSFET器件,有效改善传统DT-MOS器件的反向恢复与开关特性。该新型结构首先采用元胞内集成肖特基二极管技术替代传统DT-MOS的右侧沟道,其次采用分裂栅极集成技术代替传统槽栅设计,将栅极分成了栅极G和源极S两个部分,中间由二氧化硅进行介质隔离。其作用包括:集成肖特基二极管抑制体二极管导通并消除双极退化效应;集成分裂栅与源极短接,减小栅漏耦合面积来降低反馈电容与栅电荷,且在接入高电位时形成电子积累层以提高电子密度。其结果显示:反向导通状态下,电流将从肖特基二极管流出,连接源极的分裂栅极将提升电子浓度从而提高电流密度;动态开关状态下,分裂栅结构通过屏蔽设计减小了栅极与漏极的耦合面积,有效降低了米勒平台电荷QGD并改善了开关性能。
面向实时电力系统仿真的可扩展中央处理器-现场可编程门阵列异构集群
杨航宇, 汤勇明, 刘济源, 曹阳, 邹德虎, 许明旺, 袁晓冬, 韩华春, 顾伟, 李鹤
2025, 47(9): 3353-3362.   doi: 10.11999/JEIT250355
[摘要](1030) [HTML全文](168) [PDF 4773KB](29)
摘要:
高频开关器件的大量接入,以及可再生能源与电压源型变流器(VSCs)的深度融合,使电力系统仿真面临微秒级暂态分析和亚微秒步长仿真的挑战。现有仿真器在应对包含数百个电力电子开关的系统时,普遍存在计算扩展性不足、通信延迟偏高的问题。为此,该文提出一种面向实时电力系统仿真的中央处理器-现场可编程门阵列(CPU-FPGA)异构集群架构,能够在1 μs步长下完成对480个开关器件构成的新能源系统的实时仿真。该系统主要包含3项核心创新:(1)提出基于时间步长解耦的计算负载感知调度策略,实现4片FPGA的并行计算调度;(2)结合混合精度量化与矩阵-向量重组技术,相较传统定点方法,在400 ns计算窗口内实现资源占用大幅下降,查找表(LUT)、触发器(FF)与数字信号处理单元(DSP)分别降低32.0%, 24.3%与43.8%;(3)基于数据平面开发工具包(DPDK)设计零拷贝通信机制,实现29 μs的端到端通信延迟。实验验证表明,该系统验证了异构集群架构在大规模高频电力系统仿真中的有效性,并具备良好的扩展性与工程应用潜力。
利用循环预测执行机制实现新型瞬态执行攻击
郭佳益, 邱朋飞, 苑洁, 蓝泽如, 王春露, 张吉良, 汪东升
2025, 47(9): 3363-3373.   doi: 10.11999/JEIT250361
[摘要](349) [HTML全文](133) [PDF 3192KB](49)
摘要:
现代处理器广泛采用的分支预测技术虽然提升了指令流水线效率,但其推测执行机制产生的瞬态执行窗口已成为攻击的突破口。该文对现代处理器的分支预测技术进行了详细的分析,并对X86指令集中的指令进行了瞬态窗口的测量,发现X86架构中基于RCX寄存器值进行分支预测的循环指令(LOOP, LOOPZ和LOOPNZ)以及JRCXZ指令能够导致潜在的瞬态执行攻击。基于此,该文构建了一种新型瞬态攻击原语,成功实现了4类攻击场景:(1)跨用户态/内核态边界实现数据泄露;(2)突破同步多线程(SMT)隔离构建隐蔽信道;(3)穿透Intel SGX安全区进行私密数据窃取;(4)推测内核地址空间布局随机化(KASLR)防护机制的内核基址。该文提出的攻击方法在真实处理器环境中得到验证,其攻击成功率较传统JCC指令实现方案平均提升90%。
一种基于BRAM分段同步查表的测试向量编解码方案
易茂祥, 张佳桐, 鲁迎春, 梁华国, 马利祥
2025, 47(9): 3374-3384.   doi: 10.11999/JEIT250053
[摘要](136) [HTML全文](85) [PDF 8467KB](5)
摘要:
基于ATE的集成电路制造测试是芯片产业链的重要一环,而逻辑测试向量的编解码及应用效率,对芯片的测试成本有着重要影响。因此,结合现代FPGA内集成高速BRAM的特点,该文提出一种基于分量统计的测试向量编码方案,用于将被测芯片的全部测试向量生成分量编码表文件。与此同时,设计了一种BRAM分段同步查表控制电路,采用并行单端口BRAM结构多段地址分配模块和写优先访问时序模式,实现测试向量各分量的同步查表和并行输出。该文采用Vivado与Xilinx K7 FPGA开发平台,对查表电路进行了设计和仿真。配置了宽度64 bit和定制分段地址深度的BRAM,结合数据传输和存储地址产生控制逻辑,利用UART接口将分量编码表COE文件下载到目标BRAM中,并取得分量在BRAM中的地址,将其应用于BRAM分段同步查表电路。仿真结果充分验证了同步查表电路功能的正确性。将建议方案用于工程ATE测试板的设计,可以有效提高ATE逻辑测试指令的执行效率。
粒子群约束下的多胞空间滤波及其在锂电池SOC估计中的应用
霍雷霆, 王子赟, 王艳
2025, 47(9): 3385-3394.   doi: 10.11999/JEIT250437
[摘要](81) [HTML全文](77) [PDF 3983KB](8)
摘要:
荷电状态是衡量锂离子电池剩余电量的关键指标,其准确估计对电池管理系统至关重要。该文提出了一种粒子群约束下的多胞空间滤波算法,用于解决系统存在未知但有界噪声时的状态估计问题。该算法能够准确检测并重新映射异常粒子,从而确保搜索过程的稳定性。通过采用法向量缩放的方法调整超平面位置,将粒子群限制在多胞搜索空间区域内,以优化状态估计的效率。该粒子群优化算法具备良好的适应性,能够有效减少估计冗余并增强鲁棒性,尤其适用于高维系统。将该算法应用于锂离子电池荷电状态分析的实验结果表明,该算法能够对锂离子电池荷电状态变化情况进行有效估计。
编辑部公告
more >
学术动态
more >
作者服务中心
融媒体平台
more >
友情链接
more >

官方微信,欢迎关注

电子与信息学报

微信学术论坛群