硅中铜的深能级研究
DEEP LEVELS RELATED TO COPPER IN SILICON
-
摘要: 本文用DLTS法测量了直拉硅和区熔硅中与铜有关的深能级及其俘获截面,测量了其中部分能级的空间分布,研究了区熔硅中与铜有关深能级的退火特性。结果表明在硅中与铜有关的深能级中不存在文献报道过的代位铜的三个受主态或一个施工和三个受主态,其中的多数能级是铜和晶格缺陷的络合物。
-
关键词:
Abstract: The energy positions and carrier capture cross-sections of the deep levels related to copper in silicon are measured by DLTS. The annealing behaviour and spatial distributions of some of these levels are studied at the same time. The results show that there are not any triple acceptor or quadruple state corresponding to substimtional copper in silicon, which have been reported in the literature. Most of the deep levels related to copper in silicon are corresponding to complexes of copper and defects in silicon. -
1. 引言
2019年9月,芬兰奥卢大学6G旗舰研究计划组发布了全球首个6G白皮书,该白皮书认为6G的大多数性能指标相比5G将提升10~100倍。其中通信时延可低至0.1 ms,将是5G的1/10,并且具有超高可靠性[1]。这些需求对移动通信中的信道编解码的延迟特性和译码性能提出了更高的要求。极化码是第1种被证明在二进制离散无记忆信道下能够达到信道容量的纠错码[2],具有较高的可靠度和实用价值,已经成为5G控制信道的编码方案,并有望成为6G通信中主要的信道编码方案。在极化码的译码算法方面,串行抵消(Successive Cancellation, SC)算法[3,4]和串行抵消列表(Successive Cancellation List, SCL)[5]作为极化码的低复杂度译码方案,具有较高的可靠性,但在译码时均需遍历译码二叉树的每个节点,导致译码延迟较高。与SC, SCL算法不同,置信度传播算法(Belief Propagation, BP)是一种并行迭代的译码算法,可获得较低的译码延迟。然而,大量的迭代次数仍造成BP较高的计算复杂度。由于大部分BP译码器在到达最大迭代次数之前已经收敛于原始码字,因此需要引入迭代早期迭代停止准则提前判断。为了减少迭代冗余,Yuan等人[6]提出了G矩阵(G-matrix)和最小对数似然比 (minimum Log Likelihood Ratio, minLLR)两个准则。其中,G-Matrix包含
NlogN 次二进制操作,而minLLR需要进行大量的比较运算。Yan等人[7]提出一种基于局部固定比特的早期停止准则,将固定位作为提前停止的准则。为降低资源消耗,文献[8]提出一种有效节省资源消耗的提前迭代终止准则,与基于阈值的算法相比,该准则可降低资源消耗且不会造成译码性能损失。Ren等人[9]提出了LLR辅助(LLR-Magnitude Aided, LMA)和循环冗余校验辅助(CRC Aided, CA)两种早期停止准则,当信噪比为4 dB、最大迭代次数为30时,LMA和CA分别能减少72.6%和84.5%的迭代次数。此外,Simsek等人[10]提出一种基于最坏信息位(Worst of Information Bits, WIB)的早期停止准则,它只需检测一部分LLR的符号位,可使译码复杂度有所降低,但译码性能低于G-Matrix。Simsek等人[11]通过去除冗余加法器阵列对WIB进行了优化。另外,Albayrak等人[12]提出了一种基于Luby变换的提前停止准则,通过观察译码器中LLR信息的符号位变化,确定译码输出是否收敛到原始序列。文献[13]于2017年提出了一种检测冻结位误码率(Frozen Bit Error Rates, FBER)的早期停止准则,该准则只检测在最可靠的冻结子信道中传输的冻结位。受到早期停止准则的启发,Giard等人[14]提出了基于极化码BP译码算法的盲检测法。上述准则都取决于ˆu 或与ˆu 对应的对数似然比(Log Likelihood Ratio, LLR)。本文研究了信息序列估值(
ˆu )与码字估值(ˆx )之间的关系,当ˆu 和ˆx 满足编码算法施加的约束时,可获得有效的码字估值。当ˆx 收敛到有效估值时,ˆu 亦收敛到有效估值。基于这一思想,本文提出了一种新的早期停止准则,该方案只监测ˆx 的收敛性。同时,借助高斯近似(Gaussian Approximation, GA)[15]分析了ˆx 中每位比特的出错概率,发现一些出错概率较低的ˆx 需要较少的迭代次数。因此,该准则构造了一个由ˆx 中出错概率较低的部分构成的比较空间。由于只检测ˆx 中一部分比特的收敛性,所提出的准则进一步节省了硬件资源消耗。另外,由于译码器的最终输出是ˆu ,如果早期停止准则取决于ˆu ,那么它只能在获得ˆu 后开始执行,将导致额外的计算复杂性和延迟。所提出的方案只取决于ˆx ,可避免这种情况。仿真结果表明,所提算法在不损失译码性能的情况下,可有效降低计算复杂度并减少译码的平均迭代次数。2. 基本理论
2.1 极化码
极化码可定义为{N, K, A, AC},其中N=2n, K, A, AC分别表示码长、信息位个数、信息位集合和冻结位集合。信息
u 由K个信息位和(N-K)个冻结位组成,与生成矩阵G相乘获得码字x 。其中G=B⋅F⊗n ,B 是位置换矩阵,F⊗n 表示F=[1011] 的n次克罗内克积。2.2 BP译码算法
一个 (N, K)极化码可用一个
n 阶因子图来表示,它在每阶都有N/2个处理单元(Processing Element, PE),整个因子图包含 (n+1)N个节点。图1为(8, 4)极化码的因子图。BP算法的每次迭代过程由一个右向信息更新和一个左向信息更新组成。令Lti,j 和Rti,j 分别表示节点(i, j)在第t次迭代中自右向左和自左向右传播的信息,其中i是位索引,j是阶数索引。BP译码器中的节点更新如式(1)所示Lti,j={f(Rti+N/2,j+Lt2i,j+1,Lt2i−1,j+1)}Lti+N/2,j={f(Rti+N/2,j+Lt2i,j+1)+Lt2i,j+1}Rt2i−1,j+1={f(Lt−12i,j+1+Rti+N/2,j,Rti,j)}Rt2i,j+1={f(Lt−12i−1,j+1,Rti,j)+Rti+N/2,j}} (1) 其中
f(x,y)≈α∗sign(x)sign(y)min(|x|,|y|) (2) 式(2)中α是伸缩因子。在右向更新信息期间,按照
j=2,3,···,n+1 ,Rti,j 进行串行更新。在n+1 列的Rti,j+1 更新之后进行左向更新,Lti,j 按照j=n,n−1,···,1 进行串行更新。当BP译码器达到最大迭代次数Imax 时,第i 个信息位的估值可通过式(3)得到ˆui=sign(LImaxi,1),i∈A (3) 3. 提出的早期迭代停止准则
3.1 X-tolerance早期迭代停止准则
BP算法的迭代过程可用极化码的因子图来表示。因子图中的每一个节点都与编码过程中的节点相对应,由于因子图节点中包含相应节点的LLR,则对因子图节点中的LLR进行硬判决即可得到相应的编码过程的中间估计值。对最左侧列节点中的LLR进行硬判决可得
ui 的估值ˆui ,类似地对最右侧即因子图中第n+1列节点中的LLR进行判决可得到xi 的估值ˆxi 。设Rti,n+1=ln(P(ˆxi=0)/P(ˆxi=1) ,ˆxi 代表码字估值中的第i位。因此,ˆxi 定义为ˆxi=si,n+1=sign(Rti,n+1) (4) ˆx={ˆx1,ˆx2,···,ˆxN}=(s1,n+1,s2,n+1,···,sN,n+1) (5) 对于任何极化码,
x=u⋅G ,如果ˆx 和ˆu 是有效的估值,则必须满足式(6)ˆx=ˆu⋅G (6) 基于该推论,
ˆx=ˆu⋅G 可被用于在迭代过程中检测ˆx 与ˆu 是否为有效的估值。G-Matrix早期停止准则根据极化码编码中信息序列u 和码字x 之间的关系,在译码迭代中通过判断是否满足式(6)来决定是否提前停止译码迭代,因此每一次判断都相当于进行一次极化码编码。本文对G-Matrix做了进一步分析,依据式(6),发现译码中信息序列估值ˆu 和码字估值ˆx 存在下列3种类型:类型1,ˆx 和ˆu 满足式(6),ˆx 和ˆu 均为有效估值;类型2,ˆx 和ˆu 满足式(6),ˆx 和ˆu 均为有效估值,但ˆu 并不是发送端所传输的信息序列;类型3:迭代次数达到最大迭代次数时依旧不满足式(6)。对于类型2,
ˆx 和ˆu 在迭代过程中满足这种约束,即ˆx 的确是ˆu 经过极化编码后的码字,但ˆuN1≠uN1 ,即该信息序列并不是发送端所发送的信息。该类型情况在译码过程中极少发生,可忽略。类型3属于提前终止准则无法处理的情况,该类型会在迭代次数到达预设的最大迭代次数后停止。由以上分析可知,有效处理类型1是本文研究的重点。对于类型1,为了满足式(6),
ˆx 和ˆu 需要同时为有效的估值。令Tu 表示ˆu 收敛所需的最小迭代次数,Tx 表示ˆx 收敛所需的最小迭代次数,则类型1中迭代终止所需迭代次数由Tu 和Tx 中的较大值决定。令
Td 表示译码成功所需的最小迭代次数。通过仿真得到Td ,Tu 和Tx 之间的大小关系。图2展示了Tu−Td>0 和Tx−Tu>0 的比例,灰色部分为Tu−Td=0 的比例。从图2中可看到Tx 是Tu 和Tx 之间较大的那个。因此,对于类型1,迭代终止准则可简化为判断ˆx 是否收敛。如图3所示,当Eb/N0=2.5dB 时,随着迭代次数的增加,ˆx 中的符号改变个数和ˆu 中的错误估值位数均迅速下降。当ˆu 中的错误估值位数下降到0,得到一个有效估值。在BP译码过程中,如果
ˆx 连续几次迭代保持不变,则认定ˆx 已经收敛。因此,本文提出了一种新的停止准则,称之为X-tolerance。当ˆx 在连续X次迭代中保持不变时停止迭代。X-tolerance检测规则如式(7)所示。该准则不同于G-Matrix,它只依赖码字估计值ˆx ,无须每次迭代均对ˆu 进行重新编码,因此减少了计算复杂度t∑t−X+1N∑i=1ˆxti⊕ˆxt−1i=0 (7) 3.2 比较空间的构造
在式(7)中,X-tolerance在一次迭代中需要N个异或(XOR)操作,为了进一步减小计算复杂度,本文定义了一个集合
S⊆{1,2,···,N} ,称为比较空间,是由ˆx 中部分比特的索引构成的集合。设P(ˆxi≠xi) 是当t=Imax 时的ˆxi 的出错概率。对于BP译码器,具有较低P(ˆxi≠xi) 的ˆxN1 需要较少的译码迭代。利用这一思想,根据P(ˆxi≠xi) 构造了比较空间。对于n=3,极化码的Tanner图如图4所示。圆圈表示变量节点,方块表示校验节点。变量节点中的信息用LLR表示。设
ai,j 表示节点v(i,j) 的LLR的概率密度函数(Probability Density Function, PDF)。假设传输全零码字,基于密度进化理论[11],采用式(8)和式(9)递归地计算ai,j a2i−1,j=ai,j+1⊙ai+2j+1,j+1,a2i,j=ai,j+1⊗ai+2j+1,j+1 (8) ai,n+1=aw (9) 其中,
⊙ 和⊗ 分别是变量节点和校验节点的卷积操作。aw 是信道W接收到的LLR的概率密度函数。对于BP译码,设rti,j 和lti,j 表示v(i,j) 中Rti,j 和Lti,j 的概率密度函数。根据式(1)和密度进化理论,rti,j 和lti,j 可通过式(10)计算rti,j+1={rt2i−1,j⊙(rt2i,j⊗lt−1i+2j+1,j+1)}rti+2j+1,j+1={(rt2i−1,j⊗lt−1i,j+1)⊙rt2i,j}lt2i−1,j={lti,j+1⊙(lti+2j+1,j+1⊗rt2i,j)}lt2i,j={(lti,j+1⊗rt2i−1,j)⊙lti+2j+1,j+1}} (10) 根据BP算法的初始化可得,
rti,1 满足0∫−∞rti,1dz={0.5,i∈A0, i∉A,lti,n+1=aw (11) 可用GA简化计算,
rti,j 和lti,j 分别表示为N(mr,ti,j,2mr,ti,j) 和N(ml,ti,j,2ml,ti,j) [13]。因此,式(10)和式(11)可近似为mr,ti,j+1={φ−1(1−[1−φ(mr,t2i−1,j)] ⋅[1−φ(mr,t2i,j+ml,t−1i+2j+1,j+1)])},mr,ti+2j+1,j+1={φ−1(1−[1−φ(mr,t2i−1,j)]⋅[1−φ(ml,t−1i,j+1)])+mr,t2i,j},ml,t2i−1,j={φ−1(1−[1−φ(ml,ti,j+1)] ⋅[1−φ(ml,t2i,j+mr,ti+2j+1,j+1)])},ml,t2i,j={φ−1(1−[1−φ(ml,t2i−1,j)] ⋅[1−φ(ml,ti,j+1)])+ml,ti+2j+1,j+1} (12) mr,ti,1={0, i∈A+∞,i∉A (13) ml,ti,n+1=2/σ2 (14) 在得到
ml,Imaxi,n+1 后,ˆxi 的错误概率通过式(15)计算P(ˆxi≠xi)=0∫−∞12√πati,n+1⋅exp(−(x−ml,Imaxi,n+1)24ml,Imaxi,n+1)dx (15) 式(15)可简化为[16]
P(ˆxi≠xi)=[1−(1−exp(−(ml,Imaxi,n+1/2)/1.6058))1/2]/2 (16) 对于X-tolerance,当采用比较空间缩小检测范围时,错误率会增加。然而,当增加X来弥补性能损失时,又增加了平均迭代次数。因此,为尽可能降低平均迭代次数,S由
{P(ˆxi≠xi)|i=1,2,···,N} 中Q个最小值的索引构成。当式(17)满足时,X-tolerance停止迭代译码,在算法1中给出了具体的BP译码过程算法1 (N, K) X-tolerance BP译码器 (1) 输入: (2) 信道输出:LLR(ri) (3) 冻结位集合:AC (4) 比较空间:S (5) 初始化: (6) 设定Imax和X (7) For 每个节点的传播信息Lti,j和Rti,j (8) if (j==1) & (i∈AC) Rti,1=∞对于t=0, 1,···, Imax (9) else if (j==1+n) Lti,n+1=LLR(ri)对于t=0, 1,···,
Imax x(10) else L0i,j=R0i,j=0 (11) 迭代过程: (12) While t<Imax do (13) 根据(1)更新每个节点的Lti,j and Rti,j (14) 更新 ˆxN1 (15) if Rti,n+1>0 then ˆxi=0 (16) else ˆxi=1 (17) end while (18) 提前停止准则: (19) if (17) 成立 then (20) 迭代终止 (21) else t=t+1 (22) 输出:ˆuN1=(ˆu1,ˆu2,···,ˆuN) t∑t−X+1∑i∈Sˆxti⊕ˆxt−1i=0 (17) 4. 性能分析
采用二进制相移键控(Binary Phase Shift Keying, BPSK)调制,在二进制加性高斯白噪声(Binary-Input Additive White Gaussian Noise, BI-AWGN)信道下,对(1024, 512)极化码进行BP算法仿真,其中
α=0.9375 ,最大迭代次数设置为40次。4.1 译码性能分析
如图5所示,当Q=128, X=2时,所提出的准则在误帧率和误码率上与40次固定迭代(fixed 40), WIB和FBER译码性能相似。如果Q降低到64,则需将X至少增加到3,以弥补性能损失。每当X增加1时,它将至少导致平均迭代次数上升一次。同样可观察到Q值越大,译码性能越好。然而,较高的Q值增加了计算复杂度。因此,可通过仿真选择合适的(X,Q)来权衡硬件复杂度和平均迭代次数。
4.2 对迭代次数的分析
在相同的误码率条件下,比较不同迭代终止算法的平均迭代次数。如图6所示,在BER=1.48×10–5, Eb/N0=3.5 dB时,与40次固定迭代(fixed 40)的算法相比,G-Matrix准则可以减少87.96%的迭代,本文所提准则在Q=128和X=2时可以减少83.03%的迭代;当
Q=1024,X=1 时,与G-Matrix相比,平均迭代次数上升了29.98%;当Q=128,X=2 和Q=64,X=3 时分别与WIB(nWIB=128, M=6)和FBER(NF=64, M=6)相比平均迭代次数减少了39.44%和27.67%。当检测位数相等时,所提准则比WIB和FBER需要更少的迭代。4.3 硬件结构
X-tolerance的硬件结构如图7所示。通过硬判决得到
RtSi,n+1 的符号;异或(XOR)用于计算ˆxtSi⊕ˆxt−1Si 。在第t次迭代中,Dt 是与门(OR)的结果;Comp检测{Dt,Dt−1,···,Dt−X+1} 是否等于0;当Et 为0时终止译码。图8中给出了(8, 4)极化码的BP译码流程。虚线部分表示处理单元的阶段和停止准则之间的数据依赖关系。采用X-tolerance时,在第t次迭代的第3个时钟中,译码器输出
Rtt,4,i∈[N] ,然后确定ˆxt 。接下来,ˆxt 和ˆxt−1 被发送到相等检测器。第5个时钟,计算X比较器的结果。如果满足X-tolerance,译码器将计算Lti,1,i∈[N] ,终止译码,否则继续下一次迭代。对于大多数具有实际长度(n≤10000) 的极化码,相等检测器和X比较器的关键路径延迟总是小于PE[7]。因此,X-tolerance不会增加整个译码器的关键路径延迟。此外,G-Matrix, WIB和FBER只能在得到ˆu 后开始早期停止准则的判决,由于译码器和早期停止准则并行运行,在得到早期停止准则的结果前,译码无法终止,这会导致额外的延迟和复杂度。如图8所示,在第t次迭代的第6个时钟中译码器计算输出Lti,4,i∈[N] ,之后的第7个时钟其他准则才会开始判断是否终止译码,相对于X-tolerance会多出部分时钟译码延迟。当n>2 时,X-tolerance不会导致额外的延迟,因为X-tolerance的检测在获得ˆu 之前已完成。4.4 计算复杂度和资源消耗分析
表1列出了一次迭代停止准则的计算复杂度。对于
ˆxi,i∈S , X-tolerance使用Q个XOR操作来计算ˆxti⊕ˆxt−1i 。同时,X-tolerance需要X+Q个OR操作和1个比较操作来检测连续X次迭代是否有变化。虽然X-tolerance消耗更多或操作,但因为没有加法操作,其具有最低的计算复杂度。表2比较了多种早期迭代停止准则在Stratix V 5SGXEA7N2F45C2上的综合结果,统一采用8 bit量化LLR。与其他迭代终止准则相比,X-tolerance可有效降低硬件消耗。在ALM方面,它减少了90%以上的资源消耗。与G-Matrix, WIB和FBER相比,X-tolerance可节省37.6%~97.2%的寄存器。表 1 早期停止准则的计算复杂度比较停止准则 G-Matrix WIB FBER X-tolerance Q=N/8 Q=N/16 加法运算 2N M+2N/8 M+N/16 – – 比较运算 3N – – – 1 异或(XOR) NlogN N/8 N/16 N/8 N/16 或(OR) – – X+N/8 X+N/16 表 2 不同早期停止准则的综合结果停止准则 G-Matrix WIB FBER X-tolerance Q=128 X=2 Q=64 X=3 ALMs 30265 1820 1260 50 27 Registers 3073 330 210 131 68 5. 结束语
为了降低极化码置信度传播算法的译码延迟,减少迭代次数,本文提出一种基于码字估值的早期迭代停止准则。通过构造比较空间,只需检测码字估值
ˆx 中的部分位置,进一步降低计算复杂度,且不会引入额外的延迟。仿真表明,当最大迭代次数为40,信噪比为3.5 dB时,与G-Matrix相比,X-tolerance平均迭代次数上升了29.98%,与WIB, FBER相比,X-tolerance平均迭代次数分别降低39.44%和27.67%。综合结果表明,与G-Matrix, WIB和FBER相比,X-tolerance可节省90%以上的ALM资源。 -
R. N. Hall and J. H. Racette, J. Appl. Phys., 35(1964), 379.[2]J. W. Chen and A. G. Milnes, Ann. Rev. Mater. Sci., 10(1980), 157.[3]A. M. Salma, J. Electrochem. Soc., 126(1979), 114.[4]C. S. Fuller and J. C. Severins, Phys. Rev., 96(1954), 21.[5]C. J. Gallagher, J. Phys. Chem. Solids, 3(1957), 82.[6]C. B. Collins and R. O. Carlson, Phys. Rev., 108(1957), 1409.[7]T. Nakano and Y. Inuishi, J. Phys. Soc. Jpn, 19(1964), 851.[8]A. G. Milnes, Deep Impurities in Semiconductors, p. 14, Wiley, New York, (1973).[9]A. A. Lebedev and M. M. Akhmedova, Sov. Phys. Semicond., 10(1976), 1130.[10]M. M. Akhmedova, L. S. Berman, L. S. Kostina and A. A. Lebedev, ibid., 10(1976), 140.[11]N. Toyama, Solid State Electron., 26(1983), 37.[12]L. C. Kimerling, J. L. Benton and J. J. Rubin, Defects and Radiation Effects in Semiconductors, 59(1980),217.[13]陈开茅,秦国刚,半导体学报,7(1986)., 298.[14]秦国刚等,半导体学报,2(1981)5, 169.[15]E. R. Weber, Appl. Phys. A, 30(1983), 1.[16]G. W. Ludwig and H. H. Woodburg, Solid State Phys., 13(1962),223.[17]W. C. Dash, Phys. Rev., 98(1955), 1536.[18]Y. Chikaura and K. Kishimoto, Jpn. J. Appl. Phys., 19(1980), L5. 期刊类型引用(3)
1. 高珍,张国伟. 改进区块链的移动网络敏感数据防篡改仿真. 计算机仿真. 2023(03): 409-412+430 . 百度学术
2. 文豪,曹阳,党宇超. 无线光通信下极化码DNN-NOMS译码方法研究. 红外与激光工程. 2022(05): 262-272 . 百度学术
3. 袁建国,张瑞,张丰果,李志伟,黄胜. CRC辅助PC-polar码的新颖编码算法. 重庆邮电大学学报(自然科学版). 2022(06): 929-934 . 百度学术
其他类型引用(4)
-
计量
- 文章访问数: 2239
- HTML全文浏览量: 134
- PDF下载量: 364
- 被引次数: 7