C<sup>2 </sup>Transformer U-Net：面向跨模态和上下文语义的医学图像分割模型

周涛; 侯森宝; 陆惠玲; 刘赟璨; 党培

doi:10.11999/JEIT220445

C²Transformer U-Net：面向跨模态和上下文语义的医学图像分割模型

doi: 10.11999/JEIT220445

周涛^{1, 3},
侯森宝^1, ,,
陆惠玲²,
刘赟璨¹,
党培¹

1.
北方民族大学计算机科学与工程学院银川 750021
2.
宁夏医科大学理学院银川 750004
3.
北方民族大学图像图形智能处理国家民委重点实验室银川 750021

基金项目: 国家自然科学基金(62062003)，宁夏自治区重点研发计划(2020BEB04022)，宁夏自然科学基金(2022AAC03149)，北方民族大学引进人才科研启动项目(2020KYQD08)

详细信息

作者简介:
周涛：男，博士，教授，博士生导师，主要研究方向为计算机辅助诊断、医学图像分析与处理、模式识别等

侯森宝：男，硕士生，研究方向为图像图形智能处理

陆惠玲：女，副教授，研究方向为医学图像分析处理、机器学习

刘赟璨：女，硕士生，研究方向为图像图形智能处理

党培：女，硕士生，研究方向为图像图形智能处理

通讯作者:
侯森宝　hsb378093739@163.com

中图分类号: TN911.73; TP391
计量
- 文章访问数: 1354
- HTML全文浏览量: 1093
- PDF下载量: 250
- 被引次数: 12
出版历程
- 收稿日期: 2022-04-14
- 修回日期: 2022-08-24
- 录用日期: 2022-08-25
- 网络出版日期: 2022-08-30
- 刊出日期: 2023-05-10

C²Transformer U-Net: A Medical Image Segmentation Model for Cross-modality and Contextual Semantics

ZHOU Tao^{1, 3},
HOU Senbao^{1
, ,},
LU Huiling²,
LIU Yuncan¹,
DANG Pei¹

1.
School of Computer Science and Engineering, North Minzu University, Yinchuan 750021, China
2.
School of Science, Ningxia Medical University, Yinchuan 750004, China
3.
Key Laboratory of Image and Graphics Intelligent Processing of State Ethnic Affairs Commission, North Minzu University, Yinchuan 750021, China

Funds: The National Natural Science Foundation of China (62062003), The Key Research and Development Projects of Ningxia Autonomous Region (2020BEB04022), The National Natural Science Foundation of Ningxia (2022AAC03149), The Introduction of Talents and Scientific Research Start-up Project of Northern University for Nationalities (2020KYQD08)

摘要

摘要: 跨模态的医学图像可以在同一病灶处提供更多的语义信息，针对U-Net网络主要使用单模态图像用于分割，未充分考虑跨模态、上下文语义相关性的问题，该文提出面向跨模态和上下文语义的医学图像分割C² Transformer U-Net模型。该模型的主要思想是：首先，在编码器部分提出主干、辅助U-Net网络结构，来提取不同模态的语义信息；然后，设计了多模态上下文语义感知处理器(MCAP)，有效地提取同一病灶跨模态的语义信息，跳跃连接中使用主网络的两种模态图像相加后传入Transformer解码器，增强模型对病灶的表达能力；其次，在编-解码器中采用预激活残差单元和Transformer架构，一方面提取病灶的上下文特征信息，另一方面使网络在充分利用低层和高层特征时更加关注病灶的位置信息；最后，使用临床多模态肺部医学图像数据集验证算法的有效性，对比实验结果表明所提模型对于肺部病灶分割的Acc, Pre, Recall, Dice, Voe与Rvd分别为：97.95%, 94.94%, 94.31%, 96.98%, 92.57%与93.35%。对于形状复杂肺部病灶的分割，具有较高的精度和相对较低的冗余度，总体上优于现有的先进方法。
- 医学图像分割 /
- 跨模态语义 /
- 上下文语义 /
- Transformer /
- U-Net
Abstract: Cross-modal medical images can provide more semantic information at the same lesion. In view of the U-Net network uses mainly single-modal images for segmentation, the cross-modal and contextual semantic correlations are not fully considered. Therefore, a cross-modal and contextual semantic-oriented medical image segmentation C² Transformer U-Net model is proposed. The main idea of this model is: first, a backbone and auxiliary U-Net network structure is proposed in the encoder part to extract semantic information of different modalities; Then, the Multi-modal Context semantic Awareness Processor (MCAP) is designed to extract effectively the semantic information of the same lesion across modalities. After adding the two modal images using the backbone network in the skip connection, it is passed to the Transformer decoder. This enhances the expression ability of the model to the lesion; Secondly, the pre-activated residual unit and Transformer architecture are used in the encoder-decoder. On the one hand, the contextual feature information of the lesion is extracted, and on the other hand, the network pays more attention to the location information of the lesion when making full use of low-level and high-level features; Finally, the effectiveness of the algorithm is verified by using a clinical multi-modal lung medical image dataset. Comparative experimental results show that the Acc, Pre, Recall, Dice, Voe and Rvd of the proposed model for lung lesion segmentation are: 97.95%, 94.94%, 94.31%, 96.98%, 92.57% and 93.35%. For the segmentation of lung lesions with complex shapes, it has high accuracy and relatively low redundancy. Overall, it outperforms existing state-of-the-art methods.
- Medical image segmentation /
- Cross-modality semantics /
- Contextual semantics /
- Transformer /
- U-Net

HTML全文

1. 引言

现代战场环境复杂，电子战装备呈现高度集成化、综合化发展趋势，释放干扰形式多样，特别是数字射频存储器(Digital Radio Frequency Memory, DRFM)技术在雷达对抗领域中的广泛应用^[1,2]，使得干扰信号与雷达信号在多个参数域重叠，导致常用时频域抗干扰方法失效。在如此严峻的干扰环境下，目标源DOA估计方法的性能将大打折扣。此外，目标源的非合作性导致有效样本数少。所以，研究有源欺骗干扰环境下，基于小样本的DOA估计方法具有重要意义。

常规的DOA估计算法有两类，第1类是最大似然DOA估计算法，在高信噪比情况下可接近克拉美罗界，但运算量非常大。虽然存在很多优化算法应用到最大似然DOA估计中以降低运算量^[3–5]，但还是面临寻优速度慢、精度不够的问题；第2类是子空间类算法，这类算法基于空间搜索，运算量大，而且不适用于相干信号源DOA估计。虽然存在很多算法用于改善相干源下子空间类算法的DOA估计性能^[6,7]，但多数算法基于特定的阵列结构，限制了算法的实用性。近几年兴起的稀疏重构类算法为DOA估计开辟了新思路^[8–11]。相比于其他稀疏重构类算法，稀疏贝叶斯学习算法具备较大优势。首先，稀疏贝叶斯学习算法的全局最小点通常是稀疏解，而广泛使用的基于L1惩罚项的算法在限定条件下才可以满足^[12]；其次，当感知矩阵列相关性很强时，大多数稀疏重构类算法失效，但稀疏贝叶斯学习算法仍有较好性能^[13]。稀疏贝叶斯DOA估计通常将DOA估计问题转化为基于多测量矢量(Multiple Measurement Vectors, MMV)模型的稀疏重构问题，根据贝叶斯准则获取后验概率函数，利用EM(Evidence Maximization)等算法得到超参数估计，进而估计来波方向。基于块稀疏贝叶斯学习(Block Sparse Bayesian Learning, BSBL)^[13–15]的DOA估计利用Kronecker积将MMV模型转化为具有块结构的SMV(Single Measurement Vector, SMV)模型，MMV模型下的非零行对应SMV模型下的非零块，再利用稀疏贝叶斯学习得到DOA估计。因为，BSBL算法既利用了统计信息又利用了结构信息，所以DOA估计的稳健性得以提高。

以上DOA估计算法工作在无干扰环境时性能较好，但有源欺骗干扰的存在会降低算法的DOA估计性能^[16,17]。极化域作为继时域、频域、空域后的又一重要信号域，若可以充分利用雷达信号和干扰信号在该域的差异，抗干扰性能将得以提升。Nathanson^[18]早先提出自适应极化对消器，用于研究雨杂波对消问题，之后，出现实时性较好的自适应极化滤波(Adaptive Polarization Filter, APF)包括极化状态估计和最佳极化接收两部分，通过调整接收天线极化形式，使其与干扰极化形式正交，从而抑制干扰信号，提高信干比^[19,20]。

针对有源欺骗干扰环境下基于小样本的DOA估计问题，本文将APF与BSBL算法联合，实现了干扰环境下的高精度DOA估计。首先通过APF抑制干扰，提高信干比。之后，建立有源欺骗干扰环境下的稀疏贝叶斯模型，利用相邻采样时间相关性，将MMV模型转化为具有块稀疏特性的SMV模型，采用BSBL算法进行DOA估计。在仿真中，先在不同信噪比条件下，分析了所提算法的DOA估计性能与干扰和目标的极化角度差以及算法迭代次数的关系。然后，在有源欺骗干扰、小样本环境下，将所提方法与BSBL算法、APF联合子空间类算法和APF联合最大似然DOA估计算法进行对比，仿真和实测数据处理结果验证了所提方法具有较高的空间分辨率和测角精度。

2. 有源欺骗干扰环境下信号模型

正交极化双通道测量是获取入射电磁波极化信息的物理前提，到达接收天线的信号极化矢量表示为

${{h}} = [{{{h}}_{\rm{h}}}, {{{h}}_{\rm{v}}}] = \left[ {\begin{array}{*{20}{c}} {\cos(\alpha )}&{\sin(\alpha ){{\rm{e}}^{({\rm{j}}\phi )}}} \end{array}} \right]$

(1)

其中，h和v表示接收天线正交极化双通道， $\alpha$ 和 $\phi$ 决定信号的极化状态。

雷达信号的极化矢量表示为

$\begin{array}{*{20}{c}} {{{{h}}_q} = [\!\begin{array}{*{20}{c}} {\cos({\alpha _q})}&{\sin({\alpha _q}){{\rm{e}}^{(j{\phi _q})}}} \end{array}\!], }&{q = 1, 2, ·\!·\!· , Q} \end{array}$

(2)

其中， $Q$ 为目标数目。干扰信号极化矢量表示为

$\!\begin{array}{*{20}{c}} {{{h}}_k^1 = [\!\!\begin{array}{*{20}{c}} {\cos(\alpha _k^1)}&{\sin(\alpha _k^1){{\rm{e}}^{({\rm j}{\phi _k})}}} \end{array}\!\!], }&{k = 1, 2, ·\!·\!· , K} \end{array}$

(3)

其中， $K$ 为干扰数目。

弹载雷达接收信号由3部分构成：目标信号、干扰信号和噪声信号。目标信号表示为

$\!\!\!\!\begin{array}{*{20}{c}} {{{{S}}_q} \!=\! \left[\! {{{\rm{e}}^{\left[ {{\rm{j}}\frac{{2{{π}} }}{\lambda }d\sin({\theta _q}){{(0:M - 1)}^{\rm{T}}}} \right]}}\!{{{g}}_q}(t)}\! \right]\! \otimes \!{{{h}}_q}, }\;{q \!=\! 1, 2, ·\!·\!· , Q} \end{array}$

(4)

其中， ${\theta _q}$ 表示目标方位角，d为均匀线阵的阵元间距， $M$ 为阵元数。 ${{{g}}_q}(t)$ 表示第 $q$ 个目标的回波复包络， $\otimes$ 表示Kronecker积运算。雷达接收到的干扰信号表示为

$\!\!\!\!\!\!\begin{array}{*{20}{c}} {{{{J}}_k} \!=\! \left[\! {{{\rm{e}}^{\left[ {{\rm{j}}\frac{{2{{π}} }}{\lambda }d\sin(\theta _k^1){{(0:M - 1)}^{\rm{T}}}} \right]}}{{{j}}_k}(t)}\! \right]\! \otimes \!{{h}}_k^1, }\;{k \!=\! 1, 2, ·\!·\!· , K} \end{array}$

(5)

其中， $\theta _k^1$ 表示干扰方位角， ${{{j}}_k}(t)$ 表示第 $k$ 个干扰信号的复包络。天线接收到的总信号 ${{X}}$ 表示为

${{X}} = \sum\limits_{{{q = 1}}}^Q {{{{S}}_q}} + \sum\limits_{{{k = 1}}}^K {{{{J}}_k}} +{{{N}}\!_{s}}$

(6)

其中， ${{{N}}\!_{s}}$ 表示互不相关的加性高斯白噪声。

3. APF联合BSBL算法的DOA估计方法

弹载雷达接收信号 ${{X}}$ 中包含多个有源欺骗干扰信号，在有限信噪比和迭代次数下，影响的BSBL算法DOA估计性能。将APF联合BSBL算法可提高BSBL算法在有源欺骗干扰环境下DOA估计性能。

APF抑制干扰的前提是知道干扰信号的极化信息。记接收电场的极化相干矩阵为 ${{C}}$ ，表示如式(7)

${{C}} = \left[ {\begin{array}{*{20}{c}} {{C_{{\rm{hh}}}}}&{{C_{{\rm{hv}}}}} \\ {{C_{{\rm{vh}}}}}&{{C_{{\rm{vv}}}}} \end{array}} \right]$

(7)

极化信息可完全由 ${{C}}$ 决定，实际应用中不可先验得到，它的最大似然估计为

$\hat {{C}} = \frac{1}{N}\sum\limits_{n = 1}^N {{{X}}_n^{\rm{H}}{{{X}}_n}}$

(8)

其中， $N$ 为回波样本数， ${{{X}}_n} = \left[ {{{{X}}_{n{\rm{h}}}}, {{{X}}_{n{\rm{v}}}}} \right]$ ， ${{{X}}_{n{\rm{h}}}}$ 和 ${{{X}}_{n{\rm{v}}}}$ 分别表示 ${{{X}}_{\rm{h}}}$ 和 ${{{X}}_{\rm{v}}}$ 的第 $n$ 列。假设 $n$ 时刻极化相干矩阵估计为 ${\hat{{C}}_n}$ , $n + 1$ 时刻的极化相干矩阵估计 ${\hat {{C}}_{n + 1}}$ 通过迭代得到，具体步骤如下：

(1)初始值 ${\hat {{C}}_0} = \left[ {\begin{array}{*{20}{c}} 1&{\rm{j}} \\ { - {\rm{j}}}&1 \end{array}} \right]$ 。

(2) ${\hat {{C}}_{n + 1}}$ 的迭代公式如式(9)

${\hat {{C}}_{n + 1}} = (1 - \zeta ){\hat {{C}}_n} + \zeta {{X}}_{n + 1}^{\rm{H}}{{{X}}_{n + 1}}$

(9)

其中， $n = 0, 1, \cdots , { N} - 1$ 。 $0 \le \zeta \le 1$ 为新数据权重因子，反映新数据对相干矩阵估计的重要性。接收回波样本数据量越大，每个新样本对 ${\hat {{C}}_{n + 1}}$ 的作用越小。所以，可以认为与样本数 $N$ 具有反比关系，取为 ${1 / N}$ 。

极化相干矩阵 $\hat {{C}}$ 迭代完成后，对其进行特征分解，小特征值对应的特征矢量记为 ${{{u}}_{{2}}}$ 。天线最佳接收极化矢量表示为

${{{h}}_{{\rm{opt}}}} = \frac{{{{{u}}_{{2}}}^{\rm{T}}}}{{\left\| {{{{u}}_{{2}}}} \right\|}}$

(10)

获得天线最佳接收极化矢量 ${{{h}}_{{\rm{opt}}}}$ 后，对雷达接收信号 ${{X}}$ 进行干扰滤除得 ${{{X}}^{\rm{A}}}$

$\begin{array}{*{20}{c}} {{{X}}_i^{\rm{A}} = {{{X}}_i}{{h}}_{{\rm{opt}}}^{\rm{T}}, }&{i = 1, 2, ·\!·\!· , N} \end{array}$

(11)

其中， ${{X}}_i^{\rm{A}}$ 表示 ${{{X}}^{\rm{A}}}$ 的第 $i$ 列。

利用APF提高信干比得到 ${{{X}}^{\rm{A}}}$ 后，通过BSBL算法进行DOA估计。BSBL算法的数学模型是将MMV模型转化为具有块稀疏特性的SMV模型。 ${{{X}}^{\rm{A}}}$ 在基于MMV的稀疏贝叶斯模型中表示为

${{{X}}^{\rm{A}}} = {{fs}} + {{V}}$

(12)

其中， ${{f}}$ 是 $M \times L$ 的学习字典， $L$ 是空间划分格数。 ${{s}}$ 是 $L \times N$ 维的待恢复稀疏矩阵，为了得到唯一的全局最优解，应保证 ${{s}}$ 是行稀疏的。 ${{V}}$ 是 $M \times N$ 维的噪声矢量。无角度欺骗干扰时， ${{s}}$ 的元素满足

${{s}}\left( {l, :} \right) = \left\{ {\begin{array}{*{20}{l}} {{{{z}}_q}, } & {{\theta _l} = {\theta _q}}\\ {0, } & {{其它}} \end{array}} \right. , {l = 1, 2, ·\!·\!· , L}$

(13)

其中， ${{{z}}_q}$ 表示目标源信号。有角度欺骗干扰时， ${{s}}$ 的元素满足

${{s}}\left( {l, :} \right) = \left\{ {\begin{array}{*{20}{l}} {{{{z}}_q}, } & {{\theta _l} = {\theta _q}} \\ {{{{z}}_k}, } & {{\theta _l} = \theta _k^1} \\ {0, } & {{其它}} \end{array}} \right., {l = 1, 2, ·\!·\!· , L}$

(14)

其中， ${{{z}}_k}$ 表示干扰转发信号。

令

${{y}} = {\rm{vec}}({({{{X}}^{\rm{A}}})^{\rm{T}}})$

(15)

${{D}} = {{f}} \otimes {{{I}}_N} \hspace{20pt}$

(16)

${{x}} = {\rm{vec}}({{{s}}^{\rm{T}}}) \hspace{20pt}$

(17)

${{v}} = {\rm{vec}}({{{V}}^{\rm{T}}}) \hspace{18pt}$

(18)

其中， ${\rm{vec}}( \bullet )$ 代表矩阵矢量化， ${{{I}}_N}$ 表示 $N$ 维单位阵。

利用式(15)到式(18)，MMV模型转化为SMV模型，表示为

${{y}} = {{Dx}} + {{v}}$

(19)

式(19)的等价表示为

$\begin{aligned} {{y}} =& \left[ {\begin{aligned} {{{{f}}_1} \otimes {{{I}}_N}}\;\; {{{{f}}_2} \otimes {{{I}}_N}}\;\;·\!·· &{{{{f}}_L} \otimes {{{I}}_N}} \end{aligned}}\right]\\ &\cdot{\left[ {\begin{aligned} {{{x}}_1^{\rm{T}}}\;\; {{{x}}_2^{\rm{T}}}\;\;·\!·\!· \;\;{{{x}}_L^{\rm{T}}} \end{aligned}} \right]^{\rm{T}}} + {{v}} \end{aligned}$

(20)

其中， ${{x}}_i^{\rm{T} }$ 表示 ${{s}}$ 的第 $i$ 行， ${{{f}}_i}$ 表示 ${{f}}$ 的第 $i$ 列， $i = 1, 2, ·\!·\!· , L$ 。由展开式可以看出， ${{x}}$ 由 $L$ 个块组成，每个块中包含 $N$ 个元素，由于接收信号采样频率较高， $N$ 个元素间通常具有时间相关性。假设噪声矢量中元素独立且同服从参数为 $\partial$ 的高斯分布， ${{y}}$ 的似然函数为

$p({{y}}|{{x}};\partial )\sim {{\rm{N}}_{{{y}}|{{x}}}}({{Dx}}, \partial {{I}})$

(21)

似然函数的概率密度函数形式确定后，未知参数为期望和方差，需要用样本对参数进行估计。

假定待恢复稀疏矩阵 ${{s}}$ 中的每行之间独立，且服从正态分布

$\begin{array}{*{20}{c}} {p({{{s}}_i};{\gamma _i}, {{{B}}_i})\sim{\rm{N}}({{0}}, {\gamma _i}{{{B}}_i}), }&{i = 1, 2, ·\!·\!· , L} \end{array}$

(22)

其中， ${\gamma _i}$ 控制 ${{s}}$ 的行稀疏性， ${{{B}}_i}$ 为正定矩阵，用于描述 ${{{s}}_i}$ 的相关结构。

则 ${{x}}$ 的先验概率满足

$p({{x}};{\gamma _i}, {{{B}}_i}, \forall i)\sim{{\rm{N}}_{{x}}}({{0}}, {{{Σ}} _0})$

(23)

其中， ${{{Σ}} _0}$ 表示为

${{{Σ}} _0} = \left[ {\begin{array}{*{20}{c}} {{\gamma _1}{{{B}}_1}}&{}&{}&{} \\ {}&{{\gamma _2}{{{B}}_2}}&{}&{} \\ {}&{}& \ddots &{} \\ {}&{}&{}&{{\gamma _L}{{{B}}_L}} \end{array}} \right]$

(24)

为了防止过拟合， $L$ 个块采用同一个 ${{B}}$ 描述相关结构^[13]，得

${{{Σ}} _0} = {{Γ}} \otimes {{B}}$

(25)

其中， ${{Γ}} = {\rm{diag}}({\gamma _1}, {\gamma _2}, ·\!·\!· , {\gamma _L})$ ，根据贝叶斯公式，后验概率 $p({{x}}|{{y}})$ 由先验概率和似然函数表示为

$p({{x}}|{{y}}) = \frac{{p({{y}}|{{x}}){{p}}({{x}})}}{{p({{y}})}}$

利用贝叶斯准则得后验概率分布

$p({{x}}|{{y}};\partial , {\gamma _i}, {{B}}, \forall i)\sim{{\rm{N}}_{{{x}}|{{y}}}}({{{μ}} _{{x}}}, {{{Σ}} _{{x}}})$

(26)

其中，

$\begin{aligned} {{{Σ}} _{{x}}} =& {\left( {{{Σ}} _0^{ - 1} + \frac{1}{\partial }{{{D}}^{\rm{T}}}{{D}}} \right)^{ - 1}}\\ =& {{{Σ}} _0} - {{{Σ}} _0}{{{D}}^{\rm{T}}}{\left( {\partial {{I}} + {{D}}{{{Σ}} _0}{{{D}}^{\rm{T}}}} \right)^{ - 1}}{{D}}{{{Σ}} _0} \end{aligned}$

(27)

$$ {{{μ}} _{{x}}} = \frac{1}{\partial }{{{Σ}} _{{x}}}{{{D}}^{\rm{T}}}{{y}} \hspace{115pt}$

(28)

${{x}}$ 的MAP(Maximum-A-Posterior)估计为

$\begin{aligned} {{{x}}^*} \triangleq {{{μ}} _x} =& {\left( {\partial {{{Σ}} _0}^{ - 1} + {{{D}}^{\rm{T}}}{{D}}} \right)^{ - 1}}{{{D}}^{\rm{T}}}{{y}} \\ =& {{{Σ}} _0}{{{D}}^{\rm{T}}}{\left( {\partial {{I}} + {{D}}{{{Σ}} _0}{{{D}}^{\rm{T}}}} \right)^{ - 1}}{{y}} \end{aligned}$

(29)

由此可知，对参数集 ${{Θ}} = \left\{ {{\gamma _1}, {\gamma _2}, ·\!·\!· , {\gamma _L}, {{B}}, \partial } \right\}$ 进行估计，即求得稀疏解。

最大化 $p({{y}};{{Θ}} )$ 可得参数估计，相当于最小化 $- \lg p({{y}};{{Θ}} )$ ，目标函数为

$L\left( {{Θ}} \right) = {{{y}}^{\rm{T}}}{{Σ}} _{{y}}^{ - 1}{{y}} + \lg \left| {{{{Σ}} _{{y}}}} \right|$

(30)

通过最大期望(Expectation-Maximization, EM)算法，得到参数更新^[13]

$\!\!\!\begin{array}{*{20}{c}} {{\gamma _i}\! =\! \frac{{{{\rm{t}}{\rm{r}}}\left[ {{{{B}}^{ - 1}}({{Σ}} _x^i \!+\! {{μ}} _x^i{{({{μ}} _x^i)}^{\rm{T}}})} \right]}}{N}, }&{i \!=\! 1, 2, ·\!·\!· , L} \end{array}$

(31)

其中， ${{\rm{tr}}}\left[ \bullet \right]$ 表示矩阵求迹， ${{{μ}} _x^i}{\underline{\underline \Delta } } {{{μ}} _x}\left(\! {\left( {i \!-\! 1} \right)\!N \!+\! 1\!:iN} \right)$ , ${{{Σ}} _x^i}{\underline{\underline \Delta } } {{{Σ}} _x}\left( {\left( {i - 1} \right)N + 1:iN, \left( {i - 1} \right)N + 1:iN} \right)$ 。

${{B}} = \frac{1}{L}\sum\limits_{i = 1}^L {\frac{{{{Σ}} _x^i + {{μ}} _x^i{{({{μ}} _x^i)}^{\rm{T}}}}}{{{\gamma _i}}}}$

(32)

为了增加鲁棒性，按以下规则对 ${{B}}$ 进行估计

${{B}} = {{\mathop {{B}}\limits^ \approx } /{||\mathop {{B}}\limits^ \approx |{|_{\rm{F}}}}}$

(33)

其中， $\mathop {{B}}\limits^ \approx = \displaystyle\sum\nolimits_{i = 1}^L {\frac{{{{μ}} _x^i{{({{μ}} _x^i)}^{\rm{T}}}}}{{{\gamma _i}}}} + h{{I}}$ , $h$ 为一正的常量， $||\mathop {{B}}\limits^ \approx |{|_{\rm{F}}}$ 表示 $\mathop {{B}}\limits^ \approx$ 的Frobenius范数。 $\partial$ 的迭代公式为

$\partial = \frac{{\left\| {{{y}} - {{D}}{{{μ}} _x}} \right\|_2^2 + \partial \left[ {LN - {{\rm{tr}}}({{{Σ}} _x}{{Σ}} _0^{ - 1})} \right]}}{{MN}}$

(34)

当达到设定的迭代次数小于门限时，停止迭代，此时， ${{\gamma _i}, }i = 1, 2, ·\!·\!· , L$ 中最大值对应目标方位。

4. 仿真与实测分析

4.1 仿真实验

仿真条件：仿真采用正交极化双通道阵列天线接收信号，基于7阵元均匀线阵，阵元间距取波长的一半。载波波段为C波段，信号形式为线性调频信号，带宽为4 MHz，采样频率为5 MHz。

(1)为验证干扰信号和雷达信号的极化角度差以及迭代次数对本文方法测角性能的影响，下面对本文方法测角误差进行仿真分析。目标雷达数目为1，方位角为10°，极化矢量固定为 ${{{h}}_1} \!=\!\! \left[\!\!\!\! {\begin{array}{*{20}{c}} {\cos(45^\circ)}\;{\sin(45^\circ){{\rm{e}}^{({\rm{j}}0^\circ)}}} \end{array}} \!\!\!\!\right]$ 。干扰数目为1，方位角为–10°，极化矢量为 ${{h}}_1^1 =$ $\left[\!\!\!\! {\begin{array}{*{20}{c}} {\cos(45^\circ)}\;{\sin(45^\circ){{\rm{e}}^{({\rm{j}}\Delta \phi )}}} \end{array}} \!\!\!\!\right]$ ，其中， $\Delta \phi$ 的变化间隔为0.5°，变化范围为[12.0° 24.5°]。接收信号前面采样数据信干比为–3 dB，用于干扰极化状态估计，后面采样数据信干比为0 dB。固定BSBL算法迭代次数为100次，本文方法的测角误差随目标和干扰的极化角度差变化曲线如图1(a)所示。然后，固定干扰极化矢量 ${{h}}_1^1 = \left[\!\!\!\! {\begin{array}{*{20}{c}} {\cos(45^\circ)}\;{\sin(45^\circ){{\rm{e}}^{({\rm{j}}40^\circ)}}} \end{array}} \!\!\!\!\right]$ ，迭代次数的变化间隔为2次，变化范围为[108次 160次]，本文方法的测角误差随迭代次数变化的曲线如图1(b)所示。

图 1 APF联合BSBL算法的测角性能分析

下载: 全尺寸图片幻灯片

由图1(a)可知，信噪比越高，测角误差越小，同一信噪比下，目标和干扰极化角度差越大，测角误差越小，并逐步趋于稳定；由图1(b)可知，信噪比越高，对迭代次数的要求越小，同一信噪比下，迭代次数越大，测角误差越小，并逐步趋于稳定。

(2)为验证有源欺骗干扰环境和小样本条件下所提方法DOA估计的性能，将本文方法与BSBL算法、APF联合子空间类算法、APF联合最大似然(Maximum Likelihood, ML)算法进行对比。信噪比取为20 dB，样本数为5，干扰数目为1，方位为10°，目标数目为2，方位分别为18°和25°。干扰极化矢量为 ${{h}}_1^1 = \left[\!\!\!\! {\begin{array}{*{20}{c}} {\cos(45^\circ)}\;{\sin(45^\circ){{\rm{e}}^{({\rm{j}}90^\circ)}}} \end{array}} \!\!\!\!\right]$ ，目标1极化矢量为 ${{{h}}_1} = \left[\!\!\!\! {\begin{array}{*{20}{c}} {\cos(45^\circ)}\;{\sin(45^\circ){{\rm{e}}^{({\rm{j}}0^\circ)}}} \end{array}} \!\!\!\!\right]$ ，目标2极化矢量为 ${{{h}}_2} = \left[\!\!\!\! {\begin{array}{*{20}{c}} {\cos(45^\circ)}\;{\sin(45^\circ){{\rm{e}}^{({\rm{j}}20^\circ)}}} \end{array}} \!\!\!\!\right]$ 。不同方法DOA估计结果如图2所示。

图 2 样本数为5时DOA估计结果图

下载: 全尺寸图片幻灯片

由图2可知，BSBL算法的估计结果偏离正确的方位角，干扰信号影响BSBL算法的稀疏恢复性能，这是因为待测源个数增多要求信噪比和BSBL算法迭代次数增加，导致BSBL算法测角性能下降；通过APF联合子空间类算法进行DOA估计，由于阵元数目较少、样本数少，子空间类算法空间分辨率有限，不可以同时对两个目标源进行准确的DOA估计；APF联合最大似然算法也分辨率不足，无法对两个目标进行准确的DOA估计；本文方法先通过APF滤除干扰，再通过BSBL进行DOA估计，可以分辨两个目标源，测得两个目标源方位角分别为18°和26°。综上所述，在有源欺骗干扰环境、阵元数少和小样本条件下，本文方法具有较高的空间分辨率和测角精度。

4.2 实测实验

实测场景和条件：实验采用基于弹载的正交极化双通道阵列天线接收信号，基于7阵元非均匀圆阵。为有效掩护雷达信号，干扰辐射功率高于雷达平均副瓣1～3 dB，并低于雷达主瓣约20～25 dB。各干扰源的辐射强度基本相同，天线指向固定，因此，弹载雷达收到的干扰信号功率相对稳定。典型配置为3个干扰，为了更好的干扰弹载雷达系统，使其不能准确测量雷达信号源方向，一般沿雷达两侧及径向布置有源欺骗干扰，布设距离100～300 m。雷达主瓣极化形式多为线极化，而雷达副瓣的极化形式较为杂乱，但此时雷达功率低于干扰功率较多。干扰场景如图3所示。

图 3 干扰场景图

下载: 全尺寸图片幻灯片

为在时-频-空域保护目标，干扰信号脉冲覆盖雷达信号脉冲的前后沿。干扰信号与雷达信号的载频、重频等参数相同或接近，3个干扰分布在雷达主瓣内，时-频-空域抑制干扰手段失效。导弹对雷达进行初始探测时，接收到的信号来自雷达副瓣和干扰。所以，初始探测采样数据可以近似为干扰数据，用于极化状态估计，进而在极化域实现抗干扰。在导弹攻击过程中，初始阶段干扰与弹载雷达的空间角度差较小，随着弹目不断接近，空间角度差逐渐变大。参考方向如图4所示。

图 4 干扰和弹载雷达方位角和仰角分布图

下载: 全尺寸图片幻灯片

因为仰角和方位角的2维测量导致冗余字典长度增加，所以利用本文方法进行DOA估计时，先进行大范围粗略估计，再进行小范围精确估计。仿真实验中用到的ESPRIT算法利用自相关矩阵信号子空间旋转不变性，从子阵固定关系中求得来波方向，在测角前需要先将总阵分为几个布局一致的子阵。由此可知，ESPRIT算法不适用于基于非均匀圆阵的DOA估计。所以实测数据处理时仅将所提方法与APF联合MUSIC算法和APF联合ML算法进行对比。为了定量评估DOA估计精度，测角误差表示为方位和仰角测角误差的均方根。基于接收到的20个脉冲信号，3种方法的测角均方根误差如图5所示。

图 5 实测数据测角均方根误差图

下载: 全尺寸图片幻灯片

由图5可知，本文方法同样适用于干扰环境下基于非均匀圆阵的2维DOA估计。在有源欺骗干扰和小样本环境下，相比APF联合MUSIC算法或最大似然算法，本文方法具有更高的测角精度。

5. 结束语

有源欺骗干扰的存在使得待测源个数增多，影响BSBL算法测向性能。因此，本文提出APF联合BSBL算法，用于有源欺骗干扰环境下基于小样本的DOA估计。本文方法先基于接收数据估计干扰极化状态，进而在极化域抑制干扰信号。然后，通过BSBL算法估计目标方向，有效提高了有源欺骗干扰环境下BSBL算法的测向性能。仿真和实测实验处理结果表明本文方法在有源欺骗干扰环境下具有较高的测角精度和空间分辨率。如何进一步降低本文方法运算量，使其可以应用于更为复杂的战场环境，将是今后的研究重点。

图 1 C² Transformer U-Net网络架构

下载: 全尺寸图片幻灯片

图 2 多模态上下文感知处理器

下载: 全尺寸图片幻灯片

图 3 Transformer多头注意力编-解码分支

下载: 全尺寸图片幻灯片

图 4 跨模态语义相关性的不同编码器分割网络的雷达图和可视化分割结果图

下载: 全尺寸图片幻灯片

图 5 不同分割网络的雷达图和可视化分割结果图

下载: 全尺寸图片幻灯片

图 6 上下文语义相关的雷达图和可视化分割结果图

下载: 全尺寸图片幻灯片

表 1 评价指标定义

评价指标	定义	评价指标	定义
Acc	${\text{Acc = }}\dfrac{{{\text{TP + TN}}}}{{{\text{TP + FP + FN + TN}}}}$	Pre	${\text{Pre = }}\dfrac{{{\text{TP}}}}{{{\text{TP + FP}}}}$
Dice	${\rm{Dice}} = \dfrac{ {2 \times \left\| {P \cap G} \right\|} }{ {\left\| P \right\| + \left\| G \right\|} }$	Recall	${\text{Recall = }}\dfrac{{{\text{TP}}}}{{{\text{TP + FN}}}}$
Voe	${\rm{Voe} } = {\rm{abs} }\left(1 - \left\| {\dfrac{ {P \cap G} }{ {P \cup G} } } \right\|\right)$	Rvd	${\text{Rvd}} = \dfrac{{{\text{abs}}(P{{ - }}G)}}{G}$

下载: 导出CSV

表 2 跨模态语义相关性的不同编码器分割结果(%)

模型	Acc	Pre	Recall	Dice	Voe	Rvd
U-Net^[16]	90.23	90.38	90.33	90.28	90.97	92.09
Y-Net^[17]	90.16	90.09	90.18	90.09	91.42	92.45
本文	97.95	94.94	94.31	96.98	92.57	93.35

下载: 导出CSV

表 3 不同分割网络的分割结果(%)

模型	ACC	Pre	Recall	Dice	VOE	RVD
SegNet^[18]	89.23	89.38	88.33	87.28	79.97	81.13
WNet^[19]	90.16	89.49	91.28	88.59	82.08	83.45
Attention UNet^[20]	91.30	90.94	91.31	89.98	84.57	84.35
ResUNet^[21]	91.23	90.08	90.32	89.01	83.45	84.02
SEResUNet^[22]	92.38	92.17	92.07	92.20	90.93	91.04
UTNet^[23]	94.58	93.86	93.44	92.83	92.07	93.20
本文	97.95	94.94	94.31	96.98	92.57	93.35

下载: 导出CSV

表 4 上下文语义相关的分割结果(%)

模型	Acc	Pre	Recall	Dice	Voe	Rvd
RMUNet	93.26	90.69	91.14	92.68	89.45	91.10
RTMUNet	94.59	92.80	92.55	93.50	89.87	91.37
RTMMUNet	95.18	93.13	92.69	94.01	90.02	92.04
RTMMSUNet	96.62	93.60	93.15	94.40	90.09	92.05
本文	97.95	94.94	94.31	96.98	92.57	93.35

下载: 导出CSV

参考文献(23)

[1]	DALCA A V, GUTTAG J, and SABUNCU M R. Anatomical priors in convolutional networks for unsupervised biomedical segmentation[C]. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake, USA, 2018: 9290–9299.
[2]	ZHOU Tao, LU Huiling, YANG Zaoli, et al. The ensemble deep learning model for novel COVID-19 on CT images[J]. Applied Soft Computing, 2021, 98: 106885. doi: 10.1016/j.asoc.2020.106885
[3]	JAMES A P and DASARATHY B V. Medical image fusion: A survey of the state of the art[J]. Information Fusion, 2014, 19: 4–19. doi: 10.1016/j.inffus.2013.12.002
[4]	LI Haoming, JIANG Huiyan, LI Siqi, et al. DenseX-Net: An end-to-end model for lymphoma segmentation in whole-body PET/CT Images[J]. IEEE Access, 2020, 8: 8004–8018. doi: 10.1109/ACCESS.2019.2963254
[5]	HUSSEIN S, GREEN A, WATANE A, et al. Automatic segmentation and quantification of white and brown adipose tissues from PET/CT Scans[J]. IEEE Transactions on Medical Imaging, 2017, 36(3): 734–744. doi: 10.1109/TMI.2016.2636188
[6]	MU Wei, CHEN Zhe, SHEN Wei, et al. A segmentation algorithm for quantitative analysis of heterogeneous tumors of the cervix with ¹⁸F-FDG PET/CT[J]. IEEE Transactions on Biomedical Engineering, 2015, 62(10): 2465–2479. doi: 10.1109/TBME.2015.2433397
[7]	ZHOU Tao, DONG YaLi, LU HuiLing, et al. APU-Net: An attention mechanism parallel U-Net for lung tumor segmentation[J]. BioMed Research International, 2022, 2022: 5303651. doi: 10.1155/2022/5303651
[8]	CUI Hui, WANG Xiuying, LIN W, et al. Primary lung tumor segmentation from PET-CT volumes with spatial-topological constraint[J]. International Journal of Computer Assisted Radiology and Surgery, 2016, 11(1): 19–29. doi: 10.1007/s11548-015-1231-0
[9]	ZHAO Hengshuang, SHI Jianping, QI Xiaojuan, et al. Pyramid scene parsing network[C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition, Honolulu, USA, 2017: 6230–6239.
[10]	HE Kaiming, ZHANG Xiangyu, REN Shaoqing, et al. Identity mappings in deep residual networks[C]. The 14th European Conference on Computer Vision, Amsterdam, The Netherlands, 2016: 630–645.
[11]	HAN Guang, ZHU Mengcheng, ZHAO Xuechen, et al. Method based on the cross-layer attention mechanism and multiscale perception for safety helmet-wearing detection[J]. Computers and Electrical Engineering, 2021, 95: 107458. doi: 10.1016/j.compeleceng.2021.107458
[12]	WANG Sinong, LI B Z, KHABSA M, et al. Linformer: Self-attention with linear complexity[EB/OL]. https://arxiv.org/abs/2006.04768, 2020.
[13]	VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need[C]. The 31st International Conference on Neural Information Processing Systems (NIPS'17), Long Beach, USA, 2017: 6000–6010.
[14]	BELLO L, ZOPH B, LE Q, et al. Attention augmented convolutional networks[C]. 2019 IEEE/CVF International Conference on Computer Vision (ICCV), Seoul, Korea (South), 2019: 3285–3294.
[15]	PARMAR N, VASWANI A, USZKOREIT J, et al. Image transformer[C]. The 35th International Conference on Machine Learning, Stockholm, Sweden, 2018: 4052–4061.
[16]	RONNEBERGER O, FISCHER P, and BROX T. U-Net: Convolutional networks for biomedical image segmentation[C]. The 18th International Conference on Medical Image Computing and Computer-assisted Intervention, Munich, Germany, 2015: 234−241.
[17]	LAN Hengrong, JIANG Daohuai, YANG Changchun, et al. Y-Net: Hybrid deep learning image reconstruction for photoacoustic tomography in vivo[J]. Photoacoustics, 2020, 20: 100197. doi: 10.1016/j.pacs.2020.100197
[18]	BADRINARAYANAN V, KENDALL A, and CIPOLLA R. SegNet: A deep convolutional encoder-decoder architecture for image segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(12): 2481–2495. doi: 10.1109/TPAMI.2016.2644615
[19]	XU Lina, TETTEH G, LIPKOVA J, et al. Automated whole-body bone lesion detection for multiple myeloma on ⁶⁸Ga-pentixafor PET/CT imaging using deep learning methods[J]. Contrast Media & Molecular Imaging, 2018, 2018: 2391925. doi: 10.1155/2018/2391925
[20]	OKTAY O, SCHLEMPER J, LE FOLGOC L, et al. Attention U-Net: Learning where to look for the pancreas[EB/OL]. https://arxiv.org/abs/1804.03999, 2018.
[21]	LIU Jin, KANG Yanqin, QIANG Jun, et al. Low-dose CT imaging via cascaded ResUnet with spectrum loss[J]. Methods, 2022, 202: 78–87. doi: 10.1016/j.ymeth.2021.05.005
[22]	CAO Zheng, YU Bohan, LEI Biwen, et al. Cascaded SE-ResUnet for segmentation of thoracic organs at risk[J]. Neurocomputing, 2021, 453: 357–368. doi: 10.1016/j.neucom.2020.08.086
[23]	GAO Yunhe, ZHOU Mu, and METAXAS D. UTNet: A hybrid transformer architecture for medical image segmentation[EB/OL]. https://arxiv.org/abs/2107.00781, 2021.

施引文献

期刊类型引用(7)

1.	赵书红，董绍武，白杉杉，高喆. 一种优化的频率驾驭算法研究. 电子与信息学报. 2021(05): 1457-1464 . 本站查看
2.	陶贵丽，刘文强，张兴华，牛晓霞. 带丢包不确定广义系统鲁棒Kalman预报器. 系统科学与数学. 2021(05): 1215-1232 . 百度学术
3.	谢卫，王前东. 一种基于自适应网格剖分的协方差交集融合新算法. 电讯技术. 2019(09): 1067-1074 . 百度学术
4.	刘振亚，高敏，程呈. 基于理想弹道鲁棒容积卡尔曼滤波视线角估计. 系统工程与电子技术. 2018(02): 409-416 . 百度学术
5.	秦文利，胡捍英，陈松. 基于带势概率假设密度粒子滤波的MIMO雷达检测前跟踪算法. 信息工程大学学报. 2018(02): 140-145 . 百度学术
6.	王雪梅，刘文强，邓自立. 带丢失观测和不确定噪声方差系统改进的鲁棒协方差交叉融合稳态Kalman滤波器. 控制理论与应用. 2016(07): 973-979 . 百度学术
7.	王雪梅，刘文强，邓自立. 带不确定协方差线性相关白噪声系统改进的鲁棒协方差交叉融合稳态Kalman估值器. 控制与决策. 2016(10): 1749-1756 . 百度学术

其他类型引用(5)

资源附件(0)

访问统计

图(6) / 表(4)

计量

文章访问数: 1354
HTML全文浏览量: 1093
PDF下载量: 250
被引次数: 12

1. 引言
2. 有源欺骗干扰环境下信号模型
3. APF联合BSBL算法的DOA估计方法
4. 仿真与实测分析
4.1 仿真实验
4.2 实测实验
5. 结束语

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

C²Transformer U-Net：面向跨模态和上下文语义的医学图像分割模型

doi: 10.11999/JEIT220445

通讯作者:
侯森宝　hsb378093739@163.com

计量

C²Transformer U-Net: A Medical Image Segmentation Model for Cross-modality and Contextual Semantics

1. 引言

2. 有源欺骗干扰环境下信号模型

3. APF联合BSBL算法的DOA估计方法

4. 仿真与实测分析

4.1 仿真实验

4.2 实测实验

5. 结束语

期刊类型引用(7)

其他类型引用(5)

计量

目录

1. 引言

2. 有源欺骗干扰环境下信号模型

3. APF联合BSBL算法的DOA估计方法

4. 仿真与实测分析

4.1 仿真实验

4.2 实测实验

5. 结束语

留言板

C2 Transformer U-Net：面向跨模态和上下文语义的医学图像分割模型

doi: 10.11999/JEIT220445

通讯作者: 侯森宝 hsb378093739@163.com

计量

出版历程

C2 Transformer U-Net: A Medical Image Segmentation Model for Cross-modality and Contextual Semantics

1. 引言

2. 有源欺骗干扰环境下信号模型

3. APF联合BSBL算法的DOA估计方法

4. 仿真与实测分析

4.1 仿真实验

4.2 实测实验

5. 结束语

期刊类型引用(7)

其他类型引用(5)

计量

出版历程

目录

1. 引言

2. 有源欺骗干扰环境下信号模型

3. APF联合BSBL算法的DOA估计方法

4. 仿真与实测分析

4.1 仿真实验

4.2 实测实验

5. 结束语

C²Transformer U-Net：面向跨模态和上下文语义的医学图像分割模型

通讯作者:
侯森宝　hsb378093739@163.com

C²Transformer U-Net: A Medical Image Segmentation Model for Cross-modality and Contextual Semantics