Character-level Adversarial Samples Generation Approach for Chinese Text Classification

ZHANG Shunxiang; WU Houyue; ZHU Guangli; Xu Xin; SU Mingxing

doi:10.11999/JEIT220563

Volume 45 Issue 6

Jun. 2023

Turn off MathJax

Article Contents

Article Navigation > Journal of Electronics & Information Technology > 2023 > 45(6): 2226-2235

Yi WU, Chunlan LUO, Xinqiu ZHANG, Xiao LIN, Zhexin XU. A Fast Algebraic Decoding of the (41, 21, 9) Quadratic Residue Code[J]. Journal of Electronics & Information Technology, 2018, 40(8): 1949-1955. doi: 10.11999/JEIT170983

Citation:

ZHANG Shunxiang, WU Houyue, ZHU Guangli, Xu Xin, SU Mingxing. Character-level Adversarial Samples Generation Approach for Chinese Text Classification[J]. Journal of Electronics & Information Technology, 2023, 45(6): 2226-2235. doi: 10.11999/JEIT220563

Citation:

PDF( 1972 KB)

Character-level Adversarial Samples Generation Approach for Chinese Text Classification

doi: 10.11999/JEIT220563

1.
School of Computer Science and Engineering, Anhui University of Science & Technology, Huainan 232001, China
2.
Institute of Artificial Intelligence, Hefei Comprehensive National Science Center, Hefei 230088, China

Funds: The National Natural Science Foundation of China (62076006), The University Synergy Innovation Program of Anhui Province (GXXT-2021-008), The Graduate Students Scientific Research Project of Anhui Province(YJS20210402)

Received Date: 2022-05-07
Rev Recd Date: 2022-07-09

Available Online: 2022-07-14

Publish Date: 2023-06-10

Abstract

Abstract

Adversarial sample generation is a technique that makes the neural network produce misjudgments by adding small disturbance information. Which can be used to detect the robustness of text classification models. At present, the methods of sample generation in the Chinese domain include mainly traditional characters and homophones substitution, which have the problems of large disturbance amplitude of sample generation and low quality of sample generation. Polyphonic characters Generation Adversarial Sample (PGAS), a character-level countermeasure samples generation approach, is proposed in this paper. Which can generate high-quality adversarial samples with minor disturbance by replacing polyphonic characters. First, a polyphonic word dictionary to label polyphonic words is constructed. Then, the input text with polyphonic words is replaced. Finally, an adversarial sample attack experiment in the black-box model is conducted. Experiments on multiple sentiment classification datasets verify the effectiveness of the proposed method for a variety of the latest classification models.
- Anti-sample generation,
- Text classification,
- Sentimental classification,
- Polyphonic characters,
- Character-level adversarial samples

FullText(HTML)

1. 引言

随着第5代(Fifth Generation, 5G) 移动通信系统的商用进入第5周年，大规模机器类通信已经应用到了工农业、医疗和交通等各个领域。到2030年，物联网(Internet of Things, IoT)在线设备预计将达到数千亿，每平方公里的连接密度预计将达到千万级，这一趋势使得IoT时代正逐步走向万物互联(Internet of Everything, IoE)时代^[1–3]。对于这一重要应用场景，5G的革新技术，即大规模多入多出(Multiple-Input Multiple-Output, MIMO)技术，已经成功应用于5G标准。该项技术在频谱和能量效率两方面都具备显著的性能增益，从而确保配置了大量天线的基站(Base Station, BS)能够服务于系统中的巨量设备，并带来丰富的空间自由度^[4,5]。总的来说，目前的大部分工作考虑的是不可控信道模型的情况，不可避免会因为信道的衰落而影响系统的性能。

对于第6代(Sixth Generation, 6G)移动通信系统而言，支持的业务类型和应用范围将更加广泛，同时有待处理巨量级的数据，这就使得业界开始研究和部署大维度的新型天线阵列架构。这种大维度的天线阵列一般可与大型基础设施共同部署，例如，机场、高铁站或者体育馆中的建筑墙面，以及大型智能表面中的电磁表面。通过控制可重构智能超表面(Reconfigurable Intelligent Surface, RIS)的相位转移单元^[6,7]，进行波束成形，可以增强信号的传播强度，消除干扰信号，实现绿色的大规模覆盖增强^[8,9]。文献[10]将混合中继RIS技术应用到无蜂窝大规模MIMO中，进行上下行信道建模，推导了系统的频谱效率性能表达式，实现了性能提升。文献[11]提出RIS辅助的带天线选取的大规模MIMO系统，通过无源波束成形和子模块优化方法，提高系统性能的同时降低硬件复杂度。所以，在5G演进增强(5G-Advanced, 5G-A)或者6G中，RIS被认为是一项很有潜力的技术^[12]。对于大规模机器类通信(Massive Machine-Type Communication, mMTC)这一重要的典型场景，其传播环境十分复杂。为了实现覆盖增强，一种可能的解决方案就是控制墙体的反射特性，从而建立良好的信号传播环境^[13]。为了充分探索RIS带来的好处，信道状态信息(Channel State Information, CSI)的获取至关重要。针对未来IoT系统，文献[14]借助RIS对直接信道和反射信道进行L1范数的联合估计，从而减少了有源天线和射频链，实现快速的信道估计。Chen等人^[15]通过结构化贝叶斯学习框架，对RIS辅助的MIMO IoT系统进行了级联信道估计，降低了矩阵计算的复杂度。对于非正交多址接入(Non Orthogonal Multiple Access, NOMA)和空口计算，文献[16]联合设计了带有RIS的系统模型。然而，对于大型IoT系统而言，尤其是对于配置了大规模MIMO的mMTC系统而言，如何通过RIS控制并改善恶劣的信道传播环境，从而提升系统性能，仍旧是一个开放性的课题。

另一方面，智能通信已经成为5G-A及6G发展的重要趋势。在大型蜂窝IoT系统中，BS端需要处理各类设备的无线接入资源，这就导致整个系统的计算复杂度很高。深度学习(Deep Learning, DL)因其固有的特征，可以降低无线通信网络的设计复杂度，获取优良的系统性能。文献[17]提出了深度神经网络(Deep Neural Network, DNN)辅助的协作RIS模型，利用DL进行RIS的相位优化，从而改善IoT系统的误码率性能。文献[18]将NOMA与RIS技术相结合，使用卷积长短期记忆模型进行信道估计，并通过不同的性能指标评估了信道估计的精度和系统的鲁棒性。文献[19]结合压缩感知(Compressed Sensing, CS)的方法，提出新型DL框架用于无授权的NOMA，增强信道估计，提高数据恢复的性能，进而改善mMTC中的频谱效率，支持更多的用户数。然而，由于BS端配置的是大规模天线阵列，并且整个系统中的在线设备数是海量的，如何降低系统的计算负担，也是需要研究的重要方面。综上，本文的主要贡献如下：

(1) 建立RIS辅助的大规模IoT上行传输系统，挖掘RIS级联链路的高斯稀疏特征，根据模型驱动的思想，提出可深度学习的Turbo消息传递网络架构。

(2) 将生成对抗网络(Generative Adversarial Nets, GAN)和降噪卷积神经网络(Denoising Convolutional Neural Network, DnCNN)融入到Turbo消息传递网络中，进行mMTC的稀疏样本学习和信道估计。

(3) 分析所提方案的信道估计理论分析结果，推导相应的解析公式，并进行仿真验证。

2. 系统模型

如所示，建立一个RIS辅助的mMTC上行传输系统。其中，配置了 $M$ 根天线的BS服务于系统中的 $N$ 个单天线在线设备，并且两者之间的通信由配置了 $K$ 个反射元素的RIS辅助进行。假设信道满足块衰落，在长度给定的每个块中，信道是准静态的。在该系统中，除了传统通信模式中的直接信道链路(BS与设备之间的信道链路)，还有两条信道链路，分别是设备与RIS之间的信道链路以及RIS与BS之间的信道链路。同时，假设设备-RIS之间的信道链路满足瑞利衰落，RIS-BS之间的信道链路满足路径损失的衰落。具体地，导频信号为 ${\boldsymbol{W}} = [{{\boldsymbol{w}}_1},{{\boldsymbol{w}}_2}, \cdots ,{{\boldsymbol{w}}_n}, \cdots, {{\boldsymbol{w}}_N}] \in {\mathcal{C}^{B \times N}}$ ，其中， ${{\boldsymbol{w}}_n} \in {\mathcal{C}^B}$ 是第 $n$ 个设备的长度为 $B$ 的导频序列。接着，可得BS端的接收信号为

图 1 RIS辅助的mMTC上行传输系统示意图

下载: 全尺寸图片幻灯片

${\boldsymbol{Y}} = {\boldsymbol{W}}(\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {{\boldsymbol{H}}} + \vec{{\boldsymbol{H}}}{\boldsymbol{\varPhi}} \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{{\boldsymbol{H}}} ) + {\boldsymbol{N}}$

(1)

其中， ${\boldsymbol{Y}} = {[{{\boldsymbol{y}}_1},{{\boldsymbol{y}}_2}, \cdots ,{{\boldsymbol{y}}_m}, \cdots ,{{\boldsymbol{y}}_M}] } \in {\mathcal{C}^{B \times M}}$ , ${{\boldsymbol{y}}_m} \in {\mathcal{C}^B}$ ； $\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {{\boldsymbol{H}}} = {[{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {{\boldsymbol{h}}} _1},{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {{\boldsymbol{h}}} _2}, \cdots ,{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {{\boldsymbol{h}}} _n}, \cdots ,{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {{\boldsymbol{h}}} _N}]^{\text{T}}}$ 代表第 $n$ 个设备与BS之间的直接链路， ${\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {{\boldsymbol{h}}} _n} \in {\mathcal{C}^M}$ ，满足0均值，方差为 ${\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {\varepsilon } _n}{\boldsymbol{I}}$ 的独立同分布； $\vec {\boldsymbol{H}} = {[{\vec {\boldsymbol{h}}_1},{\vec {\boldsymbol{h}}_2}, \cdots ,{\vec {\boldsymbol{h}}_n}, \cdots ,{\vec {\boldsymbol{h}}_N}]^{\text{T}}}$ 是设备与RIS之间的信道链路， ${\vec {\boldsymbol{h}}_n} \in {\mathcal{C}^K}$ ，满足0均值，方差为 ${\vec {\varepsilon } _n}{\boldsymbol{I}}$ 的独立同分布； ${\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{\boldsymbol{H}}} = [{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{\boldsymbol{h}} _1},{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{{\boldsymbol{h}}} _2}, \cdots ,{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{{\boldsymbol{h}}} _k}, \cdots ,$ ${\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{{\boldsymbol{h}}} _K}]^{\text{T}}$ 是RIS与BS之间的信道链路， ${\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{{\boldsymbol{h}}} _k} \in {\mathcal{C}^M}$ ，满足0均值，方差为 $\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{\varepsilon }$ 的独立同分布。其中，信道衰落参数 ${\vec {{\varepsilon}} _n}$ , $\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{\varepsilon }$ 和 ${\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {\varepsilon } _n}$ 均为路径损失参量。RIS的相移矩阵表示为 ${\boldsymbol{\varPhi}} = {\text{diag(}}{\mu _1}{\text{exp(j}}{\psi _1}{\text{)}},{\mu _2}{\text{exp(j}}{\psi _2}{\text{)}}, \cdots , {\mu _k}{\text{exp(j}}{\psi _k}{\text{)}}, \cdots ,{\mu _K}{\text{exp(j}}{\psi _K}{\text{))}}$ ，其中， ${\mu _k} \in [0,1]$ 是RIS的第 $k$ 个元素的幅度， ${\psi _k} \in [0,2\pi ]$ 为第 $k$ 个相移。为了表达的简洁性，令 ${\boldsymbol{H}} = \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {{\boldsymbol{H}}} + \vec {\boldsymbol{H}}{\boldsymbol{\varPhi}} \overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{{\boldsymbol{H}}}$ ，则式(1)可改写为

${\boldsymbol{Y}} = {\boldsymbol{W}}{\boldsymbol{H}} + {\boldsymbol{N}}$

(2)

其中， ${\boldsymbol{N}} \in {\mathcal{C}^{B \times M}}$ 为复高斯白噪声，均值为 ${{\textit{0}}}$ ，方差为 ${{{\sigma}} ^2}{\boldsymbol{I}}$ 。对于配置了大规模RIS的系统中， $K$ 的取值一般都较大。所以，根据中心极限定理，式(2)中的 ${\boldsymbol{H}}$ 就可以被近似逼近为伯努利高斯随机分布，相应的概率分布表达式为

$P({{\boldsymbol{h}}_n}) = (1 - {\rho _a})\delta ({{\boldsymbol{h}}_n}) + {\rho _a}\mathcal{C}\mathcal{N}({{\boldsymbol{h}}_n};{{\textit{0}}},{\eta _n}{\boldsymbol{I}})$

(3)

其中， ${\rho _a}$ 为任一设备的活跃概率， $\delta ( \cdot )$ 为狄拉克函数， ${\eta _n} = K{\mu ^2}{\vec \varepsilon _n}\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{\varepsilon } + {\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {\varepsilon } _n}$ 。同时， ${\vec \varepsilon _n}$ , $\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftarrow}$}}{\varepsilon }$ 和 ${\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\leftrightarrow}$}} {\varepsilon } _n}$ 均为路径损失参量，分别对应设备与RIS之间的信道链路，RIS与BS之间的信道链路，以及设备与BS之间的直接信道链路。这一特征的发现，对于RIS辅助的大规模IoT系统中CSI的获取，是至关重要的。所以，本文提出可深度学习的Turbo消息传递网络架构，用于进行mMTC的信道估计。

3. 方案设计

本节给出可深度学习的Turbo消息传递网络架构，通过接收信号 ${\boldsymbol{Y}}$ 和导频信号 ${\boldsymbol{W}}$ 对RIS辅助的级联信道 ${\boldsymbol{H}}$ 进行多维向量估计。在此基础上，通过状态演化的方法，研究所提方案统计性能。

3.1 可深度学习的Turbo消息传递网络

深度学习的思想已经被广泛应用于解决无线通信系统中CS类的信号恢复问题，接下来，从深度学习的角度，具体介绍该文所设计的Turbo消息传递网络。如所示，假设该网络分为 $C$ 层，对于第 $c$ 层,输入为BS端的接收信号 ${\boldsymbol{Y}}$ ，导频序列为 ${\boldsymbol{W}}$ ，输出为信道的估计值 ${{\hat {\boldsymbol{H}}}}$ ，外部消息处理和传输模块为EXT。对于Turbo思想指导下的多维测量向量 (Multiple Measurement Vector, MMV) 方法而言，信道估计的每一次迭代过程，都可以看作是中的每一层。同时，可将其对信道后验信息的估计模块转化成联合GAN和DnCNN的模块进行处理。在具体介绍GAN和DnCNN模块转化之前，对于可深度学习的Turbo消息传递网络，考虑第 $c + 1$ 层，那么该层的初始化输入即是第 $c$ 层的输出，即 ${\boldsymbol{z}}_{\mathrm{A}}^{c + 1,{\mathrm{pri}}}[m] = {\boldsymbol{z}}_{\mathrm{B}}^{c,{\mathrm{ext}}}[m]$ , ${\boldsymbol{v}}_{\mathrm{A}}^{c + 1,{\mathrm{pri}}} = {\boldsymbol{v}}_{\mathrm{B}}^{c,{\mathrm{ext}}}$ 。具体流程可通过以下步骤实现：

图 2 信道估计深度学习架构图

下载: 全尺寸图片幻灯片

(1) 令 ${{\boldsymbol{Z}}^{c + 1}} = {\boldsymbol{W}}{{\boldsymbol{H}}^{c + 1}}$ ，估计BS端 $M$ 根天线上 ${{\boldsymbol{Z}}^{c + 1}}$ 的后验信息与 ${{\boldsymbol{H}}^{c + 1}}$ 的外部信息。对于每一根天线 $m$ 而言，根据文献[]，计算得出 ${\boldsymbol{z}}_{\mathrm{A}}^{c + 1,{\mathrm{post}}}[m]$ , ${\boldsymbol{h}}_{\mathrm{A}}^{c + 1,{\text{post}}}[m]$ , ${\boldsymbol{v}}_{\mathrm{A}}^{c + 1,{\text{post}}}[m]$ , ${\boldsymbol{h}}_{\mathrm{B}}^{c + 1,{\text{post}}}[m]$ 和 ${\boldsymbol{v}}_{\text{B}}^{c + 1,{\text{post}}}[m]$ ；

(2) 对RIS辅助的大规模IoT系统中所有的在线设备进行联合信道估计，当 $n = 1,2, \cdots ,N$ 时，计算得出 ${\boldsymbol{h}}_n^{c + 1}$ 的后验期望和后验方差分别为 ${\boldsymbol{h}}_{{\mathrm{B}},n}^{c + 1,{\text{post}}}$ 和 ${\boldsymbol{v}}_{{\mathrm{B}},n}^{c + 1,{\text{post}}}$ 。计算公式为

$\;\;{\boldsymbol{h}}_{{\mathrm{B}},n}^{c + 1,{\text{post}}} = {E} ({\boldsymbol{h}}_n^{c + 1}|{\boldsymbol{h}}_{{\mathrm{B}},n}^{c + 1,{\text{pri}}},{\boldsymbol{v}}_{\mathrm{B}}^{c + 1,{\text{pri}}})$

(4)

$\;\;{\boldsymbol{v}}_{{\mathrm{B}},n}^{c + 1,{\text{post}}} = {{\mathrm{diag}}} ({\mathrm{Var}}({\boldsymbol{h}}_n^{c + 1}|{\boldsymbol{h}}_{{\mathrm{B}},n}^{c + 1,{\text{pri}}},{\boldsymbol{v}}_{\mathrm{B}}^{c + 1,{\text{pri}}}))$

(5)

其中， ${E} ( \cdot )$ 代表求解期望的表达式， ${\mathrm{Var}}( \cdot )$ 代表求解方差的表达式， ${{\mathrm{diag}}} ( \cdot )$ 代表对角化处理。

(3) 对BS端 $M$ 根天线上的外部信息进行估计，当 $m = 1,2, \cdots ,M$ 时，通过贝叶斯计算，可得 ${\boldsymbol{z}}_{\mathrm{B}}^{c + 1,{\mathrm{post}}}[m]$ , ${\boldsymbol{v}}_{\text{B}}^{c + 1,{\text{post}}}[m]$ , ${\boldsymbol{z}}_{\text{A}}^{c + 1,{\mathrm{pri}}}[m]$ 和 ${\boldsymbol{v}}_{\text{A}}^{c + 1,{\text{pri}}}[m]$ 。

另一方面，对于第 $c + 1$ 层的步骤 (2)，可通过建立一个任意的加性白高斯噪声 (Additive White Gaussian Noise, AWGN) 模型来进行分析

${{\boldsymbol{r}}^{c + 1}} = {{\boldsymbol{h}}^{c + 1}} + {{\boldsymbol{\upsilon }}^{c + 1}}$

(6)

其中，等效噪声 ${{\boldsymbol{\upsilon }}^{c + 1}} {\text{～}} \mathcal{C}\mathcal{N}({{\textit{0}}},{\boldsymbol{v}}_{\text{B}}^{c + 1{\text{,pri}}}{\boldsymbol{I}})$ 。通过后验概率的原理，可从有噪信道 ${{\boldsymbol{r}}^{c + 1}}$ 中对 ${{\boldsymbol{h}}^{c + 1}}$ 的后验期望和后验方差进行计算

$\begin{split} {{E}}({{\boldsymbol{h}}^{c + 1}}|{{\boldsymbol{r}}^{c + 1}}) = \;&\frac{{{p_a}}}{{{{P(}}{{\boldsymbol{r}}^{c + 1}}{\text{)}}}}\mathcal{C}\mathcal{N}{\text{(}}{{\boldsymbol{r}}^{c + 1}};{{\textit{0}}},\eta {\boldsymbol{I}} + {\boldsymbol{v}}_{\text{B}}^{c + 1{\text{,pri}}}{\boldsymbol{I}}{\text{)}}\\ & \cdot{\left( {{\boldsymbol{I}} + \frac{{{\boldsymbol{v}}_{\text{B}}^{c + 1{\text{,pri}}}}}{\eta }{\boldsymbol{I}}} \right)^{ - 1}}{{\boldsymbol{r}}^{c + 1}}\\[-1pt] \end{split}$

(7)

$\begin{split} {{\mathrm{Var}}} ({{\boldsymbol{h}}^{c + 1}}|{{\boldsymbol{r}}^{c + 1}}) = \, &\frac{{{p_a}}}{{{{P(}}{{\boldsymbol{r}}^{c + 1}}{\text{)}}}}\mathcal{C}\mathcal{N}({{\boldsymbol{r}}^{c + 1}};{{\textit{0}}},\eta {\boldsymbol{I}} + {\boldsymbol{v}}_{\text{B}}^{c + 1{\text{,pri}}}{\boldsymbol{I}})\\ & \cdot\left[ \left( {{\boldsymbol{{A}}}\frac{1}{{{\boldsymbol{v}}_{\text{B}}^{c + 1{\text{,pri}}}}}{\boldsymbol{I}}{{\boldsymbol{r}}^{c + 1}}} \right)\right.\\ & \left.\cdot {{\left( {{\boldsymbol{{A}}}\frac{1}{{{\boldsymbol{v}}_{\text{B}}^{c + 1{\text{,pri}}}}}{\boldsymbol{I}}{{\boldsymbol{r}}^{c + 1}}} \right)}^{\text{H}}} + {\boldsymbol{{A}}} \right] \\ &- {{E}}({{\boldsymbol{h}}^{c + 1}}|{{\boldsymbol{r}}^{c + 1}}){{E}}{({{\boldsymbol{h}}^{c + 1}}|{{\boldsymbol{r}}^{c + 1}})^{\text{H}}} \\[-1pt] \end{split}$

(8)

其中， ${\boldsymbol{{A}}} = {({\eta ^{ - 1}}{\boldsymbol{I}} + {({\boldsymbol{v}}_{\text{B}}^{c + 1{\text{,pri}}})^{ - 1}}{\boldsymbol{I}})^{ - 1}}$ , ${{P}}({{\boldsymbol{r}}^{c + 1}}) = (1 - {p_a}) \mathcal{C}\mathcal{N} ({{\boldsymbol{r}}^{c + 1}}; {{\textit{0}}}, {\boldsymbol{v}}_{\text{B}}^{c + 1{\text{,pri}}}{\boldsymbol{I}} ) + {p_a}\mathcal{C}\mathcal{N} ({{\boldsymbol{r}}^{c + 1}}; {{\textit{0}}}, ( \eta + {\boldsymbol{v}}_{\text{B}}^{c + 1{\text{,pri}}}){\boldsymbol{I}})$ 。随着迭代次数的增加，即可深度学习的Turbo网络架构中层数的增加，信道估计的方差最终会逐步下降至收敛。

值得注意的是，本方案的GAN和DnCNN的降噪过程在信道估计中起着十分重要的作用，该降噪器可以处理诸如式(6)所示的AWGN降噪问题。如所示，首先利用GAN来生成最接近真实值的生成样本 ${{\boldsymbol{r}}_g}$ ，以及新的AWGN训练模型 ${{\boldsymbol{r}}_g} = {{\boldsymbol{h}}_g} + {{\boldsymbol{\upsilon}} _g}$ (为公式表达的简洁性，省略上标 $c + 1$ )作为DnCNN的输入。DnCNN由3种层所构成，第1种是64个 $3 \times 3 \times 1$ 的滤波器和整流线性单元(Rectified Linear Unit, ReLU)组成，第2种由64个 $3 \times 3 \times 64$ 的滤波器、批标准化 (Batch Normalization, BN) 以及ReLU构成，最后一种由单独的 $3 \times 3 \times 64$ 的滤波器进行信号重构。经过上述方法处理之后，输出结果为信道中包含的噪声，然后将输入信号减去该噪声值，即可得到经过降噪处理后的信道估计结果。该方案可以有效改善系统的训练时间和网络的准确性，从而提升信道估计的性能。

图 3 联合GAN和DnCNN的降噪模块图

下载: 全尺寸图片幻灯片

3.2 状态演化分析

接下来，从状态演化的角度，对所提方案的理论解析性能进行分析。针对可深度学习的Turbo消息传递网络的每一层，推导状态演化的公式为

${{\boldsymbol{\varsigma }}^c} = \left( {\frac{1}{{{\boldsymbol{v}}_{1,1}^c + {\sigma ^2}}}, \cdots ,\frac{1}{{{\boldsymbol{v}}_{M,M}^c + {\sigma ^2}}}} \right)$

(9)

$\begin{split} {{\boldsymbol{\varLambda }}^{c + 1}} = \;& {{\mathrm{diag}}} \left( {{\left( {\frac{{{\boldsymbol{v}}_{1,1}^c + {\sigma ^2}}}{\lambda } - {\boldsymbol{v}}_{1,1}^c} \right)}^{ - 1}}, \cdots ,\right.\\ & \left.{{\left( {\frac{{{\boldsymbol{v}}_{M,M}^c + {\sigma ^2}}}{\lambda } - {\boldsymbol{v}}_{M,M}^c} \right)}^{ - 1}} \right) \end{split}$

(10)

${({{\boldsymbol{V}}^{c + 1}})^{ - 1}} = N{\left( {\sum\limits_{n = 1}^N {{{{{\mathrm{MSE}}} }_n}({{\boldsymbol{\varLambda }}^{c + 1}})} } \right)^{ - 1}} - {{\boldsymbol{\varLambda }}^{c + 1}}$

(11)

其中， ${\boldsymbol{v}}_{1,1}^c,{\boldsymbol{v}}_{2,2}^c, \cdots ,{\boldsymbol{v}}_{M,M}^c$ 的初始化可直接根据级联信道 ${\boldsymbol{ H}}$ 进行计算， $\lambda$ 是导频矩阵的测量系数， ${{{\mathrm{MSE}}} _n}( \cdot )$ 为第 $n$ 个设备信道估计的均方误差 (Mean Square Error, MSE) 函数。对于第 $c + 1$ 层，通过 ${{\boldsymbol{\varLambda}} ^{c + 1}}$ 和 ${{\boldsymbol{V}}^{c + 1}}$ 彼此之间的不断更新，直至获取最终的收敛结果。

4. 仿真结果

4.1 仿真环境

针对所提的可深度学习的Turbo消息传递网络方案，本节从仿真结果和理论分析结果两个方面进行分析。系统中的所有在线设备个数为 $N = 500$ ，活跃度为0.05，RIS的幅度值 $\mu = 1$ ，导频序列的长度 $B = 200$ 。所有的设备都均匀分布在半径为500 m的圆内，RIS坐落在圆心，RIS与BS之间的距离为100 m。设备与RIS之间的链路损耗指数为2，RIS与BS之间的链路损耗指数为2.5，设备与BS之间的直接链路损耗指数为5。设置参考距离为50 m，该参考距离所对应的3种类型的链路损耗值分别为20 dB, 15 dB, 30 dB。该文所设计的网络方案层数为10，训练数据集中的信道 ${\boldsymbol{H}}$ 是通过伯努利高斯逼近信道模型产生，导频序列 ${\boldsymbol{W}}$ 则是通过离散傅里叶变换矩阵得到。整个模型训练的遍历次数为1 000次，在每一个遍历周期以内，训练数据集中包含5 000份真实训练样本和50 000份通过GAN产生的数据集，以及1 000份测试集。信道估计的代价函数为

${{\mathrm{MSE}}} = {\text{E}}\left\{ {\frac{{\left\| {{\boldsymbol{\hat H}} - {\boldsymbol{H}}} \right\|_2^2}}{{\left\| {{\boldsymbol{\hat H}}} \right\|_2^2}}} \right\}$

(12)

其中， ${\text{E}}\{ \cdot \}$ 为期望求解函数， $|| \cdot ||_2^2$ 为2范数求解。

4.2 仿真结果

如所示，实验考虑了不同系统模型下的信道估计结果。图例中，“AMP/GT, DL”与“AMP-net/GT-net, DL”分别代表的是在直接链路的传播环境中(即系统不配置RIS进行辅助)，通过近似消息传递(Approximate Message Passing, AMP) 和文献[]中的GT算法，采用无深度学习和深度学习的网络架构对信道进行估计；“RGT/RGT-net, DL+RIS”代表的是在直接链路和和RIS辅助的级联链路共存的情况下，RIS辅助的GT (RIS-aided GT, RGT)算法无深度学习和有深度学习的信道估计结果；“RGT/RGT-net, RIS”代表的是仅存在RIS辅助的传播链路，RGT分别采用传统架构和深度学习架构下的MSE性能结果。通过观察，可以发现，随着SNR取值的增加，所有传播环境设定和系统架构下所能获取的信道估计结果都随之下降。在所有的MSE性能曲线中，不采用深度学习多层学习和GAN-DnCNN融合方法的MSE性能较差，尤其是在仅考虑直接链路的情况下。例如，假定单纯依赖直接链路进行无线传输，当 ${{\mathrm{SNR}}} = 16$ dB的时候，通过深度学习网络，可为直接链路传播环境下的信道估计带来约10 dB的性能增益。进一步，考虑直接传播路径和RIS辅助的传播路径共存的场景，可以观察到，由于RIS技术相位可调的优势，大大提升了信道估计的精度。在此基础上，结合该文所设计的GAN进行样本增强，同时利用DnCNN进行降噪处理，可显著降低MSE的结果。此外，还可观察到，随着SNR取值的增加，通过深度学习网络所带来的MSE性能改善也会随之增加。

图 4 不同系统模型下的信道估计性能比较，

$M = 32$

下载: 全尺寸图片幻灯片

不同于，绘制的是BS天线数 $M = 64$ 时的信道估计曲线走向图，SNR的取值范围变化为0 ～15 dB。根据图4的结论，即无论是传统系统还是结合了深度学习的系统，RIS都会带来显著的性能改善，所以图5就不再考虑无RIS辅助系统下的信道估计结果。如图5所示，对于可深度学习的RIS辅助的大规模IoT系统，其信道估计的性能在SNR取值较低的时候仍旧能够获取令人满意的结果。此外，该文所设计的方案要明显优于AMP一类的算法，不管是在直接链路和RIS级联链路共存的传播环境下，还是仅考虑RIS链路的情况下。有一点需要注意的是，对于单纯考虑RIS级联链路的可深度学习的mMTC网络，其所能获取的MSE性能要优于同时考虑RIS级联链路和直接链路传播场景下的MSE结果。这是因为直接链路传输无线信号，不可避免会遇到传播环境较为恶劣的情况，从而带来较大的性能损失。

图 5 RIS辅助系统的MSE性能比较，

$M = 64$

下载: 全尺寸图片幻灯片

接下来，如图6所示，改变RIS单元的个数，观察在RIS辅助的时候，针对RIS和直接链路共存，以及只有RIS级联链路的传播场景下，不同算法在不采用深度学习的思想和融入深度学习技术情况下的信道估计结果。总的来说，随着RIS反射单元数量的增加，信道估计得到的MSE结果呈现上升趋势，这是因为系统会受到发射功率等其他系统参量因素的制约。当RIS的反射单元等于10的时候，考虑只有RIS的传播链路，可以观察到，融合了GAN和DnCNN的Turbo学习网络给信道估计的结果带来了超过10 dB的增益。另一方面，随着RIS反射单元数量上升至40，在深度学习的网络架构下，同时考虑直接链路和RIS级联链路传播环境所能获取的信道估计MSE结果几乎与单纯考虑RIS级联链路场景下的性能保持一致。这就说明，提高RIS反射单元的数量，可以弥补直接链路传播场景带来的性能损失，然而，增加该数量值也对系统功率带来了新的负担。所以，在实际系统中，要合理选择和设计RIS反射单元的数量值，力求在系统性能和功率消耗两方面取得良好折中。此外，图6还给出了AMP算法在RIS和深度学习辅助下的信道估计结果，可以发现，在不同的参数设计和系统架构下，该文提出的方案总是要优于AMP算法。

图 6 不同RIS单元数量下的MSE性能比较，

$M = 64$

下载: 全尺寸图片幻灯片

最后，通过设定不同的BS天线数和SNR的取值，给出在不同的深度学习层数下的信道估计仿真结果和理论解析结果。观察，可以发现，在 $M = 32$ 和 $M = 64$ 两种情况下，该文所分析的状态演化等式可以精准地预测Turbo消息传递学习网络中的每一层结果。值得注意的是，即便是在层数取值较小的情况下，也能获取稳定的结果，这一发现无疑降低了RIS辅助的大规模IoT系统进行深度学习的计算复杂度。最后，图7还给出了在离散傅里叶变换矩阵下的RAMP算法的深度学习结果，其MSE的性能曲线显示，随着学习层数的增加，该方法的MSE结果并未收敛，且在相同的仿真实验环境下，MSE取值要高于该文所提方案的结果。

图 7 不同学习层数下的MSE性能比较

下载: 全尺寸图片幻灯片

5. 结束语

本文提出一种新颖的可深度学习的Turbo消息传递网络学习架构，用于进行mMTC的大规模MIMO信道估计。本网络融合了GAN, DnCNN和CS信号恢复算法的优势，具有较低的计算复杂度和优异的信道估计性能。本网络可实现样本增强，且易于训练，在较少的学习层数下亦能取得令人满意的性能，具有一定的实用价值。此外，本文还给出了所提深度学习网络架构在大规模IoT场景下的理论性能分析方法，实验结果表明该方法可高效预测仿真结果的准确性，对未来大规模智能IoT无线传输的发展具有一定的参考价值。

未来将进一步研究：(1) 超大规模连接场景中的无线传输方法，寻求降低系统计算复杂度的估计检测方法；(2) 将深度学习方法与传统贝叶斯方法相结合，探索超大规模IoT系统中的设备感知技术方案；(3) RIS辅助的无蜂窝超大规模连接超大规模MIMO的轻量化系统设计与估计检测。

References(41)

References

[1]	PAPERNOT N, MCDANIEL P, SWAMI A, et al. Crafting adversarial input sequences for recurrent neural networks[C]. MILCOM 2016 - 2016 IEEE Military Communications Conference, Baltimore, USA, 2016: 49–54.
[2]	WANG Boxin, PEI Hengzhi, PAN Boyuan, et al. T3: Tree-autoencoder constrained adversarial text generation for targeted attack[C/OL]. The 2020 Conference on Empirical Methods in Natural Language Processing, 2020: 6134–6150.
[3]	LE T, WANG Suhang, and LEE D. MALCOM: Generating malicious comments to attack neural fake news detection models[C]. 2020 IEEE International Conference on Data Mining, Sorrento, Italy, 2020: 282–291.
[4]	MOZES M, STENETORP P, KLEINBERG B, et al. Frequency-guided word substitutions for detecting textual adversarial examples[C/OL]. The 16th Conference of the European Chapter of the Association for Computational Linguistics, 2021: 171–186.
[5]	TAN S, JOTY S, VARSHNEY L, et al. Mind your Inflections! Improving NLP for non-standard Englishes with Base-Inflection encoding[C/OL]. The 2020 Conference on Empirical Methods in Natural Language Processing, 2020: 5647–5663.
[6]	潘文雯, 王新宇, 宋明黎, 等. 对抗样本生成技术综述[J]. 软件学报, 2020, 31(1): 67–81. doi: 10.13328/j.cnki.jos.005884 PAN Wenwen, WANG Xinyu, SONG Mingli, et al. Survey on generating adversarial examples[J]. Journal of Software, 2020, 31(1): 67–81. doi: 10.13328/j.cnki.jos.005884
[7]	MILLER D, NICHOLSON L, DAYOUB F, et al. Dropout sampling for robust object detection in open-set conditions[C]. 2018 IEEE International Conference on Robotics and Automation, Brisbane, Australia, 2018: 3243–3249.
[8]	王文琦, 汪润, 王丽娜, 等. 面向中文文本倾向性分类的对抗样本生成方法[J]. 软件学报, 2019, 30(8): 2415–2427. doi: 10.13328/j.cnki.jos.005765 WANG Wenqi, WANG Run, WANG Li’na, et al. Adversarial examples generation approach for tendency classification on Chinese texts[J]. Journal of Software, 2019, 30(8): 2415–2427. doi: 10.13328/j.cnki.jos.005765
[9]	仝鑫, 王罗娜, 王润正, 等. 面向中文文本分类的词级对抗样本生成方法[J]. 信息网络安全, 2020, 20(9): 12–16. doi: 10.3969/j.issn.1671-1122.2020.09.003 TONG Xin, WANG Luona, WANG Runzheng, et al. A generation method of word-level adversarial samples for Chinese text classiifcation[J]. Netinfo Security, 2020, 20(9): 12–16. doi: 10.3969/j.issn.1671-1122.2020.09.003
[10]	BLOHM M, JAGFELD G, SOOD E, et al. Comparing attention-based convolutional and recurrent neural networks: Success and limitations in machine reading comprehension[C]. The 22nd Conference on Computational Natural Language Learning, Brussels, Belgium, 2018: 108–118.
[11]	NIU Tong and BANSAL M. Adversarial over-sensitivity and over-stability strategies for dialogue models[C]. The 22nd Conference on Computational Natural Language Learning, Brussels, Belgium, 2018: 486–496.
[12]	EBRAHIMI J, LOWD D, and DOU Dejing. On adversarial examples for character-level neural machine translation[C]. The 27th International Conference on Computational Linguistics, Santa Fe, USA, 2018: 653–663.
[13]	GAO Ji, LANCHANTIN J, SOFFA M L, et al. Black-box generation of adversarial text sequences to evade deep learning classifiers[C]. 2018 IEEE Security and Privacy Workshops, San Francisco, USA, 2018: 50–56.
[14]	GOODMAN D, LV Zhonghou, and WANG Minghua. FastWordBug: A fast method to generate adversarial text against NLP applications[J]. arXiv preprint arXiv: 2002.00760, 2020.
[15]	EBRAHIMI J, RAO Anyi, LOWD D, et al. HotFlip: White-box adversarial examples for text classification[C]. The 56th Annual Meeting of the Association for Computational Linguistics, Melbourne, Australia, 2018: 31–36.
[16]	SONG Liwei, YU Xinwei, PENG H T, et al. Universal adversarial attacks with natural triggers for text classification[C/OL]. The 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 2021: 3724–3733.
[17]	LI Dianqi, ZHANG Yizhe, PENG Hao, et al. Contextualized perturbation for textual adversarial attack[C/OL]. The 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 2021: 5053–5069.
[18]	TAN S, JOTY S, KAN M Y, et al. It's Morphin' time! Combating linguistic discrimination with inflectional perturbations[C/OL]. The 58th Annual Meeting of the Association for Computational Linguistics, 2020: 2920–2935.
[19]	LI Linyang, MA Ruotian, GUO Qipeng, et al. BERT-ATTACK: Adversarial attack against BERT using BERT[C/OL]. The 2020 Conference on Empirical Methods in Natural Language Processing, 2020: 6193–6202.
[20]	ZANG Yuan, QI Fanchao, YANG Chenghao, et al. Word-level textual adversarial attacking as combinatorial optimization[C/OL]. The 58th Annual Meeting of the Association for Computational Linguistics, 2020: 6066–6080.
[21]	CHENG Minhao, YI Jinfeng, CHEN Pinyu, et al. Seq2Sick: Evaluating the robustness of sequence-to-sequence models with adversarial examples[C]. The 34th AAAI Conference on Artificial Intelligence, New York, USA, 2020: 3601–3608.
[22]	JIA R and LIANG P. Adversarial examples for evaluating reading comprehension systems[C]. The 2017 Conference on Empirical Methods in Natural Language Processing, Copenhagen, Denmark, 2017: 2021–2031.
[23]	MINERVINI P and RIEDEL S. Adversarially regularising neural NLI models to integrate logical background knowledge[C]. The 22nd Conference on Computational Natural Language Learning, Brussels, Belgium, 2018: 65–74.
[24]	WANG Yicheng and BANSAL M. Robust machine comprehension models via adversarial training[C]. The 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, New Orleans, USA, 2018: 575–581.
[25]	RIBEIRO M T, SINGH S, and GUESTRIN C. Semantically equivalent adversarial rules for debugging NLP models[C]. The 56th Annual Meeting of the Association for Computational Linguistics, Melbourne, Australia, 2018: 856–865.
[26]	IYYER M, WIETING J, GIMPEL K, et al. Adversarial example generation with syntactically controlled paraphrase networks[C]. The 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, New Orleans, USA, 2018: 1875–1885.
[27]	HAN Wenjuan, ZHANG Liwen, JIANG Yong, et al. Adversarial attack and defense of structured prediction models[C/OL]. The 2020 Conference on Empirical Methods in Natural Language Processing, 2020: 2327–2338.
[28]	WANG Tianlu, WANG Xuezhi, QIN Yao, et al. CAT-Gen: Improving robustness in NLP models via controlled adversarial text generation[C/OL]. The 2020 Conference on Empirical Methods in Natural Language Processing, 2020: 5141–5146.
[29]	魏星, 王小辉, 魏亮, 等. 基于规范科技术语数据库的科技术语多音字研究与读音推荐[J]. 中国科技术语, 2020, 22(6): 25–29. doi: 10.3969/j.issn.1673-8578.2020.06.005 WEI Xing, WANG Xiaohui, WEI Liang, et al. Pronunciation recommendations on polyphonic characters in terms based on the database of standardized terms[J]. China Terminology, 2020, 22(6): 25–29. doi: 10.3969/j.issn.1673-8578.2020.06.005
[30]	KIRITCHENKO S, ZHU Xiaodan, CHERRY C, et al. NRC-Canada-2014: Detecting aspects and sentiment in customer reviews[C]. The 8th International Workshop on Semantic Evaluation (SemEval 2014), Dublin, Ireland, 2014: 437–442.
[31]	TANG Duyu, QIN Bing, FENG Xiaocheng, et al. Effective LSTMs for target-dependent sentiment classification[C]. COLING 2016, the 26th International Conference on Computational Linguistics, Osaka, Japan, 2016: 3298–3307.
[32]	TANG Duyu, QIN Bing, and LIU Ting. Aspect level sentiment classification with deep memory network[C]. The 2016 Conference on Empirical Methods in Natural Language Processing, Austin, USA, 2016: 214–224.
[33]	MA Dehong, LI Sujian, ZHANG Xiaodong, et al. Interactive attention networks for aspect-level sentiment classification[C]. The 26th International Joint Conference on Artificial Intelligence, Melbourne, Australia, 2017: 4068–4074.
[34]	HUANG Binxuan, OU Yanglan, and CARLEY K M. Aspect level sentiment classification with attention-over-attention neural networks[C]. The 11th International Conference on Social Computing, Behavioral-Cultural Modeling and Prediction and Behavior Representation in Modeling and Simulation, Washington, USA, 2018: 197–206.
[35]	SONG Youwei, WANG Jiahai, JIANG Tao, et al. Targeted sentiment classification with attentional encoder network[C]. The 28th International Conference on Artificial Neural Networks, Munich, Germany, 2019: 93–103.
[36]	HE Ruidan, LEE W S, NG H T, et al. Effective attention modeling for aspect-level sentiment classification[C]. The 27th International Conference on Computational Linguistics, Santa Fe, USA, 2018: 1121–1131.
[37]	HUANG Binxuan and CARLEY K M. Syntax-aware aspect level sentiment classification with graph attention networks[C]. The 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP), Hong Kong, China, 2019: 5469–5477.
[38]	ZHANG Chen, LI Qiuchi, and SONG Dawei. Aspect-based sentiment classification with aspect-specific graph convolutional networks[C]. The 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP), Hong Kong, China, 2019: 4568–4578.
[39]	WANG Yuanchao, LI Mingtao, PAN Zhichen, et al. Pulsar candidate classification with deep convolutional neural networks[J]. Research in Astronomy and Astrophysics, 2019, 19(9): 133. doi: 10.1088/1674-4527/19/9/133
[40]	唐恒亮, 尹棋正, 常亮亮, 等. 基于混合图神经网络的方面级情感分类[J]. 计算机工程与应用, 2023, 59(4): 175–182. doi: 10.3778/j.ssn.1002-8331.2109-0172 TANG Hengliang, YIN Qizheng, CHANG Liangliang, et al. Aspect-level sentiment classification based on mixed graph neural network[J]. Computer Engineering and Applications, 2023, 59(4): 175–182. doi: 10.3778/j.ssn.1002-8331.2109-0172
[41]	KUSNER M J, SUN Yu, KOLKIN N I, et al. From word embeddings to document distances[C]. The 32nd International Conference on Machine Learning, Lille, France, 2015: 957–966.

Relative Articles

Supplements(0)

Cited By

Cited by

Periodical cited type(3)

1.	李波，游剑铭，刘晓放，王荣，冷贵峰，马建伟. 基于告警信息和CNN的变电站故障诊断方法研究. 煤矿机械. 2024(04): 161-164 .
2.	刘文娟，吴厚月，张顺香. 基于改进蚁群算法的对抗样本生成模型. 中文信息学报. 2024(08): 44-54 .
3.	吴厚月，李现伟，张顺香，朱洪浩，王婷. 基于攻击引导扩散的中文对抗样本生成方法. 清华大学学报(自然科学版). 2024(12): 1997-2006 .

Other cited types(9)

Proportional views

Proportional views

通讯作者: 陈斌, bchen63@163.com

1.
沈阳化工大学材料科学与工程学院沈阳 110142

Figures(5) / Tables(5)

Get Citation

PDF

XML

Article Metrics

Article views (904) PDF downloads(157)