Action Recognition Network Combining Spatio-Temporal Adaptive Graph Convolution and Transformer

HAN Zongwang; YANG Han; WU Shiqing; CHEN Long

doi:10.11999/JEIT230551

Volume 46 Issue 6

Jun. 2024

Turn off MathJax

Article Contents

Article Navigation > Journal of Electronics & Information Technology > 2024 > 46(6): 2587-2595

Bin SHEN, Hebiao WU, Taiping CUI, Qianbin CHEN. An Optimal Number of Indices Aided gOMP Algorithm for Multi-user Detection in NOMA System[J]. Journal of Electronics & Information Technology, 2020, 42(3): 621-628. doi: 10.11999/JEIT190270

Citation:

HAN Zongwang, YANG Han, WU Shiqing, CHEN Long. Action Recognition Network Combining Spatio-Temporal Adaptive Graph Convolution and Transformer[J]. Journal of Electronics & Information Technology, 2024, 46(6): 2587-2595. doi: 10.11999/JEIT230551

Citation:

PDF( 4062 KB)

Action Recognition Network Combining Spatio-Temporal Adaptive Graph Convolution and Transformer

doi: 10.11999/JEIT230551

School of Mechanical Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China

Funds: The National Natural Science Foundation of China (52005338)

Received Date: 2023-06-05
Rev Recd Date: 2024-03-11

Available Online: 2024-04-08

Publish Date: 2024-06-30

Abstract

Abstract

In a human-centered smart factory, perceiving and understanding workers’ behavior is crucial, as different job categories are often associated with work time and tasks. In this paper, the accuracy of the model’s recognition is improved by combining two approaches, namely adaptive graphs and Transformers, to focus more on the spatiotemporal information of the skeletal structure. Firstly, an adaptive graph method is employed to capture the connectivity relationships beyond the human body skeleton. Furthermore, the Transformer framework is utilized to capture the dynamic temporal variations of the worker’s skeleton. To evaluate the model’s performance, six typical worker action datasets are created for intelligent production line assembly tasks and validated. The results indicate that the model proposed in this article has a Top-1 accuracy comparable to mainstream action recognition models. Finally, the proposed model is compared with several mainstream methods on the publicly available NTU-RGBD and Skeleton-Kinetics datasets, and the experimental results demonstrate the robustness of the model proposed in this paper.
- Intelligent manufacturing,
- Recognition of worker activity,
- Deep learning,
- Adaptive graph,
- Transformer

FullText(HTML)

1. 引言

随着无线通信的快速发展，监控物联网受到了工业界和学术界的广泛关注^[1]。在监控物联网中，感知设备需要不断采集监控目标的状态信息，并通常使用短包传输状态信息给无线接入节点(Access Point, AP)，从而帮助AP完成监控任务^[2]。例如，智慧医疗中传感器节点收集人的体征信息并将其发送给监管中心，自动驾驶中定位装置将位置信息发送给数据交互中心，智能工厂中监控节点采集机器设备的状态信息并将其发送给监控中心^[3]等。监控物联网遍及人们生产生活的方方面面，并为社会的生产发展提供极大便利。

在监控物联网中，信息传输的时效性和能效性非常重要^[4]。实时的状态信息可以帮助决策者快速有效地做出决策，为了准确刻画信息传输的时效性，Kaul等人^[5]提出了信息年龄(Age of Information, AoI)指标，其定义为当前时刻与接收端成功收到的最新数据包产生时刻的时间差。不同于时延，AoI是一个综合性指标，其综合度量了发包速率、传输可靠性和传输延迟的影响^[6]，若发包速率较慢或者传输可靠性较低，那么数据包的更新频率将变低，AoI长时间得不到更新，若传输延迟较高，那么每次成功更新的数据包将变得老旧，AoI的每次更新值变大。AoI被认为是刻画通信时效性的有效指标，受到了业界的广泛研究^[7]。能量效率(Energy Efficiency, EE)是监控物联网中另一个重要指标^[4]，感知设备通常由电池供电，能量有限，提高EE可以有效延长感知设备的服务时间，如果传输信息的EE很低，可能会造成感知设备频繁更换能源器件。然而，时效性和能效性通常不能同时达到最优^[8]，因为发送信号的功率越高时效性越好，而能效性并不随信号功率增加而单调增加，如何在时效性和能效性之间取得有效折衷是监控物联网中的一个关键问题。

此外，监控物联网中传输的主要是感知设备收集的关键状态信息，其信息量十分有限，通常使用短包(Short Packet)进行传输^[9,10]。与传统长包通信不同，香农公式难以准确描述短包场景下的传输性能。Durisi等人^[11]指出，由于数据包长度较短，短包传输过程中热噪声和信道畸变无法被平均化，所以即使传输速率小于当前信道容量，系统依然会存在一个非零的误包率。Polyanskiy等人^[12]从信息论的角度推导出了加性高斯白噪声(Additive White Gaussian Noise, AWGN)信道下短包通信中误包率的闭式表达式。当误包情况发生时，信息无法及时更新，系统的时效性和能效性都会降低，所以提高短包传输的可靠性对于短包通信来说十分重要。智能反射面(Intelligent Reflecting Surface, IRS)技术被认为是提高短包通信可靠性的有效技术^[13,14]。具体而言，IRS由大量的被动反射单元组成，每个单元可以通过调节相位和幅度来独立反射入射信号，从而实现信号增强和干扰抑制的目的^[15]，利用IRS技术增强短包信号，有利于短包传输可靠性的提高。基于此，IRS辅助短包通信受到了广泛研究。

为了充分发挥IRS技术在短包通信中的作用，人们对IRS辅助短包通信的各项性能展开分析。Hashemi等人^[16]分析了IRS有限相位条件下用户的平均误包率和平均可实现速率。Wang等人^[17]推导了系统的检测错误概率，并揭示出引入IRS可以提高系统的隐蔽性和可靠性性能，同时减少所需最小包长，这对短包通信系统至关重要。文献[18]在窃听者存在条件下分析了安全容量、安全中断概率和安全误包率。Le等人^[19]研究了分布式IRS辅助无线供电网络中的EE。然而，在IRS辅助短包通信中，如何折衷时效性能与能效性能目前鲜有考虑。

对此，本文针对监控物联网，研究了IRS辅助短包通信系统中时效性与能效性之间的折衷问题。本文的主要贡献如下：(1)设计了一种接入控制协议，有效地为接入设备分配通信资源，避免随机发包导致的碰撞问题，并推导了平均AoI和EE的表达式。(2)引入了平均AoI与EE之比这个指标，并给出信号传输功率优化方案，使得平均AoI与EE之比最小化，从而实现时效性与能效性的有效折衷。(3)对所提方案进行了仿真，仿真结果验证了理论分析的正确性，同时表明所提方案能够实现更好的时效性和能效性。

2. 系统模型

为传输模型图，本文考虑的是一个实时监控物联网，其中 $K$ 个设备采集监控信息，并使用短数据包将监控信息回传给AP，为增强覆盖效果和传输性能，部署一个包含 $M$ 个反射单元的IRS来辅助短数据包传输。信道总带宽为 $B$ ，所有信道均为准静态平坦块衰落信道，信道系数在一个长为 $T$ 的时隙内保持不变，在不同时隙中独立变化。为了节省设备发送信息带来的能源开销，设备在每个时隙中以一定概率 ${p_{{\text{collect}}}}$ 采集监控信息并将其发送给AP，当设备采集到新的信息包，设备会立即将旧信息包丢弃。

图 1 IRS辅助短包通信系统

下载: 全尺寸图片幻灯片

由于系统中设备数量较多，且所有设备之间没有信息交互，所以信息传输过程中会发生严重的数据包碰撞^[20]。为此，本文提出一种接入控制协议来避免资源块的浪费。为具体的传输协议图，该图展示了该文设计的接入控制协议。将每个时隙分为两个阶段，分别为控制阶段和传输阶段。在控制阶段，该时隙采集监控信息的设备首先向AP发送信号请求与AP建立连接，AP计算其服务区内请求连接的设备数量，然后设计接入控制和资源分配方案，并将其广播给所有设备，告诉设备占用哪个资源块发送信息。在传输阶段，设备按照收到的传输方案向AP发送信息。传输方案具体设计如下：首先将每个时隙划分成 $J$ 个资源块，若请求连接的设备数量少于资源块数量，则为每个设备分配不同的资源块，若请求连接的设备数量多于资源块数量，则在所有请求连接的设备中随机选取 $J$ 个设备，并为它们分配不同资源块，其它未被选中的设备不允许在该时隙发送信息。

在该系统中，IRS第 $m$ 个反射单元的调控相移表示为 ${\theta _m} \in \left[ {0,2{\pi}} \right)$ ，那么IRS的对角相移矩阵可表示为 ${\boldsymbol{\varPhi }} = {{\mathrm{diag}}}\left( {{v_1},{v_2}, \cdots ,{v_M}} \right)$ ，其中 ${v_m} = {{\text{e}}^{{\text{j}}{\theta _m}}}$ 为第 $m$ 个反射单元的反射系数。设备 $k$ -AP链路、设备 $k$ -IRS链路以及IRS-AP链路之间的基带等效信道分别表示为 ${h_{{{k{\mathrm{a}}}}}}$ ， ${{\boldsymbol{h}}}_{{{k{\mathrm{r}}}}}^{\text{H}} = [{h_{{{k{\mathrm{r}}}},1}},{h_{{{k{\mathrm{r}}}},2}}, \cdots ,{h_{{{k{\mathrm{r}}}},{{M}}}}]$ 和 ${{\boldsymbol{h}}}_{{\text{ra}}}^{\text{H}} = [{h_{{\text{ra,1}}}}, {h_{{\text{ra,2}}}}, \cdots ,{h_{{{{\mathrm{ra}},M}}}}]$ ，那么设备 $k$ 与AP之间的复合信道系数可表示为

${h_{{k}}} = {h_{{{k{\mathrm{a}}}}}} + {{\boldsymbol{h}}}_{{{k{\mathrm{r}}}}}^{\text{H}}{{\boldsymbol{\varPhi}} {\boldsymbol{h}}}_{{\text{ra}}}^{\text{*}}$

(1)

其中任意两节点间的信道系数为 ${h_\chi } = \sqrt {{L_0}d_\chi ^{ - \eta }} {g_\chi }$ ， ${L_0}$ 表示单位距离下的路径损耗， ${d_\chi }$ 表示节点间的距离， $\eta$ 表示路径损失系数， ${g_\chi }$ 表示均值为0方差为1的小尺度衰落系数， $\chi = \left\{ {\left( {{{k{\mathrm{a}}}}} \right),\left( {{{k{\mathrm{r}}}},i} \right),\left( {{\text{ra}},i} \right)} \right\}$ ， $i = 1, 2,\cdots ,M$ 。将设备 $k$ 的信号传输功率表示为 $P$ ，那么AP收到的信号可表示为

${y_k} = \sqrt P {h_k}{x_k} + {n_0}$

(2)

其中， ${x_k}$ 为设备 $k$ 的发送信号， ${n_0}$ 表示均值为0方差为 ${\sigma ^2}$ 的加性高斯白噪声。接收信号的信噪比为

${\gamma _k} = \frac{{P{{\left| {{h_k}} \right|}^2}}}{{{\sigma ^2}}}$

(3)

基于现有的IRS辅助信道估计技术^[21]，估计信道和实际信道之间的均方误差可以缩小到10^–5，所以本文假设IRS处可以获取所有链路的完美信道状态信息(Channel State Information, CSI)。为了最大化设备 $k$ 与AP之间的复合信道增益，可以将IRS相位优化为 ${\theta _m} = \angle {h_{{{k{\mathrm{a}}}}}} - \angle {h_{{{k{{{\mathrm{r}},m}}}}}} - \angle {h_{{{{\mathrm{ra}},m}}}}$ ^[22]， $\forall m \in \left\{ 1, 2, \cdots ,M \right\}$ ，其中 $\angle x$ 表示对复数 $x$ 取相位，由此可获得最大信道系数模值为

$\left| {{h_k}} \right| = \left| {{h_{{{k{\mathrm{a}}}}}}} \right| + \sum\limits_{m = 1}^M {\left| {{h_{{{k{{{\mathrm{r}},m}}}}}}} \right|\left| {{h_{{{{\mathrm{ra}},m}}}}} \right|}$

(4)

其中 $\left| {{h_k}} \right|$ 的精确分布难以求解，但当IRS反射单元数目较大时，可以利用中心极限定理对 $\left| {{h_k}} \right|$ 的概率分布进行近似表征^[19]。具体而言， $\left| {{h_k}} \right|$ 近似服从高斯分布，其均值为 ${\varPsi } = \sqrt {{\pi}{L_0}{{d}}_{{{k{\mathrm{a}}}}}^{ - \eta }} /2 + M{\pi}{L_0} \sqrt {{{d}}_{{\text{kr}}}^{ - \eta }{{d}}_{{\text{ra}}}^{ - \eta }} /4$ ，方差为 ${{{\varTheta}} } = \left( {1 - {\pi}/4} \right){L_0}{{d}}_{{{k{\mathrm{a}}}}}^{ - \eta } + M\left( 1 - {{\pi}^2}/16 \right) L_0^2{{d}}_{{{k{\mathrm{r}}}}}^{ - \eta }{{d}}_{{\text{ra}}}^{ - \eta }$ ， ${d_{{{k{\mathrm{a}}}}}}$ , ${d_{{{k{\mathrm{r}}}}}}$ 和 ${d_{{\text{ra}}}}$ 分别表示设备 $k$ -AP链路，设备 $k$ -IRS链路以及IRS-AP链路之间的距离。由此， $\left| {{h_k}} \right|$ 的累积分布函数(Cumulative Distribution Function, CDF)可以表示为^[19]

${F_{\left| {{h_k}} \right|}}\left( x \right) = \int\limits_{ - \infty }^{\frac{{x - {\varPsi }}}{{\sqrt {\varTheta } }}} {\frac{1}{{\sqrt {2{\pi}} }}\exp \left( { - \frac{{{t^2}}}{2}} \right){\text{d}}t}$

(5)

由于 ${\gamma _k} = P{\left| {{h_k}} \right|^2}/{\sigma ^2}$ ，所以 ${\gamma _k}$ 的CDF可以表示为^[19]

$\begin{split} {F_{{\gamma _k}}}\left( x \right)\;& = {F_{\left| {{h_k}} \right|}}\left( {\sqrt {{\sigma ^2}x/P} } \right) \\ & = \int\limits_{ - \infty }^{\frac{{\sqrt {{\sigma ^2}x/P} - {\varPsi }}}{{\sqrt {\varTheta } }}} {\frac{1}{{\sqrt {2{\pi}} }}\exp \left( { - \frac{{{t^2}}}{2}} \right){\text{d}}t} \end{split}$

(6)

3. 性能分析

在实时监控物联网中，感知设备数量多且每个时隙划分的资源块数量有限，设备采集完监控信息之后并不一定能够在该时隙中接入系统，且接入系统的设备向AP发送短数据包之后，AP解码短包存在一定的解码错误概率，这些都会影响平均AoI和EE。为此，本文先分析设备的接入成功概率和AP解码信息的解码成功概率，基于此，再推导系统的平均AoI和EE，并引入平均AoI和EE之比这一指标。

3.1 接入成功概率

该系统中 $K$ 个设备之间没有信息交互，所有设备均以采样概率 ${p_{{\text{collect}}}}$ 独立采集信息。在设备 $k$ 需要采集信息的条件下，其它 $K - 1$ 个设备中有 $i\left( 0 \le i \le K - 1 \right)$ 个设备同时采集信息的概率为 $p_{{\text{collect}}}^i \cdot {\left( {1 - {p_{{\text{collect}}}}} \right)^{K - 1 - i}}C_{K - 1}^i$ 。当一个时隙中采集信息的设备数量 $1 + i$ 少于资源块数量 $J$ 时，每个请求连接的设备都能分配到资源块，设备 $k$ 可以成功接入，当采集的设备数量 $1 + i$ 大于资源块数量 $J$ 时，设备 $k$ 分配到资源块并成功接入的概率为 $J/\left( {1 + i} \right)$ ，所以设备 $k$ 的接入成功概率为

$\begin{split} {p_{{\text{access}}}} =\;& \sum\limits_{i = 0}^{J - 1} {p_{{\text{collect}}}^i{{\left( {1 - {p_{{\text{collect}}}}} \right)}^{K - 1 - i}}C_{K - 1}^i}\\ & + \sum\limits_{i = J}^{N - 1} {p_{{\text{collect}}}^i{{\left( {1 - {p_{{\text{collect}}}}} \right)}^{K - 1 - i}}C_{K - 1}^i\frac{J}{{1 + i}}} \end{split}$

(7)

3.2 解码成功概率

设备接入成功以后，会通过短包将采集的信息传给AP。而在短包传输过程中，即使传输速率小于当前信道容量，AP解码信息依然会存在一个非0的解码错误概率，其表达式为^[12]

$\varepsilon = Q\left[ {\frac{{\sqrt n \left( {\ln \left( {1 + {\gamma _k}} \right) - \ln 2\dfrac{D}{n}} \right)}}{{\sqrt {1 - 1/{{\left( {1 + {\gamma _k}} \right)}^2}} }}} \right]$

(8)

其中， $n$ 表示每个资源块的包长， $D$ 表示短包中包含的信息量， $Q\left( \cdot \right)$ 为高斯右尾分布函数，其具体表达式为 $Q\left( x \right) = \displaystyle\int_x^{ + \infty } {1/\sqrt {2{\pi}} \times } \exp \left( { - {t^2}/2} \right){\text{d}}t$ 。由于式(8)中 $Q$ 函数的形式复杂，不利于进一步求解平均解码错误概率。为此，本文将其线性近似为^[20]

$\varepsilon \approx \left\{ \begin{aligned} & {1,\:\:\:\qquad\qquad\qquad {\gamma _k} < u - v} \\ &{ - w\left( {{\gamma _k} - u} \right) + \frac{1}{2},u - v \le {\gamma _k} \le u + v} \\ &{0,\:\:\:\qquad\qquad\qquad {\gamma _k} > u + v} \end{aligned} \right.$

(9)

其中， $w = \sqrt {\dfrac{n}{{2{\pi}\left( {{2^{2D/n}} - 1} \right)}}}$ , $u = {2^{D/n}} - 1$ , $v = \dfrac{1}{{2w}}$ 。通过近似式(9)可求出平均解码错误概率为

$\begin{split} \bar \varepsilon = \;&\int\limits_0^\infty \varepsilon {f_{{\gamma _k}}}\left( x \right){\text{d}}x = w\int\limits_{u - v}^{u + v} {{F_{{\gamma _k}}}\left( x \right)} {\text{d}}x\\ =\;&{ w\int\limits_{u - v}^{u + v} {{\text{d}}x} \int\limits_{ - \infty }^{\frac{{\sqrt {{\sigma ^2}x/P} - {\varPsi }}}{{\sqrt {\varTheta } }}} {\frac{1}{{\sqrt {2{\pi}} }}\exp \left( { - \frac{{{t^2}}}{2}} \right){\text{d}}t} } \end{split}$

(10)

式(10)是一个复杂的函数，不便于分析，利用积分中值定理，可将平均解码错误概率进一步近似为

$\bar \varepsilon \approx \int\limits_{ - \infty }^{\frac{{\sqrt {{\sigma ^2}u/P} - {\varPsi }}}{{\sqrt {\varTheta } }}} {\frac{1}{{\sqrt {2{\pi}} }}\exp \left( { - \frac{{{t^2}}}{2}} \right){\text{d}}t}$

(11)

基于此，可推出AP解码信息的解码成功概率为

${p_{{\text{decode}}}} = 1 - \bar \varepsilon = Q\left( {\frac{{\sqrt {{\sigma ^2}u/P} - {\varPsi }}}{{\sqrt {\varTheta } }}} \right)$

(12)

3.3 平均信息年龄

本节将推导平均AoI的闭式表达式，为了阐明AoI随时间的变化关系，以设备 $k$ 的AoI，即 ${{\varDelta }_k}$ 为例进行说明。如所示， ${{\varDelta }_k}$ 首先随着时间 $t$ 的增长而线性增长，当设备 $k$ 采集信息并通过短包传输成功时， ${{\varDelta }_k}$ 更新为最新收到的数据包的信息年龄 $T$ ，随后 ${{\varDelta }_k}$ 继续随时间 $t$ 线性增长，当数据包传输失败 (未采集信息、接入失败或解码失败) 时， ${{\varDelta }_k}$ 将维持增长而不被更新，直到下次新包传输成功时， ${{\varDelta }_k}$ 才再次更新为 $T$ 。

图 2 AoI更新过程

下载: 全尺寸图片幻灯片

平均AoI为AoI随时间变化的长期平均值，其定义式为^[20]

${\bar \varDelta } = \mathop {\lim }\limits_{\tau \to \infty } \frac{1}{\tau }\int\limits_0^\tau {{{\varDelta }_k}\left( t \right)} {\text{d}}t$

(13)

为了计算方便，将第 $i$ 次传输成功完成时刻到第 $i + 1$ 次传输成功完成时刻内AoI随时间的积分表示为 ${Z_i}$ ，那么平均AoI的计算式可以转化为

${\bar \varDelta } = \mathop {\lim }\limits_{\tau \to \infty } \frac{1}{\tau }\sum\limits_{i = 1}^{W\left( \tau \right)} {{Z_i}} = \mathop {\lim }\limits_{\tau \to \infty } \frac{{W\left( \tau \right)}}{\tau }\mathbb{E}\left( {{Z_i}} \right)$

(14)

其中， $W\left( \tau \right)$ 表示在时刻 $\tau$ 之前传输成功的次数， $\mathbb{E}\left( \cdot \right)$ 表示求均值运算。将第 $i$ 次传输成功到第 $i + 1$ 次传输成功所经历的总时隙数表示为 ${q_i}$ ，那么平均AoI的计算式又可转化为

${\bar \varDelta } = \mathop {\lim }\limits_{\tau \to \infty } \frac{{W\left( \tau \right)\left( {2\mathbb{E}\left( {{q_i}} \right) + \mathbb{E}\left( {q_i^2} \right)} \right){T^2}}}{{2\tau }}$

(15)

由于成功传输1次数据包所花的平均时间为 $\mathbb{E}\left( {{q_i}} \right)T$ ，所以 $\mathop {\lim }\limits_{\tau \to \infty } W\left( \tau \right)/\tau = 1/\left[ {\mathbb{E}\left( {{q_i}} \right)T} \right]$ ，平均AoI可进一步计算为 ${\bar \varDelta } = T + T\mathbb{E}\left( {q_i^2} \right)/\left[ {2\mathbb{E}\left( {{q_i}} \right)} \right]$ 。由于传输成功概率为采样概率、接入成功概率和解码成功概率的乘积，即 ${p_{{\text{success}}}} = {p_{{\text{collect}}}}{p_{{\text{access}}}}{p_{{\text{decode}}}}$ ，所以 $\mathbb{E}\left( {{q_i}} \right) = 1/{p_{{\text{success}}}}$ , $\mathbb{E}\left( {q_i^2} \right) = \left( {2 - {p_{{\text{success}}}}} \right)/p_{{\text{success}}}^2$ ，由此，可推导出平均AoI的闭式表达式为

${\bar \varDelta } = \frac{T}{2}\left( {1 + \frac{2}{{{p_{{\text{success}}}}}}} \right) = \frac{T}{2}\left( {1 + \frac{2}{{{p_{{\text{collect}}}}{p_{{\text{access}}}}{p_{{\text{decode}}}}}}} \right)$

(16)

随着信号传输功率增大，解码成功概率 ${p_{{\text{decode}}}}$ 会逐渐增大并趋于定值1，所以由式(16)可看出，平均AoI会随信号传输功率增大而逐渐减小并趋于定值 $T\left[ {1 + 2/\left( {{p_{{\text{collect}}}}{p_{{\text{access}}}}} \right)} \right]/2$ 。

3.4 能量效率

该系统中设备由电池供电，传输监控信息的能量有限，所以我们更加关注设备传输信息所消耗的能量，而不考虑AP和IRS所消耗的能量。EE为设备平均消耗每单位能量所能传输成功的信息量，其具体表达式为

$\eta = \frac{{D{p_{{\text{decode}}}}}}{{PT/J}}$

(17)

其中，分子为传输1次数据包平均传输成功的信息量，分母为设备传输1次数据包所消耗的能量。由于解码成功概率 ${p_{{\text{decode}}}}$ 随信号传输功率增大而增大并趋于定值1，所以由式(17)可看出，当信号传输功率增大到一定程度，EE会随信号传输功率增大而逐渐减小并趋于定值0。

3.5 平均信息年龄与能量效率之比

实时监控物联网中的时效性和能效性都很重要，然而，两者并不能同时取得最优。为了能够在降低平均AoI的同时尽量提高EE，本文引入一个与时效性和能效性均相关的综合性指标，即平均AoI与EE之比^[8]，其表达式为

$\lambda = \frac{{{\bar \varDelta }}}{\eta }$

(18)

由式(18)可看出，该指标会随平均AoI的降低而减小，或者随EE的提高而减小，本文的目标是通过优化设备传输信号的功率来最小化该指标。

4. 性能优化

本节将优化信号传输功率，使得平均AoI与EE之比最小化。首先，推导平均AoI与EE之比随信号传输功率的变化关系。然后，根据变化关系给出信号传输功率的优化方法。

通过将式(16)和式(17)代入式(18)中，可得

$\lambda = \frac{{{T^2}P}}{{2DJ}}\left( {\frac{1}{{{p_{{\text{decode}}}}}} + \frac{2}{{{p_{{\text{collect}}}}{p_{{\text{access}}}}p_{{\text{decode}}}^2}}} \right)$

(19)

将式(19)对 $P$ 求导可得

$\begin{split} \frac{{{\text{d}}\lambda }}{{{\text{d}}P}} =\;& \frac{{{T^2}}}{{2DJ}}\left( {\frac{1}{{{p_{{\text{decode}}}}}} + \frac{2}{{{p_{{\text{collect}}}}{p_{{{\mathrm{access}}} }}p_{{\text{decode}}}^2}}} \right) \\ & + \frac{{{T^2}P}}{{2DJ}}\left( { - \frac{1}{{p_{{\text{decode}}}^2}} - \frac{4}{{{p_{{\text{collect}}}}{p_{{\text{access}}}}p_{{\text{decode}}}^3}}} \right)\\ & \cdot \frac{{{\text{d}}{p_{{\text{decode}}}}}}{{{\text{d}}P}}\\[-1pt] \end{split}$

(20)

将式(20)对 $P$ 进一步求导可得

$\begin{split} \frac{{{{\text{d}}^2}\lambda }}{{{\text{d}}{P^2}}} =\;& \frac{{{T^2}P}}{{2DJ}}\left[ \left( {\frac{2}{{p_{{\text{decode}}}^3}} + \frac{{12}}{{{p_{{\text{collect}}}}{p_{{\text{access}}}}p_{{\text{decode}}}^4}}} \right)\right.\\ & \cdot{{\left( {\frac{{{\text{d}}{p_{{\text{decode}}}}}}{{{\text{d}}P}}} \right)}^2} \\ & \left.+ \left( { - \frac{1}{{p_{{\text{decode}}}^2}} - \frac{4}{{{p_{{\text{collect}}}}{p_{{\text{access}}}}p_{{\text{decode}}}^3}}} \right)\frac{{{{\text{d}}^2}{p_{{\text{decode}}}}}}{{{\text{d}}{P^2}}} \right] \\ \;& + \frac{{{T^2}}}{{DJ}}\left( { - \frac{1}{{p_{{\text{decode}}}^2}} - \frac{4}{{{p_{{\text{collect}}}}{p_{{\text{access}}}}p_{{\text{decode}}}^3}}} \right)\\ & \cdot \frac{{{\text{d}}{p_{{\text{decode}}}}}}{{{\text{d}}P}} \\[-1pt] \end{split}$

(21)

令 $\alpha = \left( {\sqrt {{\sigma ^2}u/P} - {\varPsi }} \right)/\sqrt {\varTheta }$ ，那么可得

$\frac{{{\text{d}}{p_{{\text{decode}}}}}}{{{\text{d}}P}} = \frac{1}{{2\sqrt {2{\pi}} }}\exp \left( { - \frac{1}{2}{\alpha ^2}} \right)\sqrt {\frac{{{\sigma ^2}u}}{{\varTheta }}} {P^{ - \frac{3}{2}}}$

(22)

$\begin{split} \frac{{{{\text{d}}^2}{p_{{\text{decode}}}}}}{{{\text{d}}{P^2}}} =\;& \frac{1}{{4\sqrt {2{\pi}} }}\exp \left( { - \frac{1}{2}{\alpha ^2}} \right)\sqrt {\frac{{{\sigma ^2}u}}{{\varTheta }}} {P^{ - \frac{5}{2}}}\\ & \cdot\left( {\alpha \sqrt {\frac{{{\sigma ^2}u}}{{\varTheta }}} {P^{ - \frac{1}{2}}} - 3} \right) \end{split}$

(23)

将式(22)和式(23)代入式(21)中，可得

$\begin{split} \frac{{{{\text{d}}^2}\lambda }}{{{\text{d}}{P^2}}} =\;& \frac{{{T^2}}}{{8\sqrt {2{\pi}} DJPp_{{\text{decode}}}^3}}\left( {1 + \frac{4}{{{p_{{\text{success}}}}}}} \right)\\ & \cdot\exp \left( { - \frac{1}{2}{\alpha ^2}} \right) \sqrt {\frac{{{\sigma ^2}u}}{{{\varTheta }P}}} \\ \;&\cdot \left[ \frac{2}{{\sqrt {2{\pi}} }}\exp \left( { - \frac{1}{2}{\alpha ^2}} \right)\sqrt {\frac{{{\sigma ^2}u}}{{{\varTheta }P}}} \right.\\ & \cdot \left( {1 + \frac{2}{{{p_{{\text{success}}}} + 4}}} \right) - {p_{{\text{decode}}}}\left( {1 + \alpha } \right) \Biggr] \end{split}$

(24)

由式(24)可看出，当 $1 + \alpha \le 0$ 时，即 $P \ge {\sigma ^2}u/{\left( {{\varPsi } - \sqrt {\varTheta } } \right)^2}$ 时，那么有 ${{\text{d}}^2}\lambda /{\text{d}}{P^2} > 0$ ， $\lambda$ 是关于 $P$ 的凸函数。而当 $1 + \alpha > 0$ 时，即 $P < {\sigma ^2}u/{\left( {{\varPsi } - \sqrt {\varTheta } } \right)^2}$ 时， $\lambda$ 与 $P$ 的变化关系不确定。由于 ${p_{{\text{decode}}}} = Q\left( \alpha \right)$ ，所以在 $1 + \alpha \ge 0$ 的情况下，解码成功概率 ${p_{{\text{decode}}}}$ 将小于0.841 3，这是一种很糟糕的情况，不能满足实时监控物联网对短包传输的高可靠性要求^[9]，因此本文不考虑这种情况，并且增加信号传输功率的约束，即 $P \ge {\sigma ^2}u/{\left( {{\varPsi } - \sqrt {\varTheta } } \right)^2}$ 。通过将式(22)代入式(20)中，可得

$\begin{split} \frac{{{\text{d}}\lambda }}{{{\text{d}}P}} =\;& \frac{{{T^2}}}{{2DJ{p_{{\text{decode}}}}}}\left[ 1 + \frac{2}{{{p_{{\text{success}}}}}} - \frac{1}{{2\sqrt {2{\pi}} }}\right.\\ & \cdot \left( {\frac{1}{{{p_{{\text{decode}}}}}} + \frac{4}{{{p_{{\text{success}}}}{p_{{\text{decode}}}}}}} \right)\\ & \left.\cdot \exp \left( { - \frac{1}{2}{\alpha ^2}} \right)\sqrt {\frac{{{\sigma ^2}u}}{{{\varTheta }P}}} \right] \end{split}$

(25)

当 $P = {\sigma ^2}u/{\left( {{\varPsi } - \sqrt {\varTheta } } \right)^2}$ 时， ${\text{d}}\lambda /{\text{d}}P < 0$ ，而当 $P$ 趋于无穷大时， ${\text{d}}\lambda /{\text{d}}P$ 将无限接近于 ${T^2}\left( {{p_{{\text{collect}}}}{p_{{\text{access}}}} + 2} \right)/ \left( {2DJ{p_{{\text{collect}}}}{p_{{\text{access}}}}} \right) > 0$ ，所以在 $P$ 的约束范围内， $\lambda$ 是一个随 $P$ 增大先递减而后递增的凸函数，可通过求解 ${\text{d}}\lambda /{\text{d}}P$ 的零点找到最优信号传输功率。

接下来，本文将优化信号传输功率。由于 ${\text{d}}\lambda /{\text{d}}P$ 的表达式非常复杂，很难直接获取其零点，因此本文采用二分搜索算法寻找最优解。当 $P = {\sigma ^2}u/ {\left( {{\varPsi } - 3\sqrt {\varTheta } } \right)^2}$ 时，有 ${\text{d}}\lambda /{\text{d}}P > 0$ ，所以 ${\text{d}}\lambda /{\text{d}}P$ 的零点在区间 $\left( {{\sigma ^2}u/{{\left( {{\varPsi } - \sqrt {\varTheta } } \right)}^2},{\sigma ^2}u/{{\left( {{\varPsi } - 3\sqrt {\varTheta } } \right)}^2}} \right)$ 内。基于 ${\text{d}}\lambda /{\text{d}}P$ 在区间中点的函数值，递归地选择上半区间或者下半区间，直到区间长度在容许范围内时停止搜索，取区间的中间值作为最优信号传输功率。整体算法流程如所示，其中 $\delta$ 为最大允许误差。

1 信号传输功率优化算法

初始化： ${P_{{\text{low}}}} = {\sigma ^2}u/{\left( {{\varPsi } - \sqrt {\varTheta } } \right)^2}$ , ${P_{{\mathrm{up}}}} = {\sigma ^2}u/{\left( {\varPsi - 3\sqrt \varTheta } \right)^2}$
Repeat
If ${\left. {{\text{d}}\lambda /{\text{d}}P} \right\|_{P = \left( {{P_{{\text{low}}}} + {P_{{\text{up}}}}} \right)/2}} < 0$
${P_{{\text{low}}}} = \left( {{P_{{\text{low}}}} + {P_{{\text{up}}}}} \right)/2$
Else
${P_{{\text{up}}}} = \left( {{P_{{\text{low}}}} + {P_{{\text{up}}}}} \right)/2$
Until ${P_{{\text{up}}}} - {P_{{\text{low}}}} \le \delta$
输出：最优信号传输功率为 ${P^ * } = \left( {{P_{{\text{low}}}} + {P_{{\text{up}}}}} \right)/2$

下载: 导出CSV

| 显示表格

上述算法的复杂度与初始区间长度和最大允许误差相关，初始区间长为 ${\sigma ^2}u/{\left( {{\varPsi } - 3\sqrt {\varTheta } } \right)^2} - {\sigma ^2}u/{\left( {{\varPsi } - \sqrt {\varTheta } } \right)^2}$ ，最大允许误差为 $\delta$ ，其计算复杂度可以表示为 $\left\lceil {{\log }_2}\left[ {\sigma ^2}u/{{\left( {{\varPsi } - 3\sqrt {\varTheta } } \right)}^2} - {\sigma ^2}u/{{\left( {{\varPsi } - \sqrt {\varTheta } } \right)}^2} \right] - {{\log }_2}\delta \right\rceil$ ，其中 $\left\lceil \cdot \right\rceil$ 表示对实数向上取整。

5. 仿真结果与分析

本节通过仿真结果验证理论推导的正确性，并且还分析所提方案和算法的有效性。参考文献[, ]，除非另有说明，仿真参数设置如下：以AP的位置坐标作为原点，设备均匀分布在中心为 $\left(100,\;0\right)$ m且半径为 $10$ m的圆形区域内，IRS的坐标为 $\left( {100,10} \right)$ m。系统总带宽为 $B = 1$ MHz，一个时隙长为 $T = 1$ ms，每个时隙被划分的资源块数量为 $J = 10$ 。设备数量为 $K = 15$ ，它们采集信息的采样概率为 ${p_{{\text{collect}}}} = 0.6$ ，每次采集监控信息的信息量为 $D = 100$ bit。IRS包含的反射单元数量为 $M = 100$ ，单位距离下的路径损耗为 ${L_0} = - 30$ dB，路径损失系数为 $\eta = 3.5$ ，噪声功率密度为 $- 174$ dBm/Hz。

除了本文所提的接入控制方案，还仿真了另外两种方案作为比较。其中，随机接入方案表示设备采集信息之后随机地占用一个资源块来传输信息，周期采样方案表示在1个周期内为每个设备都划分资源块，设备每隔1个周期都会采集1次信息上传给AP，由于1个时隙划分的资源块有限，所以本文以2个时隙作为1个周期。

是平均AoI随IRS反射单元数的变化关系图，其中，信号传输功率为 $P = 0$ dBm，监控信息量为 $D = 300$ bit。从可看出，理论曲线与仿真结果拟合较好，这验证了理论推导的正确性。随着IRS反射单元数量提高，IRS带来的波束赋形增益也不断增强，这有利于提高短包传输的可靠性，所以平均AoI不断减小。此外，当一个时隙划分的资源块数量为 $J = 10$ ，其性能要优于划分资源块数量为 $J = 9$ 和 $J = 11$ 的情况，这说明一个时隙划分的资源块数量并不是越多越好也不是越少越好。这是因为随着每个时隙划分的资源块数量增多，尽管设备分配到资源块的概率增大，但是每个资源块长度变短，每次信息传输的误包率也会变大。因此，需要为每个时隙合理划分资源块数量。

图 3 平均AoI与IRS反射单元数量的关系

下载: 全尺寸图片幻灯片

图4是平均AoI与信号传输功率的关系图。随着信号传输功率增加，信息传输的可靠性也不断提高，所以平均AoI在减小。此外，从图4还可以看出，当信号传输功率很大，所提接入控制方案的平均AoI趋向于2.33，随机接入方案的平均AoI趋向于4.68，而周期采样方案的平均AoI趋向于3.1。随机接入方案的平均AoI约为接入控制方案的2倍，这是因为在随机接入方案中，设备随机占用资源块，不同设备可能会占用同一个资源块而导致传输碰撞，这降低了信息传输的可靠性，所以平均AoI很高。而周期采样方案的平均AoI约为接入控制方案的1.3倍，因为周期采样方案中的设备虽然在每个周期都一定能分配到资源块传输信息，但是一个周期包含两个时隙，设备每次传输信息需要等待的时间较长，这损害了AoI性能。

图 4 平均AoI与信号传输功率的关系

下载: 全尺寸图片幻灯片

是EE与信号传输功率的关系图。从可以看出，当信号传输功率低于 $- 15.68$ dBm时，周期采样方案能获得更高的EE。这是因为信号传输功率较低时，所有方案中AP解码信息的解码成功概率较小，而周期采样通过将两个时隙的资源划分给所有设备，每个设备能分到的资源块更长，解码成功概率相对更高，所以更不容易造成信号传输能量的浪费。当信号传输功率高于 $- 15.68$ dBm时，接入控制方案能获得更高的EE。这是因为信号传输功率较高时，所有方案的解码成功概率都较高，而周期采样中设备分到的资源块更长，传输信号的能量更多，所以效率更低，随机接入中存在一定的传输碰撞概率，当发生信号传输碰撞时，这将导致信号传输能量的浪费。尽管信号功率较低时，周期采样能获得更高的EE，但是该条件下周期采样的时效性远差于接入控制的时效性，所以接入控制方案在该条件下仍不失为更好的方案。

图 5 EE与信号传输功率的关系

下载: 全尺寸图片幻灯片

图6是平均AoI与EE之比随信号传输功率的变化关系图。从图6可以看出，随着信号传输功率增加，平均AoI与EE之比先递减后递增，这与理论推导的结果相一致。通过对比3种方案，可以看到接入控制方案的性能始终优于另外两种方案的性能，这说明所提方案能实现更好的折衷增益。此外，通过本文提出的二分搜索算法找到的最优信号传输功率与穷举搜索得出的结果重合，这证明本文算法能够有效找出最优的时效-能效折衷点。

图 6 平均AoI与EE之比随信号传输功率的变化关系

下载: 全尺寸图片幻灯片

6. 结束语

本文针对实时监控物联网，研究了IRS辅助短包通信系统中时效性与能效性之间的折衷问题。首先，提出了接入控制协议，有效地避免了信息传输中的数据包碰撞问题，然后分析了该协议下的时效性能和能效性能。为了在时效性和能效性之间取得有效折衷，引入了平均AoI与EE之比这个性能指标，并提出传输功率优化方案来最小化平均AoI与EE之比。仿真结果验证了理论推导的正确性，并表明接入控制协议可以实现较好的时效-能效整体性能增益，此外，仿真结果也验证了传输功率优化方案的有效性。本文所设计的接入控制协议和传输功率优化方案可为系统设计提供理论依据，但本文考虑IRS的部署位置较为固定，在IRS辅助多设备通信系统中，如何优化IRS的位置部署实现更好的时效-能效整体性能可以作为未来的研究方向。

References(31)

References

[1]	石跃祥, 朱茂清. 基于骨架动作识别的协作卷积Transformer网络[J]. 电子与信息学报, 2023, 45(4): 1485–1493. doi: 10.11999/JEIT220270. SHI Yuexiang and ZHU Maoqing. Collaborative convolutional transformer network based on skeleton action recognition[J]. Journal of Electronics & Information Technology, 2023, 45(4): 1485–1493. doi: 10.11999/JEIT220270.
[2]	GEDAMU K, JI Yanli, GAO Lingling, et al. Relation-mining self-attention network for skeleton-based human action recognition[J]. Pattern Recognition, 2023, 139: 109455. doi: 10.1016/j.patcog.2023.109455.
[3]	GUO Hongling, ZHANG Zhitian, YU Run, et al. Action recognition based on 3D skeleton and LSTM for the monitoring of construction workers’ safety harness usage[J]. Journal of Construction Engineering and Management, 2023, 149(4): 04023015. doi: 10.1061/JCEMD4.COENG-12542.
[4]	VEMULAPALLI R, ARRATE F, and CHELLAPPA R. Human action recognition by representing 3D skeletons as points in a lie group[C]. 2014 IEEE Conference on Computer Vision and Pattern Recognition, Columbus, USA, 2014: 588–595. doi: 10.1109/CVPR.2014.82.
[5]	HEDEGAARD L, HEIDARI N, and IOSIFIDIS A. Continual spatio-temporal graph convolutional networks[J]. Pattern Recognition, 2023, 140: 109528. doi: 10.1016/j.patcog.2023.109528.
[6]	YU B X B, LIU Yan, ZHANG Xiang, et al. Mmnet: A model-based multimodal network for human action recognition in RGB-D videos[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 45(3): 3522–3538. doi: 10.1109/TPAMI.2022.3177813.
[7]	SHI Lei, ZHANG Yifan, CHENG Jian, et al. Decoupled spatial-temporal attention network for skeleton-based action-gesture recognition[C]. The 15th Asian Conference on Computer Vision, Kyoto, Japan, 2021. doi: 10.1007/978-3-030-69541-5_3.
[8]	陈莹, 龚苏明. 改进通道注意力机制下的人体行为识别网络[J]. 电子与信息学报, 2021, 43(12): 3538–3545. doi: 10.11999/JEIT200431. CHEN Ying and GONG Suming. Human action recognition network based on improved channel attention mechanism[J]. Journal of Electronics & Information Technology, 2021, 43(12): 3538–3545. doi: 10.11999/JEIT200431.
[9]	CHENG Qin, REN Ziliang, CHENG Jun, et al. Skeleton-based action recognition with multi-scale spatial-temporal convolutional neural network[C]. 2021 IEEE International Conference on Real-time Computing and Robotics, Xining, China, 2021: 957–962. doi: 10.1109/RCAR52367.2021.9517665.
[10]	LI Lin, ZHANG Wu, ZHANG Zhaoxiang, et al. Skeleton-based relational modeling for action recognition[J]. arXiv preprint arXiv: 1805.02556, 2018.
[11]	LI Shuai, LI Wangqiang, COOK C, et al. Independently recurrent neural network (IndRNN): Building a longer and deeper RNN[C]. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, USA, 2018: 5457–5466. doi: 10.1109/CVPR.2018.00572.
[12]	CHENG Ke, ZHANG Yifan, HE Xiangyu, et al. Skeleton-based action recognition with shift graph convolutional network[C]. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, 2020: 183–192. doi: 10.1109/CVPR42600.2020.00026.
[13]	KIM T S and REITER A. Interpretable 3D human action analysis with temporal convolutional networks[C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops, Honolulu, USA, 2017: 1623–1631. doi: 10.1109/CVPRW.2017.207.
[14]	KE Q H, BENNAMOUN M, AN S J, et al. A new representation of skeleton sequences for 3D action recognition[C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition, Honolulu, USA, 2017: 3288–3297. doi: 10.1109/CVPR.2017.486.
[15]	LIU Mengyuan, LIU Hong, and CHEN Chen. Enhanced skeleton visualization for view invariant human action recognition[J]. Pattern Recognition, 2017, 68: 346–362. doi: 10.1016/j.patcog.2017.02.030.
[16]	DU Yong, FU Yun, and WANG Liang. Skeleton based action recognition with convolutional neural network[C]. 2015 3rd IAPR Asian Conference on Pattern Recognition, Kuala Lumpur, Malaysia, 2015: 579–583. doi: 10.1109/ACPR.2015.7486569.
[17]	DUAN Haodong, ZHAO Yue, CHEN Kai, et al. Revisiting skeleton-based action recognition[C]. 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition, New Orleans, USA, 2022: 2969–2978. doi: 10.1109/CVPR52688.2022.00298.
[18]	YAN Sijie, XIONG Yuanjun, and LIN Dahua. Spatial temporal graph convolutional networks for skeleton-based action recognition[C]. The Thirty-Second AAAI Conference on Artificial Intelligence and Thirtieth Innovative Applications of Artificial Intelligence Conference and Eighth AAAI Symposium on Educational Advances in Artificial Intelligence, New Orleans, USA, 2018: 912.
[19]	TANG Yansong, TIAN Yi, LU Jiwen, et al. Deep progressive reinforcement learning for skeleton-based action recognition[C]. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, USA, 2018: 5323–5332. doi: 10.1109/CVPR.2018.00558.
[20]	BASAK H, KUNDU R, SINGH P K, et al. A union of deep learning and swarm-based optimization for 3D human action recognition[J]. Scientific Reports, 2022, 12(1): 5494. doi: 10.1038/s41598-022-09293-8.
[21]	CAO Zhe, SIMON T, WEI S E, et al. Realtime multi-person 2D pose estimation using part affinity fields[C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition, Honolulu, USA, 2017: 7291–7299. doi: 10.1109/CVPR.2017.143.
[22]	CHEN Yuxin, ZHANG Ziqi, YUAN Chunfeng, et al. Channel-wise topology refinement graph convolution for skeleton-based action recognition[C]. 2021 IEEE/CVF International Conference on Computer Vision, Montreal, Canada, 2021: 13359–13368. doi: 10.1109/ICCV48922.2021.01311.
[23]	SHAHROUDY A, LIU Jun, NG T T, et al. NTU RGB+d: A large scale dataset for 3D human activity analysis[C]. 2016 IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas, USA, 2016: 1010–1019. doi: 10.1109/CVPR.2016.115.
[24]	SEIDENARI L, VARANO V, BERRETTI S, et al. Recognizing actions from depth cameras as weakly aligned multi-part bag-of-poses[C]. 2013 IEEE Conference on Computer Vision and Pattern Recognition Workshops, Portland, USA, 2013: 479–485. doi: 10.1109/CVPRW.2013.77.
[25]	SLAMA R, WANNOUS H, DAOUDI M, et al. Accurate 3D action recognition using learning on the Grassmann manifold[J]. Pattern Recognition, 2015, 48(2): 556–567. doi: 10.1016/j.patcog.2014.08.011.
[26]	SHI Lei, ZHANG Yifan, CHENG Jian, et al. Skeleton-based action recognition with multi-stream adaptive graph convolutional networks[J]. IEEE Transactions on Image Processing, 2020, 29: 9532–9545. doi: 10.1109/TIP.2020.3028207.
[27]	STIEFMEIER T, ROGGEN D, OGRIS G, et al. Wearable activity tracking in car manufacturing[J]. IEEE Pervasive Computing, 2008, 7(2): 42–50. doi: 10.1109/MPRV.2008.40.
[28]	WANG Limin, XIONG Yuanjun, WANG Zhe, et al. Temporal segment networks: Towards good practices for deep action recognition[C]. The 14th European Conference on Computer Vision, Amsterdam, The Netherlands, 2016: 20–36. doi: 10.1007/978-3-319-46484-8_2.
[29]	JIANG Wenchao and YIN Zhaozheng. Human activity recognition using wearable sensors by deep convolutional neural networks[C]. The 23rd ACM international conference on Multimedia, Brisbane, Australia, 2015: 1307–1310. doi: 10.1145/2733373.2806333.
[30]	TAO Wenjin, LEU M C, and YIN Zhaozheng. Multi-modal recognition of worker activity for human-centered intelligent manufacturing[J]. Engineering Applications of Artificial Intelligence, 2020, 95: 103868. doi: 10.1016/j.engappai.2020.103868.
[31]	SONG Yifan, ZHANG Zhang, SHAN Caifeng, et al. Constructing stronger and faster baselines for skeleton-based action recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 45(2): 1474–1488. doi: 10.1109/TPAMI.2022.3157033.

Relative Articles

Supplements(0)

Cited By

Proportional views

Proportional views

通讯作者: 陈斌, bchen63@163.com

1.
沈阳化工大学材料科学与工程学院沈阳 110142

Figures(8) / Tables(6)

Get Citation

PDF

XML

Article Metrics

Article views (461) PDF downloads(79)