陈鸣锴 孙振德 万雅芳

CHEN Mingkai, SUN Zhende, WAN Yafang. Resource Allocation for RIS-aided Cross-Model Communications[J]. Journal of Electronics & Information Technology. doi: 10.11999/JEIT240619
Citation: CHEN Mingkai, SUN Zhende, WAN Yafang. Resource Allocation for RIS-aided Cross-Model Communications[J]. Journal of Electronics & Information Technology. doi: 10.11999/JEIT240619


基金项目: 国家自然科学基金(62001246),江苏省重点研发计划项目(BE2023035),江苏省通信与网络技术工程研究中心开放课题





    陈鸣锴 mkchen@njupt.edu.cn

  • 中图分类号: TN911

Resource Allocation for RIS-aided Cross-Model Communications

Funds: The National Natural Science Foundation of China (62001246), Key R and D Program of Jiangsu Province Key project and topics (BE2023035), Open Research Fundation of Jiangsu Engineering Research Center of Communication and Network Technology, NJUPT
  • 摘要: 针对视频和触觉业务共存的跨模态业务场景,该文构建了可重构智能表面(RIS)辅助的共存网络切片系统,用以提高视频业务和触觉业务的传输速率和可靠性。同时,为了有效降低触觉业务通过穿孔带给视频业务的资源损耗,提出了动态被动波束赋形方案,允许RIS在不同时隙进行动态调整。基于上述方案,该文在确保触觉业务传输的时延和可靠性满足约束的同时,构建最大化视频业务传输速率的优化问题,以满足跨模态业务共存需求,实现资源的合理分配。为求解此优化问题,该文将其建模为一个马尔可夫决策过程(MDP),通过深度确定性策略梯度(DDPG)算法来进行视频数据和触觉数据传输资源的联合优化。仿真结果显示,与现有方案相比,所提方案具有一定的优越性,在保证传输触觉业务可靠性的前提下,提高了约66.67%的视频业务和速率。
  • 图  1  基于穿孔方案的RIS辅助跨模态通信系统架构

    图  2  资源块的说明和提出的动态被动波束形成方案

    图  3  基于actor-critic的DDPG算法框架图

    图  4  不同方案下用户和速率随着基站功率的变化趋势

    图  5  不同方案下用户和速率随着RIS反射单元数量的变化趋势

    图  6  不同基站功率和RIS反射单元数量对触觉数据包平均时延的影响

    图  7  不同触觉数据包到达速率下用户和速率的变化情况

    图  8  不同功率下奖励随步长的变化

    图  9  不同学习率下平均奖励随步长的变化

    1  DDPG算法

     初始化:${s_1}$,${\theta _a}$,${\theta _c}$,${\theta '_a} \leftarrow {\theta _a}$和${\theta '_c} \leftarrow {\theta _c}$,经验回放池$\mathbb{N}$,随
     while 迭代回合$ \le $最大迭代回合 do
      while $t \le T$ do
       • 根据状态${s_t}$和随机噪声${\mathcal{N}_t}$,通过actor网络计算动作
       ${a_t} = \mu ({s_t};{\theta _a}) + {{\rm N}_t}$
       • 执行动作${a_t}$,获得奖赏值$r({s_t},{a_t})$和下一状态${s_{t + 1}}$
       • 将经验$({s_t},{a_t},{r_t},{s_{t + 1}})$存储至经验回放池$\mathbb{N}$中
       • 从经验回放池$\mathbb{N}$中随机采样${N_{batch}}$个经验样本进行神经网
       • 通过(26)的近似形式,计算得到当前训练critic网络的损失
       • 通过损失函数$L({\theta _c})$关于${\theta _c}$的梯度更新critic网络的参数
       • 通过(23)更新actor网络的参数${\theta _a}$
       • 使用公式(29)和(30)来更新目标actor网络和目标critic网络
       的参数${\theta '_a}$和${\theta '_c}$
       • $t \leftarrow t + 1$
      end while
     end while
    表  1  仿真参数表

    一个时隙的持续时间1 ms
    一个微小时隙的持续时间$\Delta $0.125 ms
    一个时隙内微小时隙个数${\rm M}$8
    RB的频率带宽$B$180 kHz
    触觉数据包到达速率$\lambda $3
    触觉数据包的大小$D_l^{m,t}$20 Byte
    高斯随机噪声功率${\delta ^2}$-93 dBm
    触觉数据包的解码错误概率${\varepsilon _l}$${10^{ - 6}}$
图(9) / 表(2)
  • 文章访问数:  19
  • HTML全文浏览量:  7
  • PDF下载量:  5
  • 被引次数: 0
  • 收稿日期:  2024-07-17
  • 修回日期:  2025-02-12
  • 网络出版日期:  2025-02-21


