蒋伟进 陈萍萍 张婉清 孙永霞 陈君鹏

蒋伟进, 陈萍萍, 张婉清, 孙永霞, 陈君鹏. 基于组合多臂赌博机的移动群智感知用户招募算法[J]. 电子与信息学报, 2022, 44(3): 1119-1128. doi: 10.11999/JEIT210119
JIANG Weijin, CHEN Pingping, ZHANG Wanqing, SUN Yongxia, CHEN Junpeng. Mobile Crowdsensing User Recruitment Algorithm Based on Combination Multi-Armed Bandit[J]. Journal of Electronics & Information Technology, 2022, 44(3): 1119-1128. doi: 10.11999/JEIT210119
doi: 10.11999/JEIT210119
基金项目: 国家自然科学基金(61472136, 61772196),湖南省自然科学基金(2020JJ4249),湖南省学位与研究生教育改革研究项目(2020JGYB234),湖南省研究生科研创新项目(CX20211108, CX20211151),湖南省教育厅科学研究项目(21A0374)







    陈萍萍 cpp0628@163.com

  • 中图分类号: TP391

Mobile Crowdsensing User Recruitment Algorithm Based on Combination Multi-Armed Bandit

Funds: The National Natural Science Foundation of China (61472136, 61772196), The Natural Science Foundation of Hunan Province (2020JJ4249), The Degree and Graduate Education Reform Research Project of Hunan Province (2020JGYB234), Hunan Provincial Innovation Foundation For Postgraduate (CX20211108, CX20211151), Scientific Research Project of Hunan Provincial Department of Education (21A0374)
  • 摘要: 在移动群智感知任务分配中,数据平台不知道用户的感知质量或成本值的前提下,如何建立合适的用户招募机制是该文需要解决的关键问题,不仅需要在用户执行的过程学习其感知质量值,还要尽可能保证移动群智感知平台的高效性和利润最大化。因此该文提出基于组合多臂赌博机(CMAB)的移动群智感知用户招募算法来解决用户成本已知和未知的招募问题。首先把用户招募过程建模为组合多臂赌博机模型,每个摇臂代表选择不同的用户,所获得的收益代表用户的感知质量;其次提出基于上限置信区间 (UCB)算法的感知质量函数,根据任务完成情况更新用户的感知质量;然后在每轮的用户招募过程中,学习用户的感知质量和成本,并提出一种新颖的贪婪修复算法。该算法是将用户的感知质量值从高到低进行排序,再选择满足预算条件下感知质量值与招募成本最大比率的用户,最后分配任务和更新其感知质量。最后进行了大量基于真实数据集的实验仿真,以此验证算法的可行性与有效性。
  • 图  1  总感知质量与预算成本的关系

    图  2  总感知质量与任务数量的关系

    图  3  总感知质量与用户数量的关系

    图  4  总感知质量与每轮招募人数的关系

    图  5  总感知质量和每轮招募用户数量的关系(b=5000)

    图  6  总感知质量和每轮招募用户数量的关系(b=10000)

    图  7  总感知质量和每轮招募用户数量的关系(b=15000)

    图  8  每轮次和每轮招募人数所占比率的关系

    图  9  感知质量和用户数量的关系(b=5000)

    图  10  感知质量和用户数量的关系(b=10000)

    图  11  感知质量和用户数量的关系(b=15000)

    图  12  感知质量和任务数量的关系(b=5000)

    图  13  感知质量和任务数量的关系(b=10000)

    图  14  感知质量和任务数量的关系(b=15000)

    表  1  本文主要符号和释义

    i, j, t移动用户、感知任务和轮次的索引值
    $ M_i^l \subset M $,$ c_i^l = {\xi _i} * f\left( {\left| {T_i^l} \right|} \right) $用户i表示可完成的任务集合,$ C_i^l $表示相应的成本,$ {\xi _i} $表示用户的成本参数
    $ {w_j} $任务的权重
    P,$ {P^t} $, L ,Y所有选项的集合,在第i轮次选中的选项集合, 每个用户最大的选项数目,每轮选择的用户数量
    $ q_i^tj $用户i在第轮次中完成任务j的感知质量值
    $ {\bar q_i}(t) $t轮次,用户i的平均感知质量值
    $ {\hat q_i}(t) $直到第t轮次,用户i基于UCB的感知质量值
    $ {q_i} $用户i的感知质量的期望值
    $ {n_i}(t) $直到第t轮次,移动用户i被选中的次数
    表  2  贪婪修复算法(GRA)

     输入:$ p_i^l $,Q[0,1,···,n],F[i], ${C}_{i}^{l} $,B,Cost,j
     (1) $p_i^l $←0,F[i]←0, j←0;
     (2) Cost←0,i←0
     (3) 在第r轮次中,将${p}_{i}^{l} $降序排列候选用户并存储在数组Q[0,1,···,n]
     (4) for(i←0 to n) do
     (5) Cost= Cost+${C}_{i}^{l} $;
     (6) If (Cost≤ B && F[i]=0)
     (7) F[i] ←1, Q′[j++]=Q[i]
     (8) else
     (9) Cost= Cost$C_i^l $
     (10) return $Q' $[j]
    表  3  基于CMAB 的用户已知成本招募算法

     输入:R, P, $p_i^l = < M_i^l,c_i^l > $,B,Y, $p_i^l $ Q[0,1,···,n] ,Cost, ${n_i}(r) $ ,任务集合$A_i^l $
     输出:${P}^{r} $
     (1) r=1,选中每一个用户的第1个选项,获得初始参数
     (2) 更新对应的$ c_i^l $, ${{q}}_{{i}}^{{l}}{j} $, $ B\prime = B\; - \;\sum\nolimits_{pr} {c_i^l} $, ${n_i}(r) = \left| {M_i^l} \right| $, Cost=0
     (3) 感知任务质量的平均值:${q_i}(r) = \mathop \sum \limits_{r = 1} q_i^lj/\left| {M_i^l} \right| $
     (4) while true do
     (5)   r=r+1, ${P^r} = \varPhi$
     (6)   while $ \left| {{P^r}} \right| < Y $
     (7) 计算所有用户感知质量函数值和成本的比率$P_i^l = \mathop { {\text{argmax} } }\limits_{p_{i'}^{l'} \in p} \dfrac{ { {u_{ {Q_i}(r)} }\left( { {P^r} \cup p_{i'}^{l'} } \right) - {u_{ {Q_i}(r)} }\left( { {P^r} } \right)} }{ {c_{i'}^{l'} } }$
     (8)   将$p_i^l $降序排列候选用户并存储在数组Q[0,1,···,n]
     (9)     for(i←1 to n)
     (10)       ${} {\rm{Cost} } = { {\rm{Cost} } } + c_i^l$
     (11)       if(${{\rm{Cost}}} < B'$&&F[i] =0 ) $ {B'}\&\& {F}\left[ {i}\right]=0 $
     (12)         F[i] ←1
     (13)         将$p_i^l $加入${P^r} $中
     (14)       else
     (15)        ${{\rm{Cost}}} = {{\rm{Cost}}} - c_i^l$
     (16) ${B'} $=${B'} $–Cost
    表  4  基于CMAB 的用户未知成本招募算法

     输入:R,P,${p}_{i}^{l}= < {M}_{i}^{l},{c}_{i}^{l} > $B,Y,$p_i^l $,Q[0,1,···,n] ,Cost,${n}_{i}\left(r\right) $,${C_i} $,${\widehat{Q}}_{i}^{l}(t) $,$m_i^l $
     输出:${P}^{r} $
     (1) r=1,选中每个用户的第1个选项,获得用户的初始参数$p_i^l $,${q}_{i}^{l} $,$\xi _i^l $
     (2)更新对应的$\xi _i^l $,$q_i^l $${{\xi }}_{{i}}^{{l}},{{C}}_{{i}}^{{l}} {{q}}_{{i}}^{{l}}$, $ \hat Q_i^l(t)$, $B' = B\; - \;\sum\nolimits_{pr} {\xi _i^lf(|M_i^l|)} $, ${n_i}(r) = \left| {M_i^l} \right| $, Cost=0
     (3) WHILE true do
     (4)    r=r+1;
     (5)    while $ \left| {{P^r}} \right| < Y $
     (6)      对于每个被选中的用户i先获得成本参数$\xi _i^l $
     (7)      计算所有用户感知质量函数值和成本的比率$p_i^l = \arg \max {u_{\hat Q_i^l(r - 1)} }\left( { {P^r} \cup \left\{ {p_{i'}^{l'} } \right\} } \right) - {u_{\hat Q_i^l(r - 1)} }\left( { {P^r} } \right)$
     (8)      将$p_i^l $降序排列候选用户并存储在数组Q[0,1,···,n]
     (9)    FOR i = 0 to n do
     (10)      ${\text{Cost} } = {\text{Cost} } + \xi _i^lf(|M_i^l|)$;
     (11)      if($ {\rm{Cost}} < B' $&&F[i] =0 ) ${B}{\text{'}}\&\&{ }{F}\left[{i}\right]=0 $
     (12)         F[i] ←1
     (13)         将$p_i^l $加入${P^r} $中
     (14)         else
     (15)         ${{\rm{Cos}}} {\text{t}} = {{\rm{Cos}}} {\text{t}} - \xi _i^lf(|M_i^l|) $
     (16) $B' $=$B' $–Cost
    表  5  算法2实验情况设定

  • 收稿日期:  2021-02-01
  • 修回日期:  2021-12-12
  • 录用日期:  2021-12-14
  • 网络出版日期:  2022-01-12
  • 刊出日期:  2022-03-28


