基于高分辨率类激活映射算法的弱监督目标实时检测

孙辉; 史玉龙; 张健一; 王蕊; 王羽玥

doi:10.11999/JEIT230268

基于高分辨率类激活映射算法的弱监督目标实时检测

doi: 10.11999/JEIT230268

孙辉¹,
史玉龙^{1, 2},
张健一¹,
王蕊^1, ,,
王羽玥³

1.
中国民航大学电子信息与自动化学院天津 300300
2.
南开大学人工智能学院天津 300350
3.
天津滨海国际机场有限公司天津 300399

基金项目: 天津市自然科学基金(18JCYBJC42300)

详细信息

作者简介:
孙辉：男，讲师，研究方向为无线传感器网络、智慧机场、机场驱鸟、认知无线电、多智能体

史玉龙：男，博士生，研究方向为图像处理、机场驱鸟、系统辩识、无线传感器网络

张健一：男，本科生，研究方向为图像处理、深度学习

王蕊：女，教授，研究方向为机场驱鸟、分布式系统、无线传感网络、混沌系统、多智能体、系统辨识

王羽玥：女，高级农艺师，研究方向为机场鸟防

通讯作者:
王蕊　ruiwang@cauc.edu.cn

中图分类号: TN911.73; TP391.4
计量
- 文章访问数: 536
- HTML全文浏览量: 356
- PDF下载量: 59
- 被引次数: 10
出版历程
- 收稿日期: 2023-04-13
- 修回日期: 2023-07-28
- 网络出版日期: 2023-08-10
- 刊出日期: 2024-03-27

Weakly Supervised Object Real-time Detection Based on High-resolution Class Activation Mapping Algorithm

SUN Hui¹,
SHI Yulong^{1, 2},
ZHANG Jianyi¹,
WANG Rui^{1
, ,},
WANG Yuyue³

1.
College of Information Engineering and Automation, Civil Aviation University of China, Tianjin 300300, China
2.
College of Artificial Intelligence, Nankai University, Tianjin 300350, China
3.
Tianjin Binhai International Airport Co., Ltd., Tianjin 300399, China

Funds: Tianjin Natural Science Foundation (18JCYBJC42300)

摘要

摘要: 受益于深度学习的发展，目标检测技术在各类视觉任务中得到广泛关注。然而，获取目标的边框标注需要高昂的时间和人工成本，阻碍了目标检测技术在实际场景中的应用。为此，该文在仅使用图像类别标签的基础上，提出一种基于高分辨率类激活映射算法的弱监督目标实时检测方法，降低网络对目标实例标注的依赖。该方法将目标检测细划分为弱监督目标定位和目标实时检测两个子任务。在弱监督定位任务中，该文利用对比层级相关性传播理论设计了一种新颖的高分辨率类激活映射算法(HR-CAM)，用于获取高质量目标类激活图，生成目标伪检测标注框。在实时检测任务中，该文选取单镜头多盒检测器(SSD)作为目标检测网络，并基于类激活图设计目标感知损失函数(OA-Loss)，与目标伪检测标注框共同监督SSD网络的训练过程，提高网络对目标的检测性能。实验结果表明，该文方法在CUB200和TJAB52数据集上实现了对目标准确高效的检测，验证了该文方法的有效性和优越性。
- 弱监督定位 /
- 目标检测 /
- 对比层级相关性传播理论 /
- 类激活映射算法 /
- 目标感知损失函数
Abstract: Thanks to the development of deep learning technology, object detection techniques have gained wide attention in various vision tasks. However, obtaining bounding box annotations for objects requires high time and labor costs, which hinders the application of object detection technology in practical scenarios. Therefore, a weakly supervised real-time object detection method based on high resolution class activation mapping algorithm is proposed, using only image class labels to reduce the dependence of network on object instance labels. It subdivides object detection into two subtasks: weakly supervised object localization and real-time object detection. In weakly supervised object localization task, a novel High Resolution Class Activation Mapping(HR-CAM) algorithm based on contrastive layer-wise relevance propagation theory is designed. It can obtain high quality class activation maps and generate pseudo detection annotation box. In real-time detection task, Single Shot multibox Detector(SSD) network as object detector is selected and an Object-Aware Loss function(OA-Loss) based on the class activation maps is designed. It can jointly supervise the training process of the SSD network with generated pseudo detection annotation box, to improve the networks' detection performance for objects. The experimental results show that the method proposed in this paper can achieve accurate and efficient object detection on the CUB200 and TJAB52 datasets, verifying the effectiveness and superiority of this method.
- Weakly supervised localization /
- Object detection /
- Contrastive layer-wise relevance propagation theory /
- Class Activation Mapping(CAM) algorithm /
- Object-Aware Loss function(OA-Loss)

HTML全文

1. 引言

随着信息技术的迅猛发展，人们的社交活动趋向于网络化。面对庞大的社交信息，如何从中筛选用户感兴趣的信息已成为广大学者研究的重点。社交数据的稀疏性和冷启动是推荐算法无法规避的问题。近年来，国内外学者提出了各种各样的解决方法，其中在深入挖掘用户的社交关系来缓解用户-活动评分矩阵的稀疏性等方面，取得了较好的结果^[1-3]。Guo等人^[4]将评级和信任等显式数据和用户对社交活动的隐式数据引入推荐模型中降低了数据稀疏和冷启动对推荐性能的影响；Wang等人^[5]利用社交用户隐性和显性信任的互补性，将两种信任关系整合到三方图上，提出了一种基于扩散的三方信任推荐模型；Papneja等人^[6]深入研究了用户兴趣随时间的变化趋势，提出了一种基于本体扩展激活的新型上下文感知个性化推荐算法；Chen等人^[7]将信任关系引入到原始CosRA方法中，提出了一种基于信任的推荐方法,利用可调参数对信任的传递进行重新调整；Guan等人^[8]将用户的社会关系进行建模，添加附加层整合用户的上下文信息，并将其嵌入神经网络社会推荐中，取得了较好的结果；Aghdam^[9]提出了一种新颖的分层隐马尔可夫模型，以识别随时间变化的用户偏好，利用变化偏好训练推荐模型，获取形似用户的偏好趋向，以完成最终的推荐；Yao等人^[10]将信任网络的本地链接结构用作两个正则化项来捕获隐式用户相关性，但此种方法以社交网络中链入和链出的用户数来确定用户的权威，并没有考虑链接点的社会地位，推荐精度虽有提高但有瓶颈；Wang等人^[11]根据用户的地位和情绪倾向量化用户间的同质性，以此构建同质数据的模型作为多级神经网络的输入，通过不断地神经网络学习预测目标用户的活动趋向，推荐精度有一定的提升，但未考虑用户间的同质性对项目评分的影响；余永红等人^[12]利用Pagerank算法计算用户的社会地位，并将其引入矩阵分解中，提出了融合用户社会地位的矩阵分解推荐算法。这些最新研究大部分仅考虑了用户的信任关系或部分用户的同质性，并没有深入的研究用户信任的多级传递、用户的社会地位和用户的同质性对推荐结果的影响。基于此,本文将用户间信任度、用户社会地位影响力和用户同质性3因素融入低秩概率矩阵分解中提出了一种融合多权重因素的低秩概率矩阵分解推荐模型(Probabilistic Matrix Factorization recommendation model incorporating Multiple Weighting Factors, MWFPMF)。

2. 多上下文特征信息

2.1 用户间信任度

给定用户 $u \in U$ ，活动 $s \in S$ ，用户间的信任分为直接信任和间接信任。所谓直接信任只涉及用户两者，而间接信任会牵扯第三者。用户间的信任度越接近1，表明两者之间越信任，反之亦然。在社交网络中，用户被信任的人数越多表明用户的可信度越高。本文借助Page rank算法构建用户直接信任度

${\rm{T}}{{\rm{r}}_{{u_i},{u_j}}} = \frac{{{N_{{u_j}}}}}{{\displaystyle\sum\limits_{{u_r} \in {T_{{u_i}}}} {{N_{{u_r}}}} }}|{T_{{u_i}}}|$

(1)

其中， ${T_{{u_i}}}$ 表示用户 ${u_i}$ 信任集合， $|{T_{{u_i}}}|$ 表示用户 ${u_i}$ 信任数量， ${N_{{u_j}}},{N_{{u_r}}}$ 分别表示用户 ${u_j},{u_r}$ 被信任的用户数量。在实际社交网络中，群组内用户间不可能都产生直接信任，我们将用户间的社交网络看作信任网络 $Q = (U,E,{\rm{TR}})$ , $E$ 表示有向边集合，边 $e({u_i},{u_j}) \in E$ 为用户 ${u_i}$ 对用户 ${u_j}$ 的信任关系， ${\rm{TR}}$ 为信任度集合， ${\rm{T}}{{\rm{r}}_{{u_i},{u_j}}} \in {\rm{TR}}$ 为用户 ${u_i}$ 对用户 ${u_j}$ 的直接信任度值。节点间的信任网络如图1所示。

图 1 信任网络

下载: 全尺寸图片幻灯片

在给定的信任网络 $Q = (U,E,{\rm{TR}})$ 中，若用户 ${u_i}$ 与非直接信任用户 ${u_x}$ 间存在一条路径 $p =$ $({u_i},\cdots,{u_y},{u_z},\cdots,{u_x})$ ，在该路径 $p$ 上任意边 $e({u_y},{u_z})$ 的信任度都大于信任阈值 ${w_\theta }$ ，那么用户 ${u_i}$ 与非直接用户 ${u_x}$ 间存在间接信任。虽然用户间存在间接信任，但间接信任值并不一定被采用，这是由于信任在传递过程中随着跳数的增加而衰减，因此在求取间接信任前，需要设置两个阈值：信任阈值 ${\rm{T}}{{\rm{r}}_\theta }$ 和跳数阈值 ${h_\theta }$ 。本文设信任阈值 ${\rm{T}}{{\rm{r}}_\theta }{\rm{ = }}0.5$ 和跳数阈值 ${h_\theta }{\rm{ = }}3$ ，间接信任度计算为

${\rm{Td}}_{{u_i},{u_j}}^* = \frac{{\displaystyle\sum\limits_{\kappa = 1}^n {(W(\kappa ) \times W_{{\rm{direct}}}^\kappa )} }}{{\displaystyle\sum\limits_{\kappa = 1}^n {W(\kappa )} }}$

(2)

其中， ${\rm{Td}}_{{u_i},{u_j}}^*$ 表示用户 ${u_i}$ 对用户 ${u_j}$ 的间接信任， $W_{{\rm{direct}}}^\kappa$ 表示第 $\kappa$ 条信任路径中用户 ${u_i}$ 到用户 ${u_j}$ 之前的信任度值， $W(\kappa )$ 表示第 $\kappa$ 条信任路径权重，其计算公式为

$W(\kappa ) = \sum\limits_{i = 0}^\kappa {W_{{\rm{direct}}}^i}$

(3)

${S}_{\rm{tr}}({u}_{i},{u}_{j})=\left\{ \begin{aligned} &{\rm{Td}}_{{u}_{i},{u}_{j}},\ \ {\text{若}}{u}_{i},{u}_{j}{\text{直接信任}}\\ & {\rm{Td}}_{{u}_{i},{u}_{j}}^{*},\ \ {\text{若}}{u}_{i},{u}_{j}{\text{间接信任}} \end{aligned} \right.$

(4)

如图1中，设信任阈值 ${\rm{T}}{{\rm{r}}_\theta }{\rm{ = }}0.5,{h_\theta } = 3$ ，那么若计算用户 ${u_3}$ 对用户 ${u_6}$ 的间接信任，则存在4条路径: ${u_3} \to {u_4} \to {u_2} \to {u_6}$ , ${u_3} \to {u_7} \to {u_5} \to {u_6}$ , ${u_3} \to {u_7} \to {u_2} \to {u_6}$ 和 ${u_3} \to {u_4} \to {u_2} \to {u_1} \to {u_6}$ ，根据信任阈值，最终剩余 ${u_3} \to {u_4} \to {u_2} \to {u_6}$ , ${u_3} \to$ ${u_7} \to {u_5} \to {u_6}$ 和 ${u_3} \to {u_7} \to {u_2} \to {u_6}$ 3条信任路径。据式(3)得： $W(1) = 0.747 \times 0.768 = 0.5737$ , $W(2) =$ $0.637 \times 0.607 = 0.3867$ , $W(3) = 0.637 \times 0.772 = 0.4918$ 。根据式(2)，用户 ${u_3}$ 对用户 ${u_6}$ 的间接信任 ${\rm{Td}}_{{u_3},{u_6}}^ *$ 为

$\begin{split} & {\rm{Td}}_{{u_3},{u_6}}^ * \\ & \quad= \frac{{0.794 \times {{W}}(1) + 0.809 \times {{W}}(2) + 0.794 \times {{W}}(3)}}{{{{W}}(1) + {{W}}(2) + {{W}}(3)}} \\ & \quad= 0.798 \end{split}$

2.2 用户社会地位影响力

用户的社会地位影响力反映了其在社交网络中所处位置，是声望、学识、经济等因素的集中体现。通常认为，具有较高社会地位影响力的用户更容易被其他用户信任，而具有较低社会地位影响力的用户更容易不被信任，图2是具有社会地位影响力的信任网络。

图 2 具有社会地位影响力的信任网络

下载: 全尺寸图片幻灯片

在图2中用户 ${u_5}$ 的社会地位影响力为0.61，用户 ${u_2}$ 的社会地位影响力为0.98。由于用户 ${u_2}$ 的社会影响力高于用户 ${u_5}$ ，用户 ${u_7}$ 更倾向于通过信任用户 ${u_2}$ 继而间接信任 ${u_6}$ 。

一般认为在社交网络中，被其他用户信任的越多说明其具有较高的社会影响力，此类用户在信任网络中拥有较多的入度，相应地，具有较低社会影响力的用户通常会优先信任社会地位影响力高的用户，其具有较多的出度。我们将用户-活动对 $< U,S >$ 表示成二部图 $G < V,E >$ ，其中 $V$ 表示顶点，包含用户和活动两类； $E$ 表示边，为用户与社交活动的交互关系，记录了用户 ${u_i}$ 是否评价过社交活动 ${s_k}$ ，若评价过则记录评价时间 ${\rm{ti}}{{\rm{m}}_{{u_i}k}}$ 。因为每个顶点初始访问概率相同，这里还是使用Page rank算法来计算用户的社会地位

${\rm{S}}{{\rm{p}}_{{u_i}}} = \rho \sum\limits_{{u_j} \in {T_{{u_i}}}} {\frac{{{\rm{S}}{{\rm{p}}_{{u_j}}}}}{{|{T_{{u_i}}}|}} + \frac{{1 - \rho }}{{{\rm{Num}}}}}$

(5)

其中， ${\rm{S}}{{\rm{p}}_{{u_i}}}$ 表示用户 ${u_i}$ 在每个聚类中的 ${\rm{Pagerank}}$ 值， ${\rm{Num}}$ 表示用户数， $\rho$ 为用户 ${u_i}$ 跳出当前信任网络的概率值。

一般认为社会地位高的用户，其社会影响力就大，其推荐的内容往往更容易被采纳，用户 ${u_i}$ 对 ${u_j}$ 关系权重为

${W}_{ij}=\left\{ \begin{aligned} & {\rm{Sp}}_{{u}_{j}}\times {S}_{\rm{tr}}({u}_{i},{u}_{j}), \quad {\rm{Sp}}_{{u}_{j}}>{\rm{Sp}}_{{u}_{i}}\\ & {\rm{Sp}}_{{u}_{i}}\times {S}_{\rm{tr}}({u}_{i},{u}_{j}),\quad {\text{其他}} \end{aligned} \right.$

(6)

用户 ${u_i}$ 对 ${u_j}$ 信任不仅受其社会地位的影响还与他们对活动的评分及评分时间有关，因为对同一活动的评价时间相差越久，兴趣度就越低。对于此，权重 ${W_{ij}}$ 修正为

$W_{ij}^* = \left\{ \begin{aligned} & \frac{{|{I_{{u_i}{u_j}}}|}}{{|{I_{{u_i}}}| + |{I_{{u_j}}}|}} \\ & \quad \times \frac{{\displaystyle\sum\limits_{k \in {I_{{u_i}{u_j}}}} {1/(1 + \exp (\delta |{\rm{ti}}{{\rm{m}}_{{u_i}k}} - {\rm{ti}}{{\rm{m}}_{{u_j}k}}|)} }}{{{\rm{Card}}({I_{{u_i}{u_j}}}) + 1}} \\ &\quad \times {\rm{si}}{{\rm{m}}_{{u_i}{u_j}}} \times {\rm{S}}{{\rm{p}}_{{u_j}}} \times {S_{{\rm{tr}}}}({u_i},{u_j}) ,{\rm{S}}{{\rm{p}}_{{u_j}}}>{\rm{S}}{{\rm{p}}_{{u_i}}} \\ & \frac{{|{I_{{u_i}{u_j}}}|}}{{|{I_{{u_i}}}| + |{I_{{u_j}}}|}} \\ &\quad \times \frac{{\displaystyle\sum\limits_{k \in {I_{{u_i}{u_j}}}} {1/(1 + \exp (\delta |{\rm{ti}}{{\rm{m}}_{{u_i}k}} - {\rm{ti}}{{\rm{m}}_{{u_j}k}}|)} }}{{{\rm{Card}}({I_{{u_i}{u_j}}}) + 1}} \\ &\quad \times {\rm{si}}{{\rm{m}}_{{u_i}{u_j}}} \times {\rm{S}}{{\rm{p}}_{{u_i}}} \times {S_{{\rm{tr}}}}({u_i},{u_j}) ,{\text{其他}} \end{aligned} \right.$

(7)

其中， $\delta \in [0,1]$ 为时间衰减参数， ${\rm{ti}}{{\rm{m}}_{{u_i}k}}$ 和 ${\rm{ti}}{{\rm{m}}_{{u_j}k}}$ 为用户 ${u_i}$ 和 ${u_j}$ 对活动 ${s_k}$ 的评价时间，集合 ${I_{{u_i}}}$ 为用户 ${u_i}$ 已评价的活动集合， ${I_{{u_i}{u_j}}}$ 为用户 ${u_i}$ 和 ${u_j}$ 共同评价的活动集合， $| * |$ 表示求取集合元素个数， ${\rm{sim}}(i,j)$ 表示用户 ${u_i}$ 和 ${u_j}$ 的兴趣偏好的相似度

$\begin{split} & {\rm{sim}}(i,j) \\ & \quad= \frac{{\displaystyle\sum\limits_{k \in {I_{{u_i}{u_j}}}} {({r_{ik}} - {{\bar r}_i})({r_{jk}} - {{\bar r}_j})} }}{{\sqrt {\displaystyle\sum\limits_{k \in {I_{{u_i}{u_j}}}} {{{({r_{ik}} - {{\bar r}_i})}^2}} } \sqrt {\displaystyle\sum\limits_{k \in {I_{{u_i}{u_j}}}} {{{({r_{jk}} - {{\bar r}_j})}^2}} } }} \end{split}$

(8)

其中， ${r_{ik}}$ 和 ${r_{jk}}$ 分别表示用户 ${u_i}$ 和 ${u_j}$ 对活动 ${s_k}$ 的评分， ${\bar r_i}$ 和 ${\bar r_j}$ 分别表示用户 ${u_i}$ 和 ${u_j}$ 对活动 ${s_k}$ 的平均评分。

2.3 用户同质性

一般认为“物以类聚人以群分”，在社交网络中，两个相似的用户往往更容易被彼此接受，继而推荐给彼此的活动也更容易感兴趣。用户之间的同质性可通过构建标签相似和个体特征相似来获取，借鉴TF-IDF算法的思想，用户 ${u_i}$ 对标签 ${l_\zeta }$ 的权重计算为

${\rm{h}}{{\rm{o}}_{i\zeta }} = \frac{{{\rm{N}}{{\rm{H}}_{i\zeta }}}}{{\displaystyle\sum\limits_{{l_\zeta } \in L} {{\rm{N}}{{\rm{H}}_{i\zeta }}} }} \times {\log _2}\frac{{{\rm{N}}{{\rm{H}}_l}}}{{{\rm{N}}{{\rm{H}}_\zeta } + 1}}$

(9)

其中， ${\rm{N}}{{\rm{H}}_{i\zeta }}$ 表示用户 ${u_i}$ 使用标签集合 $L$ 中标签 ${l_\zeta }$ 的次数， ${\rm{N}}{{\rm{H}}_\zeta }$ 表示使用标签 ${l_\zeta }$ 的用户数， ${\rm{N}}{{\rm{H}}_l}$ 表示标签总数。根据任意两个用户 ${u_i}$ 和 ${u_j}$ 的权重，可得到这两个用户的相似性 ${\rm{H}}{{\rm{O}}_{ij}}$

${\rm{H}}{{\rm{O}}_{ij}} = \frac{{\displaystyle\sum\limits_{\zeta = 1}^n {{\rm{h}}{{\rm{o}}_{i\zeta }}{\rm{h}}{{\rm{o}}_{j\zeta }}} }}{{\sqrt {\displaystyle\sum\limits_{\zeta = 1}^n {{\rm{ho}}_{i\zeta }^2} } \sqrt {\displaystyle\sum\limits_{\zeta = 1}^n {{\rm{ho}}_{j\zeta }^2} } }}$

(10)

定义用户的个体特征向量 ${\boldsymbol{F}} = ({f_1},{f_2},\cdots,f{}_n)$ , ${\rm{fe}}_1^1$ 和 ${\rm{fe}}_1^2$ 是特征 ${f_1}$ 的两个值，对应平均偏好为 ${\rm{r}}{{\rm{s}}_1}$ 和 ${\rm{r}}{{\rm{t}}_1}$ 。任意两个用户 ${u_i}$ 和 ${u_j}$ 间的同质性可划分为3类：相同、相似和不相同

$G_{{u_i}{u_j}}' = \left\{ \begin{aligned} & ({\rm{rs}},{\rm{rt}}) \in {\rm{same}},\;\;\;\;\;\;{\rm{rs}} = {\rm{rt}}\; \\ & ({\rm{rs}},{\rm{rt}}) \in {\rm{similar}},\;\; |{\rm{rs}} - {\rm{rt}}| \\ & \ \le \frac{{\displaystyle\sum\limits_{{u_i} \in U} {\displaystyle\sum\limits_{{u_j} \in U} {|{\rm{r}}{{\rm{s}}_{{u_i}}} - {\rm{r}}{{\rm{s}}_{{u_j}}}||{{\rm{rt}}_{{u_i}}} - {\rm{r}}{{\rm{t}}_{{u_j}}}|} } }}{{|U|*|U - 1|}} \\ & ({\rm{rs}},{\rm{rt}}) \in {\rm{disimilar }}\;{\rm{else}} \end{aligned} \right.$

(11)

若任意两个用户的属性值相同，那么我们认为这两个用户的同质性一致。若任意两个用户的属性值在一个范围内，则认为这两个用户拥有相似的同质性，这里借鉴文献[12,13]，任意用户间的同质性可表示为

$\begin{split} {{{H}}_{{u_i}{u_j}}} = & \frac{{2(|{\rm{s}}{{\rm{h}}_a}| + \alpha |{\rm{s}}{{\rm{h}}_s}|) * {\rm{h}}{{\rm{o}}_{ij}}}}{{|{\rm{s}}{{\rm{h}}_a}| + \alpha |{\rm{s}}{{\rm{h}}_s}| + |{\rm{s}}{{\rm{h}}_d}|}}\\ & \Bigr/\left(\frac{{(|{\rm{s}}{{\rm{h}}_a}| + \alpha |{\rm{s}}{{\rm{h}}_s}|)}}{{|{\rm{s}}{{\rm{h}}_a}| + \alpha |{\rm{s}}{{\rm{h}}_s}| + |{\rm{s}}{{\rm{h}}_d}|}} + {\rm{h}}{{\rm{o}}_{ij}}\right) \end{split}$

(12)

其中， ${\rm{s}}{{\rm{h}}_a},{\rm{s}}{{\rm{h}}_s},{\rm{s}}{{\rm{h}}_d}$ 为用户特性的相同、相似和不相似集合， $\alpha$ 为用户间同质相似性阈值，这是设 $\alpha {\rm{ = }}0.8$ 。

3. 融合多权重因素的矩阵分解

3.1 低秩概率矩阵分解

基于矩阵分解的协同过滤模型具有良好的可扩展性和推荐精度，得到了越来越多的关注和研究。这里采用低秩概率矩阵分解(Probabilistic Matrix Factorization, PMF)作为本文推荐的框架，利用该框架对用户-活动评分矩阵进行分解，将用户偏好和活动特征映射到同一潜在低秩空间中，然后利用低秩特征矩阵对用户评分缺失进行预测。

设用户-活动评分矩阵 ${\boldsymbol{R}} = \{ {r_{ij}}\}$ 为 $N$ 个用户对 $M$ 个活动的评分，列向量 ${\mathbf{U}}{{\mathbf{t}}_i}$ 和 ${\mathbf{S}}{{\mathbf{t}}_j}$ 分别为用户和活动的隐特征向量。假设用户-活动评分矩阵由高斯噪声线性概率模型构成，则 ${\boldsymbol{R}}$ 的条件分布为

$p({\boldsymbol{R}}|{\mathbf{Ut}},{\mathbf{St}},{\sigma ^2}) = \prod\limits_{i = 1}^N {\prod\limits_{j = 1}^M {{{[N({r_{ij}}|g({\mathbf{Ut}}_i^{\rm{T}}{\mathbf{S}}{{\mathbf{t}}_j}),{\sigma ^2})]}^{I(x)_{ij}^R}}} }$

(13)

其中， $N(x|\mu ,{\sigma ^2})$ 表示 $x$ 服从均值为 $\mu$ 、方差为 ${\sigma ^2}$ 的高斯分布， $I(x)_{ij}^R$ 为指示函数，若返回1表明用户 ${u_i}$ 评价了活动 ${s_j}$ ，反之亦然。根据PMF模型，原始用户-活动评分矩阵 ${\boldsymbol{R}}$ 与近邻用户获得的隐特征向量的关系为

${\boldsymbol{R}} \approx {\mathbf{U}}{{\mathbf{t}}_{n \times k}}{\mathbf{St}}_{m \times k}^{\rm{T}} = {\hat{\boldsymbol R}}$

(14)

其中， ${\mathbf{Ut}}$ 为用户的特征矩阵， ${\mathbf{St}}$ 为活动的特征矩阵， $k$ 是矩阵 ${\mathbf{Ut}}$ 的维数， $n$ 表示用户数， $m$ 表示活动数。原始评分矩阵 ${\boldsymbol{R}}$ 是稀疏的，我们的目标是最小化矩阵 ${\boldsymbol{R}}$ 和 ${\hat{\boldsymbol R}}$ 间的偏差，通过训练已建立的推荐模型获取 ${\mathbf{U}}{{\mathbf{t}}_{n \times k}}$ 和 ${\mathbf{St}}_{m \times k}^{}$ 的模型参数，目标函数为

$\begin{split} L =\,& \min |{\boldsymbol{R}} - {\hat{\boldsymbol R}}| = \min (\sum\limits_{i = 1}^n {\sum\limits_{j = 1}^m {{{({r_{ij}} - {\mathbf{U}}{{\mathbf{t}}_i}{\mathbf{St}}_j^{\rm{T}})}^2}} } \\ & + \xi (||{\mathbf{Ut}}|{|^2} + ||{\mathbf{St}}|{|^2}))\\[-15pt] \end{split}$

(15)

${\mathbf{U}}{{\mathbf{t}}_i}$ 和 ${\mathbf{S}}{{\mathbf{t}}_j}$ 分别为矩阵 ${\mathbf{Ut}}$ 和 ${\mathbf{St}}$ 的低维矩阵， $\xi (||{\mathbf{Ut}}|{|^2} +$ $||{\mathbf{St}}|{|^2})$ 为正则项，以约束过度拟合。实际矩阵 ${\mathbf{U}}{{\mathbf{t}}_i}$ 和 ${\mathbf{S}}{{\mathbf{t}}_j}$ 可利用随机梯度下降法获得

${\mathbf{Ut}}_i^{(n + 1)} \leftarrow {\mathbf{Ut}}_i^n - \beta \frac{{\partial L}}{{\partial {\mathbf{U}}{{\mathbf{t}}_i}}}$

(16)

${\mathbf{St}}_j^{(n + 1)} \leftarrow {\mathbf{St}}_j^n - \beta \frac{{\partial L}}{{\partial {\mathbf{S}}{{\mathbf{t}}_j}}}\ \;$

(17)

其中， $\beta$ 表示学习速率，通过对 ${({r_{mj}} - {\hat r_{mj}})^2}$ 偏微分，可求取 ${r_{mj}}$ 和 ${\hat r_{mj}}$ 间差值的最小值

$\frac{{\partial {{({r_{mj}} - {{\hat r}_{mj}})}^2}}}{{\partial {\rm{U}}{{\rm{t}}_{ik}}}} = - 2{\rm{U}}{{\rm{t}}_{mk}}\left({r_{mj}} - \sum\limits_{k = 1}^K {{\rm{U}}{{\rm{t}}_{mk}}{\rm{S}}{{\rm{t}}_{kj}}} \right)$

(18)

$\frac{{\partial {{({r_{mj}} - {{\hat r}_{mj}})}^2}}}{{\partial {\rm{S}}{{\rm{t}}_{kj}}}} = - 2{\rm{S}}{{\rm{t}}_{kj}}\left({r_{kj}} - \sum\limits_{k = 1}^K {{\rm{U}}{{\rm{t}}_{mk}}{\rm{S}}{{\rm{t}}_{kj}}} \right)$

(19)

根据梯度下降获得递归公式

${\rm{U}}{{\rm{t}}_{ik}} = {\rm{U}}{{\rm{t}}_{ik}} + \beta ({\rm{S}}{{\rm{t}}_{kj}} \cdot {e_{ij}} - \xi {\rm{U}}{{\rm{t}}_{ik}})$

(20)

${\rm{S}}{{\rm{t}}_{kj}} = {\rm{S}}{{\rm{t}}_{kj}} + \beta ({\rm{U}}{{\rm{t}}_{ik}} \cdot {e_{ij}} - \xi {\rm{S}}{{\rm{t}}_{kj}})$

(21)

这里设 ${e_{ij}} = {r_{mj}} - {\hat r_{mj}}$ ，预测评分为

${\hat r_{ij}} = \sum\limits_{k = 1}^K {{\rm{U}}{{\rm{t}}_{ik}}{\rm{S}}{{\rm{t}}_{kj}}}$

(22)

3.2 融合信任关系

综上分析了用户间的信任度、用户社会地位影响力以及用户的同质性，本文将这些权重因素融入矩阵分解中。图3为融合用户间信任关系的矩阵分解示意图。

图 3 矩阵分解示意图

下载: 全尺寸图片幻灯片

如图3所示，用户的信任网络由7个用户和15条关系组成，每个用户有自己的社会影响度和彼此间信任度，用户 ${u_7}$ 为冷启动用户，其对活动没有评价记录，仅利用评价信息无法为其推荐感兴趣的活动。由于用户-活动评价矩阵和用户间的信任关系都会预测到用户的兴趣所在。为了给用户 ${u_7}$ 推荐感兴趣的活动，这里利用矩阵分解技术将用户-活动评分矩阵分解为 ${\mathbf{U}}{{\mathbf{t}}^{\rm{T}}}{\mathbf{St}}$ ，具体的根据评分矩阵和用户间信任矩阵将用户特征矩阵 ${\mathbf{Ut}}$ 映射到共享低秩空间，从而利用 ${u_7}$ 信任用户获取其隐特征 ${\mathbf{U}}{{\mathbf{t}}_i}$

${\mathbf{U}}{{\mathbf{t}}_i} = \frac{{\displaystyle\sum\limits_{{u_j} \in {A_{{u_i}}}} {{S_{{\rm{tr}}}}({u_i},{u_j}){\mathbf{U}}{{\mathbf{t}}_j}} }}{{\displaystyle\sum\limits_{{u_j} \in {A_{{u_i}}}} {{S_{{\rm{tr}}}}({u_i},{u_j})} }}$

(23)

其中， ${\mathbf{U}}{{\mathbf{t}}_i}$ 为用户 ${u_i}$ 的特征矩阵， ${A_{{u_i}}}$ 为用户 ${u_i}$ 的信任用户集合，将用户 ${u_i}$ 与所有信任用户的信任关系归一化，即 $\displaystyle\sum\nolimits_{{u_j} \in {A_{{u_i}}}} {{S_{{\rm{tr}}}}({u_i},{u_j})} = 1$ ，可得

${\mathbf{Ut}}_i' = \sum\limits_{{u_j} \in {A_{{u_i}}}} {{S_{{\rm{tr}}}}({u_i},{u_j}){\mathbf{U}}{{\mathbf{t}}_j}}$

(24)

3.3 融合用户社会影响度

根据文献[14]，假设用户和活动的隐特征向量服从高斯先验分布

$p({\mathbf{Ut}}|\sigma _{{\rm{Ut}}}^2) = \prod\limits_{i = 1}^N {N({\mathbf{U}}{{\mathbf{t}}_{{u_i}}}|0,\sigma _{{\rm{Ut}}}^2)}$

(25)

$p({\mathbf{St}}|\sigma _{{\rm{St}}}^2) = \prod\limits_{j = 1}^M {N({\mathbf{S}}{{\mathbf{t}}_{{u_j}}}|0,\sigma _{{\rm{St}}}^2)}$

(26)

将用户间信任网络融入用户特征向量中，并根据目标用户的近邻用户特征向量获得其条件分布

$p({\mathbf{Ut}}|{{\boldsymbol{W}}^{\mathbf{*}}},\sigma _{{W'}}^2) = \prod\limits_{i = 1}^N {N({\mathbf{U}}{{\mathbf{t}}_i}|\sum\limits_{{u_j} \in {A_{{u_i}}}} {{{W}}_{ij}^*{\mathbf{U}}{{\mathbf{t}}_j},} \sigma _{{W^*}}^2)}$

(27)

利用贝叶斯后验概率对隐特征进行推导可得

$\begin{split} & p({\mathbf{Ut}},{\mathbf{St}}|{\boldsymbol{R}},{{\boldsymbol{W}}^*},\sigma _R^2,\sigma _{{W'}}^2,\sigma _{{\rm{Ut}}}^2,\sigma _{{\rm{St}}}^2) \\ & \quad\propto p({\boldsymbol{R}}|{\mathbf{Ut}},{\mathbf{St}},\sigma _R^2)p({\mathbf{Ut}}|{{\boldsymbol{W}}^*},\sigma _{{\rm{Ut}}}^2,\sigma _{{W^*}}^2)p({\mathbf{St}}|\sigma _{{\rm{St}}}^2) \\ & \quad = \prod\limits_{i = 1}^N {\prod\limits_{j = 1}^M {{{[N({r_{ij}}|g({\mathbf{Ut}}_i^{\rm{T}}{\mathbf{S}}{{\mathbf{t}}_j}),\sigma _R^2)]}^{I(x)_{ij}^R}}} } \\ & \qquad \times\prod\limits_{i = 1}^N {N({\mathbf{U}}{{\mathbf{t}}_i}|\sum\limits_{{u_j} \in {T_{{u_i}}}} {{{W}}_{ij}^*{\mathbf{U}}{{\mathbf{t}}_j},\sigma _{{W^*}}^2{\boldsymbol{I}}} )} \\ & \qquad\times\prod\limits_{i = 1}^N {N({\mathbf{U}}{{\mathbf{t}}_i}|0,\sigma _{{\rm{Ut}}}^2) \times \prod\limits_{j = 1}^M {N({\mathbf{S}}{{\mathbf{t}}_j}|0,\sigma _{{\rm{St}}}^2{\boldsymbol{I}})} } \\[-20pt] \end{split}$

(28)

其中， ${\boldsymbol{I}}$ 为 $d$ 维单位对角矩阵，其中 $d$ 为矩阵 ${\mathbf{Ut}}$ 和 ${\mathbf{St}}$ 的维度, ${A_{{u_i}}}$ 为用户 ${u_i}$ 的相邻用户集合。

3.4 融合用户同质性

将用户间同质性融入PMF中，可得用户特征条件分布

$p({\mathbf{Ut}}|{\boldsymbol{H}},\sigma _H^2) = \prod\limits_{i = 1}^N {N\left({\mathbf{U}}{{\mathbf{t}}_{{u_i}}}|\sum\limits_{{u_j} \in {A_{{u_i}}}} {{{{H}}_{{u_i}{u_j}}}{\mathbf{U}}{{\mathbf{t}}_{{u_j}}},} \sigma _H^2\right)}$

(29)

融入用户-活动评分矩阵、用户间信任矩阵以及用户间的同质性，可得矩阵 ${\mathbf{Ut}}$ 和 ${\mathbf{St}}$ 的后验概率

$\begin{split} & p({\mathbf{Ut}},{\mathbf{St}}|{\boldsymbol{R}},{{\boldsymbol{W}}^*},{\boldsymbol{H}},\sigma _R^2,\sigma _{{W^*}}^2,\sigma _{{\rm{Ut}}}^2,\sigma _{{\rm{St}}}^2,\sigma _H^2) \\ &\quad \propto p({\boldsymbol{R}}|{\mathbf{Ut}},{\mathbf{St}},\sigma _R^2)p({\mathbf{Ut}}|{{\boldsymbol{W}}^*},\sigma _{{\rm{Ut}}}^2,\sigma _{{W'}}^2)\\ & \qquad \cdot p{\mathbf{(Ut}}|{\boldsymbol{H}},\sigma _{{\rm{Ut}}}^2,\sigma _H^2)p{\mathbf{(St}}|\sigma _{{\rm{St}}}^2) \\ &\quad = \prod\limits_{i = 1}^N {\prod\limits_{j = 1}^M {{{[N({r_{ij}}|g{\mathbf{(Ut}}_i^{\rm{T}}{\mathbf{S}}{{\mathbf{t}}_j}),\sigma _R^2)]}^{I(x)_{ij}^R}}} } \\ &\qquad \times\prod\limits_{i = 1}^N {N({\mathbf{U}}{{\mathbf{t}}_i}|\sum\limits_{{u_j} \in {A_{{u_i}}}} {{{W}}_{ij}^*{\mathbf{U}}{{\mathbf{t}}_j},\sigma _{{W^*}}^2{\boldsymbol{I}}} )} \\ &\qquad\times \prod\limits_{i = 1}^N {N({\mathbf{U}}{{\mathbf{t}}_i}|\sum\limits_{{u_j} \in {A_{{u_i}}}} {{{{H}}_{{u_i}{u_j}}}{\mathbf{U}}{{\mathbf{t}}_j},\sigma _H^2{\boldsymbol{I}}} )} \\ &\qquad \times\prod\limits_{i = 1}^N {N({\mathbf{U}}{{\mathbf{t}}_i}|0,\sigma _{{\rm{Ut}}}^2) \times \prod\limits_{j = 1}^M {N({\mathbf{S}}{{\mathbf{t}}_j}|0,\sigma _{{\rm{St}}}^2{\boldsymbol{I}})} } \end{split}$

(30)

3.5 本文算法

用户 ${u_i}$ 对 ${u_j}$ 非常信任并不代表 ${u_i}$ 和 ${u_j}$ 具有偏好相似，若用户 ${u_i}$ 与其所信任用户的偏好有较大的偏差，那么基于用户 ${u_i}$ 隐特征向量所得到的目标用户预测评分也有一定偏差。为降低偏差对预测精度的影响，引入正则项以约束用户与其近邻

$\frac{\varphi }{2}\sum\limits_{i = 1}^N {\sum\limits_{{u_k} \in {T_{{u_i}}}} {{\rm{sim}}(i,k)||{\mathbf{U}}{{\mathbf{t}}_i} - {\mathbf{U}}{{\mathbf{t}}_k}||_{\rm{F}}^2} }$

(31)

进一步考虑用户 ${u_i}$ 在选择活动时会对类似的活动感兴趣，可能接受相似活动作为推荐结果，为此以社交正则化约束活动特征 ${\mathbf{St}}$

$\frac{\phi }{2}\sum\limits_{j = 1}^M {\sum\limits_{{s_z} \in {T_{{s_j}}}} {{\rm{sim}}(j,z)||{\mathbf{S}}{{\mathbf{t}}_j} - {\mathbf{S}}{{\mathbf{t}}_z}||_{\rm{F}}^2} }$

(32)

综上分析，将用户和活动的正则化约束项代入推荐模型中，并将原始问题转化成最小化目标函数

$\begin{split} & L({{{\boldsymbol{R}},{\boldsymbol U{\boldsymbol{t}}}}},{\mathbf{St}},{{\boldsymbol{W}}^ * },{\boldsymbol{H}}) \\ &\quad = \frac{1}{2}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^M {I(x)_{ij}^R{{({r_{ij}} - g({\mathbf{Ut}}_i^{\rm{T}}{\mathbf{S}}{{\mathbf{t}}_j}))}^2}} } \\ & \qquad+ \frac{{{\lambda _{{\boldsymbol{Ut}}}}}}{2}\sum\limits_{i = 1}^N {{\mathbf{U}}{{\mathbf{t}}^{\rm{T}}}{\mathbf{Ut}}} + \frac{{{\lambda _{{\boldsymbol{St}}}}}}{2}\sum\limits_{j = 1}^M {{\mathbf{S}}{{\mathbf{t}}^{\rm{T}}}{\mathbf{St}}} \\ & \qquad+ \frac{{{\lambda _W}}}{2}\sum\limits_{i = 1}^N \Bigr[{{({\mathbf{U}}{{\mathbf{t}}_i} - \sum\limits_{{u_j} \in {A_{{u_i}}}} {{{W}}_{ij}^ * {\mathbf{U}}{{\mathbf{t}}_j}} )}^{\rm{T}}}\\ & \qquad\cdot({\mathbf{U}}{{\mathbf{t}}_i} - \sum\limits_{{u_j} \in {A_{{u_i}}}} {{{W}}_{ij}^ * {\mathbf{U}}{{\mathbf{t}}_j}} )\Bigr] \\ & \qquad + \frac{{{\lambda _H}}}{2}\sum\limits_{i = 1}^N \Bigr[{{({\mathbf{U}}{{\mathbf{t}}_i} - \sum\limits_{{u_j} \in {A_{{u_i}}}} {{{{H}}_{{u_i}{u_j}}}{\mathbf{U}}{{\mathbf{t}}_j}} )}^{\rm{T}}}\\ &\qquad\cdot ({\mathbf{U}}{{\mathbf{t}}_i} - \sum\limits_{{u_j} \in {A_{{u_i}}}} {{{{H}}_{{u_i}{u_j}}}{\mathbf{U}}{{\mathbf{t}}_j}} )\Bigr] \\ & \qquad + \frac{\varphi }{2}\sum\limits_{i = 1}^N {\sum\limits_{{u_k} \in {T_{{u_i}}}} {{\rm{sim}}(i,k)||{\mathbf{U}}{{\mathbf{t}}_i} - {\mathbf{U}}{{\mathbf{t}}_k}||_{\rm{F}}^2} } \\ & \qquad + \frac{\phi }{2}\sum\limits_{j = 1}^M {\sum\limits_{{s_z} \in {T_{{s_j}}}} {{\rm{sim}}(j,z)||{\mathbf{S}}{{\mathbf{t}}_j} - {\mathbf{S}}{{\mathbf{t}}_z}||_{\rm{F}}^2} } \end{split}$

(33)

其中， ${\lambda _{{\boldsymbol{Ut}}}} = \dfrac{{\sigma _R^2}}{{\sigma _{{\rm{Ut}}}^2}}$ , ${\lambda _{{\boldsymbol{St}}}} = \dfrac{{\sigma _R^2}}{{\sigma _{{\rm{St}}}^2}}$ , ${\lambda _W} = \dfrac{{\sigma _R^2}}{{\sigma _{{W}}^2}}$ , ${\lambda _H} = \dfrac{{\sigma _R^2}}{{\sigma _H^2}}$ ，利用随机梯度下降优化式(33)可得 ${\mathbf{U}}{{\mathbf{t}}_i}$ 和 ${\mathbf{S}}{{\mathbf{t}}_j}$ 的梯度

$\begin{split} \frac{{\partial L}}{{\partial {\mathbf{U}}{{\mathbf{t}}_i}}} =\, & \sum\limits_{j = 1}^M I(x)_{ij}^R{\mathbf{S}}{{\mathbf{t}}_j}{g'}({\mathbf{Ut}}_i^{\rm{T}}{\mathbf{S}}{{\mathbf{t}}_j})[g({\mathbf{Ut}}_i^{\rm{T}}{\mathbf{S}}{{\mathbf{t}}_j}) - {r_{ij}}] \\ & + {\lambda _{{\boldsymbol{Ut}}}}{\mathbf{U}}{{\mathbf{t}}_i} + {\lambda _W}\left({\mathbf{U}}{{\mathbf{t}}_i} - \sum\limits_{{u_j} \in {A_{{u_i}}}} {{{W}}_{ij}^ * {\mathbf{U}}{{\mathbf{t}}_j}} \right) \\ &- {\lambda _W}\sum\limits_{{u_i} \in {A_{{u_j}}}} {{{W}}_{ij}^ * \left({\mathbf{U}}{{\mathbf{t}}_j} - \sum\limits_{{u_x} \in {A_{{u_j}}}} {{{W}}_{jx}^ * {\mathbf{U}}{{\mathbf{t}}_x}} \right)} \\ & + {\lambda _H}\left({\mathbf{U}}{{\mathbf{t}}_i} - \sum\limits_{{u_j} \in {A_{{u_i}}}} {{{{H}}_{{u_i}{u_j}}}{\mathbf{U}}{{\mathbf{t}}_j}} \right) \\ &- {\lambda _H}\sum\limits_{{u_i} \in {A_{{u_j}}}} {{{{H}}_{{u_i}{u_j}}}\left({\mathbf{U}}{{\mathbf{t}}_j} - \sum\limits_{{u_x} \in {A_{{u_j}}}} {{{{H}}_{{u_j}{u_x}}}{\mathbf{U}}{{\mathbf{t}}_x}} \right)} \\ & + \varphi \sum\limits_{{u_k} \in {T_{{u_i}}}} {\rm{sim}}(i,k){\mathbf{(U}}{{\mathbf{t}}_i} - {\mathbf{U}}{{\mathbf{t}}_k}) \\ &+ \varphi \sum\limits_{{u_y} \in T_{{u_i}}^\_} {{\rm{sim}}(i,y)({\mathbf{U}}{{\mathbf{t}}_i} - {\mathbf{U}}{{\mathbf{t}}_y})}\\[-21pt] \end{split}$

(34)

$\begin{split} \frac{{\partial L}}{{\partial {\mathbf{S}}{{\mathbf{t}}_j}}} = \,& \sum\limits_{i = 1}^N {I(x)_{ij}^R{\mathbf{U}}{{\mathbf{t}}_i}{g'}({\mathbf{Ut}}_i^{\rm{T}}{\mathbf{S}}{{\mathbf{t}}_j})[g{\mathbf{(Ut}}_i^{\rm{T}}{\mathbf{S}}{{\mathbf{t}}_j}) - {r_{ij}}]} \\ & + {\lambda _{{\boldsymbol{St}}}}{\mathbf{St}} + \phi \sum\limits_{{s_z} \in {T_{{s_j}}}} {{\rm{sim}}(j,z)({\mathbf{S}}{{\mathbf{t}}_j} - {\mathbf{S}}{{\mathbf{t}}_z})}\\[-10pt] \end{split}$

(35)

式(34)中 $T_{{u_i}}^\_$ 表示被用户 ${u_i}$ 信任的用户集合。用户和活动的隐特征向量 ${\mathbf{U}}{{\mathbf{t}}_i}$ 和 ${\mathbf{S}}{{\mathbf{t}}_j}$ 可通过式(16)和式(17)获得。

结合前文所述，本文算法的伪代码如下：

步骤1　输入用户集合 $U = \{ {u_1},{u_2},\cdots,{u_N}\}$ ，活动集合 $S$ ，用户-活动评分矩阵 ${\boldsymbol{R}}$ ，用户信任矩阵 ${{\boldsymbol{W}}^{\mathbf{*}}}$ ，初始化 ${\boldsymbol{Ut}}_i^{(0)}$ , ${\boldsymbol{St}}_j^{(0)}$ , $\varepsilon ,t = 0$ ，最大迭代次数 ${\rm{MAX}}$ ;

步骤2　 ${\rm{for}}(i = 0,i \le ||U||,i + + )$

步骤3　 ${\rm{for}}(j = 0,j \le ||S||,j + + )$

步骤4　 ${\rm{if}}\;{W}^{*}\notin \varnothing$ 利用式(7)计算 ${{W}}_{ij}^{*}$ ；

步骤5　 ${\rm{end}}\;{\rm{for}}$

步骤6　 ${\rm{end}}\;{\rm{for}}$

步骤7　 ${\rm{for}}(i = 0,i \le ||U||,i + + )$

步骤8　 ${\rm{for}}(j = 0,j \le ||S||,j + + )$

步骤9　 ${\rm{if}}\;H\notin \varnothing$ 利用式(12)计算 ${H}_{{u}_{i}{u}_{j}}$ ；

步骤10　 ${\rm{end}}\;{\rm{for}}$

步骤11　 ${\rm{end}}\;{\rm{for}}$

步骤12　 ${\rm{While(}}t{\rm{ < MAX)}}\;$

步骤13　利用式(34)和式(35)分别计算 $\dfrac{{\partial L(t)}}{{\partial {\mathbf{U}}{{\mathbf{t}}_i}}}$ , $\dfrac{{\partial L(t)}}{{\partial {\mathbf{S}}{{\mathbf{t}}_j}}}$ ；

步骤14　利用式(16)和式(17)分别计算 ${\mathbf{Ut}}_i^{(t + 1)}$ , ${\mathbf{St}}_j^{(t + 1)}$ ；

步骤15　 ${\rm{if}}\;(L(t + 1) - L(t)) < \varepsilon$ 执行步骤13；

步骤16　 $t + + ;$

步骤17　 ${\rm{end}}\;{\rm{while}}$

步骤18　输出 ${\boldsymbol{Ut}}_i^*$ , ${\boldsymbol{St}}_j^*$ ；

步骤19　根据式(22)预测评分

本文将用户间的信任关系、用户的社会影响力和用户同质性融入矩阵分解中，算法的时间代价主要集中于计算目标函数 $L$ 和梯度学习特征矩阵 ${\mathbf{Ut}}$ , ${\mathbf{St}}$ 上。其中计算目标函数的时间复杂度为 $O({\gamma _R}d + {\gamma _{{W^*}}}d + {\gamma _H}d)$ ， ${\gamma }_{R},{\gamma }_{{W}^{*}},{\gamma }_{H}$ 分别为用户-活动评分矩阵 ${\boldsymbol{R}}$ 、用户信任矩阵 ${{\boldsymbol{W}}^{\mathbf{*}}}$ 和用户同质性矩阵 ${\boldsymbol{H}}$ 中非零元素数，梯度学习特征向量的时间复杂度为 $O({\gamma _R}d\bar r + {\gamma _{{W^*}}}d{\bar w^2} + {\gamma _H}d{\bar h^2})$ ， $\overline{r},\overline{w},\overline{h}$ 分别表示用户的平均评分个数、平均信任个数以及平均近邻个数等。

4. 仿真实验与对比分析

4.1 实验数据及评价标准

本文算法目的是为某个城市中的用户推荐感兴趣的活动或项目，为了验证本文算法的有效性和优越性，以豆瓣和Ciao为实验数据来源。在豆瓣上选择北京市2018年1月1日～2019年12月31日期间用户评价的活动或项目为实验数据，豆瓣用户可以对自己所感兴趣的书籍、电影、电视剧、音乐进行评价，其中在北京数据集上共有15384名用户，相互信任关系141556条，产生的有效评分70146条，评分信息的稀疏度为98.32%，用户社交关系的稀疏度为99.88%。

Ciao是著名的欧洲消费点评网站，网站用户不仅可以浏览其他用户的评论还可以对其参与的商品进行评价。本文所采用的实验数据来自Tang等人^[15]获取的1999年～2011年间的项目评分和社交数据。其中共有7357名用户，评分记录278483条，相互信任关系111781条，评分信息的稀疏度为99.96%，用户社交关系的稀疏度为99.59%。

平均绝对误差(Mean Absolute Error, MAE)和均方差误差(Root Mean Squared Error, RMSE)是目前推荐领域最为常见评价方法

$\qquad {\rm{MAE}} = \frac{{\displaystyle\sum\limits_{(i,j) \in {{\boldsymbol{R}}_{{\rm{test}}}}} {|{r_{ij}} - {{\hat r}_{ij}}|} }}{{|{{\boldsymbol{R}}_{{\rm{test}}}}|}}$

(36)

$\qquad {\rm{RMSE}} = \sqrt {\frac{{\displaystyle\sum\limits_{(i,j) \in {{\boldsymbol{R}}_{{\rm{test}}}}} {{{({r_{ij}} - {{\hat r}_{ij}})}^2}} }}{{|{{\boldsymbol{R}}_{{\rm{test}}}}|}}}$

(37)

参考文献[16-20]对文中的参数设定如表1所示。

表 1 参数设置

参数	值	参数	值
用户特征正则化控制参数 ${\lambda _{{\boldsymbol{Ut}}} }$	0.1	用户同质性调节参数 ${\lambda _H}$	0.5
活动特征正则化控制参数 ${\lambda _{{\boldsymbol{St}}} }$	0.1	用户信任网络跳出率 $\rho$	0.85
用户社会影响力调节参数 ${\lambda _W}$	5	隐特征矩阵维度 $d$	15
梯度学习速率 $\beta$	0.01	跳数阈值 ${h_\theta }$	3
同质相似性阈值 $\alpha$	0.8	时间衰减参数 $\delta$	0.5

下载: 导出CSV

| 显示表格

4.2 参数设置

用户社会影响力和同质性是影响推荐的重要因素，参数 ${\lambda _W}$ , ${\lambda _H}$ 大小决定着用户行为和地位对信任用户的渗透力。这里在豆瓣北京和Ciao数据集上测试参数 ${\lambda _W}$ , ${\lambda _H}$ 与推荐评价指标 ${\rm{MAE}}$ 间的关系。当其他调节参数设置为0时，社会影响力调节参数 ${\lambda _W}$ 与平均绝对误差MAE的关系如图4所示。

图 4 不同数据集上参数

${\lambda _W}$ 与

${\rm{MAE}}$ 关系

下载: 全尺寸图片幻灯片

由图4可知，在豆瓣北京和Ciao数据集上随着参数 ${\lambda _W}$ 的增大，推荐评价指标 ${\rm{MAE}}$ 值先降后增。并且训练数据越多，得到的推荐精度就越高,预测误差就越小。在豆瓣北京数据集上 ${\lambda _W} = 5$ 时 ${\rm{MAE}}$ 取得最小值，算法此时获得最好的预测结果；在Ciao数据集上 ${\lambda _W} = 4$ 时 ${\rm{MAE}}$ 取得最小值，综上所述，本文将用户社会影响力调节参数 ${\lambda _W}$ 设置为5。当其他调节参数设置为0时，同质性调节参数 ${\lambda _H}$ 与平均绝对误差MAE的关系如下。

由图5可以看出，在豆瓣北京和Ciao数据集上参数 ${\lambda _H}$ 与 ${\rm{MAE}}$ 的变化趋势是一致的，即随着 ${\lambda _H}$ 的不断增大，平均绝对误差 ${\rm{MAE}}$ 先下降后增大。并且随着训练数据的增多，平均绝对误差 ${\rm{MAE}}$ 越小，推荐预测精度越高。在豆瓣北京数据集上 ${\lambda _H} = 0.35$ 时平均绝对误差 ${\rm{MAE}}$ 取得最小值；在Ciao数据集上 ${\lambda _H} = 0.7$ 时 ${\rm{MAE}}$ 取得最小值。为了使获得的推荐精度最优，我们这里折中取值 ${\lambda _H} = 0.5$ ，虽然此时在不同的数据集上不能获得最优结果，但能获得平均最优。

图 5 不同数据集上参数

${\lambda _H}$ 与

${\rm{MAE}}$ 关系

下载: 全尺寸图片幻灯片

为了降低偏差对预测精度的影响，本文引入两个正则项分别对用户特征和活动特征进行约束，约束参数 $\varphi$ 和 $\phi$ 分别用于控制用户特征和活动特征受近邻的影响程度。图6和图7分别为正则项约束参数 $\varphi$ 和 $\phi$ 与平均绝对误差 ${\rm{MAE}}$ 间的关系。

图 6 不同数据集上参数

$\varphi$ 与

${\rm{MAE}}$ 关系

下载: 全尺寸图片幻灯片

图 7 不同数据集上参数

$\phi$ 与

${\rm{MAE}}$ 关系

下载: 全尺寸图片幻灯片

由图6可知，在豆瓣北京数据集上，随着用户特征正则项约束参数 $\varphi$ 的增大，平均绝对误差 ${\rm{MAE}}$ 大致的走势是先降低后增大，在 $0.05 \le \varphi \le 0.08$ 之间，平均绝对误差 ${\rm{MAE}}$ 振荡上升；在Ciao数据集上，随着用户特征正则项约束参数 $\varphi$ 的增大，平均绝对误差 ${\rm{MAE}}$ 也是先降低后增大。并且随着训练数据的增多，平均绝对误差 ${\rm{MAE}}$ 越小，算法的推荐预测精度越高。在豆瓣北京数据集上时正则项约束参数 $\varphi = 0.048$ 时平均绝对误差 ${\rm{MAE}}$ 取得最小值；在Ciao数据集上正则项约束参数 $\varphi = 0.03$ 时 ${\rm{MAE}}$ 取得最小值。综合取用户特征正则项约束参数 $\varphi = 0.048$ 。

图7为豆瓣北京和Ciao数据集上，活动特征正则项约束参数 $\phi$ 与平均绝对误差 ${\rm{MAE}}$ 间的关系。随着正则项约束参数 $\phi$ 取值的增大，平均绝对误差 ${\rm{MAE}}$ 呈“W”状波动变化。在豆瓣北京数据集上当 $\phi = 0.1$ 时平均绝对误差 ${\rm{MAE}}$ 取得最小值；在Ciao数据集上，正则项约束参数 $\phi = 0.102$ 时，平均绝对误差 ${\rm{MAE}}$ 取得最小值。并且随着训练数据的增多，平均绝对误差 ${\rm{MAE}}$ 越小，算法的推荐预测精度越高。综合取用户特征正则项约束参数 $\phi = 0.01$ 。上述两个正则项约束参数既不能取值太大，也不能取值太小，取值太大则会控制学习的进度，取值太小就无法起到约束的作用。

隐特征矩阵维度 $d$ 也是影响算法性能的因素之一，维度太大可表征的隐藏信息就越多，但引入噪声信息的可能也越大，若维度太小，就无法全面挖掘深层隐藏信息，为此选择恰当的维度至关重要。

从图8曲线走势可知，在豆瓣北京数据集上，随着隐特征矩阵维度 $d$ 的增大，平均绝对误差 ${\rm{MAE}}$ 先降低后增大后期增幅缓慢，其中维度 $d = 15$ 时，平均绝对误差 ${\rm{MAE}}$ 取得最小值；在Ciao数据集上，随着隐特征矩阵维度 $d$ 的增大，平均绝对误差 ${\rm{MAE}}$ 先降低后缓慢增加，其中维度 $d = 20$ 时，平均绝对误差 ${\rm{MAE}}$ 取得最小值。无论在豆瓣北京数据集上还是在Ciao数据集上，当隐特征矩阵维度大于一定阈值后，不仅不会降低平均绝对误差，反而缓慢增加，这也侧面反映出隐含特征所能表达的信息是有限的，徒增特征矩阵的维度，不仅不能提升推荐的准确率，反而会引入一些不必要的噪声，降低推荐的精度。

图 8 不同数据集上维度

$d$ 与

${\rm{MAE}}$ 关系

下载: 全尺寸图片幻灯片

本文仿真实验的硬件环境为:Intel(R) Core(TM) i5-9400F@4.1 GHz, RAM: 4 GB，软件环境为：Windows 7操作系统，Python编程实现。对比实验从两个方面进行：一是对比分析各算法的有效性；二是对比本算法与同类算法对冷启动的敏感性。实验采用八折交叉验证，即将每3个月的活动数据作为子数据集，这样的数据划分主要考虑到同一季度内由于气候和环境的相似，活动项目能聚类出现。

这里将文献[17](MIMFCF)、文献[12](ISSMF)、文献[19](CSIT)、文献[21](RSNMF)、文献[22](PMF)、文献[23](AODR)、文献[24](CA-NCF)和文献[25](AutoTrustRec)作为对比算法，MIMFCF,ISSMF,CSIT,RSNMF和PMF等5种算法为传统推荐算法，AODR, CA-NCF, AutoTrustRec等3种为深度学习推荐模型。其中MIMFCF提出了两个有效矩阵分解框架，一个集成流形正则化，一个集成动态Tikhonov图正则化；基于二者深入挖掘用户-项目矩阵的内在信息；ISSMF利用整体社交网络结构信息和用户的评分信息推导特定领域社交网络结构,借助Pagerank计算用户在特定领域的社会地位，并将其融入矩阵分解；CSIT将用户信任朋友的影响引入矩阵分解模型中，借助聚类舒缓数据稀疏问题；RSNMF为基于正则项约束的非负矩阵分解算法；AODR使用深度学习从评论文本提取评分矩阵，引入张量因子分解计算加权意见，然后融合扩展协作过滤技术改进推进系统；CA-NCF提出了一种混合算法来追溯和重新利用预筛选上下文信息，并将获得的新维度用于深度学习协作过滤；AutoTrustRec利用深度架构来学习隐藏的用户和项目表示，使用自动编码器中的共享层将直接和间接信任值反馈神经网络。

4.3 算法的有效性

为了进一步验证本文算法与其他同类算法的有效性，以平均绝对误差 ${\rm{MAE}}$ 和均方差误差 ${\rm{RMSE}}$ 作为评价标准，分别在豆瓣北京和Ciao数据集上进行对比实验，结果如图9所示。

图 9 不同数据集上维度

$d$ 与

${\rm{MAE}}$ 关系

下载: 全尺寸图片幻灯片

从图9(a)上可以看出，当确定特征维度时，本文算法(MWFPMF)的平均绝对误差是最低的，其次是CSIT, MIMFCF, RSNMF, ISSMF和PMF；特别当特征维度 $d = 15$ 时，本文算法的平均绝对误差 ${\rm{MAE}}$ 取得最小值，至少低于其他5种算法8.24%，此时获得的推荐精度最佳。当增加特征维度，即 $d = 20$ 时各算法的平均绝对误差不仅没有降低，反而增大了，这是由于随着特征维度的增加，其能表达的隐含特征信息加大，无形中引入了噪声，反而降低了算法推荐的准确率。图9(b)中可知，在Ciao数据集上随着特征维度的增大，各算法的推荐准确率在提升，当特征维度 $d = 20$ 时，各算法推荐精度达到最高值，此时本文算法的平均绝对误差至少低于其他5种算法6.58%。

图10的变化趋势与图9基本一致，从图10(a)可知：在确定维度上，本文算法的均方差误差相较于其他5种算法是最低的，其中当特征维度 $d = 15$ 时，本文算法的均方差误差 ${\rm{RMSE}}$ 取得最小值，至少低于其他5种算法7.83%，所得到的推荐精度最高；图10(b)中可知，在Ciao数据集上随着特征维度的增大，各算法的均方差误差 ${\rm{RMSE}}$ 在降低，当特征维度 $d = 20$ 时，各算法的均方差误差达到最小值，此时本文算法的均方差误差至少低于其他5种算法6.27%。

图 10 不同数据集上维度

$d$ 与

${\rm{RMSE}}$ 关系

下载: 全尺寸图片幻灯片

4.4 冷启动用户对算法性能影响

为了进一步验证本算法对冷启动用户推荐的精度，这里将用户评分项目少于3个归为冷启动用户，分别从豆瓣北京和Ciao数据集上抽取冷启动用户，以平均绝对误差 ${\rm{MAE}}$ 和均方差误差 ${\rm{RMSE}}$ 作为推荐评价标准，验证各算法对冷启动用户的推荐性能。

通过表2推荐评价指标对比可知，在豆瓣北京数据集上本文算法对冷启动用户推荐的平均绝对误差相较于CSIT, MIMFCF, RSNMF, ISSMF, PMF等5种传统推荐算法分别降低了5.64%, 8.92%, 11.07%, 20.02%和22.05%，相较于AODR, CA-NCF, AutoTrustRec等3种深度学习推荐模型平均绝对误差分别仅降低了0.9%, 2.82%和6.78%；对冷启动用户推荐的均方差误差相较于CSIT, MIMFCF, RSNMF, ISSMF, PMF等5种传统推荐算法分别降低了8.08%, 10.55%, 13.41%, 20.19%和24.27%，相较于AODR, CA-NCF, AutoTrustRec等3种深度学习推荐模型均方差误差分别仅降低了3.01%, 4.02%和8.61%。

表 2 各算法对冷启动用户的推荐性能比较

推荐算法	豆瓣北京数据集		Ciao数据集
推荐算法	${\rm{MAE}}$	${\rm{RMSE}}$	${\rm{MAE}}$	${\rm{RMSE}}$
MWFPMF	0.8417	1.0526	0.8333	1.0348
AODR	0.8493	1.0843	0.8407	1.0695
CA-NCF	0.8654	1.0949	0.8537	1.0814
CSIT	0.8892	1.1377	0.8945	1.1229
AutoTrustRec	0.8988	1.1432	0.8964	1.1291
MIMFCF	0.9168	1.1637	0.9125	1.1339
RSNMF	0.9349	1.1938	0.9368	1.1954
ISSMF	1.0102	1.2651	0.9929	1.2695
PMF	1.0273	1.3081	1.0169	1.3096

下载: 导出CSV

| 显示表格

在Ciao数据集上本文算法对冷启动用户推荐的平均绝对误差相较于CSIT, MIMFCF, RSNMF, ISSMF, PMF等5种传统推荐算法分别降低了7.34%, 9.51%, 12.42%, 19.15%和22.03%，相较于AODR, CA-NCF, AutoTrustRec等3种深度学习推荐模型平均绝对误差分别仅降低了0.89%, 2.45%和7.57%；对冷启动用户推荐的均方差误差相较于CSIT, MIMFCF, RSNMF, ISSMF, PMF等5种传统推荐算法分别降低了8.52%, 9.58%, 15.52%, 22.69%和26.56%，相较于AODR, CA-NCF, AutoTrustRec等3种深度学习推荐模型均方差误差分别仅降低了3.35%, 4.5%和9.11%。

通过以上对比可知，传统矩阵分解推荐模型PMF, ISSMF和RSNMF效果较差，这是由于传统模型仅依赖用户对活动项目的评分并没有充分利用用户间信任去拓展分析信任用户间的兴趣偏好，面对稀疏数据，无法进一步提高推荐的精准性；推荐模型CSIT和MIMFCF的推荐性能较传统矩阵分解推荐模型PMF, ISSMF, RSNMF有较大的提升，这是因为它们集成了1种或多种社交关系到矩阵分解中，通过深入挖掘信任用户间的隐含关联，以求准确获取目标用户的兴趣偏好，一定程度上提高了推荐的精准度。AODR, CA-NCF和AutoTrustRec 3种深度学习推荐算法从不同角度借助深度学习挖掘有限的用户评论信息，同时融合加权意见, 上下文信息等手段进一步提高了推荐精准度，相比其他5种传统算法推荐精度有一定提高，但本文对冷启动用户融合多权重因素借助低秩概率矩阵进行深入分解，隐匿关联信息的挖掘更为充分，推荐性能更为优异。

4.5 数据量对算法性能的影响

为了进一步对比分析传统推荐算法与深度学习推荐模型的性能，这里分别取豆瓣北京和Ciao数据集1%, 50%和100%的数据量进行测试。由于1%的数据量偏少，为了充分利用有限数据，防止过拟合，在1%数据集上采用5折交叉验证，而50%和100%数据集上随机选择80%的数据用于训练，剩余20%用作测试。以平均绝对误差 ${\rm{MAE}}$ 和均方差误差 ${\rm{RMSE}}$ 作为评价标准，结果如下：

由于图11和图12可以得出，数据集测试比例逐渐增大时，各算法推荐的平均绝对误差 ${\rm{MAE}}$ 和均方差误差 ${\rm{RMSE}}$ 随之降低，表明算法的推荐精度在提高。在豆瓣北京数据集上，本文算法推荐的平均绝对误差 ${\rm{MAE}}$ 和均方差误差 ${\rm{RMSE}}$ 都低于CSIT, MIMFCF, RSNMF, ISSMF, PMF等5种传统推荐算法，推荐精度明显高于5种传统推荐算法；与AODR, CA-NCF, AutoTrustRec等3种深度学习推荐模型相比，本文算法在数据集比例较低时(1%数据量)，平均绝对误差 ${\rm{MAE}}$ 和均方差误差 ${\rm{RMSE}}$ 均低于3种深度学习推荐模型，表现出了优秀的推荐效果，这是由于本文推荐算法融合用户间信任度、用户社会地位影响力和用户同质性等多权重因素，借助低秩概率矩阵分解对用户-活动进行了深入充分的挖掘，在有限测试数据量下一定程度上提高了推荐精度。随着测试数据集比例的增大，3种深度学习推荐模型的推荐精度提升较快，当以全部数据测试推荐时，AODR推荐算法的平均绝对误差MAE与本文算法接近。

图 11 豆瓣北京数据集上各算法评价指标

下载: 全尺寸图片幻灯片

图 12 Ciao数据集上各算法评价指标

下载: 全尺寸图片幻灯片

在Ciao数据集上获得的结果与在豆瓣北京数据集上基本一致，但在以全部数据测试推荐时，AODR推荐算法的平均绝对误差MAE和均方差误差RMSE略低于本文推荐算法。综上可知本文推荐算法较适用于冷启动或数据量较小的推荐场合。

5. 结束语

用户间的信任度、同质性以及在一定范围内的影响力会影响其他用户的决策。本文从社会认知理论着手，将用户间信任度、用户社会地位影响力和用户同质性3因素融入低秩概率矩阵分解中，构建多权重因素的低秩概率矩阵分解推荐模型。本文推荐模型不仅对一般用户有较高的推荐精度，冷启动用户也取得了不错的结果。在现实生活中，用户间的信任、同质性以及社会影响力会随着时间变化而变化，如何随时更新多属性权重，融入深度学习模型中，将是文章下一步的研究重点。

图 1 基于HR-CAM算法的弱监督目标实时检测整体框架

下载: 全尺寸图片幻灯片

图 2 HR-CAM算法生成目标伪检测标注框的过程

下载: 全尺寸图片幻灯片

图 3 SSD网络监督训练的整体框图

下载: 全尺寸图片幻灯片

图 4 TJAB52数据集示例图

下载: 全尺寸图片幻灯片

图 5 部分弱监督目标定位实验结果示例

下载: 全尺寸图片幻灯片

图 6 目标感知损失函数消融实验结果图

下载: 全尺寸图片幻灯片

图 7 部分检测成功与失败结果示例图

下载: 全尺寸图片幻灯片

表 1 不同弱监督定位方法在CUB200数据集实验结果对比(%)

方法	分类网络	CUB200
方法	分类网络	Top-1	Top-5	GT-know
CAM^[17]	VGG16	41.06	50.66	55.10
ACoL^[18]	VGG16	45.92	56.51	62.96
ADL^[19]	VGG16	52.36	–	75.41
DANet^[20]	VGG16	52.52	61.96	67.70
I2C^[21]	VGG16	55.99	68.34	–
MEIL^[22]	VGG16	57.46	–	73.84
GCNet^[23]	VGG16	63.24	75.54	81.10
PSOL^[24]	VGG16	66.30	84.05	89.11
SPA^[25]	VGG16	60.27	72.50	77.29
SLT^[31]	VGG16	67.80	–	87.60
FAM^[13]	VGG16	69.26	–	89.26
本文方法	VGG16	67.43	82.59	87.34
CAM^[17]	Resnet50	46.71	54.44	57.35
ADL^[19]	Resnet50-SE	62.29	–	–
I2C^[21]	Resnet50	–	–	–
PSOL^[24]	Resnet50	70.68	86.64	90.00
WTL^[32]	Resnet50	64.70	–	77.35
FAM^[13]	Resnet50	73.74	–	85.73
本文方法	Resnet50	71.82	85.29	87.19

下载: 导出CSV

表 2 TJAB52鸟类数据集弱监督定位实验结果(%)

主干网络	Acc	Top-1	Top-5	GT-know
Vgg16	85.92	76.68	89.52	90.83
Resnet50	89.07	81.35	93.37	94.96

下载: 导出CSV

表 3 CUB200和TJAB52数据集目标检测实验结果(%)

评价指标	CUB200		TJAB52
评价指标	伪标注	真实标注	伪标注	真实标注
Acc	81.43	82.24	83.79	85.94
Top-1	77.96	83.61	81.03	87.46
Top-5	80.32	87.56	85.90	92.15

下载: 导出CSV

参考文献(32)

[1]	REN Shaoqing, HE Kaiming, GIRSHICK R, et al. Faster R-CNN: Towards real-time object detection with region proposal networks[C]. The 28th International Conference on Neural Information Processing Systems. Montreal, Canada, 2015: 1137–1149.
[2]	LIU Wei, ANGUELOV D, ERHAN D, et al. SSD: Single shot multiBox detector[C]. 14th European Conference on Computer Vision. Amsterdam, The Netherlands, Springer, 2016: 21–37.
[3]	REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: Unified, real-time object detection[C]. The 2016 IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas, USA, 2016: 779–788.
[4]	REDMON J and FARHADI A. YOLO9000: Better, faster, stronger[C]. The IEEE Conference on Computer Vision and Pattern Recognition, Hawaii, USA, 2017: 6517–6525.
[5]	REDMON J and FARHADI A. YOLOv3: An incremental improvement[EB/OL].https://arxiv.org/abs/1804.02767, 2018.
[6]	BOCHKOVSKIY A, WANG C Y, and LIAO H Y M. YOLOv4: Optimal speed and accuracy of object detection[EB/OL].https://arxiv.org/abs/2004.10934, 2020.
[7]	王蕊, 史玉龙, 孙辉, 等. 基于轻量化的高分辨率鸟群识别深度学习网络[J]. 华中科技大学学报(自然科学版), 2023, 51(5): 81–87. doi: 10.13245/j.hust.230513. WANG Rui, SHI Yulong, SUN Hui, et al. Lightweight-based high resolution bird flocking recognition deep learning network[J]. Journal of Huazhong University of Science and Technology (Nature Science Edition), 2023, 51(5): 81–87. doi: 10.13245/j.hust.230513.
[8]	王蕊, 李金洺, 史玉龙, 等. 基于视觉的机场无人驱鸟车路径规划算法[J/OL]. https://doi.org/10.13700/j.bh.1001-5965.2022.0717, 2022. WANG Rui, LI Jinming, SHI Yulong, et al. Vision-based path planning algorithm of unmanned bird-repelling vehicles in airports[J/OL]. https://doi.org/10.13700/j.bh.1001-5965.2022.0717, 2022.
[9]	CARBONNEAU M A, CHEPLYGINA V, GRANGER E, et al. Multiple instance learning: A survey of problem characteristics and applications[J]. Pattern Recognition, 2018, 77: 329–53. doi: 10.1016/j.patcog.2017.10.009.
[10]	程帅, 孙俊喜, 曹永刚, 等. 多示例深度学习目标跟踪[J]. 电子与信息学报, 2015, 37(12): 2906–2912. doi: 10.11999/JEIT150319. CHENG Shuai, SUN Junxi, CAO Yonggang, et al. Target tracking based on multiple instance deep learning[J]. Journal of Electronics &Information Technology, 2015, 37(12): 2906–2912. doi: 10.11999/JEIT150319.
[11]	罗艳, 项俊, 严明君, 等. 基于多示例学习和随机蕨丛检测的在线目标跟踪[J]. 电子与信息学报, 2014, 36(7): 1605–1611. doi: 10.3724/SP.J.1146.2013.01358. LUO Yan, XIANG Jun, YAN Mingjun, et al. Online target tracking based on mulitiple instance learning and random ferns detection[J]. Journal of Electronics &Information Technology, 2014, 36(7): 1605–1611. doi: 10.3724/SP.J.1146.2013.01358.
[12]	XIE Jinheng, LUO Cheng, ZHU Xiangping, et al. Online refinement of low-level feature based activation map for weakly supervised object localization[C]. The 2021 IEEE/CVF International Conference on Computer Vision, Montreal, Canada, 2021: 132–141.
[13]	MENG Meng, ZHANG Tianzhu, TIAN Qi, et al. Foreground activation maps for weakly supervised object localization[C]. The 2021 IEEE/CVF International Conference on Computer Vision, Montreal, Canada, 2021: 3365–3375.
[14]	孙辉, 史玉龙, 王蕊. 基于对比层级相关性传播的由粗到细的类激活映射算法研究[J]. 电子与信息学报, 2023, 45(4): 1454–1463. doi: 10.11999/JEIT220113. SUN Hui, SHI Yulong, and WANG Rui. Study of coarse-to-fine class activation mapping algorithms based on contrastive layer-wise relevance propagation[J]. Journal of Electronics &Information Technology, 2023, 45(4): 1454–1463. doi: 10.11999/JEIT220113.
[15]	IBRAHEM H, SALEM A D A, and KANG H S. Real-time weakly supervised object detection using center-of-features localization[J]. IEEE Access, 2021, 9: 38742–38756. doi: 10.1109/ACCESS.2021.3064372.
[16]	BOLEI Z, KHOSLA A, LAPEDRIZA A, et al. Object detectors emerge in deep scene CNNs[EB/OL]. https://arxiv.org/abs/1412.6856, 2014.
[17]	ZHOU Bolei, KHOSLA A, LAPEDRIZA A, et al. Learning deep features for discriminative localization[C]. The 2016 IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas, USA, 2016: 2921–2929.
[18]	ZHANG Xiaolin, WEI Yunchao, FENG Jiashi, et al. Adversarial complementary learning for weakly supervised object localization[C]. The 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, USA, 2018: 1325–1334.
[19]	CHOE J and SHIM H. Attention-based dropout layer for weakly supervised object localization[C]. The 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Long Beach, USA, 2019: 2219–2228.
[20]	XUE Haolan, LIU Chang, WAN Fang, et al. DANet: Divergent activation for weakly supervised object localization[C]. The 2019 IEEE/CVF International Conference on Computer Vision, Seoul, Korea (South), 2019: 6588–6597.
[21]	ZHANG Xiaolin, WEI Yunchao, and YANG Yi. Inter-image communication for weakly supervised localization[C]. 16th European Conference on Computer Vision, Glasgow, UK, 2020: 271–287.
[22]	MAI Jinjie, YANG Meng, and LUO Wenfeng. Erasing integrated learning: A simple yet effective approach for weakly supervised object localization[C]. The 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, 2020: 8763–8772.
[23]	LU Weizeng, JIA Xi, XIE Weicheng, et al. Geometry constrained weakly supervised object localization[C]. 16th European Conference on Computer Vision, Glasgow, UK, 2020: 481–496.
[24]	ZHANG Chenlin, CAO Yunhao, and WU Jianxin. Rethinking the route towards weakly supervised object localization[C]. The 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, USA, 2020: 13457–13466.
[25]	PAN Xingjia, GAO Yingguo, LIN Zhiwen, et al. Unveiling the potential of structure preserving for weakly supervised object localization[C]. The 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville, USA, 2021: 11637–11646.
[26]	GU Jindong, YANG Yinchong, and TRESP V. Understanding individual decisions of CNNs via contrastive backpropagation[C]. 14th Asian Conference on Computer Vision, Perth, Australia, 2018: 119–134.
[27]	HE Kaiming, ZHANG Xiangyu, REN Shaoqing, et al. Deep residual learning for image recognition[C]. The 2016 IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas, USA, 2016: 770–778.
[28]	SIMONYAN K and ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[EB/OL]. https://arxiv.org/abs/1409.1556, 2014.
[29]	柳毅, 徐焕然, 袁红, 等. 天津滨海国际机场鸟类群落结构及多样性特征[J]. 生态学杂志, 2017, 36(3): 740–746. doi: 10.13292/j.1000-4890.201703.029. LIU Yi, XU Huanran, YUAN Hong, et al. Bird community structure and diversity at Tianjin Binhai International Airport[J]. Chinese Journal of Ecology, 2017, 36(3): 740–746. doi: 10.13292/j.1000-4890.201703.029.
[30]	WAH C, BRANSON S, WELINDER P, et al. The Caltech-UCSD birds-200–2011 dataset[R]. Pasadena: California Institute of Technology, 2011.
[31]	GUO Guangyu, HAN Junwei, WAN Fang, et al. Strengthen learning tolerance for weakly supervised object localization[C]. The 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition, Nashville, USA, 2021: 7399–7408.
[32]	BABAR S and DAS S. Where to look?: Mining complementary image regions for weakly supervised object localization[C]. The 2021 IEEE Winter Conference on Applications of Computer Vision, Waikoloa, USA, 2021: 1010–1019.

施引文献

期刊类型引用(5)

1.	康海燕，胡成倩. 基于特征提取和集成学习的个人信用评分方法. 计算机仿真. 2024(01): 311-320 . 百度学术
2.	郭佳，郑山红，陈闯，王国春. 融合元学习和注意力机制的跨域推荐算法研究. 计算机仿真. 2024(12): 344-348 . 百度学术
3.	郭英清，王敏，肖明胜. 结合深度知识追踪与矩阵补全的习题推荐方法. 计算机技术与发展. 2023(07): 188-195 . 百度学术
4.	张亚加，邱啟蒙，刘恒，邵建龙. 结合潜在低秩分解和稀疏表示的脑部图像融合. 光电子·激光. 2023(11): 1225-1232 . 百度学术
5.	张亚加，邱啟蒙，刘恒，马勋国，邵建龙. 稀疏表示在脑部图像融合研究中的进展. 陕西理工大学学报(自然科学版). 2022(05): 39-47 . 百度学术

其他类型引用(5)

资源附件(0)

访问统计

图(7) / 表(3)

计量

文章访问数: 536
HTML全文浏览量: 356
PDF下载量: 59
被引次数: 10

1. 引言
2. 多上下文特征信息
2.1 用户间信任度
2.2 用户社会地位影响力
2.3 用户同质性
3. 融合多权重因素的矩阵分解
3.1 低秩概率矩阵分解
3.2 融合信任关系
3.3 融合用户社会影响度
3.4 融合用户同质性
3.5 本文算法
4. 仿真实验与对比分析
4.1 实验数据及评价标准
4.2 参数设置
4.3 算法的有效性
4.4 冷启动用户对算法性能影响
4.5 数据量对算法性能的影响
5. 结束语

1. 引言
2. 多上下文特征信息
2.1 用户间信任度
2.2 用户社会地位影响力
2.3 用户同质性
3. 融合多权重因素的矩阵分解
3.1 低秩概率矩阵分解
3.2 融合信任关系
3.3 融合用户社会影响度
3.4 融合用户同质性
3.5 本文算法
4. 仿真实验与对比分析
4.1 实验数据及评价标准
4.2 参数设置
4.3 算法的有效性
4.4 冷启动用户对算法性能影响
4.5 数据量对算法性能的影响
5. 结束语

参考文献(32)

施引文献

资源附件(0)

访问统计

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于高分辨率类激活映射算法的弱监督目标实时检测

doi: 10.11999/JEIT230268

通讯作者: 王蕊 ruiwang@cauc.edu.cn

计量

出版历程

Weakly Supervised Object Real-time Detection Based on High-resolution Class Activation Mapping Algorithm

1. 引 言

2. 多上下文特征信息

2.1 用户间信任度

2.2 用户社会地位影响力

2.3 用户同质性

3. 融合多权重因素的矩阵分解

3.1 低秩概率矩阵分解

3.2 融合信任关系

3.3 融合用户社会影响度

3.4 融合用户同质性

3.5 本文算法

4. 仿真实验与对比分析

4.1 实验数据及评价标准

4.2 参数设置

4.3 算法的有效性

4.4 冷启动用户对算法性能影响

4.5 数据量对算法性能的影响

5. 结束语

期刊类型引用(5)

其他类型引用(5)

计量

出版历程

目录

1. 引 言

2. 多上下文特征信息

2.1 用户间信任度

2.2 用户社会地位影响力

2.3 用户同质性

3. 融合多权重因素的矩阵分解

3.1 低秩概率矩阵分解

3.2 融合信任关系

3.3 融合用户社会影响度

3.4 融合用户同质性

3.5 本文算法

4. 仿真实验与对比分析

4.1 实验数据及评价标准

4.2 参数设置

4.3 算法的有效性

4.4 冷启动用户对算法性能影响

4.5 数据量对算法性能的影响

5. 结束语

通讯作者:
王蕊　ruiwang@cauc.edu.cn

1. 引言

1. 引言