高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

融合偏置的动态专家信任推荐算法

贾俊杰 张玉超 刘鹏涛 陈旺虎

贾俊杰, 张玉超, 刘鹏涛, 陈旺虎. 融合偏置的动态专家信任推荐算法[J]. 电子与信息学报, 2021, 43(8): 2370-2377. doi: 10.11999/JEIT200539
引用本文: 贾俊杰, 张玉超, 刘鹏涛, 陈旺虎. 融合偏置的动态专家信任推荐算法[J]. 电子与信息学报, 2021, 43(8): 2370-2377. doi: 10.11999/JEIT200539
Junjie JIA, Yuchao ZHANG, Pengtao LIU, Wanghu CHEN. Fusion Bias Dynamic Expert Trust Recommendation Algorithm[J]. Journal of Electronics & Information Technology, 2021, 43(8): 2370-2377. doi: 10.11999/JEIT200539
Citation: Junjie JIA, Yuchao ZHANG, Pengtao LIU, Wanghu CHEN. Fusion Bias Dynamic Expert Trust Recommendation Algorithm[J]. Journal of Electronics & Information Technology, 2021, 43(8): 2370-2377. doi: 10.11999/JEIT200539

融合偏置的动态专家信任推荐算法

doi: 10.11999/JEIT200539
基金项目: 国家自然科学基金(61967013),甘肃省高等学校创新能力提升项目(2019A-006),甘肃省科技计划项目(145RJDA325),甘肃省档案科技项目(2016-09)
详细信息
    作者简介:

    贾俊杰:男,1974年生,博士,副教授,硕士生导师,研究方向为数据挖掘与隐私保护

    张玉超:男,1994年生,硕士生,研究方向为推荐系统与数据挖掘

    刘鹏涛:男,1995年生,硕士生,研究方向为推荐系统与数据挖掘

    陈旺虎:男,1973年生,博士,教授,硕士生导师,研究方向为大数据与云计算

    通讯作者:

    张玉超 991651866@qq.com

  • 中图分类号: TN919; TP182

Fusion Bias Dynamic Expert Trust Recommendation Algorithm

Funds: The National Natural Science Foundation of China (61967013), The Higher Education Innovation Ability Enhancement Project of Gansu Province (2019A-006), The Science and Technology Project of Gansu Province (145RJDA325), The Archives Science and Technology Project of Gansu Province (2016-09)
  • 摘要: 针对协同过滤推荐算法中数据稀疏、冷启动与噪声用户对推荐质量的严重影响,该文将用户-项目评分数据与用户信任关系数据相结合;提出一种融合偏置的动态专家信任推荐算法(BDETA),首先根据用户信任关系数据进行社区划分,获取用户间显式信任值;其次从社区中用户-项目评分数据获取可信度、隐式信任值;通过结合用户间可信度、显式信任值、隐式信任值动态确定专家信任因子,根据用户的推荐能力为每个社区确定专家数据集;最后结合用户不同评分标准进行评分预测。在真实数据集FilmTrust的实验结果中,能够有效地解决协同过滤中冷启动与数据稀疏问题,可更好地满足用户的个性化推荐需求,并且在推荐系统常用评价指标MAE与RMSE中有着不错的表现。
  • 随着互联网服务的快速发展,用户越来越难以在海量的数据中找到所需要的信息。推荐系统就是在急剧膨胀的数据中为用户精准地提供他们所需要的信息。其中协同过滤推荐算法是推荐系统中最为广泛应用的算法之一[1],它通过用户购买商品的历史信息来寻找与其兴趣相似的其他用户,并为其未进行体验的项目进行评分预测。

    尽管协同过滤推荐算法有很多的优点,但在实际应用中,用户购买商品的历史信息往往很少,使得协同过滤推荐算法在计算相似度时无法为用户提供兴趣最为相似的推荐用户。即数据稀疏与冷启动问题,导致推荐效率低下。如何解决推荐系统中的数据稀疏与冷启动问题并且提高推荐准确率,是目前比较热门的研究课题。

    为了解决协同过滤算法中的数据稀疏与冷启动问题,常用的解决方法有:

    (1)矩阵分解法:通过数学的方法,对用户-评分矩阵中未评分的项目进行填充。其中奇异值分解算法[2]是矩阵分解法最为经典的算法之一,通过用户历史行为来提取相应的偏好特征或项目特征,来补充缺省的评分矩阵值。

    (2)数据填充法:利用其他有用信息对数据稀疏和冷启动用户信息进行补充,使得用户更精准地找到与其兴趣相似的推荐用户,提高推荐精度。文献[3-5]将聚类的方法应用到推荐算法,通过聚类的方法,将兴趣相似的用户放到同一聚类中,以同一类别的其他用户的评分对缺省值进行填补。文献[6-8]将用户间信任关系数据与用户项目评分信息进行结合。当遇到数据稀疏与冷启动问题时,利用社交关系数据进行补充,一定程度上缓解了数据稀疏与冷启动问题并提高推荐准确率。

    在日常生活中,人们通常是以“人以群分”的形式存在的;人们的决策通常受到朋友的影响,而传统协同过滤推荐算法往往认为用户间是相互独立的[9,10],导致推荐系统为用户计算偏好相似性时所用的信息过少。随着互联网服务的快速发展,现有很多网站为用户构建社交信息网络,现有研究表明,融合用户间信任信息网络的推荐系统能够有效地提高推荐质量并能够有效抵御恶意影响推荐精度的行为[11]

    基于用户信任关系的推荐系统,不仅考虑了用户-项目之间的评分信息,而且融入了用户间的信任关系。其中用户间的信任关系通过社交网站的方式进行收集[12]。对于一个冷启动用户,则融合用户间信任关系的推荐系统可通过分析其在信任关系数据所获得的直接或推断出的间接信任的用户来为目标用户产生推荐。其中Massa等人[6]提出的MoleTrust算法,将用户-项目与用户间信任关系分别进行处理,将用户-项目评分信息与用户信任关系作为推荐算法的输入,有效地缓解了协同过滤算法数据稀疏与冷启动问题。Yuan等人[7]对Mass等人对MoleTrust算法进行改进,提出用户是以小世界的特性存在的,并为此特性进行了证明。

    Amatriain等人[13]率先提出将专家概念融入协同过滤推荐算法,并有效地提高了推荐质量。Breese等人[14]提出了将用户专家与相似度结合的方法,在不同领域拥有不同影响力的专家在评分预测时被赋予不同的权值,然后进行评分预测;贾彭慧等人[15]提出了一种为用户动态生成专家数据集的协同过滤推荐算法,根据用户间的交叉性、信任性、趋同性等值为用户挖掘专家数据集,并通过计算用户与专家数据集的相似性进行协同过滤推荐,但未考虑用户所处社区与用户偏置对推荐的影响;高发展等人[16]提出将用户特征与专家概念相结合的方法进行协同过滤推荐,并证实所提算法可有效提高推荐质量;赵明等人[17]提出了一种结合用户信任关系与兴趣的核心用户推荐方法,实验结果证明,融合核心用户的推荐方法可有效提升推荐质量,并证实可有效降低推荐系统中托攻击的风险。

    由以上文献研究可知,结合专家概念的协同过滤算法可有效提高推荐质量,然而在现实推荐数据集中,用户评分数据严重稀疏,无法为用户生成高质量的专家数据集。而且在传统专家推荐算法中,为每位用户共享专家数据集,而未考虑到单一用户个性化推荐的问题。并且在现实生活中,我们所看到的物品评分的高低并非只与用户偏好有关,而且还与物品受外界评分影响高低和用户本身特性有关;即外界对商品评分往往获得的更高评分,积极的用户往往对其所体验过所有商品的评分普遍较高[18]

    针对此类问题,本文提出融合偏置的动态专家信任推荐算法(Biased Dynamic Expert Trust Algorithm, BDETA),旨在进一步解决传统协同过滤推荐算法中数据稀疏与冷启动问题,提高推荐精度。在本算法中,首先通过根据用户的信任关系对用户进行社区划分,根据所属社区用户间信任关系和评分信息,结合用户可信度、用户显式信任、隐式信任动态选取专家因子。进而在每个社区中选取具有代表性的用户作为专家,最后结合用户与所选取的专家信任因子与目标用户评分偏置进行协同过滤评分预测。本文主要贡献包括:

    (1) 提出了基于社区用户间信任关系与用户项目兴趣偏好的专家数据集动态挖掘策略。通过用户间的信任数据进行信任社区划分来提升寻找目标用户的推荐用户与推断出用户间显式信任关系的效率;并同时结合动态从目标用户所属社区中与其他用户间评分数据中推断出可信度、隐式信任关系;从推荐结果中确定可信度、显式信任关系、隐式信任关系,与社区专家数据集联系。

    (2) 通过计算目标用户所属社区中每个用户的可信度、显式信任关系、隐式信任关系,根据推荐质量来确定每个社区中专家的数量的占比,摒弃一些对推荐没有帮助的噪声用户,并通过结合社区中每位用户的不同评分标准,来提高推荐准确率。

    (3) 在真实数据集FilmTrust中,本文所提算法与现有相关算法进行了比较;从推荐系统为全部用户的缺失项目评分预测中平均绝对误差MAE与均方根误差RMSE指标等方面对推荐结果进行了综合的分析。

    本文结构安排如下:第2节介绍本文所提BDETA算法;第3节介绍实验结果与分析;第4节对全文进行总结与展望。

    融合信任关系的推荐算法可有效缓解数据稀疏与冷启动问题,但实际用户的信任关系数据也十分稀疏;由相关学者研究表明,结合专家概念的推荐算法可有效提高推荐质量;但在现实推荐数据集中,用户-项目评分数据严重缺失,导致无法为用户生成高质量的专家集,以至于推荐质量不理想;同样,在现实生活中,我们所看到的物品评分的高低并非只与用户偏好有关,而且还与物品所受外界评分影响有关[18],即该商品受外界评分普遍较高则往往获得更高的评分,积极的用户往往对其所体验过所有商品的评分普遍较高。因此本文提出BDETA算法,将信任关系融入到专家推荐中,首先根据信任关系将用户划分到不同社区中;然后将划分到不同社区的用户根据评分数据中推断出的可信度、隐式信任值与用户间信任关系数据中推断出的显式信任值动态挖掘专家数据集,进一步提高推荐质量。算法框架流程如图1所示。

    图 1  算法框架流程图

    融合用户间信任关系的推荐算法,不仅考虑了用户-项目评分矩阵${{\boldsymbol{R}}_{m \times n}}$,还将用户的信任关系数据融入其中;用户间信任关系数据通常用矩阵来表示。在推荐系统中,信任是指对其他用户所体验过项目评分的认可,表示与其有相同的偏好。若用户间存在信任关系则$T\left( {{u_i},{u_j}} \right) = 1$,表示用户${u_i}$信任用户${u_j}$;若$T\left( {{u_i},{u_j}} \right) = 0$则表示用户${u_i}$${u_j}$没有信任关系(如式(1)所示)。

    $$ {T}_{{u}_{i},{u}_{j}}=\left\{ \begin{aligned} & 1,\;\;\;{u}_{i}{\text{信任}}{u}_{j}\\ & 0,\;\;\;{\text{其他}}\end{aligned} \right.$$ (1)

    为结合实际专家对人们产生的影响,本文根据信任关系数据将用户划分到不同社区${\boldsymbol{X}} = $$ \left\{ {{{\boldsymbol{X}}_1},{{\boldsymbol{X}}_2},···,{{\boldsymbol{X}}_n}} \right\}$,其中${{\boldsymbol{X}}_1}$表示第1个社区,${{\boldsymbol{X}}_n}$表示第${\boldsymbol{n}}$个社区。${{\boldsymbol{X}}_i} = \left\{ {{{{u}}_1},{{{u}}_2},···,{{{u}}_k}} \right\}$表示社区${{\boldsymbol{X}}_i}$中所包含的所有用户,${u_1}$为社区${{\boldsymbol{X}}_i}$的第1位用户,${u_k}$为社区${{\boldsymbol{X}}_i}$的第$k$个用户。本文采用文献[10]的社区划分方法,利用SLM[19]算法来进行用户社区的划分;该算法既能够保证将用户以高准确率划分到所属的社区,又能保证所用时间较短。社区划分结束后,每个社区的用户个数不尽相同;用户个数少的社区表示少数用户对某一种商品有着特殊的偏好,反之则表示大众用户对热门商品的偏好。

    对目标用户推荐专家集的挖掘是本文的核心,该工作关系着推荐效果优劣。为了寻找每个社区中目标用户专家集,本文通过计算社区中用户的可信度、显式信任值与隐式信任值来动态确定专家因子,最后通过所设置的社区专家数量占比来确定该社区的专家集。

    定义1 对于任意用户的专家因子,专家${E_c}$满足:

    $${Q_u} \le {Q_e}\left( {\forall u \in U - {E_c},\forall e \in {E_c}} \right)$$ (2)

    其中,${Q_u}$表示用户$u$从其评分数据中所获得的专家因子,${Q_e}$表示专家用户$e$从其评分数据所获得的专家因子,$U$代表数据集中所有的用户。当用户的信任因子满足式(1)时,该用户被定义为专家。

    定义2 用户可信度

    用户的可信度表示用户的活跃程度,表示目标用户与其他用户互动次数;即两个用户对某一商品评分的数量越多,则表示该用户在此社区的可信度就越高[15]

    $${A_u} = \frac{{{\rm{|}}{I_u} \cap {I_v}{\rm{|}}}}{{\max (N)}}$$ (3)

    其中,${I_u}$, ${I_v}$分别表示用户$u$, $v$所体验过的商品集合。分子部分$\left| {{I_u} \cap {I_v}} \right|$表示用户$u$, $v$共同对相同商品评价的数量,$\max (N)$表示用户间最大相同商品评分数量。

    定义3 用户间显式信任

    流动性是用户间信任关系的特征之一,即朋友的朋友可能也是朋友,并有逐级递减的特性[20]

    $${J_u} = \frac{{\left| {{T_u} \cap {T_v}} \right|}}{{\left| {{T_u} \cup {T_v}} \right|}}$$ (4)

    ${T_u}$表示用户$u$的所有信任用户集合,${T_v}$表示用户$v$的所有信任用户集合,$\left| {{T_u} \cap {T_v}} \right|$表示用户$u$与用户$v$所共同信任的用户个数,共同信任的用户个数越多则获得的显式信任值越大。

    定义4 用户间的隐式信任

    为了计算用户间的隐式信任值,本文采用Lathia等人[21]提出的信任计算模型来计算用户间的隐式信任值。即用户间有相同评分项目则表示用户互动一次,评分差异越小,表示用户间越信任,互动次数越多反映用户信任程度也就越高。

    $${T_u} = 1 - \frac{{\displaystyle\sum\limits_{i = 1}^n {|{r_{u,i}} - {r_{v,i}}|} }}{{\displaystyle\sum\limits_{i = 1}^n {{r_{\max }}} }}$$ (5)

    其中,${r_{u,i}}$${r_{v,i}}$分别表示用户$u$和用户$v$对商品$i$的评分,${r_{\max }}$表示商品$i$所获得的最大评分。

    定义5 专家因子的计算

    对目标用户而言,专家因子反映了该专家在该领域的权威,专家因子越大,则表示该专家就越可信。专家因子的计算结合了用户可信度、用户隐式信任、显式信任动态选取专家因子[15]

    $$ Q=\alpha \cdot {A}_{u}+\beta \cdot {T}_{u}+\gamma \cdot {J}_{u}$$ (6)

    其中,$\alpha + \beta + \gamma = 1$, $\gamma = 1 - \alpha - \beta $,使用该公式使得原本3个参数的公式转化为2个参数,降低了寻找最优参数的困难程度。根据公式$\gamma = 1 - \alpha - \beta $求解最优参数$\alpha $$\beta $。因此,将变化成在2维坐标轴中进行求解参数$\alpha $$\beta $$\gamma $,将2维空间坐标轴中坐标间隔设置为0.1,坐标中(0,0)则表示$\alpha ,\beta $$\gamma $分别为(0,0,1)。求解区域为如图2蓝色区域所示[22]

    图 2  可求解区域

    选取前$\theta $个专家为目标用户的专家集,因为每个社区所划分的用户个数不同,因此每个社区专家比例为$\varphi $,对第$l$个社区所选专家用户个数为[23]

    $$ {\theta }_{l}={X}_{l}\cdot \varphi $$ (7)

    定义6 用户偏置信息

    在现实生活中,我们所看到的物品评分的高低并非只与用户偏好有关,而且还与物品受外界评分影响高低和用户本身特性有关,因此,计算用户评分偏置信息公式如下所示[18]

    $${\rm{bia}}{{\rm{s}}_{u,i}} = \overline {{{{r}}_{{i}}}} + {\rm{bia}}{{\rm{s}}_{{u}}} + {\rm{bia}}{{\rm{s}}_{{i}}}$$ (8)
    $${\rm{bia}}{{\rm{s}}_{{u}}} = \frac{{\displaystyle\sum\limits_{{{i}} = 1}^{{l}} {\left( {{{{r}}_{{{ui}}}} - \overline {{{{r}}_{{u}}}} } \right)} }}{{\left| {{N}} \right|}}\quad\quad$$ (9)
    $${\rm{bia}}{{\rm{s}}_{{i}}} = \frac{{\displaystyle\sum\limits_{{{i}} \in {{m}}}^{{m}} {\left( {{{{r}}_{{i}}} - \overline {{{{r}}_{{u}}}} } \right)} }}{{\left| {{{{U}}_{{i}}}} \right|}}\quad\quad\;$$ (10)

    其中,$\left| N \right|$为对所有项目评价的所有用户的数量,$\overline {{r_i}} $为社区中每位用户对该项目评分的平均,$\left| l \right|$为该用户对项目评分的数量,${r_{ui}}$表示用户$u$对项目$i$的评分情况。

    通过找到目标用户所在社区中的专家集,利用Breese等人[14]提出的目标用户与专家集相似度结合的方法;先计算目标用户与所属社区专家集中每位专家的偏好相似度,然后进行缺失项目的预测评分。

    $$ {P}_{u,i}={{\rm{bias}}}_{u,i}+\frac{{\displaystyle\sum \limits _{e\in {E}_{c}}\left({r}_{e,i}-\overline{{r}_{e}}\right)\cdot {S}_{u,e}}}{{\displaystyle\sum \limits _{e\in {E}_{c}}{S}_{u,e}}} $$ (11)

    其中,${P_{u,i}}$表示该用户所处社区的专家用户集对用户$u$项目$i$的预测评分;${{\rm{bias}}_{u,i}}$表示用户$u$的评分特性;${r_{e,i}}$表示目标用户所属社区专家$e$对项目$i$的评分情况;$\overline {{r_e}} $表示专家$e$所有项目的评分平均;${S_{u,e}}$表示用户$u$与专家$e$的皮尔逊相似度。

    算法:融合偏置的动态专家信任推荐算法

    输入:目标用户,用户-项目评分数据,用户-用户信任数据,$ \alpha ,\beta $$\gamma $值,社区专家数量占比值$\varphi $

    输出:目标用户缺失项目的预测评分。

    步骤1 用社区划分SLM算法根据输入的用户间信任数据,将用户划分到不同社区中;

    步骤2 据用户-项目评分据与用户间信任关系数据,计算社区中每位用户的可信度、显式信任值与隐式信任值,并根据推荐质量动态调整信任关系所占比例;

    步骤3 跟据推荐质量,动态选取每个社区专家所占社区用户数量比例,根据用户专家信任因子与专家比例,确定每个社区专家集;

    步骤4 计算目标用户评分偏置、与目标用户的相似度,为目标用户缺失项目评分预测。

    为验证所提算法的可行性,本实验使用文献[22]实验中所采用的FilmTrust真实数据集进行验证,FilmTrust数据集具体情况如表1所示。

    表 1  数据集信息
    数据集用户数量项目数量评分数量信任声明评分范围步长
    FilmTrust15082071354971853[0.5,4.0]0.5
    下载: 导出CSV 
    | 显示表格

    评分预测准确性是衡量一个推荐算法好坏的重要标准之一,为此本文将利用平均绝对误差(MAE)指标和均方根误差(RMSE)指标来验证本文所提算法推荐性能[24],推荐性能越好则MAE与RMSE的值越小。

    $$ {\rm{MAE}} = \frac{{\displaystyle\sum\limits_{{{i}} = 1}^{{N}} {|{{{r}}_{{i}}} - {{\rm{r}}_{\rm{p}}}|} }}{{{N}}}\qquad\quad\;\; $$ (12)
    $$ {\rm{RMSE}} = \sqrt {\frac{1}{N}\sum\limits_{i = 1}^N {{{\left( {{r_i} - {r_p}} \right)}^2}} } $$ (13)

    平均绝对误差(MAE)与均方根误差(RMSE)指标,为推荐系统为用户预测的所有项目评分与用户对所有项目真实评分之差,差值越小,则表示推荐准确性越高。其中${r_i}$${r_p}$分别表示在测试集中用户对项目$i$的真实评分和推荐系统为用户对缺失项目$i$的预测评分,$N$为在测试集中所有项目数量。

    本实验选取FilmTrust真实数据集中80%作为训练集,20%作为测试集。用本文所提BDETA推荐算法为用户未评分项目进行评分预测;所预测出的评分与测试集中的用户真实评分做对比,以验证本文所提算法的推荐质量。

    图3为本文所提算法中社区专家所占比例$\varphi $在任意给定的$\alpha = 0.5,\beta = 0.3,\gamma = 0.2$时对用户缺失项目评分预测的影响情况。由图3可知,在$\varphi $为0.1到0.5时,本文所提算法为目标用户缺失项目评分预测平均绝对误差MAE与均方根误差RMSE一直在降低,并且MAE和RMSE指标在$\varphi $为0.5时降到最低,分别为0.439与1.225;在社区专家比例$\varphi $为0.5到0.9时,MAE指标在不断上升,在$\varphi $为0.7到0.9时,MAE与RMSE最终趋于平缓;这是因为刚开始目标用户所在社区中专家占比较小,导致该社区所选取的专家用户较少,因此只有很小一部分专家用户代表社区中全体用户,进而导致推荐误差较大;随后,随着社区中专家人数的增加,越来越多较为专业的用户加入专家集中,即高质量专家,使得整体评价更为客观,因此推荐精度大幅提升;最后,随着社区专家占比 $\varphi $的不断提高,越来越多的可信度、显式信任值与隐式信任值不高的非专业用户加入专家集并为目标用户进行缺失项目评分预测,直接导致推荐精度下降,即噪声用户。因此本文以下实验将社区专家所占比例$\varphi $选定为0.5。

    图 3  社区专家占比$\varphi $对推荐质量的影响

    表2所示,在根据推荐质量动态选取专家因子(式(7))时,参数$\alpha $$\beta $对用户预测评分MAE的影响;当$\alpha + \beta > 1$时,不符合本文所提算法理论,故MAE取0;从表2可知,当$\alpha = 0.5$$\beta = 0.3$$\gamma = 0.2$时,MAE最小,为0.4392。

    表 2  参数$\alpha $$\beta $对MAE的影响
    $\alpha \backslash \beta $00.10.20.30.40.50.60.70.80.91.0
    00.52190.53540.53120.52430.51640.51540.51620.51670.51690.51730.5178
    0.10.51830.53070.53540.52380.51510.51560.51630.51670.51700.51740
    0.20.54940.53900.52940.52690.51380.51520.51600.51650.516800
    0.30.55060.54630.52200.52130.52210.51500.51580.5164000
    0.40.54300.52840.46970.49690.52230.51640.51580000
    0.50.56110.52450.52200.43920.51000.486000000
    0.60.56440.55660.54820.45320.4640000000
    0.70.55100.54360.55740.53040000000
    0.80.58320.55800.543600000000
    0.90.58310.5831000000000
    1.00.61270000000000
    下载: 导出CSV 
    | 显示表格

    图4所示本文所提算法与传统基于用户的协同过滤推荐算法(BUCF)[25]、基于项目的协同过滤推荐算法(BICF)[26]、文献[10]中一种基于社区专家信息的协同过滤推荐算法(CEFCF)与文献[15]中基于专家动态生成的协同过滤推荐算法(DGECF)在训练集规模为80%,60%和40%的情况下进行对比。随着训练集的减小,本文所提算法与对比算法中的所有算法预测评分误差都在不断增大;在训练集规模为80%与60%时,本文所提算法与其他3种算法的预测误差相差不大;但随着训练集的不断缩小,本文所提算法与其他3种算法预测误差相差明显。

    图 4  不同算法不同训练集规模推荐质量变化

    本文提出的融合偏置的动态专家信任推荐算法,首先通过用户间的信任关系数据进行社区的划分,根据信任关系数据计算用户所获得显式信任;然后根据用户-项目评分数据,推断出用户所获得的隐式信任值、可信度与用户评分的特性,动态结合用户所获显式信任值、隐式信任值与可信度,考虑社区中每位用户的不同评分标准,动态挖掘每个社区的专家集;利用社区专家来为数据稀疏、冷启动用户进行项目评分预测,通过真实数据集FilmTrust进行了具体的验证;实验证明,可有效提高推荐质量。但本文所提改进的专家推荐中,没有深入研究用户间信任传播与项目属性对专家集挖掘的影响,下一步工作将考虑从多个角度来研究对专家集挖掘的影响。

  • 图  1  算法框架流程图

    图  2  可求解区域

    图  3  社区专家占比$\varphi $对推荐质量的影响

    图  4  不同算法不同训练集规模推荐质量变化

    表  1  数据集信息

    数据集用户数量项目数量评分数量信任声明评分范围步长
    FilmTrust15082071354971853[0.5,4.0]0.5
    下载: 导出CSV

    表  2  参数$\alpha $$\beta $对MAE的影响

    $\alpha \backslash \beta $00.10.20.30.40.50.60.70.80.91.0
    00.52190.53540.53120.52430.51640.51540.51620.51670.51690.51730.5178
    0.10.51830.53070.53540.52380.51510.51560.51630.51670.51700.51740
    0.20.54940.53900.52940.52690.51380.51520.51600.51650.516800
    0.30.55060.54630.52200.52130.52210.51500.51580.5164000
    0.40.54300.52840.46970.49690.52230.51640.51580000
    0.50.56110.52450.52200.43920.51000.486000000
    0.60.56440.55660.54820.45320.4640000000
    0.70.55100.54360.55740.53040000000
    0.80.58320.55800.543600000000
    0.90.58310.5831000000000
    1.00.61270000000000
    下载: 导出CSV
  • [1] ADOMAVICIUS G and TUZHILIN A. Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions[J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(6): 734–749. doi: 10.1109/TKDE.2005.99
    [2] KOENIGSTEIN N and PAQUET U. Xbox movies recommendations: Variational Bayes matrix factorization with embedded feature selection[C]. Proceedings of the 7th ACM Conference on Recommender Systems, Hong Kong, China, 2013. doi: 10.1145/2507157.2507168.
    [3] KIM T H, PARK S I, and YANG S B. Improving prediction quality in collaborative filtering based on clustering[C]. Proceedings of 2008 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, Sydney, Australia, 2008: 704–710. doi: 10.1109/WIIAT.2008.319.
    [4] KOOHI H and KIANI K. User based collaborative filtering using fuzzy C-means[J]. Measurement, 2016, 91: 134–139. doi: 10.1016/j.measurement.2016.05.058
    [5] 龚敏, 邓珍荣, 黄文明. 基于用户聚类与Slope One填充的协同推荐算法[J]. 计算机工程与应用, 2018, 54(22): 139–143. doi: 10.3778/j.issn.1002-8331.1707-0336

    GONG Min, DENG Zhenrong, and HUANG Wenming. Collaborative recommendation algorithm based on user clustering and Slope One filling[J]. Computer Engineering and Applications, 2018, 54(22): 139–143. doi: 10.3778/j.issn.1002-8331.1707-0336
    [6] MASSA P and AVESANI P. Trust-aware recommender systems[C]. Proceedings of the 2007 ACM conference on Recommender Systems, Minneapolis, USA, 2007: 17–24.
    [7] YUAN W, SHU L, CHAO H C, et al. ITARS: Trust-aware recommender system using implicit trust networks[J]. IET Communications, 2010, 4(14): 1709–1721. doi: 10.1049/iet-com.2009.0733
    [8] LIU Fengkun and LEE H J. Use of social network information to enhance collaborative filtering performance[J]. Expert Systems with Applications, 2010, 37(7): 4772–4778. doi: 10.1016/j.eswa.2009.12.061
    [9] 郭弘毅, 刘功申, 苏波, 等. 融合社区结构和兴趣聚类的协同过滤推荐算法[J]. 计算机研究与发展, 2016, 53(8): 1664–1672. doi: 10.7544/issn1000-1239.2016.20160175

    GUO Hongyi, LIU Gongshen, SU Bo, et al. Collaborative filtering recommendation algorithm combining community structure and interest clusters[J]. Journal of Computer Research and Development, 2016, 53(8): 1664–1672. doi: 10.7544/issn1000-1239.2016.20160175
    [10] 张凯涵, 梁吉业, 赵兴旺, 等. 一种基于社区专家信息的协同过滤推荐算法[J]. 计算机研究与发展, 2018, 55(5): 968–976. doi: 10.7544/issn1000-1239.2018.20170253

    ZHANG Kaihan, LINAG Jiye, ZHAO Xingwang, et al. A collaborative filtering recommendation algorithm based on information of community experts[J]. Journal of Computer Research and Development, 2018, 55(5): 968–976. doi: 10.7544/issn1000-1239.2018.20170253
    [11] GHAVIPOUR M and MEYBODI M R. An adaptive fuzzy recommender system based on learning automata[J]. Electronic Commerce Research and Applications, 2016, 20: 105–115. doi: 10.1016/j.elerap.2016.10.002
    [12] BEDI P and VASHISTH P. Empowering recommender systems using trust and argumentation[J]. Information Sciences, 2014, 279: 569–586. doi: 10.1016/j.ins.2014.04.012
    [13] AMATRIAIN X, LATHIA N, PUJOL J M, et al. The wisdom of the few: A collaborative filtering approach based on expert opinions from the web[C]. The 32nd International ACM SIGIR Conference on Research and Development in Information Retrieval, Boston, USA, 2009: 532–539. doi: 10.1145/1571941.1572033.
    [14] BREESE J S, HECKERMAN D, and KADIE C. Empirical analysis of predictive algorithms for collaborative filtering[C]. The 14th Conference on Uncertainty in Artificial Intelligence, San Francisco, USA, 1998.
    [15] 贾彭慧, 刘鑫一, 孔亚斌, 等. 基于专家动态生成的协同过滤推荐算法[J]. 计算机技术与发展, 2020, 30(3): 19–23. doi: 10.3969/j.issn.1673-629X.2020.03.004

    JIA Penghui, LIU Xinyi, KONG Yabin, et al. A dynamically generated experts-based collaborative filtering recommendation algorithm[J]. Computer Technology and Development, 2020, 30(3): 19–23. doi: 10.3969/j.issn.1673-629X.2020.03.004
    [16] 高发展, 黄梦醒, 张婷婷. 综合用户特征及专家信任的协作过滤推荐算法[J]. 计算机科学, 2017, 44(2): 103–106. doi: 10.11896/j.issn.1002-137X.2017.02.014

    GAO Fazhan, HUANG Mengxing, and ZHANG Tingting. Collaborative filtering recommendation algorithm based on user characteristics and expert opinions[J]. Computer Science, 2017, 44(2): 103–106. doi: 10.11896/j.issn.1002-137X.2017.02.014
    [17] 赵明, 闫寒, 曹高峰, 等. 融合用户信任度和相似度的基于核心用户抽取的鲁棒性推荐算法[J]. 电子与信息学报, 2019, 41(1): 180–186. doi: 10.11999/JEIT180142

    ZHAO Ming, YAN Han, CAO Gaofeng, et al. Robust recommendation algorithm based on core user extraction with user trust and similarity[J]. Journal of Electronics &Information Technology, 2019, 41(1): 180–186. doi: 10.11999/JEIT180142
    [18] 王建芳, 刘冉东, 刘永利. 一种带偏置的专家信任推荐算法[J]. 小型微型计算机系统, 2018, 39(2): 287–291. doi: 10.3969/j.issn.1000-1220.2018.02.019

    WANG Jianfang, LIU Randong, and LIU Yongli. Expert trust recommendation algorithm with bias[J]. Journal of Chinese Computer Systems, 2018, 39(2): 287–291. doi: 10.3969/j.issn.1000-1220.2018.02.019
    [19] WALTMAN L and VAN ECK N J. A smart local moving algorithm for large-scale modularity-based community detection[J]. The European Physical Journal B, 2013, 86(11): 471. doi: 10.1140/epjb/e2013-40829-0
    [20] GUO Guibing, ZHANG Jie, and THALMANN D. Merging trust in collaborative filtering to alleviate data sparsity and cold start[J]. Knowledge-Based Systems, 2014, 57: 57–68. doi: 10.1016/j.knosys.2013.12.007
    [21] LATHIA N, HAILES S, and CAPRA L. Trust-based Collaborative Filtering[M]. KARABULUT Y, MITCHELL J, HERRMANN P, et al. Trust Management II. Boston: Springer, 2008: 119–134.
    [22] SHEUGH L and ALIZADEH S H. A novel 2D-Graph clustering method based on trust and similarity measures to enhance accuracy and coverage in recommender systems[J]. Information Sciences, 2018, 432: 210–230. doi: 10.1016/j.ins.2017.12.007
    [23] 刘国丽, 白晓霞, 廉孟杰, 等. 基于专家信任的协同过滤推荐算法改进研究[J]. 计算机工程与科学, 2019, 41(10): 1846–1853. doi: 10.3969/j.issn.1007-130X.2019.10.018

    LIU Guoli, BAI Xiaoxia, LIAN Mengjie, et al. An improved collaborative filtering recommendation algorithm based on expert trust[J]. Computer Engineering &Science, 2019, 41(10): 1846–1853. doi: 10.3969/j.issn.1007-130X.2019.10.018
    [24] NIKZAD–KHASMAKHI N, BALAFAR M A, and FEIZI-DERAKHSHI M R. The state-of-the-art in expert recommendation systems[J]. Engineering Applications of Artificial Intelligence, 2019, 82: 126–147. doi: 10.1016/j.engappai.2019.03.020
    [25] GOLDBERG D, NICHOLS D, OKI B M, et al. Using collaborative filtering to weave an information tapestry[J]. Communications of the ACM, 1992, 35(12): 61–70. doi: 10.1145/138859.138867
    [26] DESHPANDE M and KARYPIS G. Item-based top-N recommendation algorithms[J]. ACM Transactions on Information Systems, 2004, 22(1): 143–177. doi: 10.1145/963770.963776
  • 期刊类型引用(7)

    1. 宗诚,方涛. 基于动态迭代采样的医院精细化绩效考核信息动态推荐算法. 微型电脑应用. 2024(09): 45-48+53 . 百度学术
    2. 佘学兵,熊蕾,黄丽,刘承启. 基于长短期记忆的稀疏数据过滤推荐算法. 计算机仿真. 2023(02): 395-398+523 . 百度学术
    3. 杜军威,邹树林,李浩杰,江峰,于旭,胡强. 基于问答语义匹配的知识社区新问题专家推荐方法. 电子学报. 2023(07): 1875-1888 . 百度学术
    4. 赵营颖,曹莉. 海量稀疏大数据混合特征个性化推荐算法仿真. 计算机仿真. 2023(12): 563-567 . 百度学术
    5. 和凤珍. 基于局部敏感哈希的隐私保护实时服务推荐. 计算机与数字工程. 2022(01): 140-146 . 百度学术
    6. 王冲,赵艺璇,汪子尧. 自注意力环境下网络用户行为数据推荐方法. 计算机仿真. 2022(12): 497-501 . 百度学术
    7. 沈孚,王硕,黄沁. 基于层次模糊评价的高素质农民线上培训课程推荐技术研究及应用——以某农机化教育培训中心为例. 中国农机化学报. 2021(11): 116-121 . 百度学术

    其他类型引用(0)

  • 加载中
图(4) / 表(2)
计量
  • 文章访问数:  725
  • HTML全文浏览量:  259
  • PDF下载量:  60
  • 被引次数: 7
出版历程
  • 收稿日期:  2020-06-30
  • 修回日期:  2021-03-23
  • 网络出版日期:  2021-04-08
  • 刊出日期:  2021-08-10

目录

/

返回文章
返回