高级搜索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于时空上下文信息的POI推荐模型研究

叶继华 杨思渝 左家莉 王明文

叶继华, 杨思渝, 左家莉, 王明文. 基于时空上下文信息的POI推荐模型研究[J]. 电子与信息学报, 2021, 43(12): 3546-3553. doi: 10.11999/JEIT200368
引用本文: 叶继华, 杨思渝, 左家莉, 王明文. 基于时空上下文信息的POI推荐模型研究[J]. 电子与信息学报, 2021, 43(12): 3546-3553. doi: 10.11999/JEIT200368
Jihua YE, Siyu YANG, Jiali ZUO, Mingwen WANG. Research on POI Recommendation Model Based on Spatio-temporal Context Information[J]. Journal of Electronics & Information Technology, 2021, 43(12): 3546-3553. doi: 10.11999/JEIT200368
Citation: Jihua YE, Siyu YANG, Jiali ZUO, Mingwen WANG. Research on POI Recommendation Model Based on Spatio-temporal Context Information[J]. Journal of Electronics & Information Technology, 2021, 43(12): 3546-3553. doi: 10.11999/JEIT200368

基于时空上下文信息的POI推荐模型研究

doi: 10.11999/JEIT200368
基金项目: 国家自然科学基金(61462042, 61866018, 61876074)
详细信息
    作者简介:

    叶继华:男,1966年生,教授,博士生导师,主要研究方向为智能信息处理、数据融合、物联网技术、图像处理

    杨思渝:女,1994年生,硕士生,研究方向为智能信息处理

    左家莉:女,1981年生,博士,副教授,硕士生导师,主要研究方向为自然语言处理

    王明文:男,1964年生,教授,博士生导师,主要研究方向为自然语言处理、信息检索、机器学习、数据挖掘

    通讯作者:

    叶继华 yjhwcL@163.com

  • 中图分类号: TP391

Research on POI Recommendation Model Based on Spatio-temporal Context Information

Funds: The National Natural Science Foundation of China (61462042, 61866018, 61876074)
  • 摘要: 随着基于位置的社交网络(LBSN)技术的快速发展,为移动用户提供个性化服务的兴趣点(POI)推荐成为关注重点。由于POI推荐面临着数据稀疏、影响因素多和用户偏好复杂的挑战,因此传统的POI推荐往往只考虑签到频率以及签到时间和地点对用户的影响,而忽略了签到序列中用户前后行为的关联影响。为了解决上述问题,该文通过序列的表示考虑签到数据的时间影响和空间影响,建立了时空上下文信息的POI推荐模型(STCPR),为POI推荐提供了更精准的个性化偏好。该模型基于序列到序列的框架下,将用户信息、POI信息、类别信息和时空上下文信息进行向量化后嵌入GRU网络中,同时利用了时间注意力机制、全局和局部的空间注意力机制来综合考虑用户偏好与变化趋势,从而向用户推荐感兴趣的Top-N的POI。该文通过在两个真实的数据集上实验来验证模型的性能。实验的结果表明,该文所提出的方法在召回率(Recall)和归一化折损累计增益(NDCG)方面优于几种现有的方法。
  • 随着基于位置的社交网络(Location-Based Social Networking, LBSN)应用的迅速发展,Gowalla, Foursquare等平台作为一种媒介捕捉到了大量的行为信息。然而,随着信息量的爆炸式增长,如何提取用户的有效信息,解决社交网络所产生的数据冗余等问题也引起了该领域内各位专家学者的关注。基于此,POI推荐作为当前推荐研究领域内的热点,通过在LBSN中对不同用户的不同签到数据的挖掘及分析,为用户寻求下一个新的位置提供了更为便捷的服务,增加了用户体验。

    目前,国内外学者研究发现用户行为会受到多种因素的影响,为了提高POI推荐的效果,可以通过对签到用户的活跃度[1]、时空迁移影响[2]、社交影响[3]和用户签到序列相关的上下文信息[4]等影响的分析进行个性化推荐,并且采用协同过滤[5]、矩阵分解[6]、深度学习[7,8]等方法来更好地挖掘用户行为的潜在偏好,为用户生成推荐列表。

    在POI推荐研究中,将空间、时间的影响作为重要因素进行考虑,在POI推荐中有着不可替代的地位。文献[9]发现距离越近,相似度越高越能提高POI推荐性能,但由于构建二叉树的方法与空间上信息相关性较弱,因此仍需加入其他信息来提升预测效果。文献[10]通过POI之间可接受性和影响性的不对称性来分析不同地理影响对POI的推荐,由于仅仅着重对地理影响的深度研究,因此仍需综合考虑不同因素对POI的影响。同样,文献[11]通过张量因式分解,利用切分的时间片段通过两两交叉的方式进行建模。然而在现实世界中,用户访问的POI个数会因为时间及频率的影响而形成稀疏性的约束。因此,为了解决数据稀疏性问题,仍需增加相关信息。文献[4]研究发现签到的两个POI之间的转移概率是非均匀分布的,为此利用POI之间的内容语义和上下文关系进行建模,但由于提出的模型缺少对文本语义特征的考虑,因此并没有很好地突出个性化。

    目前,随着对基于位置的感知社交数据可用性的深入研究,基于POI推荐的研究方向在各种算法及模型上也得到了不断的更新及拓展,而不再只是停驻在特征因素分析的层面。例如文献[6]将时间序列、空间两种因素进行融合,从而提出了基于矩阵分解的POI推荐模型。虽然该模型表现效果较好,但由于未能解决数据稀疏性,因此在用户与POI之间关联不强时,其推荐效果欠佳。文献[12]采用因式分解的方法通过对空间和时间建立模型,但是由于因式分解的算法难以自由灵活组合与用户相关的各项指标,因此仍存在一定不足。文献[7]通过对签到数据中的用户信息和评论信息的分析,采用矩阵分解和CNN的方式建立模型,虽然有效地避免了局部最优的问题,但是对样本的需求量较大。文献[8]通过RNN网络建立的模型,可以推导预测出用户下一个签到访问轨迹的深度表示。虽然该模型的表现效果较为不错,但仍未解决梯度消失的情况。

    为了解决上述提出的问题,本文的主要工作如下:

    (1)通过研究时间、空间上下文,探究用户潜在行为模式。并且把空间、类别及时间等异构信息编码整合,将融合后的上下文信息嵌入基于GRU[13]网络的模型中。基于时空上下文信息所建立的序列模型,不但可以较好地处理序列关系,打破因为单一信息所带来的局限性,还能通过增加对用户偏好的关联性来缓解由签到数据稀疏性所带来的困难,从而提高了预测精度。

    (2)在时空上下文信息的POL模型推荐(Spatio-Temporal Context information of POI Recommendations, STCPR)模型中,引入时间注意力机制、全局和局部的空间注意力[14],获取用户的个性化偏好及移动行为,获得更好的个性化POI预测。

    (3)基于两个真实数据集上的实验结果表明,与现有的几种方法进行对比,本文所提模型占据了相对优势,并且两种注意力机制对模型效果的提升是有帮助的。

    定义1 (check-in行为) 每条打卡签到纪录h由一个4元组(u,y,t,C)构成,其含义为用户ut时刻基于用户上下文C对某位置y的签到行为。

    定义2 (上下文信息) 用户上下文信息C主要由xcatxct来表示其序列相关性。xcat描述POI的内在属性,主要考虑POI的类别属性;xct表示用户签到的时序相关转换信息,其中,通过相邻两次签到信息的时间间隔以此代表时间转换信息,通过当前签到POI与上一次签到POI之间的地理距离代表地理转换信息。

    定义3 (问题描述) 令UP分别表示用户集合和POI集合,对于用户uU,在给出当前查询到的签到地点YtP和当前查询到的时间T的条件下,依据签到历史记录H,推测用户在t+1时刻可能感兴趣的POI,并向用户进行推荐。

    由于不同用户签到信息长度不同,为了处理不同长度的序列信息,本文基于序列到序列(Sequence-to-sequence, Seq2seq)的框架进行建模。如图1所示,在编码框架(Encoder)中,主要将融合嵌入的异构数据输入基于空间注意力的GRU的序列模型,在解码框架(Decoder)中,通过对编码过程输入与输出的处理,从而生成指定的序列。本文通过GRU编码-解码框架来学习概率分布,根据预测概率大小排序生成POI推荐列表,从而对用户进行推荐。

    图 1  时空上下文信息的POI推荐(STCPR)模型框架图

    对于编码阶段如图1左侧所示,首先通过对历史数据的采集,对POI信息、用户信息、类别信息以及上下文信息等信息都采用One-hot编码,以统一的方式整合异构数据后,将拼接好的向量输入编码器中。

    由于用户对时间有着高度的敏感性,为了捕获时间特征对于用户行为的影响,通过时间的周期性和连续性两个隐含特征,来对时间进行多维度的划分。因此,我们将时间戳划分为小时与周的形式。对一天通过h{0,1,,23}来表示24小时;通过w=0或1来表示工作日和休息日,最后通过One-hot编码的拼接得到其潜在向量。

    由于用户的高流动性,且两个POI之间的地理影响性和接受性是非均匀的,为了挖掘其上下文序列关系,本文通过时间间隔以及距离间隔来度量其上下文序列的影响。选择不同的间隔会生成不同的空间,因此,加入两个潜在向量cl,cs描述长、短两个间隔之间的转换。如

    xct={λccs+(1λc)cl,λc0cl,λc<0
    (1)

    其中,λc通过πcΔcπc计算可得,其中πc表示时间间隔或者距离间隔Δc的阈值,πc表示为一个窗口,通过cl,cs之间的线性插值算出主要的时间和地理关联xct

    编码器在签到输入的序列中学习不同上下文的表示形式,为了更好地学习不同因素的影响,引入了局部和全局的空间注意力。根据空间的局部注意力层,对前期通过整合、拼接及输入的值xT,分别从时间、地理、上下文信息进行动态分析。由于POI在不同时间序列之间存在一定的动态关联性影响,因此给定时间序列Ti维上下文信息向量表示xi,T来计算其局部注意力,如式(2)、式(3)。其中,ali,t表示在t时刻的第i维局部注意力参数的得分函数,并通过一个softmax函数计算出局部注意力权重αli,t。最后,通过对αlI,TxlI,T的线性加权得到基于局部空间注意力的向量xli,t=(αl1,txl1,t,αl2,txl2,t,,αlI,txlI,t)

    ali,t=VTitanh(Wiht1+Uixi,T+bi)
    (2)
    αli,t=exp(ali,t)Ij=1exp(alj,t),1iI
    (3)

    不可避免地,在不同POI之间存在或多或少的地理关联,为了能够更加准确地发现用户的动态行为关系,引入基于空间的宏观注意力层。考虑不同因素时空数据的相互关联,测量出不同POI之间潜在向量的决策影响。

    通过前一时刻的隐藏状态和n, m两个兴趣点之间输入的潜在向量,来计算t时刻各POI关联性得分αga,t。再采用softmax函数归一化得分,得到基于空间的全局注意力权重αga,t

    aga,t=VTatanh(Wiht1+Uixi,T+bi)
    (4)
    αga,t=exp((1τ)agn,t+τDn,m)Kj=1exp((1τ)agj,t+τSn,j),1tT
    (5)

    其中,Dn,m=1dist(yn,ym)通过t时刻n, m两个POI之间距离的倒数,表示用户访问n, m两个兴趣点之间的地理相关分数。通过选取备选用户中的POI距离的最大值sn,j来规范化距离的表示。τ作为一个超参数,当它很大时会使注意力权重更侧重于计算地理位置相似性。

    最后,通过对aga,txli,t的加权求和得到了基于空间的全局注意力输出向量xga,t=(αg1,txl1,t,αg2,txl2,t,,αga,txla,t)T。根据粗粒度和细粒度的分析后将xli,txga,t拼接为一个新的向量˜xt,输入GRU模型中。

    在解码阶段,由于每个签到序列对下一个POI的贡献和偏好不同,并且随着编码长度的增长性能会有所下降,因此引入时间注意力机制的GRU模型自适应地选择相关的签入活动,从而获得更佳的推荐。

    图1右侧所示,在GRU神经网络下的时间注意力通过式(6),将其隐藏状态hj与解码阶段GRU单元前一时刻的隐藏状态St1t1时刻预测值ˆyt1非线性组合,计算出一个得分来选取关键信息。然后通过softmax函数对时间注意力权重λjt进行归一化操作,如式(7)。之后对权重λjt及隐藏状态hj进行加权求和,算出个性化偏好的隐藏向量˜St,并用˜St替换隐藏状态hj

    bjt=vTttanh(Wt[St1,ˆyt1]+Uthj+bt)
    (6)
    λjt=exp(bjt)Tn=1exp(bnt)
    (7)

    结束解码阶段后,通过一个全连接层,利用softmax函数输出t时刻POI概率的目标函数,如式(8),其中,u为用户,T为前查询时间,Yt为当前查询的签到地点,H为签到的历史数据。并且通过对目标函数的最大对数似然估计来对参数θ={u,H,Pt,T}进行学习。

    PrˆY(.|u,H,Yt,T)=softmax(WmˆyT+bm)
    (8)

    为了验证本文所提STCPR模型的有效性,本节使用来自LBSN签到的Gowalla和Foursquare数据集进行实验,并通过评价指标进行分析。在TensorFlow的框架下进行不同参数的实验对比,找到时间间隔阈值和地理距离阈值等参数最优的取值。通过召回率和归一化折损累计增益两种评价指标,对STCPR变体从时间注意力机制和空间注意力机制上的影响性能进行对比分析,用以说明考虑时空注意力机制方法的有效性。最后,通过与其他现有方法的实验和性能结果对比,分析STCPR模型有效性的原因。

    本文在LBSN签到的真实数据集Gowalla和Foursquare上进行实验。将2009—2011年数据集中的POI通过7个类的基础上再划分为335个小类。基于此我们对两个数据集进行了预处理,将数据集的70%作为训练集,10%作为验证集,20%作为测试集,删除访问少于10个POIs的用户和少于10个用户访问的POIs,具体的信息如表1所示。

    表 1  数据集
    数据集用户数地点数签到数密度
    Gowalla13117371969530060.0019
    Foursquare5398278958642300.0021
    下载: 导出CSV 
    | 显示表格

    本文使用T召回率(Recall@N)和的归一化折损累计增益(NDCG@N)来衡量和评价搜索结果。召回率作为应用广泛的度量值,具体指推荐结果中用户实际去的地点值占推荐列表的比例。其中,R(u)表示POI推荐列表的数量,T(u)表示用户实际访问POI的数量。NDCG是最受欢迎的排名评价指标,对于关联度较高且排序靠前的对象,其NDCG指标会越高。其中,DCG是折损累计增益,IDCG为理想情况下最大的DCG。定义为

    Recall@N=|R(u)T(u)|T(u)
    (9)
    NDCG@N=DCGIDCG
    (10)
    3.4.1   参数选择

    本文实验基于TensorFlow框架,将推荐列表长度N的取值分别为2, 5, 10,并采用了随机梯度下降算法和Adam优化器对参数进行更新,将其隐藏层的维度设置为{20, 40, 60},并将批量大小设置为512。作为衡量地理相似度影响的超参数τ,通过经验固定取值在0.2~0.4。基于此,我们进行了多次的实验对比,确定了最优超参数的组合。

    图2所示,分别表示在Gowalla和Foursquare数据集上实验选择合适的学习率α。将学习率范围设置为0.001到0.1,在Gowalla数据集中当推荐列表长度N值取2, 5和10时,α=0.01的召回率分别是0.1526, 0.2121和0.2654,与其他值相比效果最好。同样地,在Foursquare数据集上,在相同推荐列表长度N值的情况下α=0.01时,相较于其他学习率效果更好。当N=10时学习率α效果最好,且为0.2703。

    图 2  在不同数据集上学习率α对召回率的影响

    为了研究序列长度的影响,如图3,考虑N=2,5,10时的召回率在其不同签到数据序列长度{5, 10, 15, 20, 25}的取值。随着签到序列长度的增加,模型的效果也在不断提升。当签到序列长度为15时,在两个数据集中归一化值为1表现效果最佳。但随着签到序列长度的增加,计算复杂度增加,使得模型的效果下降。特别是Gowalla数据集中下降的速度比Foursquare数据集下降得更快。因此,当序列长度为15时,模型的性能表现更佳。

    图 3  签到序列长度在不同数据集上的变化

    为了更深入地探索时间对于用户移动行为的影响,通过将时间分片,来确定时间间隔对用户行为产生的影响。当时间间隔πt的分别取值为0, 3, 6, 9及12时,以N取2, 5, 10的召回率来对时间间隔敏感性进行度量。

    图4可知,在Gowalla数据集上,发现当时间阈值πt=3h效果最佳,且随着时间的增长,阈值的趋势较为稳定。同样地,在Foursquare数据集中,当时间间隔增加到3 h时,其归一化值为1,模型的性能取得了更好的表现。但是3 h后,随着时间间隔的增大,模型的性能开始出现逐渐下降的趋势,其中,当时间间隔处于6~12 h范围内时,随着间隔的增大,Foursquare数据集中模型性能下降速度相较于Gowalla数据集幅度更大,因此设置最佳的时间间隔的阈值为πt=3

    图 4  时间阈值πt在不同数据集上的变化

    为了确定用户的签到行为具有强烈的地理属性限制,通过对地理间隔的实验来确定其最佳阈值。在图5的Gowalla数据集中,当召回率为10时,其距离间隔πd=10时达到最佳。虽然召回率为10时,12的距离间隔是最佳,但在πd=10时其归一化值为0.998,接近最佳。因此在Gowalla数据集中将距离间隔阈值πd=10设置为10 km。同样地,在Foursquare中虽然在9 km时,Recall@2在模型中效果最佳。但随着地理距离阈值的变大,召回率也在增长,当距离间隔πd=10时达到最佳,且归一化值为1。因此,本文将距离间隔阈值πd设置为10 km。

    图 5  距离阈值πd在不同数据集上的变化
    3.4.2   实验过程

    为了评估POI推荐算法的性能,选取以下几组不同方法和本文提出的STCPR模型对比,以验证本文模型的有效性。

    FPMC[15]:是个性化马尔可夫链模型的代表,通过在时间序列上观测和模拟用户偏好,来建立矩阵模型,解决其数据稀疏的问题。

    Distance2Pre[16]:通过建立连续POIs之间的距离交互关系来获取基于空间的RNN模型。

    ST-RNN[17]:通过考虑空间及时间的上下文影响,在签到序列中,将时间间隔和空间间隔以转移矩阵的方式表示一种特殊距离的设定。将空间及时间这两种特征导入到RNN的网络结构中。

    GRU[18]:是RNN模型的一个变体,为了研究注意力的影响。

    UCGSMF_GEN[19]:从用户签到的地理位置、社交网络数据和POI类别信息等方面建立一个通用的矩阵分解模型。

    MFM-HNN[7]:基于扩展的矩阵分解模型融合评论信息特征和用户签到信息的初始值进行兴趣点推荐。

    3.4.3   结果分析

    为了验证本文模型的相关性能,对其STCPR模型通过不同的影响因素设置不同的变体并进行比较,结果如图6图7所示。主要分为简单的GRU模型,考虑时间注意力机制的STCPR-T模型,考虑空间注意力机制的STCPR-S模型这3类变体。结果表明,简单的GRU网络,由于没有考虑随着时间增加而引起的衰减效果,因此效果最不明显。在STCPR-S和STCPR-T两个模型中,其性能效果比较接近,但是STCPR-T改进更加显著。对于STCPR模型来说,在考虑了时间、空间的上下文信息的同时,还对用户的空间意图进行了多层次分析。因此,STAPR模型在两个数据集上表现都明显较好。

    图 6  Gowalla数据集上STCPR不同变体对比
    图 7  Foursquare数据集上STCPR不同变体

    为了观测各种模型在不同N值时Recall和NDCG的实验效果,通过在Gowalla和Foursquare上进行多次实验比较,结果如表2所示。在N值增加的情况下,各种模型的归一化损失和召回率都出现了一定程度的提高,但与其他模型相比,本文提出的STCPR模型的提高最为明显。

    表 2  不同方法在两个数据集上的实验结果(%)
    数据集模型Recall@NNDCG@N
    N=2N=5N=10N=2N=5N=10
    GowallaFPMC9.8414.1219.287.929.8911.51
    Distance2Pre14.2718.0523.5711.7313.9515.68
    GRU13.3417.4421.9610.2813.1214.74
    ST-RNN13.9519.0423.0410.7912.5413.52
    UCGSMF_GEN13.6618.5222.668.7510.5912.49
    STCPR15.2621.2126.5413.5615.8417.79
    FoursquareFPMC10.6115.5520.878.5410.3211.67
    Distance2Pre14.3618.9324.1212.1114.3415.87
    GRU13.6416.9422.1311.4813.1714.98
    ST-RNN13.5619.3223.2710.7813.0813.86
    UCGSMF_GEN12.7117.8222.979.0811.7212.8
    MFM-HNN13.9518.8523.8911.7613.5214.23
    STCPR15.5921.8427.0313.9616.3718.34
    下载: 导出CSV 
    | 显示表格

    当Recall@10时,与考虑了时间、空间影响的传统神经网络模型相比,STCPR模型性能表现分别要高出15.19%和16.16%。STCPR模型表现更高的主要原因在于RNN模型对实际序列数据的处理存在一定的局限性,如缺少长期依赖,短期记忆比长期记忆更具有影响力,从而出现梯度爆炸和梯度消失等情况。因此,在捕获用户兴趣方面GRU神经网络比RNN有着更优异的表现。当与最简单的GRU网络进行比较时,因其不对各种影响因素进行细粒度分析,相较于对用户偏好多样性分析的模型来说,其推荐效果略差。但与将矩阵分解和马尔可夫链结合起来的FPMC模型相比,效果要略好一些。以RNN网络为基础的基于个性化空间影响的Distance2Pre模型,由于深入全面地考虑用户与地理影响之间关系,减少了由数据稀疏所带来的问题。但由于在序列关系中,对长短期的记忆影响考虑不足,同STCPR相比其模型分别降低了12.6%和12.06%。UCGSMF_GEN模型由于综合考虑了用户自身偏好、地理位置和社交网络信息来建模用户签到行为,因此它的推荐效果优于GRU和FPMC模型。相比于UCGSMF_GEN,本文提出的STCPR模型的推荐性能提高了17.12%和17.68%,主要由于深度神经网络能够很好地将签到信息的特征和潜在特征向量融合起来,相比于矩阵分解模型在特征训练方面有着显著优势。对于MFM-HNN模型来说,由于Gowalla数据集没有提供评论信息,因此主要考虑评论信息的MFM-HNN模型仅在Foursquare数据集上进行方法对比。相对于考虑词序及上下文信息的MFM-HNN模型来说,STCPR模型性能效果高出13.14%左右,其原因在于,相比社交信息和地理信息对于POI推荐性能的影响,评论文本信息的影响较小。

    同样地,当NDCG@10时模型性能达到最佳,在两个数据集中相对较好的是Distance2Pre模型,由于其基于序列的方式分析了地理信息的可接受性和影响性,因此获得较好的性能。但由于其既没有融入有效的上下文信息,又没有关注用户对不同POI签到序列的偏好差异,因此其效果略低于融合时空上下文信息的STCPR模型。MFM-HNN模型由于充分考虑词序及上下文信息对学习的潜在特征表示的影响,因此在Foursquare数据集上表现也较好,但相对于本文提出的STCPR模型来说,它没有挖掘用户的长期偏好。由于没有使用合适的排序技术,在召回率中表现较好的ST-RNN和UCGSMF_GEN模型在排序指标NDCG中的表现效果却不尽如人意。同样地,对于传统的FPMC模型来说,虽然在用户-项目的推荐模式下通过矩阵分解的方法有着较为不错的表现,但相对于其他基于序列影响的模型而言无法产生相对较好的效果。GRU网络作为本文模型的基础,通过在两个真实数据集下的实验对比,实验结果充分表明了结合空间及时间影响的注意力机制的重要性。

    本文提出了一种基于时空上下文信息的POI推荐(STCPR)模型用于POI的推荐。为了缓解数据稀疏带来的困难和打破单个序列信息的有限性,基于Seq2seq的框架结构,将地理距离、时间和POI分类等上下文信息,利用嵌入方法来整合输入编码-解码器的GRU模型中。此外,还引入时间与空间注意力机制来挖掘与分析用户的动态行为与个性偏好,从而实现更有效的个性化POI预测。实验结果表明,本文提出的STCPR模型在召回率和归一化折损累计增益方面均优于现有的几种方法,并且两种注意力机制都能有效地提高推荐性能。

    在未来的工作中,计划融合更多有效的多源数据,帮助克服单一信息所带来的不足。其次,通过实验来查看不同密集度数据集对POI推荐模型表现的限制,并针对数据稀疏问题提出相应的解决方案。最后,希望在提高推荐性能的同时增加其模型的可解释性,从而提升用户的体验感。

  • 图  1  时空上下文信息的POI推荐(STCPR)模型框架图

    图  2  在不同数据集上学习率α对召回率的影响

    图  3  签到序列长度在不同数据集上的变化

    图  4  时间阈值πt在不同数据集上的变化

    图  5  距离阈值πd在不同数据集上的变化

    图  6  Gowalla数据集上STCPR不同变体对比

    图  7  Foursquare数据集上STCPR不同变体

    表  1  数据集

    数据集用户数地点数签到数密度
    Gowalla13117371969530060.0019
    Foursquare5398278958642300.0021
    下载: 导出CSV

    表  2  不同方法在两个数据集上的实验结果(%)

    数据集模型Recall@NNDCG@N
    N=2N=5N=10N=2N=5N=10
    GowallaFPMC9.8414.1219.287.929.8911.51
    Distance2Pre14.2718.0523.5711.7313.9515.68
    GRU13.3417.4421.9610.2813.1214.74
    ST-RNN13.9519.0423.0410.7912.5413.52
    UCGSMF_GEN13.6618.5222.668.7510.5912.49
    STCPR15.2621.2126.5413.5615.8417.79
    FoursquareFPMC10.6115.5520.878.5410.3211.67
    Distance2Pre14.3618.9324.1212.1114.3415.87
    GRU13.6416.9422.1311.4813.1714.98
    ST-RNN13.5619.3223.2710.7813.0813.86
    UCGSMF_GEN12.7117.8222.979.0811.7212.8
    MFM-HNN13.9518.8523.8911.7613.5214.23
    STCPR15.5921.8427.0313.9616.3718.34
    下载: 导出CSV
  • [1] 司亚利, 张付志, 刘文远. 基于签到活跃度和时空概率模型的自适应兴趣点推荐方法[J]. 电子与信息学报, 2020, 42(3): 678–686. doi: 10.11999/JEIT190287

    SI Yali, ZHANG Fuzhi, and LIU Wenyuan. An adaptive point-of-interest recommendation method based on check-in activity and temporal-spatial probabilistic models[J]. Journal of Electronics &Information Technology, 2020, 42(3): 678–686. doi: 10.11999/JEIT190287
    [2] FENG Shanshan, GAO Cong, AN Bo, et al. POI2Vec: Geographical latent representation for predicting future visitors[C]. Proceedings of the 31th AAAI Conference on Artificial Intelligence, San Francisco, USA, 2017: 102–108.
    [3] 孟祥福, 张霄雁, 唐延欢, 等. 基于地理-社会关系的多样性与个性化兴趣点推荐[J]. 计算机学报, 2019, 42(11): 2574–2590. doi: 10.11897/SP.J.1016.2019.02574

    MENG Xiangfu, ZHANG Xiaoyan, TANG Yanhuan, et al. A diversified and personalized recommendation approach based on geo-social relationships[J]. Chinese Journal of Computers, 2019, 42(11): 2574–2590. doi: 10.11897/SP.J.1016.2019.02574
    [4] 任星怡, 宋美娜, 宋俊德. 基于位置社交网络的上下文感知的兴趣点推荐[J]. 计算机学报, 2017, 40(4): 824–841. doi: 10.11897/SP.J.1016.2017.00824

    REN Xingyi, SONG Meina, and SONG Junde. Context-aware point-of-interest recommendation in location-based social networks[J]. Chinese Journal of Computers, 2017, 40(4): 824–841. doi: 10.11897/SP.J.1016.2017.00824
    [5] WEI Jian, He Jianhua, CHEN Kai, et al. Collaborative filtering and deep learning based recommendation system for cold start items[J]. Expert Systems with Applications, 2017, 69: 29–39. doi: 10.1016/j.eswa.2016.09.040
    [6] 柳天闻. 基于位置社交信息和群组的地点推荐算法研究与实现[D]. [硕士论文], 北京邮电大学, 2018.

    LIU Tianwen. The research and implementation of location recommendation algorithms based on location-social information and groups[D]. [Master dissertation], Beijing University of Posts and Telecommunications, 2018.
    [7] 冯浩, 黄坤, 李晶, 等. 基于深度学习的混合兴趣点推荐算法[J]. 电子与信息学报, 2019, 41(4): 880–887. doi: 10.11999/JEIT180458

    FENG Hao, HUANG Kun, LI Jing, et al. Hybrid point of interest recommendation algorithm based on deep learning[J]. Journal of Electronics &Information Technology, 2019, 41(4): 880–887. doi: 10.11999/JEIT180458
    [8] WANG Mufan, LU Yishu, HUANG J L, et al. SPENT: A successive POI recommendation method using similarity-based poi embedding and recurrent neural network with temporal influence[C]. 2019 IEEE International Conference on Big Data and Smart Computing, Kyoto, Japan, 2019: 1–8.
    [9] ZHAO Shenglin, LYU M R, KING I, et al. Geo-teaser: Geo-temporal sequential embedding rank for POI recommendation[C]. The 26th International Conference on World Wide Web Companion, Perth, Australia, 2017: 153–162.
    [10] WANG Hao, SHEN Huawei, OUYANG Wentao, et al. Exploiting POI-specific geographical influence for point-of-interest recommendation[C]. The 27th International Joint Conference on Artificial Intelligence Main Track, Stockholm, Sweden, 2018: 3877–3883.
    [11] ZHAO Shenglin, ZHAO Tong, YANG Haiqing, et al. STELLAR: Spatial-temporal latent ranking for successive point-of-interest recommendation[C]. The 30th AAAI Conference on Artificial Intelligence, Phoenix, USA, 2016: 2605–2611.
    [12] CAI Ling, XU Jun, LIU Ju, et al. Integrating spatial and temporal contexts into a factorization model for POI recommendation[J]. International Journal of Geographical Information Science, 2018, 32(3): 524–546. doi: 10.1080/13658816.2017.1400550
    [13] ZHANG Zhiqian, LI Chenliang, WU Zhiyong, et al. Next: A neural network framework for next POI recommendation[J]. Frontiers of Computer Science, 2020, 14(2): 314–333. doi: 10.1007/s11704-018-8011-2
    [14] QIAN Tieyun, LIU Bei, NGUYEN Q V H, et al. Spatiotemporal representation learning for translation-based POI recommendation[J]. ACM Transactions on Information Systems, 2019, 37(2): 18. doi: 10.1145/3295499
    [15] RENDLE S, FREUDENTHALER C, and SCHMIDT-THIEME L. Factorizing personalized markov chains for next-basket recommendation[C]. The 19th International Conference on World Wide Web, Raleigh, USA, 2010: 811–820. doi: 10.1145/1772690.1772773.
    [16] CUI Qiang, TANG Yuyuan, WU Shu, et al. Distance2Pre: Personalized spatial preference for next point-of-interest prediction[C]. The 23rd Pacific-Asia Conference, Macau, China, 2019: 289–301. doi: 10.1007/978-3-030-16142-2_23.
    [17] LIU Qiang, WU Shu, WANG Liang, et al. Predicting the next location: A recurrent model with spatial and temporal contexts[C]. The 30th AAAI Conference on Artificial Intelligence, Phoenix, USA, 2016: 194–200.
    [18] CHO K, VAN MERRIËNBOER B, GULCEHRE C, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation[C]. The 2014 Conference on Empirical Methods in Natural Language Processing, Doha, Qatar, 2014: 1724–1734, doi: 10.3115/v1/D14-1179.
    [19] 彭宏伟, 靳远远, 吕晓强, 等. 一种基于矩阵分解的上下文感知POI推荐算法[J]. 计算机学报, 2019, 42(8): 1797–1811. doi: 10.11897/SP.J.1016.2019.01797

    PENG Hongwei, JIN Yuanyuan, LV Xiaoqiang, et al. Context-Aware POI recommendation based on matrix factorization[J]. Chinese Journal of Computers, 2019, 42(8): 1797–1811. doi: 10.11897/SP.J.1016.2019.01797
  • 加载中
图(7) / 表(2)
计量
  • 文章访问数:  1358
  • HTML全文浏览量:  1270
  • PDF下载量:  146
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-05-07
  • 修回日期:  2021-04-26
  • 网络出版日期:  2021-06-02
  • 刊出日期:  2021-12-21

目录

/

返回文章
返回