梁顺攀 刘伟 尤殿龙 刘泽谦 张付志

Shunpan LIANG, Wei LIU, Dianlong YOU, Zeqian LIU, Fuzhi ZHANG. Self-attention Capsule Network Rate Prediction with Review Quality[J]. Journal of Electronics & Information Technology, 2021, 43(12): 3451-3458. doi: 10.11999/JEIT200932
基金项目: 国家自然科学基金(62072393), 河北省自然科学基金(G2021203010,F2021203038)







Self-attention Capsule Network Rate Prediction with Review Quality

Funds: The National Natural Science Foundation of China (62072393), The Natural Science Foundation of Hebei Province (G2021203010, F2021203038)
  • 摘要: 基于评论文档的推荐系统普遍采用卷积神经网络识别评论的语义,但由于卷积神经网络存在“不变性”,即只关注特征是否存在,忽略特征的细节,卷积中的池化操作也会丢失文本中的一些重要信息;另外,使用用户项目交互的全部评论文档作为辅助信息不仅不会提升语义的质量,反而会受到其中低质量评论的影响,导致推荐结果并不准确。针对上述提到的两个问题,该文提出了自注意力胶囊网络评分预测模型(Self-Attention Capsule network Rate prediction, SACR),模型使用可以保留特征细节的自注意力胶囊网络挖掘评论文档,使用用户和项目的编号信息标记低质量评论,并且将二者的表示相融合用以预测评分。该文还改进了胶囊的挤压函数,从而得到更精确的高层胶囊。实验结果表明,SACR在预测准确性上较一些经典模型及最新模型均有显著的提升。
  • 图  1  SACR模型结构

    图  2  不同数量和维度的胶囊对模型均方误差的影响

    图  3  不同的迭代次数在两个数据集上对模型均方误差的影响

    图  4  不同的挤压程度在两个数据集上对模型均方误差的影响

    表  1  模型符号定义

    N,M数据集中用户和项目的数量$ {\alpha _i} $,$ {\beta _{\text{j}}} $用户i、项目j的编号嵌入
    R用户或项目的评论文档$ {u_i} $,$ {v_j} $用户i、项目j的胶囊
    $ {r_{ij}} $评分矩阵中用户i对项目j的评分$ C $,$ {e^1} $输入胶囊的通道数、维度
    $ {\hat r_{ij}} $用户i对项目j的预测评分D,e输出胶囊的数量、维度
    W,b模型中的权重矩阵、偏置向量$ \lambda $路由迭代的次数
    表  2  对每个数据集的统计

    Musical Instruments1429900102617.211.4
    Office Products490524205325810.922.0
    Digital Music554035686470611.718.1
    Tools and Improvement16638102171344768.113.2
    Video Games24303106722317809.521.7
    Toys and Games19412119241675978.614.1
    Kindle Store682236193598261914.415.9
    Movies and TV12396050052167953313.533.6
    表  3  各模型实验结果对比

    Musical Instruments1.3980.9030.8931.0040.8000.810
    Office Products1.0920.7670.6980.9310.7280.680
    Digital Music1.2060.8760.8091.2700.8890.796
    Tools Improvement1.5661.0560.9581.1960.9640.924
    Video Games1.6721.1741.1341.2051.1661.104
    Toys and Games1.7110.8770.8100.7960.8000.780
    Kindle Store0.9840.6230.6210.6050.6100.590
    Movies and TV1.6691.0101.0260.9940.9970.930
    表  4  子模型预测准确率实验结果对比

    模型 Musical InstrumentsOffice ProductsDigital MusicTools and Home ImprovementVideo Games
    [16] 丁永刚, 李石君, 付星, 等. 面向时序感知的多类别商品方面情感分析推荐模型[J]. 电子与信息学报, 2018, 40(6): 1453–1460. doi: 10.11999/JEIT170938

    DING Yonggang, LI Shijun, FU Xing, et al. Temporal-aware multi-category products recommendation model based on aspect-level sentiment analysis[J]. Journal of Electronics &Information Technology, 2018, 40(6): 1453–1460. doi: 10.11999/JEIT170938
图(4) / 表(4)
  • 收稿日期:  2020-11-02
  • 修回日期:  2021-10-25
  • 网络出版日期:  2021-11-10
