论文部分内容阅读
由于智能手机和GPS技术的普及和发展,基于位置的社交网络(Location Based Social Network,LBSN)受到越来越多的关注,例如Foursquare和Yelp。然而随着LBSN中用户和项目数量的爆炸式增长,无论是对于用户、商家还是研究人员,都面临着信息的大量冗余、筛选上存在困难的问题。对于当前来说,推荐系统是用来解决这类问题的一种极其有效的方式。它的本质是一种信息过滤系统,它通过分析用户的历史行为记录来预测用户对项目的兴趣偏好,进而向用户推荐个性化信息。传统的推荐系统大多基于协同过滤技术,它利用用户对项目的评分来生成推荐,但是由于用户评分数据的稀疏性和冷启动问题,协同过滤技术无法产生准确的推荐结果。因此很多研究人员提出了利用辅助信息来优化推荐,不同于传统的社会媒体推荐场景,在基于位置的社交网络中,存在大量具有时空属性的对象,例如用户的文本信息、用户的签到或评论时间信息、项目的现实地理位置信息等。本文以卷积矩阵分解(Convolutional Matrix Factorization,ConvMF)为基本框架,融入时间和空间关系来生成更准确的评分预测。ConvMF采用了卷积神经网络(Convolutional Neural Network,CNN)技术从项目的评论文本中去学习文本的上下文信息,然后将CNN集成到概率矩阵分解(Probability Matrix Factorization,PMF)中。基于以上考虑,本文首先提出一种融入空间关系的卷积矩阵分解推荐模型(Convolution matrix factorization model with spatial relation,CMFSR),该模型除了考虑用户评分信息、地点评论信息外,还探索了不同地点在空间上的关联。地理学第一定律表明距离近的事物比距离远的事物之间更具有关联性,因此本文认为地点-地点之间的距离会影响他们之间的关联度,在此基础上构建了地点关联矩阵,通过共享项目潜在特征将预定义的地点关联网络嵌入到ConvMF中。除了空间关联,本文还提出一种考虑时间关系的联合卷积矩阵分解方法(Joint Convolutional Matrix Factorization,JCMF),该方法可以在一个统一的框架中共同考虑项目评论、项目之间的关系、用户的社会影响和用户评论。具体来说,为了探索项目之间的关系,我们认为如果两个项目在短时间内被同一个用户有过评分,那么这两个项目是相关的,据此提出一种称为具有项目关系的卷积矩阵分解方法(Convolutional Matrix Factorization with Item Relations,CMF-I),通过共享项目潜在特征将预定义的项目关系网络嵌入到ConvMF中。为了考虑用户之间的社交影响,我们通过在用户社交网络和用户项目评分矩阵之间共享用户潜在特征,进一步将用户社交网络整合到CMF-I中,这可以作为约束推荐过程的正则化项。最后,为了建模用户评论的文本上下文信息,我们利用另一个CNN来学习用户内容表示,并得到我们的最终模型JCMF。最后,本文在真实数据集Yelp上进行了大量实验。实验结果证明了我们提出的方法在两个评价指标均方根误差(Root Mean Squared Error,RMSE)和平均绝对误差(Mean Average Error,MAE)上都比相关算法取得了更好的结果。