论文部分内容阅读
随着移动互联网的发展,基于位置的社交网络(Location-Based Social Network,LBSN)趋于流行,用户在LBSN中产生了丰富的行为数据,这些行为数据能反映用户对相关兴趣点(Point-Of-Interest,POI)的偏好。POI推荐系统通过分析用户历史数据,从而学习用户偏好模型、建模用户访问POI的决策过程,进而预测用户可能感兴趣的地点,并根据预测结果向用户推荐其尚未访问但可能感兴趣的地点。POI推荐既有利于LBSN服务商实现人群定向以进行数字广告营销,也可帮助用户在面临搜索系统展示结果信息过载时进行个性化POI探索发现,具有重要的学术研究和应用指导价值。本文主要研究基于LBSN的POI推荐算法,在深入分析用户在LSBN中的签到行为模式特点后,提出了基于社交和时间因素的用户偏好模型,并进一步地融合地理位置决策因素,从而构建了最终的POI推荐模型。本文的主要研究成果包括:(1)用户签到行为模式分析与特征建模本文分析了LBSN中用户签到行为,总结出用户行为在社交上呈现出“他相似性(Other-Similarity)”、在时间上呈现出“自相似性(SelfSimilarity)”特点,并基于这样的行为模式特点进行特征提取和建模。本文构建的特征可以使用户与其可能访问的POI产生更多关联,对促成本文POI推荐算法性能提升有重要影响。(2)融合因子分解机与稀疏编码器的用户偏好模型本文从不同的特征处理方法切入,提出了融合因子分解机与稀疏编码器的用户偏好模型。一方面,本文基于因子分解机(Factorization Machines)的思想,提出了融合社交和时间因素的因子分解机模型来学习用户偏好模型;因子分解机通过将特征项分解为特征隐因子向量能有效的进行稀疏数据学习,因子分解机可以同时学习原始特征、基于原始特征得到的乘积组合特征,一定程度上可以理解为扩充有效特征进行学习的稀疏模型。另一方面,本文则基于神经网络模型适合处理高维稀疏特征的特点,利用稀疏自动编码器(AutoEncoder)进行特征压缩,进而进行加权式的高维特征融合以学习用户偏好;在POI推荐这种训练数据相对稀疏的场景,引入自动编码器进行特征压缩,可以提取特征的主干信息,而更进一步的基于压缩特征的偏好模型也需要相对更少的模型参数,因此也可以使模型得到充分的训练学习。(3)融合用户偏好模型和地理位置决策因素模型的POI推荐模型本文基于用户访问意愿随位置距离的幂律分布模型,融合用户偏好模型构建了本文的POI推荐模型。POI推荐场景与经典的在线商品推荐场景有所不同,用户是否会访问某POI不仅与用户偏好有关系,同时也与其他决策因素有关,本文主要考虑的是位置距离决策因素,并设计了融合偏好与决策因素的通用推荐模型。(4)算法实验验证和原型系统设计实现本文基于通用的评估数据集、通用的评估标准对所提算法进行了实验评估,并设计实现了以LBSN中的签到服务需求为背景的、包含POI推荐系统的原型应用系统。本文首先介绍了POI推荐的研究背景和现状,分析了现有研究中存在的问题与不足,并提出了本文的研究路线。然后从特征提取、偏好建模、推荐模型构建等过程详细介绍了本文所提的POI推荐算法。接着,介绍了本文算法的验证实验,并分析了实验结果。最后,还介绍了本文设计实现的以LBSN中签到服务需求为背景的、包含POI推荐子系统的原型应用系统。