论文部分内容阅读
城市的迅速扩展涌现出了大量的空间物品(POI,Points of interest),如餐馆、剧院、商场等,来提高人们的生活水平,人们越来越愿意去探究自己所生活的地方,依据自身的喜好来选择这些空间物品。随着Web2.0技术的高速发展,一系列基于位置的社交网络(LBSNs,Location-based social networks)出现了,例如国外的Foursquare、Yelp,国内的大众点评等,这些基于位置的社交网络维护着一个巨大的空间物品数据库,并允许用户通过智能手机在他当前的物理位置上进行“签到”,人们的线上数据和线下活动已经融合在一起,为研究者分析用户行为,进行空间物品推荐带来了前所未有的机遇和挑战。空间物品推荐已经成为帮助用户探究自己所生活的地方、发现感兴趣的地点,辅助商家向目标用户投放广告的重要手段。 近年来,依托数据挖掘和机器学习技术,推荐系统在理论和实践上都获得了快速的发展,隐语义推荐模型在推荐精度上较传统的推荐方法有很大程度的提升。相比于其他推荐系统,在LBSNs中进行空间物品推荐有着时空方面的特点,数据也更加稀疏,因此越来越多的研究致力于挖掘地理位置因素、时间因素、内容因素等影响空间物品推荐的因子来提高推荐精度,但大多数研究都忽略了空间物品被签到的序列特征,且缺乏对多种因素的联合研究,没有一个通用的、可扩展的空间物品推荐模型。另外,随着用户认知的增长,用户兴趣时刻发生着变化,由于模型训练时间成本昂贵,当前大多数研究对于用户兴趣的捕捉都是静态的,他们不能够动态地追踪用户兴趣的变化,缺少实时性。 为了解决以上问题,本文提出了一个基于隐语义的空间物品推荐模型,用来改善空间物品推荐的效果和用户体验。具体来讲,本文深入研究了时间序列特征、地理位置影响、时间周期效应和语义因素在空间物品推荐中的作用,采用空间嵌入的方式高效地挖掘了空间物品在签到时的序列特征,同时提出了一个通用的、可扩展的隐语义模型同时集成上述四种影响因素来应对空间物品推荐中的数据稀疏性问题和冷启动问题。另外,为了追踪用户兴趣的动态变化,本文采用了一种指数衰减的方式来表示用户的动态兴趣,并研究了模型更新的优化问题。在真实的大型LBSNs数据集中的大量实验结果表明,文中提出的这种基于隐语义的空间物品推荐算法精度优于其他对比模型。本文还设计实验证明,与时间相关的特征因素,如时间序列特征和时间周期效应是影响人们日常签到活动最重要的因素。