基于隐语义的空间物品推荐算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:l447863596
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
城市的迅速扩展涌现出了大量的空间物品(POI,Points of interest),如餐馆、剧院、商场等,来提高人们的生活水平,人们越来越愿意去探究自己所生活的地方,依据自身的喜好来选择这些空间物品。随着Web2.0技术的高速发展,一系列基于位置的社交网络(LBSNs,Location-based social networks)出现了,例如国外的Foursquare、Yelp,国内的大众点评等,这些基于位置的社交网络维护着一个巨大的空间物品数据库,并允许用户通过智能手机在他当前的物理位置上进行“签到”,人们的线上数据和线下活动已经融合在一起,为研究者分析用户行为,进行空间物品推荐带来了前所未有的机遇和挑战。空间物品推荐已经成为帮助用户探究自己所生活的地方、发现感兴趣的地点,辅助商家向目标用户投放广告的重要手段。  近年来,依托数据挖掘和机器学习技术,推荐系统在理论和实践上都获得了快速的发展,隐语义推荐模型在推荐精度上较传统的推荐方法有很大程度的提升。相比于其他推荐系统,在LBSNs中进行空间物品推荐有着时空方面的特点,数据也更加稀疏,因此越来越多的研究致力于挖掘地理位置因素、时间因素、内容因素等影响空间物品推荐的因子来提高推荐精度,但大多数研究都忽略了空间物品被签到的序列特征,且缺乏对多种因素的联合研究,没有一个通用的、可扩展的空间物品推荐模型。另外,随着用户认知的增长,用户兴趣时刻发生着变化,由于模型训练时间成本昂贵,当前大多数研究对于用户兴趣的捕捉都是静态的,他们不能够动态地追踪用户兴趣的变化,缺少实时性。  为了解决以上问题,本文提出了一个基于隐语义的空间物品推荐模型,用来改善空间物品推荐的效果和用户体验。具体来讲,本文深入研究了时间序列特征、地理位置影响、时间周期效应和语义因素在空间物品推荐中的作用,采用空间嵌入的方式高效地挖掘了空间物品在签到时的序列特征,同时提出了一个通用的、可扩展的隐语义模型同时集成上述四种影响因素来应对空间物品推荐中的数据稀疏性问题和冷启动问题。另外,为了追踪用户兴趣的动态变化,本文采用了一种指数衰减的方式来表示用户的动态兴趣,并研究了模型更新的优化问题。在真实的大型LBSNs数据集中的大量实验结果表明,文中提出的这种基于隐语义的空间物品推荐算法精度优于其他对比模型。本文还设计实验证明,与时间相关的特征因素,如时间序列特征和时间周期效应是影响人们日常签到活动最重要的因素。
其他文献
TSP问题(traveling salesman problem)是一个组合优化方面的问题。它的定义很简单,求解难度却相当的大,吸引了许多包括数学、运筹学、物理、生物和人工智能等各个领域的研究者,
随着嵌入式系统在许多领域的广泛应用,用户对嵌入式系统的要求已经不仅仅停留在保证系统的实时性、紧凑性和高性能,对于可信性的要求也日益增加。系统的可信性包含安全性、可靠
随着互联网技术的高速发展和各种监控设备和传感器的普及,工业界开始面临海量的数据所带来的挑战,已经进入了大数据时代。在这些海量的数据当中,有一类数据叫做时间序列数据。时
并行DFT是解决大数据量DFT运算耗时过久的重要途径,在PC机群上实现并行DFT是一种低成本、高效率的解决方案.该论文首先介绍了并行计算的基本理论,然后介绍了计算机机群系统和
状态空间搜索是解决优化问题的常用方法之一,传统的状态空间搜索求解技术有回溯法和分支限界法以及隐式图搜索这些算法策略作为理论指导。这些策略的缺点是不够具体化,对每个特
如何进行对象持久化是在面向对象分析设计中需要解决的问题.该文通过对面向对象数据库技术及对象数据模型技术的实现目的和优劣的分析,分析了面向对象技术中的对象模型与关系
该文针对电信运营商迫切要求建设企业级经营信息数据仓库的应用背景,主要研究了数据仓库建模技术在电信行业中的应用.在介绍了有关课题背景之后,阐述了数据仓库和数据仓库建
无线网络具有可移动、成本低、效率高和易于部署的特点,使得无线网络得到了快速的发展和广泛的应用。无线网络协议中广泛存在着并发的、非确定的或者随机的行为,导致从一个初始
机场飞机动态监控是获取机场运行规律的重要手段,可用于异常报警,有着重要的军事意义。遥感技术的兴起和高速发展产生了遥感大数据,其中机场高分辨率遥感影像序列为监控机场飞机
数据库的规模急剧膨胀,数据库应用的不断深化,但是数据库管理系统却没有提供有效的工具和方法来利用这些数据,出现了数据丰富而知识贫乏的状况,导致了数据挖掘的出现。作为数据挖