论文部分内容阅读
随着移动定位技术和社交网络的快速发展,近年来出现了一大批地理社交网络(包括:基于位置的社交网络和基于活动的社交网络),如Foursquare,Facebook Places,Gowalla和Plancast,Yelp,Meetup,Douban Event等,人们在地理社交网络中可以随时随地通过智能终端获取当前所处的位置信息,并对感兴趣的地点进行签到以便在社交网络中留下个人足迹,分享功能则可以让用户将对当前位置的评价信息和个人体验分享给好友。地理社交网络是一种包含了用户、位置以及彼此交互信息的异构信息网络,本文将其称为异构地理社交网络(Heterogeneous Geo-Social Network,HGeo SN)。由于这种异构网络相比传统的社交网络具有信息类别多、网络结构复杂以及用户在异构网络中的活动行为的多样性,这些使得HGeo SN中的应用服务需求及种类也变得多样且复杂。因此,如何提出适用于这种异构地理社交网络的推荐技术是近年来亟需解决的问题。本文从HGeo SN的“类型化、半结构化、非显式化、层次化”特征出发,对异构地理社交网络中基于影响力的推荐技术进行了系统、深入的研究,主要工作如下:1.面向推荐问题的影响力模型的研究。影响力是一种复杂而微妙的力量,它控制着社交动态和用户在异构地理社交网络中的活动行为。了解异构地理社交网络中用户、位置如何相互影响,可以使各种应用受益,例如病毒式营销,推荐,信息检索等。以往的研究主要集中通过网络的局部中心性来量化影响力,忽略了在地理社交网络中,信息在网络中是伴随着用户、位置之间的交互有向传播的。因此,本文主要通过异构地理社交网络的拓扑中心性来定量学习网络中用户、位置间的影响力;充分考虑了HGeo SN中影响力与用户活动行为相关的复合相关性、传播性以及非对称性,提出了同构影响力量化模型和异构影响力量化模型。本文提出的影响力模型主要是基于地理社交网络中用户的签到活动行为建立的,该模型主要是对影响用户活动行为的内外因素进行的量化分析,对基于用户活动行为的推荐问题的研究具有重要的理论基础作用。2.基于影响力的好友推荐方法研究。人们依靠社交媒体来满足两个共同的需求(即社交需求和信息需求):与现实世界中的朋友保持联系和获得自己感兴趣的信息。传统的社交媒体好友推荐方法主要关注用户的社交需求,很少关注用户的信息需求,使得目标用户通过推荐系统得到的好友在信息获取上是无效推荐。本文提出了一种兼顾拓宽好友圈和信息获取需求的好友推荐算法。本文首先对网络中用户的行为偏好建立基于影响力的树形结构偏好模型;然后,提出了偏好相似度量化模型来衡量用户之间的相似度;其次,证明了兼顾拓宽好友圈和信息获取需求的好友推荐问题是一个NP-Hard问题,提出了偏好覆盖的好友推荐优化算法来降低问题的复杂度;最后,通过多目标优化学习框架,解决了偏好覆盖的好友推荐算法对聚合参数的敏感问题。真实数据上的实验表明本文提出的算法在保证了具有较好的推荐准确率的前提下,在信息丰富性上优于现有先进好友推荐算法。3.基于影响力的位置推荐方法研究。推荐系统是由用户、内容提供方(商家)和平台组成,然而,现有研究主要集中满足用户的服务需求。因此,如何在为目标用户推荐位置的同时,目标用户作为信息推广的种子节点,能够促进被推荐位置(商家)在地理社交网络中的影响范围。这是解决现有研究服务对象局部性的问题的关键。本文兼顾多个参与者服务需求,提出了一种商家信息推广驱动的位置推荐算法。本文首先提出了用户的异构活动模式;然后,根据位置推荐问题的复杂性,提出了适用于多种参与者服务需求的位置相关的偏好模型;其次,根据位置推荐的本质是在网络中增加推荐对象与位置之间的链接,引入异构影响力到推荐目标函数中,以刻画增加链接对被推荐位置影响力的增益作用;最后,根据推荐对象的种类,提出了面向用户的位置推荐算法和面向商家的位置推荐算法。实验表明:本文提出的算法在准确率和影响范围增益等评价指标上优于现有HGeo SN中先进的位置推荐算法。4.基于影响力的多类型内容推荐方法研究。由于地理社交网络中人们的活动行为是由时间、活动种类、活动位置组成的有向序列。并且,人们作为社交动物,参加群体活动是日常社交生活中不可缺少的一部分。由此,向用户推荐有向序列表示的活动及一起参加活动的伙伴是当下推荐系统的一项重要任务。然而,现有的推荐服务主要集中在活动组成中的单个元素的推荐。因此,本文提出了一种新的推荐范式:面向群体活动的多类型推荐,为服务对象推荐由活动、活动位置,活动伙伴组成的异构活动模式列表。首先,提出了用户群体的异构活动模式;然后,为了挖掘群体活动的决策过程,提出了影响群体活动行为的群体影响力模型和群体偏好模型;最后,根据用户群体的组建方式的不同,提出了面向用户和面向用户群体的多类型推荐算法。实验结果表明:虽然当前已有的面向群体活动的推荐算法大都属于单类型内容推荐算法,将本文提出的算法的推荐内容,分别与面向群体活动的单类型内容推荐算法相比,在准确率、召回率等评价指标上有明显的提高。