论文部分内容阅读
以Facebook为代表的基于位置社交网络受到人们的广泛关注,这种新兴的社交网络在传统的社交网络基础上增加了地理位置,使得传统的在虚拟网络上的世界社交延伸到现实世界。通过基于位置的社交网络可以了解人们的地理位置,并且可以进一步地发现人们的生活模式、兴趣偏好等隐含信息。近年来,挖掘人们在生活中的兴趣爱好,提供个性化推荐服务成为学术界和产业界的研究热点之一。而传统的挖掘用户兴趣爱好的方法不能全面地了解用户兴趣特性,基于协同过滤的推荐方法在基于位置社交网络中推荐效果不理想。针对上述问题,本文根据用户的签到位置信息,以及签到的时间特性,提出一种新的发现用户长期兴趣爱好的方法,并根据兴趣偏好,同时考虑社交关系、空间位置关系等因素,提出一种新的个性化好友推荐模型。主要的研究内容总结如下:首先,为了根据签到位置信息挖掘用户的兴趣爱好,本文不是统计用户进行兴趣活动的次数,而是考虑进行兴趣活动的规律特性,避免了只根据次数可能会导致的所发现爱好的短期性问题。为发现规律特性,本文提出了模糊周期和模糊周期度的概念,以及模糊周期度的计算方法和改进算法。模糊周期指的是一种不严格的周期,表示现实生活中人们行为呈现的规律性,而不是理论研究的严格周期性;模糊周期度则表示规律特性的强弱。本文根据时间序列建立关于用户签到位置的布尔序列,通过布尔代数的方法计算模糊周期度,并进一步衡量模糊周期性。此外,针对可能产生的“伪规律性”问题,提出了模糊周期发现的改进算法。然后,为了根据用户的兴趣爱好完成个性化推荐,在基于位置社交网络的基础上,增加了用户兴趣,建立由三种异构顶点和三种关联边的三层网络,即多元异构社交网络MHSN。社交关系、空间位置以及兴趣爱好有机的联系起来,为完成后续的个性化好友推荐奠定基础。接着,本文提出了基于签到的用户兴趣爱好挖掘方法。用户的爱好包括长期爱好和短期爱好,本文主要发现用户的长期爱好。对于长期爱好,用户活动会呈现出一定规律性,因此不仅需要考虑用户进行兴趣活动的次数,还需要考虑用户进行兴趣活动的规律性。此外,对于没有签到记录的冷启动用户,本文采用社区发现的方法,根据与目标用户在同一个社区内的好友的爱好预测目标用户的爱好。之后,本文建立了考虑多因素的个性化好友推荐模型,推荐好友的好友与目标好友满足兴趣爱好相似、社交距离相近和空间位置相近三个条件。其中,为衡量推荐好友与目标用户的兴趣相似度,建立了兴趣爱好相似度计算模型;为了计算推荐好友与目标用户的社交距离,提出了基于共同好友和权值最大最长路径的社交距离计算方法;考虑到空间距离相近的推荐好友更容易推荐成功,提出了在签到数据稀疏的情况下的空间距离相近度计算方法。最后,本文使用真实的Foursquare数据进行了大量的实验与分析,实验结果表明:相比基于签到次数挖掘爱好,本文提出的基于规律性的兴趣爱好发现方法在准确率上具有明显优势,并且改进后的基于压缩的规律性发现方法明显优于改进之前。在个性化好友推荐模块,对比于两种传统的好友推荐方法:基于位置的协同过滤方法和基于兴趣偏好的协同过滤方法,本文提出的推荐模型准确率更高。总之,本文研究了基于位置社交网络基础上,用户的兴趣爱好挖掘以及个性化好友推荐问题,并分别提出了新的解决方案。理论分析与实验结果表明,与传统方法相比,本文方法在准确率方面具有明显优势。