论文部分内容阅读
随着移动互联网的发展,用户之间的交互变得越来越便捷,结合用户的线上和线下交互成为新的发展趋势。活动社交网络(Event-based social networks,EBSNs)通过结合用户的线上和线下交互在近几年得到迅速发展。与此同时,EBSNs的发展也为用户带来了严重的信息过载问题,即从EBSNs上找到用户感兴趣的活动正变得越来越困难。因此,活动推荐系统(event recommender systems)成为缓解EBSNs中信息过载问题的有效手段。与传统领域的推荐相比,活动推荐存在严重的冷启动问题。需要充分挖掘和利用EBSNs中丰富的上下文信息来缓解冷启动问题。此外,现有的活动推荐研究主要关注如何为单个用户进行推荐,忽略了用户通常以群组的形式参加活动,因此需要为多个用户构成的群组推荐感兴趣的活动。然而,用户偏好的多样性使得很难找到满足所有群组成员的活动,为群组活动推荐带来很大挑战。基于以上挑战,本文对活动社交网络中上下文感知的群组推荐方法进行了研究,旨在为EBSNs中的用户和群组提供准确高效的活动推荐服务。本文的主要内容和创新点总结如下:(1)将群组活动推荐问题形式化描述为排序学习问题,并提出一个基于排序学习的群组活动推荐框架。具体而言,首先分析了不同上下文因素对用户参加活动的影响,提取用户上下文偏好作为训练排序模型的输入。此外,提出了贝叶斯群组排序算法,能够在融合群组成员偏好的过程中自适应地为群组成员分配偏好融合的权重。在两个真实的活动社交网络数据集上的实验结果表明基于群组活动推荐框架的方法与现有方法相比在推荐准确度和效率上有显著提高。(2)首先通过数据分析发现活动主办方和活动内容之间存在显著的相关性,即相同主办方举办的活动之间的内容相似度比不同主办方举办的活动之间的内容相似度更高。基于这一结论,提出一个概率生成模型利用活动主办方和内容之间的相关性缓解活动文本内容的稀疏性,并通过发现活动内容主题和活动场地主题来准确提取群组的活动偏好。在该模型的基础上提出了的群组活动推荐方法。在两个真实的EBSNs数据集上的实验结果表明提出方法与现有的方法相比具有更高的推荐准确度。此外,提出的模型能够提取语义一致的潜在主题,增强了推荐的可解释性。(3)在真实的EBSNs数据集上分析了群组举办活动的时间分布,发现大量活动的举办时间呈现出明显的周期性规律。基于这一发现,提出了群组感知的周期主题模型,同时对群组依赖的周期活动和主题依赖的非周期活动建模。利用高斯混合模型作为周期活动的举办时间分布,使用多项式分布作为非周期活动的举办时间的分布。模型还考虑了活动举办地对用户决策的影响,从而能够同时对用户的活动兴趣和活动举办地的兴趣建模。在真实的EBSNs数据集上对实验结果表明,基于群组感知周期主题模型的方法比目前的方法具有显著优势。(4)提出了一种公平性和多样性感知的群组活动推荐方法。基于上下文计算活动相似度并构建活动相似度图。将相似度图上的加权覆盖度定义为次模函数,将公平性和多样性感知的群组活动推荐问题转化为最大化相似度图上的加权覆盖度问题,同时提高群组活动推荐的准确度、公平性和多样性。提出采用贪婪算法寻找加权覆盖度最大化的近似最优解。在真实数据集上的实验结果表明提出的方法比现有方法能够更好的平衡推荐准确度、公平性和多样性。