论文部分内容阅读
现代基于网络的商业行为规模巨大,由于产品或者实体的数量繁多,用户不可能一一去阅览,从而有可能遗漏掉很多对用户有价值的商品。推荐系统是信息过滤领域的一个子集,目的是预测用户对于物品的评分或者好感度,从而可以在用户没有接触过的物品中迅速地为用户找出他们可能最感兴趣的物品。随着网络数据量的持续大量增长,半结构化数据的使用率也在日益走高。作为一种贴近真实世界的数据表示方式,图模型可以表示多元及多重关系,并给许多以往的工作与面临的问题提供了一种新的解决方案。图数据模型能够将多种推荐方式统一到一个完整的模型中,并且形成一个具有统一标准的特征空间,并利用基于图的度量标准来推荐候选物品。现有的基于图的工作通常基于路径来建立数据的特征空间,往往只关注到一个物品对于描绘用户的影响。在如上所述的背景下,本文的主要工作是基于图数据模型深入研究提升推荐系统性能的方法。本文提出了组合特征的概念,更关注多种物品的组合对于用户画像构建的贡献。组合特征提出的基本动机是,以用户对应的部分物品的组合而非单个物品作为用户特征的构建基础时,具有更精确的推荐效果。在构建特征模式时,从物品集合以及与它们直接联系的节点构成的图中提取树模式作为特征。计算特征值时,利用物品集合的度中心性调节特征值。本文基于组合特征设计实现了基于用户的协同过滤方法与基于排序学习的方法。基于用户的协同过滤,有别于首先查找相似物品的基于物品的协同过滤,是以首先查找相似的用户为基础,然后再为用户构建推荐列表,更加便于基于组合特征构建特征空间。此外,传统的推荐方法在复杂物品的表示与处理、算法的可扩展性、用户及物品的冷启动、二元关系矩阵的稀疏性等问题上都一定程度地存在着瓶颈。而基于排序学习的算法将物品的相对次序考虑进优化过程之后,更加贴近求推荐列表时需要计算物品排序的基本问题。本文在组合特征的基础上进一步提出了用户-物品画像的构建方法,设计了基于排序学习的推荐方法。最后,根据所设计的两种推荐方法,本文实现了推荐系统原型,着重实现了其中的用户画像构建模块与推荐服务模块,验证了算法的有效性,以及基于组合特征对提高推荐精度的实际效果。