论文部分内容阅读
随着信息技术的发展和互联网的普及,网络上的数据呈指数式增长,信息过载问题成为了用户获取信息的一大困扰。为了从海量的信息中发现用户的兴趣,满足用户个性化的信息需求,推荐系统应运而生。传统的协同过滤推荐多采用评分数据进行推荐,存在数据稀疏问题,限制了推荐系统的性能。知识图谱中存在丰富的知识,用于推荐系统中将会是有用的辅助数据,所以基于知识图谱的推荐越来越受到研究者的关注。本文对基于知识图谱的个性化景点推荐方法展开研究。通过构建旅游景点知识图谱,提取其中的实体向量,用于构建用户兴趣模型,然后融入到矩阵分解推荐模型中,从而提高景点推荐系统的性能。本文的主要研究内容如下:(1)基于本体的景点知识图谱构建。当前,中文领域还没有一个公用的景点知识图谱,需要根据需求自行构建。本文分析了领域知识图谱的构建方法,设计并实现了一种基于本体的景点知识图谱。首先根据本体的目的,寻找可复用本体,并进行概念和分类设计,定义类的属性,构建景点本体;然后,对数据源进行采集,根据本体指导景点知识抽取;设计了一种基于字符串和基于结构的实体对齐方法,分别从字符串和实体属性两个层面进行实体对齐;最后,将景点知识图谱存储在了Neo4j图数据库中。(2)设计了基于知识图谱的用户兴趣向量化方法。分析了常用的用户兴趣建模方法,它们不适用于基于知识图谱的用户兴趣建模。通过知识图谱的表示学习,将知识图谱中的知识向量化,在此基础上,提出了一种基于知识图谱中实体属性的用户兴趣向量化方法。对景点属性进行分析,发现了景点属性与用户兴趣之间存在关联。在知识图谱向量化的基础上,定义了景点属性的权重函数,结合历史访问景点的属性值,构建了用户兴趣向量,用以精确定位用户对景点属性的兴趣,用于后续的景点推荐。(3)提出了一种融合知识图谱的矩阵分解模型。通过分析协同过滤推荐方法,发现传统的协同过滤方法仅使用评分数据进行推荐,存在数据稀疏的问题。在用户兴趣向量化的基础上,计算用户偏好相似性,与用户隐式反馈协同进行矩阵分解,从而将知识图谱信息融入到矩阵分解模型中,弥补矩阵分解算法没有考虑景点属性信息的不足,缓解数据稀疏问题。通过对比实验验证,结果表明,本文提出的基于知识图谱的个性化景点推荐方法是有效的,与基准推荐方法相比,推荐的准确率和召回率都有了一定程度的提升。