论文部分内容阅读
在旅游推荐算法的研究中,传统的基于内容的推荐方法通常只考虑游客偏好而忽略了游客的情感信息和景点的主题,因而会影响推荐的效果。基于上述不足,本文在设计旅游个性化推荐算法时,同时考虑到了游客偏好、旅游景点主题以及景点的主观评价这三个因素来促进推荐的效果。最后,通过从旅行网站上爬取景点和旅客信息构建数据集,来验证模型及推荐算法的有效性。本文工作具体如下:提出了基于跨域主题情感模型的旅游推荐算法。当使用旅游网站中纯文本信息进行景点推荐时,文本信息中“一词多义”和“一义多词”的特点容易造成语义丢失,并且若不考虑情感因素可能会造成特征区分度低。针对以上两个问题,本文设计了主题情感模型来挖掘旅游文本信息中的潜在主题和情感以及二者的耦合关系。另外,为了更好地模拟真实的旅游决策过程,本文将数据划分为用户域和景点域分别学习。在推荐中分别考虑了主题相似性、用户兴趣和景点大众评价以提升推荐准确度。实验结果表明,提出的模型泛化能力较强,推荐算法准确度较高。提出了基于多模态情感感知的旅游推荐算法。当使用旅游网站中的多模态数据进行景点推荐时,数据中文本、情感和图像信息很难进行有效地融合。针对这个问题,本文设计了多模态情感感知模型,该模型是一种贝叶斯三层模型,通过同时建模学习文本、情感、图像三个模态的数据,不仅能分别得到单一模态的数据分布情况,还可以同时学习到不同模态之间的关系。利用此模型进行的推荐算法同时考虑了“多模态数据应用”、“游客真实偏好”、“景点客观评价”、“旅游主题”四个旅游推荐的重要因素。实验结果表明,该算法的推荐效率远远高于传统多模态推荐方法中分别学习不同模态数据再综合算分的方法。构建了用于训练旅游个性化推荐算法的多模态数据集。本文通过网络爬虫技术,从旅游社交网站TripAdvisor上爬取了14,648个游客信息和8724个景点信息,并经预处理,分别构建了用户域和景点域的多模态数据集。其中,旅客信息中包含45万余条文本评论和14万余条图像数据,景点信息中包含39万余条文字评论和8万余条图像数据。