论文部分内容阅读
随着在线旅游业的迅速发展,越来越多的消费者选择在线订购旅游产品。然而在线旅游产品繁多,用户在选择旅游产品时面临着严峻的信息过载问题。个性化推荐系统能够有效缓解信息过载的问题,通过预测用户偏好和挖掘用户需求,为用户推荐合适的旅游产品,在增加用户满意度的同时提升了在线旅游运营商的竞争力,因此被广泛应用于在线旅游领域。旅游景点是在线旅游业最重要的产品之一,也是组成其它旅游产品的主要元素,因此旅游领域个性化推荐的研究主要针对旅游景点。
目前,大多数景点推荐方法都致力于提高推荐的准确性。然而,仅仅注重准确性的推荐系统往往会推荐用户经常购买的热门产品,导致推荐的产品缺乏多样性且非热门产品可见度低,产生过拟合问题。同时,由于在线旅游运营商无法向消费者推荐新颖的产品,他们可能会错失一些商机。研究表明提升推荐的多样性能够改善过拟合问题,提升用户的满意度。因此,本文聚焦于旅游景点推荐的多样性。现有的推荐多样性的相关研究存在着很多可改进的空间。首先,众多研究没有深入到具体领域,在定义推荐多样性时缺乏对项目属性特征的考虑,仅仅基于评分数据计算项目间的差异。其次,现有的提升推荐多样性的算法会造成推荐准确性的损失。
针对上述两个问题,本文首先提出了基于景点主题特征的推荐多样性定义方法,通过LDA模型提取景点的主题特征,计算景点间的主题差异性,景点推荐多样性是列表内景点主题差异性的均值。在此基础上,本文提出了考虑多样性和误分类成本的两阶段推荐模型,本文的方法基于传统的推荐方法进行优化,旨在提升旅游景点推荐多样性和准确性。最初,通过传统推荐算法计算景点的预测评分,评分最高的 M 个景点被选为初始推荐列表。在第一阶段,本文提出了考虑主题多样性的优化模型,基于用户偏好和景点主题多样性构建用户效用函数,通过最大化用户效用选择出T个候选景点。此步骤的目的是筛选出高度差异化的景点,以提高推荐的多样性。在第二阶段,为了平衡推荐的多样性和准确性,本文提出了考虑误分类成本的优化模型。基于对推荐系统错误分类类型和成本的分析构建优化模型,通过最小化误分类总成本选择 N 个景点作为最终推荐列表。
为了验证本文提出的两阶段推荐模型的效果,本文基于旅游领域代表性平台携程的数据进行了实验与分析。本文分别以概率矩阵分解算法和基于项目的协同过滤算法作为基准推荐算法进行实验,结果显示考虑多样性和误分类成本的两阶段推荐模型的推荐多样性和准确性都优于经典的推荐算法。同时,两阶段推荐模型的推荐效果优于先进的提升推荐多样性的算法。实验结果表明,本文提出的考虑多样性和误分类成本的两阶段推荐模型能够有效提升推荐效率,在提升推荐多样性的同时维持了较高的推荐准确性。
目前,大多数景点推荐方法都致力于提高推荐的准确性。然而,仅仅注重准确性的推荐系统往往会推荐用户经常购买的热门产品,导致推荐的产品缺乏多样性且非热门产品可见度低,产生过拟合问题。同时,由于在线旅游运营商无法向消费者推荐新颖的产品,他们可能会错失一些商机。研究表明提升推荐的多样性能够改善过拟合问题,提升用户的满意度。因此,本文聚焦于旅游景点推荐的多样性。现有的推荐多样性的相关研究存在着很多可改进的空间。首先,众多研究没有深入到具体领域,在定义推荐多样性时缺乏对项目属性特征的考虑,仅仅基于评分数据计算项目间的差异。其次,现有的提升推荐多样性的算法会造成推荐准确性的损失。
针对上述两个问题,本文首先提出了基于景点主题特征的推荐多样性定义方法,通过LDA模型提取景点的主题特征,计算景点间的主题差异性,景点推荐多样性是列表内景点主题差异性的均值。在此基础上,本文提出了考虑多样性和误分类成本的两阶段推荐模型,本文的方法基于传统的推荐方法进行优化,旨在提升旅游景点推荐多样性和准确性。最初,通过传统推荐算法计算景点的预测评分,评分最高的 M 个景点被选为初始推荐列表。在第一阶段,本文提出了考虑主题多样性的优化模型,基于用户偏好和景点主题多样性构建用户效用函数,通过最大化用户效用选择出T个候选景点。此步骤的目的是筛选出高度差异化的景点,以提高推荐的多样性。在第二阶段,为了平衡推荐的多样性和准确性,本文提出了考虑误分类成本的优化模型。基于对推荐系统错误分类类型和成本的分析构建优化模型,通过最小化误分类总成本选择 N 个景点作为最终推荐列表。
为了验证本文提出的两阶段推荐模型的效果,本文基于旅游领域代表性平台携程的数据进行了实验与分析。本文分别以概率矩阵分解算法和基于项目的协同过滤算法作为基准推荐算法进行实验,结果显示考虑多样性和误分类成本的两阶段推荐模型的推荐多样性和准确性都优于经典的推荐算法。同时,两阶段推荐模型的推荐效果优于先进的提升推荐多样性的算法。实验结果表明,本文提出的考虑多样性和误分类成本的两阶段推荐模型能够有效提升推荐效率,在提升推荐多样性的同时维持了较高的推荐准确性。