论文部分内容阅读
近年来,文化旅游逐渐成为现代旅游业发展的主流之一。文化内涵是文化旅游景点的核心竞争力,文化旅游产品的竞争体现为文化的竞争。对景区景点描述文本按文化属性自动分类,是快速建设文化旅游信息服务知识库的重要途径之一。针对文化旅游信息过载问题,推荐技术在一定程度上可以帮助人们快速寻找到感兴趣的景区景点。然而,但现有的推荐算法并未考虑文化旅游景区景点中蕴含着文化背景或要素,无法推荐出特定文化属性的文化旅游景区景点。本文根据文化旅游景区景点描述文本非结构化的特点,提出了一种基于朴素贝叶斯的文化旅游景区景点描述文本自动分类方法,并针对现有推荐算法无法根据文化旅游的特点进行推荐的问题,设计并实现一个交互式文化旅游景区景点在线推荐系统。主要研究成果如下:1.分析总结了文本分类、推荐系统和词向量的相关理论和技术。首先,对文本分类问题进行简单的概述,重点分析了文本分类过程中所涉及的方法和技术,包括分词、去停用词、向量空间模型(VSM)、特征降维、常用的几种文本分类算法等。其次,重点论述了推荐系统的基本概念和基本模型,总结了经典的推荐算法、评价指标和推荐系统。最后,详细介绍了词向量、神经网络语言模型和word2vec等相关理论与技术。2.开展了基于朴素贝叶斯的文化旅游景区景点描述文本分类算法的研究。首先构建文化专题词库,通过向量空间模型将景区景点描述文本转换为向量,采用信息增益和词频-逆文档频率(TF-IDF)分别进行词汇特征的选择和权重的赋值。然后构建朴素贝叶斯分类器模型,实现了景区景点描述文本的自动分类。最后,通过实验对算法的性能进行评价。实验结果显示,本文提出的算法相比同类算法准确率更高。3.开展了交互式文化旅游景区景点在线推荐系统的研究。首先,通过对文化旅游景区景点描述文本进行命名实体识别和词频分析,选取文化专题主题词,并利用word2vec工具训练词向量模型。其次,通过词向量模型可以计算词汇之间的语义相似度,进而提出一种基于主题词与景点内容相似度度量的推荐算法。将景区景点描述文本向量表示为词向量的加权平均,提出一种基于景点内容相似度的推荐方法。之后,利用Django框架实现了一个交互式文化旅游景区景点在线推荐系统。最后,通过实例对系统进行分析和评价。分析结果表明,本文提出的交互式文化旅游景区景点在线推荐系统具有一定的新颖性和合理性,能够推荐出令旅游者满意的文化旅游景区景点。