基于旅游大数据的景点位置识别与信息搜索研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:andykoy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展和社会经济的进步,旅游已经成为人们生活中不可或缺的一部分,人们对旅游信息服务的要求变得更加多样化,越来越多的人选择根据自己的需要,通过网络获取旅游景点的文字、图片等信息来为旅行做准备,也倾向于分享自己的旅游行程和旅程体验。因此基于旅游大数据的景点位置识别与信息搜索研究成为现在研究者关心和探索的热点,是帮助提高人们生活质量的重要方法。本文完成的主要工作如下:(1)结合景点评论文本数据的特点,利用动态主题模型提取景点在时间维度下的主题分布,有效地获得景点的主题分布与演化,建立了与景点相关的语义主题模型。训练得到景点在时间维度下的主题分布,在旅游信息搜索中引入时间信息,通过景点主题在时间维度上的变化来推测用户的搜索意图,可有效地提高景点信息搜索的准确率。结合游客拍摄的景点图片的GPS信息,利用聚类算法,得到景点图像的聚类中心,获得相应的热门景点位置,实现了景点图片位置信息的有效提取,获取了热门景点的分布信息。(2)提出了一种基于深度学习的景点图像位置识别的方法。利用卷积神经网络结构,提取图像的深度特征,将在视觉与地理位置上接近的图像集的交集作为候选集,结合查询图像特征与候选图像特征的相似度,对候选图像进行排序,得到在视觉语义和位置上与查询图像最相近的图像位置,作为查询图像的位置信息。在Flickr上爬取的北京地区景点图像数据集和European Cities景点地标图像数据集上进行实验,实验结果表明了基于深度学习的景点图像位置识别方法的有效性;与基于图像基本特征的方法和未考虑图像位置信息的方法作比较,基于深度学习的景点图像位置识别方法获得了更高的准确性,平均提高约15%。(3)提出了一种基于景点动态主题和搜索意图的旅游信息搜索方法。结合景点评论文本的特点,利用动态主题模型对景点提取出有效的语义主题模型,利用KL距离计算查询模型与文档模型之间的相似度,获取了有效的查询结果。结合景点评论数据和动态主题模型,通过景点主题在时间维度上的变化来推测用户的搜索意图,提高了景点信息搜索的准确率。结合搜索结果多元化的搜索方法,使搜索结果具有更多代表性的内容;通过搜索意图分类算法,解决了传统搜索方法对用户搜索意图理解不足的问题,从而提高了景点信息搜索的准确率。在北京地区的景点相关数据上进行实验,实验结果表明了结合景点主题和搜索意图的搜索方法的有效性,相比于基于关键词的搜索方法,搜索性能具有一定的提升。(4)设计和开发了基于旅游大数据的景点位置识别与信息搜索系统。该系统分为跨媒体旅游数据分析模块、基于深度学习的景点图像位置识别与搜索模块、基于景点主题与游客搜索意图的旅游信息搜索模块。使用JSP进行前端页面设计及展示,使用Struts 2框架完成前后端控制,完成了后端数据计算处理程序和算法的封装。本文结合数据挖掘算法及图像、文本搜索算法,为游客提供了较丰富和准确的旅游信息搜索功能,帮助游客获取到符合搜索意图的旅游信息,从而方便旅游计划的制定。
其他文献
脑出血发生2次以上称为再发性脑出血,它是1次出血后完全停止,血管又一次破裂而引起的出血。目前随着CT及MRI在临床的广泛应用及对脑出血机制研究的不断深入,再发性脑出血已受到
目的观察急性脑梗死后不同时期血清铁蛋白(serum ferritin,SF)、丙二醛(MDA)及超氧化物歧化酶(SOD)水平变化;观察抗自由基药物依达拉奉治疗后SF、MDA及SOD的变化及神经功能恢复情况。
本试验旨在研究布氏乳杆菌(LAB)、黑曲霉(AN)、热带假丝酵母(CT)、枯草芽孢杆菌(BS)与植物乳杆菌(LAP)组合对木薯渣品质的影响,筛选出发酵效果最优的混合菌组合。试验以木薯
基于"气虚宜掣引之"的理论阐述了"掣引"之法治疗溃疡性结肠炎的思路。"掣引"之法是指在本虚标实的情况下,采取挽回、导引阳气上升,补其气而升其阳的治法,以调畅气机令补而不滞。溃
随着社会对国贸专业应用型人才需求的不断增长,国贸专业“重理论、轻实践”的教学模式已无法满足社会发展对国贸人才的需求。从国贸专业实践教学改革的必要性、指导教师的重要