论文部分内容阅读
旅游互联网应用的快速发展,产生了大量和旅游景点相关的评论信息。这些评论信息反映了游客实地旅行之后,关于旅游景点或服务的想法和偏好,并以不同的形式出现在博客、BBS或论坛网站等各种媒体,成为一种越发重要的经验信息载体,潜在游客也花费很多时间阅读在线评论协助旅行决策。但是,游客撰写评论信息有很多主观随意性,评论内容的价值良莠不齐,大量冗余信息严重干扰了潜在游客做出合适的旅行决策,形成了信息超载(Information Overload)问题。因此,有必要研究从海量的在线评论文本内容中,挖掘群体贡献的经验知识,再结合单个游客旅行偏好的关注点,使游客景点选择时,能够有效地利用群体智慧制定更加合理和个性化的旅行决策。游客旅游活动涉及吃、住、行、游、购、娱等多个方面,每个方面都具有海量的数据量。这些数据不仅包括文字和图片,还包括空间位置、旅游路径以及其他一些与地理空间位置相关的属性。因此,如何运用地理信息系统(Geographic Information System)对包含大量具有空间位置特征的旅游数据进行采集、储存、管理、运算、分析、显示和描述,为游客提供丰富的游客体验和个性化的旅游服务,已成为旅游业未来持续发展的必然要求。本文在阅读大量相关文献的基础之上,主要研究内容和成果如下:(1)基于游客实地旅行之后发表的评论数据,通过构建景点推荐指数数学模型,为游客提供个性化景点推荐。首先根据旅游在线评论的信息内容,一方面选取待推荐景点的评论数据,针对评论对象进行细粒度情感分析,另一方面选取待被推荐的目标游客历史评论数据,通过词频统计,抽取其评论对象的关注重点,然后结合个人偏好和群体智慧构建景点推荐指数,最后将景点推荐指数较高的景点推荐给游客。(2)提出一种顾及情感分析的基于标签的旅游推荐方法。首先在网页上爬取游客关注的景点评论内容信息,并将这些数据转换成合适的景点描述,同时分析目标游客历史的评论文档或描述,从而基于游客已评论的内容信息,提取游客的个人兴趣,然后分别建立景点画像的描述标签和游客画像的兴趣标签,最后通过对比考虑情感分析前后的基于标签的推荐算法性能,发现考虑情感分析后的算法具有较高的准确率。(3)针对游客旅游的业务需求,以游客个性化景点推荐的内容为重点,汲取开源的轻量级Struts2、Spring、Hibernate框架(或称为SSH)的集成策略,应用本文提出的推荐方法作为推荐引擎,从GIS技术与个性化推荐技术相结合的角度,完成了一个基于GIS的旅游推荐系统。推荐系统的用户功能主要有热门推荐、推荐指数、标签推荐、路线规划等,实现为游客提供智慧旅游信息服务。