论文部分内容阅读
移动互联网和在线支付的飞速发展,使得旅游这种体验式消费的购买方式,逐渐由线下转移到了线上。这也促使各大旅游网站成为了游客们交流旅游体验,发表对景区评价的重要平台。由此而形成的网络口碑,也成了影响潜在旅游者出行意愿的重要因素之一。同样,景区网络口碑也是景区管理者把握景区形象,及时调整景区经营管理方案的重要信息来源。因此,对景区网络口碑的挖掘分析对于景区管理者和景区潜在游客具有重要意义。本文针对江西省6个5A景区的网络口碑进行分析挖掘,利用特征情感分析建立了景区网络口碑综合评价体系。本文利用网络爬虫工具,从携程、同程和驴妈妈这三个主要的旅游网站抓取了江西省6个5A级景区2014-2016三年间共23300条评论数据。将原始数据利用R语言进行清洗和切词之后。对切分后的数据,利用LTP语言云依存句法分析组件进行依存句法分析,并从分析结果中筛选出30198个景区特征与游客情感态度组成的词对,其中共包含3340个景区特征词,1444个情感词。为了建立景区网络口碑综合评价指标体系,本文利用R语言建立LDA主题模型,提取评论中蕴含的18个共同主题,并根据其关联词特点进行归并,建立了景区网络口碑综合评价的三级指标体系。再将得到的特征情感词对归入11个三级指标,利用文本情感分析和语义相似度计算对特征情感词对的情感倾向做出判断,得出6个景区11个三级指标的好评率。为实现对景区网络口碑的综合评价,本文以11个三级指标包含的特征情感词对数量为依据,构建两两比较判断矩阵,利用层次分析法由最底层开始逐层计算相对权重。最后利用6个景区11个三级指标的好评率,进行逐级评价,得到江西省6个5A级景区的网络口碑综合好评率,由第一名到第六名依次为:龙虎山风景区、三清山风景区、井冈山风景区、景德镇古窑、婺源江湾景区、庐山风景区,且6个景区都在旅游资源和旅游整体体验方面表现非常好,但在景区消费和景区基础条件方面的口碑表现较差。最后根据得到的结论给出了提升江西省5A级景区网络口碑建设的12条建议。