论文部分内容阅读
随着在线旅游的蓬勃发展,网络游记成为主要的信息载体,是人们获取旅行目的地信息的重要来源。网络游记一般以文本图片等形式记录游客的出行时间和旅行目的地信息,并比较完整的记录了游客在旅行过程中的感受和认知,以其真实性、透明性和互动性,对潜在游客旅行目的地的选择和路线安排产生重大影响。本文以携程网攻略社区的游记文本为数据源,经筛选处理后,共选取以云南为旅行目的地的2007篇不同游客的游记,并且游记发表时间段为2016年10月至2017年9月。以游记中的景点为切入点,把游客作为研究对象,首先通过中文分词方法提取游记文本集合中的地点及景点名词共722个,然后以此为数据基础分析游客对云南省各景点的关注热度、偏好以及景点之间的共现效应两方面内容。本文基于网络游记文本集合的广度和深度,分别使用共现次数相同处理方法、TF-IDF关键词综合权重方法,分析与总结云南省各景点关注度的冷热均衡状况及其差异,并给出文中游客对景点热度感知的评估方法;通过建立景点稀疏矩阵和景点共现矩阵,分别采用关联规则算法与社会网络分析法,分析不同景点之间的多重及二重共现关联互动效应。研究结果显示,云南旅游景点在游客感知分析中存在冷热不均衡性。丽江为游客首要关注城市,大理、香格里拉次之,昆明、西双版纳、腾冲、普洱紧随其后;丽江古城为游客关注度最高的景点。对不同景点之间共现效应分析发现,高热度景点之间产生高度共现效应,形成以{云南,昆明,大理,大理古城,洱海,双廊,丽江,丽江古城,玉龙雪山}为核心的8重共现区域;低热度景点之间呈现分区域共现效应,分别形成丽江—香格里拉共现区域,昆明—西双版纳共现区域,大理景点位于两者之间起到桥梁作用,腾冲景点与大理景点之间的共现效应稍强但形成一个单独区域;中热度景点之间没有形成凸显的共现核心及分区域共现效应。