论文部分内容阅读
随着冬奥会进入“北京时间”和“3亿人参与冰雪运动”目标的不断推进,中国冰雪旅游发展已然进入了快速发展的轨道,成为旅游产业中的一大新兴产业,而滑雪旅游作为冰雪旅游的核心项目之一,也在逐渐褪去“贵族运动”的外衣,逐渐受到更多人的关注,但与此同时,滑雪旅游需求的增加对我国滑雪场的发展与经营水平也带来了巨大的挑战。游客作为滑雪旅游的体验者,其评论包含了巨量的信息,可用于衡量我国滑雪场的发展与经营水平,因此,利用文本挖掘技术,从游客感知角度探究影响雪场经营的因素具有重要意义。本文利用爬虫技术爬取了携程网、去哪网以及蚂蜂窝网等三个品牌旅游网站上游客对于滑雪场的评论数据,并运用词频分析、词云分析、情感分析、语义网分析等文本挖掘技术,基于游客的评论文本,从游客感知角度分析滑雪者对于雪场的整体感知形象及影响因素,再利用文本相似性算法对雪场进行分类,分析不同类别的滑雪场存在的共性问题,进而探究影响雪场经营的因素,并针对目前雪场经营过程中存在的问题提出合理性建议。首先,通过查阅官方数据,本文从滑雪人次发展现状以及滑雪场发展现状两个维度分析了我国滑雪产业的发展现状;其次,利用爬虫技术对滑雪场的评论数据进行了采集,主要爬取了携程网、去哪儿网、马蜂窝网三个品牌旅游网站,共爬取了 317家滑雪场的游客评论数据、评论时间等信息,共采集数据71725条,并对数据进行了分词、过滤停用词等预处理;然后,利用词云分析、情感分析等方法分析游客的人群行为特征以及游客对于雪场的感知形象及影响因素;最后,利用文本相似度算法,基于评论的差评数据对雪场进行分类,将存在共性问题的雪场分为一类,并利用词云分析、语义网分析分析每类雪场存在的具体问题并实现了可视化。通过以上分析,得出以下主要结论:(1)我国滑雪旅游产业发展迅速仍处于初期发展阶段,且滑雪者多为体验性滑雪者。(2)滑雪旅游的在线旅游发展业务发展缓慢。(3)滑雪出游的季节性差异过大,且目的地多为北方城市。(4)滑雪游客对雪场整体感知形象比较良好,但呈现出两极分化状态。(5)利用文本相似性算法,将雪场分为了 4类,问题分别集中在雪场基础设施建设水平较差、雪场管理水平较差、教练教学素质较差、工作人员服务态度差。并提出了以下建议:(1)推动滑雪旅游业的进一步发展,加强对青少年滑雪的培养力度。(2)推动滑雪产业在线旅游产品的发展。(3)结合各地方以及季节特色,打造特色滑雪旅游品牌。(4)推动相关政府部门,建设、健全滑雪产业规范及相关制度。(5)基于不同类型的雪场存在的共性问题分别提出了具有针对性的建议。