关于蚂蜂窝旅游数据的交互式分析

来源 :电脑迷·中旬刊 | 被引量 : 0次 | 上传用户:zjcmlyj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:为了分析世界各地旅游景点的地理位置分布,热度,评分,属性(风景区,娱乐景点,购物景点)以及主题(亲子游,情侣游,家庭游,朋友游,独自游),我们爬取了54个国家和516个城市的名称和经纬度,以及5016个景点的名称、属性(风景区,娱乐景点,购物景点)、主题(亲子游,情侣游,家庭游,朋友游,独自游)、评价数量、评价星级,并分别设计了地图、气泡图、雷达图和排名图来展现这些信息,最后通过Echarts和百度地图API等来实现交互式分析图像。
  关键词:马蜂窝;旅游;数据;交互式分析;Echarts;百度地图API
  1 背景
  随着生活质量的提高,人们对旅游的需求日益增大。各种旅游相关的app如马蜂窝、去哪儿、携程、驴妈妈等应运而生。市场上与旅游有关的app玲琅满目,其中用户满意度最高的当属马蜂窝。马蜂窝自由行是中国领先的自由行服务平台,其一大特色就是平台上所发布的点评均来自上亿用户的真实分享,每年帮助过亿旅行者制定自由行方案,广受年轻一代的追捧,被誉为中国的旅行圣经。
  2 数据说明
  我们爬取了54个国家和516个城市的名称和经纬度,以及5016个景点的名称、属性(风景区,娱乐景点,购物景点)、主题(亲子游,情侣游,家庭游,朋友游,独自游)、评价数量、评价星级。
  马蜂窝网站的全球目的地在同一个页面(http://www.mafengwo.cn/mdd/)显示,我们爬取了所有带有hot标签的国家。
  在该国家->目的地->热门城市页面,我们爬取了每个国家的热门城市。
  在该城市->目的地->景点页面,我们爬取了每个城市的热门风景区;在该城市->目的地->娱乐页面,我们爬取了每个城市的热门娱乐景点;在该城市->目的地->购物页面,我们爬取了每个城市的热门购物景点。
  在每个景点页面,我们爬取了短评中的评价星级和评价数量,以及游记中的同行人物。
  我们还利用了谷歌地图来获取所爬取的热门国家和热门城市的经纬度。
  3 研究内容描述
  我们主要通过四个交互式图像来分析世界各地旅游景点的地理位置分布,热度,评分,属性(风景区,娱乐景点,购物景点)以及主题(亲子游,情侣游,家庭游,朋友游,独自游)。
  3.1地图
  3.1.1所有国家
  在初始化界面,该地图展示了所有国家的地理位置信息和景点数量信息。
  该图以世界地图为背景,以中国为中心,每个圆圈表示国家,颜色表示该国家的景点数量。
  3.1.2某国家各城市
  用户能够通过对地图上国家的选取,更新地图,使其展示该国家的所有城市的地理位置信息和景点数量。
  更新后的地图同样以世界地图为背景,以该国为中心,每个圆圈表示该国家的城市,颜色表示该城市的景点数量。
  3.2排名图
  3.2.1所有国家
  在初始化界面,该排名图展示了综合风景区、购物景点和娱乐景点的热度排名前十和评分排名前十的国家。
  3.2.2某国家各城市
  用户能够通过对地图上国家的选取,在排名图上看到该国家的所有城市的信息。
  其中,该排名图展示了该国家综合风景区、购物景点和娱乐景点的热度排名前十和评分排名前十的城市。
  3.2.3某城市各景点
  用户能够通过对地图上城市的选取,在排名图上看到该城市的所有景点的信息。
  其中,该排名图展示了该城市综合风景区、购物景点和娱乐景点的热度排名前十和评分排名前十的景点。
  3.3气泡图
  3.3.1所有国家
  在初始化界面,每个气泡代表一个国家的一种属性。横坐标代表评分,纵坐标代表热度,气泡的大小代表该国家该属性的景点数量,气泡的颜色代表屬性。
  3.3.2某国家各城市
  用户能够通过对地图上国家的选取,在气泡图上看到该国家的所有城市的信息。
  其中,每个气泡代表该国家一个城市的一种属性。横坐标代表评分,纵坐标代表热度,气泡的大小代表该城市该属性的景点数量,气泡的颜色代表属性。
  3.3.3某城市各景点
  用户能够通过对地图上城市的选取,在气泡图上看到该城市的所有景点的信息。
  其中,每个气泡代表该城市一个景点的一种属性。横坐标代表评分,纵坐标代表热度,气泡的颜色代表属性。
  3.3.4某城市某景点
  用户能够通过对排名图上景点的选取,在气泡图上看到该景点的信息。
  该气泡代表该景点的一种属性。横坐标代表评分,纵坐标代表热度,气泡的颜色代表属性。
  3.4雷达图
  3.4.1所有国家的主题占比
  在初始化界面,雷达图显示了每个国家的景点中,各主题的占比情况。
  3.4.2某国家各城市的主题占比
  用户能够通过对地图上国家的选取,在雷达图上看到该国家的所有城市的信息,该图显示了该国家每个地区的景点中,各主题的占比情况。
  3.4.3某城市各景点的主题占比
  用户能够通过对地图上城市的选取,在雷达图上看到该城市的所有景点的信息。该图显示了该城市每个景点各主题的占比情况。
  3.4.4某城市某景点的主题占比
  用户能够通过对排名图上景点的选取,在雷达图上看到该景点的信息。该图显示了该景点各主题的占比情况。
  4 意义
  关于马蜂窝旅游书籍的交互式分析,无论是对游客还是对旅游公司都是受益无穷的。游客可以通过该交互式分析在面对纷繁的旅游信息时更加容易做出选择;旅游公司也可以通过该交互式分析针对各国家各地各景点的不同信息做出相应的商业化调整。
  参考文献:
  [1]How to Read a Visualization Research Paper.Visual and Interactive Computing Group, Computer Science Department,2010.5.
  作者简介:郑航(1997.1.1—),性别:女,民族:汉,籍贯:重庆大足,研究方向:计算机科学与技术。
其他文献
摘要:本文主要統计和分析了量子通信领域的专利数据,阐述了量子通信领域专利申请的发展趋势、国别状况以及全球申请人的相关情况,并对量子通信中的量子保密通信以及器件这两个重要分支作了具体分析。  关键词:量子通信;专利;申请;保密  1 概述  量子信息是量子力学与经典信息结合的产物,兼备二者的优点,包括量子通信和量子计算两部分。与传统的经典信息学一样,量子信息学也是研究信息的获取、传输、储存和保密及应
摘要:手写数字识别现有的比较流行的方法有基于神经网络的识别、KNN、以及SVM等。而本文基于R语言,首先将图片预处理得到灰度矩阵,与数字矩阵计算协方差矩阵,得到线性拟合模型;之后采用核回归和Nadaraya-Watson估计建立第二个模型,对比和分析两个模型的预测效果。  关键词: 协方差矩阵;线性拟合模型;核回归;Nadaraya-Watson;估计  1 相关研究工作  本文基于手写数字识别这
摘要:在汽车制动性能检测的时候部分重型车辆在检测站进行制动性能定期检测会出现差别大甚至误判的情况,本文分析了台式制动性能检测方法,并根据具体问题提出了解决方法。  关键词:重型汽车;制动性能;解决办法  在我国,汽车制动性能检测为强制性检测项目,规定制动性能不符GB7258-2017《机动车运行安全技术条件》要求的车辆禁止上路。但是由于制动试验台(仪)的规格、型号、测试原理等的不同,部分重型车辆在
琼瑶,台湾小说家、编剧、诗人、词作家。她从上世纪六十年代就开始创作歌词,直到今天依然笔耕不辍,共写下歌词近三百首,许多歌词例如《在水一方》、《一帘幽梦》、《烟雨蒙蒙
【摘要】色彩风景写生是色彩教学的重要部分,是学习色彩的必修课。在色彩风景写生教学中,要注重引导学生对绘画传统的学习,提高学生的自主审美意识,让学生学会正确的观察方法和建立适合自己的表达手段。在教学中应该因材施教,引导学生发展自己的绘画个性,帮助学生建立属于自己的美的世界。  【关键词】绘画个性;色彩教学;风景写生  色彩风景写生是学习色彩规律的必修课,是绘画创作的基础,是训练和提高色彩审美的感受力
伴随社会不断的进步和物质需求与精神文明的逐步提高以及日臻成熟和完善的建筑施工技术水平,同时,也因日益增多的人口与土地资源的矛盾,高层建筑物越来越多。  为了对建筑的安全性能提供严格保障,产生了针对高层建筑物的变形观测。所谓建筑物的变形观测就是对建筑物本身的水平位移观测、沉降观测、倾斜观测等等。沉降观测的意义是:能够有效的为工程施工质量和地基基础设计质量的评估提供依据,并能及时的反映出建筑体建造过程
期刊