论文部分内容阅读
摘要:为了分析世界各地旅游景点的地理位置分布,热度,评分,属性(风景区,娱乐景点,购物景点)以及主题(亲子游,情侣游,家庭游,朋友游,独自游),我们爬取了54个国家和516个城市的名称和经纬度,以及5016个景点的名称、属性(风景区,娱乐景点,购物景点)、主题(亲子游,情侣游,家庭游,朋友游,独自游)、评价数量、评价星级,并分别设计了地图、气泡图、雷达图和排名图来展现这些信息,最后通过Echarts和百度地图API等来实现交互式分析图像。
关键词:马蜂窝;旅游;数据;交互式分析;Echarts;百度地图API
1 背景
随着生活质量的提高,人们对旅游的需求日益增大。各种旅游相关的app如马蜂窝、去哪儿、携程、驴妈妈等应运而生。市场上与旅游有关的app玲琅满目,其中用户满意度最高的当属马蜂窝。马蜂窝自由行是中国领先的自由行服务平台,其一大特色就是平台上所发布的点评均来自上亿用户的真实分享,每年帮助过亿旅行者制定自由行方案,广受年轻一代的追捧,被誉为中国的旅行圣经。
2 数据说明
我们爬取了54个国家和516个城市的名称和经纬度,以及5016个景点的名称、属性(风景区,娱乐景点,购物景点)、主题(亲子游,情侣游,家庭游,朋友游,独自游)、评价数量、评价星级。
马蜂窝网站的全球目的地在同一个页面(http://www.mafengwo.cn/mdd/)显示,我们爬取了所有带有hot标签的国家。
在该国家->目的地->热门城市页面,我们爬取了每个国家的热门城市。
在该城市->目的地->景点页面,我们爬取了每个城市的热门风景区;在该城市->目的地->娱乐页面,我们爬取了每个城市的热门娱乐景点;在该城市->目的地->购物页面,我们爬取了每个城市的热门购物景点。
在每个景点页面,我们爬取了短评中的评价星级和评价数量,以及游记中的同行人物。
我们还利用了谷歌地图来获取所爬取的热门国家和热门城市的经纬度。
3 研究内容描述
我们主要通过四个交互式图像来分析世界各地旅游景点的地理位置分布,热度,评分,属性(风景区,娱乐景点,购物景点)以及主题(亲子游,情侣游,家庭游,朋友游,独自游)。
3.1地图
3.1.1所有国家
在初始化界面,该地图展示了所有国家的地理位置信息和景点数量信息。
该图以世界地图为背景,以中国为中心,每个圆圈表示国家,颜色表示该国家的景点数量。
3.1.2某国家各城市
用户能够通过对地图上国家的选取,更新地图,使其展示该国家的所有城市的地理位置信息和景点数量。
更新后的地图同样以世界地图为背景,以该国为中心,每个圆圈表示该国家的城市,颜色表示该城市的景点数量。
3.2排名图
3.2.1所有国家
在初始化界面,该排名图展示了综合风景区、购物景点和娱乐景点的热度排名前十和评分排名前十的国家。
3.2.2某国家各城市
用户能够通过对地图上国家的选取,在排名图上看到该国家的所有城市的信息。
其中,该排名图展示了该国家综合风景区、购物景点和娱乐景点的热度排名前十和评分排名前十的城市。
3.2.3某城市各景点
用户能够通过对地图上城市的选取,在排名图上看到该城市的所有景点的信息。
其中,该排名图展示了该城市综合风景区、购物景点和娱乐景点的热度排名前十和评分排名前十的景点。
3.3气泡图
3.3.1所有国家
在初始化界面,每个气泡代表一个国家的一种属性。横坐标代表评分,纵坐标代表热度,气泡的大小代表该国家该属性的景点数量,气泡的颜色代表屬性。
3.3.2某国家各城市
用户能够通过对地图上国家的选取,在气泡图上看到该国家的所有城市的信息。
其中,每个气泡代表该国家一个城市的一种属性。横坐标代表评分,纵坐标代表热度,气泡的大小代表该城市该属性的景点数量,气泡的颜色代表属性。
3.3.3某城市各景点
用户能够通过对地图上城市的选取,在气泡图上看到该城市的所有景点的信息。
其中,每个气泡代表该城市一个景点的一种属性。横坐标代表评分,纵坐标代表热度,气泡的颜色代表属性。
3.3.4某城市某景点
用户能够通过对排名图上景点的选取,在气泡图上看到该景点的信息。
该气泡代表该景点的一种属性。横坐标代表评分,纵坐标代表热度,气泡的颜色代表属性。
3.4雷达图
3.4.1所有国家的主题占比
在初始化界面,雷达图显示了每个国家的景点中,各主题的占比情况。
3.4.2某国家各城市的主题占比
用户能够通过对地图上国家的选取,在雷达图上看到该国家的所有城市的信息,该图显示了该国家每个地区的景点中,各主题的占比情况。
3.4.3某城市各景点的主题占比
用户能够通过对地图上城市的选取,在雷达图上看到该城市的所有景点的信息。该图显示了该城市每个景点各主题的占比情况。
3.4.4某城市某景点的主题占比
用户能够通过对排名图上景点的选取,在雷达图上看到该景点的信息。该图显示了该景点各主题的占比情况。
4 意义
关于马蜂窝旅游书籍的交互式分析,无论是对游客还是对旅游公司都是受益无穷的。游客可以通过该交互式分析在面对纷繁的旅游信息时更加容易做出选择;旅游公司也可以通过该交互式分析针对各国家各地各景点的不同信息做出相应的商业化调整。
参考文献:
[1]How to Read a Visualization Research Paper.Visual and Interactive Computing Group, Computer Science Department,2010.5.
作者简介:郑航(1997.1.1—),性别:女,民族:汉,籍贯:重庆大足,研究方向:计算机科学与技术。
关键词:马蜂窝;旅游;数据;交互式分析;Echarts;百度地图API
1 背景
随着生活质量的提高,人们对旅游的需求日益增大。各种旅游相关的app如马蜂窝、去哪儿、携程、驴妈妈等应运而生。市场上与旅游有关的app玲琅满目,其中用户满意度最高的当属马蜂窝。马蜂窝自由行是中国领先的自由行服务平台,其一大特色就是平台上所发布的点评均来自上亿用户的真实分享,每年帮助过亿旅行者制定自由行方案,广受年轻一代的追捧,被誉为中国的旅行圣经。
2 数据说明
我们爬取了54个国家和516个城市的名称和经纬度,以及5016个景点的名称、属性(风景区,娱乐景点,购物景点)、主题(亲子游,情侣游,家庭游,朋友游,独自游)、评价数量、评价星级。
马蜂窝网站的全球目的地在同一个页面(http://www.mafengwo.cn/mdd/)显示,我们爬取了所有带有hot标签的国家。
在该国家->目的地->热门城市页面,我们爬取了每个国家的热门城市。
在该城市->目的地->景点页面,我们爬取了每个城市的热门风景区;在该城市->目的地->娱乐页面,我们爬取了每个城市的热门娱乐景点;在该城市->目的地->购物页面,我们爬取了每个城市的热门购物景点。
在每个景点页面,我们爬取了短评中的评价星级和评价数量,以及游记中的同行人物。
我们还利用了谷歌地图来获取所爬取的热门国家和热门城市的经纬度。
3 研究内容描述
我们主要通过四个交互式图像来分析世界各地旅游景点的地理位置分布,热度,评分,属性(风景区,娱乐景点,购物景点)以及主题(亲子游,情侣游,家庭游,朋友游,独自游)。
3.1地图
3.1.1所有国家
在初始化界面,该地图展示了所有国家的地理位置信息和景点数量信息。
该图以世界地图为背景,以中国为中心,每个圆圈表示国家,颜色表示该国家的景点数量。
3.1.2某国家各城市
用户能够通过对地图上国家的选取,更新地图,使其展示该国家的所有城市的地理位置信息和景点数量。
更新后的地图同样以世界地图为背景,以该国为中心,每个圆圈表示该国家的城市,颜色表示该城市的景点数量。
3.2排名图
3.2.1所有国家
在初始化界面,该排名图展示了综合风景区、购物景点和娱乐景点的热度排名前十和评分排名前十的国家。
3.2.2某国家各城市
用户能够通过对地图上国家的选取,在排名图上看到该国家的所有城市的信息。
其中,该排名图展示了该国家综合风景区、购物景点和娱乐景点的热度排名前十和评分排名前十的城市。
3.2.3某城市各景点
用户能够通过对地图上城市的选取,在排名图上看到该城市的所有景点的信息。
其中,该排名图展示了该城市综合风景区、购物景点和娱乐景点的热度排名前十和评分排名前十的景点。
3.3气泡图
3.3.1所有国家
在初始化界面,每个气泡代表一个国家的一种属性。横坐标代表评分,纵坐标代表热度,气泡的大小代表该国家该属性的景点数量,气泡的颜色代表屬性。
3.3.2某国家各城市
用户能够通过对地图上国家的选取,在气泡图上看到该国家的所有城市的信息。
其中,每个气泡代表该国家一个城市的一种属性。横坐标代表评分,纵坐标代表热度,气泡的大小代表该城市该属性的景点数量,气泡的颜色代表属性。
3.3.3某城市各景点
用户能够通过对地图上城市的选取,在气泡图上看到该城市的所有景点的信息。
其中,每个气泡代表该城市一个景点的一种属性。横坐标代表评分,纵坐标代表热度,气泡的颜色代表属性。
3.3.4某城市某景点
用户能够通过对排名图上景点的选取,在气泡图上看到该景点的信息。
该气泡代表该景点的一种属性。横坐标代表评分,纵坐标代表热度,气泡的颜色代表属性。
3.4雷达图
3.4.1所有国家的主题占比
在初始化界面,雷达图显示了每个国家的景点中,各主题的占比情况。
3.4.2某国家各城市的主题占比
用户能够通过对地图上国家的选取,在雷达图上看到该国家的所有城市的信息,该图显示了该国家每个地区的景点中,各主题的占比情况。
3.4.3某城市各景点的主题占比
用户能够通过对地图上城市的选取,在雷达图上看到该城市的所有景点的信息。该图显示了该城市每个景点各主题的占比情况。
3.4.4某城市某景点的主题占比
用户能够通过对排名图上景点的选取,在雷达图上看到该景点的信息。该图显示了该景点各主题的占比情况。
4 意义
关于马蜂窝旅游书籍的交互式分析,无论是对游客还是对旅游公司都是受益无穷的。游客可以通过该交互式分析在面对纷繁的旅游信息时更加容易做出选择;旅游公司也可以通过该交互式分析针对各国家各地各景点的不同信息做出相应的商业化调整。
参考文献:
[1]How to Read a Visualization Research Paper.Visual and Interactive Computing Group, Computer Science Department,2010.5.
作者简介:郑航(1997.1.1—),性别:女,民族:汉,籍贯:重庆大足,研究方向:计算机科学与技术。