论文部分内容阅读
[摘要]旅游产业是国民经济第三产业的重要组成部分,旅游业的发展直接代表了国民经济水平和消费能力,也同时带动其他行业健康发展。尤其对于新疆这样一个旅游资源丰富、民俗特色浓厚的地区,旅游业在新疆跨域式发展中的地位不可替代。以《新疆地区2012年统计年鉴》为引,利用R语言中的直观图示、聚类分析和主成分分析对新疆各地州旅游业数据进行多维标度分析,以此来了解和探究全疆旅游业发展的基本情况,为各地州旅游业发展提供科学参考。研究发现:乌鲁木齐在全疆各地州旅游业综合实力最强;地州和首府间旅游业发展现状差距很大,有待改善提高;伊犁地区居次的实例证明,政府和相关部门对旅游资源的良好管理开发对旅游业的发展更加重要;长途交通、商品销售、住宿是新疆地区旅游收入构成的重要成份,应给予高度重视。
[关键词]R语言 聚类分析 主成分分析 旅游业 新疆
[中图分类号] F59 [文献码] B [文章编号] 1000-405X(2014)-12-95-3
0引言
作为占到全国旅游资源83%的新疆,具有无以伦比的旅游资源优势,新疆境内共有景点1100余处,居全国首位。在这广阔大地上冰川雪岭与戈壁瀚海共生,自然景观独特,民俗风情浓厚,并素有歌舞之乡、瓜果之乡的美称。
独特的旅游条件决定了旅游产业始终应该被放在新疆经济发展中一个极其突出的位置来进行讨论。没有旅游产业的迅速发展,谈不上将丰富的旅游资源优势转化为经济资本,更谈不上旅游业带动其他各个行业的快速进步。天山北坡经济带、新丝绸之路、新亚欧大陆桥的发展更要求新疆地区的旅游产业提高到新的更高水平,因此,了解和探究目前新疆旅游业发展都是具有重要研究价值和客观意义的。本文基于这一迫切研究的问题,利用R语言中的多元统计方法对新疆地区各地州旅游业数据进行分析,以此来了解和探究全疆旅游业发展的基本情况,为新疆旅游产业发展提供科学参考。
1数据与分析方法
1.1多元统计数据的直观表示
利用饼图、箱尾图、及星相图分别对新疆地区接待国外人数、旅游收入构成和各地州市旅游设施基本情况进行分析,对数据所反映的现实情况情况有个基本的认识。
其中,利用饼图对旅游收入构成进行分析,以了解新疆地区旅游收入的构成情况,能够更加有的放矢的调整旅游收入来源,抓住重点,弥补弱势;利用箱尾图和星相图对新疆地区各地州市境内旅游的寡众情况进行分析;了解并比较各地州市旅游资源配置的基本情况;分析和对比新疆地区旅游业各州市入境旅游收入,得出各地州市旅游质量认可度的评价,从而可以在后期旅游设施的改善、旅游特色的凸显上等开展指导工作。
(1)饼图分析
通过对已成饼图的分析,得出以下结论:①2011年新疆地区旅游收入构成的前三位分别为:商品销售、长途客运(民航、铁路和汽车)、其他服务;②2011年新疆地区旅游收入构成的后三位分别为邮电通信、游览和市内交通;③商品销售远大于长途交通收入(45%),可知2011年旅游业的主要收入来源是旅游商品的销售。旅游部门应该同传媒、工商等部门更好的在旅游商品上下力气,提高新疆地区旅游产品的推广度、质量和特色。④2012年新疆地区旅游收入与2011年相比,前三位构成分别为长途交通、商品销售、住宿,变化最大的是长途交通费用,其中民航占比较大,说明民航产业助推了旅游业,内地赴新疆的旅游者正在从火车出行向民航出行转变;⑤2012旅游收入构成最小的后三位依旧是市内交通、游览和邮电通信,和2011年一致,说明这三项在旅游产业的收入构成并不占据主导地位;⑥住宿的异军突起说明来疆旅游者显著增多,他们没有固定居所,只能住在旅馆酒店,相关部门应该抓住时机,做好景区住宿条件的改善、规范、提高等工作。
(2)箱尾图及均值条图
从均值条图来看,經过对9个评价指标的平均,乌鲁木齐市均值领军性的在表中凸显出来,随之紧跟的是伊犁州和伊犁州直属县市,接下来是吐鲁番地区、阿勒泰地区、巴州和喀什地区,剩余地州市水平近似相同,差异不明显。
应该看到的是多个地州和乌鲁木齐的巨大差异,相反,新疆最具有人文地理特色、独特自然景观的地州并没表现出当地所具有的旅游资源优势,这应该是值得旅游从业者思考和讨论的问题。
从箱尾图来看,在九个评定指标中,国内旅游收入远远偏离其他指标,说明了国内旅游收入在新疆旅游收入中的重要性;同时,居次的2012入境旅游收入,说明,随着开放化程度的提高,新疆已被越来越多的外籍人士所青睐。
(3)星相图
从星相图来看,基础分析结果和均值条图大相径庭,但又能说明新的问题。从星相图的结构来分析,乌鲁木齐依旧在全疆旅游业表现最为突出,接下来是伊犁州和伊犁州直属,再接下来是吐鲁番地区、阿勒泰地区、巴州和喀什地区;表现最不明显的是克拉玛依市、石河子市、哈密地区、塔城地区、博州、克州和和田地区,几乎成了一个小点。
这就说明居尾的几个地州各个指标数值相比乌鲁木齐市是趋于零的,并且指标同质化、蜕化现象严重,没有突出指标,缺乏峰值。从星相图各角代表的意义来看,乌鲁木齐相对规则,但伊犁州和伊犁州直属则长短不一,指标变化较明显,说明该地区应该调整旅游产业中相关投入重点,避免出现不均衡、差异化愈发严重的现象,此特点在喀什地区、巴州、吐鲁番地区和阿勒泰地区表现更加明显,亟待改善。
1.2聚类分析和主成分分析
聚类分析的思想是认为所研究的样品或指标之间存在着不同程度的亲疏关系,将具有较大相似性的对象归为一类,并将差异较大的个体归入不同的类,这一思想即通常所说的“物以类聚”。通过对新疆地区各地州市旅游业基本情况进行聚类分析,宏观地根据各地州市的旅游业进行差异化分类,通过聚类的核心特色,凸显出各地州市中旅游产业类型相似及差异较大的地区,以此讨论各地州旅游业发展情况。 主成分分析的思想是设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关、并代表原有指标的综合指标。主成分分析的目的是对新疆地区各地州的旅游情况进行一个初步的认识和了解,由于目前指标仅限于各地州市的出入境收入、入境人数和最基本的旅游设施统计数据,故可能在数据量的寡众方面并不能凸显主成分分析化繁为简的优点,但这并不影响主成分分析的结果,分析依旧可以得出全疆各地州市的旅游资源配置、旅游质量、旅游认可度的排名情况。
2结果分析
2.1聚类分析成果(宏观分析,区域划分)
从ward聚类结果分析来看,新疆地区各地州旅游业可以分为四类,结果和此前的基本分析结论一致。从结果来看,乌鲁木齐作为全疆的政治、经济、科技、文化中心,旅游业资源配置和旅游质量监管实力都是最强的。第二类的伊犁州和伊犁州直属得益于其优越的峡谷气候和独特的自然景观,同时当地交通便捷、民俗风情浓厚,成为了北疆旅游带中的代表。第三类的几个地区都具有非常独特的旅游资源,比如吐鲁番(坎儿井)、巴州(巴音布鲁克大草原)、阿勒泰(喀纳斯湖)、喀什(维吾尔民居)、阿克苏(克孜尔千佛洞)等,但这几个地区都没有体现出应有的资源优势,或者说对景区的开发和宣传力度非常弱,使得先天旅游优势有所埋没。
从complete聚类分析来看,划分标准的差异可能对结果影响较大。乌鲁木齐市综合旅游实力始终较强,从反面来看,地州旅游业和乌鲁木齐始终保持着较大的差距。在变化划分依据时,伊犁州和伊犁州直属在地州城市脱颖而出,再次印证了西天山旅游资源的丰富独特及其巨大的吸引力。
从各地州旅游局官网可以看出,伊犁州旅游定位十分明确,对西天山库尔德宁保护区、特克斯等保护区的后续管理建设和开发合理有效。而反观其他地州政府网站,多集中在农林畜牧和投资等方面,个别出现窗口排版混乱。这就给了全疆旅游业一个重要的启示,旅游业的发展不仅仅取决于原有的自然地理景观条件,相关管理部门的后期开发规划管理工作的重要性是不言而喻的。
2.2主成分分析成果(微观分析,综合排名)
利用主成分分析提取主要成分,然后进行相应的分析。
第一主成分Comp1主要由客房、床位、入境旅游收入、国内旅游收入、星级酒店、1995入境人数等决定,说明对于旅游业来说,这是衡量地区间旅游业发展差异化的重要因素。
第二主成分Comp2主要由2000入境人数、2012入境人数、旅行社数量来决定,反应地区间旅游的热度。
我们发现9个指标可以用两个综合指标代替,而综合指标的信息没有损失。在此基础上,我们不仅可以算出各城市的成分得分,而且可以利用线性加权方法, 計算各地州市旅游业发展水平。
排名发现,Comp1和Comp 2得分最高均为乌鲁木齐市。乌鲁木齐市处于第二象限,说明在旅游业发展水平和旅游热度表现较为优异。伊犁州和伊犁州直属也同时远离原点,这也说明伊犁地区独特的自然风光和浓厚的民俗风情在旅游业发展差异化中影响较大。同时发现,其他地州市均集中在comp2轴附近,距离原点较近,得分较低,导致排名落后,并且缺少突出的地区。说明其他地州市在这两个主成分方面没有突出表现,需要调整重点,缩小地区差异。
3结论
(1)2012年新疆地区旅游收入前三位为长途交通、商品销售、住宿,与2011年相比,民航产业占比高说明交通和旅游业相互助推的作用日益凸显;相关部门应着力做好这三个关键行业的规范和提高工作;
(2)新疆地区各地州旅游业可以分为四类,即第一类:乌鲁木齐市,第二类:伊犁州和伊犁州直属,第三类:吐鲁番地区、巴州、喀什地区、阿勒泰地区、阿克苏地区,第四类:昌吉州、石河子市、哈密地区、克州、塔城地区、博州、克拉玛依市、和田地区。
(3)乌鲁木齐旅游综合实力远高于全疆其他地州,说明首府居民生活水平的显著提高;伊犁州以外的其他地州和乌鲁木齐的差异巨大,最具地方特色的地州并没表现应有优势,是值得当地部门思考和改善的问题。
(4)伊犁地区旅游事业的突出表现证实,先天的自然地理景观优势固然重要,但后期管理部门对旅游资源的良好配置、对景区景点的规划管理、宣传推广更加重要;
(5)九个评定指标中,国内旅游收入远远高于其他指标,说明了国内旅游在新疆旅游收入占主导地位,应给予重视。
*基金资助:新疆大学精品课程《新疆地质概论》建设基金资助
参考文献
[1]方匡南,基于数据挖掘的分类和聚类算法研究及R语言实现,2007,暨南大学.第89页.
[2]赵毅等,R语言与.NET混合编程在重质油数据管理分析中的应用.计算机与应用化学,2012(04):第491-494页.
[3]王怀亮,基于R语言的多元数据统计图形可视化.企业导报, 2013(08):第283页.
[4]王艳华、蒋勇军,R数据统计分析语言及其在GIS中的应用.测绘科学, 2010(02):第175-177页.
[5]胡汤正,R语言在资源环境管理研究中应用的比较研究.中国地质大学学报(社会科学版),2014(s1):第173-175页.
[6]杨霞,吴东伟,R语言在大数据处理中的应用.科技资讯, 2013(23):第19-20页.
[7]曹洋,基于R语言的北京城乡居民最低生活保障聚类分析研究.社会福利(理论版),2013(02): 第26-30页.
[关键词]R语言 聚类分析 主成分分析 旅游业 新疆
[中图分类号] F59 [文献码] B [文章编号] 1000-405X(2014)-12-95-3
0引言
作为占到全国旅游资源83%的新疆,具有无以伦比的旅游资源优势,新疆境内共有景点1100余处,居全国首位。在这广阔大地上冰川雪岭与戈壁瀚海共生,自然景观独特,民俗风情浓厚,并素有歌舞之乡、瓜果之乡的美称。
独特的旅游条件决定了旅游产业始终应该被放在新疆经济发展中一个极其突出的位置来进行讨论。没有旅游产业的迅速发展,谈不上将丰富的旅游资源优势转化为经济资本,更谈不上旅游业带动其他各个行业的快速进步。天山北坡经济带、新丝绸之路、新亚欧大陆桥的发展更要求新疆地区的旅游产业提高到新的更高水平,因此,了解和探究目前新疆旅游业发展都是具有重要研究价值和客观意义的。本文基于这一迫切研究的问题,利用R语言中的多元统计方法对新疆地区各地州旅游业数据进行分析,以此来了解和探究全疆旅游业发展的基本情况,为新疆旅游产业发展提供科学参考。
1数据与分析方法
1.1多元统计数据的直观表示
利用饼图、箱尾图、及星相图分别对新疆地区接待国外人数、旅游收入构成和各地州市旅游设施基本情况进行分析,对数据所反映的现实情况情况有个基本的认识。
其中,利用饼图对旅游收入构成进行分析,以了解新疆地区旅游收入的构成情况,能够更加有的放矢的调整旅游收入来源,抓住重点,弥补弱势;利用箱尾图和星相图对新疆地区各地州市境内旅游的寡众情况进行分析;了解并比较各地州市旅游资源配置的基本情况;分析和对比新疆地区旅游业各州市入境旅游收入,得出各地州市旅游质量认可度的评价,从而可以在后期旅游设施的改善、旅游特色的凸显上等开展指导工作。
(1)饼图分析
通过对已成饼图的分析,得出以下结论:①2011年新疆地区旅游收入构成的前三位分别为:商品销售、长途客运(民航、铁路和汽车)、其他服务;②2011年新疆地区旅游收入构成的后三位分别为邮电通信、游览和市内交通;③商品销售远大于长途交通收入(45%),可知2011年旅游业的主要收入来源是旅游商品的销售。旅游部门应该同传媒、工商等部门更好的在旅游商品上下力气,提高新疆地区旅游产品的推广度、质量和特色。④2012年新疆地区旅游收入与2011年相比,前三位构成分别为长途交通、商品销售、住宿,变化最大的是长途交通费用,其中民航占比较大,说明民航产业助推了旅游业,内地赴新疆的旅游者正在从火车出行向民航出行转变;⑤2012旅游收入构成最小的后三位依旧是市内交通、游览和邮电通信,和2011年一致,说明这三项在旅游产业的收入构成并不占据主导地位;⑥住宿的异军突起说明来疆旅游者显著增多,他们没有固定居所,只能住在旅馆酒店,相关部门应该抓住时机,做好景区住宿条件的改善、规范、提高等工作。
(2)箱尾图及均值条图
从均值条图来看,經过对9个评价指标的平均,乌鲁木齐市均值领军性的在表中凸显出来,随之紧跟的是伊犁州和伊犁州直属县市,接下来是吐鲁番地区、阿勒泰地区、巴州和喀什地区,剩余地州市水平近似相同,差异不明显。
应该看到的是多个地州和乌鲁木齐的巨大差异,相反,新疆最具有人文地理特色、独特自然景观的地州并没表现出当地所具有的旅游资源优势,这应该是值得旅游从业者思考和讨论的问题。
从箱尾图来看,在九个评定指标中,国内旅游收入远远偏离其他指标,说明了国内旅游收入在新疆旅游收入中的重要性;同时,居次的2012入境旅游收入,说明,随着开放化程度的提高,新疆已被越来越多的外籍人士所青睐。
(3)星相图
从星相图来看,基础分析结果和均值条图大相径庭,但又能说明新的问题。从星相图的结构来分析,乌鲁木齐依旧在全疆旅游业表现最为突出,接下来是伊犁州和伊犁州直属,再接下来是吐鲁番地区、阿勒泰地区、巴州和喀什地区;表现最不明显的是克拉玛依市、石河子市、哈密地区、塔城地区、博州、克州和和田地区,几乎成了一个小点。
这就说明居尾的几个地州各个指标数值相比乌鲁木齐市是趋于零的,并且指标同质化、蜕化现象严重,没有突出指标,缺乏峰值。从星相图各角代表的意义来看,乌鲁木齐相对规则,但伊犁州和伊犁州直属则长短不一,指标变化较明显,说明该地区应该调整旅游产业中相关投入重点,避免出现不均衡、差异化愈发严重的现象,此特点在喀什地区、巴州、吐鲁番地区和阿勒泰地区表现更加明显,亟待改善。
1.2聚类分析和主成分分析
聚类分析的思想是认为所研究的样品或指标之间存在着不同程度的亲疏关系,将具有较大相似性的对象归为一类,并将差异较大的个体归入不同的类,这一思想即通常所说的“物以类聚”。通过对新疆地区各地州市旅游业基本情况进行聚类分析,宏观地根据各地州市的旅游业进行差异化分类,通过聚类的核心特色,凸显出各地州市中旅游产业类型相似及差异较大的地区,以此讨论各地州旅游业发展情况。 主成分分析的思想是设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关、并代表原有指标的综合指标。主成分分析的目的是对新疆地区各地州的旅游情况进行一个初步的认识和了解,由于目前指标仅限于各地州市的出入境收入、入境人数和最基本的旅游设施统计数据,故可能在数据量的寡众方面并不能凸显主成分分析化繁为简的优点,但这并不影响主成分分析的结果,分析依旧可以得出全疆各地州市的旅游资源配置、旅游质量、旅游认可度的排名情况。
2结果分析
2.1聚类分析成果(宏观分析,区域划分)
从ward聚类结果分析来看,新疆地区各地州旅游业可以分为四类,结果和此前的基本分析结论一致。从结果来看,乌鲁木齐作为全疆的政治、经济、科技、文化中心,旅游业资源配置和旅游质量监管实力都是最强的。第二类的伊犁州和伊犁州直属得益于其优越的峡谷气候和独特的自然景观,同时当地交通便捷、民俗风情浓厚,成为了北疆旅游带中的代表。第三类的几个地区都具有非常独特的旅游资源,比如吐鲁番(坎儿井)、巴州(巴音布鲁克大草原)、阿勒泰(喀纳斯湖)、喀什(维吾尔民居)、阿克苏(克孜尔千佛洞)等,但这几个地区都没有体现出应有的资源优势,或者说对景区的开发和宣传力度非常弱,使得先天旅游优势有所埋没。
从complete聚类分析来看,划分标准的差异可能对结果影响较大。乌鲁木齐市综合旅游实力始终较强,从反面来看,地州旅游业和乌鲁木齐始终保持着较大的差距。在变化划分依据时,伊犁州和伊犁州直属在地州城市脱颖而出,再次印证了西天山旅游资源的丰富独特及其巨大的吸引力。
从各地州旅游局官网可以看出,伊犁州旅游定位十分明确,对西天山库尔德宁保护区、特克斯等保护区的后续管理建设和开发合理有效。而反观其他地州政府网站,多集中在农林畜牧和投资等方面,个别出现窗口排版混乱。这就给了全疆旅游业一个重要的启示,旅游业的发展不仅仅取决于原有的自然地理景观条件,相关管理部门的后期开发规划管理工作的重要性是不言而喻的。
2.2主成分分析成果(微观分析,综合排名)
利用主成分分析提取主要成分,然后进行相应的分析。
第一主成分Comp1主要由客房、床位、入境旅游收入、国内旅游收入、星级酒店、1995入境人数等决定,说明对于旅游业来说,这是衡量地区间旅游业发展差异化的重要因素。
第二主成分Comp2主要由2000入境人数、2012入境人数、旅行社数量来决定,反应地区间旅游的热度。
我们发现9个指标可以用两个综合指标代替,而综合指标的信息没有损失。在此基础上,我们不仅可以算出各城市的成分得分,而且可以利用线性加权方法, 計算各地州市旅游业发展水平。
排名发现,Comp1和Comp 2得分最高均为乌鲁木齐市。乌鲁木齐市处于第二象限,说明在旅游业发展水平和旅游热度表现较为优异。伊犁州和伊犁州直属也同时远离原点,这也说明伊犁地区独特的自然风光和浓厚的民俗风情在旅游业发展差异化中影响较大。同时发现,其他地州市均集中在comp2轴附近,距离原点较近,得分较低,导致排名落后,并且缺少突出的地区。说明其他地州市在这两个主成分方面没有突出表现,需要调整重点,缩小地区差异。
3结论
(1)2012年新疆地区旅游收入前三位为长途交通、商品销售、住宿,与2011年相比,民航产业占比高说明交通和旅游业相互助推的作用日益凸显;相关部门应着力做好这三个关键行业的规范和提高工作;
(2)新疆地区各地州旅游业可以分为四类,即第一类:乌鲁木齐市,第二类:伊犁州和伊犁州直属,第三类:吐鲁番地区、巴州、喀什地区、阿勒泰地区、阿克苏地区,第四类:昌吉州、石河子市、哈密地区、克州、塔城地区、博州、克拉玛依市、和田地区。
(3)乌鲁木齐旅游综合实力远高于全疆其他地州,说明首府居民生活水平的显著提高;伊犁州以外的其他地州和乌鲁木齐的差异巨大,最具地方特色的地州并没表现应有优势,是值得当地部门思考和改善的问题。
(4)伊犁地区旅游事业的突出表现证实,先天的自然地理景观优势固然重要,但后期管理部门对旅游资源的良好配置、对景区景点的规划管理、宣传推广更加重要;
(5)九个评定指标中,国内旅游收入远远高于其他指标,说明了国内旅游在新疆旅游收入占主导地位,应给予重视。
*基金资助:新疆大学精品课程《新疆地质概论》建设基金资助
参考文献
[1]方匡南,基于数据挖掘的分类和聚类算法研究及R语言实现,2007,暨南大学.第89页.
[2]赵毅等,R语言与.NET混合编程在重质油数据管理分析中的应用.计算机与应用化学,2012(04):第491-494页.
[3]王怀亮,基于R语言的多元数据统计图形可视化.企业导报, 2013(08):第283页.
[4]王艳华、蒋勇军,R数据统计分析语言及其在GIS中的应用.测绘科学, 2010(02):第175-177页.
[5]胡汤正,R语言在资源环境管理研究中应用的比较研究.中国地质大学学报(社会科学版),2014(s1):第173-175页.
[6]杨霞,吴东伟,R语言在大数据处理中的应用.科技资讯, 2013(23):第19-20页.
[7]曹洋,基于R语言的北京城乡居民最低生活保障聚类分析研究.社会福利(理论版),2013(02): 第26-30页.