论文部分内容阅读
摘要:本文在对枢纽机场的航线组织和旅客流向分析研究的基础上,明确枢纽机场中转航线特征参数,提出一种基于K均值聚类方法的枢纽机场航线特征数据获取方法,并以迪拜国际机场为例进行分析。研究结果显示,结合适宜的特征指标,K均值聚类方法可有效的完成航线归类、凸显航线特征,为航空公司和机场打造枢纽网络、发现潜在市场提供有益的决策辅助。
关键词:枢纽机场;航线组织;K均值聚类
引 言
随着航空业的快速发展,为提高航线网络通达性、旅客出行效率和便捷度以及运营收益水平,航空公司和机场开始逐步构建适宜的航线网络模式[1]。中枢辐射式航线网络逐渐成为大型航空公司及枢纽机场共同打造的航线运营模式,由此崛起了美国亚特兰大、德国法兰克福、新加坡等重要的枢纽机场,为航空公司、机场等相关产业带来了显著经济效益,推动了地方发展。国内外学者在枢纽机场的形成和构建[2]、航线网络特征[3]、旅客行为特征[4]以及枢纽机场的竞争力评估[5]等方面做了广泛而深入的研究,但关注中转航线布设与旅客O&D倾向关系的研究较少。因此,本文着眼于枢纽机场中转的旅客人数及O&D倾向,采用K均值聚类方法分析该机场航线设置状况,为运营枢纽航线网络的航空公司在新航线开设以及已有航线加密时提供决策辅助。
1 枢纽机场航线组织及旅客流向
枢纽机场是中枢辐射式航线网络的航线汇集节点。由于区位、规模和运营目标的差异,枢纽机场的航线汇集模式可以分为“哑铃式”和“星形辐射式”,分别具有不同的旅客流向特征。“哑铃式”为枢纽机场汇集周边中小机场的短程航线的旅客,集中导向至有限数量的其它远程枢纽机场;“哑铃式”航线的日单向客流和航程有明显的差异层级。“星形辐射式”航线网络将各方向机场的旅客汇集至枢纽机场,再发散至其它方向的机场;“星形辐射式”航线的日单向客流和航程没有明显的差异层级。
从旅客角度出发,相对于直飞航线,中转通常意味着一定程度的绕行,甚至迂回。如图1所示。
图1显示了一种“哑铃式”中枢辐射式航线网络,其中和为枢纽机场,和为非枢纽机场,由、经前往显然比直飞至路程更远,而经前往还有逆向路程,产生了迂回。由此可定义绕行系数和迂回系数来表征上述情况:绕行系数为中转完成的路程与直线路程的比值,在图1中、间的绕行系数即;迂回系数为由中转路线与直线构成的三角形中直线段对角的余弦值加1,在图1中、间的迂回系数即+1,可知迂回系数大于1时会产生逆向路程。
2 K均值聚类方法
聚类分析是一种无监督学习方法,可将一组数据按照其隐含的结构,自动归结为多个具有一定内部相似度的簇,从而获得数据内部的分布规律。K均值聚类是一种易操作的聚类分析方法,可用于大规模的数据分析[6]。
對于给定数据集,假设其中每个样本是维向量,K均值聚类方法的目标是将个样本划分成个簇,并使簇内各点的方差和最小,如式(1)所示,式中各簇所有点的均值为。将各簇的方差和取平均即为成本函数。
K均值聚类方法具体实施步骤为:
I.在数据集中选择个样本,将个样本值作为各簇初始的聚类中心。
II.对数据集中所有的样本,依次计算到各簇中心的距离,通常可采用欧式距离。
III.找出点对应的最小距离簇心所在的簇,并将划入该簇。
IV.根据聚类结果,重新计算各簇的中心,即簇中所有点各自维度的算术平均数。
.V.将数据集中全部点按照新的簇中心完成步骤II的计算,重新实施聚类。
VI.重复步骤V直到聚类结果不再变化。
3 K均值聚类应用算例
本文选取2017年以迪拜机场(IATA:DXB)为中转点的旅客O&D数据。2017年迪拜机场旅客吞吐量达到8824万,世界排名第3,是位于中东地区的重要枢纽机场。对迪拜机场各中转航线组合中选取日单向客流大于10的航线组合共1433组,分别计算各航线组合的直线距离、绕行系数、迂回系数等数据,其统计结果显示迪拜机场中转航线的平均距离9202km,绕行系数1.11,日单向客流22,其中最大日单向客流230。
将数据规范化后的日单向客流、直线距离和绕行系数作为属性用于聚类分析。为判断合适的类别数量,分别取,分别聚类后计算其成本函数,结果显示在和时成本函数的下降趋势出现拐点,时成本函数值过大,时成本函数值变化不明显,因此分别将航线组合分为3类和5类进行聚类分析,其聚类结果分别如图2和图3所示,统计分析结果如表1所示,图中X轴为航线距离,Y轴为绕行系数,Z轴为日单向旅客数。。
由表1、图2可知,航线组合分为3类时,第1类为远程、低绕行系数航线,占总航线数的31%,该类航线平均航距最大,具有相对较高的日单向客流;第2类为中程、低绕行系数航线,占总航线数的51%,日单向旅客占总数的60%,日单向客流最高,是迪拜机场最主要的中转旅客来源;第3类为高绕行系数航线,占总航线数18%,日单向客流较少。可见迪拜枢纽机场的中转旅客的起讫点直线距离在7000-9000km左右,大多数旅客不会选择绕行距离过长的航线组合。
由表1、图3可知,航线组合分为5类时,第1类为远程、低绕行系数航线,占总航线数的26%,该类航线平均航距最大;第2类为中短程、低绕行系数航线,占总航线数的42%,日单向客流占总数的36%,是迪拜机场最主要的中转旅客来源;第3类为高日单向客流航线,尽管航线数目较少,仅占总航线数的9%,但平均日单向客流达到59人以上,日单向客流占总数的25%,仅次于第2类航线;第4类为短程、高绕行系数航线,占总航线数的2%,绕行系数均超过1.58;第5类为中长程、低绕行系数航线,占总航线数的20%。可见选择迪拜机场进行中转的旅客主要以中、长程旅途为主,绝大多数航线绕行系数较低。对于日单向客流较高的第3类航线做单独分析,其主要航线方向依次为南亚、东南亚至英国,西欧至泰国,南亚与中东等。
可见和时的聚类结果从不同颗粒度完成了迪拜机场中转航线的特征归类,并获得了较好的聚类结果。
4 总结
分析典型枢纽机场的航线特征是航空公司及机场打造、完善机场枢纽网络的重要工作。通过K均值聚类分析方法对枢纽机场航线的日单向客流、航线距离、绕行系数等特征进行自动归类,可以有效挖掘数据内部的信息,获取具有规律性的分析结果,可协助航空公司安排合适的时刻拼接有较大收益潜力的中转航线组合,提升中转效率,也可为逐渐成长的枢纽机场规划有针对性的航线网络、明确适宜的市场定位提供帮助,具有较好的可推广性。
参考文献:
[1]张军,都业富. 发展中枢辐射航线网络战略思考[J]. 中国民航学院学报,2004(S1):189-192.
[2]柏明国,朱金福,姚韵. 枢纽航线网络的构建方法及应用[J]. 系统工程,2006(05):29-34.
[3]冯程,董斌. 基于历史数据的机场网络特征分析[J]. 指挥信息系统与技术,2018,9(01):85-91.
[4]朱勐辉,朱星辉,闵捷,孔航,苏栋辉. 基于博弈论的中小机场旅客出行选择研究[J]. 哈尔滨商业大学学报(自然科学版),2018,34(03):359-364.
[5]陶莹,杨锋,刘洋,戴兵. K均值聚类算法的研究与优化[J]. 计算机技术与发展,2018,28(06):90-92.
[6]彭语冰,李艳伟. 枢纽机场竞争力评价研究[J]. 技术经济与管理研究,2011(09):11-15.
关键词:枢纽机场;航线组织;K均值聚类
引 言
随着航空业的快速发展,为提高航线网络通达性、旅客出行效率和便捷度以及运营收益水平,航空公司和机场开始逐步构建适宜的航线网络模式[1]。中枢辐射式航线网络逐渐成为大型航空公司及枢纽机场共同打造的航线运营模式,由此崛起了美国亚特兰大、德国法兰克福、新加坡等重要的枢纽机场,为航空公司、机场等相关产业带来了显著经济效益,推动了地方发展。国内外学者在枢纽机场的形成和构建[2]、航线网络特征[3]、旅客行为特征[4]以及枢纽机场的竞争力评估[5]等方面做了广泛而深入的研究,但关注中转航线布设与旅客O&D倾向关系的研究较少。因此,本文着眼于枢纽机场中转的旅客人数及O&D倾向,采用K均值聚类方法分析该机场航线设置状况,为运营枢纽航线网络的航空公司在新航线开设以及已有航线加密时提供决策辅助。
1 枢纽机场航线组织及旅客流向
枢纽机场是中枢辐射式航线网络的航线汇集节点。由于区位、规模和运营目标的差异,枢纽机场的航线汇集模式可以分为“哑铃式”和“星形辐射式”,分别具有不同的旅客流向特征。“哑铃式”为枢纽机场汇集周边中小机场的短程航线的旅客,集中导向至有限数量的其它远程枢纽机场;“哑铃式”航线的日单向客流和航程有明显的差异层级。“星形辐射式”航线网络将各方向机场的旅客汇集至枢纽机场,再发散至其它方向的机场;“星形辐射式”航线的日单向客流和航程没有明显的差异层级。
从旅客角度出发,相对于直飞航线,中转通常意味着一定程度的绕行,甚至迂回。如图1所示。
图1显示了一种“哑铃式”中枢辐射式航线网络,其中和为枢纽机场,和为非枢纽机场,由、经前往显然比直飞至路程更远,而经前往还有逆向路程,产生了迂回。由此可定义绕行系数和迂回系数来表征上述情况:绕行系数为中转完成的路程与直线路程的比值,在图1中、间的绕行系数即;迂回系数为由中转路线与直线构成的三角形中直线段对角的余弦值加1,在图1中、间的迂回系数即+1,可知迂回系数大于1时会产生逆向路程。
2 K均值聚类方法
聚类分析是一种无监督学习方法,可将一组数据按照其隐含的结构,自动归结为多个具有一定内部相似度的簇,从而获得数据内部的分布规律。K均值聚类是一种易操作的聚类分析方法,可用于大规模的数据分析[6]。
對于给定数据集,假设其中每个样本是维向量,K均值聚类方法的目标是将个样本划分成个簇,并使簇内各点的方差和最小,如式(1)所示,式中各簇所有点的均值为。将各簇的方差和取平均即为成本函数。
K均值聚类方法具体实施步骤为:
I.在数据集中选择个样本,将个样本值作为各簇初始的聚类中心。
II.对数据集中所有的样本,依次计算到各簇中心的距离,通常可采用欧式距离。
III.找出点对应的最小距离簇心所在的簇,并将划入该簇。
IV.根据聚类结果,重新计算各簇的中心,即簇中所有点各自维度的算术平均数。
.V.将数据集中全部点按照新的簇中心完成步骤II的计算,重新实施聚类。
VI.重复步骤V直到聚类结果不再变化。
3 K均值聚类应用算例
本文选取2017年以迪拜机场(IATA:DXB)为中转点的旅客O&D数据。2017年迪拜机场旅客吞吐量达到8824万,世界排名第3,是位于中东地区的重要枢纽机场。对迪拜机场各中转航线组合中选取日单向客流大于10的航线组合共1433组,分别计算各航线组合的直线距离、绕行系数、迂回系数等数据,其统计结果显示迪拜机场中转航线的平均距离9202km,绕行系数1.11,日单向客流22,其中最大日单向客流230。
将数据规范化后的日单向客流、直线距离和绕行系数作为属性用于聚类分析。为判断合适的类别数量,分别取,分别聚类后计算其成本函数,结果显示在和时成本函数的下降趋势出现拐点,时成本函数值过大,时成本函数值变化不明显,因此分别将航线组合分为3类和5类进行聚类分析,其聚类结果分别如图2和图3所示,统计分析结果如表1所示,图中X轴为航线距离,Y轴为绕行系数,Z轴为日单向旅客数。。
由表1、图2可知,航线组合分为3类时,第1类为远程、低绕行系数航线,占总航线数的31%,该类航线平均航距最大,具有相对较高的日单向客流;第2类为中程、低绕行系数航线,占总航线数的51%,日单向旅客占总数的60%,日单向客流最高,是迪拜机场最主要的中转旅客来源;第3类为高绕行系数航线,占总航线数18%,日单向客流较少。可见迪拜枢纽机场的中转旅客的起讫点直线距离在7000-9000km左右,大多数旅客不会选择绕行距离过长的航线组合。
由表1、图3可知,航线组合分为5类时,第1类为远程、低绕行系数航线,占总航线数的26%,该类航线平均航距最大;第2类为中短程、低绕行系数航线,占总航线数的42%,日单向客流占总数的36%,是迪拜机场最主要的中转旅客来源;第3类为高日单向客流航线,尽管航线数目较少,仅占总航线数的9%,但平均日单向客流达到59人以上,日单向客流占总数的25%,仅次于第2类航线;第4类为短程、高绕行系数航线,占总航线数的2%,绕行系数均超过1.58;第5类为中长程、低绕行系数航线,占总航线数的20%。可见选择迪拜机场进行中转的旅客主要以中、长程旅途为主,绝大多数航线绕行系数较低。对于日单向客流较高的第3类航线做单独分析,其主要航线方向依次为南亚、东南亚至英国,西欧至泰国,南亚与中东等。
可见和时的聚类结果从不同颗粒度完成了迪拜机场中转航线的特征归类,并获得了较好的聚类结果。
4 总结
分析典型枢纽机场的航线特征是航空公司及机场打造、完善机场枢纽网络的重要工作。通过K均值聚类分析方法对枢纽机场航线的日单向客流、航线距离、绕行系数等特征进行自动归类,可以有效挖掘数据内部的信息,获取具有规律性的分析结果,可协助航空公司安排合适的时刻拼接有较大收益潜力的中转航线组合,提升中转效率,也可为逐渐成长的枢纽机场规划有针对性的航线网络、明确适宜的市场定位提供帮助,具有较好的可推广性。
参考文献:
[1]张军,都业富. 发展中枢辐射航线网络战略思考[J]. 中国民航学院学报,2004(S1):189-192.
[2]柏明国,朱金福,姚韵. 枢纽航线网络的构建方法及应用[J]. 系统工程,2006(05):29-34.
[3]冯程,董斌. 基于历史数据的机场网络特征分析[J]. 指挥信息系统与技术,2018,9(01):85-91.
[4]朱勐辉,朱星辉,闵捷,孔航,苏栋辉. 基于博弈论的中小机场旅客出行选择研究[J]. 哈尔滨商业大学学报(自然科学版),2018,34(03):359-364.
[5]陶莹,杨锋,刘洋,戴兵. K均值聚类算法的研究与优化[J]. 计算机技术与发展,2018,28(06):90-92.
[6]彭语冰,李艳伟. 枢纽机场竞争力评价研究[J]. 技术经济与管理研究,2011(09):11-15.