论文部分内容阅读
民航飞机的航空燃油消耗是航空公司运营成本的主要部分之一,航空燃油消耗产生的尾气排放也逐渐成为城市空气污染的一个重要因素,合理有效地控制航空燃油消耗,对降低航空公司运营成本和减少环境污染具有重要意义。降落阶段是飞行过程中最为复杂的阶段之一,相较于巡航阶段,对民航飞机的降落阶段进行合理规划和有效设计,将会产生良好的节油效果。为了探寻飞机在降落过程中的高度、重量、速度以及机场环境与航空燃油消耗之间的潜在关系,需要将航空燃油消耗数据划分成不同的类或者簇,并进行分类研究,为减少飞机降落过程燃油消耗相关决策提供合理化建议。因此,本文从航空公司可控因素与机场可控因素两个方面分别对飞机降落过程的燃油消耗进行了聚类分析研究。聚类方法是数据挖掘领域对数据进行分组或划分的一种重要方法,其依靠数据之间相关度对数据进行分析,找出其中相似的数据类型或数据集,并在无先验信息的情况下提取数据之间的相似性,从而实现从属性角度对数据集进行划分。作为一种应用广泛的聚类方法,K-means算法适合对海量数据进行聚类分析。而传统的K-means算法存在着聚类数目不易确定、易陷入局部最优以及聚类边界不易确定等问题,为解决这些问题,本文提出了一种改进的K-means算法,对飞机降落过程中的航空燃油消耗数据进行分析,并基于东方航空公司的波音737真实飞行记录数据进行了案例研究。本文的主要研究内容和创新点概括如下:(1)从紧密度、分离度和重叠度三个方面提出了一种新的聚类有效性评估指标。本研究聚类分析的数据源为民航飞机降落数据,存在连续性强、数据之间差异较小、不易确定类别大小等特点。传统聚类有效性指标通常只专注于聚合度和分离度中的一种属性,在被应用于民航飞机降落数据分析时难以很好地识别聚类过程中不同类之间的边界,从而难以确定不同类的范围大小和最佳聚类数目。本文在以往研究基础上同时考虑聚类结果的紧密度、分离度和重叠度,提出了一种综合度量聚类结果有效性的CPC聚类有效性指标。通过4组人工数值实验和4组真实值实验验证了所提出的CPC聚类有效性指标在确定聚类质量方面所具有的优势。(2)为处理具有连续性强、数据间差异较小等特点的数据,本文提出了一种改进K-means聚类算法。为揭示数据集中数据类大小的“真实”分布与聚类划分所产生的数据分布之间的关系,本文基于数据分布视角,对聚类的均匀效应进行了研究,并通过利用变异系数CV的前后值变化的方式,探讨了提出的改进K-means算法在面对不同类型数据集时的聚类表现,并利用人工数据集与CPC聚类有效性指标进行了交叉验证。实验结果证明了改进后的K-means算法在面对样本总数、类别数、属性数存在差异的数据集时,可以保证较为良好的聚类质量。除了利用人工数据集进行验证外,本文还利用真实数据集对改进后的K-means算法进行了再一次验证,实验结果证明了改进K-means算法的广泛适用性。(3)从航空公司可控因素出发,将改进的K-means算法应用于波音737飞机在降落过程中的油耗数据聚类分析。当前民航飞机油耗预测模型主要依据飞行手册数据,模型分析过程也主要依赖于对于飞行手册的查询,而飞行手册从普遍适用性和安全性的角度考虑,对飞行过程的要求相对较为宽泛,导致其对节油飞行的要求较低。基于上述原因,本文通过应用改进的K-means算法对两架波音737飞机在不同机场降落过程中的油耗数据进行聚类分析,为飞行员提供较为精细化的降落方式建议,从而实现从节能减排的角度对飞行手册中的要求进行进一步补充。此外,本文从最佳k值的选择、算法鲁棒性、CPC聚类有效性以及不同机场等四个方面对算法进行了灵敏度分析,结果验证了改进的K-means算法生成的聚类结果的可靠性。(4)从机场环境因素出发,运用改进的K-means算法对波音737飞机在不同机场降落过程中的油耗数据进行聚类分析。首先从机场基本地理环境因素、机场建设因素、机场气候因素等几个方面探讨了可能影响飞机降落过程油量消耗的具体因素,并对各因素之间的关联性进行了分析,选择了对民航飞机降落油耗影响较大同时相互之间关系较小的6个因素作为分析不同机场环境因素对民航飞机降落油耗影响的变量。然后选取国内21个主要机场作为分析目标,将改进的K-means算法应用到机场环境因素与油耗的聚类分析过程,对不同机场的民航飞机降落过程油耗数据进行聚类,探寻不同机场对民航飞机降落油耗的影响,尤其是研究针对同一架飞机情形下机场环境因素对于民航飞机降落过程油耗的影响。基于聚类分析结果,提出了有利于降低民航飞机降落过程油耗的枢纽机场建设相关建议。本文提出了一种改进的K-means聚类算法,并将其应用于民航飞机降落过程的航空油耗聚类分析,从节能减排角度为航空公司飞行员驾驶行为与机场建设提供了相关管理建议,取得了一些创新性研究成果,具有重要的理论与实践意义。