论文部分内容阅读
航空客运需求预测始终受到航空公司、机票代理商、飞机制造商等民航相关企业的关注。航班客座率是航空客运市场中用以衡量航班客运量需求的重要指标之一。准确地预测航班客座率将有利于航空公司处理航班机票超售、座位虚耗等问题,帮助民航从业者提前感知市场需求进而提高企业收益管理水平、为各级运营部门提供决策支持。传统的时间序列预测方法作为航班客座率预测问题的主流研究方法,以定义的某个航班作为研究对象,仅关注目标航班近期每日客座率的变化特点,无法同时考虑到该问题受到的其他众多因素的影响,因此无法获得理想的预测效果。除航班自身每日客座率变化外,目标航班客座率还受其所在航线中其他邻近起飞时刻的航班客座率影响,存在起飞时刻相关性,即同一航线上起飞时刻越相近的航班对应的客座率相差更小;在时间粒度上,航班客座率不仅存在起飞时刻相关性,还存在起飞日相关性,即航班自身的客座率数据在起飞日的时间维度上呈现出时间依赖关系,如航班待预测时间区间的客座率与该航班前一周同一星期的客座率具有的周周期性、与该航班去年同一时间区间的客座率具有的年周期性;同样,航班自身属性及节假日、航班所在航线是否开设高铁等其他因素也会影响航班客座率。为综合考虑以上因素进行准确的航班客座率预测,本文提出了一种新颖的基于多粒度时间注意力机制的循环神经网络模型(Multi-Granularity Time Attention Recurrent Neural Network,MTA-RNN),该模型构建多级注意力机制获取航班客座率在不同时间粒度下的时序相关性。本模型根据不同性质的时间依赖分别选取预测航班所在航线所有航班数据的临近时间区间及遥远时间区间数据,对两部分数据分别采用编码器进行编码。在编码器中,模型首先采用LSTM单元捕获预测航班所在航线中不同起飞时刻的航班客座率时间序列的时序依赖性,之后引入起飞时刻注意力机制,通过参考编码器上方LSTM单元之前起飞日的隐藏层状态,在每个起飞日自适应地提取编码器下方LSTM单元相关起飞时刻的隐藏层状态值。在解码器中,各部分编码器均引入起飞日注意力机制在所有的起飞日中选择相关编码器上方LSTM单元的隐藏层状态,并结合航班自身属性及节假日等其他因素,最终得到未来一段时间的目标航班经济舱客座率。本文在真实的历史航班客座率数据集上进行了实验,实验结果表明MTA-RNN模型相比传统的时间序列预测方法及最新的基于深度学习的预测方法具有明显的性能优势。