【摘 要】
:
出行是我们日常生活中不可避免的一部分,随着人们对于航空出行接受程度的提高,由于航班延误造成的经济损失成为了人们热议的话题.根据美国联邦航空管理局公布的统计数据,美国2018年仅由于航班延误带来的损失就高达280亿美元,无论对于航空公司还是乘客来说,这都是一笔巨大的损失.随着经济的迅速发展,我国在民航市场的需求也在不断增加,2020年我国全年机场完成旅客吞吐量8.57亿人次,完成飞机起降904.92
论文部分内容阅读
出行是我们日常生活中不可避免的一部分,随着人们对于航空出行接受程度的提高,由于航班延误造成的经济损失成为了人们热议的话题.根据美国联邦航空管理局公布的统计数据,美国2018年仅由于航班延误带来的损失就高达280亿美元,无论对于航空公司还是乘客来说,这都是一笔巨大的损失.随着经济的迅速发展,我国在民航市场的需求也在不断增加,2020年我国全年机场完成旅客吞吐量8.57亿人次,完成飞机起降904.92万架次,已达到美国同年的水平,目前也同样面临着由于航班延误带来的经济损失问题.本文的出发点是通过分析美国的航班延误数据,采用多种不同的方法构建相应的航班延误预测模型,并通过对比各方法从中选出最优模型.进而可以在之后的工作中把文中所用的多种方法推广到我国航班延误的相关分析中,通过技术手段规避相应的风险,减少不必要的损失.本文数据取自美国运输统计局,是2019年美国主要航空公司的航班数据.由于航班的延误情况具有相似性和共通性,所以文章中对于美国航班延误情况的分析方法可以推广并运用到对于中国航班延误情况的分析中.本文首先对数据进行预处理,补充缺失数值并创建新变量.接着分别分析了数据中主要变量与航班延误情况的相关性并将其可视化,直观地展现出来.在经过变量处理后的新数据集中,使用Logistic回归、基于CART算法的决策树、基于C4.5算法的决策树、随机森林算法、XGBoost算法、仅采用XGBoost生成的新特征作为变量的Logistic回归、合并XGBoost生成的新特征与原始特征作为变量的Logistic回归以及基于高斯核函数的支持向量机对航班延误的情况进行分类,并结合准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1值和AUC值评价各方法的分类效果.在本文的八种方法中,综合表现最优的方法为基于高斯核函数的支持向量机,它在识别航班延误时效果显著.在选择最优方法时主要比较AUC值,并且由于将延误航班错判为准时航班会给航空公司带来较大的损失,所以也需要格外重视召回率.Logistic回归在召回率方面的效果最为突出,但与基于高斯核函数的支持向量机相比,在AUC值、准确率、精确率和F1值上效果不佳.随机森林和XGBoost将多棵决策树进行集成,比起单一的基于CART算法的决策树和基于C4.5算法的决策树有更加优秀的分类性能.两种组合XGBoost与Logistic回归的方法能够生成变量间的非线性关系,并且结合了二者的思想,但并没有取得预期的效果,这说明优秀的方法不一定适合所有数据,需要具体问题具体分析.在航班延误的分类研究中,需要综合采用多种方法,分析影响航班延误的关键性因素并进行预测.同时在实际工作中积极做好应对准备,采取有效的措施,最大程度上减轻航班延误带来的不利影响。
其他文献
深刻剖析时代问题是每一政党和国家前瞻性思考和全局性规划发展大计的基础,把握时代脉搏、顺应时代浪潮是党和国家迈向高水平发展的客观要求。列宁时代观是马克思主义时代观发展到新阶段的理论结晶,是列宁投身伟大革命研究世界未来走势的科学思想,是俄国革命走向胜利、殖民地获得解放的制胜法宝。列宁时代观作为党和国家理论宝库中的组成部分,在时代变迁中依旧熠熠生辉,有助于我们在新时代谱写发展新篇章、书写奋进华章。研究列
随着工艺技术与硅基光子技术的迅速发展,晶体管的体积越来越小,集成在单一芯片上的晶体管数量也越来越多。电路的集成度日益增大,片上多核处理器系统(Multiprocessor systems-on-chips,MPSo Cs)应运而生并得到了广泛的关注,如何实现处理核之间的高效互连是MPSo Cs的研究重点。片上网络(Network-on-chip,No C)是一种新型的通信方法,其借鉴了分布式计算系
家蚕(Bombyx mori)是一种重要的经济昆虫,以家蚕为对象开展研究既能为其他昆虫或者哺乳动物提供一定的理论基础,也能为养蚕业指引新的方向。家蚕核型多角体病毒(Bombyx mori nucleopolyhedrovirus,BmNPV)是一类对蚕业生产危害严重的病原,世界各地养蚕业往往由于该病毒导致的蚕病而承受巨大的经济损失。长期以来,对这种病毒病还没有很好的防治方法。尽管目前已有一些家蚕抗
随着信息技术、媒体技术的不断发展普及,思想文化呈现出以文字语言为中介的抽象表述向以图像为中介的视觉表达转化的倾向。即世界越来越多的被呈现为图像,图像越来越成为人们理解和把握世界的方式。在人们的认知模式、思维方式趋于视觉化的当下,我们看什么以及看到了什么?没看到什么?如何去看?这些问题无不涉及意识形态的巨大作用。全文期以意识形态与图像叙事的交汇为基点,在深入分析意识形态图像叙事的实践成果与理论成果基
关注人本身和人生存发展状况的马克思人学思想贯穿马克思一生的学术著作,是马克思思想体系组成部分中的重要一环,在马克思主义理论体系中占据重要地位。马克思在《德意志意识形态》中提出和阐述的“现实的个人”概念,标志着他与以往的哲学家们基于对人的错误性认识和狭隘性理解基础上而构建的“抽象的人”思想泾渭分明,为马克思人学思想体系的发展增添了新的且具有革命性意义的科学内容,同时,以“现实的个人”为理论前提而初步
八十年代中后期,纷繁芜杂的诗歌团体、流派、实验渐次登台,为诗歌创作打开了多条通道,但也过度消耗了诗艺拓展的可能。在这个阶段,由于生活重心的转移,诗歌所承担的社会、政治、伦理职能,在群众心理中的位置,已逐步滑落、衰减。正是在这样一种复杂、不稳定的状态下,戈麦走入了诗坛。其实,在戈麦的人生预设中,诗歌并不是他的最初选择。按照西渡的记载,戈麦一开始甚至对诗歌抱着一种拒绝的态度,后来生活中发生的一些重要事
忆阻神经网络作为类脑研究的重要算法之一,备受国内外众多学者的关注。而稳定性是忆阻神经网络最基本的动力学行为之一,其理论研究涉及到微分方程、Lyapunov稳定性理论、脉冲控制理论、生物科学、计算机科学等学科知识。忆阻神经网络稳定性相关成果已广泛应用于模式识别、语音合成、联想记忆等实际工程。众所周知,含有脉冲控制、固定时滞、时变时滞、混合时滞、输入饱和等因素的忆阻神经网络是较为常见的忆阻神经网络,其
脑部胶质瘤是全球青少年致死率排名第二的恶性肿瘤,其核磁共振图像的准确分割对诊断和治疗至关重要。随着计算能力与速度的提升,人工智能技术得到了快速发展,深度学习算法在生物医学图像分割中显示出巨大的优势,越来越多的计算机辅助医疗技术应用到临床医学中。U-Net作为医学影像分割的基石,以其编码器-解码器的端对端结构,在脑肿瘤、身体器官、细胞核等分割任务中取得了很好的效果,并为后来的工作提供了研究基础。然而
国家制度建设是一个国家发展的根本性问题,也是一个长期的过程。加强社会主义国家制度建设,是促进社会主义国家现代化发展的必然要求。挖掘马克思主义经典作家关于社会主义国家制度建设思想对于我们今天加强国家制度建设具有重要的意义。列宁作为第一个社会主义国家的创始人,对社会主义国家制度建设作了艰难探索与伟大尝试,开启了社会主义的历史征程。系统地研究列宁关于社会主义国家制度建设思想,对我们今天坚持和完善中国特色
目前基于混沌的研究已经引起了人们越来越多的关注,实际生活中的很多方面也迫切的需要运用混沌系统独特的性质。借助各类忆阻器模型对现有的混沌系统进行改进,可以构建出动力学行为更加复杂的混沌系统。混沌系统的类随机性和不可预测性与密码学有着不可分割的联系,基于混沌序列的图像加密算法具有更高的安全性。首先通过分析混沌的定义和基本的特征,得出了判定混沌的方法,且描述了基于混沌系统的数字图像加密算法的可行性和优越