【摘 要】
:
近年来交通拥堵现象日益严重,给人们的生活带来了极大不便,因此急需完备的技术和方法对交通进行管理和诱导。智能交通系统能通过融合网络技术、通讯技术等信息技术,全方位实现对车流动态信息的监控和管理,从而解决传统交通管理不及时和不科学等问题。交通流量作为数字化所需的重要参数,对其准确预测具有重要意义。为提高单一模型的预测精度,本文引入Stacking模型;为改善传统Stacking模型基学习器利用率低的缺
论文部分内容阅读
近年来交通拥堵现象日益严重,给人们的生活带来了极大不便,因此急需完备的技术和方法对交通进行管理和诱导。智能交通系统能通过融合网络技术、通讯技术等信息技术,全方位实现对车流动态信息的监控和管理,从而解决传统交通管理不及时和不科学等问题。交通流量作为数字化所需的重要参数,对其准确预测具有重要意义。为提高单一模型的预测精度,本文引入Stacking模型;为改善传统Stacking模型基学习器利用率低的缺点,本文对传统Stacking模型进行了改进和优化,具体研究内容如下:(1)为改善传统交通流量预测模型特征结构简单的缺点,引入节假日、高峰时间特征和占有率、速度特征来增强其表达能力,实现数据特征的深入挖掘。其中节假日特征和高峰特征为检测仪记录时间分解的分类特征,占有率和速度特征为前四个时间段的历史特征。(2)针对单一模型在流量预测中的局限性,考虑建立融合不同单一模型优点的Stacking模型,并在此基础上构建Ba-Stacking模型来减小单一模型的波动误差。首先建立以随机森林、KNN、决策树、GBDT、Xgboost和GRU为基学习器,以岭回归为元学习器的Stacking模型。再从学习器角度优化Stacking模型,先利用pearson分析基学习器间的相关系数,筛选有效的基学习器;再通过不同元学习器的对比分析得到最优的Stacking模型;最后利用Bagging模型优化基学习器,将优化的学习器作为新基学习器嵌入到Stacking模型中,得到Ba-Stacking模型。实验结果证明Stacking模型能有效提高单一机器学习模型的预测精度,而Ba-Stacking模型又进一步提高了Stacking模型的预测精度。(3)针对Ba-Stacking模型对基学习器利用率低的缺点,构建能改变基学习器权重的DW-Ba-Stacking模型来调整特征分布,从而提高利用率。DW-Ba-Stacking模型的关键在于权重系数DW的设计,其中所涉及的元学习器包括GRU和岭回归两种,对GRU元学习器通过设计注意力机制来改变模型内部权重,改变基学习器特征分布情况;对岭回归元学习器,在考虑影响模型外部特征情况下,分别以误差系数和熵值系数进行加权,修正基学习器信息结构。实验结果证明DW-Ba-Stacking模型相比于Ba-Stacking模型有更高的预测精度,实现了Ba-Stacking模型的改进。
其他文献
为了提高水泥基材料的抗碳酸腐蚀性能,通过碳酸腐蚀前后砂浆的外观、质量、抗压强度和腐蚀深度的变化,研究了粉煤灰和硅灰的掺量、掺入方式(单掺、复掺)对砂浆抗碳酸腐蚀性能的影响。结果表明:单掺时,粉煤灰和硅灰的最佳掺量分别为15%、5%;复掺时,当m粉煤灰:m硅灰=7:3时,砂浆的抗碳酸腐蚀性能最佳,且优于单掺粉煤灰或硅灰砂浆的性能。
港城关系指港口与其所属的港口城市之间相互依赖、相互影响和相互制约的关系。港城之间的发展,向来秉持“港以城兴,港为城用,港城共荣”的原则。全球比较闻名的城市,有很多都是港口城市,例如,德国的汉堡、荷兰的鹿特丹、日本的神户等等,其港口设施完善,现代化程度较高,且港口在港口城市乃至腹地经济的发展中起着至关重要的作用。我国虽然海岸线较长且沿海港口众多,但设施完善、现代化程度高的港口较少,制约了其所属的港口
随着国际贸易规模的高速发展,物流的发展水平得到了较大提升,同时又更好的促进了世界经济的发展,而人们对物流服务的水平也有了给更高的要求。在该情况下,不少物流企业开始着手于构建全链条的物流服务体系,以期获得更大的规模效益、减少物流成本,为客户提供高满意度的运输服务。航运企业作为全球化的物流服务提供商,在世界贸易的货物运输中承担了绝大部分运力,积累了大量资产、运营经验和客户群。但是近年来市场波动、贸易摩
大数据时代,数据开放可以促进公共服务质量的提升、推动经济创新,因此开放数据运动蓬勃发展。地理数据是开放数据的主要领域,在社会治理、经济发展、科学研究等领域都具有巨大的价值。统一的元数据标准是开放数据建设过程的核心内容之一。地理数据蕴含的丰富数据价值让地理数据的元数据得到了更多的重视。在我国,虽然一些地方政府已经发布了地方元数据标准,但是从总体上看,因为缺少统一的管理机制、标准和方法,所以数据的利用
在互联网时代,人类生活方式的转变促进了外卖与快递行业的发展,尤其在新冠肺炎疫情的助推下,2020年中国外卖交易规模达3460亿元,快递交易规模达8750亿元,分别同比增长18.79%和16.7%。不断增长的线上交易量为外卖与快递的配送带来了极大的压力。外卖配送与快递配送都属于城市配送。外卖员的工作时间分配不均匀,工作量不饱和,这造成了很大的人力资源浪费。快递员工作量高度饱和,人力资源紧张。快递配送
新冠疫情爆发和北极冰山融化的现象使我们重新考虑人类的生活方式对环境的影响,以及企业在生产活动中尽量减少和消除排放等方面的责任。随着港口船舶交通量的增加,大气污染物的排放量也不断增加,使港口周围地区的空气质量越来越差,对公众的健康产生了影响。航运已经成为仅次于机动车和工业生产的第三大空气污染来源,我国与国际海事组织(IMO)相继通过了有关条例(例如海事组织《防止污染公约》附件六)来处理船舶排放问题。
在数字时代,数据是社会和商业活动的关键资源,其中大部分是由政府创建或持有。通过开放数据,政府可以帮助推动创造创新的商业和服务,提供社会和商业价值。开放数据不仅要求在各平台上发布大量的数据,同时要建立高效的数据管理方式,制定统一标准,聚合分散数据,消除数据孤岛,提高数据集的可发现性,从而降低数据用户发布和获取数据资源的成本,激活更多数据成果。目前,我国已上线140余个政府开放平台,基本涵盖我国大部分
随着云计算、互联网、web2.0技术、电子商务等的急速发展使得网上信息资源呈指数式增长,导致的“信息过载”问题越来越严重。用户很难从海量信息中快速寻找到满足自己个性化的需求,企业面临的困扰是用户对提供的推荐服务是否满意。推荐系统常从用户、商品以及用户评分信息等方面挖掘内在关联,从而为用户和商品建立关联,为用户提供感兴趣的商品推荐列表。虽然传统的推荐系统在一定程度上缓解了“信息过载”问题,数据稀疏和
网购消费者行为数据来源场景复杂多变,对网购消费者行为数据进行分析并标记网购消费者行为数据何时出现异常,然后利用其时间序列的规律性对标记的异常进行分类识别,一方面企业在分析网购消费者行为数据时可以避免因异常数据影响而做出错误决策,减少企业损失,另一方面异常数据可以用于研究信息系统,为系统的完善性提供可用信息。然而,由于网购消费者行为数据中的异常样本较少且含有多种类型,同时网购消费者行为数据的存储量庞
在货物运输行业中,由于其货运业务需要货运企业与其他货运参与方之间的多方协同交互,货物的运输流程也需要货运各参与方共同签署合约来保障执行,这使得货运合约成为维系货运企业与货运各参与方之间的纽带。在传统的中心化背景下,货运合约多为集中式存储和管理模式,存在着合约数据可篡改、不可追溯等一系列安全问题,同时合约的执行也易受主客观等因素的影响,使其可信性得不到保障,进而造成货运企业与货运各参与方之间建立互信