面向多源数据的客运车辆到站时间预测研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:qq978458283
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
道路客运是最方便和面向大众的中长途出行方式之一,也是社会经济发展的基础性行业。推动客运行业信息化,建设完善的智能客运系统,能有效提高公共交通服务水平。车辆到站时间是出行者最为关心的信息之一,提供客运到站时间预测不仅有利于出行者合理安排行程及客运车辆的实时调度,还能实现社会出行资源的合理调配、缓解城市交通拥堵、节能减排。随着车载GPS的普及、GIS等技术的成熟、“互联网+交通”概念的兴起,利用新技术研究和开发客运车辆到站时间预测系统具有重要的现实意义。本文设计了一种采用azkaban+Hadoop+nagios技术的无损数据清洗方法,实现客运、公交车、出租车、货车等多种类型车辆的GPS数据清洗。该方法使用azkaban调度清洗任务,将合格与不合格的数据分离,并存储到HDFS,而不像传统的清洗方法一样将脏数据直接丢弃。nagios技术监控数据清洗质量,在质量不达标时能发起告警。本文研究了道路类型、重大节假日等因素对客运车辆运行时长的影响,分析了公交同客运的差异性和客运车辆运行特点,采用支持向量回归机模型实现客运车辆到站时间预测模型。模型充分考虑道路类型、重大节假日、天气、路况、运行距离、运行时间、排班信息等7个特征因素,克服了一般公交系统研究模型设计可能因过于依赖经验导致过拟合等问题。选取遗传算法解决支持向量回归机参数寻优的难题,实验结果表明遗传算法能比传统K-CV算法节省约30%的时间。最后,在Hadoop平台上完成GPS异常记录处理、确定车辆发车时间,在storm平台上完成地图匹配、经纬度一维转换、路况计算,提取出模型需要的特征。实验使用客运车数据训练集共300组记录训练模型,用测试集数据(共124组)验证本文模型应用于客运车辆行程时间预测的有效性。基于本文的研究内容,可以实现一个可提供客运车辆到站时间预报的软件服务系统,该系统目前已经进入为期6个月的应用开发阶段,预期可产生较好的实际应用价值。
其他文献
作为陶瓷教育工作者,我有幸能拜读<景德镇陶瓷传统工艺>一书感到十分荣幸和欣慰.我国是瓷器的发源地,景德镇是享誉海内外的瓷器生产中心.她积累和创造了许多独特和精湛的制瓷
钢琴变奏曲《夜莺》就是格林卡在1833年根据花腔女高音声乐作品《夜莺》改编创作而成,作品保留了声乐作品中的经典曲调,又将大量俄罗斯本土民族民间音乐素材融合其中,乐曲风
[目的]采用中医客观化检测工具脉诊仪对高血压的脉象进行测量,通过对脉图参数与血流变指标的相关性分析,揭示脉图形成原理。[方法]选取符合纳入标准的原发性高血压患者142例,
<正>最近一段时间,在人大系统兴起了一股"培训热"。从4月中旬开始,全国人大常委会先后举办了一期省市两级人大常委会负责同志学习班、一期全国人大代表学习班和两期县级人大
祝桂洪先生编著的<景德镇陶瓷传统工艺>一书,行将出版,请为之序.我作为第一读者,阅读之后,觉得书中内容翔实、图文并茂、文字清新、言简意赅、简明易懂,是一本难得的陶瓷学方
阐述了鸡毒支原体病的病原及流行特点、临床症状与病理变化,并介绍了该病的诊断方法与防治措施,以期为鸡场鸡毒支原体病的防治提供参考。
本文的研究目的是对我国现行的风险自留规则的实际效果做出评价,检验它是否有效地提高了信贷资产证券化产品的质量;并进一步分析其影响因素。为改善我国现行的信贷资产证券化风险自留规则提供建议。本文采用的研究方法主要有比较分析和实证分析。在第一章规则梳理部分,主要采用了比较分析的方法,通过对中国、美国和欧盟的风险自留规则进行比较,描绘出我国风险自留规则的主要特征。我国的风险自留规则相对于美国和欧盟的规则还比
台风是浙东沿海地区主要灾害性天气之一,容易导致避雷针等高耸结构发生风致振动甚至发生破坏。本文根据避雷针等高耸结构特点,采用高度相关的脉动风功率谱、自回归法(AutoReg
以金地煤业特厚煤层为背景,通过FLAC3D数值模拟与工程实测分析研究了预紧力对特厚煤层巷道支护结构稳定性的影响。研究表明:锚杆预紧力增加可有效减少顶板浅部围岩离层,锚索