浮动车到达时间预估问题的研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:loserlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
浮动车在城市路网上的运动是有规律的,通过交通流预测技术,在提前获知浮动车出发与到达地点的前提下,可以预测这个车辆到达目的地的时间。利用历史数据和实时路况数据对浮动车的到达时间预估是智慧交通的研究重要领域之一。本文充分挖掘海量交通轨迹的数据的特征,分析了到达时间预估的轨迹数据预处理、模型特征评价和预测训练模型过程中存在的问题,提出了一种基于关联挖掘的特征选取和基于神经网络预测模型进行时间预估的解决方案,。本文的主要研究内容和成果如下:(1)应用地理围栏筛选和密度聚类的行程提取方法完成轨迹数据预处理交通工具的行驶轨迹是一条始终连续的坐标数据,其中可能包含着多个行程,中间夹杂大量冗余和干扰信息。如何从连续运动进行行程模式的识别是轨迹数据预处理的常见问题。基于交通常识,我们知道不同区域的交通轨迹因为社会经济、交通规则、城市规划等原因,往往呈现不同规律,很难有一个统一的模型去对全量区域的轨迹进行拟合,并取得较好的效果。常用做法是利用地理围栏将城市按照功能区进行划分,对于不同功能区的轨迹进行单独建模和调参,才能取得较好的效果。本文利用基于行驶状态表述和文本向量相似度的方法进行数据处理,并且利用空间密度聚类方法对误分割的行程进行召回,提高了行程提取的准确率和召回率,完成行程提取后,就完成了轨迹数据向交通行为的映射,一些信息稀疏的特征可以基于行程维度进行聚合,使得数据更加易于理解,便于训练。(1)应用地理围栏筛选和密度聚类的行程提取方法完成轨迹数据预处理交通工具的行驶轨迹是一条始终连续的坐标数据,其中可能包含着多个行程,中间夹杂大量冗余和干扰信息。如何从连续运动进行行程模式的识别是轨迹数据预处理的常见问题。基于交通常识,我们知道不同区域的交通轨迹因为社会经济、交通规则、城市规划等原因,往往呈现不同规律,很难有一个统一的模型去对全量区域的轨迹进行拟合,并取得较好的效果。常用做法是利用地理围栏将城市按照功能区进行划分,对于不同功能区的轨迹进行单独建模和调参,才能取得较好的效果。本文利用基于行驶状态表述和文本向量相似度的方法进行数据处理,并且利用空间密度聚类方法对误分割的行程进行召回,提高了行程提取的准确率和召回率,完成行程提取后,就完成了轨迹数据向交通行为的映射,一些信息稀疏的特征可以基于行程维度进行聚合,使得数据更加易于理解,便于训练。(2)应用关联挖掘完成预估模型的特征评价选取。实际交通是一个复杂的过程,受到诸多变量的影响。除了载具的性能、道路拥堵状态、行驶里程、道路等级之外,还会受到天气状况、交通事故、施工封闭等突发事件的影响。如何从庞杂的特征全集中寻找到对到达时间影响最大,信息密度高的特征集是提高预测精度的关键。传统的特征评价方法有滤波式算法和嵌入式算法,但是前者很难定量描述特征之间与特征与目标之间的相关性,后者受到特征组合爆炸的短板制约计算代价大。本文利用关联挖掘的算法,基于规则标注和离散化,成功应用改进的滤波法,实现在短时间内对特征之间和特征与目标之间的关联性进行分析。(3)研究了极限学习的神经网络算法的到达时间预估模型。本文研究的核心问题,就是在已知一个乘客的出发地点、目的地点、出发时间等条件的前提下,利用历史数据对其到达时间进行预估。在科研和工业界有许多成熟的算法模型可用于到达时间预估,包括基于线性模型的回归、基于非线性模型的回归、基于交通仿真预测的回归等等。目前基于树模型(回归树、随机森林、梯度提升树)的算法的实际应用最为广泛,近年来,随着深度学习理论的发展,神经网络模型越来越受到人们的关注。传统的神经网络常用于分类学习,也有一部分学者通过模型改造(激活函数和输出方式修改)将神经网络应用于分类,但是神经网络本身结构较为复杂,调参成本较高。本文利用极限学习的思想,将极限学习机神经网络算法应用于到达时间的预估过程。为了横向衡量模型的精度和可靠性,本文同时选用两种应用较为广泛的模型回归树和支持向量机进行了比较实验。通过比较三种预估方法的预测精度、可靠性、计算代价。发现神经网络模型可以在大量样本的前提下,在简单调参后达到较高精度。
其他文献
近些年来,以资产证券化为代表的金融创新产品的出现无疑大大丰富了我国市场经济的纵深层次,加快我国金融体系的建设与发展。自资产证券化产品引入我国以来,这一金融衍生工具
摘要:如今在企业商业运行中有着经营策略执行、商品供销服务、资源有效配置等优势的连锁经营形式,被越来越多的企业、商家所应用。该文通过分析比较我国两家最具代表性连锁经营公司的经营模式,提出了发展连锁经营的对策。  关键词:连锁经营;小肥羊;红高粱;对策  中图分类号:F407.86 文章标识号:A    一、 从“小肥羊”和“红高粱”的对比看连锁经营    两大连锁企业“红高粱”和“小肥羊”的创业过程
对银杏核的结构尺寸、压缩破坏载荷及临界压缩变形量、密度等物性参数的测定表明 :银杏核分级时以级差 1mm、分级数以 4级为宜 ;破壳机的挤压腔间隙至少应保证 2 .4 4~ 3.11mm
今年,美国经济严重疲软,市场消费不振,影响到美国对纺织品服装的需求增长,也影响到我国纺织品服装在美市场的份额。但由于种种原因,周边一些国家对美出口都在缓慢增长。两相对比,只能说明,市场永远都存在着。  2008年以来,国际经济放缓,国际市场疲软的声音不绝于耳。其中,又以国际经济的龙头美国经济呈现疲软的趋势更为严重。有经济学家甚至认为美国经济已经陷入衰退期,而经济前景的不明也波及了美国个人消费开支。
近年来随着我国企业并购重组节奏的加快,并购中交易的价格偏高的情况也越来越普遍,这说明高溢价并购的出现并非偶然。然而,较高的估值增值率的背后往往蕴藏着巨大的风险,因此也引起了社会对高溢价并购的广泛关注与担忧。本文章试以案例的形式来寻找现行并购中溢价的来源,并对企业并购后的风险进行分析,以有助于日后企业做出更为科学合理的兼并重组策略。本文以宇顺电子高溢价并购雅视科技作为案例,对并购高溢价形成的动因及风