基于Spark的城市道路拥堵预测研究

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:liutaostdio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的不断进步,人民生活水平逐渐提升,城市私家车保有量也在逐年稳步攀升。由机动车保有量上涨引发的交通需求与道路有限通行能力之间的不平衡关系日渐严重,最终以交通拥堵的形式呈现在我国的各个城市道路中。目前,交通拥堵问题在我国众多城市道路中日趋严重,频繁的拥堵不仅导致出行时间延误,而且加剧车辆污染排放。道路拥堵问题的治理关键是提前预测到可能出现的交通堵塞现象,并对各种拥堵情况发出预警信号,提前采取对应措施。因此,及时预测拥堵情况的发生、对各种可能出现的拥堵情况进行预警,对我国城市交通发展至关重要,对缓解通行压力、提高出行安全、节省出行时间、降低能源浪费具有重大意义。基于城市道路交通数据,对城市道路拥堵预测方法进行了研究。主要工作包括:查阅相关文献,研究道路交通拥堵预测算法、并行化技术、大数据云计算技术的发展现状。总结现有研究存在的问题与不足,确定以基于Spark并行的优化随机森林为研究目标。研究相关大数据技术,构建集群环境。从数据处理、特征选择、参数优化等角度进行研究。采用阈值法和交通流机理法对异常数据和缺失数据进行判别,采用移动平均法和历史趋势法对缺失和异常数据进行处理。构建χ2-YYPO-RF模型,利用卡方检验对处理后的数据进行特征选择,并通过阴阳对优化算法对随机森林进行参数优化,合理设置影响随机森林预测精度的两个关键参数决策树数量ntree和分裂属性个数mtry,并基于Spark大数据平台进行模型的并行化设计。为确定研究内容的可行性,通过准确率实验将K近邻算法、长短期记忆神经网络算法、传统随机森林算法与χ2-YYPO-RF模型从正确率、精确度、召回率、F1度量等方面进行比较;通过加速比实验和可扩展性实验,比较不同节点数目和不同数据量情况下的并行化模型的加速比和扩展比,验证模型并行化效果。实验证明,提出的χ2-YYPO-RF城市道路拥堵预测模型具有95.58%的预测准确率,四个评价指标均高于其他模型。随节点个数和数据量的增长,模型的加速比逐渐上升,扩展比逐渐降低,且逐渐趋近于理想值。
其他文献
空时自适应处理(STAP)是机载雷达在非均匀环境中进行运动目标检测的关键技术。抑制检测环境中的杂波与干扰是机载雷达完成目标检测任务的基础。传统STAP方法要想获得理想的处理性能,理论上用于估计杂波功率谱的训练样本数量不能少于系统自由度的两倍。然而在实际应用中,机载雷达所面临的杂波环境通常是非均匀、非平稳的,难以获取足够数量的均匀训练样本,导致STAP性能严重损失。本文针对小样本、非均匀、非平稳条件
小型化和一体化是导航系统的发展趋势之一。卫星/惯性紧组合导航具有精度高、抗干扰性强和复杂度适中等优点,但在实际应用中,因恶劣天气、复杂地形等影响,会出现系统性能下降、无法持续导航的问题。本文的目标是研究北斗/MEMS-SINS紧组合可持续导航算法及其嵌入式实现方法。首先,研究了基于加速度计和磁力计的姿态角计算原理、捷联惯性导航系统的基本原理和基于联邦滤波的北斗/MEMS-SINS紧组合导航系统的数
随着照明技术的高速发展与革新,草原受到了其周边城镇的光污染,草原夜晚天空的发亮情况有加重加快的趋势,对草原环境产生了破坏。但目前的研究仅局限于城市内部夜空发亮的研究,缺少草原整体性夜空发亮,即草原夜空广域光的研究。同时缺少对草原夜空广域光亮度定量化的研究,缺少草原夜空广域光的发亮机理研究,也缺少对草原夜空广域光亮度计算性的研究。目前研究不能充分的为草原夜空保护提供理论依据和数据支持。因此论文选用草
端到端语音识别模型将声学模型和语言模型集成为一个整体,不需要人工对齐音频与文本,能够直接将音频转换为文本。基于注意力机制的序列到序列模型是端到端语音识别的一种实现,并在英文数据集Librispeech上取得了SOTA的识别结果。本文以基于注意力机制的序列到序列模型为基础开展蒙古语在线语音识别研究,其中存在以下几个问题:(1)蒙古语数据集是低资源语料,即有标注的蒙古语音频匮乏且地区分布不均衡。低资源
移动互联网和无线通信技术的发展和普及,催生了大量计算密集和时延密集型应用。移动设备(Mobile Devices,MDs)因其计算资源和电池容量的限制,不能满足新型应用的性能需求。而现有的移动云计算技术需要将待存储数据和待计算任务远距离传输到云端,会产生较高的时延。移动边缘计算(Mobile Edge Computing,MEC)技术可以利用无线通信技术将待存储数据和待计算任务卸载到附近具有空闲资
随着社会的发展和进步,人与人之间的沟通交流变得愈发频繁,而拥有一种可以跨越地域限制、打破语言障碍的沟通方法就显得尤为重要。然而,大数据时代的到来,给利用传统人工翻译方法处理海量语言信息的工作带来了极大的困难。机器翻译技术的出现顺应了时代要求,且机器翻译技术的应用离不开大量高质量平行语料库的支撑。面对蒙语这种小语种语言,由于其使用范围较小且蒙古族经济文化发展相对缓慢等原因,使得高质量蒙汉平行语料的收
几何分辨率和距离测绘带宽是星载合成孔径雷达(SAR)的两个最为重要的性能指标,但是在传统单通道SAR系统中,受最小天线面积的限制,两者无法同时提高,难以满足高分宽测遥感领域对地观测任务的需求。多孔径成像体制是星载SAR实现高分辨率宽测绘带最有效的途径之一。方位多波束体制和距离多波束Staggered SAR体制是目前国内外多孔径体制SAR的研究热点,论文围绕这两种体制的系统设计与信号处理方法展开研
弧形阵列天线突破了常规线性阵列天线观测视角单一的限制,能够实现对周围环境实时、全方位、高分辨率和大视场观测。同时,弧形阵列天线阵面可以安装在飞行载体表面,不仅可以有效扩展雷达天线孔径和扫描范围,还可以降低或克服对雷达观测平台的空气动力学影响,弥补传统阵列的不足。副瓣电平是雷达天线重要指标之一,较高的副瓣电平易导致天线功率效率降低和接收信号质量下降。本课题主要对低副瓣弧形阵列天线优化方法展开研究,主
近年来,一些恐怖分子和极端势力经常在火车站、飞机场等人流密集的地方开展恐怖袭击活动,给人民的生命健康和财产安全带来巨大损失。金属探测器、X光安检仪等传统的安检手段在检测物品的种类,乘客隐私的保护,安检通行的效率等方面存在或多或少的问题。随着毫米波集成器件和高性能处理器的大力发展,一种基于毫米波三维成像的安检技术逐渐进入人们的视野,成为安检领域研究的热点。传统的近场毫米波三维成像算法在Nyquist
弧形阵列SAR(Synthetic Aperture Radar,简称SAR)是一种广域观测的新体制微波成像系统,将其应用于直升机平台上,能够实现对平台周围地形信息的全方位、短重访周期的成像感知。为了更充分地发挥弧形阵列雷达的潜力与效能,有必要对弧形阵列雷达的应用模式进行探索和研究。双基合成孔径雷达(Bistatic SAR,简称Bi-SAR)指的是收发分置的SAR系统,具有隐蔽性较好、抗干扰能力