基于多源交通时空数据的数据补全技术研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:eboy120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和交通信息化的快速发展,交通数据的规模越来越大,在智能交通系统中,完整有效的交通数据对交通管理来说意义重大。但是实际中采集交通数据时,由于一些不可避免的事件的发生(如设备损坏、恶劣天气等),会导致数据采集中断,造成部分数据的缺失,这降低了数据集的有效性,制约了智能交通建设的发展。对缺失的交通数据进行有效的补全,在理论和实际层面具有重要的研究意义然而交通数据的补全具有非常大的挑战性。一方面,道路交通数据随着时间的变化是非平稳的,比如早晚高峰、节假日等都会影响交通数据的变化趋势,在临近时间上,交通数据具有很强的时间依赖性,同时,交通数据还呈现出显著的长时周期相关性;另一方面,真实世界中的交通路网具有复杂的空间结构,不同路网节点之间存在着空间相关性。此外,数据的缺失模式对缺失值的补全也存在影响。针对上述问题,本文提出一种端到端的时空神经网络补全模型(STIN)来进行交通数据缺失值的补全。首先,针对交通数据存在的显著周期性特征,使用基于无因果卷积的时间卷积网络来提取每个路段的周期相关性,然后构建编码器解码器结构;针对交通数据的空间相关性,使用基于空间注意力机制的双向长短期记忆网络结构来捕获同一时刻内,交通路网中不同路段之间动态变化的空间相关性;针对交通数据的临近时间相关性,用基于时间注意力机制的长短期记忆网络来捕获不同时刻的数据与当前时刻数据之间的时间相关性。同时,根据数据的缺失信息构建时空相关性衰减因子矩阵,通过在进行缺失值补全时融入数据的缺失模式信息,有效提升补全精度。当数据缺失程度较高时,单一的数据源所提供的信息不足以支撑对缺失值的补全,在STIN的基础上,本文提出了基于多源数据融合的交通数据补全模型MSTIN,使用注意力机制捕获不同交通数据和目标数据之间的相关性,提升了模型的补全效果。以真实世界的交通数据集作为实验数据,本文通过实验比较了提出的MSTIN模型和其它基准模型的数据补全性能。结果表明,本文提出的MSTIN模型能够准确地恢复缺失数据,性能优于其它算法。同时,分析了模型中不同模块对补全性能的影响,验证了针对时空相关性建模以及融合多源数据的有效性。
其他文献
图像语义分割技术是计算机视觉领域中的一项重要的研究内容,在无人驾驶、医学影像、场景理解等领域中都有着不可或缺的作用。近几年随着深度学习的飞速发展,图像语义分割技术的整体性能得到了巨大提升,但深度学习模型对于大规模高精度数据集的依赖也成为了很多算法在泛化性和鲁棒性上的主要瓶颈。高精度的语义标注需要大量的人力和时间成本,如何在短时间内实现准确的数据标注,是图像语义分割技术面临的主要挑战之一。针对这一问
随着科学技术的不断发展,无人机航拍技术被广泛应用到农业、工业、军事等领域。但是受到相机视角的限制,单张航拍图像中所涵盖的内容,无法满足研究人员对信息获取的需要,因此,为了获得大比例尺、信息全面的图像需要对采集的航拍图像进行拼接。针对航拍图像具有易受光照、尺度和旋转等特性变化影响,以及图像不连续、存在视差的特点,本文以特征提取和图像扭曲变形两个阶段为切入点,致力于研究能够适应航拍图像特点的特征提取算
由于司法流程公开与共享的不断推进,我国的司法大数据公开化已趋于成熟,蕴含于法律文书中的丰富法律信息成为了值得深入研究的珍贵资源。但由于法律文书以自然语言形式进行记录,机器难以直接对文档内容进行理解和分析。因此,通过文本挖掘技术对非结构化的司法领域文本进行信息提取和结构化存储,对司法领域信息化发展以及司法效率的进一步提高都具有积极意义和深远影响。文本挖掘中的实体识别和关系抽取技术对于法律文书中关键信
随着软硬件技术的飞速发展,大规模知识图谱的构建和存储成为了可能,并为问答系统、药物发现等人工智能应用提供了知识基础。问答系统作为人工智能领域一项前景广阔的落地应用受到人们的广泛关注。与通过搜索引擎获取知识的方式相比,问答系统能更加智能和高效地给出确切的答案。基于知识图谱的问答系统(Knowledge Based Question Answering,KBQA)结合二者的优势,将用户的查询解析为逻辑
随着信息时代的到来,人们在网上获取知识的渴望越来越高。传统的基于搜索引擎的信息检索方式会返回大量与问题相关的网页,这不仅对网页的排序准确率有较高的要求,还需要人工的去点击链接筛选信息,这无疑会耗费一定时间。因此,问答系统应运而生。问答系统可以直接理解用户的问题,返回简洁正确的答案,降低用户查询成本。知识图谱是一种新型的数据库,可以看作是巨大的语义关系网,表示客观世界实体之间的关系,其以图结构存储知
汽车工业和计算机深度学习等技术的进步使无人驾驶汽车(Automatic Vehicle,AV)逐渐成为一种不可替代的交通方式。自主代客泊车(Autonomous Valet Parking,AVP)功能作为无人驾驶汽车的重要功能之一,使汽车能自主完成导航和泊车任务。在自主代客泊车领域,分为短程自主代客泊车(Short-range Autonomous Valet Parking,SAVP)和远程自
当前是一个信息爆炸的时代,人们都在创作或者接受各种各样的文本资讯。让机器学会生成文本在一定程度可以避免人们机械重复的信息生产过程,在提高效率的同时还可以为人类创作提供灵感或者辅助。文本的内容通常会围绕特定的主题进行展开,如果文本内容松散,缺乏明确的主题,文本可读性就会下降。当前的许多文本生成研究也较少对于主题信息进行建模研究,因此,本文主要探究融合主题信息的文本生成技术。首先,本文对主题模型的主题
幽默是人类交流中一种独特的表达方式,它能够创造轻松愉快的氛围,促进人与人之间的沟通。幽默饱含智慧与创造力,研究幽默的产生机理,使用计算机对幽默建模,识别和生成幽默有助于计算机模拟人类的认知,对人工智能的发展至关重要。近年来已有许多基于文本的幽默识别研究,但是随着社交媒体的发展,幽默识别的对象不再局限于文本,音频、视频等多模态信息中也包含着丰富的幽默。多模态幽默识别成为该领域新兴的研究课题,它需要挖
高维、复杂的生物数据中潜藏着大量与生命健康密切相关的信息,生物数据往往具有样本量小、维数高的特点,因此如何对其进行有效降维并提取重要信息,对疾病诊断、药物研发、个性化医疗等具有重要意义。由于生物体自身的复杂性导致分子间存在错综复杂的交互作用,对此,本文分别从特征选择与特征提取两个角度出发,利用分子间的关联关系从复杂的生物数据中提取出具有重要意义的信息,具体研究内容如下:1.提出了基于协同作用网络的
背包问题是组合优化问题中的经典问题之一,该问题经常出现在资源分配中,决策者必须在规定的时间或者预算下,在一组不可分割的物品或者任务中进行选择。背包问题已经被研究了一个多世纪,最早的文献作品可以追溯到1896年。在经典的0-1背包问题中,给定一个容量固定的背包和若干物品,每个物品都有收益属性和重量属性,目标是选出若干物品放入到背包中(每个物品最多只能选择一次),满足背包中所有物品的重量之和不超过背包