基于多源数据集共有结构的交通数据张量补全算法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:tta86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汽车增多导致的交通拥堵和安全问题,考验着城市交通管理的水平。因此提高交通系统承载力,改善出行条件,已成为当前热点研究问题之一,同时为未来城市热点区域挖掘和城市规划提供智慧决策。行车数据是进行智慧交通系统规划的前提和基础,完善的交通数据和车辆运行数据能够提供高质量的交通服务信息,提高交通运输系统的综合运行效率和智能化管理水平。目前,许多城市的道路网络都已部署了交通监管设备,能够实时获得交通数据,但是受到数据采集故障、传输和存储失效等问题的影响,实时获取的数据通常质量不高,会存在数据缺失、错误以及冗余等问题,这使得智慧交通管控、诱导等工作难以开展。因此对于交通数据的缺失问题,本文将基于多源数据集的共有结构特性和数据的时空维多模态特征以张量分解算法作为补全模型的核心,对交通数据进行恢复的同时对交通数据补全问题展开研究。在交通数据补全问题中,对于数据的预处理发现和获取其中相关性程度高的数据特征,对数据恢复精度的提高具有很大的意义。对研究问题进行张量建模,利用张量模型的多模态数据表证结构和多维数据并行处理的优势,不仅能提高数据恢复的准确度,同时能极大的提高模型的运行效率和性能。在结合市区真实GPS数据、和热点数据,讨论基于张量分解的时空维(TIME AND SPACE DIMENSIONS)粒度建模技术对交通数据进行恢复。交通数据信息恢复算法中,存在一些数据丢失较多情况时,有些模型的补全效果表现较差,本文提出多源数据共有结构下含残差张量的正则张量分解模型,通过选取最佳的模型特征秩,对交通领域路网数据进行高精度补全。通过昆明市交通运营部门GPS数据和城市热点POI数据对模型算法进行实验验证。表明带有残差张量的正则张量分解的补全模型,在最优秩选择适当的情况下能够对某一区间或者时间片段的缺失数据达到一个良好的数据恢复精度。相较于传统的机器学习算法和统计学习模型不仅速度更快性能更优,并且数据恢复的精度更高,并且也有良好的鲁棒性。本文基于张量分解(TENSOR DECOMPOSITION)和张量关联分析技术(TENSOR CORRELATION ANALYSIS)对交通数据的补全问题着重进行以下几方面讨论:(1)对经典张量分解模型CP、Tucker进行变体分解后采用交替最小二乘法优化,优化后比最小二乘法能获得更好的恢复精度且提取数据信息更完整,尤其是在处理稀疏张量信息方面。(2)改进变体分解交替优化方法并引入张量正则化梯度交替、分解修正,并结合真实GPS数据提出基于多源数据集共有结构的张量补全算法,本算法不仅向变体交替分解优化中引入正则项进行过拟合修正,同时引入残差张量对补全精度进行进一步提高。(3)利用多源交通数据集,通过对KNN、MICE、Miss Forest和TDIM等模型进行实验对比分析,表明本文算法通过选择不同的张量局部最优秩对实验数据进行区间段时间片的最佳恢复精度,该模型不仅在速度上更优于传统模型,避免了维度爆炸,通过最优秩选择使得恢复精度高于上述模型,并且具有良好的鲁棒性。
其他文献
研究表明miRNA的功能异常可能与许多人类复杂疾病相关,并且存在着多种渠道的作用机制(如:遗传学、表观遗传学等等)。然而,人类对于这些机制尚还不太清楚,这就需要我们对导致miRNA表达异常的潜在机制进行更深层次的研究,找到存在关联的miRNA-疾病对并确定二者之间的关联类型,这将更好地揭示miRNA表达与功能之间的关系,有助于人们对复杂疾病致病机理的进一步了解。与耗时且昂贵的传统生物学湿实验相比,
学位
泰国是目前中国派出国际汉语教师志愿者最早且人数最多的国家之一。在前期的汉语教学过程中,很多国际汉语教师志愿者会因为文化差异、异国工作经验缺乏等遇到各种各样的问题。这也引起了泰国相关教育主管部门的重视,泰国院校和国际汉语教师志愿者都希望能够通过培训解决这些问题。因此,探索如何有效开展泰国国际汉语教师志愿者岗中培训,具有十分重要的意义。本论文第一章为绪论,主要包括研究目的及意义、研究综述、相关概念界定
学位
在高中英语新课程改革不断深入的背景下,2016年起至今,浙江、山东、湖北、湖南、广东等地陆续把读后续写新题型纳入高考写作考查,其阅卷标准对续写语篇的连贯性问题提出了明确要求。而历经山东省两年的探索,笔者发现几乎所有学生在写作实践中都存在不同程度的无从下手、硬凑字数之现象,对读后续写和写作策略的认知不足,作文的连贯性和流畅度亟待提高。由此,本文基于过程写作和语义连贯理论开展研究,旨在探索高中生英语写
学位
随着中泰两国在文化、经济以及各个领域上的交流与合作的密切,中国与泰国两国之间的交流日益频繁,笔者作为泰国留学生,通过工作与学习,逐渐认识到中文对自身成长的重要性,以及中国对世界各国的影响力,泰国社会对中文教育人才的需求正在不断增加,这就促使越来越多的泰国人开始学习汉语。泰国有关语言教育的政策,特别是汉语言文学的教育政策及其发展、演变和实施情况,这是我们深刻认识新时期汉语教育发展方向、解决汉语发展中
学位
神经元是神经网络的主要组成部分,其在神经网络中起着至关重要的作用。在目前的神经网络模型中,各个层级使用一致的神经元结构,也就意味着网络中的每个神经元都使用相同的特征提取和特征选择方式。然而每个神经元关注的特征不同,整个网络中使用相同结构的神经元,缺乏对不同数据和不同层级特征的适应性。为了提升神经元在面对不同特征的适应性,本文提出了一种新的神经元结构——双激活函数自适应神经元,通过神经元学习训练数据
学位
随着深度学习的高速发展,大量的研究人员和研究机构将其应用于图像分类任务中,使得传统图像分类任务的性能得到了空前的提升,其识别精度已经超越了人类。然而,传统的图像分类任务需要大量的训练图像和对应标签才能构建一个性能优良的图像分类模型,而收集大量特定场景、类别的图像样本是一份非常繁琐和耗时耗力的工作,更别提类别标签的标记工作了。毫无疑问,这一现象使得图像分类任务很难实现真正的人工智能,难以进一步向前发
学位
近年来,媒体侵权的行为频频发生且愈演愈烈。尤其是互联网上以微博、微信上的媒体侵权行为逐渐增多,媒体侵权的研究从未停歇,但仍无法解释所有问题。有学者提出,导致这些问题难以解决的原因是我国目前没有与新闻传播相关的针对性法律文件。本研究通过对2015年~2019年的微博、微信上出现的媒体侵权案件进行分析和前人文章的总结,明晰媒体侵权的概念、现状和相关法律问题,并进行梳理,以给其他学者一些帮助。
期刊
疲劳失效是机械零件常见失效形式,且易引起严重后果。扭力梁作为与汽车安全性和动态性能息息相关的零件,应重视其疲劳耐久性能。本文介绍了一种基于伪损伤分析的扭力梁疲劳失效预测方法,首先通过有限元强度分析,获取扭力梁应力分布,然后在应力梯度变化较小的相对高应力区域采集应变谱,将采集的应变谱进行伪损伤分析,预测零件疲劳失效风险位置。进行整车耐久试验,预测的失效风险位置与试验失效位置一致。相较于传统有限元法真
会议
实测随机载荷谱直接应用于副车架台架等效试验对设备精度要求严苛且所需试验周期长。现通过台架对标试验获取载荷-应力函数转化关系,将随机载荷谱转化为等效应力谱,在GlyphWorks软件中应力谱经雨流法计数统计后依据参数法进行频次外推,在此基础上将获取的应力谱损伤分析结果与疲劳损伤等效原理结合,建立8级程序载荷谱,为副车架疲劳台架试验提供数据支持,有效提高了工作效率和计算精度。
期刊
以某掘进机回转台疲劳试验为例,结合Ncode GlyphWorks软件载荷谱处理技术和CAE应力敏感度仿真及虚拟疲劳试验台架技术,实现掘进机回转台疲劳试验台架结构设计和试验加速因子的拟合的双闭环应用,从而形成低成本、高效、实用的掘进机回转台疲劳台架试验方案开发流程,在掘进机回转台结构设计过程和售后故障策略中起到关键的作用。
期刊